• Столбцы матрицы $\boldsymbol{Q}$ являются сингулярными векторами матрицы $\boldsymbol{A}$.
  • Столбцы матрицы $\boldsymbol{P}$ являются сингулярными векторами матрицы $\boldsymbol{A}^T$, и $i$-й столбец матрицы $\boldsymbol{P}$ может быть найден по следующей формуле: \begin{equation*} \boldsymbol{p}_i = \frac{1}{\sigma_i} \boldsymbol{A} \boldsymbol{q}_i, \quad i = 1, \dots, r, \end{equation*} где $\sigma_i$ и $\boldsymbol{q}_i$ являются $i$-м сингулярным числом/вектором.
  • Сингулярное разложение позволяет найти псевдообратную матрицу / обратную Мура–Пенроуза (обобщение обратных матриц на случай прямоугольных матриц): $$ \boldsymbol{A}^{+} = \boldsymbol{Q} \boldsymbol{\Sigma}^{-1} \boldsymbol{P}^T. $$
Лемма Пусть матрица $\boldsymbol{A} \in \mathbb{R}^{m \times n}$ имеет ранг $n$. Тогда \begin{equation*} \boldsymbol{A}^{+} = (\boldsymbol{A}^T \boldsymbol{A})^{-1} \boldsymbol{A}^T. \end{equation*}
Доказательство Доказательство
Ковариационная матрица $\boldsymbol{K} \in \mathbb{R}^{n \times n}$ $$ \boldsymbol{K} = \nu \boldsymbol{A}^T \boldsymbol{A}, $$
  • Коэффициент $\nu$ – зависит от выбора оценки ковариации (по умолчанию $\nu = 1/(m-1)$).
  • Элементы этой матрицы $k_{ij}$ являюся ковариациями $i$-х и $j$-х показаний
  • Ковариационная матрица при этом является матрицей Грама, т.е. положительно полуопределенной (линейная зависимость между столбцами матрицы может наблюдаться только в очень редких случаях).
$$ k_{ij} = \sigma_{x_i, x_j} = \nu \sum_{k=1}^m (x_{ki} - \bar{x}_i) (x_{kj} - \bar{x}_j) = \nu \boldsymbol{a}_{i} \cdot \boldsymbol{a}_{j}. $$
Главные компоненты
  • Формируют ортонормальный базис, состоящий из векторов, ассоциированных с наибольшими выборочными дисперсиями.
  • Первая главная компонента является направлением, вдоль которого выборочная дисперсия максимальна.
  • Вторая главная компонента является направлением, ортогональным первой главной компоненте, вдоль которого выборочная дисперсия максимальна.
  • ... и так далее
  • Формируют ортонормальный базис, в котором межкоординатные коэффициенты корреляции равны нулю.
Теорема о главных компонентах Главными компонентнами матрицы центрированных данных $\boldsymbol{A}$ являются ее сингулярные вектора, при этом $j$-я главная компонента соответствует $j$-му сингулярному вектору $\boldsymbol{q}_j$ и стандратному отклонению $\sqrt{\nu} \sigma_j$, где $\sigma_j$ является $j$-м сингулярным числом.