Я пытаюсь запустить PCA на матрице размеров m x n, где m - количество функций и n число выборок.
Предположим, что я хочу сохранить функции nf
с максимальной дисперсией. С помощью scikit-learn
я могу сделать это следующим образом:
from sklearn.decomposition import PCA
nf = 100
pca = PCA(n_components=nf)
# X is the matrix transposed (n samples on the rows, m features on the columns)
pca.fit(X)
X_new = pca.transform(X)
Теперь я получаю новую матрицу X_new
, которая имеет форму n x nf. Можно ли узнать, какие функции были отброшены или сохранены?
Спасибо