В настоящее время я придумал некоторые работы, чтобы подсчитать количество отсутствующих значений в pandas DataFrame
. Это довольно уродливые, и мне интересно, есть ли лучший способ сделать это.
Создайте пример DataFrame
:
from numpy.random import randn
df = pd.DataFrame(randn(5, 3), index=['a', 'c', 'e', 'f', 'h'],
columns=['one', 'two', 'three'])
df = df.reindex(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
В настоящее время у меня есть
a) Подсчет ячеек с отсутствующими значениями:
>>> sum(df.isnull().values.ravel())
9
b) Подсчет строк, которые где-то отсутствуют:
>>> sum([True for idx,row in df.iterrows() if any(row.isnull())])
3