Подтвердить что ты не робот

Проверка, является ли конкретное значение (в ячейке) NaN в pandas DataFrame, не работающем с использованием ix или iloc

Допустим, что у меня есть pandas DataFrame:

import pandas as pd
df = pd.DataFrame({"A":[1,pd.np.nan,2], "B":[5,6,0]})

Как выглядит:

>>> df
     A  B
0  1.0  5
1  NaN  6
2  2.0  0

Первый вариант

Я знаю один способ проверить, есть ли конкретное значение NaN, которое выглядит следующим образом:

>>> df.isnull().ix[1,0]
True

Второй вариант (не работает)

Я подумал, что опция ниже, используя ix, будет работать, но это не так:

>>> df.ix[1,0]==pd.np.nan
False

Я также пробовал iloc с такими же результатами:

>>> df.iloc[1,0]==pd.np.nan
False

Однако, если я проверю эти значения с помощью ix или iloc, я получаю:

>>> df.ix[1,0]
nan
>>> df.iloc[1,0]
nan

Итак, почему второй вариант не работает? Можно ли проверить значения NaN с помощью ix или iloc?

4b9b3361

Ответ 1

Попробуй это:

In [107]: pd.isnull(df.iloc[1,0])
Out[107]: True

ОБНОВЛЕНИЕ: в более новых версиях Pandas используйте pd.isna():

In [7]: pd.isna(df.iloc[1,0])
Out[7]: True

Ответ 2

Приведенный выше ответ отлично. Вот то же самое с примером для лучшего понимания.

>>> import pandas as pd
>>>
>>> import numpy as np
>>>
>>> pd.Series([np.nan, 34, 56])
0     NaN
1    34.0
2    56.0
dtype: float64
>>>
>>> s = pd.Series([np.nan, 34, 56])
>>> pd.isnull(s[0])
True
>>>

Я также пытался пару раз, следующие испытания не сработали. Благодаря @MaxU.

>>> s[0]
nan
>>>
>>> s[0] == np.nan
False
>>>
>>> s[0] is np.nan
False
>>>
>>> s[0] == 'nan'
False
>>>
>>> s[0] == pd.np.nan
False
>>>

Ответ 3

pd.isna(cell_value) может использоваться, чтобы проверить, является ли данное значение ячейки nan. Кроме того, pd.notna(cell_value) чтобы проверить обратное.

Из исходного кода панд:

def isna(obj):
    """
    Detect missing values for an array-like object.

    This function takes a scalar or array-like object and indicates
    whether values are missing (''NaN'' in numeric arrays, ''None'' or ''NaN''
    in object arrays, ''NaT'' in datetimelike).

    Parameters
    ----------
    obj : scalar or array-like
        Object to check for null or missing values.

    Returns
    -------
    bool or array-like of bool
        For scalar input, returns a scalar boolean.
        For array input, returns an array of boolean indicating whether each
        corresponding element is missing.

    See Also
    --------
    notna : Boolean inverse of pandas.isna.
    Series.isna : Detect missing values in a Series.
    DataFrame.isna : Detect missing values in a DataFrame.
    Index.isna : Detect missing values in an Index.

    Examples
    --------
    Scalar arguments (including strings) result in a scalar boolean.

    >>> pd.isna('dog')
    False

    >>> pd.isna(np.nan)
    True