Как я могу получить элементарный логический NOT серии pandas? - программирование
Подтвердить что ты не робот

Как я могу получить элементарный логический NOT серии pandas?

У меня есть относительно простой вопрос, сегодня. У меня есть объект pandas Series, содержащий логические значения. Как я могу получить серию, содержащую логическое NOT для каждого значения?

Например, рассмотрим ряд, содержащий:

True
True
True
False

Серия, которую я хотел бы получить, будет содержать:

False
False
False
True

Кажется, это должно быть достаточно простым, но, по-видимому, я потерял моджо сегодня = (

Спасибо!

4b9b3361

Ответ 1

Чтобы инвертировать булевскую серию, используйте ~s:

In [7]: s = pd.Series([True, True, False, True])

In [8]: ~s
Out[8]: 
0    False
1    False
2     True
3    False
dtype: bool

Использование Python2.7, NumPy 1.8.0, Pandas 0.13.1:

In [119]: s = pd.Series([True, True, False, True]*10000)

In [10]:  %timeit np.invert(s)
10000 loops, best of 3: 91.8 µs per loop

In [11]: %timeit ~s
10000 loops, best of 3: 73.5 µs per loop

In [12]: %timeit (-s)
10000 loops, best of 3: 73.5 µs per loop

В соответствии с Pandas 0.13.0, Серии больше не являются подклассами numpy.ndarray; теперь они являются подклассами pd.NDFrame. Это может иметь какое-то отношение к тому, почему np.invert(s) не так быстро, как ~s или -s.

Предостережение: timeit результаты могут различаться в зависимости от многих факторов, включая версии аппаратного обеспечения, компилятора, ОС, Python, NumPy и Pandas.

Ответ 2

Я просто сделаю снимок:

In [9]: s = Series([True, True, True, False])

In [10]: s
Out[10]: 
0     True
1     True
2     True
3    False

In [11]: -s
Out[11]: 
0    False
1    False
2    False
3     True

Ответ 3

Ответ @unutbu на месте, просто хотел добавить предупреждение о том, что вашей маске должно быть dtype bool, а не "объект". Т.е. у вашей маски никогда не было никаких нанов. См. здесь - даже если ваша маска теперь ненанна, она останется типом объекта.

Обратный к "объектной" серии не будет вызывать ошибку, вместо этого вы получите маску мусора ints, которая не будет работать так, как вы ожидаете.

In[1]: df = pd.DataFrame({'A':[True, False, np.nan], 'B':[True, False, True]})
In[2]: df.dropna(inplace=True)
In[3]: df['A']
Out[3]:
0    True
1   False
Name: A, dtype object
In[4]: ~df['A']
Out[4]:
0   -2
0   -1
Name: A, dtype object

Ответ 4

Вы также можете использовать numpy.invert:

In [1]: import numpy as np

In [2]: import pandas as pd

In [3]: s = pd.Series([True, True, False, True])

In [4]: np.invert(s)
Out[4]: 
0    False
1    False
2     True
3    False

EDIT: разница в производительности появляется на Ubuntu 12.04, Python 2.7, NumPy 1.7.0 - хотя, похоже, не существует NumPy 1.6.2:

In [5]: %timeit (-s)
10000 loops, best of 3: 26.8 us per loop

In [6]: %timeit np.invert(s)
100000 loops, best of 3: 7.85 us per loop

In [7]: %timeit ~s
10000 loops, best of 3: 27.3 us per loop