Новое для Python.
В R вы можете получить размерность матрицы, используя dim (...). Какова соответствующая функция в Python Pandas для их кадра данных?
Новое для Python.
В R вы можете получить размерность матрицы, используя dim (...). Какова соответствующая функция в Python Pandas для их кадра данных?
df.shape
, где df
- ваш DataFrame.
Существует несколько способов получить информацию об атрибутах вашего DataFrame или Series.
Создать образец DataFrame и Series
df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df
a b
0 5.0 9
1 2.0 2
2 NaN 4
s = df['a']
s
0 5.0
1 2.0
2 NaN
Name: a, dtype: float64
shape
АтрибутАтрибут shape
возвращает двоичный набор из числа строк и количество столбцов в DataFrame. Для серии он возвращает кортеж из одного элемента.
df.shape
(3, 2)
s.shape
(3,)
len
функцияЧтобы получить количество строк DataFrame или получить длину серии, используйте функцию len
. Будет возвращено целое число.
len(df)
3
len(s)
3
size
атрибутЧтобы получить общее количество элементов в DataFrame или Series, используйте атрибут size
. Для DataFrames это произведение количества строк и количества столбцов. Для серии это будет эквивалентно функции len
:
df.size
6
s.size
3
ndim
атрибутАтрибут ndim
возвращает количество измерений вашего DataFrame или Series. Он всегда будет 2 для DataFrames и 1 для серии:
df.ndim
2
s.ndim
1
count
Метод count
может использоваться для возврата количества не пропущенных значений для каждого столбца/строки DataFrame. Это может быть очень запутанным, потому что большинство людей обычно думают о подсчете как о длине каждой строки, а это не так. Когда вызывается в DataFrame, возвращается строка с именами столбцов в индексе и количеством не пропущенных значений в качестве значений.
df.count() # by default, get the count of each column
a 2
b 3
dtype: int64
df.count(axis='columns') # change direction to get count of each row
0 2
1 2
2 1
dtype: int64
Для серии существует только одна ось для вычисления, и поэтому она просто возвращает скаляр:
s.count()
2
info
для извлечения метаданныхМетод info
возвращает количество непустых значений и типов данных для каждого столбца
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a 2 non-null float64
b 3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes
Форма dataframe находится в виде столбцов строк *, поэтому функция поиска формы
dataframe_name.shape()