Подтвердить что ты не робот

Python - размер кадра данных

Новое для Python.

В R вы можете получить размерность матрицы, используя dim (...). Какова соответствующая функция в Python Pandas для их кадра данных?

4b9b3361

Ответ 1

df.shape, где df - ваш DataFrame.

Ответ 2

Сводка всех способов получения информации о размерах DataFrame или Series

Существует несколько способов получить информацию об атрибутах вашего DataFrame или Series.

Создать образец DataFrame и Series

df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df

     a  b
0  5.0  9
1  2.0  2
2  NaN  4

s = df['a']
s

0    5.0
1    2.0
2    NaN
Name: a, dtype: float64

shape Атрибут

Атрибут shape возвращает двоичный набор из числа строк и количество столбцов в DataFrame. Для серии он возвращает кортеж из одного элемента.

df.shape
(3, 2)

s.shape
(3,)

len функция

Чтобы получить количество строк DataFrame или получить длину серии, используйте функцию len. Будет возвращено целое число.

len(df)
3

len(s)
3

size атрибут

Чтобы получить общее количество элементов в DataFrame или Series, используйте атрибут size. Для DataFrames это произведение количества строк и количества столбцов. Для серии это будет эквивалентно функции len:

df.size
6

s.size
3

ndim атрибут

Атрибут ndim возвращает количество измерений вашего DataFrame или Series. Он всегда будет 2 для DataFrames и 1 для серии:

df.ndim
2

s.ndim
1

Неверный метод count

Метод count может использоваться для возврата количества не пропущенных значений для каждого столбца/строки DataFrame. Это может быть очень запутанным, потому что большинство людей обычно думают о подсчете как о длине каждой строки, а это не так. Когда вызывается в DataFrame, возвращается строка с именами столбцов в индексе и количеством не пропущенных значений в качестве значений.

df.count() # by default, get the count of each column

a    2
b    3
dtype: int64


df.count(axis='columns') # change direction to get count of each row

0    2
1    2
2    1
dtype: int64

Для серии существует только одна ось для вычисления, и поэтому она просто возвращает скаляр:

s.count()
2

Используйте метод info для извлечения метаданных

Метод info возвращает количество непустых значений и типов данных для каждого столбца

df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a    2 non-null float64
b    3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes

Ответ 3

Форма dataframe находится в виде столбцов строк *, поэтому функция поиска формы

dataframe_name.shape()