Подтвердить что ты не робот

Морской груз load_dataset

Я пытаюсь получить сгруппированный boxplot, работающий с использованием Seaborn в соответствии с example

Я могу заставить приведенный выше пример работать, однако строка:

tips = sns.load_dataset("tips")

не объясняется вообще. Я нашел файл tips.csv, но я не могу найти адекватную документацию о том, что конкретно делает load_dataset. Я попытался создать свой собственный csv и загрузить это, но безрезультатно. Я также переименовал файл подсказок, и он все еще работал...

Мой вопрос:

Где load_dataset действительно ищет файлы? Могу ли я использовать это для своих собственных ящиков?

EDIT: мне удалось создать свои собственные ящики, используя мой собственный DataFrame, но мне все еще интересно, используется ли load_dataset для чего-то большего, чем таинственные примеры учебников.

4b9b3361

Ответ 1

load_dataset ищет онлайн файлы csv на https://github.com/mwaskom/seaborn-data. Здесь docstring:

Загрузите набор данных из онлайн-репозитория (требуется интернет).

Параметры


name: str        Имя набора данных (name.csv on        https://github.com/mwaskom/seaborn-data). Вы можете получить список        доступные наборы данных, используя: func: get_dataset_names

kws: dict, необязательный        Перейти к pandas.read_csv

Если вы хотите изменить этот онлайн-набор данных или ввести свои собственные данные, вам, вероятно, придется использовать pandas. load_dataset фактически возвращает объект pandas DataFrame, который вы можете подтвердить с помощью type(tips).

Если вы уже создали свои собственные данные в файле csv, например, tips2.csv, и сохранили его в том же месте, что и ваш script, используйте его (после установки pandas), чтобы загрузить его:

import pandas as pd

tips2 = pd.read_csv('tips2.csv')