Подтвердить что ты не робот

Pandas: read_html

Я пытаюсь извлечь США из URL-адреса wiki и для которого я использую Python Pandas.

import pandas as pd
import html5lib
f_states = pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states') 

Однако приведенный выше код дает мне ошибку L

ImportError Traceback (последний последний вызов)  в()       1 импорт pandas в виде pd ---- > 2 f_states = pd.read_html ('https://simple.wikipedia.org/wiki/List_of_U.S._states')

если аромат в ('bs4', 'html5lib'):     662, если нет _HAS_HTML5LIB: → 663 повысить ImportError ( "html5lib не найден, пожалуйста, установите его" )     664, если нет _HAS_BS4:     665 raise ImportError ( "BeautifulSoup4 (bs4) не найден, установите его" ) ImportError: html5lib не найден, пожалуйста, установите его

Я также установил html5lib и beautifulsoup4, но он не работает. Может кто-то помочь PLS.

4b9b3361

Ответ 1

Запуск Python 3.4 на Mac

Новый пивенв

pip install pandas
pip install lxml
pip install html5lib
pip install BeautifulSoup4

Затем запустил ваш пример...

import pandas as pd
import html5lib
f_states=   pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states') 

Все работает...

Ответ 2

Также подумайте о том, чтобы конда установила нужные пакеты в https://www.continuum.io/downloads. Вместо того, чтобы устанавливать pip, вы можете установить свои пакеты.

$ conda install html5lib