Я знаком с держателями данных R, такими как векторы, dataframe и т.д., но вам нужно сделать некоторый анализ текста, и похоже, что у python есть хорошие настройки для этого. Мой вопрос в том, где я могу найти объяснение того, как python хранит данные.
В частности, у меня есть набор данных в файле с разделителями табуляции, где текст находится в третьем столбце, а скоринга данных, которые мне нужны, находится в 4-м столбце.
id1 id2 text score
123 889 "This is the text I need to read..." 88
234 778 "This is the text I need to read..." 78
345 667 "This is the text I need to read..." 91
В R я просто загрузил его в кадр данных с именем df1
, и когда мне захотелось вызвать столбец, я бы использовал df1 $text или df1[,3]
, и если бы мне нужна определенная ячейка, я мог бы использовать df1[1,3]
.
Я получаю представление о том, как читать данные в python, но не о том, как обращаться с табличными структурами.
Как бы вы предложили работать с этим для новичков-питонов?