Я заинтересован в получении данных от разных reddit subreddits. Кто-нибудь знает, есть ли reddit/другой api, похожий на твиттер, чтобы сканировать все страницы?
Получение красных данных
Ответ 1
Да, reddit имеет API, который может использоваться для различных целей, таких как сбор данных, автоматические комментирующие боты или даже для облегчения замедления.
Есть несколько мест для поиска информации о reddit API:
- github reddit wiki - содержит обзор и правила использования reddit API (следуйте правилам)
- автоматически создаваемые документы API - предоставляет информацию о запросах, необходимых для доступа к большинству конечных точек API
- /r/redditdev - сообщество reddit, предназначенное для ответа на вопросы как о исходном коде reddit, так и о reddit API
Если есть определенный язык программирования, с которым вы уже знакомы, вы должны проверить существующий набор оберток API для разных языков. Несмотря на мои предвзятости (я сторонник пакета), я совершенно уверен, что PRAW, для python, поддерживает наибольшее количество функций reddit API.
Ответ 2
Обратите внимание, что если вы только читаете данные и не заинтересованы в отправке обратно на reddit, вы можете получить довольно много данных из json-фидов, связанных с каждым subreddit. С помощью этого метода вам не нужно беспокоиться об API вообще - вы просто запрашиваете соответствующий json файл и разбираете его на выбранном вами языке.
Здесь приведен пример URL-адреса, который будет возвращать объект json, содержащий горячие сообщения из подзадачи Justrolledintothehop: https://www.reddit.com/r/Justrolledintotheshop/top.json
Вместо верха вы можете использовать hot
, new
или controversial
. При использовании top вы можете добавить ?t=day
в конец URL-адреса, чтобы указать верхний пост за день. Другие допустимые значения: hour
, day
, week
, month
, year
или all
.