Подтвердить что ты не робот

Получение красных данных

Я заинтересован в получении данных от разных reddit subreddits. Кто-нибудь знает, есть ли reddit/другой api, похожий на твиттер, чтобы сканировать все страницы?

4b9b3361

Ответ 1

Да, reddit имеет API, который может использоваться для различных целей, таких как сбор данных, автоматические комментирующие боты или даже для облегчения замедления.

Есть несколько мест для поиска информации о reddit API:

  • github reddit wiki - содержит обзор и правила использования reddit API (следуйте правилам)
  • автоматически создаваемые документы API - предоставляет информацию о запросах, необходимых для доступа к большинству конечных точек API
  • /r/redditdev - сообщество reddit, предназначенное для ответа на вопросы как о исходном коде reddit, так и о reddit API

Если есть определенный язык программирования, с которым вы уже знакомы, вы должны проверить существующий набор оберток API для разных языков. Несмотря на мои предвзятости (я сторонник пакета), я совершенно уверен, что PRAW, для python, поддерживает наибольшее количество функций reddit API.

Ответ 2

Обратите внимание, что если вы только читаете данные и не заинтересованы в отправке обратно на reddit, вы можете получить довольно много данных из json-фидов, связанных с каждым subreddit. С помощью этого метода вам не нужно беспокоиться об API вообще - вы просто запрашиваете соответствующий json файл и разбираете его на выбранном вами языке.

Здесь приведен пример URL-адреса, который будет возвращать объект json, содержащий горячие сообщения из подзадачи Justrolledintothehop: https://www.reddit.com/r/Justrolledintotheshop/top.json

Вместо верха вы можете использовать hot, new или controversial. При использовании top вы можете добавить ?t=day в конец URL-адреса, чтобы указать верхний пост за день. Другие допустимые значения: hour, day, week, month, year или all.