Подтвердить что ты не робот

Как отслеживать URL-адрес с помощью API-интерфейсов Twitter Streaming

Я хочу отслеживать ссылки с помощью потокового API. В идеале я хотел бы определить "http://twitter.com" и получить все статусы, содержащие этот url, как сокращенный (например http://bit.ly/reXnK3), так и полный (http://twitter.com/dev/api/help.html). В любом случае я мог бы достичь этого? В настоящее время кажется, что метод "track" не поддерживает URL-адреса. Или я что-то упускаю?

p.s. Я знаю о API поиска и о BackType, но я бы предпочел использовать Streaming API, поскольку он работает в режиме реального времени и не имеет ограничений по скорости.

4b9b3361

Ответ 1

Параметр трека находится в statuses/filter, и результат вашего запроса обязательно должен содержать ссылки, если ссылки находятся в Tweet. Это - пример того, что вы получаете из потока. Я думаю, ваша проблема в том, что потоковый API не позволяет вам отслеживать URL как таковой, но позволит отслеживать ключевые слова или пользователей по идентификатору пользователя. URL-адрес, который вы пытаетесь отслеживать, связанный с каким-то ключевым словом? Можете ли вы проанализировать URL-адрес и использовать - скажем - как имя домена, так и определенный URI в качестве отдельных ключевых слов (например: в случае http://twitter.com/dev/api/help.html, следующие ключевые слова могут помочь: twitter.com, dev, api)? То, что вы получаете с этой стратегией, имеет много "шума" в нем, но вы можете сохранить результаты в своей базе данных и затем запросить полный URL-адрес, который вы пытаетесь отслеживать. Документация о методе "дорожка" выглядит следующим образом:

Текст полей Tweet и некоторых объектов рассматривается для Матчи. В частности, текстовый атрибут Tweet, expand_url и display_url для ссылок и медиа, текст для хэштегов и screen_name для упоминаний пользователя проверяется на соответствие.

Я никогда не пробовал API потоковой передачи и не чувствовал себя более комфортно с API поиска, но оба они обязательно должны давать аналогичные результаты. Попробуйте увеличить список ключевых слов, разделенных запятыми, добавьте URL-адрес, который вы пытаетесь отслеживать, как два ключевых слова (один для имени домена, один для определенного URI), и вы должны получить что-то близкое к тому, что вы пытаетесь достичь. По крайней мере, это то, что я сделал бы, если бы у меня возникла эта проблема, основываясь на том, что говорит Twitter в документации.