Подтвердить что ты не робот

Поддерживает ли googlebot сеансы при сканировании?

Когда googlebot сканирует страницы, у него есть сеанс? Например, я храню некоторые переменные в сеансе и использую их на своих страницах сайта. Когда googlebot сканирует эти страницы, у меня все еще будут переменные сеанса? В моем global.asax я храню некоторые переменные в сеансе при запуске сеанса. Будут ли у меня проблемы с ботом Google?

4b9b3361

Ответ 1

Ответ на один из ваших вопросов: да, у вас будут проблемы с боттом Google.

Как правило, мы сталкиваемся с двумя типами проблем с ботом Google:

  • иногда он не сохраняет файлы cookie HTTP между запросами. Наше приложение опирается на пользовательские файлы cookie, и было много запросов к бот-боту, которые были пойманы, чтобы не иметь никаких файлов cookie.

  • он делает длительные перерывы между последовательными запросами. Например, он извлекает вашу страницу и запрашивает ее позже.

Оба вызовут проблемы с вашей сессией. Во-первых, вам нужно указать точный cookie ASPNETSessionID, который будет передаваться между запросами. Вероятно, Googlebot не может этого сделать. Во-вторых - если есть длительный промежуток между запросами, ваш сеанс завершается, даже если файл cookie существует.

Ответ 2

Googlebot активно пытается избежать сеансов и не поддерживает файлы cookie. Из Первая дата с роботом Googlebot: заголовки и сжатие (март 2008 г.)

Я обычно избегаю файлов cookie (поэтому нет заголовка "Cookie:" ), поскольку я не хочу контент слишком сильно повлиял на информацию, относящуюся к сеансу. И, если сервер использует идентификатор сеанса в динамическом URL, а не cookie, я могу как правило, выясняют это, так что я не заканчиваю сканирование страницы миллион раз с миллионом различных идентификаторов сеанса.

Я полагаю, что большинство регулярных роботов поисковой системы будут похожи в этом отношении. Google пытается создать индекс уникальных URL-адресов. URL-адрес - это уникальный ключ, который идентифицирует уникальную страницу содержимого. Файлы cookie (и сеансы) не передаются, когда пользователь щелкает ссылку в SERPS. Google в первую очередь индексирует страницы, а не сайты.

Ответ 3

В общем случае ответ отрицательный, однако другие сканеры (которых много) работают другими способами.

Я должен заметить, что я видел экземпляр искателя Google для Adwords (не обычный googlebot), который DID представляет файл cookie сеанса.

Ответ 4

Это очень маловероятно, я думаю. Он должен создавать новый сеанс каждый раз, когда он сканирует ваш сайт.