Когда googlebot сканирует страницы, у него есть сеанс? Например, я храню некоторые переменные в сеансе и использую их на своих страницах сайта. Когда googlebot сканирует эти страницы, у меня все еще будут переменные сеанса? В моем global.asax
я храню некоторые переменные в сеансе при запуске сеанса. Будут ли у меня проблемы с ботом Google?
Поддерживает ли googlebot сеансы при сканировании?
Ответ 1
Ответ на один из ваших вопросов: да, у вас будут проблемы с боттом Google.
Как правило, мы сталкиваемся с двумя типами проблем с ботом Google:
-
иногда он не сохраняет файлы cookie HTTP между запросами. Наше приложение опирается на пользовательские файлы cookie, и было много запросов к бот-боту, которые были пойманы, чтобы не иметь никаких файлов cookie.
-
он делает длительные перерывы между последовательными запросами. Например, он извлекает вашу страницу и запрашивает ее позже.
Оба вызовут проблемы с вашей сессией. Во-первых, вам нужно указать точный cookie ASPNETSessionID, который будет передаваться между запросами. Вероятно, Googlebot не может этого сделать. Во-вторых - если есть длительный промежуток между запросами, ваш сеанс завершается, даже если файл cookie существует.
Ответ 2
Googlebot активно пытается избежать сеансов и не поддерживает файлы cookie. Из Первая дата с роботом Googlebot: заголовки и сжатие (март 2008 г.)
Я обычно избегаю файлов cookie (поэтому нет заголовка "Cookie:" ), поскольку я не хочу контент слишком сильно повлиял на информацию, относящуюся к сеансу. И, если сервер использует идентификатор сеанса в динамическом URL, а не cookie, я могу как правило, выясняют это, так что я не заканчиваю сканирование страницы миллион раз с миллионом различных идентификаторов сеанса.
Я полагаю, что большинство регулярных роботов поисковой системы будут похожи в этом отношении. Google пытается создать индекс уникальных URL-адресов. URL-адрес - это уникальный ключ, который идентифицирует уникальную страницу содержимого. Файлы cookie (и сеансы) не передаются, когда пользователь щелкает ссылку в SERPS. Google в первую очередь индексирует страницы, а не сайты.
Ответ 3
В общем случае ответ отрицательный, однако другие сканеры (которых много) работают другими способами.
Я должен заметить, что я видел экземпляр искателя Google для Adwords (не обычный googlebot), который DID представляет файл cookie сеанса.
Ответ 4
Это очень маловероятно, я думаю. Он должен создавать новый сеанс каждый раз, когда он сканирует ваш сайт.