Сканування та індексування сторінок на декількох мовах

Багато великі сайти щодня приваблюють відвідувачів не тільки в країні, з якої вони походять. Для відвідувачів-іноземців робляться локалізовані версії: які переведені краще, якісь гірше, на одних інформації стільки ж, скільки на рідному для сайту мовою, на інших — зовсім небагато. Тим не менш, пошуковій системі Google проіндексувати контент на багатомовних сайтах буває нелегко.



Найчастіше, вибір, якою мовою віддавати інформацію за замовчуванням, зроблений вручну із збереженням інформації про обраному мовою в cookies, або автоматично: з мовних налаштувань браузера, операційної системи, за допомогою геолокаціі і визначення країни / міста по IP. Індексуючі робот Googlebot — не користувач, сама мова не вибере, а автоматична система визначення не розпізнає його і не видасть всі мови відразу, так що для правильної індексації контенту треба було докласти деякі зусилля.


Як було раніше

Раніше робот Googlebot мав IP-адресу США, а запити відправляв без заголовка Accept-Language. У такій ситуації більшість сайтів мовчки віддавала йому свою англійську версію, і на багатомовних ресурсах могли виникати проблеми з індексуванням контенту.

Наприклад, при попаданні на російський сайт, де з-за кордону завжди надавався контент англійською, робот не мав можливості отримати основний зміст сайту російською. Як наслідок, в результатах пошуку в Росії сторінки такого сайту могли відображатися нижче, ніж вони того заслуговували, або не відображається взагалі, якщо стояла налаштування «відображати результати тільки російською мовою».

Як Googlebot працює зараз
Алгоритм роботи робота змінився: якщо матеріали можуть підбиратися в залежності від місця розташування користувача і мовних налаштувань на його пристрої, Googlebot буде обробляти такі сторінки з використанням нових конфігурацій сканування, враховують місцезнаходження і мову. Ось які рішення при цьому використовуються:

  • Надсилання запиту з інших IP-адрес, які не відносяться до США на додаток до використовувалися досі адресами з США.
  • Використання у запиті заголовків Accept-Language, що дозволяє роботові Googlebot переходити до різних мовних версій сторінки і сканувати їх.


Нові конфігурації сканування активуються автоматично, тому ваші сторінки можуть по-іншому оброблятися роботами Google і відображатися в результатах пошуку, навіть якщо ви не змінювали налаштування сервера або системи управління контентом.

Що варто зробити, щоб сайт багатомовний напевно правильно відображався?
Хочете забезпечити найбільш ефективне індексування і ранжування вашого контенту і зробити сайт більш зручним для пошуку користувачами? Ми раніше рекомендуємо використовувати для мовних версій різні URL і підбирати потрібні варіанти з допомогою атрибутів rel=«alternate» hreflang=«x».

Якщо у вас виникають питання або побажання, чекаємо вас на нашому довідковому форумі для веб-майстрів або в співтоваристві для веб-майстрів Google+: g.co/ruwebmasters.

Довідкові матеріали
Мультирегіональні і багатомовні сайти (Розділ Довідкового центру)
Шість рад по створенню сайтів для багатомовною аудиторії від Google Web Studio

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.