Yandex роботи, особено сайтове индексиране

Yandex роботи, особено сайтове индексиране
Yandex в момента е най-популярната търсачка рускоезичното интернет, където повече от един милион души го използват всеки ден. Такава популярност се дължи на факта, че базата данни Yandex съдържа огромен брой уеб страници индексирани, съдържащ най-разнообразни и понякога уникална информация. В съчетание с алгоритъма за търсене на води до високо ниво на съответствие на документите, намерени при поискване от потребителя и, в крайна сметка, за удовлетворяване на информационните нужди на потребителя.

На 17.07.09 от Yandex е индексиран 3,558,614,259 уеб страници. Получаване на информация от интернет сайтове и да го изпратите до базата данни на търсачката - специална задача робот показалец. До голяма степен се дължи на високата скорост на досегашната му работа, Yandex има такава богата база данни от документи, който да се търси.

История Yandex роботи

Сега официално обяви 11 Yandex роботи, всеки от които е специализирана в определена задача.

Yandex роботи

Робот всяка търсачка има свое име. Например, Rambler - «StackRambler / 2.0», от Google -. «Googlebot / 2.1» Yandex в състава му има редица специализирани роботи, които изпълняват добре определени задачи. Тук са могат да бъдат изпълнени някои Yandex роботи:

За разлика от първата група от роботи, тези работи не вземат съдържанието на страницата и фиксират отговор само на сървъра. Ето защо, те правят няколко други искане до сървъра. Например, проучване Dyatel робот може да се запише в сървърните логове като низ следва:

Както се вижда, използван директива началник иска само сървърни заглавията. В този случай, на сайта е на разположение, работа, така че как да се даде код на състояние 200 OK.

Процесът на индексиране на документ

Ако той се добавя към първия път, Yandex ще се появи съобщение:

Ако сайтът вече е посетен от Indexer на робот, се появява съобщение:

След добавянето на нов сайт, през формата, тя незабавно посетете робот Yandex / 1.03.003 (съвместим; Win16; D). Тя ще се определи на достъпността на сайта, за да бъдат индексирани, а също така определя дали на площадката отговаря на изискванията на Yandex, основната от които е изискването на руски език ресурси. Ето защо, като например, може да възникне ситуация:

Ако всичко е наред, линията може да се намери в трупите на сайта:

Тя може да се види, че първият робот се обърна към файла robots.txt, за да се определи дали сайта е забранено на индексация. След това са се обърнали към главната страница.

Възможни пречки за индексиране на документ

Има няколко причини, които пречат на правилното индексиране на вашия сайт в Яндекс.

  1. Технически трудности:
      а. Неправилно функциониране на сървърът връща грешка 404. б. страхотно време за реакция на сървъра (например, защото на неговия тежък товар. Също така, много време отговор характерен за безплатен хостинг)
  2. Изкуствен забрана индексация:
      а. забрани на определени страници, индексирани във файла robots.txt б. Индексирането забрана използването на мета-тагове
  3. Други:
      а. много малък размер на страницата (Yandex не индексира файлове по-малко от 1 KB) б. ресурсите не съдържа текста на българина

Трябва да се отбележи, че Yandex индексира не само за документи, HTML. Освен тях на разположение за индексиране са следните видове документи: PDF (Adobe Acrobat файл), DOC (MS Word), RTF (REACH текстов формат). Също така, Yandex индексира сайтове с флаш-базирани технологии. Но Rambler индекси само HTML файлове, HTM, shtml и динамични страници и флаш сайтове, индексирани лоши.

  1. Първо трябва да се уверите, че страницата дойде на екстрадицията. Най-лесният начин за използване на "разширено търсене Яндекс". Въведете в полето "са на сайта" URL Не сайт, например, www.seonews.ru и след това в полето за търсене въведете думата с желаната страница, например, "майсторския клас".
  2. Намерете в резултатите от търсенето желаната страница и кликнете върху линка "намира израз".
  3. Следваща в горната част на натискането документ върху връзката "Кеширана":
  4. Нов прозорец ще се отвори така наречения "Кеширана Yandex". Можете да видите и сравни оригиналния документ. Може да откриете, че някои думи не са индексирани от Yandex.

Neindeksatsiya някои елементи на страницата могат да бъдат причинени от няколко фактора:

заключение

Всеки, който е в интернет е сериозен проект, е необходимо да се разберат основните принципи на роботизирани индексатори търсачката. Да знаеш кога роботът идва към уебсайт, който индекси, които не са индексирани, ще избегнат много проблеми, най-вече технически, още на етапа на създаване на сайта и след това - когато тя е придружена.

За да не се чудите защо за пореден път на сайта изчезна от издаването на определена заявка, на първо място, е необходимо да се анализира това, което е в момента индексиране робот на сайта? Тя може да бъде, че част от информацията става достъпна за робота по една или друга причина?

Познаването на основните аспекти на процеса на индексиране на документи правилно ще произвежда регистрацията на ресурсите в търсачката и компетентно да извършва по-нататъшното му предварително, така че потребителите винаги да намерят вашия сайт в интернет.