Пошуковий алгоритм

Пошуковий алгоритм – складна математична модель, що дозволяє пошуковій системі скласти пошукову видачу, найбільш релевантний запиту користувача. Являє собою класичний «чорний ящик» з набором параметрів, на вході в який задається проблема, а на виході – її рішення.

Параметри пошукового алгоритму, що використовуються для оцінки релевантності

Пошукові алгоритми є секретами пошукових систем. Тому уявити повний список параметрів, використовуваних ПА для оцінки релевантності контенту сайтів при складанні пошукової видачі, не представляється можливим. Однак основні критерії відомі. До них можна віднести:

  • Вік ресурсу.
  • Ім’я ресурсу, доменна зона і доменний рівень.
  • Популярність тематики інформації, розміщеної на ресурсі, відповідність їй ключових слів.
  • Обсяг інформації всього ресурсу, кожної його сторінки, а також кількість сторінок.
  • Загальна авторитетність ресурсу у пошукових систем і авторитет кожної його сторінки окремо.
  • Спільність стилю всіх сторінок ресурсу.
  • Кількість ключових слів в текстовому контенті всього ресурсу, і їх розподіл по сторінках.
  • Співвідношення ключів до всієї кількості слів контенту.
  • Індекс цитування.
  • Кількість запитів по кожному ключовому слову з семантичного ядра сайту, створених користувачами за певний проміжок часу.
  • Періодичність, з якою оновлюється інформація на сайті.
  • Час, що минув після останнього оновлення.
  • Використання графіки, мультимедіа, фреймів, flash-модулів.
  • Шрифт та (тип, розмір) ключових слів, стиль заголовків і ключів.
  • Відстань до ключових слів від початку тексту.
  • Спроби унікалізації тексту за допомогою спірних прийомів (ключі, написані в р о з р я д к у або граматичні помилки, наприклад).
  • Використання метатегів.
  • Присутність файлу robots.txt.
  • Глибина сайту (мається на увазі кількість переходів, які можна зробити «всередині» сайту, не відвідуючи одну і ту ж сторінку двічі; кількість рівнів сайту).
  • Наявність коментарів в програмному коді.
  • Географічне положення і мову ресурсу.
  • Наявність і обсяг зовнішньої і внутрішньої посилальної маси.
  • Якість зовнішніх посилань.
  • Інші параметри.

Просування сайтів Львів – 063-238-14-95

Принципи роботи пошукових алгоритмів

Пошукові алгоритми за принципом дії можна розділити на дві групи:

  1. Алгоритми прямої дії

Алгоритми прямої дії в пошуках відповіді на користувацький запит перебирають всі документи, що зберігаються в індексі пошукової системи. Незважаючи на те, що результатом такої дії буде максимально релевантна видача, даний вид алгоритмів неефективний через великий обсяг роботи, яку доводиться виконувати при такій її організації, і, отже, довгого очікування результату. Тому алгоритми прямої дії великими пошуковими системами не використовуються.

  1. Алгоритми інвертованого (зворотного) індексу

Для прискорення пошуку інформація в базі даних пошукових систем перетворена в текстові файли. Кожен з них представляє список слів з сайтів, поруч з якими розташовуються їх координати в початковому тексті і інші параметри. База таких файлів називається зворотним індексом, і саме по ним здійснює пошук алгоритм інвертованого або зворотного індексу. Релевантність пошукової видачі, створеної за допомогою таких алгоритмів трохи нижче, ніж у алгоритмів прямої дії, але велика на порядок швидкість відповіді спокутує цей недолік.

Апдейти пошукових алгоритмів

Кожна пошукова система проводить регулярне оновлення (апдейти) своїх складових, в тому числі і пошукових алгоритмів, для збільшення ефективності їх роботи.

Апдейт пошукового алгоритму означає додавання до нього нових параметрів ранжування, виняток неактуальних, корекція формул і т.п. Кожен апдейт ПА тягне за собою деякі зміни в ранжуванні сайтів і, як наслідок, зміна позицій в пошуковій видачі деяких сайтів.

Пошукові системи відстежують коректність роботи пошукових алгоритмів після апдейтів за допомогою асесорів – спеціально для цього запрошених користувачів, які оцінюють релевантність пошукової видачі з позицій людини, а не машини. На основі таких оцінок ПС вносять відповідні корективи.

Пошукові алгоритми ПС Яндекс і Google

Дані пошукові системи є лідерами мережі інтернет в Україні і, крім того, деякі інші пошукові системи використовують їх пошукові алгоритми (наприклад, Рамблер зараз використовує пошуковий алгоритм Яндекса). Тому їх назви є найбільш відомими.