Knowledge-Based Trust – новий алгоритм Google

Knowledge-Based Trust - новий алгоритм Google
Компанія Google анонсувала новий алгоритм, який суттєво вплине на ранжування інформаційних сайтів. Алгоритм Knowledge-Based Trust (KBT) заснований на достовірності інформації, яку надає сайт своїм читачам. В першу чергу він зачіпає сайти, наповнені інформаційними статтями і новинних сайтів.

Прогнозується такий розвиток алгоритму, що з часом він буде набирати вагу, поступово витісняючи традиційне ранжирування посилань.

Новий алгоритм буде визначати інформаційну достовірність сайту (Knowledge-Based Trust або KBT), вказуючи тt, наскільки можна довіряти фактам, викладеним на цьому сайті. Чим менше помилкових фактів наводиться на сайті, тим вище рівень довіри.

Необхідність алгоритму KBT для пошуку

Knowledge-Based Trust - новий алгоритм GoogleГоловне завдання пошукових алгоритмів – точно визначити, наскільки корисна сторінка сайту для відвідувачів, тобто якість оцінки web документа виходить на перше місце. Традиційні зовнішні чинники (посилальна маса, історія переглядів і подібні сигнали) вказують лише на популярність сайтів, незалежно від достовірності інформації.

Сучасна проблема пошукових систем в тому, що з одного боку популярні сайти можуть мати високі значення PR та інших метрик, але при цьому містити плітки, качки і різного роду неперевірену інформацію. Інша ж сторона цієї проблеми, що менш відомі сайти з низьким PR можуть публікувати дуже точну інформацію, але так і не займати належного місця в пошуковій видачі.

Саме тому для нової метрики, заснованої на KBT, фундаментальним стає питання оцінки достовірності веб-джерела.

Сайти з невеликою кількістю фактичної інформації не будуть піддаватися санкціям цього фільтра до тих пір, поки їх інформація коректна.

Механізм розрахунку KBT

В оцінку включено коректне значення фактів, приміром, відомі факти. Алгоритм здатний витягувати з тексту логічні триплети (три логічно пов’язаних твердження) виду суб’єкт-предикат-об’єкт.

Найпростіший приклад логічного триплета: Рим столиця Італії.

Коректність інформації визначається шляхом зіставлення фактів, витягнутих з бази знань (Knowledge Vault), однак не можна гарантувати абсолютну точність цієї бази.

Історія бази знань Кnowledge Vault йде корінням в проект Freebase, який активно наповнювався ентузіастами, а тепер переноситься в Wikidata. Тобто, використовуючи базу Freebase, Google розробляє свою базу Кnowledge Vault (KV).

На сьогоднішній день вся база фактів Кnowledge Vault містить близько 16% інформації в категорії «неспростовні факти», можливо, що інші дані відіграють допоміжну роль.

Професійна розробка сайтів Львів – 0632381495

Штучний інтелект при розрахунку KBT

В процесі розробки алгоритму найбільші обчислювальні проблеми виникали, коли було потрібно порівнювати велике число фактів в їх різних комбінаціях.

Knowledge-Based Trust - новий алгоритм GoogleАби не заглиблюватися в складні формули, відзначимо, що розробникам вдалося істотно поліпшити оцінку достовірності фактів за рахунок використання більш еффектіного і що масштабується алгоритму для оцінки достовірності джерел фактичної інформації.

Нова багатошарова імовірнісна модель, в якій аналізуються пересічні факти в спрощеному вигляді дозволяє визначати головне джерело помилки: некоректні факти вебдокумента або ж неточність в базі знань Кnowledge Vault.

Прогнозується, що модель Knowledge-Based Trust може піти настільки далеко, що допоможе в синтезі знань на базі наявних фактів.

Підсумок

Варто відзначити, що ступінь достовірності сайту забезпечує додатковий сигнал про якість сайту. Очевидно, що незабаром ця метрика братиме участь в ранжируванні сайтів поряд з показником PR або навіть вийде на перше місце. Тому достовірність статей для інформаційних сайтів стає вкрай важливою.