Сиюминутные интересы


Яндес выкатил новый поисковый алгоритм Дублин, который по их задумкам должен учитывать не только постоянные интересы пользователя, но и очень быстро подстраиваться под сиюминутные потребности. В пресс-релизе компании говориться, что если футбольный болельщик захочет почитать про английские города, то по запросу "Манчестер" поисковая машина Яндекса покажет ему город, а не футбольную команду. Неужели Яндекс стал угадывать мысли? На самом дел все просто. Поисковик стал учитывать запросы пользователя в текущей сессии. Это работает очень просто. При запросе "Анна Коренина" Яндекс первой ссылкой выдает статью на Википедию.

Но если я перед этим искал фильмы, то после ввода того же запроса ссыла на Кинопоиск становится первой

Все вроде просто. Но обрабатывать такие объемы данных в режиме онлайн очень сложно. В компании Яндекс должны работать очень талантливые математики и программисты, чтобы реализовать такую возможность.
Я заметил одну небольшую странность. В первом случае Яндекс нашел 2 миллиона документов, а втором уже 3 миллиона. Откуда взялся целый миллион страниц?
Я уверен, что в этих цифрах кроется алгоритм, который позволяет Яндексу учитывать сиюминутные потребности человек. В втором случае Яндекс на самом деле ищет не по ключевому запросу "анна каренина", а по запросу "анна каренина" + "кино", где вес второго слова несколько ниже основного ключа. Это позволяет учесть предыдущие запросы пользователя. Хочу также заметить, что если пользователь станет искать по запросу "анна каренина кино", то он увидит другую поисковую выдачу по причине того, что вес всех слов теперь одинаковый.
Новый алгоритм Яндекса работает благодаря тому, что компания научилась выставлять собственный вес каждому ключевому слову, которое входит в поисковый запрос.
Персональный поиск компания Яндекс запустила в конце прошлого года. Теперь компания его совершенствует. Я уверен, что новый алгоритм ищет лучше предыдущего, ведь компания провела масштабное тестирование и получила положительный результат. В противном случает Яндекс бы не стал выкатывать Дублин для всех, а продолжил бы эксперименты.

1 комментарий:

Viktor комментирует...

Пищат да лезут в наши мозги...(((