Новое поколение технологий поиска информации

Однажды в 1987 году в поселке Серышево Амурской области на военных авиационных учениях лейтенант перебежал взлетно-посадочную полосу на глазах у генерала. Нарушитель был доставлен к начальству, но возиться с ним было некогда, и лейтенанта отпустили, выяснив фамилию (Иванов) и взяв слово, что он лично прибудет на гауптвахту и доложит дежурному о нарушении. На «губу» Иванов так и не прибыл. В сердцах генерал велел строго наказать Иванова. Поскольку не знали кого именно, то строго наказали всех Ивановых, в том числе командира эскадрильи полковника Иванова, какого-то рядового и тракториста Иванова из соседней деревни.

Для чего нужен поиск? В частности, для чего нужна строка запроса с кнопкой «Найти» на главной странице Яндекса?

Вот несколько первых пришедших на ум запросов.

Набираем: Таунхаусы в 3 км от МКАД

Получаем: 740 тыс. страниц

На первых местах:

14 км от МКАД, таунхаус 3 уровня

5 км от МКАД, 790 секций таунхаусов..., участки - 3 сотки

19 км от МКАД . Этажей: 3

8,2 км от МКАД и т.д.

Далее Яндекс предлагает вручную перебрать 740 тысяч ссылок, из которых многие повторяются, а еще больше не по теме. Если учесть, что только на открытие одной ссылки уходит от 10 до 60 секунд, то это больше похоже на издевательство, чем на сервис.


Набираем: Дома в 2 км от МКАД

Получаем: 5 млн. страниц

На 3 месте ссылка на отели. Что дальше.., лучше промолчать. Что предлагает Яндекс? 9 лет непрерывно открывать ссылку за ссылкой? Или проще не открывать больше сам Яндекс?


Набираем: выделенный сервер по цене виртуального

Получаем: 989 тыс. страниц

На первом месте: виртуальный выделенный сервер
Дальше можно не смотреть.


Набираем: компьютерные аксессуары в Утконосе

Получаем: 54 тыс. страниц

На первом месте единственная ссылка на мышь, которая продается в сети «Утконос».
Со второго места начинаются ссылки про утконосов, в т.ч. про какие-то чудо устройства с названием «Утконос».


Набираем: наушники для необычных ушей

Получаем: 296 тыс. страниц

Начинается с необычных наушников, далее что-то про уши.
Необычных ушей на первой странице нет и в помине.


Понятно, что найти можно всё. Но «всё» было актуально двадцать лет назад, когда Рунет помещался на одном компьютере. «Всё» современному пользователю больше не нужно.

Понятно, что Яндекс помогает искать. Но также должно быть понятно, что одна минута намного меньше часа или двух часов.

Мы хотим радикально изменить процесс поиска информации в сети, научить машину различать смысл того, что содержится в ее хранилищах, и смысл того, что хочет найти клиент.

Научить «машину понимать» энтузиастов много, толку мало. Но у нас есть конкретные результаты, которые мы хотели бы продемонстрировать вам. Мы начали обучение машины с обработки конкретных запросов – тех, что можно сформулировать в виде простого человеческого вопроса. Что цветет в мае? За сколько Прохоров купил РБК? Когда состоялась Куликовская битва? Ситуация, когда пользователь ищет одно-два слова, просто ответ. Уже сейчас мы научили систему это делать. Вот ее возможности.