September 11th, 2007

чб

новая эра поиска

хочу поделиться новой идеей для создание следующего поколения поисковых систем.

для начала нужно определиться, каким же будет оно - следующее поколение, и чем оно принципиально будет отличаться от поколения нынешнего.

понятно, что алгоритмы поиска будут в дальнейшем улучшаьтся.
понятно, что эффект ранжирования страниц, который применяется сейчас - вес страницы определяется количеством ссылок на неё с авторитетных источников - будет коренным образом переработан, потому что уже сейчас в поисковиках живут только новостные и блоговые сайты, а информативные, за исключением википедии, из поля их видимости выпадают.

речь не об этом.

весь сегодняшний поиск в интернете основан на запросе словоформы, и выдаче результата по словоформе.

впрочем, и гугл, и яндекс, и пиксарт делают весьма широкие шаги в развитии, создавая на собственных серверах службы поиска по изображениям. но, хочется заметить, что основным инструментом поиска изображения является тег "alt", который 80% вебмастеров не используют по причине ненадобности. и никакие поисковики их это сделать не заставят.

идея состоит в том, чтобы перестать пытаться связать две изначально разные вещи - словоформу и изображение.

поиск картинки должен производиться по определённому количеству и сочетанию цветов на ней. допустим, фото пожара должно быть на 50% красным. ну, или какие-нибудь харрактерные для изображения огня штрихи на нём должны присутствовать. если будет разработана подобная технология, и пользователь сможет, набросав в поле браузера примерный рисунок, получить качественный отпечаток, - отклик по поиску будет в разы больше, чем количество "отальтованных" на сегодня картинок.

та же самая мысль и в отношении медийки: насвистав мелодию в микрофон, человек может найти интересующую копозицию по совпадению тональностей. или, наговорив монолог, обнаружить, где скачать тот или иной фильм.

думаю, мы все к этом достаточно скоро придём. года этак до 2015го точно.

и тогда уже совершенно точно не гугл будет рулить, а кто-то другой. потому что гугл зациклился на совершенствовании морфологических запросов, а это, как мне кажется, весьма тупиковый путь.

при перепечатке в качестве источника просьба ставить официальный сайт Антонова Сергея