Monday, July 16, 2007

Искать по смыслу

Hakia является одним из представителей того самого нового рода поисковых систем, являющихся одновременно и достаточно сумасшедшими для того, чтобы бросить открытый вызов Google и достаточно претенциозными, чтобы утверждать, что их поисковая технология превосходит ныне существующие.

Мотивация проста: "поиск" является главной формой нашего доступа к информации И самым надежным источником доходов в сети (реклама). Также очевидно, что предлагаемая Google система крайне тупа, ибо основывается в основном на словах, содержащихся на индексируемых страницах и ведущих к ним ссылках, независимо от того что именно говорится на этих страницах.


Горстка startup-ов считает, что наступил момент повысить ставки в надежде на получение максимального выигрыша. Они уверены, что индексация ключевых слов не позволяет более двигаться вперед и потому изучают иные технологии, способные понимать смысл фраз.

Финансируемая иностранным капиталом (в основном европейским), но имеющая главный штаб в Нью-Йорке Hakia основывается, по словам её основателя, на принципе "семантического поиска" (semantic search). Система должна "эмулировать понимание". Глубокий смысл тут заключается в понимании языков, а не просто в поиске и индексации информации.

В принципе на сегодняшний день практически невозможно победить Google, в частности в том что касается самых простых запросов. Но - резонный - аргумент основателей Hakia заключается в том, что они могут улучшить ответы на сложные или, по-крайне мере более редкие запросы; те на которые Google плохо отвечает.

"Не прибегая к статистике, поиск в длинном хвосте (The Long Tail) может быть мгновенно проанализирован семантическими алгоритмами, которые дадут список ответов с уместным контекстом", утверждает Доктор Риза Беркан, начальник и основатель Hakia.

Речь, выходит, идёт ни столько об индексации, сколько об анализе. Это проявляется и в том, что в ответах ни слова запроса подчеркнуты, а отдельные отрывки фраз.

Многие задаются вопросом, способна ли Hakia потеснить Google... Разумеется еще рано делать прогнозы на эту тему. Но уже удивляет, что результаты Hakia почти столь же хороши как и Google-вские, а иногда даже лучше, и это при том, что их поисковик пока что лишь на стадии публичных тестов. Сравните, например , оба поисковика по фразой "Who's the president?" и не теряйте из виду The Lab - именно оттуда появятся новшества.

Источник: http://pisani.blog.lemonde.fr/


2 comments:

Unknown said...

Всегда думаю, как задать вопрос, чтобы получить более-менее приемлемый ответ от поисковика...

Впрочем, недавно нужно было найти песенку группы $7000, которая называется "Словечко 'бля'" :)

В рунете запрос, который содержит слова "скачать", "mp3" и "бля" в любом сочетании, как я не пробовал, максимум позволило найти нечто вроде "... пытался бля скачать эту mp3..." и все в таком роде :))

Так что подумать над этим запросом действительно стоит :)

Отсюда можно видеть, что семантика поиска очень привязана к языку - нельзя сделать универсальную систему, да и заставить весь мир говорить только на английском - тоже не реально :)

Технология семантического поиска давно изучена и много где применяется... И если уж сейчас надо подумать, как составить "правильный" запрос Google и можно примерно представить, как гугл будет искать результаты, то думать над запросом семантическому поисковику - голову наверное сломать можно :)

Да... а как пользователю узнать какой поисковик лучше подойдет для его запроса? :) Наверное скоро появится один поисковик, который будет просто брать ответы по запросу с разных поисковиков и группировать их на одной странице. Кстати, идея? :)

yves@brussels said...

"Вопросообразный" поиск действительно довольно неудобно выглядит для простых/обычных запросов на мой вкус (о чем они собственно сами и говорят) ;-)

Ну услышал я песенку по радио, запомнил пару слов; в поисковик ввел и voila - готово.

Другое дело если слова забыл, но помню, что ведущий сказал, что эта песня победила на евровидении ХХХХ года. Тут-то и понадобяться семантические поисковики!

В общем все профессии полезны, все профессии нужны. Пора бы им сделать такую штуку и.... вставить в Google ;-)