Google пугают лингвистической экзотикой

Опубликовано: 00.00.0000, 00:00 Автор:
Google пугают лингвистической экзотикой Как можно обыграть Google на его собственном поле? Поисковый стартап Powerset рассчитывает на помощь обитателей Сети. 17 сентября компания запустила новый социальный портал Powerset Labs. Компания надеется, что сайт объединит тысячи пользователей, которые помогут довести до ума ее поисковый движок перед выпуском в следующем году.
Powerset оказалась одним из множества стартапов, которые были представлены 17 и 18 сентября в рамках мероприятия TechCrunch40, организованного известным блогером и редактором TechCrunch Майклом Аррингтоном (Michael Arrington) совместно с основателем поискового стартапа Mahalo.com Джейсоном Калаканисом (Jason Calacanis). Однако Powerset сумела выделиться на фоне других проектов своими амбициозными планами.

Прицел – на рекламодателей

Базирующаяся в Сан-Франциско команда из 70 человек рассчитывает потеснить Google, выдавая поисковые результаты, которые будут представлять больший интерес для рекламодателей. Поисковая система Google сопоставляет ключевые слова с текстом web-страниц, а также определяет положение сайта в выдаче на основе числа внешних ссылок на него. Однако Powerset будет анализировать действительное значение проиндексированных слов, фраз и предложений. Это позволит получать более релевантные результаты. "Наша система считывает каждое предложение в каждом документе и определяет его смысл", - говорит руководитель Powerset Барни Пелл (Barney Pell). В основу положен принцип распознавания символов. Технология была частично разработана Powerset самостоятельно, а частично лицензирована PARC, Xerox и Palo Alto Research Center.

Такая система предложит формировать запросы в виде законченных предложений, а не простого набора ключевых слов. Кроме того, анализ смысла встречающихся слов и фраз позволит дополнить результаты документами, содержащими синонимы запроса. Поиск по ключевым словам, используемый Google, такую возможность не поддерживает.

Скептики и последователи

Многие специалисты скептически относятся к замыслу Powerset. Еще в прошлом октябре главный редактор портала Search Engine Land Дэнни Салливан (Danny Sullivan) сообщил, что слова о превосходстве поисковиков на основе системы распознавания текста пока не получили ни одного веского доказательства. Он также считает, что людям значительно проще формировать запрос в виде короткой фразы из ключевых слов, чем в виде смыслового предложения. "Лингвистика не способна решить проблемы поисковых движков", - уверен Апостолос Герасоулис (Apostolos Gerasoulis), вице-президент Ask.com.

Однако Powerset далеко не единственная компания, продвигающая подобную идею. Аналогичные технологии предлагают стартап Hakia и ряд других компаний. Powerset рассчитывает на помощь пользователей. На сайте Powerset Labs они смогут испытать работу системы, посмотреть демонстрационные видеоролики и внести какие-либо предложения по ее улучшению. За удачные идеи пользователи будут получать специальные очки «кармы», которые откроют доступ к новым демо-роликам. "Народная мудрость иногда помогает найти лучшие идеи", - говорит Скотт Превост (Scott Prevost), один из руководителей Powerset.

Лингвистика – дело тонкое

Однако Powerset предстоит решить ряд серьезных проблем, связанных со скоростью индексации страниц и оперативной выдачей результатов. Кроме того, пользователям придется пересмотреть традиционный подход к формированию запросов. Отказаться от привычных ключевых слов в пользу законченных фраз и предложений будет нелегко. Релевантные результаты можно получить только в том случае, если запрос будет достаточно длинным и полным.

Разработчики обещают максимально упростить процесс формирования запросов с помощью примеров и указания отдельных слов в тематических разделах. Доступ широкой публике к тестированию Powerset закрыт. В данный момент разработчики планируют регистрировать не более 500 тестеров в неделю.

Руководство Google пока не воспринимает конкурентов всерьез. Представители компании считают, что до начала практического использования лингвистического поиска еще очень далеко, а пока это лишь экзотика, над которой еще предстоит упорно работать долгие годы.

Источник: Business Week

Добавьте комментарий
Для размещения комментария необходима регистрация или авторизация:
 пользователь:   
 запись OpenID: 


Заработай деньги
на своём сайте!
Новый сервис монетизации СМИ и блогов.
Приглашаем сайты к бета-тестированию →
Новости СМИ2

ТЕМА НЕДЕЛИ


Rambler's Top100