Игорь Ашманов о социальном поиске Mail.ru

Опубликовано: 13.11.2007, 17:18 Автор: TelNews_ru Рубрики: лица
Игорь Ашманов о социальном поиске Mail.ru 21 августа интернет-холдинг Mail.Ru запустил собственный социальный поисковик, в котором вместо роботов на вопросы пользователей отвечают люди, составляющие аудиторию портала. Появление сервиса Ответы@Mail.Ru вызвало противоречивые оценки участников рынка.
 
TelNews публикует мнение Игоря Ашманова, управляющего партнера и генерального директора компании "Ашманов и Партнеры".

- Насколько жизнеспособной Вам кажется эта идея?

Вы знаете, я на такой вопрос ответить не берусь. Про "социальные" сервисы понять очень трудно, отчего один "завелся", а другой - нет. У меня нет никаких сомнений, что если бы пять лет назад меня спросили, заведется ли Википедия, я бы (как и очень многие) ответил бы, что это какая-то ерунда. Ну зачем писать статьи, без денег, без славы, практически анонимно?

Народ же хочет развлечений в сети, а не тяжелой работы.

А вот поди ж ты. Хотя и получилась какая-то ерунда, по-моему, но ерунда в огромном объеме, посещаемая, с огромным сообществом всезнаек. Проект в смысле построения социальной сети явно успешный.

И про ЖЖ - тоже заранее понять было трудно. Писать публичные и одновременно частные дневники? Да ерунда какая-то.

И про MySpace никто бы не подумал, что получится самый посещаемый сайт мира. Что там такого особенного, казалось бы? Так что не знаю.

Ясно, что пользователей 
туда Mail.ru нагонит. Но сколько они там просидят, возникнет ли сообщество - не знаю.  В Википедии возникло, а это примерно похожая мотивация, для разговорчивых всезнаек с избытком времени.

- Как Вы оцениваете модель мотивации пользователей?

Да не понятно, будет ли она мотивировать тех самых маньяков, которые должны составить ядро и отвечать, отвечать, отвечать. Тут ведь, как обычно, 1-2%, ну 5% будут отвечать, а остальные будут потреблять ответы.

- Сможет ли такой "человеческий" поиск конкурировать с машинным?

Навряд ли. Здесь есть очень серьезная проблема полноты. С какой вероятностью новый вопрос, с которым пришел пользователь уже есть в базе? Удастся ли за счет наращивания массы и повторяемости вопросов покрыть хотя бы самую частотную верхушку? Вроде бы расчет здесь на повторяемость. Вот тут у меня есть очень серьезные сомнения.

Дело в том, что:

Вопрос на естественном языке, выражающий конкретную потребность пользователя - это очень узкий запрос. Он длинный, в нем много слов, а значит, он очень узкий. Пространство таких длинных векторов-запросов чудовищно многомерно, это не поисковые запросы из 1-2 слов.

Грубо говоря, реальные вопросы расположены в пространстве многословных запросов очень разреженно, далеко друг от друга, в отличие от поисковых запросов, которые лежат плотно и уже толкаются локтями в своем довольно узком пространстве коротких фраз. Удастся ли плотно заполнить это пространство длинных фраз, чтобы была высокая вероятность попасть уже в существующую фразу? Я сильно сомневаюсь.
 
По-другому это можно пояснить так: тут есть проблема так называемого тяжелого хвоста. Все языковые явления обычно подчиняются закону Ципфа, что означает, что если расположить эти явления (например, запросы) в порядке частотности, то частоты обратно пропорциональны номеру явления.

Говоря проще, если N - номер запроса, то его частота равна примерно 1/N с каким-то коэффициентом. То есть график частот запросов - гипербола. В начале координат - частые запросы, их сумма покрывает большую часть вообще всех запросов.

Это и дает обычное житейское правило 80:20 (не менее известный закон Парето). Чтобы было понятнее: на вечеринке самые злостные выпивохи (выстроенные в ряд по выпивательной способности) выпивают пива в соотношении 1:1/2:1/3:1/4 и так далее, а 20% всех самых злостных выпивох выпивают 80% всего пива.
 
Однако, поскольку ряд 1/n - расходится, то низкочастотный хвост у гиперболы - тяжелый. Интеграл по нему - вовсе не конечная величина, а стремится к бесконечности.

То есть если на вечеринке очень много народу, то малопьющие выпивают в сумме, оказывается, все-таки больше группы лидеров. Разработчики поисковиков могут рассказать, что и правда всегда имеется длинный хвост запросов, которые не повторяются, а их сумма в итоге больше суммы частотных запросов.

Это значит, что полноты достичь, в общем, не удастся, всегда будет множество новых вопросов, на которые никто не дал ответа.

Ну и будущее качество "ответов" тоже беспокоит. Вот смотрите, взял я посмотреть один из "верхних" вопросов:
 
        Мне в обменнике выдали розовые доллары. Это нормально?
       
        E. J. Ученик (137) 8 минут назад
                нормально. это такие новые доллары.
       
Ученик (105)8 минут назад
                это даже не смешно
        S_girl Ученик (115)4 минуты назад
                Вполне)
 
Ну и чему тут научили вопрошавшего? Стало ему легче жить? Нужно очень серьезно контролировать и стимулировать качество, чтобы не было такой ерунды. Мне не очень верится, что "невидимая рука" сообщества сама все исправит. Никакая мотивация не поможет, кроме разве большого количества презренного металла и выделенных редакторов на окладе - а тогда не обеспечить полноты...

Я вот лично не уважаю результат развития Википедии, да собственно и сами википедисты это признают (на только что прошедшей конференции они сетовали на низкое качество и на то, что с Британникой конкурировать пока не получается).

Но, с другой стороны, проект-то сам по себе популярный, то есть успешный.
Так что, скорее всего, популярный проект из этого получится, если постараться, а конкурировать с поисковиками в этом формате - вряд ли.
 
Текст: Федор Смирнов

Добавьте комментарий
Для размещения комментария необходима регистрация или авторизация:
 пользователь:   
 запись OpenID: 


Заработай деньги
на своём сайте!
Новый сервис монетизации СМИ и блогов.
Приглашаем сайты к бета-тестированию →
Новости СМИ2

ТЕМА НЕДЕЛИ


Rambler's Top100
Покупка, интернет магазин продажа холодильников