Google будет искать таблицы
В ближайшее время компания Google планирует добавить в свою поисковую систему технологию анализа табличных данных. Развитие поиска в этом направлении позволит увеличить поисковый индекс системы.
Поиск по таблицам позволить сделать доступной для поиска, а значит, и для пользователей, информацию, которая ранее не была видна поисковым машинам. Сотрудники Google определили, что в данный момент в Интернете размещено более 14 миллиардов таблиц. Среди них 154 миллиона содержат полезную информацию.
Задача распознавания и поиска в табличных данных для Google представляет собой, в первую очередь, умение «увидеть» содержимое таблицы и проиндексировать ее, включив в поисковый индекс. В этом случае система сможет расширить поисковую выдачу, представляя таблицы как результаты поиска. Например, в ответ на запрос о курсах валют в первую неделю февраля система сможет предоставить пользователю таблицу, содержащую такие данные.
Задача видимости данных, размещенных в Интернете, является очень актуальной в наше время. Стремительный рост размещенной в онлайне информации привел к появлению так называемого глубинного веба (deep Web) – сайтов, контент которых недоступен поисковым системам. Частично глубинный веб состоит из сайтов, получить доступ к которым можно только после регистрации. Кроме того, к глубинному вебу также относятся данные, пока еще недоступные поисковым машинам. Такими данными являются также и таблицы.
Для поиска по глубинному вебу недавно была запущена поисковая система DeepDyve.
- 03.02.2009 в 12:21
- 3 голоса
- одобрить
- утопить
- 0 комментариев
на своём сайте!