18.05.2005г.
"Яндекс.блоги" воспользовались базами LJSearch и Liveinternet
В "Яндекс.блогах" (поиск "Яндекса" по блогам и форумам) теперь доступны архивы большинства русскоязычных блогов, накопленных на сайтах LiveJournal и LiveInternet.
"Сейчас проиндексировано 19 миллионов сообщений, начиная с 1999 года, - рассказывает руководитель отдела веб-поиска "Яндекса" Александр Садовский. - Теперь пользователи "Яндекса" могут не только найти мнения о недавних событиях, но и вспомнить события давно минувшие, а также изучать динамику отношения авторов блогов к людям, компаниям и товарам".
Для того чтобы проиндексировать архивы, "Яндекс" получил базы данных LiveInternet и поисковика LJSearch. Как и blogs.yandex.ru, LJSearch позволял искать в Livejournal. Проект был закрыт вскоре после открытия "Яндекс.блогов".
Как пояснил создатель LJSearch Илья Котельников, база LJSearch потребовалась "Яндексу" из-за того, что "Яндекс.блоги" индексируют только RSS-потоки, а в них не попадают старые записи. Кроме того, выкачивать такой объем данных - большая нагрузка на серверы самого LiveJounal. База LJSearch собиралась около года. "Архивы блогов - это очень большой объём информации. Чтобы не завалить серверы LiveInternet и Livejournal, пришлось бы потратить месяцы, поэтому проще было связаться напрямую и взять их архивы," - подтвердил руководитель пресс-службы "Яндекс", Михаил Ушаков
Многие пользователи LJSearch жалуются, что этот поисковик давал лучшие результаты, нежели в "Яндекс.блоги". В "Яндексе" с этим не согласны. Blogs.yandex.ru обычно упрекают их в двух вещах: в отсутствии поиска по никам и неполноте поиска. По словам Ушакова, поиск по никам появился вскоре после запуска. Воспользоваться им можно с помощью языка запросов. Что касается полноты результатов, то недовольство связано с тем, что, по его мнению, некоторые пользователи хотят искать и те дневники , авторы которых запретили индексацию. При запуске поиска "Яндекс" индексировал всё, но потом, по многочисленным просьбам авторов, начал учитывать этот запрет. "Мы полагаем, что желание создателя дневника сохранить определенный уровень приватности является существенным, и с ним надо считаться - также как робот "большого" Яндекса считается с robots.txt," - говорит Ушаков.
Поиск "Яндекса" по блогам и форумам был открыт в декабре 2004. У сервиса до сих пор экспериментальный статус, и он постоянно развивается. Уже после запуска добавлена поддержка формата представления данных Atom, появилась возможность оформить RSS-подписку на любой запрос (ссылка на соответствующий запросу RSS-поток находится над результатами поиска). Кроме того, владельцы блогов и форумов могут организовать поиск по своим записям, установив у себя форму поиска.
Источник: Компьюлента
При перепечатке материала ссылка на innov.ru обязательна
Все новости рубрики