01.11.2008г.
Поисковик Google научился различать слова на изображениях
  
Компания Google разработала систему оптического распознавания текста. Она позволяет поисковику различать текст на отсканированных изображениях. Об этом сообщается в официальном блоге Google. 
В настоящее время Google способен распознать текст на изображениях, сохраненных в формате PDF. О планах Google по расширению возможностей системы не сообщается. 
Поисковик уже начал индексировать PDF-файлы. Наибольшую сложность представляет поиск по старым отсканированным документам, где бумага, например, испачкана следами от чашки с кофе, либо имеются различные пометки, сделанные от руки. 
Ранее Google запустил в экспериментальном режиме сервис Google Audio Indexing, распознающий звуковую дорожку в видеоклипах. Он конвертирует звук в текст и индексирует последний. 
Кроме того, в начале сентября Google сообщил о планах по размещению в интернете отсканированных страниц старых газет и журналов. Они будут помещены в новостной архив поисковика и появятся в результатах поисковой выдачи. 
Источник:   lenta.ru 
Связаться с автором новостей можно по почте: diza[@]innov.ru. Обязательно укажите тему письма: inews.
При любом использовании материала гиперссылка на innov.ru обязательна
Все новости рубрики