Итак, я снова о поиске. Несколько недель назад я писала о модели графического поисковика, который бы работал не на атрибутах графического файла, а на основе схожести картинки. Вроде бы вот этот сервис http://www.photodate.ru предлагает нечто подобное. Правда, пока функционал ограничен поиском среди фотобанков и работой только с фотографиями, да и, судя по обзору и картинкам, об особенной релевантности говорить пока не приходиться, однако сервис являет собой определенный шаг вперед. По крайней мере, по тому, что он делает.
Интересны используемые алгоритмы поиска — действительно ли учитывается схожесть фотографий (хотя если посмотреть на описание, то до настоящего графического поиска еще далеко). Уверена, что исследования подобного рода уже ведутся, вопрос, насколько они близки к выходу реального продукта.
На мой взгляд, настоящий графический поиск должен позволять решать такие задачи:
- проводить поиск по атрибутам картинки (уже давно используется в поисковиках)
- проводить поиск по описанию картинки. Тут, наверное, должны использоваться элементы семантической поисковой машины (т.е. такой, которая умеет общаться с пользователем на естественном языке. Ведь тот же пример с «большим красным шаром» и является нечетким описанием довольно конкретного изображения. Т.е., поисковая система должна уметь: а) понять такой нечеткий запрос и превратить его в набор понятий; б) по этому набору понятий суметь найти картинку. Кстати, если будет решена семантическая составляющая, то эта задача может быть спокойно сведена к первой, при условии, конечно же, если вебмастеры правильно проставляют тег ALT)
- искать изображение, похожее на данное. Вот что пытается делать http://www.photodate.ru. Эту задачу решенной я видела в парочке фильмов, когда крутые полицейские с помощью совершенно крутого компьютера находят по фотографии преступника в базе данных. Правда, сама такого поисковика не встречала. А может они доступны только американским полицейским? 😉
Интересно, занимаются ли в Google подобными исследованиями? Ведь поисковая система, которая первой выйдет на этот рынок, будет очень и очень востребованной.
Так как искуственного интеллекта еще не разработали, то все системы поиска в нетекстовых данных (графика, звук, видео) построены на одном принципе — надо перевести информацию в текстовый (описательный) вид и искать совпадения именно в описаниях. Для поиска преступника по фотографии понятно как ее переводить в текстовый вид — лицо круглое/вытянутое/квадратное, волосы темные/светлые/рыжие, длинна волос короткая/длинная/лысый … Перевод осуществляется на основе сравнения части исследуемой фотографии с заранее заготовленными образцами — лбы, носы, уши…
А вот как произвести текстовое описание ЛЮБОЙ фотографии — это пока нерешенный вопрос.
совсем не обязательно текстовое, почему вы так решили?
еще будучи студенткой 3го курса (1993 год) я решала задачу представления графического файла в виде набора неких элементов. т.е. в своей курсовой я проводила обучение системы — сопоставляла некий граф. объект и систему элементов, а потом пыталась распознать другой граф. объект, похожий на оригинал путем определения похожести на эту систему элементов.
учитывая, что мой опыт программнирования и решения подобных задач закончился в 1995 году, я уверена, что эта задача решается и сейчас и уверена, что гораздо более эффективно.
Используя термин «текстовое» описание я утрировал. Описание может быть в виде любой модели — текст, графы, фреймы, сети … Но в любом случае это законченная модель, которая разработана для описания чего-то конкретного, а для описания общей картинки требуется «модель всего». Отсюда выходим на уже озвученную проблему.
подобие графического поиска вроде есть уже на gogo . ру
кстати и неплохо ищет. кто пробовал можете поделиться впечатлениями. мне наравится