Без рубрики

Поиск картинок и распознавание изображений: где прорыв?

Прекратим (на время 😉 ) наезжать на блогосферу — как оказалось, многие блогеры слишком болезненно на сие реагируют ;-). Но не по причине излишне нервных товарищей, а потому как в мире есть достаточно много интересных вещей. Вот, например, поговорим о более отвлеченных вещах, а именно – о поиске, на этот раз — о поиске картинок. Недавно Яндекс анонсировал обновление функционала своего поиска картинок. В нем появились некоторые достаточно интересные вещи.

Приведу цитату:

Вторая новинка, которую представили разработчики Яндекса своим пользователям – появление расширенного поиска. Здесь можно задать некоторые дополнительные ограничения, позволяющие более точно сформировать поисковый запрос и получить более точную, более релевантную выдачу. Кроме традиционных ограничений по размеру и формату графического файла, тут можно задать цвет, который должен преобладать на найденном изображении. Такую функцию можно смело считать первым серьезным шагом на пути интеллектуального поиска картинок – благодаря этой возможности поиск Яндекс.Картинки даже превосходит аналогичный поиск Google, где пока можно задать только цветовую палитру изображений (черно-белую, полутоновую или полноцветную).

Собственно, первый шаг, он, конечно, но слишком уж мал. В отличие от традиционных поисковых механизмов, пока справляющихся с традиционными задачами, поиск по картинках пока еще оставляет желать лучшего. Ибо базируется он на тегах и текстовых описаниях. Поленился поставить автор (редактор) сайта нужные описания, и картинка слепа для Интернета. Более того, пользователь, который хочет провести интуитивный поиск, сделать этого не сможет по причине отсутствия подобных механизмов. Например, мне нужны фотографии, на которых изображены подростки (юноши и девушки) и собаки. Поисковая выдача запроса к гуглу оставляет желать лучшего.

В то же время, по запросу «Ющенко семья» мы имеем достаточно релевантную выдачу – ну понятно, что на сайте Президента, равно как и на других официальных ресурсах описания картинок используются такие, чтобы фото были видны поисковикам.

Еще один пример поиска – запрос «Большой красный шар». Поисковая выдача, как видите, вообще непонятно как получена. А все потому, что запрос такого типа использует, если можно так выразиться, описание контента картинки. Которое пока не обрабатывается современными поисковиками.

Эти примеры являются описанием одной из глобальнейших задач современной…хм, не знаю как сказать – математики, кибернетики, ИТ, алгоритмизации? Речь идет о задаче распознавания образов. В том числе – задаче распознавания картинок. Суть ее – заставить компьютер понимать, что изображено на картинке.

Одним из направлений решения этой задачи является разработка OCR-приложений, то есть программ распознавания текстов. Кстати, очень много диссертаций защищено именно в сфере распознавания объектов.

Хотя тут интересна связь распознавания с поиском. Если воспринимать это как единую задачу, тогда поисковая система, индексируя изображения, должна будет все их пропускать через механизм распознавания. Не могу оценить длительность этого процесса, однако наверняка будет не очень мало по времени.

С другой стороны, распознавание – не очень связанная с поиском задача. Хотя, когда она будет решена, то есть – поисковая система по картинкам сможет искать по контенту изображений, то такой поисковик мгновенно завоюет для себя практически весь рынок поиска изображений. Интересно, ведет ли Гугль работы в этом направлении?

В дополнение – замечательный текст от Антона Носика.

5 комментариев

  1. Вы знаете, существует несколько поисковичков картинок, где вместо поисковой фразы нужно рисовать искомый образ в специальном флеш-плагинчике. При поиске простых изображений. Например, большого красного шара, выдача неплохая. Однако, если нарисовать домик, то получим все что угодно.

    В задаче распознавания образов остро стоит вопрос о том, какое качество и детальность распознавания стоит считать приемлемым? Слишком высокая детальность при распознавании даст неприемлемо медленную скорость работы и индексатора, и машины поиска.

    Это очень трудная техническая задача. А если учесть, что изображения могут быть в огромном количестве форматов, то она усложняется еще сильнее.

    При всем при этом, поиск по картинкам ведется не так часто, как поиск по тексту. То есть, экономический эффект, если и положителен, то не очевиден.

    Потом, основной способ заработка поисковиков — реклама в поисковой выдаче. А что можно рекламировать, при поиске большого красного шара? То есть, сложно сделать так, чтобы мощные интеллектуальные затраты могли вообще окупиться. Вот и тормозит область.

  2. Для нашей газеты (в которой я работаю) предпочитают пользоваться фотобанками.
    Во-первых 100% найдётся то, что ищется.
    Во-вторых цена — порядка 0.5-1 бакса за кадр и никаких проблем с copyright-ами
    В-третьих, правда, если это репортажи очень свежие и с места событий (Ливан, например, или ещё где) то тут цена кадра может колебаться до 30-50 долларов за штуку.

    Но если надо для подобного использования — лучше, чем фотобанки, пожалуй, нет

  3. Влад, думаю, тема не в том, «где найти» нужную фотку. А в самой технологии и ее развитии. Даже самые лучшие поисковики, даже специализирующиеся на поиске изображений, не могут дать релевантную выдачу по многим запросам.

    Научить систему понимать что изображено на картинке — непосильная задача. Объектов в реально мире слишком много. А объекты, которые выглядят похоже не всегда одно и то же. Например, вы сможете с первого взгляда отличить телефон от коммуникатора, а КПК от gps-навигатора?

    А чтобы проиллюстрировать наглядно сложность задачи, можно привести пример — распознавалки текстов. В их базе всего несколько сотен объектов. Буквы, цифры, знаки препинания и прочее. Внимание, вопрос: кто скажет мне название распознавалки, которая стопроцентно отличит букву «н» от «п», а «0» от «О».

  4. По ссылке у какого-то Лебедева нашел интересный поисковик — TinEye Image Search — пока что в бете, но якобы позволил толпе народу выиграть конкурс «определи кто на портрете», устроенный этим самым Лебедевым. Правда требует регистрации. Правда это скорее обратная задача: найти, а то за … такая изображена на картинке?

Добавить комментарий для SHAman Отменить ответ

Ваш e-mail не будет опубликован. Обязательные поля помечены *