распознаватель картинок
Sep. 19th, 2007 10:53 pm![[identity profile]](https://www.dreamwidth.org/img/silk/identity/openid.png)
![[community profile]](https://www.dreamwidth.org/img/silk/identity/community.png)
Скажите, есть ли в инете такой сервис: я закачиваю на сервер jpg-файл какой-нибудь картинки, а он мне выдает, что это такое за картинка и дает ссылки на то где это еще встречается в сети. Например, у меня есть какая-то известная фотография, но я не знаю кто автор и где и когда она снята, в общем, подробностей о ней, а сервис выдает мне что автор этой фотки такой-то американский фотограф, иснята она во Вьетнаме в 1965 году.
no subject
Date: 2007-09-19 07:19 pm (UTC)Что такое картинка - это набор пикселов, причем их там обычно несколько миллионов. Каждый пиксел характеризуется расположением и тремя (обычно) цветами, к тому же цветовые схемы моглут быть разными. И как вы себе представляете такое сравнение?
А если у одной картинки одно разрешение, а у другой - другое, то для компьютера - это уже две разные картинки. А если я прошелся фильтром? Даже просто резкость повысил - уже другие пикселы. И еще много-много нюансов.
А картинок в инете - биллионы, а как их проиндексировать?
В общем, чтобы чушь не спрашивать - учите матчасть.
no subject
Date: 2007-09-19 07:28 pm (UTC)Всё-таки есть проги-каталогизаторы, которые на компьютере ищут похожие изображения с учётом именно того, что у них могут быть разные варианты.
Другое дело, что организация подобного предприятия в масштабах интернета потребует гигантских вычислительных мощностей и огромного архива тегов к каждой картинке.
Думаю, что через n-е количество лет Гугль это сделает...
Но сейчас такого 99.9% не существует.
no subject
Date: 2007-09-19 07:47 pm (UTC)no subject
Date: 2007-09-19 07:35 pm (UTC)"Поздравляю, господин, саврамши!" ))
no subject
Date: 2007-09-19 07:59 pm (UTC)А если у слов разны окончания и приставки, и вобще морфология и все дела, а еще и ошибки орфографические и анаграммы нормально понимают, причем в обе стороны. Ну про то что еще язык документа и тематику распознают я не буду упоминать.
А то что в инете текстов ооооочень много и явно больше 10 в 9 -биллиона вашего, напомню. И индексируются они не прямым индексом, а как миниму обратным.
так что подучите матчасть.
А топиккастеру, скажу что технических проблем особо нету, все решаем и не мега сложно, просто тексты ищют гораздо-гораздо чаще чем картинки, и из-за этого нету смысла вкладывать деньги в такой сервис который почти не кто не будет использовать.
no subject
Date: 2007-09-19 08:11 pm (UTC)no subject
Date: 2007-09-20 02:23 am (UTC)А вот понимаете ли Вы, что есть еще и "глубина цвета", что измеряется в битах? Если картинка, скажем восьмибитная, то количество комбинаций цвета пиксела получается всего-то 2 в восьмой. А ежели цвет - 24-х битный, то количество комбинаций увеличивается несколько, да? Так что получается это несколько хм, больше того же алфавита. Сколько там в том же Юникоде символов? Неужели 2 в 24-й степени?
Много Вы видели тех же вордовских документов размером 5-6 мегабайт? А моя камера делает снимки в JPEG от 5 мегабайт только так, без проблем. И это в JPEG, который как известно, формат уже сжатый. Ну-ка, попробуйте сжать текст и картинку в JPEG, получится лиодинаковый процент сжатия? А есть еще много других форматов.
Да, проблему индексации частично можно решить за счет ключевых слов, включенных в тот же графический файл.
Только кто их добавляет к каждой фотографии? Стоковые фотографы, разве что.
Насколько понимаю, проблема в принципе решаемая, только пока что даже в рамках одного стокового банка она потребует столько вычислительных ресурсов, сколько ни одна фирма себе позволить не может.
no subject
Date: 2007-09-20 05:21 am (UTC)Другое дело что потянет это только гугль, ибо объем индексации - уууу ;)
no subject
Date: 2007-09-20 11:06 am (UTC)Я к чему говорю - проблема, которую Вы так страшно описываете (с глубиной цвета, разрешением, картами цветопередачи) решается как раз вот так вот - преобразованием картинки к стандартным параметрам.
Хотя, по сути вопроса я тоже таких поисковиков не знаю, но такие системы должны существовать. В МВД, например...
Кстати, подумалось тут, что программы оптического распознавания символов - частный случай.
Частные случаи...
Date: 2007-09-20 02:45 pm (UTC)Re: Частные случаи...
Date: 2007-09-20 03:19 pm (UTC)Если сделать такое допущение (оно выглядит вполне логичным, не правда ли?) то задача поиска заметно упрощается. Особенно, если и фото и оригинал будут смасштабированы к одному размеру и глубине цвета.
Программу же распознавания я привел только как пример. Иллюстрацию. Ведь в принципе она работает похоже - берет фрагмент изображения, предполагая что этот квадратик из пикселей - буква. И ищет такой же у себя в библиотеке. Да, при этом допускаются некоторые несовпадения (огрехи сканирования) нивелируются различные шрифты. Но это - уже дополнительные условия. Принцип работы тот же.
Иллюстрацией же того, что это возможно в принципе можно рассматриватьи те сайты, что были приведены выше.
В принципе...
Date: 2007-09-20 10:51 pm (UTC)Кстати, даже поиск точного подобия - задача сложнейшая, т.к. то, что мы глазом воспринимаем как одинаковые картинки, может выводиться совершенно разным набором пикселов.
Re: В принципе...
Date: 2007-09-21 06:15 am (UTC)http://forum.graphicon.ru/viewtopic.php?t=57
...или предлагают готовые программные продукты
http://www.imagedupeless.com/ru/
Кстати, никто и не говорит о точном подобии - поисковики тоже не выдают одну строку в качестве результата. Они лишь предлагают множество вариантов, из которых можно выбрать наиболее подходящий.
PS Поскольку проверять наши аргументы в этом затянувшемся споре мы не будем (ссылкам Вы не верите, а писать самому такую программу у меня пока в планах нет), предлагаю сворачиваться. Тем более, на исходный вопрос мы ответили - таких поисковиков, дающих точный результат, пока нет. А уж почему их пока нет и будут ли - это уже второй вопрос (с) анекдот
Re: В принципе...
Date: 2007-09-21 06:23 am (UTC)=================================
Растровый классификатор.
Сравнивает символ с набором эталонов, поочередно накладывая изображения друг на друга. Эталонами в данном случае выступают специально подготовленные изображения; каждое из них объединяет в себе очертания множества вариантов написания того или иного символа. Гипотезы выдвигаются в зависимости от того, с какими эталонами точнее совпало изображение буквы. Сами эталоны строятся методом наложения друг на друга большого количества одних и тех же букв в разных вариантах начертания. Растровый классификатор работает быстро, однако высокой точности не обеспечивает. Широко используется в современных системах распознавания символов.
==================================
Разве тут не говорится о сравнении изображений?..
Конечно...
Date: 2007-09-21 07:08 am (UTC)Что же касается доверия ссылкам на научпоп, то по данному вопросу для меня авторитетом являются сотрудники Лаборатории электронной микроскопии и обработки изображений (http://lemoi-www.dvgu.ru/DNN/Science/tabid/147/Default.aspx). В научпопе больше мракобесия, чем фактов.
no subject
Date: 2007-09-20 12:36 pm (UTC)а про все что вы сказали ответ один, нормализовать данные на входе надо ровно так же как и с текстом всегда их нормализуют.
Не решается...
Date: 2007-09-20 02:37 pm (UTC)no subject
Date: 2007-09-20 12:39 pm (UTC)no subject
Date: 2007-09-19 07:30 pm (UTC)Например, банальный новый интерфейс какой-нибудь оболочки операционной системы кому-то кажется верхом технической мысли, а задача распознавания произвольных изображений кажется ему достаточно простой - всего-то сервис в инете найти.
no subject
Date: 2007-09-19 07:38 pm (UTC)no subject
Date: 2007-09-19 08:22 pm (UTC)no subject
Date: 2007-09-19 08:33 pm (UTC)Так что низачот, дорогой мой человек пытливого ума.
no subject
Date: 2007-09-22 05:40 pm (UTC)А клише - да, такое выражение не меньший паразит среди выражений, чем слово-паразит среди слов.
no subject
Date: 2007-09-19 07:30 pm (UTC)no subject
Date: 2007-09-19 07:46 pm (UTC)no subject
Date: 2007-09-19 07:53 pm (UTC)http://grail.cs.washington.edu/projects/query/
http://www.imgseek.net/
http://www.imgseek.net/sshot/
no subject
Date: 2007-09-20 05:11 pm (UTC)no subject
Date: 2007-09-19 08:06 pm (UTC)поиск про доминирующему цвету точно есть (только ссылку потерял), значит не так долго ждать и до поиска, о котором ты спросил.
а пока, я бы выкладывал такие фотки, например сюда, и задавал бы вопрос о ней :)
no subject
Date: 2007-09-19 08:23 pm (UTC)Про журнальную статью о поиске -- правильное наблюдение, которое пригодилось бы людям, у которых матчасть уже лезет из ушей ))
no subject
Date: 2007-09-20 02:24 pm (UTC)no subject
Date: 2007-09-20 09:25 am (UTC)Хорошая статья...
Date: 2007-09-20 02:00 pm (UTC)То, про что написано в статье, это детский лепет, построенный на простеньких алгоритмиках и эвристиках. Если что-то находится, то, как правильно сказано в статье, "воспринимается такой сервис скорее как развлечение".
На сегодняшний день задача математического поиска похожих изображенй не решена.
Re: Хорошая статья...
Date: 2007-09-20 02:15 pm (UTC)Именно так.
Date: 2007-09-20 02:28 pm (UTC)no subject
Date: 2007-09-20 05:22 pm (UTC)no subject
Date: 2007-09-20 03:25 pm (UTC)http://www.artinfo.ru/eva/EVA2000M/eva-papers/200008/Baigarova-R.htm
Тоже хорошая статья...
Date: 2007-09-20 11:08 pm (UTC)Выделенные мной слова расшифрованы в тексте. Общий вывод статьи: если взять произвольную картинку, то найти ей подобную мы не можем без дополнительных текстовых запросов.