[identity profile] slonaved.livejournal.com posting in [community profile] useful_faq
Скажите, есть ли в инете такой сервис: я закачиваю на сервер jpg-файл какой-нибудь картинки, а он мне выдает, что это такое за картинка и дает ссылки на то где это еще встречается в сети. Например, у меня есть какая-то известная фотография, но я не знаю кто автор и где и когда она снята, в общем, подробностей о ней, а сервис выдает мне что автор этой фотки такой-то американский фотограф, иснята она во Вьетнаме в 1965 году.

В принципе...

Date: 2007-09-20 10:51 pm (UTC)
From: [identity profile] wamana.livejournal.com
...OCR работают совсем не так. А потому и масштабирование метода от поиска буквы до поиска большой картинки не работает.

Кстати, даже поиск точного подобия - задача сложнейшая, т.к. то, что мы глазом воспринимаем как одинаковые картинки, может выводиться совершенно разным набором пикселов.

Re: В принципе...

Date: 2007-09-21 06:15 am (UTC)
From: [identity profile] luckywalrus.livejournal.com
Пока мы тут обсуждаем как и почему это сделать невозможно, на других форумах говорят о том, как это может быть устроено:

http://forum.graphicon.ru/viewtopic.php?t=57

...или предлагают готовые программные продукты

http://www.imagedupeless.com/ru/

Кстати, никто и не говорит о точном подобии - поисковики тоже не выдают одну строку в качестве результата. Они лишь предлагают множество вариантов, из которых можно выбрать наиболее подходящий.

PS Поскольку проверять наши аргументы в этом затянувшемся споре мы не будем (ссылкам Вы не верите, а писать самому такую программу у меня пока в планах нет), предлагаю сворачиваться. Тем более, на исходный вопрос мы ответили - таких поисковиков, дающих точный результат, пока нет. А уж почему их пока нет и будут ли - это уже второй вопрос (с) анекдот

Re: В принципе...

Date: 2007-09-21 06:23 am (UTC)
From: [identity profile] luckywalrus.livejournal.com
Не смог удержаться. Вот цитата из описания принципа работы программы FineReader - одной из известнейшей программы для оцифровки текстов (http://www.docflow.ru/analytic_full.asp?param=30386) Дается описание Растровой классификации как одного из способов опознавания образа буквы:

=================================

Растровый классификатор.
Сравнивает символ с набором эталонов, поочередно накладывая изображения друг на друга. Эталонами в данном случае выступают специально подготовленные изображения; каждое из них объединяет в себе очертания множества вариантов написания того или иного символа. Гипотезы выдвигаются в зависимости от того, с какими эталонами точнее совпало изображение буквы. Сами эталоны строятся методом наложения друг на друга большого количества одних и тех же букв в разных вариантах начертания. Растровый классификатор работает быстро, однако высокой точности не обеспечивает. Широко используется в современных системах распознавания символов.

==================================

Разве тут не говорится о сравнении изображений?..

Конечно...

Date: 2007-09-21 07:08 am (UTC)
From: [identity profile] wamana.livejournal.com
...нет! Здесь идет речь о поиске объекта типа Буква. "поочередно накладывая изображения друг на друга" - ну, это некоторое упрощение, да? Сначала-то символ должен быть выделен. А об этом ни слова. Кроме того, OCR могут разбирать и рукописный текст. И ведь явно не по совпадению с известными начертаниями.

Что же касается доверия ссылкам на научпоп, то по данному вопросу для меня авторитетом являются сотрудники Лаборатории электронной микроскопии и обработки изображений (http://lemoi-www.dvgu.ru/DNN/Science/tabid/147/Default.aspx). В научпопе больше мракобесия, чем фактов.