[identity profile] arabian-gold.livejournal.com posting in [community profile] useful_faq
Есть некая картинка. Когда я завожу по ней поиск в Гугле и в Яндексе, они, как обычно бывает в случаях, если картинка размещена на многих сайтах, выдают список с размерами. Но вот в чём странность. В этих результатах совсем другие картинки, не та, по которой производится поиск.

Обычно, если такой картинки больше нигде в интернете нет, результаты поиска по картинкам выглядят совершенно иначе: В Гугле — надпись Изображения других размеров не найдены. и Совет: введите описание изображения в строке поиска. В Яндексе — строка Сайты, где встречается картинка и после неё пусто.

Под катом пример, как это выглядит в случае с проблемной картинкой.

Результаты в Гугле:
google
При переходе по двум выданным ссылкам — дядька со "Страниц с подходящими изображениями", а не с загруженной картинки. При переходе по ссылке Все размеры: две эти же картинки дядьки, а не загруженного.

Результаты в Яндексе:
yandex
Тут ещё интереснее. Множество результатов, но нигде не выводится человек с загруженной картинки (все в скриншот не влезли, но я проверила, по результату 1225×1200, вообще женский портрет, например). Если присмотреться, то в маленькой иконке Загруженная картинка в поисковой строке — вообще чёрно-белая другая фотка.

Не понимаю, что за странности такие?

Кто хочет повторить эксперимент, вот исходная фотка:
fd5b8923626fc38894f9d7883b35b213



Юзфул по двум причинам.
1) Хочу понять, почему алгоритм поиска именно на данной картинке так странно срабатывает.
2) Хочу узнать, кто изображён на данной картинке.

Date: 2014-10-04 10:20 pm (UTC)
From: [identity profile] print-design.livejournal.com
попробуйте Tineye
Попробовал. Нет результата.
Наверное и поисковики дают похожие картинки, т.к. аналогов нема.
Edited Date: 2014-10-04 10:21 pm (UTC)

Date: 2014-10-04 11:37 pm (UTC)
From: [identity profile] spamsink.livejournal.com
Так вот же: http://www.24open.ru/qa/situation/529923/

Date: 2014-10-06 07:00 am (UTC)
From: [identity profile] m-maeglion.livejournal.com
страницы уже нету.

Date: 2014-10-05 06:28 am (UTC)
From: [identity profile] d-v-temnote.livejournal.com
потому что картинки, которые вам выдаются, действительно похожи на запросную. в гугле же не человек их опознает по сюжету и роже, а машинка - по цвету и расположению цвета.
например, мне однажды на поиск картинки мужика в смокинге на белом фоне выдали кучу пингвинов. потому как и вправду распределение цвета прям почти один в один.

Date: 2014-10-05 11:26 am (UTC)
From: [identity profile] d-v-temnote.livejournal.com
повторю - для гугла это ТЕ ЖЕ картинки

Date: 2014-10-05 11:32 am (UTC)
From: [identity profile] d-v-temnote.livejournal.com
это уже другой вопрос - какие алгоритмы у яндекса и гугла.

Date: 2014-10-06 09:42 am (UTC)
From: [identity profile] blood-again.livejournal.com
Точный алгоритм поиска мне неизвестен, но причину такой ошибки знаю :)
При сравнении изображений используются оценочные функции, выдающие некоторое число на основе каждой картинки. Поэтому в поисковой базе данных хранятся не сами картинки, а набор чисел, характеризующих эти картинки.
Поиск картинки означает: рассчитать соответствующие числа для заданной картинки и найти в базе набор чисел, совпадающий с полученным.
Проблема всех этих алгоритмов в том, что возможное разнообразие этих чисел заведомо меньше, чем возможное разнообразие картинок. Поэтому целому ряду разных картинок будет соответствовать один и тот же набор чисел. И значит, с точки зрения алгоритма, эти разные картинки будут считаться одинаковыми.
Edited Date: 2014-10-06 10:07 am (UTC)

Date: 2014-10-06 01:30 pm (UTC)
From: [identity profile] blood-again.livejournal.com
Ошибочный расчёт только для данной картинки? Маловероятно. Иначе результат в гугле не повторялся бы так устойчиво.
Я попробовал немного растянуть приложенное Вами фото - гугл находит всё того же Вильяма Тёрнера. Так что способ рассчёта тот же и даёт повторяющиеся результаты.
Любопытно, что поворот фото на небольшой угол даёт тоже устойчивый, но другой результат - некто Тимо Микконен. Попробуйте в гугле это фото:
Image

Пожалуй, дело таки в специфических элементах картинок. Здесь всё зависит от реализации оценочных функций. Но, боюсь, посмотреть их изнутри нам не дадут :)

Кстати, если Вам не лень, отправьте это фото в техподдержку гугла. Думаю, их разработчикам будет интересна эта ошибка поиска. Не исключено, что они улучшат поиск через какое-то время.

Что до яндекса - я вижу, у них нет разделения на "точно это фото" и "похожие фото". Поэтому для распространённых в сети фото выдаётся оно же (как наиболее похожее), а для редких - просто отдалённо похожие.

Date: 2014-10-07 02:05 pm (UTC)
From: [identity profile] blood-again.livejournal.com
> для некоторых картинок, имеющих какие-то определённые характеристики, под которые подпадает и данная.

Скорее это не ошибочный расчёт чисел, а неверный выбор функций со стороны разработчика. Ключ к этой проблеме таится в непрерывности выбранных функций.

Так, например, одно или ряд рассчитанных чисел могут характеризовать распределение цветовых пятен на фото. Этот набор функций, как можно заметить, у гугла подобран хорошо: среди предложенных картинок сплошь человеческие портреты. Более того, портреты мужчин.
Другой ряд чисел может характеризовать разброс или форму мелких деталей на б/м равномерном фоне (например, черты лица). Если плохо выбрать вид функций для этого (выбрать уж очень прерывистые функции), то малое изменение деталей картинки может дать скачок значений (как произошло при малом повороте фото). И наоборот, значительно отличающиеся картинки дадут близкие значения чисел.

Возможно, как раз черты лица на этом фото оказались близки к точке разрыва одной из функций. Что сыграло основную роль: сильно оттенённые скулы, утолщённые брови или ещё что - сложно сказать.
Можно поэкспериментировать в редакторе: попробовать оттенить скулы на другом портрете и скормить результат гуглу. Но я не готов этим заниматься :)