![[identity profile]](https://www.dreamwidth.org/img/silk/identity/openid.png)
![[community profile]](https://www.dreamwidth.org/img/silk/identity/community.png)
Есть некая картинка. Когда я завожу по ней поиск в Гугле и в Яндексе, они, как обычно бывает в случаях, если картинка размещена на многих сайтах, выдают список с размерами. Но вот в чём странность. В этих результатах совсем другие картинки, не та, по которой производится поиск.
Обычно, если такой картинки больше нигде в интернете нет, результаты поиска по картинкам выглядят совершенно иначе: В Гугле — надпись Изображения других размеров не найдены. и Совет: введите описание изображения в строке поиска. В Яндексе — строка Сайты, где встречается картинка и после неё пусто.
Под катом пример, как это выглядит в случае с проблемной картинкой.
Результаты в Гугле:

При переходе по двум выданным ссылкам — дядька со "Страниц с подходящими изображениями", а не с загруженной картинки. При переходе по ссылке Все размеры: две эти же картинки дядьки, а не загруженного.
Результаты в Яндексе:

Тут ещё интереснее. Множество результатов, но нигде не выводится человек с загруженной картинки (все в скриншот не влезли, но я проверила, по результату 1225×1200, вообще женский портрет, например). Если присмотреться, то в маленькой иконке Загруженная картинка в поисковой строке — вообще чёрно-белая другая фотка.
Не понимаю, что за странности такие?
Кто хочет повторить эксперимент, вот исходная фотка:

Юзфул по двум причинам.
1) Хочу понять, почему алгоритм поиска именно на данной картинке так странно срабатывает.
2) Хочу узнать, кто изображён на данной картинке.
Обычно, если такой картинки больше нигде в интернете нет, результаты поиска по картинкам выглядят совершенно иначе: В Гугле — надпись Изображения других размеров не найдены. и Совет: введите описание изображения в строке поиска. В Яндексе — строка Сайты, где встречается картинка и после неё пусто.
Под катом пример, как это выглядит в случае с проблемной картинкой.
Результаты в Гугле:

При переходе по двум выданным ссылкам — дядька со "Страниц с подходящими изображениями", а не с загруженной картинки. При переходе по ссылке Все размеры: две эти же картинки дядьки, а не загруженного.
Результаты в Яндексе:

Тут ещё интереснее. Множество результатов, но нигде не выводится человек с загруженной картинки (все в скриншот не влезли, но я проверила, по результату 1225×1200, вообще женский портрет, например). Если присмотреться, то в маленькой иконке Загруженная картинка в поисковой строке — вообще чёрно-белая другая фотка.
Не понимаю, что за странности такие?
Кто хочет повторить эксперимент, вот исходная фотка:

Юзфул по двум причинам.
1) Хочу понять, почему алгоритм поиска именно на данной картинке так странно срабатывает.
2) Хочу узнать, кто изображён на данной картинке.
no subject
Date: 2014-10-04 10:20 pm (UTC)попробуйте TineyeПопробовал. Нет результата.
Наверное и поисковики дают похожие картинки, т.к. аналогов нема.
no subject
Date: 2014-10-04 10:26 pm (UTC)no subject
Date: 2014-10-04 11:37 pm (UTC)no subject
Date: 2014-10-05 08:42 am (UTC)Хотя в любом случае, эта находка не закрывает вопросы.
Т.к. совершенно не факт, что на данной картинке именно Никита, 30 лет из Москвы. Более того, за данной анкетой может вообще скрываться Вася, 18 лет из Пензы или Аркадий Моисеевич, 54 года из Оклахомы, а на фотке и вовсе какой-нибудь Стив Макферсон, допустим, из Сиднея...
И опять же непонятно, почему в результатах на страницы, где якобы размещена данная фотка -- совсем другие фотки, ведь, когда такой фотки в сети нет, обычно поисковик пишет: Изображения других размеров не найдены
no subject
Date: 2014-10-06 07:00 am (UTC)no subject
Date: 2014-10-05 06:28 am (UTC)например, мне однажды на поиск картинки мужика в смокинге на белом фоне выдали кучу пингвинов. потому как и вправду распределение цвета прям почти один в один.
no subject
Date: 2014-10-05 08:38 am (UTC)no subject
Date: 2014-10-05 11:26 am (UTC)no subject
Date: 2014-10-05 11:31 am (UTC)Ну и вопрос с яндексом тоже остаётся не решён.
no subject
Date: 2014-10-05 11:32 am (UTC)no subject
Date: 2014-10-06 09:42 am (UTC)При сравнении изображений используются оценочные функции, выдающие некоторое число на основе каждой картинки. Поэтому в поисковой базе данных хранятся не сами картинки, а набор чисел, характеризующих эти картинки.
Поиск картинки означает: рассчитать соответствующие числа для заданной картинки и найти в базе набор чисел, совпадающий с полученным.
Проблема всех этих алгоритмов в том, что возможное разнообразие этих чисел заведомо меньше, чем возможное разнообразие картинок. Поэтому целому ряду разных картинок будет соответствовать один и тот же набор чисел. И значит, с точки зрения алгоритма, эти разные картинки будут считаться одинаковыми.
no subject
Date: 2014-10-06 11:49 am (UTC)Впервые с таким сталкиваюсь: обычно или дают ссылки на ту картинку, что надо, или информацию, что такой картинки нигде нет.
А может быть ошибка алгоритма ещё может крыться в способе расчёта соответствующих чисел для заданной картинки? Неправильно рассчитали числа, соответственно неправильные аналоги найдены. Но тогда все аналоги были бы одинаковым (как в гугле в примере выше).
Или какие-то определённые картинки (в силу цвета или специфических элементов, на них изображённых или ещё чего-то) могут давать такую ошибку определения чисел?
no subject
Date: 2014-10-06 01:30 pm (UTC)Я попробовал немного растянуть приложенное Вами фото - гугл находит всё того же Вильяма Тёрнера. Так что способ рассчёта тот же и даёт повторяющиеся результаты.
Любопытно, что поворот фото на небольшой угол даёт тоже устойчивый, но другой результат - некто Тимо Микконен. Попробуйте в гугле это фото:
Пожалуй, дело таки в специфических элементах картинок. Здесь всё зависит от реализации оценочных функций. Но, боюсь, посмотреть их изнутри нам не дадут :)
Кстати, если Вам не лень, отправьте это фото в техподдержку гугла. Думаю, их разработчикам будет интересна эта ошибка поиска. Не исключено, что они улучшат поиск через какое-то время.
Что до яндекса - я вижу, у них нет разделения на "точно это фото" и "похожие фото". Поэтому для распространённых в сети фото выдаётся оно же (как наиболее похожее), а для редких - просто отдалённо похожие.
no subject
Date: 2014-10-06 07:52 pm (UTC)У Яндекса, как функция "похожее фото" в выдаче результатов не предусмотрена, скорее всего потому, что у них есть отдельная функция "поиск похожих картинок", поэтому, чисто теоретически, все картинки в поиске по картинке должны быть именно копиями искомой, расположенными на других сайтах.
По изменённой вами картинке Яндекс, кстати, выдаёт примерно тот же набор портретов, что и по исходной.
no subject
Date: 2014-10-07 02:05 pm (UTC)Скорее это не ошибочный расчёт чисел, а неверный выбор функций со стороны разработчика. Ключ к этой проблеме таится в непрерывности выбранных функций.
Так, например, одно или ряд рассчитанных чисел могут характеризовать распределение цветовых пятен на фото. Этот набор функций, как можно заметить, у гугла подобран хорошо: среди предложенных картинок сплошь человеческие портреты. Более того, портреты мужчин.
Другой ряд чисел может характеризовать разброс или форму мелких деталей на б/м равномерном фоне (например, черты лица). Если плохо выбрать вид функций для этого (выбрать уж очень прерывистые функции), то малое изменение деталей картинки может дать скачок значений (как произошло при малом повороте фото). И наоборот, значительно отличающиеся картинки дадут близкие значения чисел.
Возможно, как раз черты лица на этом фото оказались близки к точке разрыва одной из функций. Что сыграло основную роль: сильно оттенённые скулы, утолщённые брови или ещё что - сложно сказать.
Можно поэкспериментировать в редакторе: попробовать оттенить скулы на другом портрете и скормить результат гуглу. Но я не готов этим заниматься :)
no subject
Date: 2014-10-07 02:10 pm (UTC)Я тоже не готова к таким экспериментам )) лень )) Отписала Гуглу и Яндексу, посмотрим, что ответят.