Исследование картинка: Attention Required! | Cloudflare

Содержание

Анализ фотографического изображения

Анализ — от греч. analysis — разложение, расчленение, процедура мысленного, а часто также и реального расчленения предмета (явления, процесса), свойства предмета или отношений между предметами на части; Аналитические методы настолько распространены в науке, что термин «Анализ» часто служит синонимом исследования вообще как в естественных, так и в общественных науках.

В лекции “Хорошая и плохая фотография” мы уже касались вопроса критериев оценки фотоизображения. Сейчас пришло время поговорить об этом более подробно. Умение анализировать и беспристрастно оценивать свои и чужие фотографии — это одно из важнейших профессиональных качеств фотографа. Будучи первым и, в идеале, самым строгим критиком собственных работ, фотограф должен представить на суд зрителя фотографии, не только совершенные в техническом плане, но и эмоционально яркие, наиболее соответствующие конкретной ситуации. Совершенно очевидно, что для качественного выполнения такой непростой работы нужны определенные знания, умения и навыки. Более того, анализ фотографии развивает фотографическое мышление и способствует росту мастерства, поскольку анализ и синтез это, «две стороны одной медали». Ну и конечно, важно понимать, что целое это, практически всегда, не просто сумма частей, а некое количество взаимоувязанных элементов, в совокупности рождающих новое качество. Именно это качество и отличает настоящую фотографию от простого фотоснимка. Занимаясь анализом фотографического изображения, мы будем рассматривать разные части и стороны изображения, но особенно тщательно – оценивать, то самое качество, которое присуще именно целому – настоящей фотографии.

Теперь о главном – предварительный анализ. Бессмысленно анализировать фотографию просто так, то есть в отрыве от цели ее создания и назначения! Попробуйте ответить на вопрос – что лучше – автобус, грузовик, легковой автомобиль или мотоцикл? Тут же возникает встречный вопрос – для чего? Надо сказать, совершенно правильно возникает. С музыкальным или литературным произведением ситуация аналогичная – можно сравнивать песню со скрипичным концертом, либо эссе с детективом, но пытаться определить, что лучше, в отрыве от контекста и, извините, от конкретного потребителя – совершенно бессмысленно. В полной мере это относится и к фотографии – глупо и дико говорить о достоинствах или недостатках, предварительно не определившись с позиционированием. Отсюда следует простой вывод: чтобы анализ фотографии имел смысл, нужно обязательно соотносить результат с целью его получения.

Воспользуемся самой простой, интуитивно понятной, классификацией по традиционной рыночной схеме – ответим на вопросы:

— для кого,

— о чем,

— зачем.


Для кого?

Ответ на этот вопрос многое определяет. Для начала, отделим общее от частного, то есть фотографии, сделанные для узкого круга друзей или родственников от фотографий для широкой зрительской аудитории. В общем смысле, это деление зрителей на тех, кто «в теме» и тех, кто не знаком с контекстом изображенного на фотографии. Согласитесь, фотография внука, для дедушки с бабушкой, гораздо интереснее самых качественных, абстрактных фотошедевров. Фото как документальное средство, в узкосемейном смысле имеет полное право на жизнь. Более того, абсолютное большинство фотографий делается именно как «фото на память». Конечно же, хорошо когда в семейном альбоме или на стене жилища присутствуют профессиональные снимки, сделанные с высоким качеством, композиционно выверенные и интересные по содержанию. Однако, важнее другое – решающее значение имеет сам факт отражения, известных узкому кругу персонажей, в важных жизненных ситуациях и, конечно то, насколько эти персонажи нравятся «себе любимым». Увлекаясь высокохудожественными, творческими изысканиями, не забывайте о своих близких, чтобы не получился «сапожник без сапог». Близкие люди самая благодарная аудитория.

С фотографиями «на заказ» несколько другая ситуация, они могут предназначаться и для узкого круга и для широкой аудитории. Как правило, выполняя такую работу, нелишне уточнить – для кого делаются фотографии? Главная задача, в этом случае, обеспечить максимальное соответствие требованиям и ожиданиям заказчика, причем, всегда с высочайшим техническим качеством. Зачастую, на то чтобы понять чего хочет клиент, уходит сил и времени больше, чем на выполнение самой работы, но иначе никак нельзя.

Переходим к самому интересному – творчество и самовыражение. Часто фотолюбители говорят о том, что они снимают исключительно для себя – это самообман или лукавство. Всякому творцу нужна аудитория и признание этой аудитории! Значит, занимаясь творчеством, фотограф работает на незнакомую ему аудиторию, которую стремится «завоевать», заинтересовать своими мыслями и фото-образами. Отсюда основное требование – фотографии должны быть привлекательны, интересны и содержательно понятны широкому кругу незнакомых людей. Такие фотографии должны «цеплять» своей формой и содержанием людей оторванных от контекста изображения.

О чем?

На эту тему мы уже неоднократно говорили, поэтому не станем особенно углубляться. Однако, обратим ваше внимание на то, что идея и содержание фотографии должны соответствовать аудитории, месту и времени. Для анализа фотографии по этому критерию, как ни странно, удобно использовать жанровую классификацию: репортаж, пейзаж, макро, монокль, натюрморт, эротика, портрет… Коль уж так сложилось, что форма задает весьма определенные рамки содержания, будем этим пользоваться. Определив жанр, мы в значительной степени даем ответ на вопрос о чем фотография. Понятно, что жанры могут смешиваться, например, фото обнаженной девушки купающейся на фоне морского пейзажа, в закатных лучах, будет относиться и к эротике, и к пейзажу. Также точно и ответ на вопрос «о чем?» будет смешанным – о красоте женского тела и величии природы, о гармонии и скоротечности бытия…

Зачем?

Вопрос кажется простым и не очень связанным с темой анализа фотографии, но, только на первый взгляд. Ответ на этот вопрос, пожалуй, самая непростая и, в то же время, самая важная часть предварительного анализа. Если по отношению к семейному «фото на память» ответ на вопрос «зачем?» лежит на поверхности, то в остальных случаях, он требует серьезной проработки. Один, в общем, весьма продвинутый фотолюбитель на вопрос: «Зачем ты сделал эту пейзажную серию?», совершенно серьезно ответил: «Чтобы все увидели, какой я офигительный фотограф». Стремление к признанию и востребованности – нормально, естественно и имеет полное право на жизнь, но подход «хочу, чтобы зрителю нравилось то, что нравится мне», изначально неправильный и проигрышный. Очевидно, правильнее был бы ответ типа: «Чтобы показать красоту природы тех мест, в которых мне довелось побывать, поделиться теми чувствами, которые испытал». Учитывая, что фотография это эмоционально-образное сообщение, уместна формулировка – зачем зрителю это сообщение? Если ответ на этот вопрос понятен и автору и зрителю – значит, фотография удалась.

Где и как будут представлены фотографии? Еще два дополнительных вопроса, которые имеют значение на этапе предварительного анализа, но они больше относятся к стадии обработки и подготовки фотографии к печати. Да простят нас сторонники так называемой «чистой фотографии», но допечатная обработка, подготовка к печати и сама печать имеют очень большое значение. Все мы знаем, что с одного и того же негатива можно отпечатать весьма разные фотографии. Не случайно наибольшую ценность имею именно винтажи – фото-отпечатки выполненные лично автором, то есть в полной мере отвечающие авторскому видению. Цифровизация внесла свой вклад, и теперь с одного и того же цифрового негатива, на разных, хорошо откалиброванных фотопринтерах, можно получать совершенно идентичные отпечатки. Более того, процесс стал контролируемым – на экране монитора можно увидеть почти то же самое, что получится на отпечатке. Вопросу подготовки изображения к печати у нас будет посвящен целый курс, поэтому сейчас, мы ограничимся простым замечанием – правильная обработка фотографии может кардинально улучшить ее восприятие зрителем. В не меньшей степени нужно учитывать формат и способ отображения. Есть фотографии, которые хороши в любом формате без изменений, но в большинстве случаев, приходится несколько менять контраст и насыщенность изображения. Некоторые фотографии смотрятся только в большом формате, а иные, например панорамы – совершенно не полиграфичны. С некоторой долей условности, можно классифицировать форматы и размещение следующим образом:

1. фотоотпечатки малого формата (10х15 см и менее) – в фотоальбоме
2. фотографии экранного разрешения – для показа в электронном виде
3. журнальный формат (А3-А4) – для полиграфии
4. галерейный формат (А2-А3) – для выставочной экспозиции или в интерьере
5. широкоформатная печать высокого разрешения – для выставочной экспозиции или в интерьере
6. баннерная печать низкого разрешения (наружная реклама)

Кроме размеров, имеет значение так же субстрат, то есть, то, на чём напечатан окончательный результат. Галереи, например, до сих пор не очень охотно берут цифровые отпечатки, поэтому большинство чёрно-белых фотографий в галереях напечатаны традиционным способом: фотоувеличителем на галогенсеребрянной фотобумаге. Фотографии, предназначенные для типографской печати, требуют специальной подготовки, учитывающей специфику процесса типографского цветоделения и растровой печати. Электронное представление накладывает на фотографию дополнительные требования по совместимости и четкости – изображение должно выглядеть одинаково хорошо на любом мониторе (лучше, конечно, на правильно откалиброванном).

Перейдем, наконец, непосредственно к анализу фотографии. Выделим четыре вида:

— технический анализ,

— эмоциональный анализ,

— семантический анализ,

— композиционный анализ.

 


ТЕХНИЧЕСКИЙ АНАЛИЗ

Этот вид анализа наиболее объективен. Как бы вы не были эмоционально привязаны к снятому Вами портрету, если глаза на нём нерезкие, убедить себя и окружающих в обратном не получится. Существует достаточно устойчивый набор критериев технического качества, которому изображение должно удовлетворять: резкость/нерезкость, экспозиция, (яркость, контрастность, провалы, пересветы), цветовой баланс, насыщенность, детализация.

Резкость — первый критерий технического качества, вернее, баланс резкости и нерезкости в кадре. Рассмотрим основные причины нерезкости.

1. Точность фокусировки: на фотографии всегда есть элементы, представляющие особую важность. Они, как правило, должны быть резкими. Если Вы видите, что резкость не там, где надо, а рядом, перед Вами брак.
2. Правильный выбор глубины резкости: малая глубина резкости — это красивый художественный приём, но с ним нужно обращаться осторожно. Например, если на двойном портрете одно лицо в резкости, а другое слегка расплывчато — это брак.
3. “Шевелёнка” она же «смаз» – эти задорные словечки настолько прочно вошли в лексикон фотографов, что давно перешли в разряд терминов. Шевелёнка это смазывание в результате движения в момент экспозиции. Двигаться могут фотографируемые объекты, фотоаппарат, либо и то, и другое одновременно. Разумеется, чем длиннее выдержка, тем больше вероятности получить смазанную фотографию. Смаз, как и небольшая глубина резкости, может быть эффективным художественным приёмом, но, чаще всего, его наличие — плохие новости для фотографа.

4. Масштаб изображения: бывает так, что контрольный отпечаток размером 9х12 см выглядят вполне сносно, но стоит увеличить фотографию до размеров журнального листа, как оказывается, что резкости явно не хватает. Чем больше масштаб изображения, тем строже требования к резкости исходного негатива, слайда, или цифрового файла, потому что резкость определяется четкостью разделения тонов разной плотности. На маленьком изображении, линия может казаться вполне резкой, но, при увеличении, становится видно, что это не чёткая граница между чёрным и белым, а серая полоса, в которой тон меняется градиентно от черного к белому.

Фото 1.

Рассмотрим следующий пример (Фото 1):

Перед Вами технически сложная и достаточно профессионально выполненная фотография. По большинству технических критериев, она почти безукоризненна, за исключением резкости. Посмотрите внимательно на циферблат: сегмент от восьми до четырех часов идеально резок, но цифры V, VI и VII слегка расплывчаты. В принципе, резкости там вполне достаточно для печати на четверть страницы, но для полностраничной рекламы эта фотография непригодна. В данном случае, проблема возникла из-за недостаточной глубины резкости, что при таком увеличении не редкость.

Фото 2. «Старый добрый спорткар». NIKON D70s, 1/60s, f/18, 138 мм»

В этом примере «Старый добрый спорткар» вы видите смазывание, не только допустимое, но и полезное. В результате съемки «с проводкой» движущийся автомобиль получился резким, а неподвижная часть изображения – смазана. Такой прием создает иллюзию движения, скорости.

Экспозиция — второй критерий технического качества. Идеально экспонированный кадр передаёт максимальный тональный диапазон, то есть, детали зарегистрированы как в тенях, так и в светах. Кроме этого, тональное наполнение узнаваемых объектов выглядит естественным, то есть, белое выглядит белым, черное — черным, загорелая кожа — загорелой, а каштановые волосы не светлее и не темнее, чем в жизни. В традиционной фотографии, определение правильности экспозиции отпечатка было делом достаточно субьективным, поскольку способность различать детали в тенях и светах зависит от остроты зрения. Цифровая же фотография даёт возможность объективной оценки экспозиции при помощи гистограммы, представляющей распределение тонов изображения. Этого вопроса мы уже касались в материалах вводного курса и знаем, что понимание основных характеристик гистограммы необходимо для оценки правильности экспозиции.

Бывает так, что световые условия не позволяют запечатлеть все детали. Это происходит в том случае, если освещение слишком контрастно, и нет возможности его модифицировать. В таком случае, кадр экспонируется по теням, либо по светам, в зависимости от того, какой частью тонального спектра можно пожертвовать. В этом случае, отсутствие деталей в одной из частей гистограммы не будет техническим браком. Следует отличать контрастность освещения от контраста фотографии. Контраст отпечатка зависит не только от условий освещения, но и от способа допечатной подготовки, выбора фотоматериалов, режима проявления. Если фотография слишком контрастна, она бедна деталями (что иногда может быть сделано преднамеренно), а если контраст низок, то отпечаток кажется “вялым”, невыразительным.

Даже если резкость и экспозиция безошибочны, есть две причины, по которым фотография может оказаться технически несостоятельной: характер свето-теневого рисунка и композиция. Тема композиции настолько объёмна, что ей будет посвящен отдельный курс, а элементы анализа свето-теневого рисунка мы обсудим.

Характер свето-теневого рисунка это глубина и объемность изображения, иначе говоря — способность создавать иллюзию трёхмерности. Вернёмся к часам на Рис. 1. Обратите внимание на то, как освещено левое верхнее ушко оправы. В отличии от остальных трёх, оно кажется совершенно плоским, лишенным объёма. Произошло это потому, что свет отразился от плоскости точно в объектив – получился практически блик.

Кроме того, следует обращать внимание на то, насколько уместна степень жесткости освещения, реализованная в данном изображении. Жесткий свет, сам по себе, не может быть техническим браком, но его применение чаще ведёт к ошибкам, чем в случае мягкого света, потому что с ним гораздо сложнее обращаться. Например, на Фото 3, неправильная постановка жесткого рисующего источника привела к двум серьёзным проблемам: левый глаз оказался в тени, и тень от носа пересекла губы.

Фото 3. «Засмущал». Неизвестный фотограф.

В принципе, нельзя сказать, что это стопроцентно недопустимо, но в данной ситуации, результат был бы гораздо лучше, если бы источник света был расположен значительно ниже. Кроме того, из-за слишком высокого контраста, кожа на кистях рук, на лбу и под глазами практически выбелена. Как Вы можете обратить внимание, фотографии не достаёт резкости, но, при таком размере изображения, это заметно только при внимательном рассмотрении, в то время, как ошибки в освещении бросаются в глаза, независимо от формата.

Цветовой баланс и насыщенность это цветовые характеристики, влияющие на восприятие фотографии. В пленочной фотографии нужно было аккуратно использовать пленки для дневного света и для искусственного освещения, но даже при этом, в процессе печати применялась цветокоррекция, для обеспечения естественности оттенков. У разных производителей фотопленки были свои особенности – Кодак желтил, Фуджи зеленила, а Коника придавала синеватый оттенок. Наверное поэтому, в портрете был наиболее популярен Кодак. Цифровая фотография позволила в процессе съемки менять баланс белого, подстраиваясь под спектральную составляющую светового потока конкретных условий. Более того, любой фоторедактор позволяет изменить цветовой баланс и насыщенность цвета в фотографии. Этим нужно правильно пользоваться. Сравните фотографии – «Дождливый закат» (Фото 4) и «Baloon Fiesta» (Фото 5) – совершенно очевидно, что цветовой баланс и насыщенность здесь оправданно различаются.

Фото 4. «Дождливый закат». Canon EOS 5D, Canon EF 28-300 f/3.5-5.6 L IS USM

Фото 5. «Baloon Fiesta». Canon EOS 5D, Canon EF 28-300 f/3.5-5.6 L IS USM

Наконец последний пункт – детализация – она же микро-резкость и зернистость, а в цифровой фотографии – шумы. Бытует мнение, что высокая детализация и отсутствие зерна, или шумов — это непреложные критерии качества изображения. На самом деле, не всё так просто. Например, в классической пейзажной фотографии, в съёмке архитектуры, или в криминалистике, детализация чрезвычайно важна, а в женском портрете она, как правило, нежелательна. Поэтому фотографы-портретисты нередко прибегают к разным хитростям и уловкам, позволяющим избавиться от таких неприятностей, как поры, пигментные пятна и мелкие шрамы. В некоторых видах художественной фотографии от чёткого изображения вообще стараются уйти, чтобы перенести основную эмоциональную нагрузку на тональность и свето-теневой рисунок. Поэтому, оценивая детализацию и “чистоту” (отсутствие шума), нужно принимать во внимание, какую задачу ставил перед собой фотограф. При этом, важно помнить, что острота зрения у всех разная, но ориентироваться нужно на «островидящих», значит, если у фотографа зрение не стопроцентное, стоит надеть очки.

СЕМАНТИЧЕСКИЙ АНАЛИЗ

«Жизнь подражает Искусству в гораздо большей степени, чем Искусство подражает Жизни.»
Оскар Уайльд


Фотография, как мы уже не раз говорили, это не просто изображение. Её вполне можно рассматривать, как язык общения, дающий фотографу возможность, при помощи визуальных образов, выразить свои чувства, поделиться переживаниями. Поэтому, смысловое содержание снимка и изящество, с которым оно раскрывается с помощью визуальных метафор, вполне можно считать критериями качества.

Анализируя смысловое содержание снимка, задайте себе вопрос — “Что автор хотел сказать?” — а потом, — “а получилось ли?” Хочу напомнить, что хорошая фотография обязательно оперирует общими понятиями: портретист изображает не глаза, а взгляд, пейзажист показывает не восход, а свежесть раннего утра, и т.д. Важно, что неопределённость, или многозначность сюжета не является недостатком. Предлагая различные интерпретации, автор даёт возможность каждому зрителю додумать сюжет по-своему. При этом, содержание должно быть настолько очевидным, чтобы зритель не потерял интереса в процессе “разгадывания” скрытого смысла, но не настолько прямолинейным, чтобы это не выглядело так, будто автор снисходительно упрощает повествование, потому что зритель не в состоянии осилить более интеллектуальную форму изложения. То же самое можно сказать и по поводу подачи материала: чрезмерная простота грозит примитивностью, а вычурность — заумью. Фотография на Рис. 5 — пример эффективного использования лаконичной подачи в раскрытии довольно сложной темы, допускающей несколько различных трактовок.

Семантический анализ наиболее тесно связан с предварительным анализом, поскольку речь идет о содержании, нужно снова вернуться к вопросу — на кого это самое содержание ориентировано. Важно понять насколько изображение апеллирует к общепонятным, общечеловеческим ценностям. Иногда полезно показать фото разным людям и спросить что они видят, какие ассоциации рождаются, какие чувства будит фотография. Задавайте и конкретные вопросы: о чем фото, что главное в кадре, какие отношения между элементами изображения, насколько оно уравновешено и устойчиво. Если из десяти зрителей, хотя бы пять ответили одинаково, значит фотография будет понятна широкой аудитории.

ЭМОЦИОНАЛЬНЫЙ АНАЛИЗ

«На самом деле искусство отражает не жизнь, а зрителя.»
Оскар Уайльд


Из всех видов анализа, эмоциональный, пожалуй, самый важный. При этом, он наименее формализуем и наиболее субъективен. Эмоциональное восприятие практически моментально, поэтому часто, даже не всматриваясь в изображение, мы уже формируем первоначальное мнение о нём. Критерии очень просты: нравится, не нравится, оставляет равнодушным. Последний, пожалуй, самый неблагоприятный. Если фотография не трогает, то она не запоминается, у зрителя не возникает желания к ней вернуться. С другой стороны, если фотография активно не нравится, стоит разобраться, плохо ли это. Здесь имеет смысл воспользоваться критерием уместности. Когда негативная эмоциональная окраска изображения способствует правильной интерпретации семантического (смыслового) компонента, её можно считать вполне приемлемой. На этом этапе, нет смысла задумываться, почему изображение вызывает те, или иные эмоции. Главное — это прислушаться к своим ощущениям, попытаться понять, изменила ли фотография Ваше настроение и уместно ли это изменение содержанию и авторскому замыслу. Подсознательное ощущение того, что в фотографии всё “сложилось” говорит о том, что в ней присутствует гармония между эмоциональным и семантическим компонентами. Зачастую, визуальная гармония делает изображение настолько приятным для восприятия, что этому не могут воспрепятствовать даже очевидные технические проблемы.

Анализируя фотографию с эмоциональной точки зрения, нужно попытаться отделить истинно подсознательные эмоции, вызываемые только изображением, от личных переживаний, особенно, если это касается ваших собственных работ. Например, портрет бывшей возлюбленной, которая Вас бросила, вряд ли будет радовать, хотя, объективно, он может быть очень неплохим. Или же наоборот, ничем не примечательная фотография скамейки в парке может вызывать бурю чувств, если на этой скамейке Вы впервые поцеловались. При этом, заметьте, по-настоящему разделить эти чувства с Вами может только один человек. Реакция остальных зависит исключительно от объективных критериев.

Важно понимать, что нередко определённый эмоциональный настрой фотографии создаётся нарушением тех, или иных технических норм: неправильной экспозицией, кадрированием, компоновкой кадра. Поэтому, на этапе эмоционального анализа, любые технические решения нужно рассматривать только в контексте уместности их эмоционального воздействия. Кроме того, нужно помнить, что в силу моментальности эмоционального восприятия, зритель начинает воспринимать смысловое содержание, уже находясь под воздействием вызванных фотографией эмоций. Таким образом, восприятие эмоционального и семантического компонента происходят в комплексе, и анализировать их по отдельности достаточно сложно. Вообще говоря, для получения правильного результата, анализ фотографии должен осуществляться одновременно по всем критериям. При этом, нужно стараться оставаться максимально беспристрастным, не позволяя личному отношению к событиям на фотографии, или к её автору, влиять на оценку.

Остался не рассмотренным композиционный анализ, но, во-первых, композиции будет посвящен отдельный курс, а во-вторых, анализом композиции и композиционным строительством мы занимаемся и будем заниматься постоянно. Поэтому в данной лекции мы его отдельно не рассматриываем.

ОШИБКИ ФОТОГРАФА

Давайте теперь немного повторимся, а заодно свяжем теорию с практикой. Ошибки фотографа и, как следствие, недостатки фотографии можно условно разделить на три группы:

— Технические

— Композиционные

— Содержательные

 

технические ошибки: четкость, резкость, насыщенность, контрастность… Основная причина подобных ошибок это недостаток профессионализма или элементарная неаккуратность – неправильно выбранная глубина резкости (ГРИП), некорректная экспозиция, отсутствие резкости там, где она необходима (плохая фокусировка, шевеленка), нарушенный цветовой баланс… такие ошибки видны сразу и, вообще говоря, легко устранимы. За исключением случаев невозможности выбора места и времени а, следовательно – световых условий… объективно непригодные (крайне сложные) для съемки световые условия. Например, существующие на отдельных участках кадра чрезмерный динамический диапазон или наоборот – чрезвычайно тонкие тональные переходы, которые неспособна адекватно зафиксировать камера;


композиционные ошибки: неуравновешенность, невыразительность, отсутствие динамики и (или) перспективы, «замусоренность», потеря многоплановости… Эта группа сложнее – ошибки видны не все, не всегда, порой не сразу и причины здесь разнообразны. Во-первых, это объективная невозможность выбрать правильное время суток, точку съемки и ракурс, дающие возможность «выстроить кадр». Во-вторых, — субъективная неспособность (порой, простая лень) фотографа правильного скомпоновать кадр (скадрировать) из-за недостаточно развитого чувства композиции и неумения пользоваться элементами и средствами композиции для выразительного построения кадра. В-третьих – элементарная невнимательность – фотограф может не заметить какую-то деталь, наличие которой разрушает композицию, или придаёт изображению нежелательную двусмысленность. Зритель может быть в большей степени невнимателен, но обязательно заметит именно эту «неприятную» деталь. В-четвертых – самое сложное – недостаток опыта и воображения для того, чтобы понять как, преобразуется четырехмерная реальность, при переходе в фотографическую плоскость и как при этом изменится образ, столь явно «читаемый» в момент съемки;


содержательные – самое важное – отсутствие мыслей и субъективизм – в среде живописцев бытует пословица: “Мы пишем то, что видим, а видим то, что знаем”. Личный жизненный опыт заставляет нас обращать больше внимания на вещи, наиболее близкие и понятные или субъективно интересные. Поэтому, какие-то структурные и смысловые детали в фотографии могут остаться незамеченными или «недооцененными», а какие-то, напротив – будут гиперболизированы. Кроме того, в процессе создания фотографии, автор неизбежно становится свидетелем, или участником событий, вызывающих эмоциональную реакцию – это часть личного опыта непосредственно связанная с частью содержания, которая могла не попасть в фотографию, но ассоциативно воспринимается автором. Таким образом, как мы уже не раз говорили, фотограф и зритель смотрят на фотографию по-разному и видят в ней разное.

 

_______________________

Читайте также:

Свадебная фотография: новые тенденции

Композиция и зрительная гармония

Способы манипулирования вниманием зрителя

Анализ  снимков. Валерий Стигнеев

Некоторых участников дискуссии по поводу книги А.Лапина «Фотография как…» более всего заботил анализ снимков. И это справедливо, потому что такой анализ — инструмент фотографа. Да и каждый зритель, воспринимая фотографию, вольно или невольно по-своему ведет анализ изображения.

№570

Со столиком, который в кадре № 570, вышел спор. То, что он воспринимается автором книги (далее везде — автор) как часть дивана, да еще повисшая в воздухе, это, конечно, его фантазия. Столик твердо стоит на полу перед диваном с полулежащим на нем человеком и, если кто то, вслед за автором, все же видит его парящим в воздухе, то это уже вопрос веры, а с ней не поспоришь.

Перед нами типично комнатный портрет, такие стали снимать и в Европе и в России с начала ХХ века. Анализ изображения отметит свободную позу персонажа и естественный жест руки, откровенный контакт с камерой. Укажет, какие детали интерьера помогают охарактеризовать персонаж, обратит внимание на обрезанную сверху рамку с графикой и «простроченный» линиями угол шкафа. Не забудет про необычную конструкцию дивана и столика и натюрморт на нем-то ли готовый, то ли составленный фотографом. Отметит расположение фигуры и предметов относительно основных линий кадра, и, наконец, подчеркнет роль ритмического рисунка в предметной композиции и характер светового решения.

Подпись и дата у снимка отсутствуют, хотя они могли бы тоже кое-что подсказать зрителю. Сам снимок в книге отнесен к изобразительной фотографии (по классификации автора), и он следующим образом высказался об оценке таких произведений: «Здесь один критерий — закрыть лицо человека и проверить, что останется от фотографии. Если очертания фигуры, какая-то линия, сочетание форм и т. д. содержательны, то портрет остается портретом и без лица».

Представляете, маэстро перед съемкой закрывает у модели лицо покрывалом и на матовом стекле (или на дисплее) проверяет, осталась ли картинка портретом.

№580

Другой пример — снимок № 580. В дискуссии один из участников сообщил, что не сомневается — на снимке есть злосчастные юбки, из которых вырастает фигура славного юноши. Плохо, что другие этого не видят. Конечно, можно ориентироваться на указание автора: мы ощущаем то, чего на картинке нет, но как бы происходит. Или считать, что любой мужчина, стоящий рядом с женщиной в пышной юбке, из этой юбки вырастает. Но, может быть, стоит повнимательнее рассмотреть снимок.

№577

Такая произвольность в описании сюжетов характерна для ряда примеров. На фото № 577 художник как бы смотрит, пишет автор, на святого сквозь холст (!) на мольберте. Но на снимке перед ним не холст, а иконная доска, смотрит он не на святого, а на изображение на ней и что-то видеть сквозь нее может только «чудесным образом». Идея обмена взглядами живого человека и персонажа иконы сама по себе не корректна. А соображение, что благодаря скамейке и согнутой ноге (!) художник сопоставим по размеру со святым вообще очень странно.

№72

О снимке № 72 автор пишет: «Мужчина на кладбище остановился у могилы, на памятнике фотография молодого человека в военной форме. „Отец пришел к сыну“, — говорим мы себе». Тут важно, что автор устанавливает изобразительную связь овала шляпы в руках мужчины с овалом снимка на памятнике, и из этой связи якобы возникает связь смысловая. Но позвольте, мужчина остановился совсем у другой могилы на первом плане, которую закрывает своей фигурой, и чья это могила — сказать нельзя. А упомянутый памятник стоит вдалеке и, кстати, на нем снимок молодого человека в гражданской одежде (хотя надпись сообщает: солдат, имя). И снова читатель встречается с авторской фантазией, толчок которой действительно дала фотография.

В промежутках между формами на снимке автор нередко усматривает фигуры, которые, как он пишет, ведут себя как реальные (?), вступают в отношения с другими фигурами, что приводит к неожиданному прочтению снимков.

На снимке № 580, по словам автора, есть пространство между фигурами танцоров, по форме «напоминающее торс обнаженной женщины» и »эта женщина одновременно связывает и разрывает нашу пару». Руки юноши и девушки, встречаясь в пожатии, пронзают торс обнаженной. Тут уже не маленький рассказ, заключает автор, снимок становится целым романом о любви. Исходит он из заявленной им позиции: фотография «дает начальный толчок фантазии, но ничем ее не ограничивает». Но почему эту фантазию надо подавать как содержание снимка — вопрос.

Говорить только о том, что реально существует на фотобумаге, а не в нашем сознании — это заповедь автора. Но на практике получается по другому.

№567

Эссе о своей фотографии № 567 автор дополняет рисунком. Текст стоит того, чтобы привести его: «Мужчина и женщина как бы проникают друг в друга, серое переходит в серое, линия воротника женщины — в линию его ноги, ноги смыкаются и получается что-то вроде восьмерки. И в центре этого пересечения женская сумка и то, что за ней скрывается…». Сумка (и то, что за ней скрывается) — это видимо то место, где находятся композиционный и смысловой центры, про которые автор откровенно забыл. В случае их совпадения, подчеркивал он раньше, глаз приходит к сути изображенного сразу. Только вот как линия воротника переходит в линию ноги (возможно ли это?) и где скрывается злополучная восьмерка — неясно. Да и рисунок мало что проясняет, по тону он, если соотносить его с фотографией, заштрихован неверно. Возможно это случай, когда автор, по его словам, ощутил то, чего на картинке нет, но как бы происходит.

К достоинствам «Фотографии как…» следует отнести то, что автор использовал нечастый педагогический прием: из одной книги по теории фотографии (как он пишет) он заимствовал фотографические примеры и взял большие цитаты их анализов, но без ссылок и сопоставил с собственными комментариями. «Одна книга по теории фотографии» — это «Поэтика фотографии», изданная в советское время (1989), а «неизвестный критик» — это В.Михалкович и В.Стигнеев в одном лице.

№84

Вот комментарий автора к фото А.Шешкуса «Женщина» (№ 84): «отрезать человеку голову рамкой кадра — серьезный поступок и он должен быть обоснован. Видимо, активное светлое лицо женщины не укладывалось в темную тональность, поэтому фотограф, не долго думая, его и обрезал. Это этюд, а не законченная работа, что-то удалось, но целое не сложилось. Слишком велика претензия на оригинальность».

Что тут скажешь? Судить произведение по ученическим прописям нельзя.

Автор книги проявил неосведомленность даже не в современной фотографии, а в фотографии 70-80-х годов прошлого века. Потому что уже тогда чешское «Ревю фотографии» познакомило советских читателей с работами Ч.Гарбутта и Р.Гибсона, которые широко использовали этот прием, оставляя в кадре любые фрагменты человеческого тела. Так что Шешкус не изобретал сам принцип.

№65

Снимок Р.Пачесы «Натюрморт 1У» (№ 65) автор называет простенькой картинкой, что, также свидетельствует об уровне понимания фотографии. Самое интересное то, что усмотрел автор: «никакого движения „светлых сосудов“ на снимке нет, да и самих этих сосудов нет, они не светлые». В своей книге он нередко видит на снимках то, чего там действительно нет, но тут обратный случай — в упор не видит того, что есть. Ему слово: «Нужно ли было тревожить тени стольких великих людей, чтобы разобрать эту простенькую картинку? Наверное, очень смеялся фотограф над этим описанием, за то время, которое он потратил на чтение, он бы снял еще четыре точно таких же».

Нет, десять раз прав автор, когда пишет, что у нас нет еще достаточной культуры понимания фотографии.

Читатель легко может прочесть процитированный в «Фотографии как…» анализ снимка Пачесы и сравнить его с претензиями автора.

№2

О снимке В.Филонова (№ 2) автор привел большую выдержку из «Поэтики», но в комментарии дал совет: надо было прежде всего обратить внимание на обратную перспективу, ибо в этом снимке именно она — главная особенность формы, она же выражает содержание. Вот и весь метод анализа. В обратной перспективе надо искать смысл этой фотографии, пишет он. Именно кажущееся движение черных масс вперед, а светлой фигуры назад приводит к поэтическому смыслу этого кадра.

Тут есть одна тонкость: нигде в книге автор не объясняет, что такое смысл, тем более поэтический, хотя постоянно использует этот термин по разным поводам-то находит его среди игрушек под елкой, то мимоходом обронит, что это красота кадра, то приравняет к подтексту. А чаще всего использует как синоним понятия содержание. И опять-таки, можно сравнить два подхода к анализу кадра Филонова и составить свое мнение.

№1

Обсуждение композиции портрета Л.Панкратовой (№ 1) автор считает совершенно неуместным. По его словам, снимок скомпонован так, как может себе позволить только начинающий: лицо девочки попало в центр кадра, а более активные плечо и рука обрезаны. Его негодованию нет предела. А ведь и плечо и рука есть в кадре, скадрирован только локоть (достаточно взглянуть на репродукцию).

№29

Еще строже отзыв о снимке Л.Балодиса «Взгляд» (№ 29). Две светлые фигуры матери и девочки, пишет автор, образуют треугольник, этим, а еще встречей их рук, выражено их единство. Остальное от лукавого. Девочка здесь отнюдь не Джоконда и фотография эта имеет мало общего с подлинной картиной. «И вообще она достаточно неряшливо сделана… сопоставление этой простенькой фотографии с вечными шедеврами живописи совершенно непозволительно». Пикантность ситуации однако в том, что в процитированном автором анализе этой «простенькой фотографии» нет ни слова о Джоконде.

№33

И, наконец, «Реставраторы» В.Семина (№ 33). Снимок автору нравится, еще больше — изображение обобщенного видения, полученное в компьютере. В комментарии есть и композиция Весы, и сильная связь, и белые халаты, которые вызывают эффект обратной перспективы. Автор пишет, что вследствие этого эффекта двое реставраторов зрительно еще активнее проникают (?) в пространство картины (попробуйте сами увидеть это на снимке). Итог он подводит такой: «Светлая фигура женщины на картине взаимодействует с белыми халатами реставраторов и соизмерима с ними. Это форма, а вот и содержание, которое она выражает: ощущение общего пространства и единства всех четырех изображенных в снимке фигур, контакт между ними». Констатация того, что видишь на снимке — это еще не форма. И понимать под содержанием «ощущение общего пространства и единства» — это, как говорят, маловато будет. Тут хорошо бы объяснить читателю, что автор понимает под содержанием. Одно он напутал: у фигуры на картине сложная светотеневая лепка и фигура совсем не светлая, особенно в сравнении с белыми халатами.

Анализ снимка автор дополнил выводом: «Объединение фигур, их единство, цельность этого объединения настолько сильны и гармоничны, что сама фотография чудесным образом превращается в картину».

№546

Фотография Ли Миллер № 546 такой чести не удостоилась. Описывая ее, автор снисходительно замечает, что создание этого снимка было делом случая, игрой природы, а вовсе не заслугой фотографа. Хуже того, оказывается Ли Миллер совершенно не позаботилась об изобразительной стороне снимка, так как кадр с двумя композиционными центрами требовал симметрии в их расположении. А она этого не сделала.

Зато автор отчетливо продемонстрировал свой метод анализа на примере этой фотографии. Из того, что преступник и исполнители приговора с ружьями одинаково черные и подобны по размеру, он делает вывод: этот человек мог бы стрелять вместе с ними в другого преступника. Это-то к чему? Сопоставляя белые одежды священника и белые по цвету мешки за спиной арестанта, он находит ассоциативную связь между ними. У него получается, что это священник стоит за спиной приговоренного, это в священника полетят пули. «Ведь в этом его работа и истинное предназначение». Но заключено ли в этой фантазии автора предназначение снимка?

Теперь об основном принципе анализа фотографий. В книге в изложении автора он выглядит инструкцией, расписанной как первомайские призывы в советской газете: анализ должен быть., говорить следует., фотографию следует оценивать., разбирая фотографию, не следует., необходимо научиться видеть., необходимо провести. Из аннотаций к снимкам можно попытаться реконструировать схему этого принципа: сначала определить форму, из нее вывести содержание, затем дать вывод.

№556

Примером может послужить снимок № 556 и авторское резюме к нему: «Форма: композиция Весы, два памятника на периферии, выраженная обратная перспектива. Содержание формы: поиски смысла в том, что памятники стоят спиной друг к другу, что один из них черный, а второй белый, а также ощущение движения черных масс вперед и светлых — назад. Вывод: все неустойчиво, все движется, светлая земля роет подкоп под могилы, а те плывут вперед».

В главе «Феномен картины» автор предлагает загадочный эксперимент с этим же снимком: он советует перевернуть кадр и тогда, по его словам, обобщенно получится черный лес на первом плане и небо над ним. Для чего это? И что это означает?

В конце книги автор приоткрыл податливый характер самого анализа: «Можно доказать, что эта фотография гениальна, или же, что она никуда не годится».

Не получается.

Введение в курс «Анализ изображений и видео». Лекции от Яндекса
Мы начинаем публиковать лекции Натальи Васильевой, старшего научного сотрудника HP Labs и руководителя HP Labs Russia. Наталья Сергеевна читала курс, посвящённый анализу изображений, в петербургском Computer Science Center, который создан по совместной инициативе Школы анализа данных Яндекса, JetBrains и CS клуба

Всего в программе — девять лекций. В первой из них рассказывается о том, как применяется анализ изображений в медицине, системах безопасности и промышленности, какие задачи оно еще не научилось решать, какие преимущества имеет зрительное восприятие человека. Расшифровка этой части лекций — под катом. Начиная с 40-й минуты, лектор рассказывает об эксперименте Вебера, представлении и восприятии цвета, цветовой системе Манселла, цветовых пространствах и цифровых представлениях изображения. Полностью слайды лекции доступны по ссылке.

Изображения везде вокруг нас. Объёмы мультимедиа информации растут с каждой секундой. Снимаются фильмы, спортивные матчи, устанавливается аппаратура для видеонаблюдения. Мы сами каждый день снимаем большое количество фотографий и видео — такая возможность есть почти у каждого телефона.

Чтобы все эти изображения приносили пользу, нужно уметь что-то с ними делать. Можно сложить их в ящик, но тогда непонятно, для чего их создавать. Необходимо уметь искать нужные картинки, что-то делать с видеоданными — решать задачи, специфичные для той или иной области.

Наш курс называется «Анализ изображений и видео», но речь в основном будет идти об изображениях. Невозможно начать заниматься обработкой видео без знаний о том, что делать с картинкой. Видео — это набор статических изображений. Конечно, есть задачи, специфичные для видео. Например, слежение за объектами или выделение каких-то ключевых кадров. Но в основе всех алгоритмов работы с видео лежат алгоритмы обработки и анализа изображений.

Что же такое анализ изображений? Это во многом смежная и пересекающаяся с компьютерным зрением область. Точного и единственного определения у неё нет. Для примера приведем три.

Computing properties of the 3D world from one or more digital images. Trucco and Veri

В этом определении подразумевается, что вне зависимости от того, есть мы или нет, существует какой-то окружающий мир и его изображения, анализируя которые мы хотим что-то о нём понять. И это подходит не только для определения анализа цифровых изображений машиной, но и для их анализа нашей головой. У нас есть сенсор — глаза, у нас есть преобразующее устройство — мозг, и мы воспринимаем мир путем анализа тех картинок, которые видим.
Make useful decision about real physical objects and scenes based on the sensed images. Shapiro

Наверное, это больше относится к робототехнике. Мы хотим принимать решения и делать выводы о реальных объектах вокруг нас на основе изображений, которые уловили сенсоры. К примеру, это определение идеально подходит под описание того, что делает робот-пылесос. Он принимает решение о том, куда ему дальше ехать и какой угол пылесосить на основании того, что он видит.
The construction of explicit, meaningful decisions of physical objects from images

Наиболее общее определение из трех. Если опираться на него, мы хотим просто описывать явления и объекты вокруг нас на основе анализа изображений.

Подытоживая, можно сказать, что в среднем анализ изображений сводится к извлечению значимой информации из изображений. Для каждой конкретной ситуации эта значимая информация может быть разной.

Если мы посмотрим на фотографию, на которой маленькая девочка ест мороженое, то сможем описать её словами, — так мозг интерпретирует то, что мы видим. Приблизительно этому мы хотим научить машину. Чтобы описать изображение текстом, необходимо провести такие операции, как распознавание объектов и лиц, определение пола и возраста человека, выделение однородных по цвету областей, распознавание действия, выделение текстуры.

Связь с другими дисциплинами


В рамках курса мы будем говорить и об алгоритмах обработки изображений. Именно они используются, когда мы повышаем контрастность, удаляем цвет или шум, применяем фильтры и т.д… В принципе изменение картинок — это все, что делается в обработке изображений.

Далее идут анализ изображений и компьютерное зрение. Точных определений для них нет, но, на мой взгляд, для них характерно то, что имея на входе изображение, на выходе мы получаем некую модель или некоторый набор признаков. То есть некоторые числовые параметры, которые описывают это изображение. Например, гистограмма распределения уровней серого цвета.

В анализе изображений как результат мы получаем вектор признаков. Компьютерное зрение решает более широкие задачи. В частности строятся модели. К примеру, по набору двухмерных изображений можно построить трехмерную модель помещений. И есть еще одна смежная область — компьютерная графика, в которой генерируют изображение по модели.

Все это невозможно без использования знаний и алгоритмов из еще целого ряда областей. Таких, как распознавание образов и машинное обучение. В принципе можно сказать, что анализ изображений — это частный случай анализа данных, область искусственного интеллекта. К смежной дисциплине можно отнести и нейропсихологию — для того чтобы понять, какие у нас есть возможности и как устроено восприятие картинок, хорошо бы понимать, как эти задачи решает наш мозг.

Для чего нужен анализ изображений


Существуют огромные архивы и коллекции изображений, и одной из самых главных задач является индексирование и поиск картинок. Коллекции бывают разные:
  • Персональные. Например, в отпуске человек может сделать пару тысяч фотографий, с которыми потом нужно что-то делать.
  • Профессиональные. Они насчитывают миллионы фотографий. Здесь тоже есть необходимость как-то их организовывать, искать, находить то, что требуется.
  • Коллекции репродукций. Это тоже миллионы изображений. Сейчас у большого количества музеев есть виртуальные версии, для которых оцифровываются репродукции, т.е. мы получаем изображения картин. Пока утопичная задача — поиск всех репродукций одного и того же автора. Человек по стилю может предположить, что видит, допустим, картины Сальвадора Дали. Было бы здорово, если бы этому научилась и машина.

Что можно делать со всеми этими картинками? Самое простое — можно как-то по-умному построить навигацию по ним, классифицируя их по темам. Отдельно складывать мишек, отдельно слонов, отдельно апельсины — так, чтобы пользователю потом было удобно навигировать по этой коллекции.

Отдельная задача — это поиск дубликатов. В двух тысячах фотографий из отпуска неповторяющихся не так уж и много. Мы любим экспериментировать, снимать с разной выдержкой, фокусным расстоянием и т.д., что в итоге нам дает большое количество нечетких дубликатов. Кроме того, поиск по дубликатам может помочь обнаружить незаконное использование вашей фотографии, которую вы однажды могли выложить в интернете.

Отличная задача — выбор лучшей фотографии. С помощью алгоритма можно понять, какая картинка больше всего понравится пользователю. Например, если это портрет, лицо должно быть освещено, глаза открыты, изображение должно быть четким и т.д. В современных фотоаппаратах уже есть такая функция.

Тоже задача поиска — создание коллажей, т.е. подбор фотографий, которые будут хорошо смотреться рядом.

Применение алгоритмов анализа изображений


Сейчас совершенно потрясающие вещи происходят в медицине.
  • Выявление аномалий. Уже широко известная и решаемая проблема. К примеру, по рентгеновскому снимку пытаются понять, здоров пациент или нет — отличается ли этот снимок от снимка здорового человека. Это может быть как снимок всего тела, так и отдельно кровеносной системы, чтобы выделить из нее аномальные сосуды. В рамках этой задачи — поиск раковых клеток.
  • Диагностика заболеваний. Также делается на основе снимков. Если у вас есть база снимков пациентов и известно, что первая аномалия встречается у здоровых людей, а вторая означает, что человек болен раком, то, основываясь на подобии изображений, можно помочь врачам с диагностикой заболеваний.
  • Моделирование организма и предсказание последствий лечения. Сейчас это то, что называется, cutting edge. Хотя мы все и похожи, каждый организм устроен индивидуально. Наример, у нас может быть разное расположение или толщина кровеносных сосудов. Если человеку требуется соединить разорванный сосуд шунтом, то определить, где его ставить, можно, основываясь на экспертном мнении врача, а можно — смоделировав по снимку кровеносную систему и «вставив» шунт в этой модели. Так мы получим возможность увидеть, как изменится кровоток, и предсказать, как пациент будет себя чувствовать при разных вариантах.

Еще одна область применения – это системы безопасности. Кроме использования отпечатков пальцев и сетчатки глаза для авторизации, здесь есть и не решенные пока задачи. Например, **обнаружение «подозрительных» предметов**. Её сложность в том, что вы не можете заранее дать описание того, что является подозрительным предметом. Другая интересная задача — **выявление подозрительного поведения** человека в системах видеонаблюдения. Невозможно предоставить все возможные примеры аномального поведения, поэтому распознавание будет устроено на выявлении отклонений от того, что помечено как нормальное.

Есть еще большое количество областей, где используется анализ изображений: военная промышленность, робототехника, кинопроизводство, создание компьютерных игр, автомобилестроение. В 2010 году одна итальянская компания оснастила камерами грузовик, который, используя карты и сигнал GPS, на автоматическом управлении проехал от Италии до Шанхая. Путь проходил и через Сибирь, не все дороги которой есть на картах. На этом отрезке карту ему передавал управляемый человеком автомобиль, который ехал перед ним. Грузовик же сам распознавал дорожные знаки, пешеходов и понимал, как ему можно перестраиваться.

Сложности


Но почему мы до сих пор водим автомобили самостоятельно, и даже к системам видеонаблюдения должен быть приставлен человек? Одна из ключевых проблем — семантический разрыв.

Человек, глядя на картинку, понимает её семантику. Компьютер же понимает цвет пикселей, умеет выделить текстуру и в конечном счете отличить кирпичную стену от ковра и распознать на фотографии человека, но определить, счастлив ли он, машина ещё может. Мы сами не всегда можем это понять. То есть автоматическое понимание того, скучают ли студенты на лекции, — это следующий уровень.

Кроме того, наш мозг — это уникальная система понимания и обработки той картинки, которую мы видим. Он склонен видеть то, что мы хотим видеть, а как научить такому же компьютер — открытый вопрос.

Мы очень хорошо умеем обобщать. По изображению мы способны догадаться, что видим лампу. Нам не нужно знать все модификации предмета из одного класса, чтобы отнести к нему образец. Компьютеру это сделать сложнее, потому что визуально разные лампы могут сильно отличаться.

Есть еще ряд сложностей, с которыми анализ изображений еще не справился.

Зрительное восприятие человека


Наш мозг часто «достраивает» картинку и добавляет семантику. Мы все можем увидеть «что-то» или «кого-то» в очертании облака. Зрительная система самообучается. Европейцу сложно различать лица азиатов, так как обычно в жизни он редко их встречает. Зрительная система научилась улавливать различия в европейских лицах, а азиаты, которых он видел мало, кажутся ему «на одно лицо». И наоборот. Был случай с коллегами из Пало-Альто, которые совместно с китайцами разрабатывали алгоритм обнаружения лиц. В итоге он чудесно находил азиатов, но не мог увидеть европейцев.

В каждой картинке мы в первую очередь ищем знакомые образы. Например, мы здесь видим квадраты и круги.

Глаз способен воспринимать очень большие диапазоны яркости, но делает это хитрым образом. Зрительная система адаптируется к диапазону значений яркости порядка 10^10. Но в каждый конкретный момент мы можем распознать небольшой участок яркости. То есть наш глаз выбирает себе какую-то точку, адаптируется к значению яркости в ней и распознает только небольшой диапазон вокруг этой точки. Все то, что темнее, кажется черным, все то, что светлее — белым. Но глаз очень быстро перемещается и мозг достраивает картинку, поэтому мы видим хорошо.

Субъективная яркость – логарифм от физической яркости. Если мы посмотрим на изменение яркости какого-либо источника и станем изменять яркость линейно, наш глаз будет воспринимать ее как логарифм.

За зрительное восприятие отвечают два типа компонентов — колбочки и палочки. Колбочки отвечают за цветовое восприятие и могут очень четко воспринять картинку, но в том случае, если не очень темно. Это называется фотопическим зрением. В темноте работает скотопическое зрение — включаются палочки, которых меньше колбочек и которые не воспринимают цвет, поэтому картинка получается размытой.

Анализ изображений | Altamisoft.ru

Анализ изображений и фотографий заключается не только в определении качества полученных снимков, но и в оценке их информативности. Для того чтобы определить, как хорошо выполнено цифровое изображение, нужно проанализировать, например, его гистограмму распределения пикселей по яркости и цветовым компонентам, а также выделить и исследовать нужную на снимке информацию. Последнее действие может быть связано с нахождением объектов на изображении и определением их характеристик, как цвет, размер и т. д. Исследование качества изображения включает в себя оценку резкости фотографии, цветового баланса, попиксельный анализ и многое другое.

Часто обработка и анализ изображений проводятся совместно. В тех случаях, когда нужно выделить интересующие области или объекты на снимке, перед тем, как выполнить количественный анализ и провести измерения, требуется найти границы объектов интереса на изображении и приглушить лишние детали. Редактирование изображений нужно и для того, чтобы проводить визуальный анализ: например, предварительная обработка рентгеновского изображения значительно упрощает его исследование.

Методы анализа изображений

В связи с тем, что анализ и обработка изображений тесно связаны, алгоритмы анализа изображений ассоциируются с методами их обработки.

Например, так как сведения о границах объектов несравнимо ценны при анализе изображений, для повышения информативности снимка и его дальнейшего исследования можно воспользоваться одной из пороговых, морфологических и других функций для определения контуров. Бинаризация (или преобразование полутонового, имеющего много градаций яркости, изображения в черно-белое) оставляет лишь детали изображения и их границы и удаляет фон, дилатация объединяет однородные области, размыкание удаляет шумы, градиент определяет контуры и т. д.

Для настройки цвета и резкости цифровых изображений можно воспользоваться гистограммой яркости и контраста, операцией гамма-коррекции и многими другими.

 

 

Программа для анализа изображений

Для ввода цифровых изображений с видео-, веб- или фотокамеры в компьютер и их последующего исследования нужна система анализа изображений: кроме управления устройством захвата, она также предоставляет возможности для анализа и обработки изображений.

Программа Altami Studio разработана специально для управления системой ввода информации и ее настройками, а также для проведения исследования и обработки изображений. К примеру, в программе реализован очень удобный инструмент для попиксельного анализа изображений — Лупа (приближает выбранную область и определяет значения яркостей пикселей в заданном радиусе, а также показывает их составляющую красного, синего, зеленого цветов или оттенков).

В программе Altami Studio присутствует множество фильтров для различных преобразований изображений: пороговые (адаптивный порог, нахождение границ, преобразование Собеля и др.), морфологические (дилатация, эрозия, размыкание, градиент и т. д.), для работы с цветом и формой изображения (гамма, негатив, сглаживание), а также компенсация дисторсии и многие другие. Для быстрого выделения контуров можно воспользоваться операцией Автоматический поиск объектов. По результатам, найденным при использовании данного преобразования, можно получить статистику измерений, включающую характеристики объектов (площадь, периметр).

Для измерений объектов в данном приложении существуют и такие инструменты, как отрезок, овал, круг, прямоугольник, многоугольник, с помощью которых можно выделить объект интереса и найти его параметры (длина, площадь, периметр) и также получить статистику проведенных измерений.


Читать другие материалы по теме:

Цитологические методы исследования
Видеокамеры на USB 3.0
Микроскоп сравнения
Вам не подходят существующие решения?
Контроль качества зерна
Захват изображения
Компенсация дисторсии изображения
Цифровая обработка изображений
Техническое (машинное) зрение
Обработка изображения в реальном времени
Анализ изображений и видео. Классификация изображений и распознавание объектов
Сегодня мы публикуем седьмую лекцию из курса «Анализ изображений и видео», прочитанного Натальей Васильевой в петербургском Computer Science Center, который создан по совместной инициативе Школы анализа данных Яндекса, JetBrains и CS-клуба.

Всего в программе девять лекций, из которых уже были опубликованы:

  1. Введение в курс «Анализ изображений и видео»;
  2. Основы пространственной и частотной обработки изображений;
  3. Морфологическая обработка изображений;
  4. Построение признаков и сравнение изображений: глобальные признаки;
  5. Построение признаков и сравнение изображений: локальные признаки;
  6. Поиск по подобию. Поиск нечетких дубликатов.

Под катом вы найдете план новой лекции и слайды.

Зачем сравнивать изображения:

  • Что считать похожими объектами.
  • Что есть распознанный объект.

Насколько сложна задача выделения объекта:
  • Сложности: разные ракурсы/позы объекта.
  • Сложности: разный масштаб.
  • Сложности: изменение освещения.
  • Сложности: фон.
  • Cложности: перекрытия.
  • Сложности: деформируемые объект.
  • Сложности: внутривидовые различия.

Как выделить общие свойства объектов из одной категории:
  • Общая схема решения.
  • Какие признаки использовать.
  • Как обучить классификатор.
  • Различные варианты разметки обучающего множества.
  • Модели: Generative vs. Discriminative.
  • Discriminative methods.

Классификация для разных подзадач и типов объектов:
  • Определение категории объекта.
  • Определение категории: пример.
  • Выделение объекта.
  • Использование классификатора.
  • Использование скользящего окна.
  • Добавим информацию о пространственном расположении в модель «мешка слов».
  • Можно использовать пирамиду.
  • Jittering.

Детектор Violo-Jones:
Исследование методов сегментации изображений / Хабр

В статье описано исследование методов сегментации изображений на различных примерах. Целью исследования является обнаружение достоинств и недостатков некоторых известных методов.

Методы, которые будут рассмотрены в данной статье:


  1. Метод выращивания регионов Тут можно почитать про метод выращивания регионов;
  2. Метод водораздела А тут подробно про метод водораздела, еще и с кодом;
  3. Метод нормальных разрезов Подробнее почитать можно тут.

Исследование методов сегментации на модельных изображениях

Исследование методов сегментации первоначально проводилось моделях изображений. В качестве моделей использовались девять видов изображений.


Название метода Результаты
Метод выращивания регионов
Метод водораздела
Метод нормальных разрезов

Результаты исследования показали:


  • Метод выращивания регионов локализует дефекты текстуры как резко отличающиеся от фона, так и образованные поворотом и изменением яркости текстуры;
  • Метод выращивания регионов в различной степени локализует дефекты при разных углах поворота текстуры;
  • Рассмотренный метод сегментации водораздела в исходном виде не обеспечивает локализацию текстурных дефектов;
  • Метод нормальных разрезов хорошо локализует наличие текстуры отличной от фона, но не выделяет изменение яркости и поворот текстуры.

Исследование методов сегментации на изображениях объекта

Для исследования методов сегментации было подготовлена база изображений различных объектов. Полученные изображения прошли сегментацию с помощью различных методов, результат которой представлен на рисунках в таблице


Результаты:


  • Метод выращивания регионов не обеспечивает локализацию сегментов на изображениях объекта;
  • Рассмотренные методы водораздела и нормальных разрезов в исходном виде не обеспечивают локализацию представленных объектов;
  • Метод нормальных разрезов обеспечивает локализацию объектов на изображениях объектов.

Результаты

Результаты проведенного исследования:


  • Метод выращивания регионов не обеспечивает локализацию сегментов как на модельных изображениях, так и на изображениях объекта, а также обеспечивает локализацию элементов дорожно-транспортной инфраструктуры.
  • Рассмотренные методы водораздела и нормальных разрезов в исходном виде не полностью обеспечивают локализацию представленных объектов.
  • Метод нормальных разрезов обеспечивает локализацию объектов как на модельных изображениях, так и на изображениях объектов, а также обеспечивает локализацию элементов дорожно-транспортной инфраструктуры.
  • Метод выращивания регионов и метод нормальных разрезов могут быть рекомендованы для использования в автоматизированных системах визуального контроля.

Пару слов о распознавании образов / Хабр

Давно хотел написать общую статью, содержащую в себе самые основы Image Recognition, некий гайд по базовым методам, рассказывающий, когда их применять, какие задачи они решают, что возможно сделать вечером на коленке, а о чём лучше и не думать, не имея команды человек в 20.

Какие-то статьи по Optical Recognition я пишу давненько, так что пару раз в месяц мне пишут различные люди с вопросами по этой тематике. Иногда создаётся ощущение, что живёшь с ними в разных мирах. С одной стороны понимаешь, что человек скорее всего профессионал в смежной теме, но в методах оптического распознавания знает очень мало. И самое обидное, что он пытается применить метод из близрасположенной области знаний, который логичен, но в Image Recognition полностью не работает, но не понимает этого и сильно обижается, если ему начать рассказывать что-нибудь с самых основ. А учитывая, что рассказывать с основ — много времени, которого часто нет, становится всё ещё печальнее.

Эта статья задумана для того, чтобы человек, который никогда не занимался методами распознавания изображений, смог в течении 10-15 минут создать у себя в голове некую базовую картину мира, соответствующую тематике, и понять в какую сторону ему копать. Многие методы, которые тут описаны, применимы к радиолокации и аудио-обработке.
Начну с пары принципов, которые мы всегда начинаем рассказывать потенциальному заказчику, или человеку, который хочет начать заниматься Optical Recognition:
  • При решении задачи всегда идти от простейшего. Гораздо проще повесить на персону метку оранжевого цвета, чем следить за человеком, выделяя его каскадами. Гораздо проще взять камеру с большим разрешением, чем разрабатывать сверхразрешающий алгоритм.
  • Строгая постановка задачи в методах оптического распознавания на порядки важнее, чем в задачах системного программирования: одно лишнее слово в ТЗ может добавить 50% работы.
  • В задачах распознавания нет универсальных решений. Нельзя сделать алгоритм, который будет просто «распознавать любую надпись». Табличка на улице и лист текста — это принципиально разные объекты. Наверное, можно сделать общий алгоритм(вот хороший пример от гугла), но это будет требовать огромного труда большой команды и состоять из десятков различных подпрограмм.
  • OpenCV — это библия, в которой есть множество методов, и с помощью которой можно решить 50% от объёма почти любой задачи, но OpenCV — это лишь малая часть того, что в реальности можно сделать. В одном исследовании в выводах было написано: «Задача не решается методами OpenCV, следовательно, она неразрешима». Старайтесь избегать такого, не лениться и трезво оценивать текущую задачу каждый раз с нуля, не используя OpenCV-шаблоны.

Очень сложно давать какой-то универсальный совет, или рассказать как создать какую-то структуру, вокруг которой можно строить решение произвольных задач компьютерного зрения. Цель этой статьи в структуризации того, что можно использовать. Я попробую разбить существующие методы на три группы. Первая группа это предварительная фильтрация и подготовка изображения. Вторая группа это логическая обработка результатов фильтрации. Третья группа это алгоритмы принятия решений на основе логической обработки. Границы между группами очень условные. Для решения задачи далеко не всегда нужно применять методы из всех групп, бывает достаточно двух, а иногда даже одного.

Список приведённых тут методов не полон. Предлагаю в комментариях добавлять критические методы, которые я не написал и приписывать каждому по 2-3 сопроводительных слова.

Часть 1. Фильтрация

В эту группу я поместил методы, которые позволяют выделить на изображениях интересующие области, без их анализа. Большая часть этих методов применяет какое-то единое преобразование ко всем точкам изображения. На уровне фильтрации анализ изображения не производится, но точки, которые проходят фильтрацию, можно рассматривать как области с особыми характеристиками.
Бинаризация по порогу, выбор области гистограммы

Самое просто преобразование — это бинаризация изображения по порогу. Для RGB изображения и изображения в градациях серого порогом является значение цвета. Встречаются идеальные задачи, в которых такого преобразования достаточно. Предположим, нужно автоматически выделить предметы на белом листе бумаги:


Выбор порога, по которому происходит бинаризация, во многом определяет процесс самой бинаризации. В данном случае, изображение было бинаризовано по среднему цвету. Обычно бинаризация осуществляется с помощью алгоритма, который адаптивно выбирает порог. Таким алгоритмом может быть выбор матожидания или моды. А можно выбрать наибольший пик гистограммы.

Бинаризация может дать очень интересные результаты при работе с гистограммами, в том числе в ситуации, если мы рассматриваем изображение не в RGB, а в HSV . Например, сегментировать интересующие цвета. На этом принципе можно построить как детектор метки так и детектор кожи человека.
Классическая фильтрация: Фурье, ФНЧ, ФВЧ

Классические методы фильтрации из радиолокации и обработки сигналов можно с успехом применять во множестве задач Pattern Recognition. Традиционным методом в радиолокации, который почти не используется в изображениях в чистом виде, является преобразование Фурье (конкретнее — БПФ ). Одно из немногих исключение, при которых используется одномерное преобразование Фурье, — компрессия изображений. Для анализа изображений одномерного преобразования обычно не хватает, нужно использовать куда более ресурсоёмкое двумерное преобразование.

Мало кто его в действительности рассчитывает, обычно, куда быстрее и проще использовать свёртку интересующей области с уже готовым фильтром, заточенным на высокие (ФВЧ) или низкие(ФНЧ) частоты. Такой метод, конечно, не позволяет сделать анализ спектра, но в конкретной задаче видеообработки обычно нужен не анализ, а результат.


Самые простые примеры фильтров, реализующих подчёркивание низких частот (фильтр Гаусса) и высоких частот (Фильтр Габора).
Для каждой точки изображения выбирается окно и перемножается с фильтром того же размера. Результатом такой свёртки является новое значение точки. При реализации ФНЧ и ФВЧ получаются изображения такого типа:


Вейвлеты

Но что если использовать для свёртки с сигналом некую произвольную характеристическую функцию? Тогда это будет называться «Вейвлет-преобразование». Это определение вейвлетов не является корректным, но традиционно сложилось, что во многих командах вейвлет-анализом называется поиск произвольного паттерна на изображении при помощи свёртки с моделью этого паттерна. Существует набор классических функций, используемых в вейвлет-анализе. К ним относятся вейвлет Хаара, вейвлет Морле, вейвлет мексиканская шляпа, и.т.д. Примитивы Хаара, про которые было несколько моих прошлых статей (1, 2), относятся к таким функциям для двумерного пространства.


Выше приведено 4 примера классических вейвлетов. 3х-мерный вейвлет Хаара, 2х-мерные вейвлет Мейера, вейвлет Мексиканская Шляпа, вейвлет Добеши. Хорошим примером использования расширеной трактовки вейвлетов является задачка поиска блика в глазу, для которой вейвлетом является сам блик:

Классические вейвлеты обычно используются для сжатия изображений, или для их классификации (будет описано ниже).
Корреляция

После такой вольной трактовки вейвлетов с моей стороны стоит упомянуть собственно корреляцию, лежащую в их основе. При фильтрации изображений это незаменимый инструмент. Классическое применение — корреляция видеопотока для нахождения сдвигов или оптических потоков. Простейший детектор сдвига — тоже в каком-то смысле разностный коррелятор. Там где изображения не коррелируют — было движение.

Фильтрации функций

Интересным классом фильтров является фильтрация функций. Это чисто математические фильтры, которые позволяют обнаружить простую математическую функцию на изображении (прямую, параболу, круг). Строится аккумулирующее изображение, в котором для каждой точки исходного изображения отрисовывается множество функций, её порождающих. Наиболее классическим преобразованием является преобразование Хафа для прямых. В этом преобразовании для каждой точки (x;y) отрисовывается множество точек (a;b) прямой y=ax+b, для которых верно равенство. Получаются красивые картинки:

(первый плюсег тому, кто первый найдёт подвох в картинке и таком определении и объяснит его, второй плюсег тому, кто первый скажет что тут изображено)
Преобразование Хафа позволяет находить любые параметризуемые функции. Например окружности. Есть модифицированное преобразование, которое позволяет искать любые фигуры. Это преобразование ужасно любят математики. Но вот при обработке изображений, оно, к сожалению, работает далеко не всегда. Очень медленная скорость работы, очень высокая чувствительность к качеству бинаризации. Даже в идеальных ситуациях я предпочитал обходиться другими методами.
Аналогом преобразования Хафа для прямых является преобразование Радона . Оно вычисляется через БПФ, что даёт выигрыш производительности в ситуации, когда точек очень много. К тому же его возможно применять к не бинаризованному изображению.
Фильтрации контуров

Отдельный класс фильтров — фильтрация границ и контуров . Контуры очень полезны, когда мы хотим перейти от работы с изображением к работе с объектами на этом изображении. Когда объект достаточно сложный, но хорошо выделяемый, то зачастую единственным способом работы с ним является выделение его контуров. Существует целый ряд алгоритмов, решающих задачу фильтрации контуров:

Чаще всего используется именно Кэнни, который хорошо работает и реализация которого есть в OpenCV (Собель там тоже есть, но он хуже ищёт контуры).

Прочие фильтры

Сверху приведены фильтры, модификации которых помогают решить 80-90% задач. Но кроме них есть более редкие фильтры, используемые в локальных задачах. Таких фильтров десятки, я не буду приводить их все. Интересными являются итерационные фильтры (например активная модель внешнего вида), а так же риджлет и курвлет преобразования, являющиеся сплавом классической вейвлет фильтрации и анализом в поле радон-преобразования. Бимлет-преобразование красиво работает на границе вейвлет преобразования и логического анализа, позволяя выделить контуры:

Но эти преобразования весьма специфичны и заточены под редкие задачи.
Часть 2. Логическая обработка результатов фильтрации

Фильтрация даёт набор пригодных для обработки данных. Но зачастую нельзя просто взять и использовать эти данные без их обработки. В этом разделе будет несколько классических методов, позволяющих перейти от изображения к свойствам объектов, или к самим объектам.
Морфология

Переходом от фильтрации к логике, на мой взгляд, являются методы математической морфологии (1, 2 , 3). По сути, это простейшие операции наращивания и эрозии бинарных изображений. Эти методы позволяют убрать шумы из бинарного изображения, увеличив или уменьшив имеющиеся элементы. На базе математической морфологии существуют алгоритмы оконтуривания, но обычно пользуются какими-то гибридными алгоритмами или алгоритмами в связке.
Контурный анализ

В разделе по фильтрации уже упоминались алгоритмы получения границ. Полученные границы достаточно просто преобразуются в контуры. Для алгоритма Кэнни это происходит автоматически, для остальных алгоритмов требуется дополнительная бинаризация. Получить контур для бинарного алгоритма можно например алгоритмом жука.
Контур является уникальной характеристикой объекта. Часто это позволяет идентифицировать объект по контуру. Существует мощный математический аппарат, позволяющий это сделать. Аппарат называется контурным анализом (1, 2 ).

Если честно, то у меня ни разу ни получилось применить контурный анализ в реальных задачах. Уж слишком идеальные условия требуются. То граница не найдётся, то шумов слишком много. Но, если нужно что-то распознавать в идеальных условиях — то контурный анализ замечательный вариант. Очень быстро работает, красивая математика и понятная логика.
Особые точки

Особые точки это уникальные характеристики объекта, которые позволяют сопоставлять объект сам с собой или с похожими классами объектов. Существует несколько десятков способов позволяющих выделить такие точки. Некоторые способы выделяют особые точки в соседних кадрах, некоторые через большой промежуток времени и при смене освещения, некоторые позволяют найти особые точки, которые остаются таковыми даже при поворотах объекта. Начнём с методов, позволяющих найти особые точки, которые не такие стабильные, зато быстро рассчитываются, а потом пойдём по возрастанию сложности:
Первый класс. Особые точки, являющиеся стабильными на протяжении секунд. Такие точки служат для того, чтобы вести объект между соседними кадрами видео, или для сведения изображения с соседних камер. К таким точкам можно отнести локальные максимумы изображения, углы на изображении (лучший из детекторов, пожалуй, детектор Хариса), точки в которых достигается максимумы дисперсии, определённые градиенты и.т.д.
Второй класс. Особые точки, являющиеся стабильными при смене освещения и небольших движениях объекта. Такие точки служат в первую очередь для обучения и последующей классификации типов объектов. Например, классификатор пешехода или классификатор лица — это продукт системы, построенной именно на таких точках. Некоторые из ранее упомянутых вейвлетов могут являются базой для таких точек. Например, примитивы Хаара, поиск бликов, поиск прочих специфических функций. К таким точкам относятся точки, найденные методом гистограмм направленных градиентов (HOG).
Третий класс. Стабильные точки. Мне известно лишь про два метода, которые дают полную стабильность и про их модификации. Это SURF и SIFT. Они позволяют находить особые точки даже при повороте изображения. Расчёт таких точек осуществляется дольше по сравнению с остальными методами, но достаточно ограниченное время. К сожалению эти методы запатентованы. Хотя, в России патентовать алгоритмы низя, так что для внутреннего рынка пользуйтесь.
Часть 3. Обучение

ретья часть рассказа будет посвящена методам, которые не работают непосредственно с изображением, но которые позволяют принимать решения. В основном это различные методы машинного обучения и принятия решений. Недавно Яндыкс выложил на Хабр курс по этой тематике, там очень хорошая подборка. Вот тут оно есть в текстовой версии. Для серьёзного занятия тематикой настоятельно рекомендую посмотреть именно их. Тут я попробую обозначить несколько основных методов используемых именно в распознавании образов.
В 80% ситуаций суть обучения в задаче распознавания в следующем:
Имеется тестовая выборка, на которой есть несколько классов объектов. Пусть это будет наличие/отсутствие человека на фотографии. Для каждого изображения есть набор признаков, которые были выделены каким-нибудь признаком, будь то Хаар, HOG, SURF или какой-нибудь вейвлет. Алгоритм обучения должен построить такую модель, по которой он сумеет проанализировать новое изображение и принять решение, какой из объектов имеется на изображении.
Как это делается? Каждое из тестовых изображений — это точка в пространстве признаков. Её координаты это вес каждого из признаков на изображении. Пусть нашими признаками будут: «Наличие глаз», «Наличие носа», «Наличие двух рук», «Наличие ушей», и.т.д… Все эти признаки мы выделим существующими у нас детекторами, которые обучены на части тела, похожие на людские. Для человека в таком пространстве будет корректной точка [1;1;1;1;..]. Для обезьяны точка [1;0;1;0…] для лошади [1;0;0;0…]. Классификатор обучается по выборке примеров. Но не на всех фотографиях выделились руки, на других нет глаз, а на третьей у обезьяны из-за ошибки классификатора появился человеческий нос. Обучаемый классификатор человека автоматически разбивает пространство признаков таким образом, чтобы сказать: если первый признак лежит в диапазоне 0.5
По существу цель классификатора — отрисовать в пространстве признаков области, характеристические для объектов классификации. Вот так будет выглядеть последовательное приближение к ответу для одного из классификаторов (AdaBoost) в двумерном пространстве:


Существует очень много классификаторов. Каждый из них лучше работает в какой-то своей задачке. Задача подбора классификатора к конкретной задаче это во многом искусство. Вот тут немножко красивых картинок на тему.
Простой случай, одномерное разделение

Разберём на примере самый простой случай классификации, когда пространство признака одномерное, а нам нужно разделить 2 класса. Ситуация встречается чаще, чем может представиться: например, когда нужно отличить два сигнала, или сравнить паттерн с образцом. Пусть у нас есть обучающая выборка. При этом получается изображение, где по оси X будет мера похожести, а по оси Y -количество событий с такой мерой. Когда искомый объект похож на себя — получается левая гауссиана. Когда не похож — правая. Значение X=0.4 разделяет выборки так, что ошибочное решение минимизирует вероятность принятия любого неправильного решения. Именно поиском такого разделителя и является задача классификации.

Маленькая ремарка. Далеко не всегда оптимальным будет тот критерий, который минимизирует ошибку. Следующий график — это график реальной системы распознавания по радужной оболочке. Для такой системы критерий выбирается такой, чтобы минимизировать вероятность ложного пропуска постороннего человека на объект. Такая вероятность называется «ошибка первого рода», «вероятность ложной тревоги», «ложное срабатывание». В англоязычной литературе «False Access Rate ».
Что делать если измерений больше двух?

Алгоритмов много. Даже очень много. Если хотите подробно узнать про каждый из них читайте курс Воронцова, ссылка на который дана выше, и смотрите лекции Яндыкса. Сказать, какой из алгоритмов лучше для какой задачи часто заранее невозможно. Тут я попробую выделить основные, которые в 90% помогут новичку с первой задачей и реализацию которых на вашем языке программирования вы достоверно найдёте в интернете.
k-means (1, 2, 3 ) — один из самых простых алгоритмов обучения. Конечно, он в основном для кластеризации, но и обучить через него тоже можно. Работает в ситуации, когда группы объектов имеют неплохо разнесённый центр масс и не имеют большого пересечения.
AdaBoost (1, 2, 3) АдаБуста — один из самых распространённых классификаторов. Например каскад Хаара построен именно на нём. Обычно используют когда нужна бинарная классификация, но ничего не мешает обучить на большее количество классов.
SVM (1, 2, 3, 4 ) Один из самых мощных классификаторов, имеющий множество реализаций. В принципе, на задачах обучения, с которыми я сталкивался, он работал аналогично адабусте. Считается достаточно быстрым, но его обучение сложнее, чем у Адабусты и требуется выбор правильного ядра.

Ещё есть нейронные сети и регрессия. Но чтобы кратко их классифицировать и показать, чем они отличаются, нужна статья куда больше, чем эта.
________________________________________________
Надеюсь, у меня получилось сделать беглый обзор используемых методов без погружения в математику и описание. Может, кому-то это поможет. Хотя, конечно, статья неполна и нет ни слова ни о работе со стереоизображениями, ни о МНК с фильтром Калмана, ни об адаптивном байесовом подходе.
Если статья понравится, то попробую сделать вторую часть с подборкой примеров того, как решаются существующие задачки ImageRecognition.

И напоследок

Что почитать?
1) Когда-то мне очень понравилась книга «Цифровая обработка изображений» Б. Яне, которая написана просто и понятно, но в то же время приведена почти вся математика. Хороша для того, чтобы ознакомиться с существующими методами.
2) Классикой жанра является Р Гонсалес, Р. Вудс » Цифровая обработка изображений «. Почему-то она мне далась сложнее, чем первая. Сильно меньше математики, зато больше методов и картинок.
3) «Обработка и анализ изображений в задачах машинного зрения» — написана на базе курса, читаемого на одной из кафедр ФизТеха. Очень много методов и их подробного описания. Но на мой взгляд в книге есть два больших минуса: книга сильно ориентирована на пакет софта, который к ней прилагается, в книге слишком часто описание простого метода превращается в математические дебри, из которых сложно вынести структурную схему метода. Зато авторы сделали удобный сайт, где представлено почти всё содержание — wiki.technicalvision.ru
4) Почему-то мне кажется, что хорошая книжка, которая структурирует и увязывает картину мира, возникающую при занятии Image Recognition и Machine Learning — это «Об интеллекте» Джеффа Хокинса. Прямых методов там нет, но есть много мыслей на подумать, откуда прямые методы обработки изображений происходят. Когда вчитываешься, понимаешь, что методы работы человеческого мозга ты уже видел, но в задачах обработки видео.
фотоисследований — это … Что такое фотоисследования?
  • Система обмена изображениями — (PECS) — это форма расширенной и альтернативной связи. Обычно он используется в качестве помощи в общении для детей с аутизмом и другими особыми потребностями. Система использовалась для разных возрастов, включая дошкольников, подростков…… Wikipedia

  • Отчет об исследованиях — Отчеты об исследованиях — это бизнес-отчеты, составленные фирмами, занимающимися бизнес-исследованиями (и коммерческими и инвестиционными банками), их финансовыми аналитиками.Отчеты предназначены для того, чтобы откопать важные части оперативной и финансовой отчетности компаний… Wikipedia

  • Система связи с обменом изображениями — (PECS) — это форма расширенной и альтернативной связи (AAC). Обычно он используется в качестве помощи в общении для детей с аутизмом и другими особыми потребностями. Система была успешной с различными возрастами, включая дошкольников, … … Википедия

  • картинка — изображение | W1S1 [ʃəpıktʃə US ər] n ▬▬▬▬▬▬▬ 1¦ (живопись / рисунок) ¦ 2¦ (фотография) ¦ 3¦ (телевидение) ¦ 4¦ (описание / идея) ¦ 5¦ (ситуация) ¦ 6¦ (мысленный образ) ¦ 7 положи / оставь кого-нибудь в кадре 8 вытащи картинку 9 из картинки… Словарь современного английского языка

  • картинка — Синонимы и родственные слова: 3 D, пятно ЭЛТ, Cinemascope, Cinerama, DM-дисплей, доплеровский сигнал, ПЧ-сигнал, IM-дисплей, РЧ-эхо, Technicolor, Telephoto, Vorstellung, Western, Wirephoto, аннотация, абстракция, аэрофотоснимок, союзник, алтарь,…… тезаурус Моби

  • исследования и разработки — Введение в промышленность аббревиатуры R и D, или R & D, два тесно связанных процесса, посредством которых новые продукты и новые формы старых продуктов создаются посредством технологических инноваций.Введение и определения… Universalium

  • Система архивации и передачи изображений — Изображение, хранящееся в системе архивации и передачи изображений (PACS) То же изображение после регулировки контрастности,… Wikipedia

  • Язык изображения — В теории формального языка язык изображения — это набор изображений, где изображение представляет собой двумерный массив символов в некотором алфавите. Например, язык L = left {a ^ {n, n} | n> 0 ight} определяет язык квадратов, состоящих из…… Wikipedia

  • Picture Sorts — существительное a) исследовательский инструмент, используемый для деконструкции визуального восприятия телевизионной рекламы аудиторией.Сортировки картинок — это инструменты, наиболее полезные для рекламной команды, потому что они показывают в картинках, а не в словах, что работает и не работает в… Wiktionary

  • Исследовательский консорциум по соседним звездам — Исследовательский консорциум по ближайшим звездам (RECONS) — это проект по исследованию звезд, ближайших к Солнечной системе, в пределах 10 парсек (32,6 световых года). Отчасти проект надеется, что более точный обзор локальных звездных систем даст…… Википедия

  • Исследование насилия в СМИ — Исследование СМИ и насилия исследует, существуют ли связи между потреблением насилия в СМИ и последующим агрессивным и насильственным поведением.Хотя некоторые социологи поддерживают эту ссылку, [1] методологические и теоретические проблемы с… Wikipedia

  • ,Редактор составного изображения

    — Microsoft Research

    Автоматическое завершение изображения

    ICE теперь может добавлять отсутствующие пиксели по краям панорамы, обеспечивая плавные границы для частичных или неполных изображений.

    Image Composite Editor

    Image Composite Editor

    Переработанный пользовательский интерфейс и рабочий процесс

    ICE имеет новый внешний вид, который делает все функции более понятными и простыми в использовании. Приложение проведет вас через шаги, необходимые для создания великолепных панорам. Это позволяет создавать резервные копии или изменять настройки и сразу же просматривать результаты без необходимости начинать все заново.

    Image Composit Editor

    Предварительный просмотр в полном разрешении

    ICE позволяет увеличить масштаб изображения, чтобы увидеть каждую деталь вашей сшитой панорамы, независимо от ее размера, перед экспортом. В отличие от более ранних версий ICE, предварительный просмотр панорамы больше не ограничен вашим разрешением экрана.

    Image Composite Editor

    .

    Отправить ответ

    avatar
      Подписаться  
    Уведомление о