Читать книгу Теория и практика распознавания инженерных сооружений, промышленных предприятий и объектов железнодорожного транспорта при дешифрировании аэроснимков - А. С. Молчанов - Страница 5

1. Основы подготовки операторов-дешифровщиков и пути повышения их квалификации
1.3. Модель зрительного анализатора оператора-дешифровщика и критерии оценки качества аэроснимков

Оглавление

Процесс отражения внешней среды характеризуется определенной детерминированностью, активностью и динамичностью. Как показывают исследования последних лет, этот процесс реализуется у человека на основе сложной системы психического управления и имеет характер активной, познавательной деятельности.

В общем виде детерминированно-эвристическую концепцию моделирования психофизиологических функций человека можно свести к следующим позициям:

а) управление представляет собой процесс формулирования и решения задачи, сформировавшейся в результате сопоставления воспринятой информации с прошлым опытом и в соответствии с потребностями системы;

б) уяснение задачи и оценка ситуации включает планирование и предвосхищение результатов предстоящих действий системы;

в) процесс решения задачи сводится к выбору или построению программ действий;

г) анализаторы обеспечивают полное, синтетическое и предметное отображение внешней среды («афферентный синтез»);

д) в ходе решения задачи идет непрерывный процесс саморегулирования системы за счет реализации обратных связей (обратная афферентация о результатах действия системы).

Психическое управление имеет два основных аспекта: логико-психологический и операциональный. Логико-психологический аспект связан с формулированием (переформулированием) задач управления. Операциональный аспект связан с процедурами преобразования входной информации и перцептивных образов в интересах выдвижения (построения) и проверки гипотез с использованием внутренних эвристических, структурных и вероятностных механизмов.

Причем сенсорные преобразования выполняют кодирование внешнестимульной информации, последовательно переводя описание внешней среды с одного языка на другой, более абстрактный.

Перцептивные операции осуществляют обратное перекодирование абстрактных, символьных данных в конкретные образы. Система перцептивных операций является в общем случае системой управления познавательным действием, использующей сформированный образ (модель).

Проблема реализации психического управления в технических воспринимающих устройствах сводится к формальному построению сенсорно-перцептивной системы, формирующей и использующей для решения сложных задач модель среды, адекватную задачам и среде.

В настоящее время еще нет формальных, т. е. имеющих строгое математическое построение, моделей информационных процессов, которые бы учитывали основные свойства психического отражения (управления). В нейрофизиологии и психофизиологии имеется описание моделирования некоторых сенсорных процессов, памяти, элементарных мыслительных операций в интересах количественного описания психофизиологических функций и явлений. Однако психологические модели не лишены недостатков – они охватывают изолированные процессы и лишены универсальности даже в рамках одной психологической модели, и не всегда их можно рассматривать как программу формального описания психофизиологических функций человека.

К основным внешним и внутренним закономерностям, свойственным содержательным психологическим моделям, в свете рассмотренной выше структурной теории восприятия могут быть отнесены:

а) обусловленность функционирования «внутренних» моделей среды воспринимаемыми структурами и решаемой задачей;

б) активно-избирательный характер отражения внешней среды на основе действия замкнутых систем постоянных и временных связей различной природы и уровня;

в) этажность обработки информации на основе взаимодействия сенсорных, перцептивных и концептуальных моделей разного ранга, обеспечивающих отражение внешних структур любой сложности;

г) использование динамических, иерархических систем описания и внутреннего воссоздания элементов среды;

д) выработка оптимальной стратегии функционирования в процессе отражения;

е) реконструкция моделей при реализации новых познавательных целей в рамках «гностической саморегуляции».

В структурном смысле рассматриваемые модели представляют собой иерархические системы данных с переменным числом уровней разной сложности, на каждом из которых с помощью определенных лингвистических средств отражаются (в той или иной степени абстрактно) внешняя среда и схемы поведения. Рассмотренная система моделей образует весьма гибкий и тонкий аппарат отражения внешней среды, обладающий высокой чувствительностью и разрешающей способностью, измерительными возможностями с автоматической настройкой.

С точки зрения автоматизации процессов первичной обработки дешифровочной информации особое значение имеет анализ особенностей функционирования перцептивных моделей.

Выполненные экспериментальные исследования позволяют конкретизировать закономерности функционирования перцептивных моделей при восприятии дешифровочной информации:

слойно-ступенчатая природа процесса восприятия первичной информации с формированием на выходе «слоев» промежуточных, а на выходе исчисления – «итогового» образа;

использование естественного языка единичных объектов, опирающегося на переменный алфавит оперативных единиц восприятия;

взаимодействие структурных и эвристических механизмов при построении образов и структурных, вероятностных механизмов – при распознавании;

непрерывное взаимодействие в процессе восприятия поисковых, ориентировочно-исследовательских и распознавательно-информационных действий;

сочетание структурного анализа с индикаторным при восприятии и распознавании зашумленных стимулов;

непрерывное регулирование процесса извлечения и обработки информации; развитое перцептивное обучение (самообучение).

С позиции автоматизации процессов вторичной обработки дешифровочной информации большое значение имеет учет особенностей функционирования концептуальных моделей, связанных с использованием системы эвристик: упреждающего планирования процессов; последовательного структурного расчленения воспринимаемой ситуации и установления отношений между ее элементами; избирательного поиска на каждом уровне без полного перебора вариантов; формирования алгоритмов распознавания в ходе решения задачи и т. п.

Анализ закономерностей, свойственных содержательным психологическим моделям, позволяет сформулировать два основных принципа «действия» таких моделей:

а) детерминированность функционирования моделей воспринимаемыми структурами и задачей и как следствие их адаптивность;

б) эвристичность функционирования моделей при решении сложных перцептивно-опознавательных задач, проявляющуюся прежде всего в многоуровневом решении задачи и общей композиционной активности процесса, включая самопрограммирование.

Последнее не исключает вероятностных аспектов перцептивно-распознавательной деятельности. Все эти особенности определяют преимущества человека перед машиной в информационном плане: активность, избирательность, гибкость, огромный арсенал «лингвистических» средств, возможность использования недостаточной и искаженной информации, огромные возможности обучения, т. е. универсальность функционирования.

Для расширения сферы применения автоматических распознающих и других технических средств с «интеллектуальными» функциями в них должны воспроизводиться основные особенности функционирования соответствующих содержательных психологических моделей. Разумеется, преимущества человека должны использоваться с учетом возможностей и преимуществ машины: высокого быстродействия, пропускной способности, точности, постоянной работоспособности при заданном уровне надежности и т. д. Конечно, не все слепо должно заимствоваться у природы, у человека. Большое значение имеет поиск и использование более экономных или вообще более выгодных в каком-то отношении решений по сравнению с биологическими системами. Однако эти решения, как правило, могут касаться лишь частных, узкоспециализированных функций. Для полифункциональных технических систем, а к ним относятся распознающие автоматы, более или менее полное соответствие с функциями человека является весьма желательным. Это будет способствовать резкому повышению надежности и эффективности технических средств.

Итак, в основу моделирования процессов восприятия и распознавания в интересах построения технических устройств широкого назначения должен быть положен «детерминированно-эвристический» подход с реализацией основных принципов функционирования содержательных психологических моделей, «структурной» детерминированности, взаимодействия моделей разного характера и уровня, эвристичности перцептивно-опознавательной деятельности. Детерминированность рассматривается с содержательно-психологических позиций, а эвристичность – в широком смысле слова, не исключая вероятностные аспекты. Из указанных принципов вытекают как следствие все перечисленные преимущества психического управления и восприятия, включая иерархичность, взаимную корреляцию функциональной и лингвистической структур, кольцеобразность (замкнутость) функциональной структуры в целом и ее элементов и т. д.

Возможные пути построения эффективно действующих непримитивных автоматов на принципах психики:

а) анализ характера психофизиологических и психологических моделей, описывающих в естественном языке деятельность человека;

б) формальное описание психофизиологических функций человека при решении соответствующих задач и построение математических моделей (цифровых, аналитических);

в) создание физических моделей из специализированных (например, оптико-электронных) конструкций и экспериментальная проверка их в различных условиях;

г) формирование интегральной системы, содержащей совокупность физических и математических моделей.

Основными задачами построения формальных моделей являются:

обеспечение универсальности функционирования рецепторных устройств, производящих обработку любой входной информации; воспроизведение функциональной структуры психического управления с реализацией соответствующих эвристик и алгоритмов выделения, преобразования и фиксации информации как при построении психологических моделей, так и их функционировании; разработка иерархического языка для адекватного описания объектов среды и отражающих их текущих образов;

разработка принципов построения внутренней модели проблемной ситуации в ходе ее решения на перцептивно-опознавательном уровне. В настоящее время эти задачи являются центральными в области кибернетической психологии.

При построении моделей восприятия и распознавания необходимо учитывать следующие основные требования:

а) модель должна быть непротиворечивой в рамках моделируемых процессов, способной «вписываться» в более общую модель, быть основой для детализации частных моделей;

б) модель должна выполнять определенные информационные функции, нести новые знания о структуре моделируемых процессов, обеспечивать прогнозирование их функционирования;

в) модель должна быть реализуемой на современных технических средствах, обладать практической полезностью и представлять собой новое средство автоматического выполнения всей системы операций, реализуемых в моделируемых ею психофизиологических структурах.

Полная модель, учитывающая все свойства зрительного анализатора, до настоящего времени не разработана, поэтому при составлении и оценке алгоритмов аналого-цифрового преобразования основные особенности зрительного анализатора учитываются раздельно, а не в совокупности. Особенности зрения выявляются при этом с помощью относительно простых тестовых изображений (штрихов, резких перепадов яркости и т. п.). Полученные результаты затем распространяются на изображения с более сложной структурой.

Сетчатка, которая содержит сложную сеть нейронов, связывающих перекрестно фоторецепторы и соединяющихся с ганглиозными клетками, аксоны которых образуют зрительный нерв, а также связывающих друг с другом ганглиозные клетки, осуществляет преобразование оптического изображения в нейронное, представляющее собой распределение интенсивности возбуждения нейронов, образующих сетчатку. Это преобразование является нелинейным и определяется химическими процессами в фоторецепторах и в системе взаимосвязанных клеток сетчатки, расположенных сразу после фоторецепторов. Изменения, происходящие при этом с изображением, моделируются путем его поэлементного преобразования нелинейной функцией, обычно логарифмической или степенной, с показателем степени 1/3. Использование логарифмической функции удобнее с методической точки зрения, т. к. она согласуется с законом Вебера-Фехнера, который сам является приближенным, применение же степенной функции позволяет получить несколько более точные результаты.

Существует три типа колбочек, входящих в сетчатку, называемых «красные», «синие», «зеленые», которые различаются по чувствительности к различным участкам длины волн λ светового излучения. На рисунке 1.1 приведены кривые спектральных чувствительностей трех типов колбочек, выраженных в процентах, поглощенных зрительными пигментами квантов.

При построении функциональной модели зрительной системы это обстоятельство учитывается включением в нее трех звеньев, «сигналы» с которых соответственно вычисляются по формулам

ek(x,y) = ƒ L(x,y,λk(λ),

eз(x,y) = ƒ L(x,y,λз(λ), (1.1)

ec(x,y) = ƒ L(x,y,λc(λ),

где L(x,y,λ) – распределение яркости (светового потока) по координатам x,y и длин волн света εk(λ),εз(λ),εc(λ) – спектральные чувствительности «красных», «зеленых» и «синих» колбочек, ek(x,y),eз(x,y),ec(x,y) – сигналы с «красных», «зеленых» и «синих» фоторецепторов (колбочек).


Рисунок 1.1 – Кривые спектральных чувствительностей колбочек


В сетчатке глаза происходит первичная обработка изображения, в результате которой формируется ахроматическая (черно-белая) и цветностные составляющие изображения, причем, последние не зависят от яркости наблюдаемого изображения. Сформированные таким образом составляющие изображения фильтруются сетчаткой. При фильтрации ахроматической (яркостной) составляющей имеет место ослабление нижних пространственных частот (ПЧ) за счет латерального торможения. Степень ослабления определяется условиями наблюдения. Если яркость изображения не меняется во времени, то это ослабление максимально. В случае наблюдения мелькающих изображений ослабление нижних ПЧ оказывается тем меньше, чем выше частота мелькания, а при частотах мелькания f ≥ 6 Гц ослабление вообще отсутствует.

Верхние ПЧ как ахроматической, так и цветностных составляющих изображений ослабляются в процессе фильтрации глазом. Процесс ослабления формализуется экспериментальными графиками передаточных функций, представляемых обычно в виде зависимостей контрастной чувствительности зрительной системы в децибелах от пространственной частоты пространственно-гармонического сигнала.

Таким образом, в процессе описанного преобразования оптического изображения в нейронное уменьшается зависимость зрительного ощущения от освещенности сцены, «срезаются» пространственные частоты, сужается спектр, что приводит к сокращению количества информации, поступающей в зрительный нерв за счет устранения всего несущественного. Это сокращение потока информации можно оценить, если учесть, что число колбочек равно 6,5–7 млн, а число волокон зрительного нерва 0,8–1 млн, т. е. оно составляет 6,5–8,75 раз.

Полная функциональная модель зрительной системы на уровне сетчатки, в которой были бы отражены все известные в настоящее время ее характеристики, хотя и может быть построена, но она оказывается слишком сложной и представляет скорее теоретический интерес. При построении модели, пригодной для практического использования, делается ряд упрощающих допущений. Основными из них являются допущения об инвариантности к сдвигу и повороту, а также допущение относительно непрерывности мозаики сетчатки.

При описании модели ахроматического зрения было сделано предположение, что нелинейная реакция глаза на изменение интенсивности имеет логарифмический характер. Нелинейное преобразование осуществляется после проецирования изображения на сетчатку.

Преобразованию подвергаются сигналы рецепторов (палочек и колбочек) до того, как они вступают во взаимодействие друг с другом. На рисунке 1.2 приведена простейшая логарифмическая модель глаза для одноцветного зрения. Эта модель позволяет удовлетворительно предсказать реакцию зрительной системы в широком диапазоне интенсивностей.


Рисунок 1.2 – Логарифмическая модель одноцветного зрения


Однако на высоких и очень низких ПЧ или очень высоких интенсивностях наблюдаемая реакция отличается от предсказанной на основе модели, изображенной на рисунке 2. Для того чтобы получить более точную модель, необходимо детально рассмотреть процессы в зрительной системе.

Нелинейная реакция палочек и колбочек на изменение интенсивности все еще служит предметом активных исследований. Были выдвинуты гипотезы о том, что механизм этой нелинейности объясняется химической активностью, электрическими эффектами и нервной обратной связью. Если входной и выходной сигналы обозначить как Iвх(x,y),Iвых(x,y), соответственно, то основная логарифмическая модель предполагает, что:

Iвых(x,y) = K1log[K2 + K3Iвх(x,y)], (1.2)

где K1,K2,K3 – постоянные.

В другой модели предполагается следующая зависимость выходного сигнала от входного:

Iвых(x,y) = [K1Iвх(x,y)]/[K2 + Iвх(x,y)], (1.3)

В настоящее время используется также степенная функция, когда:

Iвых(x,y) = [Iвх(x,y)]s, (1.4)

где S – постоянная величина, обеспечивающая хорошее согласие между вычисленной вероятностью и субъективной оценкой качества изображения. Подбором постоянных коэффициентов, входящих в выражения (1.2) – (1.4), соответствующие кривые могут быть хорошо сближены в диапазоне средних интенсивностей.

На рисунке 1.3 приведена функциональная модель зрительной системы (глаза). В этой модели колбочки трех типов создают сигналы изображения, определяемые соотношениями (1.2).


Рисунок 1.3 – Функциональная модель зрительной системы (глаза)


Далее эти изображения преобразуются тремя фильтрами – оптическими передаточными функциями оптической системы глаза в этих световых диапазонах. Затем они подвергаются логарифмическому преобразованию и комбинируются, образуя цветоразностные Uk-3(x,y),Uk-c(x,y) и ахроматические Ua(x,y) сигналы (изображения) в соответствии с формулами


где α = 0,612, β = 0,396, γ = 0,019, а коэффициенты a,b1,b2 подобраны так, чтобы пороговые различия при восприятии света или цвета представлялись сферой единичного радиуса в пространстве сигналов (изображений) Ua(x,y),Uk-з(x,y),Uk-c(x,y). Ахроматический и цветностные сигналы (изображения) Ua(x,y),Uk-з(x,y),Uk-c(x,y) поступают на вход фильтров с оптическими передаточными функциями (ОПФ) Wн1(ωx,ωy), Wн2(ωx,ωy), Wн3’(ωx,ωy),ωx = 2πNx, ωy = 2πNy, ωм = 2πfм; Nx,Ny – ПЧ, лин/мм, fм – частота мелькания изображения, Гц. После фильтрации изображения через зрительный нерв поступают в высшие отделы зрительной системы.

Изменение яркости изображения без изменения его спектрального состава вызывает изменение компоненты Ua(x,y), в то время как компоненты Uk-з(x,y),Uk-c(x,y)остаются без изменения, что согласуется с опытом.

В соответствии с теорией линейных систем функция передачи модуляции (ФПМ) зрительного анализатора можно получить из ОПФ по следующей формуле:


где T(2πθx,0) = T(2πN)– одномерная ОПФ, вычисляемая по ФРЛ h(x)


Это выражение в грубом приближении есть зависимость контраста от ПЧ. Так как контраст не может быть равным единице, поэтому можно выполнить нормирование на T(0,0).

ФПМ зрительного анализатора учитывает передаточные свойства как оптической системы глаза, так и передаточные свойства, обусловленные нервными процессами в сетчатке, дифракцией на входном зрачке, аберрацией хрусталика, конечных размеров фоточувствительных рецепторов и др. Однако ФПМ зрительного анализатора не учитывает пространственный шум, фоновую освещенность, положение оператора относительно монитора и времени экспонирования. Тем не менее, каждый из этих параметров влияет на качество восприятия изображения, поэтому эмпирические зависимости, характеризующие ФПМ зрительного анализатора, являются лишь аппроксимацией реальной ФПМ. Преобразование сигналов в сетчатке связано с процессом их «усиления» за счет биологической энергии. При этом коэффициент «усиления» принимается kзр = 2.

Эквивалентную модель зрительного анализатора как канала передачи информации можно представить в виде, приведенном на рисунке 1.4, где WОПТ.ЗР(θ) – ФПМ оптической системы глаза, WСЕТ(θ) – эквивалентная ФПМ сетчатки, полученная путем деления WЗР(θ) на WОПТ.ЗР(θ); Gш.зр(θ) – спектральная плотность дисперсии эквивалентного шума зрительного анализатора. Взаимодействие этих двух фильтров и определяет общую ФПМ зрительного анализатора. Энергия шумов зрительной системы распределена неравномерно в диапазоне пространственных частот.


Рисунок 1.4 – Эквивалентная модель зрительного анализатора как канала передачи информации


Зрительный анализатор представлен в виде эквивалентного фильтра низких ПЧ, состоящего из двух звеньев, и источника помех. Сетчатка обладает свойствами эквивалентными фильтру высоких пространственных частот и имеет характеристики, близкие к характеристикам пространственного дифференцирующего звена.

Зрительный анализатор обладает врожденной и приобретенной способностью специальной организации рецепторов. Поля фоторецепторов подсознательно изменяются в зависимости от яркости изображений. В этом заложена потенциальная возможность зрения изменять свою ФПМ в зависимости от формы рассматриваемых деталей изображения и условий наблюдения.

В работе Шадэ проведены исследования реакции глаза на тест-объект с синусоидальным изменением яркости по пространственной координате и приведена зависимость контрастной чувствительности глаза (звена формирования изображения) от пространственной частоты наблюдаемых объектов, полученная при условии порогового восприятия. В качестве наблюдаемых объектов использовались пространственные синусоидальные миры, что наиболее понятных и хорошо исследованных характеристик, используемых в физиологии зрительного восприятия. Для анализа желательно рассматривать процесс зрения как линейный, чтобы можно было использовать аппарат линейной фильтрации. Однако зрительные процессы не всегда линейны, как, например, в случае эффекта Маха, когда наблюдаются верхний и нижний выбросы в восприятии резкого края детали высокого контраста при переходе от светлого к темному. В тех случаях, когда глаз наблюдает достаточно резкий переход яркости от светлого поля к темному, на границе изменения градиента на темном фоне субъективно появляется еще более темная линия, а на светлом – более светлая линия. При низких контрастах зрительные процессы обычно приближенно считают линейными. В этом случае ФПМ определялась как обратная величина порогового контраста для каждой пространственной частоты миры, приведенной в плоскость сетчатки. Полученные результаты нормировались относительно минимального контраста. Характеристики свидетельствуют об увеличении порогового контраста не только при увеличении ПЧ решетки, но и при ее уменьшении.

Относительно реакции глаза на тест-объект с синусоидальным изменением яркости можно сделать следующие основные выводы:

1. Наблюдаемые пространственно-частотные характеристики глаза не являются результатом действия множества узкополосных резонансных фильтров, а не одного пространственного фильтра. Каждый из этих фильтров настроен на свою среднюю частоту, и они взаимно стохастически независимы. Каждый фильтр может быть выбран независимо, и мозг с известным приближением конструирует оптимальный для решения данной задачи обнаружения фильтр, выбирая соответствующие резонансные фильтры из имеющегося их набора.

2. Оптимальные для решения данной задачи наборы фильтров имеют огибающие типичной формы для одной определенной совокупности условий. Чувствительность зрительного анализатора мала при постоянном сигнале, резко возрастает до максимума на низких частотах и спадает примерно по закону Гаусса на высоких частотах. Пространственная частота, на которой наблюдается максимум, увеличивается с ростом яркости поля адаптации, и реакция глаза в целом охватывает широкий частотный диапазон. Диапазон максимума яркостей наблюдается в интервале 0,1–0,4 мрад-1.

3. При постоянном увеличении максимум яркостей сдвигается в сторону высоких частот с увеличением расстояния аккомодации глаза. Реакция глаза расширяется с увеличением расстояния в связи с меньшей кривизной хрусталика и устранением лучей, идущих под большими углами к оси.

4. Пороговый контраст повышается, если положение штрихов синусоидального тест-объекта составляет угол 45° с вертикалью или горизонталью. Пороговый контраст понижается с ростом яркости поля адаптации и расстояния аккомодации.

Наличие зрительных порогов объясняется воздействием специфических помех (шумов) зрительного анализатора, определяемых спонтанной активностью сетчатки и флуктуацией проводимости нервных каналов. Таким образом, ФПМ зрительного анализатора для случая порогового наблюдения характеризует величину шумов зрительной системы и их зависимость от ПЧ наблюдаемой миры.

Имеющиеся экспериментальные данные указывают на способность зрительного анализатора человека перестраивать свои рецепторные поля, т. е. как бы изменять размер, форму и закон пропускания отождествляемой со зрительным анализатором сканирующей апертуры глаза в зависимости от формы рассматриваемых объектов и их деталей. Это дает основание применять для описания визуального восприятия (обнаружения) методы линейной фильтрации.

Для описания чувствительности к свету зрительного анализатора человека используют так называемый дифференциальный порог – отношение минимальной воспринимаемой визуальной разности фона Lф и расположенной на нем круглой или квадратной площадки (стимула) Lс к яркости фона

kt = |Lс – Lф|/Lф = ΔL/Lф. (1.9)


Рисунок 1.5 – Зависимость дифференциального порога зрения от яркости фона: 1 – α2=500 угл. мин2 (350×350 мкм2), 2 – α2=100 угл. мин2 (50×50 мкм2), 3 – α2 = 10 угл. мин2 (16×16 мкм2)


Экспериментальные данные показывают, что дифференциальный порог зависит от яркости поля адаптации Lад, углового размера стимула на сетчатке глаза α, степени размытия границы между стимулом и фоном, продолжительности наблюдения, степени флюктуации яркости в пределах фона и стимула и от зоны сетчатки глаза, на которую проецируется стимул.

Если фон и стимул однородны, граница между ними резкая, а продолжительность наблюдения не ограничена, то в фовеальной зоне при яркостях более 10 Кд/м2 (дневное зрение) и размерах стимула более 100 угл. мин2 дифференциальный порог достигает сравнительно небольших значений – 0,02–0,04 (рисунок 1.5).

При уменьшении размера стимула дифференциальный порог возрастает, и при наибольшей остроте зрения (α=1 угл. мин, Lф100 кд/м2) он равен примерно десяти. Если граница между фоном и стимулом нерезкая, порог увеличивается.

Дифференциальный порог может быть выражен в значениях контраста, а именно: при


Отношение ΔL/L называется отношением Вебера. В практических приложениях принимают отношение Вебера, равным 0,02.

Восприятие цветных изображений характеризуется порогом цветоразличия. Чувствительность зрительного анализатора к изменению цвета наибольшая, когда цвет детали примерно совпадает с цветом окружающего ее фона. Зрительный анализатор может различать несколько тысяч цветов, в пределах которых при наилучших условиях наблюдения цвета деталей с угловыми размерами, равными 2°, воспринимаются как одинаковые. Пороги цветоразличия можно считать примерно равными размерам этих областей. Треугольник «красный-зеленый-синий» ограничивает область цветов, воспроизводимых ЦОЭС. Величина порогов цветоразличия в значительной мере зависит не только от положения в цветовом теле, но и от направления координатных осей, т. е. от цветовой системы. Это обстоятельство может быть использовано для повышения эффективности аналого-цифрового преобразования путем перехода от одной цветовой системы к другой.

Зрительный анализатор, как правило, более чувствителен к изменению яркости деталей, чем к изменению их цветности. Этим, в частности, объясняется то, что в каналах цветности допускается обычно более высокий уровень шумов, чем в канале яркости. Относительная видность шумов в канале передачи зеленой составляющей изображения выше, чем в канале передачи красной составляющей, а в канале красной составляющей выше, чем в канале передачи синей составляющей. При уменьшении угловых размеров деталей изображения контрастная чувствительность зрения падает. Пороговый контраст необходимо учитывать, отмечая конкретно, к каким деталям изображения он относится.

Зависимость порога цветоразличия от размеров деталей и пространственной частоты изображения имеет примерно тот же характер, что и зависимость порогового контраста от этих величин. Установлено, что зрительный анализатор удовлетворительно различает цвет крупных деталей, линейные размеры которых более 12 элементов разрешения изображения. Детали, угловые размеры которых равны 6–18 угл. мин., воспринимаются как окрашенные цветами от оранжевого до зелено-синего. Детали с меньшими угловыми размерами воспринимаются как неокрашенные. Порог цветоразличия растет с увеличением ПЧ изображения независимо от его цвета. Поэтому при оценке уровней помех в каналах цветности широко используются взвешивающие характеристики помех.

Контрастная чувствительность зрительного анализатора зависит также от частоты изменений яркости деталей во времени. Такие изменения могут возникнуть как паразитный эффект при передаче многокадровых изображений. Чем меньше размеры деталей, тем слабее это влияние. С увеличением частоты мельканий их заметность вначале увеличивается, а затем падает. При частоте, превышающей 40 Гц, мелькания незаметны. Изменения яркости могут повысить контрастную чувствительность зрения к обнаружению крупных деталей на порядок. Такое повышение имеет место при частоте мельканий, равной 3–15 Гц.

При кодировании изображений, хранения и передачи в цифровом коде, а также при использовании тех или иных алгоритмов улучшения изображений необходимо оценивать качество результата. Во всех этих задачах общим является вопрос о качестве изображения о том, чтобы в процессе обработки изображений поддерживать, повышать и восстанавливать его.

Для оценки качества передачи изображений любого типа удобно было бы иметь единый обобщенный критерий. Известно, что два цвета практически неразличимы при величине 4–6 ед. МКО. В качестве численного значения цветового различия используется пороговая величина, равная 6 ед. МКО. При любом методе передачи необходимы экспериментальные оценки изображений по нескольким критериям, перечень которых согласуется с общими свойствами трактов передачи данного типа и с перечнем возможных искажений сигналов в таких трактах. При оценке качества передачи изображений на практике иногда используется критерий СКО.

Приближенный характер оценок по приведенным выше критериям делает необходимой субъективную экспертизу качества на реальных изображениях.

В настоящее время субъективное качество оценивается двумя способами: либо определяется верность воспроизведения, либо оценивается дешифрируемость изображения.

Верность воспроизведения характеризует степень отклонения обработанного изображения от некоторого эталонного. Например, при оцифровке и визуализации изображения на мониторе компьютера могут возникать погрешности, проявляющиеся в потере РС, уменьшении контрастов и т. д. Некоторые погрешности воспроизведения улучшают дешифрируемость, поэтому существуют различные процедуры подчеркивания границ, дифференцирования, цветовой коррекции изображений.

Очевидно, что количественные меры верности и дешифрируемости изображений крайне необходимы для проектирования и оценки систем воспроизведения изображений. Эти меры во многом помогут избавиться от трудоемкости и подчас неточной современной методики оценки изображений посредством субъективной экспертизы. Кроме того, на основе количественных мер можно развивать методы оптимизации систем обработки изображений.

В разработке количественных критериев верности и дешифрируемости изображений достигнуты значительные успехи. Однако введенные критерии не являются достаточно совершенными: очень часто можно привести примеры изображений, качество которых формально оценивается как высокое, а субъективно как низкое, и наоборот.

В настоящее время наиболее распространенным способом определения качества изображений является субъективная экспертиза. В качестве экспертов привлекают наблюдателей-неспециалистов. Их оценки определяют качество изображения именно так, как его воспринимает средний наблюдатель.

Кроме того, проводятся опыты со специалистами, имеющими опыт обработки изображений, от которых следует ожидать более обоснованных оценок качества. Предполагается, что опытные наблюдатели замечают небольшие погрешности изображения, которые неспециалист может проглядеть.

Существуют два вида экспертных оценок: абсолютные и сравнительные. В первом случае наблюдатель должен оценить качество изображения по какой-то заранее определенной шкале. При некоторых методиках процесс оценивания облегчается тем, что наблюдателю предоставляется также набор эталонных изображений. Существуют и другие методики, когда наблюдатель вынужден принимать решение только на основании своего собственного опыта. При сравнительных оценках наблюдатель должен ранжировать набор конкретных изображений, т. е. расставить их в ряд по убыванию качества.

Изображения оцениваются экспертами по шкалам снижения и оценки качества. Шкала снижения качества применяется для сравнительной оценки изображений до и после преобразований. Шкала оценки качества применяется для оценки преобразованного изображения при отсутствии оригинала. Как правило, пользуются следующими пятибалльными шкалами.

Шкала снижения качества:

5 – искажения незаметны;

4 – искажения заметны, но не мешают;

3 – искажения заметны, немного мешают;

2 – искажения мешают, надоедают;

1 – искажения сильно мешают.

Шкала оценки качества:

5 – отличное качество;

4 – хорошее;

3 – удовлетворительное;

2 – плохое (неприемлемое);

1 – очень плохое (совершенно неприемлемое).

На основании оценок, данных различными наблюдателями, вычисляется среднеарифметическая оценка.

Распространенным видом шкалы оценок является шкала «общего качества», когда изображениям приписываются баллы, которые соответствуют градациям от «неудовлетворительно» до «отлично», приведенным в таблице 1.1. На практике каждое изображение поступает к наблюдателю, и он выставляет балл той категории, которая, по его мнению, в наибольшей степени соответствует качеству изображения. Вариантом данной шкалы является шкала «места в группе», или относительная шкала (таблица 1.2), когда наблюдатель оценивает качество изображения, сравнивая его со всеми другими изображениями, входящими в рассматриваемую группу.


Таблица 1.1 – Шкала общего качества изображения


Таблица 1.2 – Относительная шкала качества изображения


Еще одной распространенной шкалой оценок является шкала погрешностей (таблица 1.3), согласно которой наблюдатель должен оценить в баллах степень искажений, изменяющихся от «незаметных» до «крайне нежелательных».

Результаты экспертных оценок обычно выражают с помощью среднего балла, определяемого как:


где nk – число изображений k-й категории; Ck – соответствующий ей балл.


Таблица 3 – Шкала погрешностей


Рисунок 1.6 – Сравнение шкал качества и погрешностей, применяемых для субъективной оценки изображений


Считается, что для получения надежной оценки качества изображения необходимо опросить не менее двадцати наблюдателей. Одной из трудностей, связанных с балльными оценками, является возможная нелинейность шкалы.

На рисунке 1.6 для сравнения помещены шкала абсолютного (общего) качества, шкала погрешностей и еще одна шкала погрешностей, состоящая из трех градаций. Сравнение шкал выполнено на основе субъективных оценок.

Для сравнения и оценки качества съемочных систем в США успешно используется Национальная шкала дешифрируемости снимков (National Imagery Interpretability Scale, NIIRS), которая первоначально разрабатывалась для военных организаций, имеющих в своем штате опытных специалистов и использующих визуальные методы дешифрирования. Шкала NIIRS основана, прежде всего, на пространственном разрешении снимков, но в ней учитываются также факторы, связанные с отношением сигнал/шум и функцией рассеяния точки. Краткое описание 10-уровневой шкалы NIIRS, разработанной для панхроматических снимков, приведено в таблице 1.4. Более подробное описание содержится в работе Лихтенауэра (Leachtenauer и др., 1997) и в документации IRARS (1996). Была также разработана шкала NIIRS для оценки многоспектральных снимков (IRARS, 1995). Процедура оценки заключается в том, что снимок отдают опытному специалистудешифровщику (сертификат NIIRS) и просят его определить уровень деталей, которые он может распознать. Средний балл процедуры для панхроматических снимков, полученных системой IKONOS с разрешением 1 м по шкале NIIRS, составил 4,5.


Таблица 1.4 – Национальная шкала дешифрирования (NIIRS) Баллы Критерий.


На первый взгляд, шкала NIIRS не очень полезна для тех задач, которые решаются в области гражданского применения данных дистанционного зондирования. Однако при существующей тенденции к увеличению разрешающей способности многоспектральных датчиков до уровня таких систем, как IKONOS, QuickBird и Orb View, можно ожидать, что одни и те же данные будут использоваться как для военных, так и для гражданских целей. Кроме того, положенная в основу NIIRS идея о необходимости связывания характеристик съемочной системы и параметров решаемой задачи может оказаться очень полезной для количественного анализа ЦОЭС. В частности, предлагается математически связать параметры датчиков со шкалой NIIRS и оценивать возможность использования той или иной съемочной системы с помощью обобщенной формулы качества изображения (Leachtenauer и др., 1997).

На результаты субъективных экспертных оценок влияют характер рассматриваемых изображений и окружающая обстановка (условия эксперимента). Если наблюдатель видел подобные изображения, то он склонен более строго оценивать погрешности, поскольку имеет сложившееся представление о структуре изображения. С другой стороны, в незнакомом изображении искажения могут оставаться незамеченными, пока наблюдателю не будет на них указано. Условия эксперимента должны в максимально возможной степени соответствовать условиям наблюдения в реальной обстановке. Следует с осторожностью пользоваться экспертными оценками, если изменились условия наблюдения. Так, качество изображения на экране обычного телевизионного монитора может быть расценено как «хорошее», с «еле заметными» искажениями. Однако если то же самое изображение будет представлено в виде фотографии, снятой с помощью высококачественной аппаратуры, то все погрешности, ранее скрытые нелинейностями телевизионного устройства, неожиданно могут стать очень заметными.

Теория и практика распознавания инженерных сооружений, промышленных предприятий и объектов железнодорожного транспорта при дешифрировании аэроснимков

Подняться наверх