10
ТРУДЫ МФТИ. — 2009. — Том 1, № 3 171 УДК 528.85/87(15) Л.Н. Чабан 1, 2 , Г.В. Вечерук 2 , Т.С. Гаврилова 2 1 Московский государственный университет геодезии и картографии 2 Московский физико-технический институт (государственный университет) Исследование возможностей классификации растительного покрова по гиперспектральным изображениям в пакетах тематической обработки данных дистанционного зондирования Анализируются особенности классификации растительного покрова на гиперспек- тральных изображениях в наиболее известных пакетах обработки данных дистан- ционного зондирования. Показано, что наилучшие результаты даёт статистическая классификация по эталонам с учётом дисперсии спектральных признаков по кана- лам. Для качественного выбора эталонов и возможности классификации такими ме- тодами больших объёмов видеоданных необходим отбор наиболее информативных каналов. На примерах наземных гиперспектральных изображений рассмотрены воз- можности и ограничения решения данной задачи методом главных компонент, в част- ности методика использования проекций каналов на наиболее информативные ком- поненты. Ключевые слова: тематическая обработка данных дистанционного зондирования, классификация растительного покрова, гиперспектральные изображения, методы классификации, анализ главных компонент. Тематическая классификация поч- венно-растительного покрова является необходимым этапом большинства за- дач ландшафтно-экологического картогра- фирования по материалам аэрокосмиче- ской съёмки. Для решения таких задач наибольший интерес представляют ма- териалы космической съёмки в несколь- ких зонах энергетического спектра, пре- имущественно в видимом диапазоне (0,4 0,7 мкм) и ближнем ИК диапазоне (0,7 1,3 мкм). Спектральные отражатель- ные свойства растительности и почвенно- растительных комплексов зависят от со- става, структуры, фазы вегетации, кли- матических и многих других факторов. С одной стороны, наличие таких взаимо- связей имеет большое значение для реше- ния прикладных задач, но, с другой сторо- ны, усложняет задачу тематической клас- сификации по спектральным признакам. Сложности обусловлены как ограничени- ями датчиков, регистрирующих отражён- ное от земной поверхности солнечное излу- чение, так и особенностями альбедо каж- дого отдельного участка земной поверхно- сти, на которое, кроме перечисленных вы- ше факторов, влияет также топография местности и текущие метеоусловия. В связи с этим разработка любой при- кладной компьютерной технологии тема- тического дешифрирования растительно- сти и почвенно-растительных комплексов требует тщательного выбора признаков и методов классификации. Эта пробле- ма становится особенно актуальной в свя- зи с увеличением спектрального и про- странственного разрешения космических средств дистанционного зондирования. Ес- ли опыт тематической классификации мультиспектральных изображений на сего- дняшний день достаточно обширен, то ме- тодология обработки гиперспектральной видеоинформации находится только в ста- дии формирования и вызывает определён- ные трудности у специалистов по приклад- ному тематическому дешифрированию [1]. I. Особенности тематической обработки гиперспектральных изображений Специфика тематической обработки гиперспектральных изображений обуслов- лена, прежде всего, большой размерно- стью видеоданных. Основной проблемой является адаптация существующей мето-

Исследованиевозможностейклассификации ... · ТРУДЫМФТИ.—2009.—Том1,№3 171 УДК528.85/87(15) Л.Н.Чабан1,2,Г.В.Вечерук2,Т.С.Гаврилова2

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Исследованиевозможностейклассификации ... · ТРУДЫМФТИ.—2009.—Том1,№3 171 УДК528.85/87(15) Л.Н.Чабан1,2,Г.В.Вечерук2,Т.С.Гаврилова2

ТРУДЫ МФТИ. — 2009. — Том 1, № 3 171

УДК 528.85/87(15)

Л.Н. Чабан1,2, Г.В. Вечерук2, Т.С. Гаврилова2

1 Московский государственный университет геодезии и картографии2 Московский физико-технический институт (государственный университет)

Исследование возможностей классификациирастительного покрова по гиперспектральнымизображениям в пакетах тематической обработки

данных дистанционного зондированияАнализируются особенности классификации растительного покрова на гиперспек-тральных изображениях в наиболее известных пакетах обработки данных дистан-ционного зондирования. Показано, что наилучшие результаты даёт статистическаяклассификация по эталонам с учётом дисперсии спектральных признаков по кана-лам. Для качественного выбора эталонов и возможности классификации такими ме-тодами больших объёмов видеоданных необходим отбор наиболее информативныхканалов. На примерах наземных гиперспектральных изображений рассмотрены воз-можности и ограничения решения данной задачи методом главных компонент, в част-ности методика использования проекций каналов на наиболее информативные ком-поненты.

Ключевые слова: тематическая обработка данных дистанционного зондирования,классификация растительного покрова, гиперспектральные изображения, методыклассификации, анализ главных компонент.

Тематическая классификация поч-венно-растительного покрова являетсянеобходимым этапом большинства за-дач ландшафтно-экологического картогра-фирования по материалам аэрокосмиче-ской съёмки. Для решения таких задачнаибольший интерес представляют ма-териалы космической съёмки в несколь-ких зонах энергетического спектра, пре-имущественно в видимом диапазоне(0,4–0,7 мкм) и ближнем ИК диапазоне(0,7–1,3 мкм). Спектральные отражатель-ные свойства растительности и почвенно-растительных комплексов зависят от со-става, структуры, фазы вегетации, кли-матических и многих других факторов.С одной стороны, наличие таких взаимо-связей имеет большое значение для реше-ния прикладных задач, но, с другой сторо-ны, усложняет задачу тематической клас-сификации по спектральным признакам.Сложности обусловлены как ограничени-ями датчиков, регистрирующих отражён-ное от земной поверхности солнечное излу-чение, так и особенностями альбедо каж-дого отдельного участка земной поверхно-сти, на которое, кроме перечисленных вы-ше факторов, влияет также топографияместности и текущие метеоусловия.

В связи с этим разработка любой при-кладной компьютерной технологии тема-тического дешифрирования растительно-сти и почвенно-растительных комплексовтребует тщательного выбора признакови методов классификации. Эта пробле-ма становится особенно актуальной в свя-зи с увеличением спектрального и про-странственного разрешения космическихсредств дистанционного зондирования. Ес-ли опыт тематической классификациимультиспектральных изображений на сего-дняшний день достаточно обширен, то ме-тодология обработки гиперспектральнойвидеоинформации находится только в ста-дии формирования и вызывает определён-ные трудности у специалистов по приклад-ному тематическому дешифрированию [1].

I. Особенности тематическойобработки гиперспектральных

изображений

Специфика тематической обработкигиперспектральных изображений обуслов-лена, прежде всего, большой размерно-стью видеоданных. Основной проблемойявляется адаптация существующей мето-

Page 2: Исследованиевозможностейклассификации ... · ТРУДЫМФТИ.—2009.—Том1,№3 171 УДК528.85/87(15) Л.Н.Чабан1,2,Г.В.Вечерук2,Т.С.Гаврилова2

172 ТРУДЫ МФТИ. — 2009. — Том 1, № 3

дологии автоматической классификациимультиспектральных изображений к коли-чественно и качественно новым объёмаминформации.При классификации материалов муль-

тиспектральной съёмки образ пикселяизображения представляют как n-мерныйвектор спектральных яркостей:

�x =

⎛⎝ x1

...xn

⎞⎠ ,

где xi — яркость пикселя в i-м диапазоне(канале), n — общее число используемыхканалов. Этот вектор принято называтьспектральной сигнатурой пикселя. Соот-ветственно набор векторов, описывающийопределённый класс объектов, называютсигнатурой (эталоном) класса.Совокупности всех сигнатур пикселей

изображения соответствует определённаядиаграмма рассеяния в n-мерном про-странстве спектральных признаков. Притематической классификации каждомувыделяемому типу объектов земной по-верхности сопоставляется многомерная об-ласть в диаграмме рассеяния. Качествоклассификации изображения зависит оттого, насколько точно определены грани-цы этих областей для выделяемых клас-сов.Современные пакеты тематической об-

работки мультиспектральных изображе-ний имеют развитый аппарат для выбораи оценки качества эталонов классов. Наи-более удобные и разнообразные средствапредставлены в пакете ERDAS Imagine.Эти средства позволяют, например, свя-зывать изображение с проекцией диаграм-мы рассеяния и выполнять интерактив-ный анализ данных непосредственно в про-странстве признаков, в том числе отоб-ражение и построение эталонов тематиче-ских классов [2, 5]. На основе такого анали-за можно наиболее точно определять гра-ницы тематических классов и строить ком-бинированные схемы распознавания с ис-пользованием нескольких методов класси-фикации.Популярным средством предваритель-

ного анализа является также неконтроли-руемая классификация на заданное чис-ло классов (кластерный анализ). Она, вчастности, позволяет оценить общее коли-чество разделяющихся по спектральным

признакам тематических классов на вы-бранном участке территории.Увеличение количества спектральных

диапазонов затрудняет использование ме-тодов визуально-интерактивного анализа,как самих изображений, так и диаграммрассеяния. Неконтролируемая классифи-кация (кластерный анализ) также стано-вится неэффективной, поскольку реаль-ное количество объектов с различнымиспектрами очень велико, и при доступ-ном для интерпретации количестве клас-сов они будут группироваться непредска-зуемым образом в силу свойств алгорит-мов класса ISODAТA [3], в частности,из-за зависимости результата кластериза-ции от способа задания исходных цен-тров [4]. Следовательно, при анализе ги-перспектральных изображений практиче-ски невозможно предварительно оценитьколичество разделяющихся по спектраль-ным признакам классов объектов на от-снятом участке территории. Поэтому за-дача классификации в данном случае сво-дится к выделению определённого подмно-жества классов, представляющих интересдля конкретной задачи, то есть к класси-фикации по эталонам. Выбор эталонов всвою очередь должен выполняться в техканалах, где различия между исследуемы-ми объектами могут быть обнаружены ви-зуально.Наконец, для классификации изобра-

жений в 100 и более каналах, как неконтро-лируемой, так и контролируемой, необхо-димы огромные вычислительные ресурсы,которые не всегда доступны даже в мощ-ных комплексах тематической обработки,а тем более широкому кругу потребителей.Таким образом, тематическая обработ-

ка гиперспектральных изображений тре-бует либо специального аппарата анализаизображений, либо разработки эффектив-ных методик снижения размерности зада-чи с минимальными потерями необходи-мой для прикладного дешифрирования ин-формации.Специальные средства анализа гипер-

спектральных изображений уже имеютсяв таких популярных пакетах, как ERDASImagine и ENVI [6, 7]. Однако, как спра-ведливо отмечено в [6], тематический ана-лиз гиперспектральных изображений рас-тительного покрова представляет собой от-дельную и наиболее сложную задачу. Ос-

Page 3: Исследованиевозможностейклассификации ... · ТРУДЫМФТИ.—2009.—Том1,№3 171 УДК528.85/87(15) Л.Н.Чабан1,2,Г.В.Вечерук2,Т.С.Гаврилова2

ТРУДЫ МФТИ. — 2009. — Том 1, № 3 173

новные причины этого были изложены вы-ше. Тем не менее на первом этапе нашихисследований было решено проанализиро-вать возможности использования при те-матической обработке гиперспектральныхизображений уже отработанных методовавтоматического анализа, в том числе су-ществующих средств снижения размерно-сти и отбора наиболее информативныхспектральных диапазонов. Последняя за-дача актуальна и для разработки перспек-тивной мультиспектральной и гиперспек-тральной космической аппаратуры. Ана-лиз традиционных и перспективных мето-дов обработки многоспектральных и ги-перспектральных изображений с использо-ванием авиакосмической оптикоэлектрон-ной аппаратуры представлен в учебном по-собии [11].

II. Исходные данные

В исследовании использовались мате-риалы наземных гиперспектральных съе-мок 2007–2008 годов. Съемки выполне-ны на кафедре СУМГФ МФТИ полевымгиперспектрометром, разработанным набазовом предприятии кафедры СУМГФЗАО «НПО Лептон». Гиперспектрометримеет 290 каналов в спектральном диапа-зоне 394,5–928,9 нм. На основании резуль-татов предварительной оценки информа-тивности коротковолновых каналов гипер-спектрометра для тематической классифи-кации растительных объектов использо-вались только 101–290 каналы (диапазон441,58–928,9 мкм).В связи с отсутствием на момент съе-

мок калибровочных эталонов для пере-счёта яркостей пикселей в коэффициентыотражения использование блока анализагиперспектральных изображений SpectralAnalysis Workstation из пакета ERDASImagine оказалось не целесообразным. По-этому анализ гиперспектральных изоб-ражений проводился в пакете ERDASImagine общими средствами анализа муль-тиспектральных данных.Для эксперимента были выбраны изоб-

ражения, полученные в мае и сентябре, тоесть в различные периоды вегетации рас-тительного покрова. Особенность майскойи сентябрьской съёмки — различие ста-дий вегетации в пределах одного типа —

позволяет промоделировать возможностьразделения не только породного состава,но и различных состояний древесной рас-тительности. По наземным обследовани-ям отснятого участка был определён по-родный состав древесной растительностии сформированы группы эталонов основ-ных типов древесных пород. По весеннемуизображению были выбраны: ель — 1 эта-лон, береза — 5 эталонов, ясень — 3 эта-лона, деревья с нераспустившейся листвой(почки) — 2 эталона, травянистая расти-тельность — 1 эталон. По осеннему изобра-жению выбраны: сосна — 3 эталона, бере-за — 3 эталона, ясень — 3 эталона, клен —3 эталона. Размеры эталонов выбиралисьпутём увеличения таковых до полученияустойчивого среднего спектра по выбор-ке (в некоторых случаях набирались понескольким участкам). Для удобства сов-местного статистического анализа оконча-тельный размер был определён по макси-мальной величине выборки и составил око-ло 200 пикселей. Основным требованиемк эталонам была принципиальная возмож-ность их точного разделения по спектраль-ным характеристикам в рабочем наборе из190 каналов каким-либо из доступных ме-тодов классификации.

Для проверки полученных результатовчастично использовались также материа-лы летних съемок 2007 года. Провестипо этим изображениям полноценный ана-лиз не удалось из-за недостатка сопроводи-тельной информации для идентификацииэталонных объектов.

III. Методология тематическойклассификации

Особенности альбедо растительного по-крова ограничивают, прежде всего, ис-пользование для классификации корреля-ционных мер сходства спектров, имеющих-ся в пакетах тематической обработки. Кор-реляционные методы всегда предполага-ют наличие определённого угла ϕ междуn-мерными векторами mk эталонных спек-тров классов, поскольку коэффициент кор-реляции есть косинус угла между двумяединичными векторами в пространстве яр-костей. Коэффициент корреляции эталон-ных спектров j-го и k-го классов опреде-

Page 4: Исследованиевозможностейклассификации ... · ТРУДЫМФТИ.—2009.—Том1,№3 171 УДК528.85/87(15) Л.Н.Чабан1,2,Г.В.Вечерук2,Т.С.Гаврилова2

174 ТРУДЫ МФТИ. — 2009. — Том 1, № 3ляется выражением

ρjk =mjmk

‖mj‖ · ‖mk‖ ,

где ||mj||, ||mk|| — модули (длины) векто-ров средних значений по сигнатурам j-гои k-го классов.Предварительный статистический ана-

лиз спектров выбранных растительныхклассов на наших изображениях показал,что в некоторых случаях средние mj иmk сигнатур растительных классов, на-пример, классов сосны и березы на осен-нем снимке, отличаются только по модулю||mj-mk||, то есть в данном случае ρjk = 1и ϕ = 0.Существенной для распознавания осо-

бенностью растительных и почвенно-рас-тительных классов на мультиспектраль-ных и гиперспектральных изображенияхявляется также зависимость разброса ихспектральных яркостей от длины волны.Наиболее сильно это проявляется на изоб-ражениях лесной и кустарниковой расти-тельности, поскольку даже при простран-ственном разрешении порядка 1 м на пик-сель растительные классы представляютсобой сложные комплексы объектов с раз-личными спектральными отражательны-ми свойствами. Эти свойства характеризу-ют состав и структуру растительного по-крова, поэтому характер рассеяния сигна-туры такого класса в признаковом про-странстве является важным признакомпри его распознавании. Использование ли-нейных разделяющих и решающих функ-ций в такой задаче, в частности классифи-кации по минимуму евклидова расстояниядо среднего значения сигнатуры класса,может приводить к неприемлемым ошиб-кам. Для классификации древесно-кустар-никовой растительности наиболее эффек-тивны статистические методы — макси-мум правдоподобия или квадратичное рас-стояние Махаланобиса [5]. В предположе-нии о нормальном распределении сигна-тур эталонов и равной вероятности клас-сов, границы между классами в этих мето-дах представляют собой поверхности вто-рого порядка вида [8]

1

2ln

|Ck||Cj| −

1

2(x−mj)

TC−1j (x−mj)+

+1

2(x−mk)

TC−1k (x−mk) = 0,

где mj , mk — векторы средних значенийпо эталонным сигнатурам, Cj, Ck — их ко-вариационные матрицы.Поскольку данные методы классифи-

кации требуют расчёта ковариационныхматриц, обработка изображений в 100 иболее каналах связана с вычислительны-ми проблемами, о которых говорилось вы-ше. Классификацию удобнее выполнятьна подмножестве каналов, где требуе-мые классы выделяются с минимальнымиошибками.Таким образом, задача отбора каналов

имеет две цели: корректный выбор этало-нов классов; снижение требований к мощ-ности программно-технического обеспече-ния процесса классификации.При большом количестве каналов про-

стейшим способом снижения размерностиявляется равномерный отбор (прорежива-ние) каналов с заданным шагом. Однакотакое «загрубление» спектров путём ку-сочно-линейной аппроксимации допусти-мо только до определённого уровня и явнонепригодно в задаче выбора эталонов. Дляболее эффективного сокращения размер-ности может быть использовано несколькоразличных подходов.

III.1. Корреляционный и факторныйанализ

Анализ корреляции между каналамидля заданного набора из N тематическихклассов и выбор подмножества наименеекоррелированных каналов. Коэффициенткорреляции между j-м и k-м каналами рас-считывается по формуле

ρjk =1

N

∑Ni=1 [(xij −mj)(xik −mk)]

σjσk.

Здесь mj , mk — средние яркости по мно-жеству в j-м и k-м каналах, σj, σk — со-ответствующие стандартные отклонения.Поскольку коэффициент корреляции естькосинус угла ϕ между двумя единичны-ми векторами xi, xj n-мерного базиса про-странства яркостей, минимальная корре-ляция между xi, xj обеспечивает наиболь-ший разброс диаграммы рассеяния в со-ответствующей плоскости n-мерного про-странства, что в общем случае позволяетнаиболее точно определять границы тема-тических классов. Факторный анализ при

Page 5: Исследованиевозможностейклассификации ... · ТРУДЫМФТИ.—2009.—Том1,№3 171 УДК528.85/87(15) Л.Н.Чабан1,2,Г.В.Вечерук2,Т.С.Гаврилова2

ТРУДЫ МФТИ. — 2009. — Том 1, № 3 175

этом обеспечивает выбор направлений наи-большего разброса диаграммы рассеянияв целом. Однако направления наибольше-го разброса для представляющей интересгруппы классов далеко не всегда ортого-нальны. Поэтому снижение размерностипри выполнении одновременно двух ука-занных требований может привести к по-терям информации по отдельным классамзаданного набора, что и подтвердили про-ведённые нами эксперименты.

III.2. Статистический анализколичества различающей

информации

Рассматриваются нормированные к об-щему числу пикселей гистограммы изоб-ражений в каждом канале как эмпириче-ские функции p(x) плотности распределе-ния спектральной яркости на множествезначений X. Среднее количество различа-ющей информации [8, 10] для пары кана-лов j, k определяется как

ΔIjk =

X

pj(x) lnpj(x)

pk(x)dx+

+

X

pk(x) lnpk(x)

pj(x)dx =

=

X

(pj(x) − pk(x)) lnpj(x)

pk(x)dx.

Выбирается подмножество каналов, обес-печивающих требуемый критерий по зна-чениям ΔIjk. Проблема состоит в выбореподходящего критерия ΔIjk для конкрет-ного набора классов. В целом метод пред-ставляется пригодным для дифференци-альной классификации одного типа расти-тельного покрова, например лесов.

III.3. Функциональный анализэталонных спектров

Спектры эталонов классов рассматри-ваются как функции f(λ), где λ — дли-на волны. Здесь может использоватьсяфурье-анализ, дифференциальные харак-теристики спектральных кривых и раз-личные типы отношений между каналами.

Метод представляется наиболее эффектив-ным для разделения пространственно од-нородных объектов при известной допу-стимой величине отношения сигнал/шумпо каналам.В данной работе рассматривается пер-

вый из перечисленных подходов к отборуканалов, пригодный для наиболее широко-го класса задач тематического дешифри-рования, в том числе почвенно-раститель-ного покрова. Выбор обусловлен, преж-де всего, наличием соответствующих про-грамм во всех пакетах тематической обра-ботки аэрокосмической информации. По-этому его реализация не требует разработ-ки специального программного обеспече-ния.

IV. Методика отбора каналов

Основой методики отбора является ор-тогональное преобразование исходного ба-зиса пространства признаков, известноекак метод главных компонент. Метод явля-ется одной из моделей факторного анали-за, предназначенной для снижения размер-ности данных с минимальной потерей ин-формации. Общая постановка задачи сле-дующая [9]: для измеренных параметровx1, ..., xn найти m < n новых параметров(факторов) f1,.., fm, таких что

xj =

m∑k=1

αkjfk + ξj, j = 1, ..., n;

(fkfl) =

{N, k = l,0, k �= l,

k = 1, ..., n; l = 1, ..., n.

n∑j=1

σ2(ξj) =1

N

n∑j=1

(ξj ,ξj) → min ,

где N — число элементов статистическойвыборки, по которой выполняется преоб-разование.Решение задачи сводится к нахожде-

нию собственных чисел и собственных век-торов корреляционной матрицы R = {rij},где rij — коэффициенты корреляции (ино-гда ковариации) между параметрами xi

и xj . В данном случае таковыми являют-ся векторы исходного базиса пространства

Page 6: Исследованиевозможностейклассификации ... · ТРУДЫМФТИ.—2009.—Том1,№3 171 УДК528.85/87(15) Л.Н.Чабан1,2,Г.В.Вечерук2,Т.С.Гаврилова2

176 ТРУДЫ МФТИ. — 2009. — Том 1, № 3спектральных признаков, то есть кана-лы гиперспектрального изображения. Соб-ственные векторы матрицы R, располо-женные в порядке убывания их собствен-ных чисел, задают направления наиболь-шего разброса диаграммы рассеяния, а ихсобственные числа — дисперсии по этимнаправлениям.Преобразование к главным компонен-

там используется при визуально-интерак-тивном анализе мультиспектральных дан-ных, так как изображения в новом ортого-нальном базисе и их RGB-композиции ча-сто оказываются более информативными,чем исходные. При этом основная часть ин-формации содержится в первых компонен-тах нового изображения.Поскольку проекция αjk вектора исход-

ного базиса xj на компоненту fk есть коэф-фициент корреляции между этими векто-рами, для оценки вклада каждого каналаxj в наиболее информативные направле-ния можно использовать аддитивный кри-терий

Aj =

p∑k=1

|αjk|,

где j = 1, ..., p � m — наиболее информа-тивные из m главных компонент для вы-бранного набора тематических классов.Процесс отбора каналов включает, та-

ким образом, следующие этапы.1. Преобразование гиперспектрального

изображения к главным компонентам.2. Анализ трендов средних яркостей

эталонов в новом наборе каналов и выделе-ние наиболее информативных компонент.3. Расчёт проекций αjk и величины Aj

для всех j = 1, ..., n.4. Отбор каналов по максимальным

значениям величины Aj .5. Оценку точности классификации

для выбранного набора каналов.Предварительный интервальный отбор

по выбранным группам классов показал,что 100% точность классификации эта-лонов по максимуму правдоподобия какдля майского, так и для сентябрьскогоизображений может быть обеспечена наподмножестве из 80 каналов в диапазоне565,33–928,9 мкм (каналы 211–290). Этотнабор каналов принят за базовый для срав-нительных оценок точности классифика-ции. Под 100% точностью понимается пра-вильная классификация всех точек этало-

нов. Допустимой (приемлемой) точностьюпри нормально распределённых значени-ях признака обычно считается точность67–70% — так называемый «уровень 1σ»,когда функции распределения по парамклассов (j, k) пересекаются на расстоя-нии от средних значений mj , mk не мень-шем одного стандартного отклонения (1σ).В одномерном случае это условие обычнозаписывается через нормализованное рас-стояние [10]:

R =|mj −mk|σj + σk

> 1.

Оценка точности выполнялась на этало-нах путём их классификации методом мак-симума правдоподобия и методом евкли-дова расстояния. Параллельно для сопо-ставления использовались меры попарнойстатистической разделимости эталонов —трансформированная дивергенция и рас-стояние Джеффриса–Матуситы [3, 5].Анализ эффективности методики вы-

полнялся путём сопоставления результа-тов классификации эталонов на выбран-ных наборах каналов с результатами клас-сификации при упомянутом выше равно-мерном отборе каналов с заданным ша-гом. На рис. 1 представлены результатыклассификации эталонов майского изобра-жения двумя методами при различном ко-личестве каналов, полученном путём та-кого «прореживания» на выбранном под-множестве из 80 каналов. Данные гра-фики, в частности, наглядно иллюстриру-ют преимущества статистической класси-фикации изображений растительного по-крова перед классификацией по минимумурасстояния.Преобразование и анализ главных ком-

понент выполнялись в пакете ERDASImagine (функция Principal Components).В процессе преобразования изображенийданная функция по заказу пользователяформирует текстовый файл — матрицу ко-эффицентов разложения векторов исход-ного базиса по n собственным векторамкорреляционной матрицы R (в порядкеубывания собственных значений этих век-торов). Для расчёта величины Aj доста-точно выбрать столбцы матрицы, соответ-ствующие наиболее информативным ком-понентам по заданному набору классов,и просуммировать их абсолютные значе-

Page 7: Исследованиевозможностейклассификации ... · ТРУДЫМФТИ.—2009.—Том1,№3 171 УДК528.85/87(15) Л.Н.Чабан1,2,Г.В.Вечерук2,Т.С.Гаврилова2

ТРУДЫ МФТИ. — 2009. — Том 1, № 3 177

ния. Данная операция выполнялась в па-кете Excel. На рис. 2 представлены ре-зультаты преобразования к главным ком-понентам майского изображения. Графикслева показывает распределение инфор-мативности по первым пятнадцати ком-понентам ортогонального преобразования.Из графика видно, что основная информа-ция по выбранным классам содержится в1, 2, 3, 5, 8, 9 компонентах. Изображенияв трёх из перечисленных компонент (наи-более контрастных) показаны слева.

Рис. 1. Зависимость точности классифика-ции (%) эталонов растительности майскогоизображения от числа каналов при равномер-ном отборе с заданным шагом в диапазоне565,33–928,9 мкм (каналы 211–290)

Для сентябрьского изображения(рис. 3) наиболее информативными ока-зались соответственно 1, 3, 4, 6, 9, 14 ком-поненты. Визуальный анализ результатапреобразования к главным компонентампоказал, однако, что различия породного

состава и состояний растительности в дан-ном случае сильно маскируются условия-ми освещенности. Этим обусловлено болеерезкое, чем в первом случае, снижениеточности классификации при сокращениичисла каналов.

Рис. 2. Распределение информации для набо-ра растительных классов по 15 главным ком-понентам майского изображения (слева) и са-мо изображение в 1, 2, 5 компонентах (сверхувниз)

Рис. 3. Сентябрьское изображение в видимомдиапазоне спектра

На рис. 4 представлен результат расчё-та критерия Aj , j = 211, ..., 290 для обоихизображений.Заметим, что точность классификации

эталонов по изображениям в главных ком-понентах, в том числе в наиболее ин-формативных, в обоих случаях оказаласькрайне низкой. Это говорит о том, чтосамые информативные направления диа-грамм рассеяния для выбранных наборовклассов растительности не ортогональны.

Page 8: Исследованиевозможностейклассификации ... · ТРУДЫМФТИ.—2009.—Том1,№3 171 УДК528.85/87(15) Л.Н.Чабан1,2,Г.В.Вечерук2,Т.С.Гаврилова2

178 ТРУДЫ МФТИ. — 2009. — Том 1, № 3

Тем не менее наборы каналов, сформиро-ванные по всем пикам критерия Aj (20каналов для майского и 17 каналов длясентябрьского изображений), обеспечиливполне приемлемую точность классифи-

кации. В худшем случае она составляла93,1% для майского и 81,1% для сентябрь-ского изображений. Средняя точность погруппам эталонов составила соответствен-но 97,8% и 91,7%.

Рис. 4. Графики значений критерия Aj по 80 каналам для майского (слева) исентябрьского (справа) изображений

Рис. 5. Зависимость точности классификации (%) эталонов майского изображе-ния от числа каналов при разных стратегиях отбора. Слева — равномерныйотбор с заданным шагом. В центре — отсечение пиков критерия по заданно-му порогу (величина порога по шкале критерия на рис. 4 указана в скобках).Справа — адаптивное прореживание при разной ширине интервалов

Page 9: Исследованиевозможностейклассификации ... · ТРУДЫМФТИ.—2009.—Том1,№3 171 УДК528.85/87(15) Л.Н.Чабан1,2,Г.В.Вечерук2,Т.С.Гаврилова2

ТРУДЫ МФТИ. — 2009. — Том 1, № 3 179

Рис. 6. Зависимость точности классификации (%) эталонов сентябрьско-го изображения от числа каналов при двух стратегиях отбора. Слева —равномерный отбор с заданным шагом. Справа — адаптивное прорежи-вание при разной ширине интервалов

Для дальнейшего сокращения числаканалов было апробировано две стратегииотбора:

1) пороговое отсечение по значениямлокальных максимумов;

2) адаптивное прореживание — 1 мак-симум в пределах заданного интервала;при этом ширина интервала может регу-лироваться в зависимости от суммарноговеса попадающих в него максимумов.

На рис. 5 приведён результат по точ-ности классификации для различных стра-тегий отбора каналов на майском изобра-жении, включая равномерный отбор (про-реживание) с заданным шагом. Сравнениеметода отсечения максимумов по заданно-му порогу с равномерным прореживаниемпоказывает, что равномерное прорежива-ние до определённого уровня (в данномслучае с шагом 4) может оказаться болееэффективным. Но при дальнейшем сокра-щении числа каналов отбор по порогово-му отсечению даёт значительно лучшийрезультат. Отбор путём адаптивного про-реживания (правый график на рис. 5) ока-зался ещё более эффективным. Так, ре-зультат отбора 15 каналов лучше результа-та равномерного отбора 16 каналов, а для12 каналов результат не хуже, чем для 14каналов при пороговом отсечении. При со-кращении числа каналов до трёх разница

в точности с равномерным отбором состав-ляет уже более 10%.На сентябрьском изображении отсече-

ние по порогу оказалось не эффективнымиз-за специфики распределения пиков. По-этому отбор каналов проводился сразу пу-тём адаптивного прореживания. На рис. 6приводятся результаты по точности клас-сификации для такого отбора в сравне-нии с равномерным прореживанием кана-лов. Шаг равномерного прореживания вы-бирался таким образом, чтобы число кана-лов совпадало с соответствующим значе-нием при отборе по критерию Aj. Графи-ки показывают, что отличия в точности отравномерного отбора становятся заметныс 10 каналов, а при отборе трёх каналовточность по некоторым классам уже отли-чается в пользу отбора по критерию Aj бо-лее чем на 10%.Апробация методики на пригодных для

анализа летних наземных изображенияхрастительного покрова, а также на само-лётном сентябрьском гиперспектральномснимке 2007 года участка поймы р. Орша(с аналогичным числом каналов), дала ре-зультаты, очень близкие к приведённымвыше. Классификация по изображениямв главных компонентах во всех случаяхпоказала низкую точность. При сокраще-нии числа каналов путём отсечения наи-меньших пиков критерия Aj (также при-

Page 10: Исследованиевозможностейклассификации ... · ТРУДЫМФТИ.—2009.—Том1,№3 171 УДК528.85/87(15) Л.Н.Чабан1,2,Г.В.Вечерук2,Т.С.Гаврилова2

180 ТРУДЫ МФТИ. — 2009. — Том 1, № 3

мерно по уровню 0,2) точность классифи-кации несколько повышалась, после чегозначительное преимущество отбора по пи-кам критерия наблюдалось уже при сокра-щении числа каналов до минимального ко-личества (от 10 до 3). Необходимо отме-тить, что RGB-композиции по таким набо-рам каналов были наиболее информатив-ны для визуально-интерактивного анали-за.

V. Обсуждение результатов

Полученные результаты позволяют сде-лать следующие выводы.1. Непосредственное использование ре-

зультата преобразования гиперспектраль-ного изображения к главным компонентампри классификации типов и состояния рас-тительного покрова приводит к существен-ным потерям информации.2. Использование проекций исходных

каналов на наиболее информативные изглавных компонент в виде предложенно-го критерия Aj без разработки дополни-тельного программного обеспечения позво-ляет:1) исключить из рассмотрения наиме-

нее информативные спектральные диапа-зоны для анализируемых почвенно-расти-тельных комплексов путём отсечения ми-нимальных пиков критерия Aj ;2) отобрать наиболее репрезентатив-

ные каналы для визуального анализа и вы-бора эталонов тематических классов;3) определить минимальное количе-

ство каналов, обеспечивающих допусти-мую точность классификации по выбран-ному набору эталонов.Поскольку общее количества максиму-

мов критерия Aj во всех случаях обеспе-чивало наиболее высокую точность клас-сификации, можно предположить, что онсодержит достаточное количество инфор-мации для создания методики отбора ка-налов, по крайней мере, для определён-ного класса задач. Эта проблема, одна-ко, требует проведения дополнительныхисследований, в том числе получения каче-ственного экспериментального материала.Не исключено, что для детальной класси-фикации породного состава и фитопатоло-гий лесов может потребоваться разработ-ка более тонких методов отбора каналов,например, на основе гистограммного ана-лиза. Решение всех этих вопросов не мо-

жет быть обеспечено только стандартны-ми средствами пакетов тематической обра-ботки аэрокосмической информации и тре-бует разработки специального программ-ного обеспечения.В заключение отметим, что объеди-

нение каналов, моделирующее спектраль-ные диапазоны мультиспектральной ап-паратуры, вообще не позволило осуще-ствить классификацию выбранных этало-нов с приемлемой точностью, что говорито несомненных преимуществах высокогоспектрального разрешения для решениязадач классификации почвенно-раститель-ного покрова и его состояний.

Литература

1. Лурье И.К., Косиков А.Г. Теория ипрактика цифровой обработки изображе-ний. — М.: Научный мир, 2003.2. ERDAS Imagine 8.5. Field Guide. —

Atlanta, USA, 1999–2001.3. Jain A.K., Dubes R.C. Algorithms for

Clastering Data. — Englewood Cliffs (NJ):Prentice-Hall, 1988.4. Андреев Г.Г., Чабан Л.Н. Методи-

ка автоматизированной тематической об-работки многозональной космической ин-формации при отсутствии или недостаткеназемных данных // Исследования Землииз космоса. — 1999. — № 2. — С. 40–52.5. Чабан Л.Н. Тематическая класси-

фикация многозональных (многослойных)изображений в пакете ERDAS Imagine. Ме-тодические указания для лабораторногопрактикума. — М.: МИИГАиК, 2006.6. IMAGINE Spectral Analysis. User’s

Guide. — Leica Geosystems GIS&Mapping,LLC, Atlanta, USA, 2003.7. ENVI 3.4. User’s Guide. — Reseach

System Inc., 2000.8. Ту Дж., Гонсалес Р. Принципы рас-

познавания образов. — М.: Мир, 1978.9. Браверман Э.М., Мучник И.Б.

Структурные методы обработки эмпириче-ских данных. — М.: Наука, 1983.10. Дистанционное зондирование: ко-

личественный подход / под ред. Ф. Свей-на, Ш. Дэйвис. — М.: Недра, 1983.11. Козодеров В.В., Кондранин Т.В.

Методы оценки состояния природно-техно-генной сферы по данным аэрокосмическо-го мониторинга: учеб. пособие. — М.: МФ-ТИ, 2008.

Поступила в редакцию 27.04.2009.