93
TEKNILLINEN KORKEAKOULU Maanmittausosasto KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA ANALYSOINTI HYPERSPEKTRIKUVILTA Teknillisen korkeakoulun Maanmittausosastolla tehty diplomityö Espoo, huhtikuu 2004 tekniikan ylioppilas Juho Lumme Työn valvoja prof. Henrik Haggrén Työn ohjaaja tekn. lis. Markus Törmä

KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

TEKNILLINEN KORKEAKOULU

Maanmittausosasto

KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA

ANALYSOINTI HYPERSPEKTRIKUVILTA

Teknillisen korkeakoulun Maanmittausosastolla tehty diplomityö

Espoo, huhtikuu 2004

tekniikan ylioppilas Juho Lumme

Työn valvoja

prof. Henrik Haggrén

Työn ohjaaja

tekn. lis. Markus Törmä

Page 2: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

i

TEKNILLINEN KORKEAKOULU DIPLOMITYÖN TIIVISTELMÄ

Tekijä: Juho Lumme Työn nimi: Kasvillisuuden sekä maaperän luokittelu ja analysointi hyperspektrikuvilta Päivämäärä: 28.5.2004 Sivumäärä: 87

Osasto: Professuuri: Maanmittausosasto Fotogrammetria ja kaukokartoitus Pääaine: Kaukokartoitus

Työn valvoja: prof. Henrik Haggrén, Teknillinen korkeakoulu Työn ohjaaja: tekn. lis. Markus Törmä, Teknillinen korkeakoulu

Hyperspektrikuvan luokittelu perinteisillä tilastollisen hahmontunnistuksen menetelmillä on hidasta. Lisäksi hyperspektrikuvan korreloivien kanavien takia luokittelualgoritmien toiminta saattaa keskeytyä kokonaan. Hyperspektrikuvien analysointiin on kehitetty uusia algoritmeja, joiden soveltuvuutta maaperän sekä kasvillisuuden analysointiin tutkittiin tässä diplomityössä. Algoritmien suorituskykyä vertailtiin keskenään sekä perinteisten luokittelualgoritmien kanssa. Lisäksi tutkittiin, miten luokkien opetusalueet sekä referenssispektrit vaikuttavat luokittelutulokseen. Työssä tutkittiin AISA-spektrometrillä kuvattuja Lammin sekä Paraisten testialueita. Aineisto käsitti 17 kanavaa näkyvän valon sekä lähi-infrapunasäteilyn alueella. Aineisto luokiteltiin seuraavilla algoritmeilla: Spectral Angle Mapper, Spectral Correlation Mapper, Spectral Unmixing, Perceptron neuraaliverkko, Bayesin päätösteoria sekä minimietäisyyden menetelmä. Luokittelijoiden opetusalueina käytettiin maastossa varmistettuja alueita. Opetusalueista laskettiin hyperspektrikuville kehitetyille luokittelijoille referenssispektrit erilaisia keskiarvomittoja käyttäen. Luokittelun lisäksi tutkittiin tarkemmin eri kasvillisuusluokkien heijastusspektrejä sekä erilaisten olosuhteiden vaikutusta näihin spektreihin. Luokittelu Bayesin päätösteorian avulla antoi hyvät tulokset, mutta luokittelu oli hidasta eikä se toiminut alueilla, joissa oli valoisuuseroja. Spectral Angle Mapper sekä Spectral Correlation Mapper luokittelivat aineiston hyvin myös olosuhteissa, joissa valoisuus vaihteli. Spectral Unmixing -algoritmin ongelmana oli kunnollisten referenssispektrien löytäminen. Perceptron neuraaliverkkolla saatiin parhaimmat tulokset, mutta verkon opettaminen vei paljon aikaa. Minimietäisyyden algoritmi oli nopea, mutta tulokset eivät olleet kovinkaan hyviä. Verrattaessa kasvillisuuden heijastusspektrejä havaittiin, että lehtipuiden sekä sokerijuurikkaan heijastusspektrit sekoittuivat keskenään. Eri maalajien vaikutus kasvillisuuden heijastusspektriin oli vähäinen ja se sekoittui kasvillisuudesta heijastuneen säteilyn normaaliin vaihteluun.

Avainsanat: luokittelu, kuvaava spektrometri, hyperspektri, heijastusspektri Kieli: suomi

Page 3: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

ii

HELSINKI UNIVERSITY OF TECHNOLOGY ABSTRACT OF THE MASTER’S THESIS

Author: Juho Lumme Name of the thesis: Vegetation and soil classification and analysis from imaging spectrometer data Date: 28 May 2004 Number of pages: 87

Department: Professorship: Surveying Department Photogrammetry and Remote Sensing Major: Remote Sensing

Supervisor: Henrik Haggrén, Prof., Helsinki University of Technology Instructor: Markus Törmä, Lic.Sc.(Tech), Helsinki University of Technology

Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing time. Image channels of the data are strongly correlated with each other and it may prevent the execution of the classification. Therefore new algorithms are developed for the hyperspectral data classification. The suitability of these algorithms for ground and vegetation classification has been investigated in this work. The efficiency of the algorithms is compared to each other. Besides, the effect of different training areas of the classification is investigated. The test area located in Southern Finland was imaged by an AISA airborne imaging spectrometer using 17 visual and near infrared bands. The area included lakes, rural areas, cultivated fields and forests. Spectral Angle Mapper (SAM), Spectral Correlation Mapper (SCM), Spectral Unmixing and Perceptron neural network algorithms were used in the classification. Besides, the data were classified using conventional algorithms as Minimum Distance and Bayes' theorem classifiers that have often been used for multispectral data classification. The effects of various classification algorithms and different training areas were investigated. The reflectance spectra of different plants were examined and compared under varying illumination. Maximum Likelihood classifier led to fair results, but it required more computation time and the results deteriorated under varying illumination. SAM and SCM were faster and they led to better classification results in poor illumination. The problem with the Spectral Unmixing classification was finding suitable reference spectra from mixed pixels. Neural network led to good results as well, but the training of the network was difficult. Minimum Distance classifier was fast but the results were inferior. The reflectance spectra of deciduous trees and sugar beet was seen to mix when analysing the reflectance spectra of different plants. The effects of soil types of vegetation to reflectance were slight and they mixed with natural variation of the reflectance of the plants.

Keywords: classification, imaging spectrometry, reflectance spectrum Language: Finnish

Page 4: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

iii

Alkusanat

Tämä diplomityö on tehty Teknillisen korkeakoulun Maanmittausosaston Fotogrammetrian ja

kaukokartoituksen laboratorion Digitaalinen kuvankäsittely kaukokartoituksessa -

tutkimushankkeen yhteydessä. Hanketta on rahoittanut Maa- ja metsätalousministeriö, mistä esitän

kiitokseni kaikille veronmaksajille. Erityisesti haluan kiittää työn ohjaajaa tekn. lis. Markus

Törmää sekä työn valvojaa TKK:n Fotogrammetrian ja kaukokartoituksen laboratorion johtajaa

prof. Henrik Haggrénia.

Tahdon kiittää myös työtovereitani sekä kaikkia niitä henkilöitä, jotka ovat myötävaikuttaneet

tämän työn syntyyn. Lopuksi esitän kiitokseni Aleksi pojalleni, joka on motivoinut opiskelujani

sekä tarjonnut aamuisin tehokasta herätyspalvelua.

Juho Lumme

Espoo, huhtikuu 2004

Page 5: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

iv

Sisällysluettelo

1. JOHDANTO.................................................................................................................... 1

2. SPEKTROSKOPIA........................................................................................................ 4

2.1. SPEKTROMETRIT ......................................................................................................... 4 2.2. KUVAAVAT SPEKTROMETRIT ...................................................................................... 5 2.3. AISA-SPEKTROMETRI ................................................................................................. 7

2.3.1. AISA:n rakenne................................................................................................... 8 2.3.2. AISA:n toiminta .................................................................................................. 8

2.4. HEIJASTUSSPEKTRI.................................................................................................... 10 2.5. MATERIAALIEN HEIJASTUSOMINAISUUDET ............................................................... 11 2.6. HYPERSPEKTRIKUVA................................................................................................. 13 2.7. SPEKTRIKIRJASTO ..................................................................................................... 14

3. KUVAAVAN SPEKTROMETRIN TUOTTAMAN DATAN KORJAUKSET ..... 16

3.1. GEOMETRINEN KORJAUS ........................................................................................... 16 3.2. RADIOMETRINEN KORJAUS........................................................................................ 17 3.3. ILMAKEHÄKORJAUS .................................................................................................. 18

3.3.1. Ilmakehän sironta ............................................................................................. 19 3.3.2. Ilmakehän absorptio ......................................................................................... 20

3.4. HEIJASTUSSPEKTRIN NORMALISOINTI ....................................................................... 21

4. PIIRTEIDEN VALINTA JA IRROITUS .................................................................. 23

4.1. FYSIKAALISIA PIIRTEIDEN IRROITUSMENETELMIÄ..................................................... 24 4.2. PIIRTEIDEN VALINTA................................................................................................. 25

4.2.1. Branch and bound............................................................................................. 25 4.2.2. Parhaat piirteet................................................................................................. 27 4.2.3. Sequential Forward Selection (SFS) ................................................................ 27 4.2.4. Sequential Backward Selection (SBS) .............................................................. 28 4.2.5. Lisää-l ota pois-r .............................................................................................. 29

4.3. PIIRTEIDEN IRROITUS ................................................................................................ 29 4.3.1. Pääkomponenttimuunnos.................................................................................. 30 4.3.2. n-ulotteiset todennäköisyystiheysfunktiot piirteiden irroituksessa ................... 32

5. LUOKITTELUALGORITMIT................................................................................... 35

5.1. HYPERSPEKTRIDATAN LUOKITTELUALGORITMIT ...................................................... 35 5.1.1. Spectral Angle Mapper (SAM).......................................................................... 35 5.1.2. Spectral Correlation Mapper (SCM)................................................................ 37 5.1.3. Spectral Unmixing ............................................................................................ 38 5.1.4. Spectral Feature Fitting (SFF) ......................................................................... 40 5.1.5. Perceptron-neuroverkko ................................................................................... 41

5.2. PERINTEISIÄ LUOKITTELIJOITA.................................................................................. 43 5.2.1. Bayesin päätösteoria ........................................................................................ 44 5.2.2. Minimietäisyyden luokittelija............................................................................ 45

6. TYÖSSÄ KÄYTETTY AISA-DATA SEKÄ MAASTOTYÖT................................ 46

Page 6: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

v

6.1. AISA-DATA .............................................................................................................. 46 6.2. AISA-DATAN ESIKÄSITTELY..................................................................................... 48 6.3. MAASTOTYÖT ........................................................................................................... 48

7. LUOKITTELU ............................................................................................................. 50

7.1. OPETUSALUEIDEN VALINTA ...................................................................................... 50 7.2. HEIJASTUSSPEKTRIEN ANALYSOINTI ......................................................................... 51

7.2.1. Kasvillisuusluokkien erottumisen analysointia luokkien välisten spektrikulmien avulla .......................................................................................................................... 51 7.2.2. Kuusen heijastusspektrin analysointia ............................................................. 57

7.3. REFERENSSISPEKTRIT................................................................................................ 59 7.4. ERI TAVOIN MUODOSTETTUJEN REFERENSSISPEKTRIEN VERTAILU............................ 60 7.5. LUOKITTELUALGORITMIEN SUORITTAMINEN ............................................................ 63

7.5.1. Spectral Angle Mapper sekä Spectral Correlation Mapper ............................. 64 7.5.2. Spectral Unmixing ............................................................................................ 66 7.5.3. Perceptron-neuroverkko ................................................................................... 68 7.5.4. Minimietäisyyden sekä suurimman uskottavuuden menetelmät ....................... 68

7.6. LUOKITTELUTULOKSET JA -KUVAT ........................................................................... 70 7.6.1. Spectral Angle Mapper sekä Spectral Correlation Mapper ............................. 72 7.6.2. Perceptron-neuroverkko sekä minimietäisyyden menetelmä............................ 74 7.6.3. Suurimman uskottavuuden menetelmä ............................................................. 75 7.6.4. Valoisuuserojen vaikutus luokitteluun .............................................................. 77 7.6.5. Luokittelu Paraisten alueen referenssispektreillä ............................................ 79

8. YHTEENVETO ............................................................................................................ 81

LÄHDELUETTELO ........................................................................................................ 83

Page 7: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

1

1. Johdanto

Hyperspektrikuvaus on yksi eniten kasvavimmista kaukokartoituksen sovelluksista tällä hetkellä.

Hyperspektrisovellusten historia ulottuu 80-luvun lopun tienoille. Tämän lyhyen historian ajan

hyperspektrikuvaus on kehittynyt varsin nopeasti. Vain muutamia vuosia sitten ei käytössä ollut

helppokäyttöisiä kaupallisia ohjelmia hyperspektrikuvien analysointiin. Silloin hyperspektrikuvien

analysointi vaati paljon työtä sekä erikoisalan ammattitaitoa. Monikanavakuville kehitettyjä

algoritmeja käytettiin myös paljon hyperspektrikuvien käsittelyssä sekä hyvällä että huonolla

menestyksellä. Nykyään kaukokartoitusohjelmat sisältävät erilaisia hyperspektridatan

analysointialgoritmeja, joita kehitellään lisää jatkuvasti.

Kuvaavien hyperspektri-instrumenttien kanavamäärää on onnistuttu kasvattamaan useisiin satoihin

hyvin kapeisiin kaistoihin huonontamatta liikaa laitteen spatiaalista erotuskykyä. Kuvaavien

spektrometrien myötä käytännön kaukokartoitus on löytänyt läheisen tieteenalan laboratoriossa

suoritettavista spektroskooppimittauksista [Tsai & Philpot 1998]. Materiaaleille laboratorio-oloissa

tehtyjä tarkkoja mittauksia voidaan nykyään käyttää hyväksi kaukokartoituksessa [Kokaly et al.

2002]. Tällä hetkellä useimmat hyperspektrikuvauksen käytännön sovellukset koskevat

lentokonekäyttöisiä spektrometrejä. Satelliitteihin on asennettu hyperspektrisensoreita, joilla on

saavutettu kymmenien metrien spatiaalinen erotuskyky kanavien lukumäärän ollessa joitakin

kymmeniä. Tulevaisuudessa myös kaukokartoitussatelliitteihin asennettujen kuvaavien

spektrometrien asema käytännön sovelluksissa tulee todennäköisesti kasvamaan. Tietokoneiden

laskentatehon, tiedonsiirtonopeuden sekä -tallennuskapasiteetin parantuminen ovat myös osaltaan

auttaneet suurten hyperspektrikuvien analysoinnissa.

Hyperspektrikuvien luokittelu perinteisillä tilastollisen hahmontunnistuksen menetelmillä voi olla

ongelmallista. Näiden algoritmien suoritusajat kasvavat usein eksponentiaalisesti verrattuna

kanavien lukumäärään. Algoritmit voivat muuttua kompleksisiksi tai niiden toiminta saattaa jopa

keskeytyä kokonaan kanavien suuren määrän sekä lineaarisesti riippuvien piirteiden takia. Vaikka

uudet menetelmät hallitsevat paremmin moniulotteisen datan käsittelyn, on piirteiden irroitus

edelleenkin tärkeä vaihe luokittelussa. Hyperspektridatan piirreavaruuden pienentäminen

matalaulotteisemmaksi säilyttäen piirteiden luonteet onkin yksi hyperspektridatan analysoinnin

ajankohtaisimmista ongelmista.

Page 8: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

2

Hyperspektrikuvien luokittelualgoritmien toiminta perustuu usein kohteen koko ominaisspektrin

käyttöön eikä piirteiden irroitusta tarvitse yleensä tehdä. Näin heijastusspektrissä olevat

materiaalin ominaiset piirteet voidaan havaita tarkemmin. Tämä voi parantaa erilaisten

mineraalien, kasvilajien sekä ihmisen tekemien kohteiden identifiointia. Uudet algoritmit

soveltuvat paremmin hyperspektrikuvien luokitteluun. Ne ovat nopeampia ja lisäksi ne tuovat

uusia menetelmiä ja mahdollisuuksia luokittelun ongelmiin. Esimerkiksi Spectral Angle Mapper

luokittelee kohteet välittämättä kuvan tai kuvamosaiikin eri osien välisistä kirkkauseroista, joita

esiintyy usein kaukokartoituksessa esimerkiksi pilvien ja varjojen takia. Toisaalta Spectral

Unmixing -algoritmi pystyy erottamaan yksittäiseen pikseliin sekoittuneet useamman luokan

spektrit toisistaan.

Suomessa hyperspektrikuvausta on käytetty eri tahojen toimesta monipuolisissa tutkimuksissa.

Geologian tutkimuskeskuksessa on tutkittu hyperspektrikuvausta kaivosalueiden ympäristön ja

maaperän tulkinnassa [Arkimaa et al. 2002]. Metsäntutkimuslaitoksen tutkijat ovat olleet mukana

kehittämässä AISA-spektrometriä. Heillä on kokemusta AISA:n kalibroinnista sekä radiometrisistä

ja geometrisistä korjauksista. Lisäksi instrumenttia on käytetty suomen metsien inventoinnissa

sekä erilaisten kasvitautien havainnoinnissa [Mäkisara & Tomppo 1996]. Suomen

ympäristökeskuksessa on hyperspektrikuvilta tutkittu esimerkiksi vesistöjen laatua [Kallio et al.

2001] sekä ilmakehäkorjausta. Teknillisen korkeakoulun avaruustekniikan laboratoriossa AISA-

spektrometrin havaintoja on käytetty esimerkiksi lumipeitteen sekä Suomenlahden öljypäästöjen

tutkimiseen. Yhdysvalloissa tehdyissä hyperspektritutkimuksissa on useimmiten käytetty NASA:n

kehittämän AVIRIS-spektrometrin havaintoja.

Tässä diplomityössä on tutkittu AISA (Airborne Imaging Spectrometer for Applications) -

spektrometrin tuottamaa dataa, joka on tallennettu 17 kanavalle näkyvän valon ja lähi-

infrapunasäteilyn aallonpituuksille. Analysoinnissa on käytetty seuraavia PCI:n Geomatica-

ohjelmiston algoritmeja: Spectral Angle Mapper, Spectral Unmixing, Perceptron-neuroverkko,

minimietäisyyden menetelmä ja suurimman uskottavuuden luokittelija. Lisäksi erilaisten kohteiden

heijastusspektrejä on analysoitu sekä laskennallisesti että visuaalisesti tulostamalla

heijastusspektrejä xy-koordinaatistoon.

Työn tavoitteena oli tutkia AISA-kuvan soveltuvuutta maaperän ja kasvillisuuden luokitteluun.

Lisäksi haluttiin tutkia materiaalien identifiointia heijastusspektrien avulla sekä heijastusspektrien

Page 9: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

3

vertailua. Uusia hyperspektrikuville soveltuvia algoritmeja haluttiin testata ja vertailla niitä

tavallisten luokittelualgoritmien kanssa. Lisäksi tavoitteena oli etsiä parempia metodeita

referenssispektrien keräämiseen ja editointiin, sillä niiden vaikutus oli luonnollisesti suuri kuvien

luokittelussa.

Diplomityön toisessa kappaleessa esitellään spektrometrit ja niiden tuottamat hyperspektrikuvat

sekä heijastusspektrit ja spektrikirjastot. Lisäksi tarkastellaan lähemmin AISA-instrumentin

rakennetta ja toimintaa. Kolmas kappale käsittelee erilaisia korjauksia, joita voidaan käyttää

kuvaavan spektrometrin tuottaman datan laadun parantamiseksi. Neljännessä kappaleessa

pohditaan hyperspektridatalle tehtävää piirteiden valintaa ja irroitusta. Viides kappale esittelee

työssä käytetyt luokittelualgoritmit ja kuudennessa kappaleessa esitellään tässä työssä käytetty

AISA-datan sekä kerrotaan miten Lammin alueen maastotyöt tehtiin. Seitsemännessä kappaleessa

analysoidaan kasvillisuusluokkien heijastusspektrejä ja tutkitaan eri luokkien välisiä

erottuvuusmittoja. Lisäksi pohditaan opetusalueiden ja referenssispektrien vaikutusta luokitteluun,

luokitellaan data eri algoritmeilla ja vertaillaan luokittelutuloksia.

Page 10: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

4

2. Spektroskopia

Erilaisia spektrometrejä on käytetty paljon esimerkiksi avaruuden kaukokartoituksessa. Verraten

yksinkertaisen rakenteen omaavilla spektrometreillä on kerätty tietoa esimerkiksi auringon

rakenteesta tai avaruuden kaasuista [Bosche 1979]. Tutkittavat kohteet ovat olleet pistemäisiä tai

homogeenisia valonlähteitä, joten niiden spatiaalista vaihtelua ei ole tarvinnut ottaa huomioon.

Maanpinnan kaukokartoituksessa kuvausalueesta halutaan erottaa kohteet toisistaan, joten

spatiaalisen erotuskyvyn on oltava riittävän hyvä. Tekniikan kehittyminen on mahdollistanut

kuvaavien spektrometrien valmistamisen, joissa yhdistyy spektrometrin sekä perinteisen kuvaavan

keilaimen hyvät puolet. Kuvaavilla spektrometreillä voidaan saavuttaa tarkempia analyysejä sekä

ne mahdollistavat kokonaan uusien menetelmien käytön kaukokartoituksessa.

2.1. Spektrometrit

Spektrometrien historia ulottuu aina Isaac Newtonin (1642-1727) aikaan, jolloin hän käytti lasista

tehtyä prismaa erottamaan näkyvästä valosta spektrin värit. Myöhemmin spektristä, joka saatiin

ohjaamalla valo kapean raon läpi, havaittiin tummia viivoja. Joseph Fraunhofer (1787-1826)

kehitti diffraktiohilan ja tutki auringon sekä muiden tähtien spektreistä erottuvia tunnusomaisia

viivoja. Myöhemmin havaittiin, että tummat viivat eli absorptiospektrit syntyvät valon kulkiessa

matalalämpöisten kaasujen läpi. Vaaleat viivat eli emissiospektrit syntyvät vastaavasti kuumien

kaasujen emittoidessa säteilyä. Esimerkiksi auringosta saapuneesta säteilystä voidaan havaita

absorptiospektrejä sekä emissiospektrejä. Absorptiospektrit ovat syntyneet säteilyn vaikuttaessa

maan ilmakehän ja emissiospektrit auringon kaasukehän kanssa. Niels Bohr (1885-1962) keksi,

että eri kaasujen aiheuttamat spektrien tunnusomaiset viivat johtuivat kaasujen atomirakenteesta.

Tätä tietoa käytetään edelleen hyväksi mm. tähtien rakenteiden ja muiden avaruuden materiaalien

kaukokartoituksessa sekä laboratorioissa erilaisten materiaalien identifioinnissa [Campbell 1996].

Spektrometri eli spektroskooppi on laite, joka hajottaa instrumenttiin tulevan säteilyn spektriksi.

Spektrometrin toiminta perustuu prismaan, hilaan tai niiden yhdistelmään. Säteilyn kohdatessa

prisman, joka on optisesti ilmaa tiheämpää ainetta, säteilyn kulkusuunta muuttuu kuvan 2.1

esittämällä tavalla. Lyhimmät aallonpituudet taittuvat eniten, kun taas pidemmät aallonpituudet

taittuvat vähemmän. Hilan toiminta perustuu valon interferenssiin. Hyvin kapeiden aukkojen läpi

Page 11: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

5

kulkenut säteily taittuu. Hilassa säteily taittuu siten, että pisimmät aallonpituudet taittuvat eniten ja

lyhimmät vähiten [Ohanian 1989].

Kuva 2.1: Prisma taittaa näkyvän valon spektriksi.

Prisman tai hilan tuottama jatkuva spektri ohjataan detektoreille tai perinteisissä instrumenteissa

filmille. Useat sadat detektorit havaitsevat kohdalleen osuneen kapean spektrinosan ja määrittävät

sen kirkkausarvon. Kohteen heijastusspektri saadaan peräkkäisten detektorien havaitsemista

kirkkausarvoista. Spektrometri vaatii tavallista kameraa pidemmän integrointiajan, sillä yksi

detektori havaitsee vain pienen osan tulevan säteilyn intensiteetistä. Lyhyellä integrointiajalla

detektoreille ei saada tarpeeksi säteilyä, joka pystyttäisiin rekisteröimään.

2.2. Kuvaavat spektrometrit

Kuvaavat spektrometrit tai hyperspektri-ilmaisimet ovat yleensä passiivisia ja havaitsevat

kohteesta heijastunutta tai emittoitunutta säteilyä näkyvän valon sekä infrapunasäteilyn

aallonpituuksilla. Nämä instrumentit kuvaavat kohdetta usein sadoilla eri kanavilla muodostaen

kohteesta kolmiulotteisen tietojoukon. Tavallisen kaksiulotteisen kuvan lisäksi hyperspektri-

instrumentti tuottaa kuvalle kolmannen ulottuvuuden, jossa säteilyn spektri on tallennettuna eri

kanaville. Näin instrumentin kuvaaman alueen jokainen pikseli sisältää jatkuvan heijastusspektrin.

Pelkästään suuri kanavien lukumäärä ei automaattisesti tarkoita että instrumentti olisi kuvaava

spektrometri. Hyperspektrisensoreissa kanavat ovat lisäksi hyvin kapeita, usein alle 10 nm leveitä,

ja sijaitsevat tasaisesti jakautuneena instrumentin havaitsemalla aallonpituusalueella [Lillesand &

Kiefer 2000].

Kaikille kuvaaville spektrometreille on yhteistä erittäin hyvä spektraalinen erotuskyky. Toisaalta

myös spatiaalisen erotuskyvyn halutaan nykyisin olevan kohtuullisen hyvä. Kuten edellä todettiin,

säteilyn jakaminen satoihin eri aallonpituusosiin prismassa tai hilassa heikentää vastaavasti yhdelle

Page 12: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

6

detektorille saapuvaa säteilyn intensiteettiä. Siksi tarvitaan pitkähkö integrointiaika. Jos

spatiaalinenkin erotuskyky halutaan hyväksi, niin yhdelle detektorille tuleva säteilyn intensiteetti

pienenee edelleen, joten integrointiaikaa joudutaan taas kasvattamaan. Lentokoneiden sekä

kaukokartoitussatelliittien on kuitenkin liikuttava tiettyä nopeutta maahan nähden, jolloin

integrointiaikaa ei enää pystytä pidentämään lentämällä hitaammin. Pushbroom-tyyppisten

rivikeilaimien tulo markkinoille sekä CCD-kennojen nopea kehitys ovat kuitenkin mahdollistaneet

sen, mitä ennen pidettiin mahdottomana; hyvä spektraalinen sekä spatiaalinen erotuskyky samassa

kaukokartoitusinstrumentissa.

Kuvaavia spektrometrejä on asennettu lentokoneisiin sekä nykyään myös satelliitteihin.

Käytännössä instrumenttien toimintaperiaate sekä rakenne on samanlainen, mutta satelliitti-

instrumenteissa ei päästä yhtä hyvään spatiaaliseen ja spektraaliseen erotuskykyyn.

Satelliittikäyttöisten hyperspektri-instrumenttien spatiaalinen erotuskyky on parhaimmillaan

joitain kymmeniä metrejä ja kanavien lukumäärä on yleensä joitain kymmeniä. Lentokoneeseen

kiinnitetyllä spektrometrillä voidaan havaita useita satoja eri kanavia spatiaalisen erotuskyvyn

ollessa alle metrin luokkaa. Kuvaavien spektrometrien kehitys on ollut nopeaa ja varsinkin

satelliitti-instrumenttien spatiaalinen sekä spektraalinen erotuskyky tulevat vielä parantumaan

[Meer & Jong 2001].

Sekä satelliitilla, että lentokoneella on omat hyvät ja huonot puolensa hyperspektri-instrumentin

kuvausalustana. Kaukokartoitusprojektin luonne määrää kannattaako käyttää lentokonetta vai

satelliittia. Kaukokartoitussatelliitit sijaitsevat yli 100 kilometrin korkeudella ja niistä

havainnoidaan maastoa pienellä avaruuskulmalla. Niiden näkökenttä on pienempi kuin

lentokoneinstrumenteilla. Lentokonekäyttöisen instrumentin näkökenttä on erilainen kuvan eri

osissa, mikä johtuu siitä, että instrumentti havaitsee maastoa suurella avaruuskulmalla. Satelliitin

rata on hyvin sileä ja se eroaa suuresti lentokoneesta, jonka korkeus- sekä kallistusvaihtelut

aiheuttavat suuria geometrisia vääristymiä kuvalle. Näiden vääristymien korjaamiseksi

lentokoneen liikettä rekisteröidään GPS/INS-instrumentin sijainti- sekä inertiahavainnoilla.

Lentokonekäyttöisissä instrumenteissa signaali digitoidaan ja kirjoitetaan muistiin. Satelliitista

havaittu signaali joudutaan vielä siirtämään maahan. Tiedonsiirtojärjestelmä käsittää yleensä

geostationäärisellä radalla olevan tietoliikennesatelliitin, joka välittää signaalin satelliitista

maahan. Satelliittien suurempi näkökenttä ei aina johda yksinkertaiseen ja nopeaan projektiin.

Eräässä tutkimuksessa havaittiin, että Lontoon kartoittaminen Ikonos-kuvilla vaatisi noin 300

kuvaa. Ottaen huomioon Ikonos-satelliitin radan sekä Lontoon keskimääräisen pilvettömien

Page 13: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

7

päivien määrän vuodessa tämä kartoitusprosessi veisi aikaa kokonaisen vuoden. Vastaavasti

lentokoneesta nämä kuvat voitaisiin ottaa yhdessä päivässä [Meer & Jong 2001].

Vaikka laitevalmistajat ilmoittavat hyperspektri-instrumenttiensa kykenevän tallentamaan satoja

spektrikanavia, niin käytännön mittauksissa kanavien lukumäärä jää huomattavasti pienemmäksi.

Instrumenttien monipuolisuus johtuu niiden ohjelmoitavuudesta. Kanavien spektraaliset

ominaisuudet, kuten havaittava aallonpituus ja aallonpituusalueen leveys voidaan ohjelmoida

jokaiselle kanavalle erikseen. Ohjelmoitavuus merkitsee myös sitä, että tallennettavat kanavat

voidaan valita eri kaukokartoitusprojekteille yksilöllisesti siten, että ainoastaan parhaimman

tuloksen antamat kanavat tallennetaan. Toisaalta kanavien leveyden, sijainnin ja lukumäärän

valinta on vaikeaa. Etukäteen ei aina tiedetä, mitä kaikkea datasta halutaan analysoida ja millä

aallonpituusalueilla piirteet eroavat toisistaan parhaiten. Lisäksi näin valittujen yksilöllisten

kuvien vertailu eri projektien välillä voi olla yhtä vaikeaa, kuin vertailu kokonaan eri

instrumenttien tuottamilla kuvilla.

2.3. AISA-spektrometri

AISA on kaupalliseen käyttöön suunniteltu lentokoneeseen asennettava pushbroom-tyyppinen

kuvaava spektrometri. AISA:n suunnitteluprojekti aloitettiin virallisesti vuonna 1992, vaikka

alustavia töitä oli tehty jo vuotta aikaisemmin. Laitteisto suunniteltiin VTT Automaatiolla.

Optiikka sekä elektroniikka suunniteltiin ja rakennettiin sen sijaan VTT Optoelektronisella

laboratoriolla. Ensimmäinen koelento tehtiin helmikuussa 1993 ja ensimmäinen kaupallinen versio

saatiin valmiiksi 1995. Aluksi instrumenttia markkinoitiin Karelsilva Oy:n toimesta. Nykyisin

instrumentin kehityksestä ja markkinoinnista vastaa Oululainen Spectral Imaging Ltd. Taulukon

2.1 mukaan AISA:sta on saatavilla kolme eri versiota: AISA+, AISA Eagle ja AISA Hawk.

AISA+ ja AISA Eagle toimivat näkyvän valon sekä lähi-infrapunasäteilyn aallonpituuksilla. Sen

sijaan AISA Hawk kerää kohteesta tietoa hieman pidemmillä aallonpituuksilla. Tässä työssä

käytetty AISA-data on kuvattu alkuperäisellä AISA-instrumentilla ja sen ominaisuudet poikkeavat

nykyisistä instrumenteista.

Page 14: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

8

2.3.1. AISA:n rakenne

AISA:n rakenne voidaan jakaa hyperspektri-ilmaisimeen, GPS/INS-laitteesen sekä PC-yksikköön,

joka ohjaa hyperspektri-ilmaisinta ja tallentaa sen havaintoja. Lisäksi järjestelmään kuuluu

CaliGeo-ohjelma sekä FODIS (fiberoptic downwelling irradiance sensor) -ilmaisin. CaliGeo:n

avulla havaittu data voidaan jälkikäteen korjata. Sen avulla voidaan AISA-kuvista muodostaa

myös kuvamosaiikkeja. FODIS mittaa auringon irradianssia ilmakehässä ja sen tietoja käytetään

hyväksi AISA:n radiometrisessä korjauksessa. Hyperspektri-ilmaisin sisältää optiikan,

spektrografin sekä CCD-tai MCT-ilmaisimen. Laitteesta ja objektiivista riippuen AISA:lla

saavutetaan noin 1 metrin spatiaalinen erotuskyky kun lennetään tuhannen metrin korkeudesta.

Spatiaalisen erotuskyvyn lentosuuntaiseen komponenttiin vaikuttaa lentokoneen nopeus sekä

ilmaisimen integrointiaika. Integrointiaikaa voidaan säätää, jolloin erotuskyvyn lentosuuntainen

komponentti saadaan vastaamaan optiikan sekä ilmaisinrivin määräämää lentosuuntaa vastaan

olevaa erotuskyvyn komponenttia.

Taulukko 2.1: AISA-instrumenttien parametrit. Ensimmäinen sarake kuvaa instrumenttia, jonka

dataa on käytetty tässä työssä.

AISA AISA+ AISA Eagle AISA Hawk Kanavien lukumäärä 286 244 244 240 Havaittava aallonpituusalue 450-900 nm 400-970 nm 400-970 nm 1000-2400 nm Kuvalinjan pikselien lkm 384 512 1000 320 Kanavien kaistanleveys 1.6 nm 2.9 nm 2.9 nm 8 nm Objektiivi 24 mm 17/23 mm 17/23 mm 30 mm FOV 21° 39.7°/29.9° 39.7/29.9° 17.8° IFOV 0.055° 0.078°/0.058° 0.039°/0.029° 0.054° Output 12 bit 12 bit 12 bit 14 bit Instrumentin paino 4 kg 7 kg 6.5 kg 15.5 kg

2.3.2. AISA:n toiminta

AISA-instrumentissa säteily ohjataan optiikan jälkeen 30 µm leveän raon läpi, joka tuottaa

säteilystä kapean keilan. Seuraavaksi keila kulkeutuu spektrografiin, joka muodostuu kahdesta

prismasta sekä niiden välissä olevasta hilasta. Spektrografissa säteily taittuu aallonpituutensa

mukaan ja samalla kapea keila leviää spektriksi, joka ohjataan CCD-ilmaisimeen. CCD-ilmaisin

muodostuu matriisista, jonka lukuisat elementit rekisteröivät niille saapuneen säteilyn. Oletetaan,

Page 15: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

9

että ilmaisimen sarakkeet ovat yhdensuuntaisia lentosuunnan kanssa ja rivit kohtisuorassa

lentosuunnasta. Tällöin ilmaisimen sarakkeet edustavat kukin vastaavaa pistettä ilmaisimen

havaitsemasta keilasta. Näin yksi sarake sisältää tietoa samasta maaston kohteesta eri

aallonpituuksilla mitattuna. Käytännössä ilmaisimen sarakkeet vastaavat siis heijastusspektrejä.

Ilmaisimen sarakkeilla sijaitsevien säteilyä rekisteröivien elementtien lukumäärä määrää siten

instrumentin kanavien lukumäärän. Kanavien lukumäärän lisäksi spektraaliseen erotuskykyyn

vaikuttaa myös kanavien leveydet. Ilmaisimen rivit edustavat sen sijaan spektrografissa hajotetun

säteilyn aallonpituutta. Kullakin rivillä aallonpituus on vakio, mutta sijainti ilmaisimen

havaitsemassa keilassa muuttuu. Riveillä sijaitsevien elementtien lukumäärä määrää siten

instrumentin havaitseman kuvan pikselien lukumäärän keilauslinjan leveyssuunnassa, eli

spatiaalisten pikselien lukumäärän. [Mäkisara et al. 1993]

Ilmaisimen tuottama 12 (AISA+ ja Eagle) tai 14 (Hawk) bittinen digitaalinen data tallennetaan

AISA:n PC-yksikköön, jonka kovalevyt voidaan vaihtaa uusiin kesken kuvausprojektin. GPS/INS-

ilmaisimen rekisteröimät lentokoneen kallistus- ja sijaintihavainnot tallennetaan myös PC-

yksikköön. Näiden havaintojen avulla AISA-datasta voidaan poistaa geometriset vääristymät, jotka

johtuvat lentokoneen satunnaisista liikkeistä.

Kuva 2.2: AISA-instrumentti sekä GPS/INS-yksikkö [Specim 2003].

AISA on ohjelmoitava, joten käyttäjä voi määrätä kuinka paljon kanavia halutaan käyttää ja mitä

aallonpituusaluetta kukin kanava edustaa. Näin AISA:lla havaittujen kanavien lukumäärää voidaan

vähentää kun tiedetään, mitkä aallonpituusalueet ovat mittausprojektin kannalta merkityksettömiä.

Vähentämällä kanavien lukumäärää voidaan instrumentin kuvaaman keilauslinjan integraatioaikaa

Page 16: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

10

pienentää, mikä on tärkeää kun kuvataan nopeasti ja matalalla lentävästä koneesta. AISA+ toimii

kahdella eri käyttömoodilla. Moodi A:ssa valitaan 244-61 kappaletta jatkuvia ja kapeita

spektrikanavia. Moodi B:ssä valitaan enintään 61 kappaletta kanavaa, tietyiltä aallonpituusalueilta.

Nämä kanavat voivat olla leveämpiä eivätkä ne sijaitse peräkkäin jatkuvana sarjana vaan niiden

välissä voi olla aallonpituusalueita, joita ei tallenneta. [Specim 2003]

2.4. Heijastusspektri

Eri materiaalit heijastavat ja absorboivat eri tavalla sähkömagneettisen säteilyn aallonpituuksia.

Heijastuksen sekä absorption suuruudet vaihtelevat eri aallonpituuksilla. Materiaalin

heijastusspektri saadaan piirtämällä materiaalin heijastaman säteilyn voimakkuus aallonpituuden

funktiona. Kun hyperspektri-instrumentilla kuvataan materiaalia sadoilla kapeilla kanavalla,

saadaan kohteen heijastusspektri kuvattua jatkuvana käyränä, joka myötäilee tarkasti kohteen

ominaisia heijastuksen sekä absorption suhteita eri aallonpituuksilla, kuten kuvissa 2.3a ja 2.3b

nähdään. Väliaine, eli yleensä ilmakehä, vaikuttaa kuitenkin sirottamalla ja absorboimalla säteilyä,

joten kohteen ominaisspektri ei ole sama kuin instrumentin havaitsema spektri. Tämä voidaan

kuitenkin huomioida ilmakehämallin avulla.

Kuvat 2.3a ja 2.3b: Kuva 2.3a esittää ruohon heijastusspektriä 0-14 µm alueella. Kuvassa 2.3b on

esitetty tarkemmin saman materiaalin heijastusspektri näkyvän valon sekä lähi-infrapunasäteilyn

alueella. Heijastusarvot on saatu ASTER-spektrikirjastosta.

Page 17: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

11

Kuva 2.4: Sähkömagneettisen spektrin näkyvän valon sekä infrapunasäteilyn alueet. Jaottelu

infrapunasäteilyn alueiden väleillä on joustava ja vaihtelee jonkin verran eri piireissä.

Instrumenttien mittaama kohteesta heijastunut säteily on peräisin auringosta. Auringon spektri on

jatkuva eli siinä on kaikkia aallonpituuksia. Maan ilmakehä absorboi voimakkaasti auringon

ultraviolettisäteilyä sekä lyhyempiä aallonpituuksia. Käytännössä kuvaavien spektrometrien

havaitsevat lyhimmät aallonpituudet ovat siten noin 0.3 µm. Auringon säteilyn maksimi sijaitsee

0.5-0.55 µm kohdalla ja sen jälkeen säteilyn intensiteetti alkaa laskea aallonpituuden kasvaessa.

Tietyn materiaalin heijastusspektri on usein yksilöllinen, joten kyseinen materiaali voidaankin

tunnistaa ja erottaa muista materiaaleista heijastusspektrinsä avulla. Luokittelualgoritmit Spectral

Angle Mapper, Spectral Correlation Mapper ja Spectral Feature Fitting perustuvat suoraan

heijastusspektrien vertailuun. Luonnossa eri materiaalit ovat usein sekoittuneet keskenään, jolloin

myös niiden heijastusspektri sisältää sekalaisen yhdistelmän eri materiaalien ominaisista

heijastuksista sekä absorptioista. Jos sekoittuneiden materiaalien heijastusspektrit tunnetaan, niin

materiaalien suhteelliset määrät voidaan laskea sekoittuneesta heijastusspektristä. Spectral

Unmixing -algoritmi on kehitetty etsimään eri materiaalit ja niiden määrät sekoittuneesta

heijastusspektristä.

2.5. Materiaalien heijastusominaisuudet

Säteilyn osuessa materiaaliin fotonit, joilla on sopiva aallonpituus, voivat virittää materiaalin

atomeja. Tällöin atomi absorboi fotonin ja samalla atomin energiatila muuttuu korkeammaksi.

Atomin energiatila palautuu useimmiten takaisin ja samalla atomi luovuttaa fotonin (emissio)

uudella aallonpituudella. Erilaiset atomit virittyvät kukin tietyllä aallonpituudella ja vapauttavat

tietyn aallonpituista ominaista säteilyä, jota havaitsemalla kyseiset atomit voidaan tunnistaa.

Page 18: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

12

Käytännössä atomit ovat sekoittuneet havaittavassa materiaalissa ja niiden muodostamasta

spektristä ei voida erottaa yksittäisiä komponentteja.

Mineraalien heijastusominaisuudet johtuvat niiden kemiallisesta koostumuksesta sekä

kiderakenteesta. Näkyvän valon sekä lähi-infrapunasäteilyn alueella mineraalien

heijastusominaisuuksiin vaikuttavat eniten mineraalissa olevat vapaat metalli-ionit. Lähi-

infrapunasäteilyn pidemmillä aallonpituuksilla mineraalien vesi-, hydroksidi-, karbonaatti- sekä

sulfaattipitoisuudet aiheuttavat mineraaleille niiden ominaiset absorptiopiirteet. [Meer & Jong

2001]

Kasvillisuuden heijastusominaisuutta tutkittaessa on pääosin keskitytty kasvin vihreiden lehtien

ominaisuuksiin. Näkyvän valon alueella kasvin fotosynteettiset pigmentit aiheuttavat

absorptiopiirteitä. Fotosynteettisistä pigmenteistä tärkeimpiä ovat klorofylli a ja b. Ne absorpoivat

auringon säteilyä 0.66 ja 0.68 µm alueilla. Red edge on heijastusspektrissä noin 0.7 µm kohdalla

oleva absorptioreuna, jonka jälkeen kasvillisuuden heijastus kasvaa voimakkaasti, kuten kuvassa

2.5 näkyy selvästi. Klorofyllipitoisuuksien muutokset näkyvät spektrissä red edgen siirtymisenä.

Jos klorofyllin määrä vähenee, niin red edge siirtyy vasemmalle, lyhyempien aallonpituuksien

suuntaan. Klorofyllin lisääminen siirtää red edgeä kohti spektrin infrapunasäteilyn osaa. Lähi-

infrapunasäteilyn alueella kasvillisuuden spektriin vaikuttaa eniten kasvien sisältämä vesi sekä

orgaaniset yhdisteet kuten selluloosa, ligniini, tärkkelys sekä valkuaisaine. [Meer & Jong 2001]

Kuva 2.5: Erilaisten materiaalien heijastusspektrit näkyvän valon sekä lähi-infrapunasäteilyn

alueella. Eri materiaalien heijastusarvot on saatu ASTER-spektrikirjastosta.

Page 19: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

13

Maaperän heijastukseen vaikuttaa sen fysikaaliset sekä kemialliset ominaisuudet. Maaperä koostuu

pääosin vedestä, maan seassa olevasta ilmasta sekä epäorgaanisista ja orgaanisista aineista.

Maaperän rauta vaikuttaa voimakkaasti heijastusspektriin näkyvän valon sekä lähi-

infrapunasäteilyn aallonpituuksilla aina 1.0 µm asti. Hydroksidipitoiset mineraalit aiheuttavat

huomattavan jäljen spektriin 2.74 µm kohdalle. Karbonaatit sekä kerrostuneet silikaatit, kuten savi,

aiheuttavat spektrissä näkyviä absorptiopiirteitä lähi-infrapunasäteilyn alueella. Maaperään

sekoittunut orgaaninen aine pienentää heijastusta koko näkyvän valon sekä lähi-infrapunasäteilyn

alueella. Heijastuksen pienentyessä absorptiopiirteiden vaikutus vähenee spektrissä, joten

orgaaninen aines voi vaikeuttaa maaperän muiden aineiden havainnointia. Jos maaperässä on vettä,

niin se aiheuttaa huomattavan absorptiovaimennuksen 1.4 ja 1.9 µm kohtiin. Näkyvän valon sekä

infrapunasäteilyn alueella kosteus vähentää maaperän kokonaisheijastusta. Maaperän suuret

hiukkaset aiheuttavat pienemmän ja pienet hiukkaset suuremman kokonaisheijastuksen. [Meer &

Jong 2001]

2.6. Hyperspektrikuva

Hyperspektrikuva on kuvaavan spektrometrin maastosta tuottama 3-ulotteinen tietokanta.

Tavallisella harmaasävykuvalla jokaiselle pikselille on annettu numeroarvo, joka kuvaa pikselin

kirkkautta. 8-bittisellä kuvalla jokainen pikseli voi saada 256 erilaista harmaasävyarvoa. RGB-

värikuvan pikselit saavat kolme eri arvoa, jotka edustavat pikselin punaisen, vihreän ja sinisen

värin kirkkautta. Näiden päävärien sekoituksina voidaan näytölle muodostaa vaikutelmat eri

väreistä.

Hyperspektrikuva muodostuu useista päällekkäisistä kuvista, joista jokainen esittää samaa aluetta

eri aallonpituusalueilla kuvattuna. Nämä eri aallonpituusalueiden kuvat eli hyperspektrikuvan

kanavat määrittävät kukin hyvin kapean aallonpituusalueen. Kanavat sijaitsevat lisäksi perätysten

kuvaten tarkasti laajemman aallonpituusalueen. Hyperspektrikuva eroaa multispektrikuvasta siten,

että multispektrikuvan kanavat ovat huomattavasti leveämpiä, eivätkä ne sijaitse jatkuvana sarjana

koko aallonpituusalueen yli vaan kanavien väliin jää usein tyhjiä alueita. Hyperspektrikuvan

pikseli saa yhtä monta numeroarvoa kuin instrumentissa on kanavia. Pikselin voidaan ajatella

olevan vektori, jonka alkioita ovat instrumentin havaitsemat heijastusarvot eri kanavilla. Näin

jokainen pikseli käsittää yksityiskohtaisen spektrin, joka sisältää usein tarpeeksi informaatiota

pikselillä sijaitsevan materiaalin identifioimiseksi.

Page 20: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

14

Kuva 2.6: Hyperspektrikuva muodostuu useista samaa aluetta eri aallonpituuksilla kuvaavista

harmaasävykuvista.

Tietokone käyttää RGB-menetelmää kuvien esittämiseen. Samoin ihmisen näköjärjestelmä on vain

kolmikanavainen. Hyperspektrikuvan sadoista kanavista joudutaan siten valitsemaan 3 kanavaa,

jotka halutaan esittää. Tämä merkitsee, että hyperspektrikuvalla on enemmän tietoa verrattuna sen

3-kanavaiseen visualisointiin, jonka ihminen pystyy havaitsemaan.

Hyperspektrikuva sisältää huomattavasti enemmän tietoa verrattuna tavalliseen kuvaan. Jo

tavallisen 3-kanavaisen RGB-värikuvan havaitaan helposti sisältävän enemmän informaatiota

verrattuna harmaasävykuvaan. Hyperspektrikuva voi teoriassa sisältää jopa sata kertaa enemmän

tietoa verrattuna harmaasävykuvaan. Sama pätee myös hyperspektrikuvan kokoon, joka on tällöin

100-kertainen. Käytännössä hyperspektrikuvan kanavat korreloivat hyvin paljon, joten

hyperspektrikuvan kanavat voidaan tiivistää muutamaan tärkeimpään kanavaan

pääkomponenttimuunnoksella. Usein onkin mahdollista ja järkevääkin pudottaa korreloivia

kanavia pois tai laskea uusia korreloimattomia kanavia. Hyperspektridatan tiivistäminen ei

kuitenkaan ole aina järkevää. Siinä voidaan hävittää eri kohteiden väliset pienet piirteiden erot,

jotka saattavat olla merkittäviä kohteiden erottamisessa tai analysoinnissa.

2.7. Spektrikirjasto

Spektrikirjasto on laboratorio- tai maastomittauksilla koottu tietokanta eri materiaalien spektreistä.

Spektrien mittaamisessa voidaan käyttää tarkkoja hilaspektrometrejä, joilla mitataan halutun

materiaalin heijastusta sadoilla tai jopa tuhansilla erittäin kapeilla aallonpituusalueilla. Kuvaavan

spektrometrin mittaamia havaintospektrejä voidaan verrata spektrikirjaston tunnettuihin

Page 21: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

15

spektreihin. Vertailussa käytetään erilaisia spektreiltä laskettuja tunnuslukuja. Jos spektrit

täsmäävät riittävällä tarkkuudella, niin havaintospektrin sekä spektrikirjaston spektrin voidaan

olettaa edustavan samaa materiaalia. Vertailussa on syytä ottaa huomioon spektrikirjaston ja

havaittujen spektrien väliset erot mitattujen heijastusten tarkkuuksissa sekä varsinkin kanavien

leveyksissä. Lisäksi täytyy ottaa huomioon ilmakehä, joka vaikuttaa havaittuun spektriin.

ASTER Spectral Library on tunnetuin kansainvälinen spektrikirjasto. Se sisältää tietoa kolmesta

eri spektrikirjastosta: Johns Hopkins University Spectral Library, Jet Propulsion Laboratory

Spectral Library sekä U. S. Geological Survey Spectral Library. ASTER Spectral Library

määrittää melkein 2000 erilaisen materiaalin spektrin, joista suurin osa on erilaisia mineraaleja tai

ihmisen tekemiä materiaaleja, mutta sekaan mahtuu myös kasvillisuuden, maaperän sekä jään,

lumen ja veden spektrejä. Materiaalien spektrit on mitattu näkyvän valon sekä lähi-

infrapunasäteilyn alueella. Osalle mineraaleista mittauksia on jatkettu vielä pidemmälle keski-

infrapunasäteilyn alueelle - aina 25 mikrometriin asti.

Koska ASTER Spectral Libraryn spektrit on kerätty kolmesta erillisestä spektrikirjastosta, joissa

on käytetty erilaisia spektrometrejä niin eri spektrien tarkkuudet vaihtelevat hieman. Lisäksi saman

spektrin näkyvän valon ja lähi-infrapunasäteilyn aallonpituudet ovat usein mitattu eri

instrumentilla kuin pidemmät infrapunasäteilyn aallonpituudet. Esimerkiksi Johns Hopkins

University Spectral Libraryn kanavien leveydet ovat yleensä alle 8 nanometriä 0.4 - 2.5

mikrometrin alueella ja materiaalien absoluuttinen heijastus on mitattu ± kolmen prosentin

tarkkuudella. Mittauksissa on käytetty tarkkoja hilaspektrometrejä laboratorio-olosuhteissa, joten

spektrikirjastojen spektrit ovat paljon tarkempia kuin kuvaavien spektrometrien spektrit. [ASTER

Spectral Library 2004]

Tässä diplomityössä on havaintospektrejä vertailtu enimmäkseen keskenään, jolloin

heijastusspektrin kanavien lukumäärä, sijainti ja tarkkuus on eri spektreillä sama. Vertailussa on

myös käytetty Geomatican omaa spektrikirjastoa, joka on saatu U. S. Geological Survey:n

mittauksista.

Page 22: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

16

3. Kuvaavan spektrometrin tuottaman datan korjaukset

Kuvaavan spektrimetrin tuottama data sisältää erilaisia virheitä, joita syntyy esimerkiksi

ilmakehän, kuvausgeometrian sekä kuvausalustan liikkeiden takia. Nämä virheet voidaan jakaa

radiometrisiin ja geometrisiin virheisiin ja niiden vaikutukset pyritään minimoimaan datan

esikäsittelyssä erilaisilla korjauksilla. Geometrisellä korjauksella pyritään korjaamaan kuvauksen

geometriset vääristymät, kun taas radiometrisellä korjauksella pyritään muuttamaan instrumentin

havaitsema säteily vastaamaan maastosta heijastunutta ja emittoitunutta säteilyä. Nykyään

kuvauksessa korjataan osa näistä virheistä automaattisesti. Tämä perustuu instrumentin

kalibrointitietoihin, lentokoneessa olevan GPS/INS laitteen sijainti- sekä kallistushavaintoihin sekä

lentokoneen katolla olevaan detektoriin, jolla havaitaan auringon irradianssi. Kuitenkin suurin osa

korjauksista jää tehtäväksi myöhemmin datan esikäsittelyvaiheeseen.

3.1. Geometrinen korjaus

Kuvaavat spektrometrit ovat pushbroom-tyyppisiä keilaimia. Ne kuvaavat kohdetta rivin

kerrallaan ja lentokoneen tai satelliitin kulkiessa eteenpäin ne kuvaavat seuraavan rivin ja

muodostavat näin kohteesta kuvan. Eri häiriöt, jotka vaikuttavat kuvausalustaan tai instrumenttiin,

sekä kuvausgeometria ja maanpinnan ominaisuudet aiheuttavat geometristä vääristymistä

hyperspektridatalle. Lentokoneen tai satelliitin poikkeavat liikkeet vakionopeudesta, korkeudesta

ja suunnasta sekä kuvausalustan kallistelut aiheuttavat vääristymiä kuvausgeometriaan. Erityisen

paljon virheitä syntyy, kun kuvausalustana käytetään epävakaata yksimoottorista pienlentokonetta.

Sen sijaan kaukokartoitussatelliittien radat ovat hyvin stabiileja, eikä silloin synny yhtä paljon

virheitä. Lentokoneen kallistukset sekä nopeuden ja korkeuden muutoksia voidaan rekisteröidä

GPS/INS-laitteella ja virheet voidaan korjata datasta.

Maapallon pyöriminen aiheuttaa virheitä kaukokartoitussatelliittien tuottamaan dataan. Maapallo

ehtii pyörähtämään hieman keilaimen kuvaamien rivien välillä, joten kuvauslinja kaartuu hiukan

maan liikkeen suuntaan. Myös maanpinnan kaarevuus aiheuttaa virhettä satelliitti-instrumenteissa,

joissa on suuri keilainleveys. Nämä virheet ovat vakioita ja ne voidaan korjata helposti, kun

tiedetään maan pyörimisnopeus sekä kaarevuus. Maaston topografia aiheuttaa virheitä ja eteenkin

vuoristoisella alueella maaston korkeusvaihtelut aiheuttavat suuria virheitä, jotka voidaan

Page 23: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

17

kuitenkin korjata käyttäen apuna digitaalista korkeusmallia. Instrumentin optiikassa linssien

epätasaisuudet sekä niiden sijaintien epätarkkuudet aiheuttavat virheitä, joiden suuruudet voidaan

määrittää jo laitteen kalibroinnissa.

Geometriset virheet voidaan korjata kahdella eri tekniikalla. Virheen ominaisuudet ja suuruus

voidaan mallintaa sekä poistaa niiden vaikutus. Tällöin eri syistä syntyneille vääristymille

muodostetaan kullekin erikseen omat mallit. Virheiden mallintaminen onnistuu, kun niiden

syntymekanismi sekä laatu tunnetaan hyvin. Toinen tapa korjata geometriset vääristymät on

verrata kuvalla näkyvien kohteiden sijaintia sekä niitä vastaavia maaston koordinaatteja. Kun koko

kuvan alueelta havaitaan runsaasti pisteitä, joiden maastokoordinaatit tunnetaan, voidaan kaikki

kuvan geometriset vääristymät korjata samalla kertaa, vaikka yksittäisten virheiden

syntymekanismia ei tunnettaisikaan. Tämä menetelmä on suositumpi sekä helpompi käyttää, jos

pisteiden maastokoordinaatit ovat tunnettuja. [Richards & Xiuping 1999]

3.2. Radiometrinen korjaus

Ilma- sekä satelliittikuvauksessa syntyy usein huomattavia radiometrisiä virheitä. Nämä virheet

haittaavat kuvien visuaalista tulkintaa sekä huonontavat luokittelutuloksia. Virheet voivat olla

satunnaisia, esimerkiksi heterogeenisen ilmakehän aiheuttamia, tai ne voivat riippua esimerkiksi

kuvausgeometriasta ja maaston topografiasta. Lentokäyttöinen kuvaava spektrometri keilaa aluetta

usein linjoittain. Eri linjoja kuvatessa valaistus voi muuttua hyvinkin paljon vaihtelevan sään takia.

Tällöin kuvalle tulee valoisuuseroja, jotka huonontavat kuvan tulkittavuutta. Radiometrinen

korjaus on erityisen tärkeää, kun vertaillaan keskenään eri alueista tai eri ajankohtina otettuja

kuvia. Lisäksi eri instrumenttien tuottamien kuvien vertailu keskenään sekä havaitun spektrin ja

spektrikirjaston spektrin vertailu edellyttää radiometristen virheiden korjausta.

Hyperspektrikuvaus perustuu yleensä auringosta saapuneen ja kohteesta heijastuneen valon

havainnointiin. Useimmissa luonnonkohteissa tapahtuu diffuusi heijastus eli säteily kimpoaa niistä

kaikkiin suuntiin kuvan 3.1a esittämällä tavalla. Heijastuneen säteilyn intensiteetti riippuu säteilyn

heijastus- sekä tulokulmasta ja se on suurimmillaan kun säteilyn heijastuskulma on sama kuin

tulokulma. Luonnon eri materiaalit heijastavat säteilyä lisäksi kukin omalla tavallaan suhteessa

säteilyn heijastus- sekä tulokulmiin. Lisäksi kohteista saataviin heijastusarvoihin vaikuttaa

heijastavan kohteen pinnan orientaatio sekä instrumentin sijainti kohteen ja auringon suhteen.

Page 24: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

18

Tämä johtaa siihen, että luonnossa samanlaisen heijastuksen aiheuttavat kohteet saavat kuvan eri

osissa erilaisen heijastusarvon. Tätä virhettä on vaikea korjata, sillä siihen vaikuttaa paljon erilaisia

tekijöitä, joita on vaikea ottaa huomioon.

Kuvat 3.1a ja 3.1b: (a) diffuusi heijastus ja (b) peiliheijastus.

Auringon sekä instrumentin sijainnin ja maaston topografian yhteistä vaikutusta radiometrisiin

virheisiin voidaan korjata käyttämällä apuna digitaalista korkeusmallia sekä tietoja auringon ja

instrumentin sijainnista. Suomessa tätä BRDF (bidirectional reflectance distribution function) -

mallinnusta on tutkittu Geodeettisessa laitoksessa [Peltoniemi 1997]. Virheiden korjaaminen on

kuitenkin vaikeaa, joten käytännössä kuvaukset tulisi suunnitella siten, että mahdollisimman vähän

virheitä syntyy. Lentokoneesta suoritettavat kuvaukset kannattaa suunnitella suoritettavaksi

sellaiseen ajankohtaan, että aurinko on suhteellisen korkealla ja eri päivinä suoritetut kuvaukset

kannattaa suorittaa samaan vuorokauden aikaan, jolloin radiometriset virheet eivät vaikuta niin

paljoa. Radiometristen virheiden määrä kasvaa, kun kuvataan maastoa, joka sisältää suuria

korkeusvaihteluita ja käytetään viistokuvausta.

3.3. Ilmakehäkorjaus

Sähkömagneettisen säteilyn kulkeutuessa ilmakehässä ja vuorovaikuttaessa ilmakehän hiukkasten

kanssa sen ominaisuudet muuttuvat. Säteilyn nopeus, taajuus, intensiteetti ja suunta muuttuvat,

mikä aiheuttaa kaukokartoituksessa radiometristä virhettä. Virheiden suuruudet riippuvat säteilyn

aallonpituudesta sekä ilmakehän ominaisuuksista. Ilmakehän molekyylit absorboivat säteilyä,

kukin ominaisella aallonpituudella. Aerosolit sirottavat säteilyä. Ilmakehän kaasut ja aerosolit ovat

sekoittuneet heterogeenisesti ja varsinkin aerosolien suhteet ja määrät saattavat muuttua hyvinkin

nopeasti, esimerkiksi ilmavirtausten ansiosta. Aerosolit ovat ilmakehässä leijuvia molekyylejä

suurempia hiukkasia. Osa aerosoleista on syntynyt ihmisen toimien seurauksena, mutta niitä

syntyy ja joutuu ilmaan myös luonnon omien prosessien seurauksena. Esimerkiksi palamisessa

Page 25: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

19

syntyvät savuhiukkaset sekä tuulen nostattama pöly ovat aerosoleja. Säteilyn lyhyet aallonpituudet

reagoivat voimakkaimmin ilmakehän hiukkasten kanssa. Näkyvä valo, varsinkin sen sininen

osuus, siroaa voimakkaasti ilmakehässä. Sinistä valoa lyhyempää säteilyä ei voi enää käyttää

kaukokartoituksessa hyväksi lukuun ottamatta joitakin erikoissovellutuksia.

Kuvaavat spektrometrit havaitsevat useimmiten näkyvän valon sekä lähi- ja keski-

infrapunasäteilyn alueita. Säteily muuttuu kulkeutuessaan ilmakehän läpi, joten instrumenttien

havaitsema säteily ei vastaa täysin kohteesta heijastunutta säteilyä. Ilmakehäkorjauksella pyritään

poistamaan ilmakehän säteilylle aiheuttama vaikutus kohteen ja instrumentin väliltä. Instrumentin

havaitsema säteily korjataan kohteen heijastamaksi säteilyksi. Ilmakehä myös emittoi säteilyä

pidemmillä aallonpituuksilla. Tämä täytyy ottaa huomioon käytettäessä instrumentteja, jotka

pystyvät havaitsemaan pidempiä infrapunasäteilyn taajuuksia. Tällaisella alueella toimivia

hyperspektri-instrumentteja käytetään esimerkiksi geologisissa kaukokartoitusprojekteissa, joissa

etsitään erilaisia mineraaleja.

3.3.1. Ilmakehän sironta

Suurin osa silmiimme saapuneesta säteilystä on sironnutta säteilyä. Esimerkiksi taivaalta tai

pilvistä saapunut säteily [Paltridge & Platt 1976]. Sironnassa auringosta lähtenyt tai maasta

heijastunut säteily vuorovaikuttaa ilmakehän suurten molekyylien sekä aerosolien kanssa. Eniten

sirontaa tapahtuu ilmakehän alaosassa, jossa on paljon aerosoleja ja ilmakehä on tiheämpää.

Sironnassa fotonin energia ei muutu esimerkiksi lämmöksi. Sen sijaan säteen kulkusuunta voi

muuttua. Sironnan laatu ja merkitys riippuvat sirottavan hiukkasen suuruudesta verrattuna

sironneen säteen aallonpituuteen [Schott & Henderson-Sellers 1984].

Pääosin molekyylit, mutta myös hyvin pienet ilmakehän hiukkaset, joiden koko on noin 1/10 tai

vähemmän näkyvän valon aallonpituudesta, aiheuttavat Rayleigh-sirontaa. Säteilyn aallonpituus

vaikuttaa sironnan määrään siten, että valon lyhyimmät aallonpituudet siroavat eniten. Tästä johtuu

mm. taivaan sininen väri, sillä sininen valo siroaa ilmakehässä noin neljä kertaa punaista valoa

enemmän. Kuvan 3.2a mukaan säteily kimpoaa melko tasaisesti kaikkiin suuntiin osuessaan

ilmakehän hiukkasiin tai molekyyleihin. Tämän takia taivas näyttää kauttaaltaan tasaisen siniseltä.

Page 26: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

20

Säteilyn siroamista suurista hiukkasista, joiden koko on samaa luokkaa säteilyn aallonpituuden

kanssa, kutsutaan Mie-sironnaksi. Ilmakehän pöly- ja savuhiukkaset ovat vastuussa Mie-

sironnasta. Mie-sironnassa säteily siroaa kyllä kaikkiin suuntiin, mutta eniten säteilystä siroaa

eteenpäin kuvan 3.2b mukaan, eli yksittäisen säteen suunta muuttuu vain hiukan. Havainnoitsija

näkee ilmakehän Mie-sironnan esimerkiksi vaaleana kiekkona tai utuna auringon ympärillä, koska

suurin osa Mie-säteilystä siroaa eteenpäin.

Kuvat 3.2a ja 3.2b: (a) Rayleigh- sekä (b) Mie-sironta.

Valikoimatonta sirontaa tapahtuu silloin kuin hiukkaset ovat moninkertaisesti niihin osuneen

säteilyn aallonpituutta suurempia. Yleensä tällaiset raskaat hiukkaset sijaitsevat ilmakehän

alaosissa ja esimerkiksi sumu johtuu niiden sirottamasta säteilystä. Pilviin tiivistynyt vesihöyry

aiheuttaa myös valikoimatonta sirontaa. Valikoimaton sironta on nimensäkin mukaan

aallonpituudesta riippumatonta, joten se sisältää kaikkia auringon säteilyn aallonpituuksia yhtä

paljon. Tämän takia pilvet ja sumu näkyvät valkoisina tai harmaina.

3.3.2. Ilmakehän absorptio

Absorptiossa fotoni törmää ilmakehän molekyyliin ja fotonin energia siirtyy molekyylille.

Molekyyli voi emittoida tämän jälkeen uuden fotonin eri aallonpituudella. Ilmakehän kaasut

absorboivat säteilyä tietyillä aallonpituuksilla kuvan 3.3 esittämällä tavalla. Kaasuista happi, typpi,

hiilidioksidi, otsoni ja vesihöyry ovat pääosin vastuussa ilmakehän aiheuttamasta absorptiosta

[Cracknell & Hayes 1991]. Korkealla ilmakehässä absorptiokaasujen tiheys on hyvin pieni, joten

hyvin pieni määrä säteilystä absorboituu siellä. Toisaalta maan pinnan lähellä kaasujen tiheys on

suurimmillaan, mutta silloin ilmakehän läpi kulkeutuneen säteilyn absorptiokaistoista on suurin

osa jo suodattunut pois, joten alailmakehänkin absorptio on hyvin vähäistä.

Page 27: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

21

Kuva 3.3: Ilmakehän absorptio säteilyn aallonpituuden funktiona [EUMETSAT 2004].

Säteilyn käyttäytymistä ilmakehässä voidaan mallintaa eri tavoilla. Säteilyn käyttäytyminen

riippuu lukuisista eri tekijöistä, mikä tekee sen ennustamisesta hyvin vaikeaa. Neljä yleisimmin

käytettyä menetelmää ilmakehän virheiden korjaamiseen ovat: säteilyn kulun mallintaminen,

tumman pikselin vähentäminen, radianssi/heijastussuhde-muunnos sekä regressioon perustuva

tekniikka. Säteilyn kulun mallintamisessa ilmakehän ominaisuuksista kerätään kuvaushetkellä

havaintoja. Näiden havaintojen avulla ilmakehästä muodostetaan teoreettinen malli, jonka avulla

voidaan arvioida säteilyn käyttäytymistä ilmakehässä. Tumman pikselin vähentämisessä etsitään

kuvalta kaikkein tummin pikseli. Esimerkiksi infrapunakanavan arvo syvässä, kirkkaassa vedessä.

Tällaisen pikselin heijastus oletetaan nollaksi ja instrumenttiin saapuvan säteilyn arvo, joka on

suurempi kuin nolla, oletetaan johtuvan ilmakehän vaikutuksesta. Vähentämällä tämä tumman

pikselin arvo kaikkien muiden kanavien pikseleistä saadaan ilmakehän vaikutusta korjattua.

Radianssi/heijastussuhde-muunnoksessa verrataan vähintään kahden kohteen tunnettuja

heijastusarvoja instrumentin havaitsemiin radiansseihin. Kun tunnetun heijastusarvon sekä

instrumentin havaitsemien arvojen välille löydetään yhteys, voidaan oikeat arvot interpoloida koko

kuvalle. Regressioon perustuvassa tekniikassa määritetään parhaiten istuvat suorat eri materiaalien

heijastusspektrikäyrille. Näiden suorien leikkauspisteen oletetaan edustavan kohtaa, jonka

heijastusarvo on peräisin ainoastaan ilmakehän vaikutuksesta. [Crippen 1987]

3.4. Heijastusspektrin normalisointi

Eri instrumenteilla ja ajankohtina havaitut absorptiopiirteet eivät ole usein vertailukelpoisia. Siksi

piirteet täytyy normalisoida kannan suhteen (baseline normalization) esimerkiksi ennen Spectral

Feature Fitting -analyysin käyttämistä. Tällaista normalisointia on käytetty paljon laboratorioissa

infrapunaspektrometrien havaitsemalla datalla. Valoisuuseroja voidaan korjata myös käyttämällä

kromaattista suhdetta. Siinä määritetään kuinka monta prosenttia kunkin kanavan harmaasävy on

kaikkien harmaasävyjen summasta:

Page 28: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

22

∑=

= d

jj

nn

DN

DNCR

1

, (3.1)

jossa nDN on kanavan n harmaasävyarvo ja kanavien lukumäärä on d [Törmä et al. 2001].

Normalisointi kannan suhteen suoritetaan ns. continuum removing -operaatiolla, jossa ensin

määritetään spektrin maksimikohtien kautta kulkeva kupera continuum-käyrä, katso kuva 3.4.

Käyrä estimoi mittauksen kannalta epäoleellisten kohteiden kokonaisheijastuksen vaikutusta

[Kokaly et al. 2002]. Continuum-käyrä kulkee kutakuinkin spektrikäyrää pitkin lukuun ottamatta

spektrin oleelliset absorptiokuopat, joissa se kulkee suoraan ylittäen kuopat. Käyrän vaikutus

poistetaan jakamalla alkuperäinen spektri continuum-käyrällä. Tuloksena saadaan continuum

removed -spektri, jossa korostuvat analysoitavan materiaalin oleellisimmat absorptio-

ominaisuudet. Lisäksi maaston kaltevuuden vaikutukset eliminoituvat, joten spektrien vertailu on

helpompaa [Kokaly et al. 2002].

Kuva 3.4: Heijastusspektri, continuum-käyrä, ja continuum removed spektri [ENVI Tutorial 2003].

Page 29: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

23

4. Piirteiden valinta ja irroitus

Hyperspektrikuvalla eri materiaalit saavat erilaisia kirkkausarvoja. Materiaalit erottuvat toisistaan

paremmin tietyillä aallonpituusalueilla eli hyperspektrikuvan kanavilla. Kanavista voidaan laskea

myös erilaisia suhde- tai erotuskuvia sekä pääkomponentteja. Jos ennen kuvausta tiedetään, mitkä

kanavat eli piirteet erottavat luokat toisistaan parhaiten, niin kuvaus voidaan suorittaa käyttäen

ainoastaan tätä etukäteen tunnettua piirrejoukkoa. Silloin kuvauksessa tallennetaan vain osa

kanavista, eikä luokittelun kannalta ylimääräistä dataa tarvitse huomioida.

Etukäteen ei yleensä tiedetä mitkä piirteet, ovat tehtävän kannalta tärkeitä.

Hyperspektrikuvauksessa kustannukset eivät yleensä riipu kuvattavien kanavien lukumäärästä.

Siksi on käytännöllistä mitata kohdetta kapeilla kanavilla, jotka kattavat tasaisesti laajan

aallonpituusalueen. Kuvaavat spektrometrit toimivat yleensä koko näkyvän valon sekä lähi-

infrapunasäteilyn aallonpituuksilla ja niiden yksittäiset kanavat ovat vain muutaman nanometrin

levyisiä. Näin varmistetaan, että mittausprosessi säilyttää mahdollisimman suuren osan

alkuperäisestä informaatiosta, ja kaikki mittauksen kannalta relevantit piirteet sijaitsevat mitatulla

aallonpituusalueella. Lisäksi materiaalien spektreissä olevat pienet erot, jotka näkyvät ainoastaan

tietyillä kanavilla, saadaan näin huomioitua.

Teoriassa piirteiden lukumäärän kasvattaminen parantaa aina mahdollisuuksia löytää hyvä

erottuvuus luokkien välille. Tilastollisen päätösteorian mukaan luokitteluvirheen todennäköisyys

pienenee kasvatettaessa eri lailla tehtyjen mittausten lukumäärää eli piirrevektorin dimensiota.

Tämä päteekin käsiteltäessä äärettömän suuria otoksia. Käytännön mittauksia häiritsee kohina ja

erilaiset vääristymät, mikä huonontaa piirteiden laatua. Lisäksi usein saadaan myös luokittelun

kannalta merkityksetöntä informaatiota. Mittauksen opetusjoukko on äärellinen ja parametrien

estimaatit ovat harhaisia. Järjestelmä mukautuu hyvin otosjoukkoon, jos käytettävissä on suuri

määrä piirteitä. Samalla kuitenkin estimoidut parametrit muuttuvat harhaisemmiksi. Tämän

järjestelmän suorituskyky voi heiketä huomattavasti, jos sitä käytetään jonkun toisen alueen

luokittelussa. Syynä on se, että järjestelmän parametrien lukumäärä ja parametrien estimaattien

harha kasvaa nopeasti piirteiden lukumäärän kasvaessa. Käytännössä järjestelmältä puuttuu tällöin

kyky yleistää. Piirteiden valinnalla sekä irroituksella voidaan tällöin parantaa järjestelmän

yleistyskykyä. [Heikkilä & Törmä 1996]

Page 30: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

24

Moni hyperspektrikuvalle tarkoitettu luokittelumenetelmä toimii hyvin vaikka piirteiden irroitusta

tai valintaa ei tehtäisi. Itse asiassa nämä algoritmit käyttävät yleensä referenssispektreinä jostain

spektrikirjastosta valittuja spektrejä. Tällöin on tärkeää, että havaittu spektri on mitattu kapeilla ja

tasaisesti koko aallonpituusalueen yli kulkevilla kanavilla. Mitään suhde- , erotus-, tai

pääkomponenttikuvia ei ole myöskään järkevää laskea, jotta vertailu referenssispektrin kanssa

onnistuisi. Toisaalta joissain tapauksissa hyperspektrikuvien piirrejoukkoa voidaan ja kannattaakin

pienentää piirteiden irroituksella ja valinnalla. Lisäksi hyperspektrikuvan kanavia voidaan

summata yhteen, jolloin saadaan leveämpiä kanavia. Näin muokatun hyperspektrikuvan

piirrevektori muistuttaa multispektrikuvan piirrevektoria ja käytössä ovat kaikki perinteiset

multispektrikuvauksen luokittelumenetelmät. Hyperspektrikuvauksessa onkin tärkeää tietää

milloin tarvitaan piirteiden valintaa ja irroitusta ja milloin se on turhaa tai jopa haitallista.

Piirteiden irroitus ja valinta täytyy suunnitella aina luokittelualgoritmin yhteydessä. Yhtä ainoaa

parasta piirrejoukkoa ei aina ole olemassa vaan eri luokittelualgoritmeille sopivat erilaiset

piirrejoukot, mutta yleisesti hyvä piirteiden osajoukko sisältää mahdollisimman vähän korreloivia

piirteitä.

4.1. Fysikaalisia piirteiden irroitusmenetelmiä

Hyperspektrikuvan kanavilla voidaan suorittaa erilaisia matemaattisia laskutoimituksia. Kanavia

voidaan esimerkiksi laskea yhteen, vähentää, kertoa ja jakaa keskenään. Näin kanavien joukosta

voidaan laskea uusia kanavia, joiden informaatio poikkeaa alkuperäisistä kanavista. Eri

menetelmillä voidaan korostaa tiettyjä kuvilla esiintyviä piirteitä. Laskemalla kanavien suhdekuvia

voidaan esimerkiksi vahvistaa tekijöitä, jotka vaikuttavat erilailla kanavien harmaasävyihin.

Samalla kertautuvat tekijät, kuten topografian ja auringon korkeuskulman vaikutukset, pienenevät.

Eri aikoina otettujen kuvien erotuskuvalta voidaan tunnistaa liike tai muutos. Kuvien kertominen

keskenään sen sijaan voimistaa maanpinnan muotoja. Hiukan monimutkaisemmilla laskuilla

voidaan laskea tiettyä ilmiötä kuvaavia indeksikuvia. Esimerkiksi lehtivihreän määrää kuvaa

NDVI (Normalized Difference Vegetation Index) kasvillisuusindeksi:

( )( )PUNNIR

PUNNIRNDVI+−

= , (4.1)

jossa NIR on lähi-infrapuna-alueen kanava ja PUN on punaisen alueen kanava. [Lillesand &

Kiefer 2000]

Page 31: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

25

4.2. Piirteiden valinta

Piirteiden valinta-algoritmit valitsevat piirreavaruuden D piirteen joukosta d piirteen osajoukon

( )Dd < . Osajoukon kokoa d pyritään minimoimaan ja samalla pyritään maksimoimaan eri

luokkien erottuvuutta. Tietyllä osajoukolla suoritetun oikean luokittelun todennäköisyyttä eli

luokittelun onnistumista kuvataan kriteerifunktioilla. Käytännössä voidaan laskea esimerkiksi

luokkien välisiä todennäköisyysteoreettisia etäisyysmittoja. Hyperspektrikuvauksessa eri kanavat

eli piirteet korreloivat voimakkaasti, joten jokaista kanavaa ei tarvitse ottaa mukaan luokitteluun.

Näin luokittelu voidaan suorittaa pienemmällä ja vähemmän korreloivien kanavien osajoukolla.

Kaikkien osajoukkojen kombinaatioiden laskeminen on mahdotonta, jos kanavia on runsaasti.

Osajoukon valinta voidaan tehdä kokoavilla tai jäsentävillä algoritmeilla. Kokoavat algoritmit

aloittavat tyhjästä joukosta, johon ne lisäävät piirteitä kunnes paras osajoukko löydetään.

Vähentävät algoritmit aloittavat kaikkien piirteiden joukosta ja poistavat siitä piirteitä, kunnes

jäljelle jää paras piirteiden osajoukko. Osajoukko voidaan myös löytää algoritmilla, joka

vuorotellen kokoaa ja jäsentää piirrejoukkoa. Koska kaikkia osajoukkojen kombinaatiota ei tutkita,

niin aina ei päästä varmuuteen siitä, ettei uutta vähemmän korreloivaa osajoukkoa löytyisi.

Seuraavassa esitellään muutamia yleisesti käytettyjä piirteiden valinta-algoritmeja.

4.2.1. Branch and bound

Branch and bound -algoritmi on jäsentävä optimaalinen hakumenetelmä. Siinä käydään

implisiittisesti läpi kaikkien piirteiden mahdolliset alijoukot. Algoritmi ei suorita täydellistä hakua,

mutta sen peräytymisominaisuus mahdollistaa kaikkien piirrekombinaatioiden implisiittisen

tutkinnan. Branch and bound -algoritmin huonoja puolia ovat sen laskennallinen raskaus ja suuren

opetusjoukon käytön vaatiminen. Parhaimman piirrejoukon haku perustuu siihen, että poistetaan

valittuja piirteitä alkuperäisestä piirrejoukosta. Seuraavaksi, edellisessä vaiheessa saaduista

joukoista muodostetaan edelleen osajoukkoja samaan tapaan. Prosessia jatketaan kunnes alijoukot

ovat halutun kokoisia. [Heikkilä & Törmä 1996]

Page 32: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

26

Ratkaisu saadaan muodostamalla ratkaisupuu, jonka solmuissa vähennetään aina alkuperäisten

piirteiden lukumäärää yhdellä. Ratkaisupuu etsii parhaimman kriteerifunktion tuloksen antavan

osajoukon. Puun juuressa eli nollatasossa ei piirteitä ole vielä poistettu, joten niitä on käytettävissä

kaikki D kappaletta. Ensimmäiselle tasolle siirryttäessä juuren piirrejoukosta poistetaan 1. tason

solmuissa määrätyt piirteet. Seuraavan tason solmut näyttävät samaan tapaan mitkä piirteet

poistetaan. Prosessia jatketaan kunnes päästään puun viimeiselle tasolle. Tämän tason

järjestysnumero on dD − . Viimeisellä tasolla olevista solmut määrittävät viimeiset piirteet, jotka

jäljelle jääneestä piirrejoukosta poistetaan. Koska jokaisella tasolla vähennetään piirrejoukosta

yksi piirre, niin yhteensä piirteiden lukumäärä vähenee dD − :lla ja edelleen piirteitä jää jäljelle

haluttu d kappaletta. Viimeisen tason solmuista eli puun lehdistä pääsee kustakin yksilöllistä

polkua pitkin kulkemalla puun juureen. Tällä polulla olevat solmut määrittävät, mitkä piirteet

poistetaan alkuperäisestä piirrejoukosta. [Narenda & Fukunaga 1977]

Kuva 4.1: Branch and Bound –ratkaisupuu.

Viidestä piirteestä voidaan valita kahden piirteen osajoukkoja kuvan 4.1 hakupuun esittämällä

tavalla. Puun solmut ilmoittavat niiden piirteiden numerot jotka vähennetään piirrejoukosta.

Alussa, puun juuressa, kaikki viisi piirrettä ovat mukana joukossa ja siirryttäessä alemmalle tasolle

vähennetään aina solmun osoittama piirre joukosta siten, että 3 tasolla on enää kahden piirteen

kokoisia osajoukkoja jäljellä.

Branch and bound -algoritmi käyttää hyväksi sisäkkäisten piirrejoukkojen

monotonisuusominaisuutta eli useat piirrekombinaatiot voidaan hylätä niitä tutkimatta.

Page 33: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

27

Ratkaisupuu on epäsymmetrinen ja solmun poikien määrään vaikuttaa tason, jolla solmu sijaitsee,

järjestysnumero sekä solmun kriteerifunktion arvo. Ratkaisupuu muodostetaan harvimmasta osasta

tiheimpään käyttäen depth-first -hakua. Ensin muodostetaan oikeanpuoleisin oksa ja

kriteerifunktion arvo kyseisen oksan haaran päässä asetetaan kynnysarvoksi. Seuraavaksi palataan

taaksepäin lähimpään haarautumiskohtaan ja seuraavaksi oikeanpuoleisin oksa tutkitaan. Jos

jonkin solmun kohdalla kriteerifunktion arvo alittaa sen hetkisen kynnysarvon, niin tämän solmun

poikia ei tarvitse enää tutkia, sillä myös niiden kriteerifunktioiden arvot alittavat kynnysarvon.

Näin haku voidaan keskeyttää ja siirrytään peräytymisominaisuuden ansiosta ylöspäin lähimpään

käsittelemättömään solmuun. Prosessia jatketaan kunnes koko puu on tutkittu tai jos saavutetaan

puun dD − :s taso. Tällöin ollaan saavuttu solmuun, jonka kriteerifunktion arvo ylittää

kynnysarvon, joten kynnysarvo päivitetään. Puun tutkimista jatketaan samaan tapaan uudella

kynnysarvolla. [Heikkilä & Törmä 1996]

4.2.2. Parhaat piirteet

Hyvin yksinkertainen ja nopea algoritmi, joka testaa piirteet yksitellen riippumatta muista

piirteistä. Kriteerifunktion arvot, jotka siis kuvaavat luokittelun onnistumista, lasketaan erikseen

jokaiselle piirteelle. Piirteet järjestetään kriteerifunktioiden arvojen määräämään järjestykseen ja

valitaan d kappaletta suurimpien kriteerifunktioiden tuottavia parhaita piirteitä [Heikkilä, Törmä

1996]. Koska tämä menetelmä testaa piirteet yksitellen, eikä muita piirteitä oteta huomioon

piirteiden valinnassa, niin hyperspektrikuvalta tämä algoritmi valitsee todennäköisesti

parhaimmiksi piirteiksi d kappaletta vierekkäisiä kanavia, jotka ovat sisällöltään lähes identtisiä.

Siksi tätä algoritmia ei kannata käyttää hyperspektrikuvan kanavien valinnassa.

4.2.3. Sequential Forward Selection (SFS)

SFS on yksinkertainen kokoava piirteiden valinta-algoritmi. Se valitsee ensin suurimman

kriteerifunktion arvon antavan piirteen. Seuraavaksi lisätään valittuun piirrejoukkoon yksi piirre

kerrallaan. Lisättävä piirre valitaan siten, että se tuottaa suurimman kriteerifunktion arvon

laskettuna jo aikaisemmin valitun piirrejoukon kanssa. SFS ottaa huomioon jossain määrin

piirteiden väliset tilastolliset riippuvuudet, mutta se ei pysty poistamaan jo valittuja piirteitä. Tämä

haittaa silloin, kun jokin aikaisemmin valittu piirre tulee tarpeettomaksi uusien piirteiden valinnan

Page 34: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

28

myötä. SFS-algoritmista on olemassa myös yleistetty versio, jossa lisätään r piirrettä kerrallaan

yhden sijaan. Muuten se toimii aivan samaan tapaan kuin SFS. Yleistetty SFS on hiukan

monimutkaisempi ja sen suorittaminen vaatii enemmän laskenta-aikaa, varsinkin jos r on suuri,

mutta sillä saadaan todennäköisesti luotettavampia tuloksia. [Heikkilä & Törmä 1996]

4.2.4. Sequential Backward Selection (SBS)

SBS-algoritmi toimii samaan tapaan kuin SFS, mutta se on jäsentävä algoritmi. SBS aloittaa

kaikkien piirteiden joukosta, josta poistetaan piirteitä yksitellen kunnes dD − piirrettä on

poistettu. Piirrettä poistettaessa valitaan aina sellainen piirre, jonka poistamisen jälkeen jäljelle

jääneen joukon kriteerifunktio on mahdollisimman suuri. Ensimmäistä piirrettä poistettaessa

joudutaan siten laskemaan 1−D kokoisten piirrejoukkojen, jotka saadaan poistamalla

alkuperäisestä piirrejoukosta vuorotellen yksi piirre kerrallaan, kriteerifunktioiden arvot. Toisen

piirteen valinnassa lasketaan 2−D kokoisilla piirrejoukoilla. Laskenta helpottuu jokaisen piirteen

poistamisen jälkeen, mutta silti SBS-algoritmi on raskaampi kuin SFS, sillä kriteerifunktioiden

arvot joudutaan laskemaan aluksi hyvin korkeaulotteisissa avaruuksissa.

SBS tuottaa lisäksi parhaan saavutettavissa olevan luokkien erottuvuuden mitan, jota voidaan

käyttää arvioimaan piirteiden irroituksessa menetetyn informaation määrää. Myös SBS-

algoritmista on olemassa yleistetty versio, joka on muuten yhtenevä SBS:n kanssa, mutta siinä

poistetaan useampia piirteitä kerrallaan. Yleistetyssä versiossa otetaan huomioon riippuvuudet

kunkin hetkisen piirrejoukon piirteiden välillä sekä poistettavien piirteiden välillä. Yleistetyssä

menetelmässä täytyy jokaisessa vaiheessa tutkia

⎟⎟⎠

⎞⎜⎜⎝

⎛ −r

kD (4.2)

joukkoa, kun poistettavien piirteiden lukumäärä on r ja k merkitsee kuinka monta piirrettä on

poistettu joukosta. Yleistetyllä menetelmällä saatu joukkojen määrä on huomattavasti enemmän

kuin SBS-algoritmilla, joka joutuu käymään läpi kD − joukkoa. [Heikkilä, Törmä 1996]

Page 35: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

29

4.2.5. Lisää-l ota pois-r

Tämä algoritmi käyttää ensin SFS-algoritmia piirrejoukon kasvattamiseen l-piirteellä ja sitten

SBS-algoritmilla vähennetään tästä joukosta r piirrettä. Tällä menetelmällä voidaan poistaa osittain

piirejoukkojen sisäkkäisyyttä. Kuitenkaan poistettavien tai lisättävien piirteiden keskinäisistä

riippuvuuksista ei välitetä. Tämä ongelma ratkaistaan käyttämällä yleistettyä lisää-l ota pois-r -

algoritmia. Tässä käytetään yleistettyjä SFS ja SBS -algoritmeja piirrejoukon kasvattamiseen ja

vähentämiseen.

Hyperspektrikuvien peräkkäiset kanavat ovat usein lähes identtisiä. Ainoa ero niissä on havaittava

aallonpituusalue, joka kahden peräkkäisen kanavan välillä eroaa vain muutaman nanometrin. Jos

piirteiden valintaa käytetään hyperspektrikuvien kanavien valintaan, niin peräkkäisten kanavien

samankaltaisuus kannattaisi ottaa huomioon laskettaessa eri piirteiden valinta-algoritmeja.

Yksinkertaisimmillaan voitaisiin ensin suorittaa karkea piirteiden valinta, jossa valittaisiin joka n.

kanava. Tämän jälkeen piirrejoukko olisi jo supistunut huomattavasti ja voitaisiin käyttää edellä

mainittuja laskennallisesti raskaampia ja monimutkaisempia piirteiden valinta-algoritmeja.

4.3. Piirteiden irroitus

Piirteiden irroituksessa muunnetaan piirreavaruutta yksinkertaisemmaksi käyttäen lineaarista

muunnosta

Axy = , (4.3)

missä x on alkuperäinen piirrevektori (dimensio D) ja y on muunnettu piirrevektori (dimensio d). A

on muunnosmatriisi, joka määritellään esimerkiksi luokkienvälisten todennäköisyysteoreettisten

erottuvuusmittojen avulla. Tällöin luokista täytyy tietää niiden tiheysfunktiot ja a’priori

todennäköisyydet. Joskus hyperspektrikuvalla olevien materiaalien tärkeät ominaisuudet, joiden

avulla materiaali voidaan tunnistaa, voivat näkyä ainoastaan hyvin kapeilla aallonpituusalueilla,

joiden sijaintia ei etukäteen tiedetä. Tällöin on tärkeää, että piirteiden irroituksessa näitä kaistoja ei

hävitetä muiden kanavien massaan.

Page 36: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

30

4.3.1. Pääkomponenttimuunnos

Kuvasta 4.2a näkee, että AISA-kuvan kanavat korreloivat voimakkaasti. Tämän takia, käytettäessä

esimerkiksi suurimman uskottavuuden luokittelijaa, voi luokkien kovarianssimatriisit tulla

singulaarisiksi. Matriisin kääntäminen ei tällöin onnistu eikä luokittelija toimi. Tästä ongelmasta

päästään eroon tiivistämällä kuvien sisältämä informaatio pienempään sekä korreloimattomaan

kanavamäärään. Näin luokittelijan parametrit tulevat harhattomammiksi ja luokittelun suoritusta

voidaan nopeuttaa sekä tuloksia parantaa. Pääkomponenttimuunnos on Karhunen-Loéve –

muunnoksen erikoistapaus ja sillä voidaan tiivistää kuvaavan spektrometrin kanavajoukkoa

pienempään sekä korreloimattomaan kanavajoukkoon (katso kuva 4.2b), jossa kanavat on

järjestetty pienenevän varianssin mukaiseen järjestykseen. Pääkomponenttimuunnos on

optimaalinen vaihtoehto, jolla saadaan pienin keskimääräinen neliöllinen virhe, mutta

laskennallisesti se on raskas. Lisäksi hyperspektrikuvalla hankalasti näkyvät ja vähäpätöisiltä

tuntuvat piirteet, jotka saattavat karakterisoida tietyn materiaalin, voidaan hävittää

pääkomponenttimuunnoksella.

Kuvat 4.2a ja 4.2b: Kuva 4.2a esittää AISA-kuvan peräkkäisten kanavien 2 ja 3 hajontakuviota

(scatter plot). Kuva 4.2b esittää kahden ensimmäisen pääkomponenttikanavan hajontakuviota.

Taulukko 4.1: AISA-kuvan pääkomponenttikanavat.

Pääkomponenttikanava Hajonta Varianssi 9 1.53 0.02% 1 77.85 56.90% 10 1.02 0.01% 2 66.14 41.06% 11 0.92 0.01% 3 11.74 1.29% 12 0.72 0.00% 4 5.09 0.24% 13 0.68 0.00% 5 4.20 0.17% 14 0.62 0.00% 6 4.08 0.16% 15 0.57 0.00% 7 2.58 0.06% 16 0.54 0.00% 8 2.53 0.06% 17 0.51 0.00%

Page 37: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

31

Kuvat 4.3a, 4.3b, 4.3c ja 4.3d: AISA-kuvasta pääkomponenttimuunnoksella muokatut neljä ensimmäistä pääkomponenttikuvaa.

Pääkomponenttimuunnoksen tarkoituksena on muuntaa korreloivien piirteiden joukko uuteen

korreloimattomaan muotoon. Muunnos kiertää piirteiden muodostamia vektoriavaruuden akseleita

siten, että kunkin koordinaattiakselin varianssi maksimoituu. Akseleille asetetaan ehto, että ne ovat

ortogonaalisia, eli ne ovat aina kohtisuorassa muihin akseleihin nähden. Ensimmäistä akselia

kierretään siten, että sen varianssi maksimoituu. Seuraavan akselin varianssi maksimoidaan myös,

mutta lisäksi akselin on oltava kohtisuorassa ensimmäiseen akseliin nähden. Seuraavat akselit

asetetaan aina siten että ne toteuttavat varianssin maksimoitumisen sekä sen että ne ovat aina

kohtisuorassa edellisiin akseleihin nähden. Kuten taulukosta 4.1 sekä kuvista 4.3a, 4.3b, 4.3c ja

4.3d näkee, pääkomponenttimuunnoksella määritetty ensimmäinen koordinaattiakseli sisältää

eniten informaatiota ja yleensä seuraavissa akseleissa informaation määrä vähenee nopeasti.

Tämän takia luokitteluun riittää muutaman ensimmäisen pääkomponenttimuunnoksella tuotetun

akselin eli pääkomponentin valinta. Sinänsä pääkomponenttimuunnos on häviötön muunnos, mutta

tämä tarkoitta sitä että kaikki sen tuottamat pääkomponentit valitaan mukaan lopulliseen

piirrejoukkoon, mikä on harvinaista. [Short & Robinson 2003]

Page 38: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

32

4.3.2. n-ulotteiset todennäköisyystiheysfunktiot piirteiden irroituksessa

Multi- sekä hyperspektridataa voidaan muokata sekä analysoida monenlaisin eri menetelmin

käyttäen n-ulotteisia todennäköisyystiheysfunktioita (nPDF). Menetelmää on käytetty

kaukokartoitusdatan havainnollistamiseen, ohjattuun ja ohjaamattomaan luokitteluun sekä

piirteiden irroitukseen. Lisäksi se on hyödyllinen apuväline luokittelijan opetusalueiden

valitsemisessa. Menetelmän ajatuksena on muodostaa alkuperäisestä kuvasta nPDF-diagrammi,

jonka avulla kuva saa selkeämmän esitysmuodon. Ohjaamattomassa luokittelussa nPDF-arvoista

saadaan valittua suoraan luokkien lukumäärä sekä luokkien keskipisteiden sijainnit.

Kuva 4.4: 3D hahmoavaruus. D1-D4 ovat erään hahmoavaruuden piirteen etäisyyksiä kuution

nurkkiin #1-#4.

Piirteiden irroitus tapahtuu siten, että uudet kanavat valitaan hyperulotteisen kuution nurkista.

Kuva 4.4 havainnollistaa tilannetta 3D tapauksessa. Jos kanavien lukumäärää halutaan pienentää

esimerkiksi neljään kanavaan, niin nämä kanavat voidaan valita samassa järjestyksessä

hyperulotteisen kuution neljästä ensimmäisestä nurkasta. Seuraavaksi lasketaan piirteiden

etäisyydet hyperkuution nurkkiin. Jos

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

nx

xx

M2

1

Page 39: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

33

on n-ulotteinen hahmovektori, niin hahmovektorin ja hyperkuution nurkkien väliset Euklidiset

etäisyydet saadaan laskettua kaavalla:

( )( ) 21

1

22⎟⎟⎠

⎞⎜⎜⎝

⎛∗−+∗= ∑

=

n

jjjjji bxRaxD , (4.4)

jossa j merkitsee kanavan numeroa. Muuttujat a ja b saavat arvoikseen joko 0 tai 1, riippuen

hyperkuution nurkasta i sekä kanavan numerosta j. Muuttujien a ja b arvot saadaan määriteltyä

seuraavalla tavalla: 3D tapauksessa kuution nurkilla on kolme koordinaattiarvoa. Kulma #1 on

origo ja sen x, y, z koordinaatit ovat (0,0,0). Koordinaatit kulmalle #2 ovat (0,0,255), kulmalle #3

ovat (0,255,0) ja kulmalle #4 ovat (0,255,255). Nyt laskentaa voidaan helpottaa käyttämällä

binäärilukuja lukujen a ja b ratkaisemisessa. Muutetaan koordinaatit siten, että nolla pysyy

nollana, mutta 255 korvataan ykkösellä. Kuvassa 4.4 pääkulmien binääriesitykset näkyvät

sulkeissa.

Seuraavassa 15D esimerkki (kanavat ensimmäisestä viidenteentoista kulkevat esityksessä

vasemmalta oikealle):

kulma #1: 000000000000000

kulma #2: 001001001001001

kulma #3: 010010010010010

kulma #4: 011011011011011

Jos kanavan binääriluku on 0, niin silloin a on 1 ja b on 0. Jos kanavan binääriluku on 1, niin

silloin a on 0 ja b on 1. Tämän jälkeen voidaan nPDF-komponentit laskea seuraavalla kaavalla:

2/12 NBDSnPDF BIT

ii ∗

∗= , (4.5)

jossa:

i = nurkan numero,

S = haluttu skaalauskerroin,

BIT = käytetyn datan bittien lukumäärä ja

NB = kanavien lukumäärä.

Piirteiden irroituksessa nPDF-menetelmä on merkittävästi pääkomponenttimuunnosta nopeampi.

Lisäksi hyperspektridatan dimension kasvaessa pääkomponenttimuunnoksen suoritusajat kasvavat

Page 40: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

34

dramaattisesti verrattuna nPDF-menetelmään. Pääkomponenttimuunnoksen laskeminen vaatii

lisäksi enemmän muistia, mikä vaikeuttaa sen käyttöä eteenkin suurten hyperspektridatatiedostojen

kanssa [Cetin & Levandowski 1993].

Page 41: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

35

5. Luokittelualgoritmit

Tässä kappaleessa esitellään työssä käytetyt luokittelualgoritmit. Algoritmit on jaettu kahteen

luokkaan. Ensin esitellään uudet hyperspektrikuvien analysointiin tarkoitetut algoritmit. Lopuksi

perehdytään kahteen hyvin yleiseen kaukokartoituksessa käytettyyn luokittelualgoritmiin.

5.1. Hyperspektridatan luokittelualgoritmit

Tässä kappaleessa esitetään useimmin käytettyjä algoritmeja hyperspektridatan analysoinnissa ja

luokittelussa. Eri algoritmien käyttötarkoitus vaihtelee paljon eikä niiden vertailu ole helppoa

lukuun ottamatta Spectral Angle Mapper sekä Spectral Correlation Mapperia, jotka muistuttavat

toisiaan hyvin läheisesti. Siksi ei kannata miettiä, mikä näistä algoritmeista on paras vaan tulisi

ajatella mihin käyttötarkoitukseen eri algoritmit sopivat parhaiten. Yksi hyperspektrikuva voi olla

usean gigatavun kokoinen, joten sitä analysoivien algoritmien täytyy toimia tehokkaasti. Liian

monimutkaiset sekä kompleksiset algoritmit kuluttavat tietokoneen laskenta-aikaa eikä siihen aina

ole varaa. Laskennan pitää sujua nopeasti vaikka luokittelu laskettaisiin käyttäen kaikkia

hyperspektrikuvan kanavia. Perceptron-neuroverkkoa ei erityisesti ole kehitetty hyperspektridatan

analysointiin, mutta sitä on käytetty mitä erilaisimpien ongelmien ratkaisemisessa ja sen käyttöä

haluttiin kokeilla myös hyperspektrikuvien luokittelussa.

5.1.1. Spectral Angle Mapper (SAM)

Hyperspektrikuvan pikselien arvoihin vaikuttaa instrumentin mittaama kohteesta ja sen

ympäristöstä lähteneen säteilyn määrä sekä kohteen spektriset ominaisuudet. Pikselin spektrin

voidaan ajatella olevan n-ulotteinen vektori, missä n on kanavien lukumäärä (katso kuva 5.1).

Täysin musta piste sijaitsee vektoriavaruuden origossa, muuten jokaisella vektorilla on tietty

pituus ja suunta. Vektorin pituus vastaa nyt kohteen valaistusta/kirkkautta ja vektorin suunta on

kohteen "värin" funktio. Tässä "väri" tarkoittaa kohteen spektristen ominaisuuksien suhdetta eri

kanavilla. Topografia, pilvet, varjot sekä auringon ja instrumentin kulma maahan nähden

vaikuttavat enimmäkseen pikselin valoisuuteen eli vektorin pituuteen. Nämä kaukokartoituksessa

Page 42: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

36

vaikeasti kontrolloitavissa olevat ilmiöt eivät kuitenkaan vaikuta juurikaan vektorin suuntaan,

joten luokittelu tehdään siihen perustuen [IMAGRS-L 1996].

Kuva 5.1: Kahden eri materiaalin spektrien A ja B välinen kulma kahden kanavan tapauksessa.

Spectral Angle Mapper (SAM) on nopea, selkeä ja yleisesti käytetty hyperspektrikuvien

luokittelualgoritmi. SAM vertaa luokiteltavan kuvan jokaisen pikselin spektriä tunnettuihin

spektreihin, jotka voivat olla laskettu kuvan opetusalueista tai valittu spektrikirjastoista.

Instrumentin havaitseman heijastuksen korjaaminen todelliseksi kohteen heijastukseksi on tärkeää,

kun spektrejä vertaillaan eri aineistojen kesken. Esimerkiksi hyperspektrikuvan radiometriset

virheet on korjattava, kun referenssitietona käytetään spektrikirjastoa. Jos referenssispektrit

kerätään samalta kuvalta, niin kuvan radiometriset virheet, jotka vaikuttavat samalla tavalla koko

kuvaan, eivät vaikuta tulokseen. Vertailu tapahtuu käsittelemällä spektrejä vektoreina ja

laskemalla niiden välinen kulma:

⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜

⎟⎠

⎞⎜⎝

⎛⎟⎠

⎞⎜⎝

⎛=

∑∑

==

=−

21

1

221

1

2

11cosn

ii

n

ii

n

iii

rt

rtα , (5.1)

jossa r on luokiteltava vektori, t on hahmovektori ja n on hyperspektrikuvan kanavien lukumäärä.

Kaava 5.1 saadaan johdettua vektoreiden pistetulosta:

( )rtrtrt ,cos=• . (5.2)

Page 43: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

37

Pikseli luokitellaan siihen luokkaan, jonka kanssa se muodostaa pienimmän kulman. Näin

vektorien pituus eli kohteen valaistus/kirkkauserot eivät vaikuta tulokseen. Toisaalta värejä on

vaikea erottaa pimeässä. Tämä ilmiö on helposti havaittavissa SAM-luokittelijassakin. Hyvin

tummat alueet kuvautuvat vektoriavaruuden origon lähettyville. Alueet voivat kuulua samaan

luokkaan ja sijaita hyvinkin lähellä toisiaan, mutta niiden välinen kulma voi olla suuri jolloin ne

luokitellaan virheellisesti. [Kruse et al. 1993]

SAM-luokittelutuloksen lisäksi voidaan luokiteltavan kuvan sekä referenssidatan

heijastusspektrien väliset kulmat jokaiselta pikseliltä tallentaa erikseen. Tuloksena saadaan kuva,

jossa tummat alueet kertovat vektorien välillä olevan pieni kulma eli luokittelutulos on hyvä.

Vaaleilla alueilla kulma on suuri ja siten myös luokittelutulos on epävarma. Kuvan visuaalista

tulkintaa voidaan vielä helpottaa kääntämällä sen värit, jolloin vaaleat alueet ovat hyvin

luokiteltuja alueita ja tummat alueet huonosti luokiteltuja. Tällaiset kuvat tarjoavat hyvän

yleiskuvan esimerkiksi alueen mineraalien kartoittamisprosessissa. [Kruse et al. 1997]

5.1.2. Spectral Correlation Mapper (SCM)

Spectral Correlation Mapper -algoritmi ei eroa paljoa SAM:sta ja sitä voidaankin pitää SAM:n

kehittyneempänä versiona. SCM:ssä spektrivektorien kulmat lasketaan samaan tapaan kuin

SAM:ssa, mutta sitä ennen spektrivektorit standardisoidaan. Tämä tehdään vähentämällä

spektrivektoreista vektorien keskiarvo. SCM voidaan laskea kaavalla:

( )( )

( ) ( ) ⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜

⎟⎠

⎞⎜⎝

⎛−⎟

⎞⎜⎝

⎛−

−−=

∑∑

==

=−

21

1

221

1

2

11cosn

ii

n

ii

n

iii

rrtt

rrttα , (5.3)

joka eroaa aikaisemmasta kaavasta 5.1 siten, että nyt spektrivektoreista t ja r vähennetään kaikista

kanavista lasketut keskiarvot t ja r .

SAM:ssa vektorien väliset kulmat saivat arvoja °−° 900 väliltä, eikä sillä pystytä esittämään

piirteiden välistä negatiivista korrelaatiota. SCM saa arvonsa väliltä -1-1 ja siten se huomioi myös

piirteiden välistä negatiivista korrelaatiota. Lisäksi SCM-algoritmin on havaittu olevan tarkempi

Page 44: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

38

analysoidessa erilaisia käyriä ja sen todettiin eliminoivan paremmin varjojen vaikutuksen

[Carvalho 2000]. Tutkimuksessa saavutetut johtopäätelmät tehtiin analysoimalla keinotekoisia 5-

kanavaisia spektrejä, jotka eivät vastaa luonnossa esiintyviä spektrejä. Käytännössä erot SAM:n ja

SCM:n välillä eivät ole yhtä suuria.

5.1.3. Spectral Unmixing

Maanpinta muodostuu harvoin homogeenisistä alueista. Erilaiset maalajit sekä kasvillisuus ovat

usein sekoittuneet keskenään. Yhden pikselin sisältämä alue voi edustaa maastossa useita eri

kasvillisuus- sekä maalajiluokkia. Perinteisessä kaukokartoituksessa erilaisia maaston kohteita

voidaan havaita pikselin tarkkuudella. Pikseliä pienemmän kohteet sekoittuvat ja yleensä tämä

pikseli luokitellaan sen materiaalin mukaan, jota pikselissä on eniten. Väärän luokittelutuloksen

mahdollisuus on myös suuri, jos pikseliltä ei löydy yhtä hallitsevaa materiaalia. Tällöin kohteen

heijastusspektri on muodostunut useamman eri materiaalin spektristä saman kuvapikselin sisällä.

Kuvaavat spektrometrit määrittävät kohteesta lähes jatkuvan heijastusspektrin, mihin aikaisemmin

pystyttiin ainoastaan laboratoriomittauksilla. Kohteen heijastusspektrin avulla Spectral Unmixing -

malli pyrkii erottamaan pikseliin sekoittuneista spektreistä eri materiaalien spektrit sekä

materiaalien suhteelliset osuudet.

Materiaalien spektrit sekoittuvat lineaarisesti, jos materiaalien sekoittuneisuuden mittakaava on

makroskooppista. Tämä tarkoittaa, että sekoittuneessa pikselissä olevat puhtaat materiaalit ovat

paljain silmin erotettavissa toisistaan. Instrumentin havaitsema spektri on näiden puhtaiden

materiaalien lineaarinen kombinaatio ja siitä voidaan purkaa sekoittuneet materiaalit sekä laskea

niiden suhteet. Lineaarisen Spectral Unmixing –mallin matemaattinen muoto on:

( )∑=

+=m

jijiji FRDN

1

ε , (5.4)

jossa:

i = 1,2,…,n

n = kanavien lukumäärä

m = piirteiden lukumäärä

iDN = pikselin heijastusarvo kanavalla i

ijR = materiaalin j tunnettu heijastusarvo kanavalla i

Page 45: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

39

jF = materiaalin j suhteellinen osuus pikselillä

iε = kanavan i virhetermi.

Lineaarisen Spectral Unmixing -mallin käyttäminen edellyttää puhtaiden referenssispektrien, jotka

edustavat homogeenisiä materiaaleja sekä sisältävät vähän kohinaa, löytämistä. Lineaarista mallia

voidaan lähestyä myös toisesta suunnasta: hajotetaan sekoittuneen pikselin spektri

komponentteihin ja verrataan sitä tunnettuihin referenssispektreihin, joita löytyy esimerkiksi

spektrikirjastoista [Kruse et al. 1997].

Lineaarisen mallin etuja ovat sen helppokäyttöisyys ja ymmärrettävyys. Lisäksi se antaa hyviä

tuloksia useimmissa tilanteissa sekä sitä voidaan käyttää erilaisten instrumenttien kanssa. Toisaalta

lineaarinen malli ei ota huomioon pikseliin sekoittuneiden materiaalien lukumäärän tai spektrin

sävyn vaihtelua. Joissain tapauksissa, esimerkiksi ilmakehän aiheuttaessa häiriöitä materiaalien

spektreihin, malli voi epäonnistua erilaisten materiaalien erottamisessa. Käyttämällä Multple

Endmember Spectral Mixture Analysis (MESMA) -mallia voidaan edellä kuvatusta ongelmasta

päästä eroon. MESMA on laajennus yksinkertaiseen lineaariseen malliin ja se sallii piirteiden

lukumäärän ja laadun vaihtelun kuvan eri osissa. Malli tarvitsee koko kuvalta satoja eri

piirrevektoreita, mutta käyttää niistä vain muutamaa yksittäisen pikselin analysoinnissa. [Roberts

et al. 1997]

Kuva 5.2: Piirrevektorit edustavat eri materiaalien heijastusspektrejä, joista yhdessä muodostuu

sekoittunut pikseli. Piirrevektorit rajaavat avaruudesta alueen jonka sisälle jää sekoittunut pikseli.

Page 46: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

40

Sekoittuneen pikselin paikka tässä alueessa riippuu siitä kuinka paljon kutakin materiaalia on

kyseisellä pikselillä. Kuvassa 2-ulotteinen avaruus ja kolme piirrevektoria.

Referenssivektoreiden kerääminen on vaikein tehtävä käytettäessä lineaarista Spectral Unmixing -

mallia. Referenssivektoreita voidaan kerätä joko suoraan hyperspektrikuvalta tai

spektrikirjastoista. Kun referenssivektorit valitaan suoraan kuvalta on tärkeää, että pikselit, joilta

vektorit kerätään, ovat puhtaita eli sisältävät vain yhtä materiaalia. Referenssivektorien lukumäärä

voi tuottaa myös ongelmia. Jotta Spectral Unmixing -malli saataisiin ratkaistua, täytyy siinä olla

enemmän tunnettuja kuin tuntemattomia parametreja. Tämä tarkoittaa sitä, että mukaan otettavien

vektorien määrä on rajoitettu kuvan kanavien määrään. Käytännössä kanavat korreloivat

keskenään, joten referenssivektoreiden suurin mahdollinen lukumäärä on selvästi kanavien

lukumäärää pienempi. Toisaalta mukaan otettavien referenssivektoreiden lukumäärä ei voi olla

liian pieni, vaan kaikkien oleellisten materiaalien, joita kuvalla esiintyy, piirrevektorit täytyy ottaa

mukaan laskentaan. Näin malli saa tarvittavat tiedot sekoittuneen spektrin purkamiseen oikeisiin

komponentteihin [Roberts et al. 1997].

Suoritettaessa Spectral Unmixing –algoritmia voidaan referenssispektrien lukumäärää rajoittava

ongelma kiertää. Tämä tapahtuu jakamalla kuva osiin, esimerkiksi kasvillisuusindeksin perusteella

kasvillisuusalueisiin sekä kasvittomiin alueisiin. Tämän jälkeen kuvan molemmille osille voidaan

suorittaa erikseen Spectral Unmixing –luokittelu. Hyperspektrikuvan sekoittuneet pikselit

sisältävät usein myös varjoja. Nämä varjot vaikuttavat pikselin heijastusspektriin, kuten muutkin

pikselin materiaalit. Siksi myös varjoa kuvaava piirre täytyy ottaa mukaan malliin. Tämän varjo-

piirteen huomioiminen on tärkeää vaikka sen heijastusarvot kaikilla kanavilla olisivat hyvin pieniä

[Radelof et al. 1999].

5.1.4. Spectral Feature Fitting (SFF)

Spectral Feature Fitting (SFF) vertaa tutkittavan kohteen spektriä vastaavaan referenssispektriin.

SFF:ssä käytetään hyväksi eri materiaalien yksilöllisiä absorptio-ominaisuuksia. Absorption

intensiivisyys sekä sen vaikutus näkyvän valon ja infrapunasäteilyn eri aallonpituusalueille

vaihtelevat johtuen materiaalin mikroskooppisesta rakenteesta. Esimerkiksi kasvin lehtivihreä

absorpoi voimakkaasti 0.68 µm aallonpituuksia sekä lehdissä olevat vesimolekyylit absorpoivat

Page 47: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

41

säteilyä 0.98 ja 1.20 µm aallonpituuksilla. Kasvilajit sisältävät eri määriä lehtivihreää sekä vettä,

joten niiden heijastusspektrit eroavat erityisesti absorptio-ominaisuuksiltaan ja tähän perustuu

SFF:n kyky erottaa eri kasvilajit toisistaan.

Spectral Feature Fitting vaatii etukäteistietoa etsittävästä materiaalista. Materiaalin absorptio-

ominaisuudet, joiden perusteella materiaali voidaan tunnistaa, sekä absorptiokaistojen sijainnit

täytyy selvittää. SFF-algoritmissa kaikkien kuvaavan spektrometrin kanavien käyttäminen ei tuo

mittauksen kannalta oleellista tietoa. Ainoastaan ne kanavat, joissa materiaalien absorptio-

ominaisuudet sijaitsevat, on järkevää ottaa huomioon. Spektrometrin on lisäksi havaittava useita

riittävän kapeita kanavia materiaalien absorptiokohdissa, jotta materiaalien absorptiopiirteet

saadaan estimoitua riittävän tarkasti ja materiaalit voidaan erottaa toisistaan. Varjot latistavat

absorptiopiirteitä ja huonontavat niiden tulkittavuutta, joten jyrkimmät varjonpuoleiset rinteet ja

muut varjoalueet kannattaa kynnystää kokonaan pois SFF-analyysistä [Kokaly et al. 2002].

SFF sovittaa kappaleen 3.4 mukaan normalisoidut spektrikäyrät yhteen ja tutkii, miten paljon

nämä käyrät eroavat toisistaan. Tutkittavan kohteen spektrin absorptiopiirteiden eli -piikkien

syvyyksiä sekä muotoja verrataan vastaaviin referenssispektrin ominaisuuksiin. Vertailu tehdään

usein pienimmän neliösumman tekniikkaa käyttäen. Kun SFF-algoritmia käytetään luokittelussa,

niin luokiteltavan pikselin absorptiopiirteitä verrataan referenssispektrien absorptiopiirteisiin.

Pikseli voidaan luokitella esimerkiksi pienimmän neliösumman algoritmilla laskettujen

luokiteltavan pikselin sekä referenssispektrien korrelaatiokertoimien mukaan [Kokaly et al. 2002].

5.1.5. Perceptron-neuroverkko

Neuroverkot muodostuvat neutroneista ja niiden välisistä yhteyksistä. Tiedonkäsittely

neuroverkkojen avulla eroaa paljon tietokoneen yleisten prosessien ja ohjelmien tiedonkäsittelystä.

Neuroverkkojen avulla yritetään jäljitellä luonnossa esiintyviä tiedonkäsittelyjärjestelmiä,

esimerkiksi ihmisen aivoja [Törmä 1997]. Aivojen toiminnallinen yksikkö on hermosolu eli

neuroni, joka on yhteydessä muihin neuroneihin synapsien kautta. Yksittäiset neuronit eivät pysty

kovinkaan monimutkaiseen prosessointiin vaan ne ottavat vastaan signaaleja ja välittävät niitä

eteenpäin muihin neuroneihin. Ihmisen aivoissa on keskimäärin 1210 hermosolua eli neuronia ja

jokaisella neuronilla on keskimäärin 410 synapsia. Näin muodostuu erittäin monimutkainen

Page 48: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

42

verkko, jossa on noin 1610 erilaista kytkentää. Ihmisen oppiminen solutasolla tapahtuu neuronien

välisten yhteyksien muutoksina. Oppimisessa uusia yhteyksiä syntyy neuronien välille, sekä jo

olemassa olevat yhteydet joko vahvistuvat tai heikkenevät. Muutos yhteyksien toiminnassa saa

aikaan impulssien kulun helpottumista tai vaikeutumista.

Tietokoneille kehitetyt neuroverkot toimivat periaatteiltaan aivan samaan tapaan kuin ihmisen

aivot. Neuroverkon perusyksikkö on neuroni, joka saa syötteen muilta neuroneilta kytkentöjen

kautta. Neuroni muokkaa syötettä ja lähettää tuloksen eteenpäin kytkentöjen kautta muille

neuroneille. Kytkennöille on määritelty painot, jotka muuttavat kytkentöjen kautta kulkevia

signaaleja. Neuroverkon oppiminen merkitsee kytkentöjen painojen sovittamista siten, että verkko

suoriutuu tehtävästä mahdollisimman hyvin [Törmä 1997]. Neuroverkon opettaminen painoja

sovittamalla vastaa ihmisen aivoissa hermosolujen välisten yhteyksien eli synapsien toiminnan

muutoksia.

Yksi yleisimmistä nykyään käytetyistä neuroverkoista on monikerros-perceptron (Multi-layer

Perceptron). Tällainen neuroverkko muodostuu kolmenlaisista kerroksista: syötekerroksesta,

piilotetuista kerroksista ja vastekerroksesta. Syötekerros ottaa vastaan syötteen ja esittää sen

piilotetuille kerroksille. Luokiteltaessa kaukokartoitusdataa kunkin kanavan pikselien

harmaasävyarvot toimivat neuroverkon syötteenä ja syötekerroksessa neutroneita on tavallisesti

yksi kutakin piirrettä vastaan. Piilotettuja kerroksia on verkossa yksi tai useampia ja siellä pyritään

löytämään ratkaisu esitettyyn ongelmaan. Siellä syöte kulkee monimutkaisia ja eri painoisia

kytkentöjä pitkin ja samalla muokkaantuu halutunlaiseksi. Yksittäisessä neuronissa lasketaan

siihen saapuvista kytkennöistä tulevien signaalien painotettu summa ja tämä muutetaan

epälineaarisella funktiolla vasteeksi, joka edelleen ohjataan seuraavan kerroksen neuroneille.

Vastekerros kokoaa piilotetuista kerroksista saapuneet signaalit halutunlaiseksi vasteeksi.

Kaukokartoitusdatan luokittelussa haluttu vaste voi muodostua esimerkiksi eri maankäyttöluokista,

jolloin vastekerroksessa on neuroneita yhtä paljon kuin luokittelutulokseen halutaan luokkia.

[Kanellopoulos et al. 1991]

Page 49: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

43

Kuva 5.3: Monikerros-perceptron neuroverkon rakenne.

Monikerros-perceptron neuroverkon rakenne on helppotajuinen ja sen opettaminen onnistuu

periaatteeltaan yksinkertaisella virheen takaisinkorjausmenetelmällä (error backpropagation).

Opettamisessa syötetään verkolle dataa ja verrataan verkosta saatavaa vastetta haluttuun tulokseen.

Seuraavaksi korjataan verkon kytkentöjen painoja siten, että vasteesta saataisiin halutun tuloksen

kaltainen. Operaatiota toistetaan kunnes vaste ei enää eroa merkittävästi halutusta tuloksesta.

Takaisinkorjausmenetelmä on nopea, mikäli voidaan käyttää rinnakkaista prosessointia.

Menetelmän huonot puolet tulevat esiin suurella verkolla, jolloin verkon opettaminen vie paljon

laskenta-aikaa eikä silloin iteraatiota voi toistaa kovinkaan montaa kertaa. Verkon opettaminen

vaatii lisäksi suuren opetusjoukon käyttämistä. Sopivien painojen löytyminen ei aina onnistu ja

ongelmaan parhaiten sopivan verkon arkkitektuurin valinta on vaikeaa. Usein joudutaankin

kokeilemaan erilaisia valistuneita arvauksia kunnes verkolle löydetään tarpeeksi hyvä rakenne.

[Törmä 1997]

5.2. Perinteisiä luokittelijoita

AISA-kuvat luokiteltiin myös perinteisillä Bayesin päätösteorian sekä minimietäisyyden

algoritmeilla, koska hyperspektridatalle kehitettyjen luokittelijoiden tuloksia haluttiin verrata myös

perinteisten luokittelijoiden kanssa. Näitä ohjattuja luokittelualgoritmeja on käytetty paljon

erilaisten multispektrikuvien analysoinneissa. Esimerkiksi 70- sekä 80-luvuilta lähtien Landsat-

sekä SPOT-satelliitit ovat tuottaneet runsaasti dataa. Satelliittidataa on luokiteltu Bayesin sekä

minimietäisyyden -algoritmeilla lukuisissa eri tutkimuksissa. Luokittelussa Bayesin päätösteorian

avulla on usein käytetty suurimman uskottavuuden (Maximum Likelihood) menetelmää [Stahler

1980]. Perinteisiä luokittelijoita on useimmiten käytetty erilaisten kasvi- tai maalajien

luokittelussa, esimerkiksi puuvillaviljelysten luokittelu [Dutta et al. 1994].

Page 50: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

44

5.2.1. Bayesin päätösteoria

Luonnon materiaalien spektraalisessa heijastuskuviossa tapahtuu luonnollista vaihtelua materiaalin

pinnan rakenteen takia. Lisäksi heijastus muokkaantuu ilmakehän, kohinan sekä topografian

vaikutuksesta. Yhteen pikseliin voi myös sekoittua eri materiaaleja [Campbell 1996], joten

luokkien rajat eivät ole yksiselitteisiä. Luokittelussa Bayesin päätösteorian avulla käytetään

hyväksi tilastollisia mittoja. Luokille lasketaan opetusalueiden avulla todennäköisyysjakaumia

kuvaavat tiheysfunktiot ja luokitettavan pikselin luokka määräytyy sen funktion mukaan, joka

antaa pikselille suurimman todennäköisyyden.

Esitetään systeemin luokkia symboleilla iw , missä i = 1,2,...,n ja n on luokkien lukumäärä.

Olkoon x hahmovektori, joka saa arvonsa d-ulotteisesta piirreavaruudesta. Jos luokittelussa

käytetään piirteinä suoraan instrumentista saatavia kanavia, eikä kanavista lasketa uusia piirteitä,

niin d on alkuperäisten kanavien lukumäärä ja x -vektorin arvot ovat kyseisten kanavien

kirkkausarvoja. Luokittelussa Bayesin päätösteorian avulla määritetään todennäköisyydet:

( )xwP i . Nämä kuvaavat todennäköisyyttä, jolla x kuuluu oikeaan luokkaan iw ja niitä

kutsutaan a posteriori todennäköisyydeksi. Luokittelussa hahmovektorille x lasketaan eri

luokkien tuottamat a posteriori todennäköisyydet ja valitaan niistä suurin. Suurimman a posteriori

todennäköisyyden antava luokka merkitään edustamaan luokiteltavan pikselin luokkaa. Samalla

tavalla lasketaan uudet a posteriori todennäköisyydet kuvan jokaiselle pikselille. A posteriori

todennäköisyyksiä ei saada laskettua suoraan, mutta niihin voi käyttää Bayesin sääntöä:

( ) ( )( )xP

PwxPxwP ii

i

∗= , (6.5)

missä:

( ) ( )∑=

=n

iii PwxPxP

1 (6.6)

on x :n yhteistiheysfunktio ja )( iwxP eli luokan i tiheysfunktio voidaan selvittää opetusdatan

avulla.

Page 51: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

45

Bayesin päätösteorian käyttö ohjatussa luokittelussa on hyvin suosittua ja sillä saadaan yleensä

hyviä tuloksia multispektrikuvien luokittelussa [Richards, Xiuping 1999]. Algoritmit ovat järeitä ja

tehokkaita ja ne vaativat runsaasti laskentaa sekä tietokoneen resursseja. Tämä menetelmä vaatii

kuitenkin enemmän opetusalueiden laadulta kuin muut ohjatun luokittelun menetelmät.

Opetusalueiden dataa estimoidaan erilaisilla, yleensä Gaussin, tiheysfunktioilla. Sopivan

tiheysfunktion valinta voi olla vaikeaa, eikä takeita sen löytymisestä aina ole. Opetusalueita ei

todennäköisesti pystytä estimoimaan millään siistillä funktiolla, jos alueet on valittu huonosti

[Campbell]. Tällöin täytyy käyttää ei-parametrisia tiheysfunktioita.

5.2.2. Minimietäisyyden luokittelija

Minimietäisyyden luokittelussa lasketaan ensin luokkien keskipisteet, jotka saadaan laskettua

opetusalueiden heijastusarvojen keskiarvoista. Luokkien keskipisteiden laskemiseen voidaan

käyttää myös muita mittoja, esimerkiksi mediaania. Seuraavaksi lasketaan euklidiset etäisyydet

luokiteltavan pikselin sekä jokaisen luokan keskipisteen väliltä. Pikseli ohjataan siihen luokkaan,

jonka kanssa niiden välinen etäisyys on pienin. Minimietäisyyden menetelmä on yksinkertainen ja

helppo toteuttaa, mutta nykyään se ei ole kovinkaan yleinen luokittelualgoritmi

kaukokartoituksessa. Menetelmä ei ole kovinkaan tarkka, joten tehokkaammat algoritmit ovat

syrjäyttäneet sen. Päällekkäiset sekä epämääräiset luokat aiheuttavat usein vaikeuksia

minimietäisyyden menetelmässä. Toisaalta luokittelija on helposti laajennettavissa, sillä luokkien

keskipisteitä sekä etäisyysmittoja voidaan laskea erilaisilla metodeilla. Minimietäisyysluokittelija

on myös optimaalinen kun luokilla on samat ortogonaaliset kovarianssimatriisit. [Campbell 1996]

Page 52: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

46

6. Työssä käytetty AISA-data sekä maastotyöt

Tässä työssä käytettiin kahdelta eri koealueelta havaittua hyperspektridataa. Osa datan sisältämistä

virheistä korjattiin jo esikäsittelyvaiheessa. Geologian Tutkimuskeskus suoritti koealueiden

maastotyöt.

6.1. AISA-data

Lammin sekä Paraisten koealueet kuvattiin Geologian tutkimuskeskuksen toimesta syyskuussa

1999. Hankkeen tarkoituksena oli tutkia hyperspektrikaukokartoitusmenetelmien käyttöä

geologisiin tutkimuksiin. Alueet kuvattiin Metsäntutkimuslaitoksen AISA-spektrometrillä. Datan

esikäsittely tehtiin METLA:ssa korjaamalla kuvauslinjat yhtenäiskoordinaatistoon. Lisäksi osa

aineiston geometrisistä virheistä korjattiin.

Lammin alue on pohjois-etelä-suunnassa oleva yli 50 km pitkä ja 2 km leveä suorakaide. Se alkaa

etelässä Mommilan kylästä, keskus osuu Lammin kylän tietämille ja alue jatkuu aina Padasjoen

kuntaan Vesijaon kylään. Koealue sisältää paljon erilaisia jääkauden aikaisia maalajeja,

kerrostumia sekä muodostumia, joita jäämassan reuna sekä sulamisvedet muokkasivat ja

lajittelivat. Lisäksi suuri osa alueesta on ollut muinaisten Baltian jääjärven sekä Yoldiameren

vedenpinnan alla, jolloin alueen eteläosan pohjasedimentit muodostuivat. Alueen poikki kulkevalla

Salpausselkä-vyöhykkeellä sijaitsee tyypillisiä jäämassan reunan sekä jäätikköjokien muokkaamia

harjuja, reunamuodostumia sekä moreenikumpuja ja -selänteitä. [Törmä et al. 2001]

Paraisten koealue sijaitsee Paraisten kaivosalueen tietämillä ja sen ympäristössä, sisältäen myös

Paraisten keskustan. Alue sisältää paljon kaupunki- sekä pientaloalueita, havu- ja lehtipuita,

rannikkokasvillisuutta, kallioita sekä merta. Kuvalle on eksynyt myös jokunen pilvi, mikä heikensi

tulkittavuutta kyseisillä alueilla. Alue oli valittu GTK:n hankkeeseen kaivosten

ympäristövaikutusten selvittämiseksi.

Page 53: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

47

Lammin koealue kuvattiin keskimäärin 1000 metrin korkeudesta ja lentonopeus oli 200 km/h.

Näin yhden pikselin kooksi saatiin 1.1 x 1.1 metriä ja mittauslinjojen leveydeksi 384 metriä.

Vierekkäisten lentolinjojen peitto valittiin 84 metriin. Kuvausten aikana sää muuttui huonommaksi

ja lentokoneen rauhattomuus lisääntyi. Lentolinjojen sivuttaispeitto ei enää riittänyt vaan

kuvauslinjojen väliin syntyi katvealueita. Samalla pilvisyys lisääntyi, mikä näkyy kuvauslinjojen

välisinä valoisuuseroina. Ensimmäinen kuvauslinja näkyy selvästi kirkkaimpana ja sen jälkeen

kuvauslinjat tummuvat nopeasti. Huonon sään takia kuvattiin kuusi lentolinjaa alun perin

suunnitellun kahdeksan lentolinjan sijaan. Mittauslennot tehtiin päivällä, auringon ollessa

korkeimmillaan, jolloin näkyvän valon määrä on suurimmillaan ja varjot ovat mahdollisimman

lyhyitä [Ruohomäki et al. 2002]. Varjoja näkyi kuitenkin kuvilla, sillä syyskuussa ei aurinko ole

keskipäivälläkään kovin korkealla. Myöhäinen vuodenaika aiheutti myös sen, että lehtivihreä oli

alkanut hävitä joistain kasveista sekä osa pelloista oli korjattu.

Taulukko 6.1: Lammi sekä Paraisten alueiden kuvauksissa käytettyjen kanavien aallonpituusalueet.

Kanava Aallonpituus MIN (nm) Aallonpituus MAX (nm) 1 448.99 456.27 2 470.84 478.13 3 491.24 498.53 4 520.38 527.67 5 548.06 555.35 6 572.83 580.12 7 597.60 604.89 8 620.91 628.20 9 644.67 652.27 10 667.46 675.05 11 696.32 703.91 12 744.93 752.52 13 776.83 784.42 14 796.57 804.17 15 840.62 848.22 16 857.33 864.93 17 866.45 874.04

AISA ohjelmoitiin tallentamaan 17 eri kanavaa, jotka sijaitsivat näkyvän valon sekä lähi-

infrapunasäteilyn aallonpituuksilla. Vastaavat aallonpituudet ovat noin 450-875 nm. Kanavien

leveydeksi saatiin noin 7-8 nm ja ne sijaitsivat kutakuinkin tasaisesti jakautuneena näkyvän valon

alueella. Lähi-infrapuna-alueella kanavien keskinäinen sijainti vaihteli. Kuvatut alueet olivat

laajoja, joten 17 kanavaa sisältävän 12 bittisen kuvadatan koko oli noin 4.5 GB sekä Lammin että

Paraisten alueelta.

Page 54: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

48

6.2. AISA-datan esikäsittely

Datan esikäsittelyssä tehtiin radiometriset sekä geometriset korjaukset sekä kuvauslinjoista

muodostettiin yhtenäiskoordinaatistossa oleva mosaiikki. Esikäsittely tehtiin METLA:ssa VTT:n

kehittämällä ohjelmalla. Radiometrisessä korjauksessa instrumentin havaitsemasta raakadatasta

korjattiin erilaisia virheitä. Auringon korkeudesta johtuvat radianssin muutokset korjattiin käyttäen

Lambertin mallia. Ilmakehän vaikutusta ei kuitenkaan huomioitu, mutta erot instrumentin CCD-

kennon eri pikseleiden välillä korjattiin vertaamalla kunkin CCD-kennon pikselin mittaamaa

maastossa olevaa kalibrointikohdetta [Mäkisara et al. 1994]. Geometrisessä korjauksessa käytettiin

apuna differentiaali GPS-instrumentin havaintoja sekä lentokoneen navigointitietoja. Oikaisun

tärkeänä apuna käytettiin myös Maanmittauslaitoksen numeerista peruskarttaa ja oikaisun tarkkuus

vaihteli sen puitteissa metreistä muutamiin kymmeniin metreihin. Käytännössä oikaisu tehtiin

osoittamalla kontrollipisteitä AISA-datan sekä peruskartan välillä.

6.3. Maastotyöt

Maastotöitä tehtiin Lammin koealueella. Aineiston radiometristä kalibrointia varten maastoon

sijoitettiin signaalipintoja ennen kuvausta. Pintoina käytettiin aumamuovia, jonka toinen puoli oli

valkea ja toinen musta. Muovin tarkat heijastusominaisuudet määritettiin laboratoriomittauksilla.

Muovit sijoitettiin ensimmäisen kuvauslinjan alkuun ja niiden yli lennettiin vielä uudelleen

mittauslennon lopuksi. Koealueen kuvauksen jälkeen, vuosina 2000 ja 2001, suoritettiin alueella

maastoinventointia, jolloin valittiin 260 kasvillisuudeltaan ja maalajiltaan yhtenäistä aluetta. Nämä

koealat piirrettiin maastossa vektorikuvioina AISA-kuvan päälle, jolloin alueiden sijainti saatiin

tarkoin määriteltyä. Tämä oli tärkeää sillä osa koealoista oli hyvin pieniä ja tarkoin määriteltyjä

(esimerkiksi yksittäiset puiden latvukset). Koska AISA-kuvan oikaisutarkkuus oli kymmeniä

metrejä, niin pelkkien koordinaattien perusteella pienten kohteiden sijainti olisi todennäköisesti

pielessä. [Ruohomäki et al. 2002]

Koealoista saatu heijastus oli useimmiten peräisin kasvillisuudesta. Erityisesti tiheät lehti- sekä

kuusimetsät, peltojen nurmiviljelyt sekä sokerijuurikaspellot muodostivat heijastukseltaan

yhtenäisiä alueita. Harvemmissa metsissä varjot aiheuttivat suuria vaihteluita heijastusspektriin ja

Page 55: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

49

lisäksi heijastukseen vaikutti maaston aluskasvillisuus. Viljapellot olivat jo kuvausajankohtana

puituja tai tuleentuneita, joten niissä ei ollut lehtivihreää ja niiden heijastukseen vaikutti

useimmiten myös maaperän heijastusominaisuudet. Paljaan maan heijastusspektrejä saatiin

enimmäkseen maanteistä, maanottopaikoista sekä kynnetyistä pelloista. Näiden alueiden maalajeja

oli useimmiten sora, hiekka, hieta, hiesu ja savi. [Ruohomäki et al. 2002]

Lammin alueen koealoilta havaittiin kasvillisuus, maaperä ja kosteus. Kasvillisuuden

inventoinnissa erotettiin puusto, josta kuvattiin puulaji, ikä ja peitteisyys sekä aluskasvillisuus,

josta pääkasvilaji, lehtivihreän määrä ja kosteusolosuhteet havaittiin. Peltoalueilta kirjattiin

viljelykasvi sekä pellon viljelytilanne. Maaperän ominaisuuksia tutkittiin erikseen pinta-, sekä

pohjamaan osalta. Maaperän maalaji kirjattiin pintamaan arvioinnin, maaperäkartan sekä

kairauksen avulla. Koealojen kosteusominaisuudet arvioitiin silmämääräisesti. Lopuksi alueilta

raportoitiin mitkä kohteet pääosin aiheuttivat heijastuksen ja kirjoitettiin lyhyt kuvaus alueesta.

Muutamilta koealoilta otettiin valokuvia [Törmä et al. 2001].

Page 56: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

50

7. Luokittelu

AISA:lla havaitusta hyperspektridatasta valittiin pienempi alue, joka luokiteltiin Spectral Angle

Mapper, Spectral Correlation Mapper, Spectral Unmixing, Perceptron-neuroverkko, Bayesin

päätössäännön sekä minimietäisyyden algoritmeilla. Tarkoituksena oli vertailla eri algoritmien

toimintaa ja suoritusaikoja. Luokittelualgoritmeille pyrittiin löytämään mahdollisimman hyvät

opetusaluejoukot. Työssä kokeiltiin useita eri opetusaluejoukkoja, joista valittiin parhaiten

vertailuun sopivat opetusalueet. Useimmat luokittelualgoritmit vaativat myös erilaisia parametreja

tai kynnysarvoja, jotka vaikuttivat luokitteluun. Erilaisia parametrien arvoja vertailtiin ja etsittiin

parhaan lopputuloksen antavat arvot.

Hyperspektrikuville kehitetyt luokittelualgoritmit käyttävät luokittelussa referenssimateriaalina

opetusalueiden heijastusarvoista muodostettuja referenssispektrejä. Nämä referenssispektrit

vaikuttavat oleellisesti hyperspektrikuvan luokitteluun. Eri metodein muodostetut heijastusspektrit

eroavat hiukan toisistaan, joten myös niitä vertailtiin sekä tutkittiin miten eri tavoin muodostetut

heijastusspektrit vaikuttavat luokittelun lopputulokseen.

7.1. Opetusalueiden valinta

Opetusalueet valittiin samalta alueelta kuin luokiteltava kuva. Opetusalueiksi kelpuutettiin puhtaita

kasvillisuuden, maaperän tai keinotekoisten materiaalien alueita, joilta saatiin yhtenäinen heijastus.

Koealueiden suuruus vaihteli, mutta yleensä ne olivat useamman sadan pikselin kokoisia tai

suurempia. Ainoastaan rakennukset-luokkaa edustaneiden opetusalueiden pinta-alat olivat

pienempiä.

Opetusalueiden valinnassa käytettiin hyväksi aikaisemmin tehdyissä maastotöissä kerättyjen

koealueiden tietoja. Näitä koealueita ei kuitenkaan käytetty suoraan luokittelun

referenssimateriaalina. Opetusalueet valittiin siten, että ne edustavat kaikkia luokiteltavan kuvan

tärkeitä maaston tai ihmisen tekemiä kohteita. Opetusalueiksi kelpasivat siten seuraavanlaiset

kohteet: lehtimetsä, havumetsä, rakennukset, tiet, ruoho, sokerijuurikaspellot, kynnöspellot sekä

muut viljapellot.

Page 57: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

51

Hyperspektri-instrumentilla saadaan enemmän tietoa eri materiaalien heijastuksista ja kohteiden

karakterisoivat ominaisuudet tulevat paremmin esille. Toisaalta – myös saman kasvillisuusluokan

sisältä voi löytyä vaihtelua. Joskus tämä vaihtelun havaitseminen on hyödyllistä ja joskus siitä on

vain haittaa. Esimerkiksi kasvisairauksien etsimisessä kuusimetsästä on tärkeää, että kuusimetsästä

erotetaan terveet ja sairastuneet alueet. Toisaalta kasvilajien luokittelussa kuusimetsästä saatavan

heijastuksen toivotaan olevan mahdollisimman homogeeninen. Käytännössä hyperspektri-

instrumenttien tarkkuudet ovat useimmiten sitä luokkaa, että niillä voidaan selvästi havaita

eroavaisuuksia saman kasvillisuusluokan heijastuksessa. Siksi joudutaan keräämään enemmän

referenssidataa saman kasvillisuusluokan sisältä. Tämän takia hyperspektridatan luokittelussa

tarvitaan enemmän opetusalueita kuin perinteisissä luokitteluissa.

7.2. Heijastusspektrien analysointi

Hyperspektrikuvien, jotka oli kuvattu Lammin alueelta, heijastusspektrejä analysoitiin erilaisin

metodein. Lammin alueen maasto sisältää erilaisia kasvillisuusluokkia, eikä paljasta maaperää

juurikaan näy kasvillisuuden alta. Siksi tässä työssä tutkittiin, miten eri kasvillisuusluokat voidaan

erottaa toisistaan. Erilaisia kasvillisuusluokkia edustivat paju, koivu, mänty, kuusi, heinä ja

sokerijuurikas. Näihin kasvillisuusluokkiin päädyttiin, koska maastoinventoinnissa oli runsaasti

tietoa kyseisistä luokista. Erilaisia viljapeltoluokkia ei otettu tähän vertailuun mukaan, sillä

kuvausajankohtana vilja oli tuleentunut ja useat pellot olivat jo korjattu. Näin viljapeltojen

heijastukseen vaikutti maaperän laatu sekä tuleentuneet oljenkorret, joiden heijastuksesta ei juuri

löytynyt ominaisia piirteitä eri viljakasviluokkien välillä. Kasvillisuusluokista kuusi otettiin myös

tarkemman analysoinnin kohteeksi, sillä kuusi oli ainoa luokka, jolle löytyi riittävästi

maastoinventoinnissa kerättyjä erilaista maaperää sisältäviä koealoja. Valoisuusolosuhteiden

muutosta sekä erilaisten maaperälajien vaikutusta kuusen heijastusspektriin tutkittiin.

7.2.1. Kasvillisuusluokkien erottumisen analysointia luokkien välisten spektrikulmien avulla

Samoille kasvillisuusluokille löytyi Lammin koealueelta kymmeniä koealoja, jotka erosivat

toisistaan mm. pinta-alan, sijainnin, maaperän, aluskasvillisuuden sekä valoisuusolosuhteiden

mukaan. Vertailusta karsittiin sellaiset koealat pois, joiden heijastus ei ollut pääosin peräisin

Page 58: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

52

kyseisestä kasvillisuusluokasta. Esimerkiksi taimikoita ei otettu mukaan, sillä niistä saatuun

heijastukseen vaikuttaa paljon myös maaperän tai aluskasvillisuuden heijastus. Lisäksi vertailusta

pyrittiin poistamaan sellaisia koealoja, joiden ominaisuudet poikkesivat merkittävästi saman

kasvillisuusluokan ominaisuuksista ja joiden heijastus ei vastannut kyseisen kasvillisuusluokan

tyypillistä heijastusta. Jäljelle jääneiden koealojen pikseleiltä laskettiin keskiarvot kaikille

hyperspektrikuvan 17 eri kanavalle. Näistä keskiarvoista saatiin heijastusspektrit, jotka edustivat

kukin omaa koealaa. Nämä heijastusspektrit luokiteltiin edellä mainittujen kasvillisuusluokkien

mukaan, ja kunkin luokan heijastusspektreistä laskettiin keskiarvot eri kanaville, jotka edustavat

eri kasvillisuusluokkien keskimääräisiä heijastusspektrejä. Lisäksi saman luokan heijastusspektrien

keskihajonnat laskettiin kullekin kanavalle. Vähentämällä keskimääräisestä heijastusspektristä

saman luokan keskihajonnat, saatiin kyseisen luokan heijastusspektrin alakvartiili. Yläkvartiili

saatiin edelleen laskemalla yhteen keskimääräinen heijastusspektri sekä keskihajonta. Ylä- ja

alakvartiilit kuvaavat sellaisia käyriä, että saman luokan heijastusspektrit useimmiten osuvat

kvartiilien välille, kuten kuvasta 7.1 voidaan havaita. Tässä työssä käytetyt kvartiilit eroavat

yleisesti käytetyistä kvartiileista, jotka määritellään siten, että x-prosenttia havainnoista on

kvartiilin ylä/alapuolella.

PAJUALUEIDEN KESKIMÄÄRÄINEN HEIJASTUSSPEKTRI JA SEN KVARTIILIT

0

1000

2000

3000

4000

5000

6000

7000

8000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

KANAVAT

HEI

JAST

USA

RVO

KESKIARVO

YLÄKVARTIILI

ALAKVARTIILI

Paju1

Paju2

Paju3

Kuva 7.1: Pajualueiden keskiarvoista laskettu keskimääräinen heijastusspektri ja sen ylä- ja

alakvartiili sekä yksittäisiä pajun heijastusspektrejä.

Kasvillisuusluokkien heijastusspektrejä vertailtiin laskemalla niiden välisten spektrikulmien

arvoja. Heijastusspektrejä käsiteltiin vektoreina ja niiden välisten spektrikulmien arvot laskettiin

vektoreiden pistetulon avulla, samaan tapaan kuin kappaleen 5.1.1. Spectral Angle Mapper –

algoritmilla. Vertailussa käytettiin koealojen pikseleistä laskettuja keskiarvomittoja. Näin

Page 59: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

53

heijastusspektrit edustivat aina tietyn pikselijoukon keskimääräistä heijastusta. Näin saadut

tulokset eroavat Spectral Angle Mapper –luokittelusta, jossa spektrikulmien arvot laskettiin

erikseen jokaiselle luokiteltavan kuvan pikselille. Hyperspektridata sisälsi paljon valoisuuseroja,

joten eri luokkien väliset mitat oli kätevä laskea heijastusspektrien välisinä kulmina. Näin

valoisuuserot eivät vaikuta tuloksiin merkittävästi, kuten kappaleessa 7.6.4. tullaan huomaamaan.

Keskimääräisten spektrien lisäksi muodostettiin ylä- ja alakvartiilit ja spektrikulmien arvot

laskettiin myös näiden välille, sillä haluttiin tutkia myös kasvillisuusluokkien sisältämien

heijastusspektrien hajonnan vaikutusta spektrikulman suuruuteen ja sen kautta myös luokkien

erottuvuuteen. Jos tarkastellaan ainoastaan keskimääräisiä heijastusspektrejä, unohdetaan se

tosiasia, että saman kasvillisuusluokan sisällä heijastusominaisuudet voivat vaihdella.

Spektrikulmien laskeminen pelkästään keskimääräisille heijastusspektreille voi tuottaa

hyvännäköisiä tuloksia, joissa eri luokat erottuvat toisistaan hyvin. Jos luokkien sisältämissä

heijastusspektreissä on hajontaa, niin todellisuudessa luokkien erottuminen ei ole yhtä varma asia.

Kvartiilit otettiin mukaan, jotta saataisiin todellisempia mittoja luokkien erottuvuudesta. Eri

kasvillisuusluokkien heijastusarvojen keskihajonnan todettiin pysyttelevän näiden kvartiilien

välillä.

Heijastusspektrien väliset spektrikulmien arvot saatiin kiinnittämällä erikseen kunkin

kasvillisuusluokan keskimääräinen heijastusspektri referenssispektriksi ja laskemalla sen sekä eri

luokkien keskimääräisten heijastusspektrien sekä niiden ylä- ja alakvartiilien väliset spektrikulmat.

Spektrikulmien arvot havainnollistettiin pylväsdiagrammeilla kuvissa 7.2 – 7.7. Diagrammin

otsikko kertoo, minkä kasvillisuusluokan keskimääräinen heijastusspektri on referenssispektrinä ja

pylväät kuvaavat referenssispektrin sekä muiden kasvillisuusluokkien heijastusspektrien välisten

spektrikulmien arvoja. Spektrikulman arvo referenssispektrin ja yläkvartiilin välillä ei välttämättä

täydy olla suurempi kuin referenssispektrin ja alakvartiilin välillä. Myöskään referenssispektrin ja

keskimääräisen heijastusspektrin välinen spektrikulman arvo ei välttämättä sijaitse kvartiilien

välissä. Näistä kolmesta luvusta voidaan kuitenkin päätellä, että useimmiten kyseisen luokan

heijastusspektrien sekä referenssispektrin välinen spektrikulma sijaitsee näiden lukujen välillä.

Luokka erottuu muista luokista hyvin, jos spektrikulmat ovat pienempiä kyseisen luokan

keskimääräisen heijastusspektrin sekä saman luokan ylä- ja alakvartiilikäyrien välillä kuin

kyseisen luokan keskimääräisen heijastusspektrin sekä muiden luokkien keskimääräisten spektrien

sekä niiden ylä- ja alakvartiilikäyrien välillä.

Page 60: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

54

PAJU

0,00

0,02

0,04

0,06

0,08

0,10

0,12

0,14

0,16

PAJU KOIVU MÄNTY KUUSI HEINÄ SOKERIJUURI

SPEK

TRIK

ULM

AN

AR

VO

KESKIARVO

YLÄKVARTIILI

ALAKVARTIILI

Kuva 7.2: Pajun keskimääräisen heijastusspektrin sekä eri kasvien heijastusspektrien, sekä niiden

ylä- ja alakvartiilien, välisten spektrikulmien vertailua.

Kuvassa 7.2 referenssispektrinä on paju, joten spektrikulmat on laskettu pajun

keskimääräisen heijastusspektrin sekä eri kasvillisuusluokkien (paju, koivu, mänty, kuusi,

heinä ja sokerijuurikas) keskimääräisten heijastusspektrien sekä niiden ylä- ja

alakvartiilikäyrien välillä. Ensimmäisen pylvään arvo on 0, sillä vertailussa on sama pajun

keskimääräisten heijastusspektri. Kuvasta voidaan päätellä, että pajun heijastusspektri

sekoittuu koivun sekä sokerijuurikkaan kanssa laskettaessa spektrien välisiä spektrikulmia.

KOIVU

0,00

0,02

0,04

0,06

0,08

0,10

0,12

0,14

0,16

KOIVU PAJU MÄNTY KUUSI HEINÄ SOKERIJUURI

SPEK

TRIK

ULM

AN

AR

VO

KESKIARVO

YLÄKVARTIILI

ALAKVARTIILI

Kuva 7.3: Koivun keskimääräisen heijastusspektrin sekä eri kasvien heijastusspektrien, sekä niiden

ylä- ja alakvartiilien, välisten spektrikulmien vertailua.

Kuvan 7.3 mukaan koivun spektrikulmien arvot voidaan erottaa hyvin muista luokista ottamatta

huomioon pajua, joka saattaa sekoittua koivun kanssa. Koivun ja sokerijuurikkaan väliset

spektrikulmat ovat niin suuria, että ne pitäisi voida erottaa toisistaan. Koivun sekä männyn, kuusen

Page 61: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

55

ja heinän spektrikulmat ovat selvästi niin suuria, että mitään ongelmia koivun sekoittamiseksi

näiden luokkien kanssa ei ole, kun vertaillaan luokkien heijastusspektrien välisiä spektrikulmia.

MÄNTY

0,00

0,02

0,04

0,06

0,08

0,10

0,12

0,14

0,16

MÄNTY PAJU KOIVU KUUSI HEINÄ SOKERIJUURI

SPEK

TRIK

ULM

AN

AR

VO

KESKIARVO

YLÄKVARTIILI

ALAKVARTIILI

Kuva 7.4: Männyn keskimääräisen heijastusspektrin sekä eri kasvien heijastusspektrien, sekä niiden

ylä- ja alakvartiilien, välisten spektrikulmien vertailua.

Mäntyluokan sisällä spektrikulmien hajonta on erittäin pientä kuvan 7.4 mukaan. Spektrikulmien

suuruudet mäntyluokan sisällä ovat selvästi muita luokkia pienempiä. Ainoastaan männyn ja

kuusen väliset spektrikulmat voivat sekoittua, muuten mäntyluokka pitäisi olla helppo erottaa

muista luokista laskettaessa luokkien välisiä spektrikulmia.

KUUSI

0,00

0,02

0,04

0,06

0,08

0,10

0,12

0,14

0,16

0,18

0,20

0,22

KUUSI PAJU KOIVU MÄNTY HEINÄ SOKERIJUURI

SPEK

TRIK

ULM

AN

AR

VO

KESKIARVO

YLÄKVARTIILI

ALAKVARTIILI

Kuva 7.5: Kuusen keskimääräisen heijastusspektrin sekä eri kasvien heijastusspektrien, sekä niiden

ylä- ja alakvartiilien, välisten spektrikulmien vertailua.

Myös kuusiluokan sisällä laskettujen spektrikulmien hajonta on hyvin pientä, kuten kuvan 7.5

diagrammista ilmenee. Kuuset on helppo erottaa muista luokista, mutta sekoittuminen on

Page 62: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

56

mahdollista mäntyluokan kanssa. Kuusen ja muiden luokkien kanssa laskettujen spektrikulmien

arvojen hajonta oli suurta.

HEINÄ

0,000,020,040,060,080,100,120,140,160,180,200,22

HEINÄ PAJU KOIVU MÄNTY KUUSI SOKERIJUURI

SPEK

TRIK

ULM

AN

AR

VO

KESKIARVO

YLÄKVARTIILI

ALAKVARTIILI

Kuva 7.6: Heinän keskimääräisen heijastusspektrin sekä eri kasvien heijastusspektrien, sekä niiden

ylä- ja alakvartiilien, välisten spektrikulmien vertailua.

Heinän sekä muiden luokkien väliset spektrikulmien arvot sekoittuivat helposti keskenään.

Varsinkin heinän erottaminen männystä ja kuusesta oli vaikeaa.

SOKERIJUURIKAS

0,00

0,02

0,04

0,06

0,08

0,10

0,12

0,14

0,16

SOKERIJUURI PAJU KOIVU MÄNTY KUUSI HEINÄ

SPEK

TRIK

ULM

AN

AR

VO

KESKIARVO

YLÄKVARTIILI

ALAKVARTIILI

Kuva 7.7: Sokerijuurikkaan keskimääräisen heijastusspektrin sekä eri kasvien heijastusspektrien,

sekä niiden ylä- ja alakvartiilien, välisten spektrikulmien vertailua.

Spektrikulmien hajonta oli erittäin pientä homogeenisen sokerijuurikasluokan sisällä. Muiden

luokkien kanssa spektrikulmien arvot olivat selvästi suurempia. Näin sokerijuurikasluokan

erottaminen muista luokista onnistuu hyvin vertailemalla luokkien välisiä spektrikulmia.

Page 63: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

57

7.2.2. Kuusen heijastusspektrin analysointia

Kasvillisuusluokkien erottumisen analysoinnissa karsittiin koealoja, joiden ominaisuudet

poikkesivat merkittävästi saman kasvillisuusluokan ominaisuuksista. Näin kuusiluokkaan jäi 34

tyypillistä suomalaista kuusimetsää sisältävää aluetta. Alueiden koot olivat tyypillisesti joitain

satoja tai tuhansia pikseleitä. Kuusialueilta saatiin alueiden heijastusspektrit laskemalla pikselien

keskiarvot erikseen 17 eri kanavalle, kuten edellisessäkin kappaleessa tehtiin. Nämä

heijastusspektrit asetettiin valoisuusolosuhteidensa mukaiseen järjestykseen ja laskettiin näiden

spektrien sekä keskimääräisen kuusenspektrin väliset spektrikulmat. Keskimääräinen

kuusenspektri saatiin kuusialueiden heijastusspektrien keskiarvosta. Tutkittaessa maaperän

vaikutusta kuusen spektriin luokiteltiin kuusialueiden heijastusspektrit maaperälajien karkeuden

mukaan. Spektrikulmien arvot laskettiin näiden heijastusspektrien sekä keskimääräisen

kuusenspektrin välille.

KUUSEN HEIJASTUSSPEKTREJÄ

0

500

1000

1500

2000

2500

3000

3500

4000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

KANAVAT

HEI

JAST

USA

RVO

KUUSIALUE

KUUSI1

KUUSI2

KUUSI3

Kuva 7.8: Erilaisia kuusen heijastusspektrejä. Kuusi 1, 2 ja 3 ovat yksittäisiä kuusialueiden pikseleitä

ja kuusialue on laajemman alueen pikseleistä laskettu heijastusspektri.

Kuusialue käsittää valoisia kuusenlatvoja, varjoja sekä metsänpohjaa ja alueen

heijastusominaisuudet vaihtelevat voimakkaasti. Siksi yksittäisten pikselien arvot voivat poiketa

selvästi alueen muista pikseleistä. Kun koko alueesta lasketaan keskimääräinen heijastusspektri,

saadaan koko aluetta kuvaava tunnusluku, mutta samalla menetetään tieto alueen tekstuurista.

Kuvassa 7.8 on kuusialueen pikseleistä laskettu heijastusspektri, sekä muutama yksittäisen

kuusipikselin heijastusspektri.

Page 64: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

58

VALAISTUKSEN VAIKUTUS SPEKTRIKULMAAN

0

0,025

0,05

0,075

0,1

0,125

0,15

0,175

0,2

0,225

0,25

<- HYVÄ VALAISTUS HUONO ->

SPEK

TRIK

ULM

AN

AR

VO

Kuva 7.9: Kuusialueiden välisten spektrikulmien muuttuminen valoisuuden vähentyessä. Paksumpi

viiva on aineistoon sovitettu eksponentiaalinen käyrä. Spektrikulma on laskettu keskimääräisen

kuusen heijastusspektrin sekä kuusialueiden, joiden valaistusolosuhteet vaihtelevat, heijastusspektrien

välille.

Valaistuksen vaikutus kuusialueiden heijastusspektrien välisiin spektrikulmiin näkyy kuvassa 7.9.

Pienet valoisuuden erot eivät juuri vaikuta spektrikulman arvoon, mutta valoisuuden vähetessä

spektrikulman arvo kasvaa. Lisäksi on huomioitava, että valaistuksen ollessa huonoa

spektrikulmien arvojen hajonta kasvaa melkoisesti ja näin esimerkiksi Spectral Angle Mapper -

luokittelun epävarmuus lisääntyy.

Page 65: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

59

MAAPERÄN VAIKUTUS KUUSEN SPEKTRIKULMIIN

0

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

<- HIENOT MAALAJIT MAAPERÄ KARKEAT MAALAJIT ->

SPEK

TRIK

ULM

AN

AR

VO

Kuva 7.10: Erilaisen maaperän vaikutus kuusialueiden heijastusspektrien välisiin spektrikulmiin.

Spektrikulma on laskettu keskimääräisen kuusen heijastusspektrin sekä eri maalajeilla kasvaneiden

kuusialueiden heijastusspektrien välille.

Kuvan 7.10 mukaan erilaiset maalajit eivät näyttäisi vaikuttavan kuusen heijastusspektrien välisiin

kulmiin. Kuusialueet olivat hyvin peitteisiä, joten maaperän suora vaikutus alueiden

heijastusspektriin oli hyvin vähäinen. Maaperän on kuitenkin todettu vaikuttavan esimerkiksi

kasvin rakenteeseen ja sen kautta myös heijastukseen [Huete 1989]. Tämän toteamiseksi vaaditaan

kuitenkin huomattavasti suuremman koealuejoukon keräämistä sekä maastohavaintoja myös

kasvillisuuden rakenteesta.

7.3. Referenssispektrit

Hyperspektrikuvien luokittelussa luokiteltavan pikselin heijastusspektriä verrataan luokkien

referenssispektreihin, minkä perusteella pikselin luokka määräytyy. Referenssispektri vastaa

muodoltaan heijastusspektriä ja niitä on laskennassa helpoin käsitellä vektoreina, joiden dimensio

vastaa hyperspektridatan kanavien lukumäärää. Referenssispektrit voidaan hakea suoraan

spektrikirjastoista tai ne voidaan muodostaa kuvan opetusalueista laskemalla. Hyperspektrikuvan

hyvin tunnettujen pikseleiden heijastusspektrejä voidaan käyttää myös suoraan

referenssispektreinä. Hiukan harvinaisempi ja kalliimpi keino on käydä maastossa mittaamassa

esimerkiksi helikopteriin ripustetulla spektrometrillä referenssispektrejä.

Page 66: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

60

Tässä työssä referenssispektreiksi valittiin hyvin tunnettujen pikseleiden heijastusspektrejä. Lisäksi

heijastusspektrejä muodostettiin hyperspektrikuvan opetusalueista eri metodeilla. Kansainväliset

spektrikirjastot sisälsivät enimmäkseen erilaisten mineraalien spektrejä, joten Suomen

kasvillisuuden luokittelussa niistä ei ollut apua. Kun jokaiselle erilliselle luokalle haettiin useita

referenssispektrejä nousi lopullinen referenssispektrien määrä joissain tapauksissa yli sataan.

Hyvin tunnettujen pikselien heijastusspektrien valitseminen referenssispektreiksi oli nopeaa mutta

virhealtista. Valittuun pikseliin tuli tällöin kiinnittää erityisen paljon huomiota. Pikselin

heijastuksen tuli olla peräisin kyseisen, pikseliä edustavan, luokan materiaalin heijastuksesta.

Lisäksi referenssispektrin tuli edustaa mahdollisimman hyvin kyseisen luokan heijastusarvoja. Jos

luokan heijastusominaisuudet muuttuivat riittävästi saman luokan sisällä, jouduttiin samalle

luokalle etsimään uusia referenssispektrejä. Useimmiten eri luokille jouduttiin keräämään useita

referenssispektrejä, jotta kyseisen luokan heijastusominaisuudet saatiin määritettyä riittävän

tarkasti.

7.4. Eri tavoin muodostettujen referenssispektrien vertailu

Optimaalisen opetusalueen heijastusominaisuudet eivät juurikaan vaihtele alueen eri osissa.

Esimerkiksi tiheä sokerijuurikaspelto aiheutti hyvin tasaisen heijastuksen kuvattuna AISA:lla, kun

spatiaalinen erotuskyky oli noin yhden metrin luokkaa. Sen sijaan tiheäkin havumetsä oli

heijastusominaisuuksiltaan hyvin epätasainen. Korkeat puunlatvat aiheuttivat voimakkaan

heijastuksen sekä varjostivat latvojen välissä olevia havukerroksia, joiden heijastus oli vähemmän

intensiivistä. Kun saman opetusalueen heijastusominaisuudet vaihtelevat rajusti, on tältä alueelta

kerättyjen referenssispektrien valitsemiseen kiinnitettävä erityistä huomiota. Erilaiset menetelmät

aluetta kuvaavan heijastusspektrin luomiseksi tuottavat erilaisia tuloksia ja edustavimman

heijastusspektrin löytäminen voi olla vaikeaa.

Luokitteluissa käytetyistä luokista kuusen heijastusominaisuudet vaihtelivat hyvin voimakkaasti.

Siksi heijastusspektrin luomismenetelmien tarkempaa analysointia varten hyperspektrikuvalta

valittiin kuvan 7.11 osoittava 1010× -kokoinen alue, joka kuvasi tyypillistä tiheää kuusimetsää.

Sadan pikselin alue käsitti valoisia kuusenlatvoja, varjoja sekä hiukan metsänpohjaa. Aluetta

edustavia heijastusspektrejä kerättiin eri menetelmin. Ensiksi laskettiin tutkittavan alueen pikselien

Page 67: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

61

keskiarvot kaikille 17 kanavalle erikseen. Heijastusspektri saatiin kuvaamalla keskiarvot kanavien

aallonpituuksien funktiona. Toisena tapana muodostaa heijastusspektrit käytettiin keskiarvojen

laskemisen sijaan mediaania, eli keskimmäistä arvoa. Kolmantena tapana käytettiin moodia, eli

valittiin heijastusarvo, joka esiintyi yleisimmin tutkittavalla sadan pikselin alueella kullekin

kanavalle erikseen.

Kuva 7.11: Tarkemman analysoinnin kohteena oleva pieni kuusialue, jonka kirkkaat pikselit ovat

valoisia kuusenlatvuksia ja tummat pikselit ovat varjossa olevia kuusenhavuja sekä metsänpohjaa.

Lopuksi alueelta valittiin kirkkaan heijastuksen omaavia puhtaita pikseleitä, jotka edustivat kuvalla

aurinkoisia ja selkeästi näkyviä kuusenlatvoja. Näistä pikseleistä saatiin suhteellisen puhtaita

kuusenhavun heijastusspektrejä. Näistä heijastusspektreistä ei laskettu keskiarvoja, mediaaneja tai

moodeja, vaan heijastusspektrikäyrät piirrettiin samaan koordinaatistoon. Seuraavaksi valittiin se

käyrä, joka näytti kuvaavan parhaiten koko joukkoa. Aikaisemmin lasketut eri keskiarvomitat

laskettiin erikseen jokaiselle kanavalle välittämättä naapurikanavien arvoista. Tällöin

heijastusspektri ikään kuin latistuu ja sen materiaalia kuvaavat piirteet heikkenevät. Nyt pyrittiin

valitsemaan kokonainen ja paras heijastusspektri, jota ei muokata ollenkaan.

Page 68: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

62

Eri metodein muodostetut heijastusspektrit

0

10

20

30

40

50

60

70

80

1 2 3 4 5 6 7 8 9 1 11 1 1 1 15 1 17Kanavat

Hei

jast

usar

vo

Keskiarvo

Mediaani

Moodi

Puhdas pikseli

Kuva 7.12: Keskiarvo, mediaani, moodi -tavoilla lasketut heijastusspektrit sekä puhtaan havupikselin

heijastusspektri, joka valittiin puiden latvojen spektrien joukosta.

Erilaisilla metodeilla kerättyjä referenssispektrejä testattiin käytännössä Spectral Angle Mapper –

algoritmilla, jolla laskettiin kuvalla 7.12 näkyvien referenssispektrien sekä kuvan 7.11 osoittaman

alueen pikselien väliset spektrikulmat. Luokittelun tuloksena saatiin alkuperäisen havualueen

kokoinen kuva, jonka pikselien arvot saatiin vastaavien spektrien välisistä kulmista, kun spektrejä

käsiteltiin vektoreina. Jos onnistuttiin luomaan hyvin kuusimetsää kuvaava referenssispektri, niin

sen ja kuvapikselien väliset spektrikulmat olivat pieniä, ja siten vastaavat pikselit näkyivät

tummina. Tulkinnan helpottamiseksi kuvista, jotka havainnollistavat eri referenssispektrien sekä

kuvan 7.11 osoittaman alueen pikselien välisiä spektrikulmia, käännettiin värit siten, että tummat

pikselit tulivat vaaleiksi ja vaaleat tummiksi.

Kuva 7.13: Kuvat esittävät eri tavoin muodostettujen referenssispektrien sekä kuvan 7.11 osoittaman

alueen välisiä spektrikulmia. Värit on käännetty, joten kirkkaat pikselit kertovat hyvästä

luokittelutarkkuudesta.

Seuraavaksi 1010× -alueen pikseleista etsittiin sellaisia, joiden heijastus oli selkeästi peräisin

kuusen latvuksista eikä esimerkiksi metsän aluskasvillisuudesta. Näiden pikseleiden sijainnit

Page 69: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

63

tallennettiin ja vastaavat arvot haettiin aikaisemmin lasketuista referenssispektrien ja kuvapikselien

välisistä spektrikulmista. Näistä arvoista laskettiin vielä keskiarvot sekä keskihajonnat eri

referenssispektrien tapauksissa. Lisäksi minimi- ja maksimiarvot taulukoitiin.

Taulukko 7.1: Eri tavoin määritettyjen referenssispektrien vaikutus luokiteltavan pikselin sekä

referenssispektrin väliseen kulmaan selkeillä kuusenlatvusalueilla.

Keskiarvo Mediaani Moodi Puhdas pikseli Min 1.12 1.75 2.75 0.99 Max 6.49 7.24 10.16 5.89 Keskiarvo 3.11 3.83 6.52 2.51 Keskihajonta 1.39 1.44 1.69 1.01

Taulukosta 7.1 huomataan, että referenssispektrien laskentatapaan kannattaa kiinnittää huomiota.

Kannattaa kuitenkin huomioida, että tässä tarkasteltiin selkeitä kuusenlatva-alueita. Metsänpohjan

sekä muiden epämääräisten alueiden ottaminen huomioon muuttaisi todennäköisesti tilannetta.

Referenssispektrien laskemisessa pikselien keskiarvo tuotti paremman tuloksen kuin mediaani.

Moodilla laskettu referenssispektri antoi huonoimman tuloksen. Puhdas pikseli –menetelmä toimi

odotetusti hyvin, sillä spektrien välisiä kulmia tarkasteltiin selkeillä kuusialueilla.

7.5. Luokittelualgoritmien suorittaminen

Luokittelussa käytettiin Geomatican multi- sekä hyperspektrikuville tarkoitettuja algoritmeja.

Lammin alueen datasta valittiin pienempi alue, jolta kerättiin opetus- ja testialueet. Luokiteltava

alue kuvasi tyypillistä maalaismaisemaa, joka sisälsi erilaisia peltoja, lehti- ja havumetsiä sekä

haja-asutusalueita. Luokittelussa alue jaettiin seuraaviin luokkiin: lehtimetsä, havumetsä,

rakennukset, tiet, kynnöspelto ja viljapelto.

Eri kuvalta kerättyjä referenssispektrejä kokeiltiin myös edellä mainitun alueen luokittelussa.

Referenssispektrit kerättiin tällöin Paraisten aineistosta ja niitä käytettiin Lammin alueen Spectral

Angle Mapper –luokittelussa. Lisäksi luokitteluun valittiin Lammin datasta leveän suorakulmion

muotoinen alue, joka sisälsi kuvauslinjoista johtuvia valoisuuseroja. Referenssispektrit, joilla koko

alue luokiteltiin, oli kerätty yhdeltä kuvauslinjalta ja niiden valaistusominaisuudet erosivat muista

kuvan osista lentolinjojen mukaan. Luokittelu tehtiin Spectral Angle Mapper -algoritmilla sekä

Page 70: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

64

myös Bayesin päätössäännön avulla. Tarkoituksena oli tutkia, miten eri valaistusolosuhteet

vaikuttavat referenssidataan ja sitä kautta luokittelun tulokseen. Lisäksi Spectral Angle Mapperin

suorituskykyä haluttiin vertailla perinteisen luokittelijan kanssa tilanteessa, jossa kuvan

valoisuusolosuhteet muuttuvat.

7.5.1. Spectral Angle Mapper sekä Spectral Correlation Mapper

Spectral Angle Mapper –luokittelua varten kerättiin lukuisia referenssispektrejä eri luokista. Nämä

spektrit valittiin hyperspektrikuvan niiden opetusalueiden sisältä, jotka toimivat myös perinteisten

luokittelijoiden opetusalueina. Näin vertailu eri luokittelijoiden välillä oli mahdollista.

Referenssispektrien valinnassa kiinnitettiin erityisesti huomiota siihen, että kyseinen

referenssispektrijoukko edustaisi mahdollisimman hyvin koko opetusaluetta. Spectral Angle

Mapper –luokittelu tehtiin myös käyttäen muualta, kuin luokiteltavalta alueelta kerättyjä

referenssispektrejä.

Muita luokittelutulokseen vaikuttavia tekijöitä oli referenssispektrien lisäksi luokittelun

hylkäyskulman suuruus. Luokittelussa laskettiin luokiteltavan pikselin heijastusspektrin sekä

referenssispektrien välinen spektrikulma. Jos tämä kulma oli suurempi kuin hylkäyskulma, niin

kyseinen pikseli luokiteltiin hylkäysluokkaan ja sen arvoksi annettiin nolla. Tässä työssä

hylkäyskulman arvoksi valittiin 5 tai 8 astetta. Kun luokiteltava kuva sekä referenssispektrit

kerättiin samalta alueelta, niin spektrikulman arvo oli hyvin pieni ja lähes kaikki pikselit saatiin

luokiteltua johonkin luokkaan, vaikka hylkäyskulmana pidettiin 5 astetta. Käytettäessä muualta

hankittuja referenssispektrejä spektrikulmien arvot ylittivät usein 8 asteen rajan, jota pidettiin tässä

tapauksessa hylkäyskulmana. Siksi osa kuvasta jäi luokittelematta.

Luokittelussa oli myös mahdollista tutkia tarkemmin eri referenssispektrien sekä luokiteltavan

kuvan pikselien heijastusspektrien välisiä spektrikulmia. Näiden kulmien suuruudet voitiin

tallentaa uudelle kanavalle ja tuloksena saatiin kuva, joka havainnollistaa spektrikulmien suuruutta

ja siten luokittelun onnistumista. Pienet spektrikulmat näkyvät tummana ja ne merkitsevät, että

luokiteltava pikseli sekä referenssispektri ovat hyvin samankaltaisia. Tämä merkitsee suurempaa

varmuutta siitä, että luokiteltava pikseli sekä referenssispektri olisivat samaa materiaalia. Vaaleat

alueet merkitsevät sitä vastoin spektrikulmien suuria arvoja. Tällöin luokiteltava pikseli sekä

Page 71: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

65

referenssispektri eivät juurikaan muistuta toisiaan ja todennäköisesti ne myös kuuluvat eri

luokkiin.

Kuva 7.14: Peltikaton sekä kuvan pikselien välisten heijastusspektrien väliset spektrikulmat.

Tulkinnan helpottamiseksi kuvan värit on käännetty siten, että vaaleat alueet merkitsevät pientä

spektrikulmaa ja tummat alueet suurempaa spektrikulmaa.

Spektrikulman suuruutta havainnollistavat kuvat ovat hyödyllisiä erinäisten materiaalien

etsimisessä ja tunnistamisessa hyperspektrikuvilta. Kuvassa 7.14 on esitetty referenssispektrin,

joka on kerätty rakennuksen peltikatosta, sekä hyperspektrikuvan väliset spektrikulmat. Kuvasta

on helppo löytää muut peltikattoiset rakennukset, joita kuvan kirkkaimmat pikselit edustavat. Tie

näkyy kuvalla myös suhteellisen kirkkaana, joten se sekoittaa hiukan kuvan peltikattojen

tulkittavuutta.

Spectral Correlation Mapper –luokittelussa käytettiin samoja referenssispektrejä, kuin siinä

Spectral Angle Mapper –luokittelussa, jossa luokittelun referenssispektrit kerättiin luokiteltavan

kuvan kanssa samalta alueelta. Ennen luokittelua hyperspektrikuvan jokaisen pikselin

heijastusspektri sekä referenssispektrit normalisoitiin. Muuten luokittelu tehtiin samaan tapaan

kuin Spectral Angle Mapper –algoritmin kanssa. Spektrien normalisointi tapahtui vähentämällä

niistä keskiarvo, joka oli laskettu kaikista kanavista.

Page 72: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

66

7.5.2. Spectral Unmixing

Spectral Unmixin –luokittelua varten alkuperäisen hyperspektrikuvan pikselikokoa suurennettiin

kymmenkertaiseksi. Kuvan 7.15b pikselit ovat laskettu kuvan 7.15a vastaavien 1010× -kokoisten

alueiden pikseleiden keskiarvoista. Näin luokitteluun saatiin mukaan pikseleitä, joiden materiaalit

ovat selkeästi sekoittuneet. Lisäksi Spectral Unmixing -algoritmin tuloksia pystyttiin analysoimaan

helpommin kun käytössä oli 10 kertaa luokittelukuvaa tarkempi kuva. Esimerkiksi kuvalta 7.15a a

voidaan helposti nähdä, minkälaisista pikseleistä kuvan 7.15a b suuret pikselit ovat muodostuneet.

Kuvat 7.15a ja 7.15b: Alkuperäinen kuva (a) ja sama kuva kymmenkertaisella pikselikoolla (b).

Spectral Unmixing –luokittelussa käytettiin seuraavien luokkien referenssispektrejä: havupuu,

kynnöspelto, lehtipuu, pelto, rakennus, tie ja varjo. Luokittelun tuloksena Spectral Unmixing tuotti

kuvat 7.16a-7.16g eri luokkien suhteellisista osuuksista. Eri luokkien osuuskuvien kirkkaat pikselit

tarkoittavat, että sillä alueella kyseisen luokan osuus on suuri ja alueen heijastusspektri on

muodostunut pääosin tämän luokan materiaalin vaikutuksesta. Tumma pikseli merkitsee, että

kyseisen luokan heijastus ei juurikaan vaikuta sekoittuneen pikselin heijastusspektriin ja luokan

osuus tällä pikselillä on vähäinen.

Page 73: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

67

Kuvat 7.16: Spectral Unmixing –algoritmin tuottamat luokkien suhteelliset osuuskuvat. (a) esittää

havupuun, (b) kynnöspellon, (c) lehtipuun, (d) pellon, (e) rakennuksen, (f) tien ja (g) varjon

suhteellista osuutta kyseisellä pikselillä.

Spectral Unmixing –luokittelun tuloksia on helppo analysoida kun eri luokkien osuuskuvia

verrataan alkuperäiseen erotuskyvyltään hyvään kuvaan 7.15a. Alkuperäisestä kuvasta voidaan

havaita pikselit, jotka vaikuttavat erotuskyvyltään huonon kuvan sekoittuneessa pikselissä.

Havupuuluokan osuuskuvasta 7.16a sekä alkuperäisestä kuvasta 7.15a voidaan havaita, että

luokittelu havupuun osalta ei tuottanut merkittävää tulosta. Sen sijaan kuvalla 7.16b voidaan

selvästi havaita vaaleammalla kynnöspellot, jotka myös näkyvät alkuperäisessä kuvassa 7.15a.

Samoin kuvalla 7.16c näkyy vaaleampana alueet, joilla myös oikeasti on paljon koivumetsää ja

joiden suhteellinen osuus on kyseisellä pikselillä on suuri. Kuvalla 7.16d peltoalue erottuu

vaaleampana, mutta myös tausta näkyy vaaleana vaikka tätä luokkaa ei juurikaan kuvan keskellä

olevaa peltoaluetta lukuun ottamatta ole. Rakennusluokan osuuskuvalta 7.16e voidaan havaita, että

osa rakennuksista onnistutaan esittämään hyvin ja erityisesti voidaan huomata, kuinka rakennusten

koko vaikuttaa pikselien kirkkauteen, mikä johtuu rakennuksen osuudesta kyseisellä pikselillä.

Toisaalta joitain rakennuksia ei tällä kuvalla pystytä havaitsemaan ollenkaan. Tämä johtuu

todennäköisesti rakennusten erilaisista kattomateriaaleista. Osuuskuvat 7.16f ja 7.16g eivät

juurikaan vastaa todellista tilannetta, joten tien sekä varjojen kannalta luokittelu ei myöskään

tuottanut kunnollista tulosta vaan nämä luokat sekoittuivat muihin materiaaleihin ja osuuskuvat

olivat tasaisen kirkkaita kauttaaltaan.

Page 74: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

68

7.5.3. Perceptron-neuroverkko

Tässä työssä aiemmin mainitut hyperspektrikuville tarkoitetut luokittelualgoritmit perustuivat

referenssikohteiden heijastusspektrien eli referenssispektrien käyttöön. Luokittelussa käytettiin

useita referenssispektrejä. Samasta luokasta saattoi olla kerättynä kymmeniä hiukan toisistaan

poikkeavia referenssispektrejä. Perceptron-neuroverkko sekä perinteisissä luokittelijoissa valittiin

jokaista luokkaa kohden opetusalueet, joilta laskettiin luokittelussa käytettävät keskiarvo- tai muut

yleistysmitat.

Luokittelussa käytettiin Perceptron-verkkoa, joka muodostui syötekerroksesta, kahdesta

piilotetusta kerroksesta sekä vastekerroksesta. Syötekerros sisälsi 17 neuronia, yksi kullekin

AISA-kuvan kanavalle. Molemmissa piilotetuissa kerroksessa oli 10 neuronia, jotka syöttivät

tiedon edelleen kuudelle vastekerroksen neuronille, jotka vastasivat luokittelun luokkajakoa.

Vaikka verkon rakenne oli suhteellisen yksinkertainen, eikä luokiteltava kuvakaan ollut kovin

suuri, verkon opettaminen vaati paljon laskenta-aikaa. Laajemman alueen, esimerkiksi koko

Lammin-alueen, luokittelu olisi vienyt todella paljon aikaa. Toisaalta niin suuren alueen luokittelu

olisi vienyt paljon aikaa millä tahansa luokittelijalla, mutta Perceptron-neuroverkko luokittelija vei

tutkituista algoritmeista selvästi eniten tietokoneen laskenta-aikaa.

Perceptron-verkkon käyttöön liittyi sopivan verkon rakenteen muodostaminen sekä useiden

oppimisessa käytettävien parametrien säätäminen. Lopputulokseen vaikuttavia muuttujia oli

paljon, eikä sopivien parametrien valintaan ollut selviä sääntöjä. Parametrien arvoina käytettiin

valistuneita arvauksia ja niillä suoritettiin luokittelu. Lisäksi luokittelua kokeiltiin eri kokoisilla ja

muotoisilla verkoilla. Menetelmä oli hankala sillä erilaisia kombinaatioita oli lukuisia ja jokainen

luokittelu vei runsaasti aikaa.

7.5.4. Minimietäisyyden sekä suurimman uskottavuuden menetelmät

Perinteisiä luokittelijoita varten AISA-kuvalle suoritettiin piirteiden irroitus sekä piirteiden valinta.

Piirteiden irroituksessa käytettiin pääkomponenttimuunnosta, jossa piirteiden määrää pudotettiin

neljään ensimmäiseen pääkomponenttiin. Piirteiden valinnassa käytettiin Geomatican CHNSEL-

algoritmia, joka perustuu Branch and bound –algoritmiin. Alkuperäisestä 17 kanavan joukosta

Page 75: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

69

valittiin neljä vähiten korreloivaa kanavaa, jotka sijaitsivat vihreän ja punaisen valon sekä lähi-

infrapunasäteilyn aallonpituusalueella. Lammin alueelta valittu pienempi kuva luokiteltiin käyttäen

minimietäisyyden sekä Bayesin algoritmeja. Luokittelussa Bayesin pääsäännön avulla

todennäköisyysjakaumien estimoinnissa käytettiin suurimman uskottavuuden menetelmää. Tästä

työssä suurimman uskottavuuden luokittelijalla tarkoitetaan Bayesin luokittelijaa, jossa

todennäköisyysjakaumat on estimoitu suurimman uskottavuuden menetelmällä. Molemmissa

luokitteluissa käytettiin luokkien normaalijakaumaoletusta sekä pääkomponenttimuunnoksen

neljää ensimmäistä pääkomponenttikanavaa. Lisäksi sama alue luokiteltiin suurimman

uskottavuuden menetelmällä käyttäen CHNSEL-algoritmin valitsemaa kanavien joukkoa.

Luokittelu minimietäisyyden sekä suurimman uskottavuuden algoritmeilla sujui hyvin, kun

luokiteltavan datan dimensiota oli pienennetty riittävästi piirteiden irroitus- ja valinta-

algoritmeilla.

Kuva 7.17: Koivu-luokan histogrammit. Kolme ylintä histogrammia on laskettu AISA-kuvan

kanaville 3, 8 ja 14 ja kolme alinta histogrammia on laskettu kolmelle ensimmäiselle

pääkomponenttikanavalle.

Page 76: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

70

Kuva 7.18: Rakennus-luokan histogrammit. Kolme ylintä histogrammia on laskettu AISA-kuvan

kanaville 3, 8 ja 14 ja kolme alinta histogrammia on laskettu kolmelle ensimmäiselle

pääkomponenttikanavalle.

Kuvat 7.17 ja 7.18 esittävät AISA-kuvan kanavien histogrammeja. Kolme ensimmäistä

histogrammia esittävät vihreän, punaisen sekä lähi-infrapunasäteilyn aallonpituudella olevien

kanavien harmaasävyjakaumaa. Alemmalla rivillä olevat historammit esittävät AISA-kuvalta

laskettujen kolmen ensimmäisen pääkomponenttikanavan harmaasävyjakaumaa. Kuvista voidaan

helposti havaita, että koivu-luokkaa on helppo estimoida normaalijakaumalla. Rakennusten

harmaasävyarvot sen sijaan eivät sopineet normaalijakaumaan. Muiden luokkien harmaasävyarvot

olivat kohtalaisen normaalijakautuneita lukuun ottamatta tie-luokkaa.

Pääkomponenttimuunnoksella ei todettu olevan vaikutusta, jolla ongelmalliset rakennus- sekä

tieluokkien jakaumat olisivat lähestyneet normaalijakaumaa.

7.6. Luokittelutulokset ja -kuvat

Tulosten vertailun helpottamiseksi luokittelutulokset ja -kuvat on kerätty samaan kappaleeseen. Eri

luokittelualgoritmeilla on luokiteltu sama hyperspektrikuvan alue. Algoritmien vaatimat

opetusalueet on kerätty samalta kuvalta sekä samanlaisista valaistusolosuhteista kuin luokiteltava

alue. Spectral Angle Mapperia sekä minimietäisyyden luokittelijaa on myös vertailtu tilanteissa,

joissa opetusalueiden sekä luokiteltavan kuvan valaistusominaisuudet ovat muuttuneet.

Luokitteluun valittiin seuraavat luokat: havumetsä, lehtimetsä, kynnöspelto, sokerijuurikaspelto,

viljapelto, rakennus sekä tie. Kuvissa 7.20 – 7.22 luokiteltiin eri luokittelualgoritmeilla Lammin

hyperspektrikuvalta valittu pienempi alue, jota väärävärikuva 7.19 esittää. Luokiteltava alue

Page 77: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

71

sisältää rakennuksia, muutamia peltoja, teitä sekä havu- ja lehtimetsää. Seuraavissa kuvissa 7.25 ja

7.26 on luokiteltu alue, joka sisältää useita kuvauslinjoja ja jonka valaistusominaisuudet

vaihtelevat kuvauslinjojen väleillä. Lopuksi, kuvissa 7.27a ja 7.27b on luokittelussa käytetty

sellaisia opetusalueita, jotka on kerätty Paraisten alueen kaukokartoitusdatasta, kun luokiteltava

alue sijaitsee Lammin alueella.

Kuva 7.19: Väärävärikuva luokiteltavana olevasta hyperspektrikuvan alueesta sekä luokittelun

värikoodit.

Taulukko 7.2: Opetusalueiden sisältämien pikseleiden lukumäärä

Alue Koko pikseleinä Havu 8740 Kynnös 16113 Lehti 3090 Pelto 6691 Talot 1091 Tie 1045

Luokittelun jälkeen laskettiin virhematriisit, joiden avulla voitiin tarkastella luokittelun tarkkuutta.

Virhematriisin riveillä esitetään vertailukohteena olevat oikeat luokat ja sarakkeilla vastaavat

estimoinnin tuottamat luokat. Matriisin diagonaalilla sijaitsevat oikein luokiteltujen pikselien

osuudet prosentteina. Virhematriiseista laskettiin myös seuraavat tarkkuusmitat, jotka helpottivat

eri luokittelijoiden vertailua: keskimääräinen tarkkuus, kokonaistarkkuus ja kappa-tekijä.

Keskimääräisellä tarkkuudella tarkoitetaan eri luokkien luokittelutarkkuuksien keskiarvoa.

Kokonaistarkkuus on muuten samanlainen, mutta se ottaa huomioon testialueiden suuruudet ja

Page 78: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

72

painottaa niitä laskuissa. Kappa-tekijällä tarkoitetaan luokittelun satunnaisuutta. Kapan arvot

vaihtelevat nollan ja yhden välillä. Suuret kapan arvot tarkoittavat, että luokittelu on parempi kuin

satunnainen luokittelu. Esimerkiksi kappa-arvo: 0.82 tarkoittaa, että luokittelutulos on 82

prosenttia parempi, kuin mitä satunnaisella luokittelulla olisi saatu.

7.6.1. Spectral Angle Mapper sekä Spectral Correlation Mapper

(a) (b)

Kuvat 7.20a ja 20b: Kuva 7.20a on Spectral Angle Mapperin ja kuva 7.20b on Spectral Correlation

Mapperin luokittelukuva.

Taulukot 7.2a ja 7.2b: Spectral Angle Mapper –luokittelun virhematriisi sekä tarkkuusmittoja.

Havu Kynnös Lehti Pelto Talot Tie Keskimääräinen tarkkuus

84.06%

Havu 72.6 0.0 8.5 6.1 0.0 0.0 Kokonaistarkkuus 90.43% Kynnös 0.0 98.9 0.0 0.6 0.0 0.2 Kappa 0.8671 Lehti 4.6 0.0 95.0 0.0 0.0 0.0 Pelto 1.9 0.2 0.0 97.8 0.0 0.0 Talot 0.0 5.2 0.0 1.1 65.4 18.3 Tie 0.7 4.9 0.0 3.5 3.3 74.7

Page 79: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

73

Taulukot 7.3a ja 7.3b: Spectral Correlation Mapper –luokittelun virhematriisi sekä tarkkuusmittoja.

Havu Kynnös Lehti Pelto Talot Tie Keskimääräinen tarkkuus

80.92%

Havu 71.8 0.0 24.1 3.6 0.0 0.0 Kokonaistarkkuus 88.93% Kynnös 0.0 96.6 0.0 0.7 0.0 0.1 Kappa 0.8471 Lehti 3.5 0.0 96.4 0.0 0.0 0.0 Pelto 1.7 0.1 0.0 98.1 0.0 0.0 Talot 0.2 1.4 0.0 1.5 61.7 14.5 Tie 4.9 2 0.0 2.1 9.8 60.9

Molemmat hyperspektrikuville kehitetyt algoritmit luokittelivat alueen hyvin. Varsinkin lehtimetsä

sekä kynnös- ja viljapelto luokiteltiin hyvin tarkasti. Rakennukset olivat vaikeita luokittelun

kohteita sillä heijastus rakennusten kattomateriaaleista oli hyvin heterogeenistä ja sekoittui joskus

teiden heijastukseen. Silti useimmat rakennukset onnistuttiin luokittelemaan oikein. Keräämällä

lisää rakennusten referenssispektrejä olisi luokittelutulos todennäköisesti parantunut niiltä osin.

Toisaalta referenssispektrien lisääminen ei tuonut apua siihen, että joidenkin rakennusten sekä

teiden heijastusspektrit olivat hyvin samankaltaisia ja näin ollen nämä luokat sekoittuivat.

Spectral Angle Mapper luokitteli virheellisesti osan havumetsästä hylkäysluokkaan, lehtimetsään

tai peltoon. Spectral Correlation Mapper sen sijaan luokitteli huomattavan suuren havumetsän

osuuden lehtimetsäksi. Molemmilla algoritmeilla havumetsä luokiteltiin oikein lähes samalla

tarkkuudella. Spectral Angle Mapper luokitteli tiet paremmin verrattuna Spectral Correlation

Mapper –algoritmiin, joka sekoitti tiet useimmin rakennuksiin. Myös rakennukset onnistuttiin

luokittelemaan hiukan tarkemmin Spectral Angle Mapperilla, jolla myös luokittelun kokonais-

sekä keskimääräinen tarkkuus oli parempi.

Page 80: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

74

7.6.2. Perceptron-neuroverkko sekä minimietäisyyden menetelmä

(a) (b)

Kuvat 7.21a ja 7.21b: Kuva 7.21a on Perceptron-neuroverkko algoritmin ja kuva 7.21b on

minimietäisyyden menetelmän luokittelukuva.

Taulukot 7.4a ja 7.4b: Perceptron-neuroverkkoluokittelun virhematriisi sekä tarkkuusmittoja.

Kynnös Pelto Talot Tie Havu Lehti Keskimääräinen tarkkuus

93.39%

Kynnös 99.0 0.5 0.0 0.6 0.0 0.0 Kokonaistarkkuus 96.08% Pelto 0.1 99.4 0.0 0.1 0.4 0.0 Kappa 0.9451 Talot 0.2 1.1 81.6 17.0 0.0 0.0 Tie 1.6 0.6 4.5 93.3 0.0 0.0 Havu 0.0 0.3 0.0 0.0 89.9 9.8 Lehti 0.0 0.0 0.0 0.0 2.8 97.2

Taulukot 7.5a ja 7.5b: Minimietäisyyden menetelmän virhematriisi sekä tarkkuusmittoja.

Kynnös Pelto Tie Talot Havu Lehti Keskimääräinen tarkkuus

73.12%

Kynnös 98.8 0.0 0.0 1.2 0.0 0.0 Kokonaistarkkuus 86.16% Pelto 0.3 97.2 0.0 0.0 2.3 0.2 Kappa 0.8167 Tie 9.6 2.7 25.7 54.2 7.8 0.0 Talot 18.3 0.6 13.6 41.4 26.1 0.0 Havu 0.0 9.4 0.0 0.0 84.2 6.5 Lehti 0.0 1.3 0.0 0.0 7.3 91.5

Page 81: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

75

Perceptron-neuroverkolla saatiin muille luokittelijoille hankalat luokat: havumetsä sekä

rakennukset luokiteltua selvästi paremmin. Myös tien ja rakennusten erottaminen toisistaan

onnistui kohtalaisen hyvin. Rakennusten luokittelutulos oli huonoin, mutta niistäkin yli 80

prosenttia luokiteltiin oikein. Havu- sekä tieluokka luokiteltiin seuraavaksi huonoiten, noin 90

prosentin tarkkuudella. Loput luokat luokiteltiin oikein melkein 100 prosenttisesti. Neuroverkolla

saatiin parhaimmat luokittelutulokset. Luokittelun tarkkuusluvut olivat vertailun parhaita.

Kuten Spectral Angle Mapper sekä Spectral Correlation Mapper, minimietäisyyden algoritmi

luokitteli lehtimetsän sekä kynnös- ja viljapellon erittäin hyvin. Havumetsäkin luokiteltiin

kohtalaisen tarkasti, mutta rakennusten sekä teiden luokittelu epäonnistui pahasti.

Minimietäisyyden luokittelun kokonais- sekä keskimääräinen tarkkuus oli tässä työssä tutkituista

luokittelijoista huonoimpia.

7.6.3. Suurimman uskottavuuden menetelmä

(a) (b)

Kuvat 7.22a ja 7.22b: Luokittelukuvat suurimman uskottavuuden luokittelijalle. Ennen luokittelua

piirteiden määrää on vähennetty valitsemalla parhaat piirteet kuva 7.22a tai käyttäen

pääkomponenttimuunnosta kuva 7.22b.

Page 82: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

76

Taulukot 7.6a ja 7.6b: Suurimman uskottavuuden luokittelun virhematriisi sekä tarkkuusmittoja, kun

piirteiden määrää on vähennetty pääkomponenttimuunnoksella.

Kynnös Pelto Tie Talot Havu Lehti Keskimääräinen tarkkuus

86.14%

Kynnös 95.3 0 0.1 4.6 0 0 Kokonaistarkkuus 91.09% Pelto 0 93.1 0 0.3 0.2 0 Kappa 0.88342Tie 0 0 93.1 3.2 0 0 Talot 0 0 36.6 51.9 4.4 0 Havu 0 0 0 0.2 91.7 5.8 Lehti 0 0 0 0 3.7 91.8

Suurimman uskottavuuden luokittelu onnistui hyvin. Lukuun ottamatta rakennuksia kaikki muut

luokat luokiteltiin yli 90% tarkkuudella. Piirteiden määrän vähentäminen valitsemalla luokitteluun

neljä vähiten korreloivaa kanavaa sekä piirteiden irroitus pääkomponenttimuunnoksella tuottivat

lähes samanlaiset tulokset. Siksi neljän parhaan kanavan luokittelun virhematriisi on jätetty pois.

Pääkomponenttimuunnosluokittelun tulokset olivat hieman parempia verrattuna neljän parhaan

kanavan luokitteluun, lukuun ottamatta rakennusluokkaa, joka luokiteltiin paremmin neljän

parhaan kanavan luokittelussa.

SAM SCM NEURO MINDIS MLC

Keskimääräinen tarkkuus

Kokonaistarkkuus60

70

80

90

100

KeskimääräinentarkkuusKokonaistarkkuus

Kuva 7.23: Spectral Angle Mapper (SAM), Spectral Correlation Mapper (SCM), Perceptron-

neuroverkko (NEURO), minimietäisyyden (MINDIS) sekä suurimman uskottavuuden (MLC)

luokittelijoiden kokonais- sekä keskimääräiset tarkkuusluvut.

Kun luokiteltava kuva sekä opetusalueet on kerätty samalta valaistusominaisuuksiltaan

yhtenäiseltä alueelta, niin Perceptron-neuroverkkoluokittelija antoi parhaimman tuloksen, kun

tarkastellaan luokittelun tarkkuuslukuja. Suurimman uskottavuuden sekä Spectral Angle Mapper -

Page 83: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

77

luokittelun tarkkuusluvut olivat myös hyviä. Minimietäisyysluokittelijan tulokset olivat muita

algoritmeja huonompia.

7.6.4. Valoisuuserojen vaikutus luokitteluun

Lammin alueella kuvatusta hyperspektrikuvasta valittiin leveä suorakulmainen alue, joka sisälsi

useita kuvauslinjoja. Kuvassa 7.24 on kyseisen alueen väärävärikuva ja siitä voidaan havaita

kolmen eri kuvauslinjan väliset valoisuuserot. Oikeanpuoleinen linja kuvattiin ensimmäiseksi

hyvissä olosuhteissa. Seuraavan kuvalinjan kohdalla sää oli pilvistynyt, siksi kyseinen linja näkyy

edellistä tummempana. Edelleen seuraavalle kuvauslinjalle siirryttäessä sää huononi lisää ja

valoisuus väheni edelleen. Väärävärikuvan vasemmassa reunassa näkyy muutamia rakennuksia

sekä tie. Laajat vaaleanvihreät alueet ovat sokerijuurikaspeltoja ja kuvan oikeassa reunassa kasvaa

metsää sekä muuta peltoa.

Kuva 7.24: Väärävärikuva hyperspektrikuvan luokiteltavasta alueesta, jossa näkyy kuvauslinjojen

väliset valoisuuserot.

Usean kuvauslinjan sisältämä alue luokiteltiin kahdella eri algoritmilla: Spectral Angle Mapperilla

sekä suurimman uskottavuuden luokittelijalla. Jälkimmäisessä luokittelussa käytettiin lisäksi

pääkomponenttimuunnosta piirteiden irroituksessa. Tarkoitus oli vertailla näiden kahden eri

menetelmän tuloksia luokittelussa, jossa alueen valoisuusolosuhteet muuttuvat dramaattisesti.

Kuvassa 7.25 on Spectral Angle Mapper –luokittelun tuloskuva ja kuvassa 7.26 on suurimman

uskottavuuden luokittelijan tuloskuva.

Page 84: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

78

Kuva 7.25: Luokittelukuva Spectral Angle Mapper –luokittelulle.

Kuva 7.26: Luokittelukuva suurimman uskottavuuden luokittelijalle.

Verrattaessa luokittelutuloksen kuvaa 7.26 sekä saman alueen väärävärikuvaan 7.24 voidaan

selvästi havaita, että suurimman uskottavuuden luokittelija ei pysty luokittelemaan alueita, joiden

valoisuusominaisuudet vaihtelevat. Ainoastaan ensimmäinen kuvauslinja eli kuvan oikea reuna on

pystytty luokittelemaan tyydyttävästi. Siirryttäessä vasemmalle seuraavalle kuvauslinjalle ei

selkeää sokerijuurikaspellon luokkaa ole pystytty luokittelemaan ollenkaan. Sitä vastoin Spectral

Angle Mapperin luokittelukuva 7.25 osoittaa, kuinka paljon paremmin SAM toimii olosuhteissa,

joissa kuvan valoisuuserot muuttuvat.

Page 85: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

79

7.6.5. Luokittelu Paraisten alueen referenssispektreillä

Lammin hyperspektrikuvalta valittu alue luokiteltiin myös sellaisilla referenssispektreillä sekä

opetusalueilla, jotka oli valittu Paraisten hyperspektrikuvalta. Tarkoituksena oli tutkia, miten eri

mittausprojektista kerätty referenssimateriaali sopii hyperspektrikuvan luokitteluun. Luokittelu

suoritettiin Spectral Angle Mapperilla sekä suurimman uskottavuuden luokittelijalla.

Luokittelualgoritmeja varten Paraisten alueelta kerättiin referenssispektrejä sekä opetusalueita.

Luokittelijoiden vertailun vuoksi referenssispektrit sekä opetusalueet kerättiin samoilta alueilta.

Ennen suurimman uskottavuuden luokittelua suoritettiin pääkomponenttimuunnos, jolla piirteiden

määrää vähennettiin neljään pääkomponenttikanavaan. Muunnos tehtiin sekä referenssitietoa

sisältävälle Paraisten hyperspektrikuvalle että luokiteltavalle Lammin hyperspektrikuvalle.

(a) (b)

Kuvat 7.27a ja 7.27b: Kuva 7.27a on Spectral Angle Mapperin luokittelukuva ja Kuva 7.27b on

suurimman uskottavuuden algoritmin luokittelukuva. Referenssidatana on käytetty Paraisten alueelta

kerättyjä referenssispektrejä sekä opetusalueita.

Vaikka Lammin sekä Paraisten hyperspektrikuvat ovat otettu samalla instrumentilla sekä niiden

kanavat ovat yhtäläiset, niin luokkien heijastusominaisuudet muuttuvat siirryttäessä kuvalta

toiselle. Syitä tähän löytyy esimerkiksi kuvausprojektien erilaisista ilmakehistä,

kuvausajankohdista sekä luokkamateriaalien paikallisista ominaisuuksista. Eri kuvausprojektista

kerätyllä referenssitiedolla ei saatu kunnollisia tuloksia. Spectral Angle Mapper –luokittelussa

Page 86: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

80

lehti- sekä havupuut luokittuivat siedettävästi, mikä näkyy kuvassa 7.27a. Sen sijaan rakennukset,

tiet ja pellot sekoittuivat tai jäivät kokonaan luokittelematta. Luokittelukuva kuitenkin näyttää

huomattavasti paremmalta verrattuna suurimman uskottavuuden luokittelukuvaan 7.27b, missä yli

70 % kuvasta on jätetty kokonaan luokittelematta ja loputkin on väärin luokiteltu.

Page 87: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

81

8. Yhteenveto

Tämän diplomityön tarkoituksena oli tutkia kasvillisuuden sekä maaperän määrittämistä

hyperspektrisen kaukokartoitusdatan avulla. Työssä luokiteltiin lentokoneeseen asennetun AISA-

instrumentin mittaamaa hyperspektridataa erilaisilla algoritmeilla. Perinteisten luokittelijoiden

sekä hyperspektridatalle suunniteltujen algoritmien tuloksia vertailtiin keskenään. Ohjatussa

luokittelussa referenssitiedon vaikutus luokittelun tulokseen on suuri ja sen kerääminen on usein

luokittelun työläin vaihe. Siksi tutkittiin erilaisten opetusalueiden sekä referenssitietoa

muodostavien metodien vaikutusta lopputuloksiin. Lisäksi haluttiin selvittää erilaisten

kaukokartoituskuville tehtävien korjausten sekä piirteiden valinnan ja irroituksen mahdollisuuksia

hyperspektrikuvauksen näkökulmasta.

Luokittelualgoritmit erosivat toisistaan paljon, joten samaa referenssitietoa ei voitu käyttää

kaikissa luokittelijoissa. Esimerkiksi perinteiset luokittelualgoritmit vaativat opetusalueiden

käyttämistä, kun taas Spectral Angle Mapper, Spectral Unmixing sekä Spectral Correlation

Mapper vaativat referenssispektrien käyttöä. Siksi oli tärkeää määrittää erityyppisten

referenssitietojen vaikutukset lopputuloksiin sekä löytää jokaiselle luokittelualgoritmille

mahdollisimman hyvän opetusjoukon. Referenssispektrejä muodostettiin opetusalueiden

heijastusarvoista erilaisilla keskiarvomitoilla. Referenssispektreiksi valittiin myös yksittäisten

pikselien heijastusspektrejä. Näin saatiinkin hyviä tuloksia jos pikseli oli tarkoin määritelty ja

edusti homogeenistä aluetta, kuten yksittäinen puun latvus.

Luokittelualgoritmeista Perceptron-neuroverkkoluokittelijalla saatiin parhaimmat tulokset, mutta

verkon opettaminen vei paljon aikaa. Myös suurimman uskottavuuden menetelmällä saatiin hyvät

tulokset. Algoritmi oli kuitenkin hidas eikä se toiminut alueilla, joissa oli paljon valoisuuseroja.

Spectral Angle Mapper antoi lähes yhtä hyvät tulokset. Lisäksi se oli nopeampi ja toimi selvästi

paremmin, jos kuvalla oli valoisuuseroja. Spectral Angle Mapperin etuna voidaan pitää myös sitä,

että datalle ei tarvinnut suorittaa pääkomponenttimuunnosta. Referenssitiedon valitseminen

kokonaan eri kuvalta kuin luokiteltava kuva huononsi luokittelutuloksia huomattavasti. Spectral

Angle Mapper -algoritmilla saatiin tässä tapauksessa kuitenkin huomattavasti parempia tuloksia

kuin suurimman uskottavuuden menetelmällä. Työssä todettiin Spectral Unmixing -algoritmin

toimivan hyvin luokiteltaessa kynnöspeltoja, lehtipuita ja rakennuksia. Sitä vastoin tulokset olivat

Page 88: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

82

huonoja havupuun, peltojen ja tien kanssa. Spectral Unmixing -algoritmille oli vaikeaa löytää

kunnollisia referenssispektrejä, sillä malli vaati jokaisen kuvalla esiintyvän oleellisen materiaalien

heijastusspektrin määrittämistä.

Hyperspektri-instrumentilla saadaan entistä tarkempaa tietoa kohteen spektrisistä ominaisuuksista.

Analysoimalla sekä vertailemalla eri kohteiden heijastusspektrejä voidaan tehdä erilaisia oletuksia

kohteen laadusta sekä tutkia materiaalien erottuvuutta. Tässä työssä laskettiin myös eri luokkien

välisiä erottuvuusmittoja ja tutkittiin kuinka hyvin eri luokat ovat erotettavissa muista luokista.

Erottuvuusmittana käytettiin heijastusspektrien välistä spektrikulmaa, jonka on todettu toimivan

hyvin kuvan valoisuusolosuhteiden muutoksissa. Vertailussa olevat luokat olivat paju, koivu,

kuusi, mänty, heinä ja sokerijuurikas. Havaittiin, että lehtipuut sekoittuivat keskenään, mutta

erottuivat hyvin havupuista ja heinästä. Vastaavasti mänty sekoittui kuusen ja heinän kanssa

joissain tapauksissa, mutta niiden erottaminen lehtipuista oli helppoa. Sokerijuurikas erottui hyvin

kaikista luokista, lukuun ottamatta pajua.

Kuusen heijastusspektri otettiin tarkemman analysoinnin kohteeksi, sillä haluttiin selvittää,

vaikuttaako maaperän laatu kuusen heijastusspektriin ja voitaisiinko kuusen heijastusspektrin

perusteella määrittää maalaji. Lisäksi tutkittiin kuvauksen aikana syntyneiden valoisuuserojen

vaikutusta kuusialueiden välisiin spektrikulmiin. Todettiin, että pienet valoisuuserot eivät juuri

vaikuta alueiden välisiin spektrikulmiin, mutta tulokset huononevat nopeasti, valaistuksen ollessa

riittävän huono. Tutkittavat kuusialueet olivat tiheitä, joten maaperästä ei saatu suoraa havaintoa.

Maaperän ei todettu vaikuttavan tilastollisesti merkittävästi kuusen heijastusspektriin.

Kuusialueiden heijastuksen sisäinen hajonta oli suurta ja lisäksi heijastukseen vaikutti myös monet

muut tekijät, joista ei välttämättä ollut havaintoa. Maaperän määrittäminen kasvin

heijastusspektrin avulla olisi merkittävä saavutus, mutta se vaatii huomattavasti laajemman

opetusaluejoukon käyttämistä sekä enemmän maastohavaintoja kasvin rakenteesta.

Page 89: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

83

Lähdeluettelo

Arkimaa, H., Kuosmanen, E., Kuosmanen, V. & Laitinen, J. 2002. Environmental studies using

airborne hyperspectral AISA and HYMAP data in the mining area of Kemi. Geologian

tutkimuskeskus, RS/2002/4.

ASTER Spectral Library 2004. Saatavissa: http://speclib.jpl.nasa.gov/ (viitattu 1.1.2004).

Boschke, F. 1975. Spectroscopy. Berliini, Springer. 294 s. ISBN 3-540-09462-8

Campbell, J. 1996. Introduction to remote sensing. 2. painos. New York, The Guilford Press. 622

s. ISBN 1-57230-041-8

Carvalho, O. & Meneses, P. 2000. Spectral Correlation Mapper (SCM): An Improvement on the

Spectral Angle Mapper (SAM). NASA, JPL, AVIRIS Workshop 2000.

Cetin, H. & Levandowski, D. 1991. Interactive classification and mapping of multi-

dimensional remotely sensed data using n-dimensional probability density functions

(nPDF). Photogrammetric Engineering and Remote Sensing, Vol. 57, s. 1579-1587.

Cracknell, A. & Hayes, L. 1991. Introduction to remote sensing. London, Taylor & Francis. 293 s.

ISBN 0-85066-335-0

Crippen, R. 1987. The Regression Intersection Method of Adjusting Image Data for Band

Ratioing. International Journal of Remote Sensing, Vol. 8, s. 137-155.

Dutta, S., Sharma, S. A., Khera, A. P., Ajai, Yadav, M., Hooda, R. S., Mothikumar, K. E. &

Manchanda, M. L. 1994. Accuracy assessment in cotton acreage estimation using Indian remote

sensing satellite data. ISPRS Journal of Photogrammetry and Remote Sensing, Vol. 49, s. 21-26.

Page 90: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

84

ENVI Tutorial 2003. Saatavissa: http://www.ice.mtu.edu/online_docs/envi31/tut10.htm (viitattu:

1.1.2003).

EUMETSAT 2004. Saatavissa: http://www.eumetsat.de/ (viitattu 1.1.2004).

Huete, A. 1989. Soil ifluences in remotely sensed vegetation-canopy spectra. Teoksessa: Asrar, G.

(toim.). Theory and Application of Optical Remote Sensing Chassem Asrar. New York, Wiley.

734 s. ISBN 0-471-62895-6

Heikkilä, J. & Törmä, M. 1996. Hahmontunnistus – Tilastollinen lähestymistapa. Espoo,

Teknillinen korkeakoulu. 286 s. ISBN 951-22-2974-9

IMAGRS-L, 1996. Mailing List WWW Gateway (online). Boardman, J., Re: Spectral angle.

Saatavissa: http://adis.cesnet.cz/cgi-bin/lwgate/IMAGRS-L/ (viitattu 1.11.2003).

Kallio, K., Kutser, T., Hannonen, T., Koponen, S., Pulliainen, J., Vepsäläinen, J., Pyhälahti, T.

2001. Retrieval of water quality from airborne imaging spectrometry of various lake types in

different seasons. The Science of the Total Environment, Vol. 268, no. 1-3, s. 59-77.

Kanellopoulos, I., Varfis, A., Wilkinson, G. & Mégier, J. 1991. Neural network classification of

multi-date satellite imagery. Teoksessa: Putkonen, J. (toim.). IGARSS '91: 1991 International

Geoscience and Remote Sensing Symposium. Remote sensing: global monitoring for Earth

management. Espoo, Finland. June 3-6, 1991. Vol. IV, s. 2215-2218. ISBN: 0-87942-676-4

Kokaly, R. F., Despain, D. G., Clark, R. N. & Livo, K. E. 2002. Mapping vegetation in

Yellowstone National Park using spectral feature analysis of AVIRIS data. Remote Sensing of

Environment, Vol. 84, s. 437-456.

Page 91: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

85

Kruse, F., Lefkoff, A., Boardman, J., Heidebrecht, K., Shapiro, A., Barloon, P. & Goetz, A. 1993.

The spectral image processing system (SIPS) - interactive visualization and analysis of imaging

spectrometer data. Remote Sensing of Environment, Vol. 44, s. 145-163.

Kruse, F., Richardson, L. & Ambrosia, V. 1997. Techniques developed for geologic analysis of

hyperspectral data applied to near-shore hyperspectral ocean data. Fourth International Conference

on Remote Sensing for Marine and Coastal Environments. Orlando, Florida. March 17-19, 1997.

S. 233-246.

Lillesand, T., Kiefer R. 2000. Remote sensing and image interpretation. 4. painos. New York, John

Wiley & Sons. 724 s. ISBN 0-471-25515-7

Meer, F., Jong, S. 2001. Imaging spectrometry, basic principles and prospective applications.

Dordrecht, Kluwer Academic. 403 s. ISBN 1-4020-0194-0

Mäkisara, K., Meinander, M., Rantasuo, M., Okkonen, J., Aikio, M., Sipola, K., Pylkkö, P.,

Braam, B. 1993. Airborne imaging spectrometer for applications (AISA). Teoksessa: IGARSS '93:

1993 International Geoscience and Remote Sensing Symposium. Better understanding of earth

environment. Tokyo, Japan. August 18-21, 1993. S. 479-481. ISBN: 0-7803-1240-6

Mäkisara, K., Lohi, A. & Kärnä, J.P. 1994. A system for geometric and radiometric correction of

airborne imaging spectrometer data. Teoksessa: Stein, T. (toim.). IGARSS '94: 1994 International

Geoscience and Remote Sensing Symposium. Surface and atmospheric remote sensing:

technologies, data analysis and interpretation. California, USA. August 8-12, 1994. S. 851-853.

ISBN: 0-7803-1497-2

Mäkisara, K. & Tomppo E. 1996. Airborne imaging spectrometer in National Forest Inventory.

Teoksessa: Stein, T. & Brunk, J. (toim.). IGARSS '96: 1996 International Geoscience and Remote

Sensing Symposium. Remote sensing for a sustainable future. Vol. II. New York, USA. May 27-

31, 1996. S. 1010-1013. ISBN: 0-7803-3068-4

Page 92: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

86

Narendra, P. & Fukunaga, K. 1977. A branch and bound algorithm for feature subset selection.

IEEE Transactions on Computers, Vol. 26, s. 917-922.

Othanian, H. 1989. Physics. 2. painos. New York, Norton. 1148 s. ISBN 0-393-95750-0

Paltridge, G. & Platt, C. 1976. Radiative Processes in Meteorology and Climatology. New York,

Elsevier Scientific Publishing company. 318s.

Peltoniemi, J. 1997. Measuring the bidirectional reflectance functions of Sjökulla test field targets.

European Goniometer users' workshop. Ispra, February 26-28, 1997.

Radeloff, V. C., Mladenoff, D. J. & Boyce, M. S. 1999. Detecting jack pine budworm defoliation

using spectral mixture analysis: separating effects from determinants. Remote Sensing of

Environments, Vol. 69, s. 156-169.

Richards J. A. & Xiuping J. 1999. Remote sensing digital image analysis: an introduction. 3rd,

revised and enlarged edition. Berlin, Springer. 363 s. ISBN 3-540-64860-7

Roberts, D., Gardner, M., Church, R., Ustin, S. & Green, R. 1997. Optimum strategies for

mapping vegetation using multiple endmember spectral mixture models. Teoksessa: Descour, M.

& Shen, S. (toim.). SPIE Conf. Vol. 3118, Imaging Spectrometry III. San Diago, CA, July 27-Aug

1, 1997. S. 108-119. ISBN 0-8194-2540-0

Ruohomäki, T., Törmä, M., Rainio, H., Lumme, J. & Mäkilä, M. 2002. Soil types, vegetation and

AISA-imagery in Lammi test area. Geologian tutkimuskeskus, GTK/RS/2002/6

Schott, J. & Henderson-Sellers, A. 1984. Radiation, the Atmosphere and Satellite Sensors.

Teoksessa: Henderson-Sellers, A. (toim.). Satellite Sensing of a Cloudy Atmosphere. Observing

the Third Planet. London, Taylor and Francis.

Page 93: KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA … · 2016-04-05 · Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing

87

Short, N. & Robinson, J. 2003. Remote sensing tutorial. Saatavissa:

http://rst.gsfc.nasa.gov/AppC/C1.html (viitattu: 1.11.2003).

Specim 2003. Saatavissa: www.specim.fi (viitattu: 1.11.2003).

Stahler, A. H. 1980. The use of prior probabilities in maximum likelihood classification of

remotely sensed data. Remote Sensing of Environment, Vol. 10, s. 135-163.

Tsai, F. & Philpot, W. 1998. Derivative analysis of hyperspectral data. Remote Sensing of

Environment, Vol. 66, s. 41-51.

Törmä, M. 1997. Neuraaliverkot ja niiden käyttö kuvien analysoinnissa. Maankäyttö, 1/97, s 5-9.

Törmä, M., Rainio, H. & Ruohomäki, T. 2001. Kasvillisuuden ja eräiden maalajien luokittelukoe

käyttäen Aisa-spektrometriaineistoa: Lammin testialue. Geologian tutkimuskeskus,

GTK/RS/2001/3.