Űrfelvételek feldolgozása - osztályozás

Bevezetés

A földi erőforráskutató műholdak viszonylag nagy területről, több sávban készítenek felvételeket. Így a geometriai felbontásnak megfelelően egy adott területről több mérési eredmény áll rendelkezésünkre. Pontosabban minden képelem egy földfelszíni területet határoz meg (geometriai korrekció után abszolút értelemben), és a képelem értékei (pixelértékek) az adott terület visszaverő, vagy kisurgárzási képességét írják le. Vagyis a pixelérték a terület reflektanciartékét fejelzi ki közvetve vagy közvetlenül. Ha több spektrális sávban történik a reflektancia meghatározása, akkor a terepi spektrumok felvételével vagy az ún. spektrumkönyvtárak használatával azonosíthatjuk a pixelértékek alapján, hogy az adott területre milyen felszínborítás jellemző. Miután minden képelemhez nem lehet terepi adatokat hozzárendelni, így általában az ilyen pixelalapú kiértékelés során a digitális képfeldolgozás egy nagyon hatékony módszerét, az osztályozást tudjuk elvégezni. Az osztályozás célja, hogy a képelemeket a pixelértékek alapján a felhasználó által vagy automatikusan kijelölt osztályokba (klaszterekbe) soroljuk, és létrehozva egy tematikus térképet.

Az osztályozási módszerek rendkívül szerteágazóak, sok matematikai (geometriai, valószínűségszámítási) ismeretet igényelnek. A beépített funkciók révén ezek a módszerek nem feltétlenül jelennek meg a felhasználó előtt, ezért érdemes ezeket részletesebb tárgyalni. Nagy adatbázisok esetében gyakran használunk hasonló módszereket.

Az osztályozás lehet pixel vagy szubpixel alapú. Az előbbi esetben a pixelérték egy értékként jellemzi az adott felszín reflektancia-tulajdonságait. Pédául, ha több felszínborítási típus van egy területegységen belül, akkor az azokról visszaverődő elektromágneses sugárzást egy jelként értékeljük. Szubpixel alapú osztályozás esetén valamilyen képfeldolgozási módszerrel arra is próbálunk adatot kinyerni, hogy a területen belül milyen arányban fordulnak elő a különböző felszínborítási típusok.

A tananyagban jelenleg csak apixelalapú osztályozás két fő típusát az irányított és az automatikus osztályozást tekintjük át röviden.

Irányított osztályozás

Bevezetés

A multispektrális klasszifikáció során a képalkotó elemeket, a pixeleket, a pixelértékek alapján besoroljuk a véges számú osztályok egyikébe. Ha a pixel megfelel bizonyos kritériumoknak, akkor abba a tematikus osztályba fog tartozni, melyet a kritériumok szerint határoztunk meg. A fenti folyamatot a kép szegmentációjának is nevezik.

A klasszifikáció folyamata

Mintázat felismerés

Az emberi szem felismer bizonyos szerkezeteket és a színeket kategóriákba csoportosítja a színes képeken. A multispektrális, digitális képek esetén a számítástechnika és a matematika eszközeivel lehetőség van a spektrális mintázatok tudományos elven történő felismerésére. Statisztikák készíthetők a pixelek spektrális tulajdonságai szerint, és a pixelek osztályozhatók matematikai feltételek alapján. Ezt a folyamatot két jól elkülönülő részre, a betanításra (tréning) és a döntéshozási módszereket használó osztályozásra bontjuk.

Tréning

A számítógépet fel kell készíteni, be kell tanítani arra, hogy felismerje az adatokon belüli csoportokat. A tréning az a folyamat, melyben meghatározunk feltételeket, amelyekkel ezek a csoportok felismerhetők. A tréning vagy a felhasználó által irányított, un. supervised, vagy minimálisan irányított, un. unsupervised módszer lehet.

Irányított betanítás

Ezt a módszert az jellemzi, hogy végig a felhasználó irányítása alatt áll. Először a felhasználó kiválasztja azokat a pixeleket, amelyek reprezentálni fogják az adott osztályt. A pixelek kiválasztásakor használhatunk különböző forrásokat, légifelvételeket, térképeket, helyszíni megfigyelési adatokat, stb. A pixelértékek elemzése és a tematikus térkép osztályainak előzetes ismerete szükséges ehhez a módszerhez. A minta azonosítása készíti fel a számítógépet a hasonló tulajdonságú pixelek azonosítására.

Nem irányított betanítás

A nem irányított betanítás sokkal inkább automatizált folyamat. A képfeldolgozó program felismeri a hasonló tulajdonságú pixeleket, de ezek nem szükségszerűen illeszkednek a kép folyamatos, könnyen felismerhető területeihez, mint pl. a talajtípusokhoz, vagy területhasznosítási osztályokhoz. Ezek csak egyszerű pixel klaszterek, melyek a hasonló spektrális tulajdonságú pixeleket gyűjtik össze. Ezt a módszert általában akkor alkalmazzuk, ha kevés információnk van a klasszifikáció előtt a területről. A klasszifikáció után a felhasználónak kell értelmeznie a létrejött osztályokat.

Tanulók - signatures

A tréning eredménye a tanulók egy halmaza, amely tartalmazza a tanulóterületeket, vagy a klasztereket. Minden tanuló egy osztályt ír le, és a döntéshozási szabállyal együtt a képfile minden egyes pixele egy osztályhoz rendelhető. A tanulók aszerint csoportosíthatók, hogy hogyan és hol jelöltük ki azokat. A statisztikai paramétereken (pl. átlag, szórás, kovariancia mátrix, stb.) alapuló pixelhalmazt parametrikus tanulónak nevezi az ERDAS. A parametrikus pixelhalmazt kijelölhetjük a földrajzi térben egy terület lehatárolásával, mely a benne lévő pixelek értékei szerint jellemezhető statisztikus paraméterekkel. A tanulóterület kijelölése többféle módon is történhet. Parametrikus adatokkal jelölhetünk ki egy klasztert a spektrális térben, ha kijelölünk egy n-dimenziós pontot , mint klaszterközepet és meghatározzuk a klaszterbe tartozó, pl. egy bizonyos szórástartományon belül lévő pixeleket . A parametrikus tanulók a statisztikus osztályozási módszereknél, pl. a maximum likelihood, használhatók az osztályok meghatározására. A nem-parametrikus tanulókat nem statisztikai módszerekkel jelöljük ki. Ilyen lehet egy spektrális térben megadott diszkrét alakzat. Ezekkel az alakzatokkal az osztályok spektrális térbeli határait adjuk meg. A nem-parametrikus osztályozások fogják használni a nem-parametrikus tanulókat.

Az osztályba soroláskor azt vizsgáljuk, hogy az adott pixel kívül vagy belül van a spektrális térben lokalizált osztályokon. A supervised tréning során hozhatunk létre nem-parametrikus tanulókat (Kloer, 1994).

A tanulók értékelése

Alarm réteg

Az alarm értékelés lehetővé teszi, hogy összehasonlítsuk egy vagy több tanulóra a tervezett osztályozás eredményét az eredeti adatokkal.. A parallelepipedon döntési szabály alapján azok a pixelek kapnak új színt a megjelenített űrfelvétel feletti rétegben, amelyek megfelelnek az osztályozás kritériumának.

Ellipszis vizsgálat a spektrális térben

Az ellipszisek a tanulókban lévő pixelek osztályközepei, és a szórás alapján rajzolhatók ki, de lehetséges parallelepipedon határokat, az osztályközepet és a osztály nevét is megjeleníteni a 2-dimenziós spektrális térben. Ha jelentős az ellipszisek átlapolása, akkor a megjelenített két sávban (a spektrális tér 2 dimenziójában) a pixeleket nem lehet teljesen elkülöníteni a tanulók alapján. A legjobb, ha nincs átlapolás, de átlapolás a legtöbb esetben várható.

ábra Ellipszis vizsgálat a spektrális térben

Kontingencia mátrix

A tanulóterület pixelei nem mindig homogének, ami azt jelenti, hogy az osztályozáskor nem minden pixel kerül abba az osztályba, amit az a tanulóterületen belüli többi pixellel együtt reprezentál. Minden pixel csak súly abban a statisztikában, amely meghatározza az osztályt. Ha a tanuló statisztikája jelentősen eltér a többi tanuló statisztikáitól, akkor a tanulón belüli pixelek jelentős része úgy osztályozódik, ahogy azt várjuk. Ez a kiértékelés a minimum távolság, a maximum likelihood vagy a Mahalanobis távolság döntési szabályt használja. A kontingencia mátrix mutatja százalékosan vagy számszerűen, hogy a tanulók pixelei hogyan osztályozódtak.

Szeparabilitás vizsgálat

A tanulók szeparabilitása (elkülönülése) a tanulók között mért statisztikus távolság. A szeparabilitást bármely két tanuló között megmérhetjük bármely sávokban, ezáltal kizárhatók azok a sávok, amelyek nem segítik az osztályozást (a tanulók nem különíthetők el egymástól megfelelően). Ha a távolság, (spektrális euklideszi távolság), két tanuló osztályközepe között nem elég nagy, akkor az osztályozás sem lesz sikeres.

Döntési szabály

A tanulók meghatározása után a kép pixeleit egyenként elemezve osztályozzuk és soroljuk be egy-egy osztályba (vagy marad osztályozatlan) a döntési szabály szerint. A döntési szabály egy matematikai algoritmus, mely a tanulók adatai alapján végzi el a pixelek osztályba sorolását.

Parametrikus döntési szabály

A parametrikus döntési szabály parametrikus tanulókat használ, melyek legfontosabb statisztikai paramétere az átlagvektor és a kovariancia mátrix. Amikor parametrikus döntési szabály szerint osztályozzuk a pixeleket, akkor minden pixelt besorolunk valamilyen osztályba, mert a parametrikus döntési tér folyamatos.

Nem-parametrikus döntési szabály

A nem-parametrikus döntési szabály nem statisztikákon alapul, így független az adatok tulajdonságaitól. Ha egy pixel egy nem-parametrikus tanuló határán belül van, akkor ez a döntési szabály a pixelt a tanuló által meghatározott osztályhoz rendeli. Vagyis a nem-parametrikus döntési szabály azt vizsgálja, hogy a pixel a tanuló határán belül vagy kívül helyezkedik-e el.

Az iteratív klasszifikáció

A klasszifikáció részlépéseit és a végeredmény is értékelni kell, s az esetleges hibákat javítani lehet, majd megismételhetjük vagy a részfolyamatot vagy az egész osztályozást. A megismételhető folyamatokat iteratívnak nevezzük.

Supervised klasszifikáció

A supervised tréning a priori (már ismert) információkon alapul. Ehhez ismerni kell pl. a területhasznosítási típusok bizonyos tulajdonságait, melyeket felszíni mérések biztosítanak. E méréseket legjobb, ha a kép felvételezés időpontjában végzünk el.

A tanulók kijelölése

A tanuló reprezentál egy osztályt

vektorréteg alapján

poligon definiálásával a képen

hasonló spektrális tulajdonságú szomszédos pixelek kijelölésével

adott területen belüli pixelek kijelölésével, melyek nem szükségszerűen hasonló spektrális tulajdonságúak

tematikus raszterréteg egy osztályát felhasználva

A tanulók attribútumai

A tanulókat többféle attribútummal látjuk el, amelyek egyrészt befolyásolják a döntéshozás eredményét, pl. a rang értéke, másrészt a kimenő tematikus raszterréteg paramétereit határozzák meg, pl. az osztályok színei, értékei, nevei, stb. A következő attribútumok minden tanulóra (parametrikus és nem-parametrikus) általánosan érvényesek:

név - azonosítja a tanulót, és az osztály neve lesz a kimenő tematikus raszterrétegen

szín - a tanuló színe és az osztály színe a kimenő tematikus raszterrétegen

érték - a kimenő osztály értéke és a tanuló értéke nem szükségszerű, hogy megegyező legyen, legjobb, ha pozitív egész.

rang - a rang értéke a rangfüggő műveletekben játszik szerepet, mint pl. a tanuló gyorsértékelése (alarm) vagy a parallelepipedon osztályozás

parallelepipedon határok - a határokat a parallelepipedon osztályozásban használjuk. A parametrikus tanuló további attribútumai lehetnek:

sávok száma - a bemenő kép sávjainak a száma

szélsőértékek - a klaszter vagy a tanuló minimum és maximum vektora

átlagértek - a klaszter vagy a tanuló átlagvektora

a klaszter vagy a tanuló kovariancia mátrixa

a klaszter vagy a tanuló pixeleinek a száma

A nem- parametrikus tanuló spektrális térben, nem statisztikai paraméterek alapján, kijelölt térrészletbe eső pixelek értékeit rögzíti. A tanulók vizsgálata, értékelése

tanuló gyorsértékelése (alarm)

ellipszis

kontingencia mátrix

divergencia

statisztikák és hisztogramok

A klasszifikáció döntési szabályai

Ha a tanulókat összegyűjtöttük és értékeltük, a következő lépés a döntéshozáson alapuló osztályozás elindítása. Az osztályozáskor minden egyes pixelt önállóan értékelünk. A döntési szabályban vagy algoritmusban meghatározó szerepe van a pixel helyét az n-dimenziós vektortérben kijelölő vektornak. Az alábbi ábra az ERDAS döntéshozási mechanizmusának folyamatábráját ábrázolja

Eszerint, ha nem-parametrikus tanulók nem szerepelnek, akkor a pixeleket csak parametrikus szabályok szerint osztályozzuk. Ha nem-parametrikus tanulók is vannak a tanulók között, akkor minden pixelt úgy osztályozunk, hogy minden tanulót nem-parametrikusnak tekintünk. Ekkor a következők szerint járunk el:

ha a nem-parametrikus teszt eredménye egy egyedi osztály, akkor a pixelt besoroljuk ebbe az osztályba

 ha a nem-parametrikus teszt eredménye egy üres osztály (pl. a pixel kívül esik minden nem-parametrikus döntési határon), akkor az osztályozatlansági szabályt alkalmazzuk. Ezzel a szabállyal a pixelt vagy tovább osztályozzuk a parametrikus szabállyal vagy marad osztályozatlan.

ha a pixel több mint egy osztályhoz is tartozhat, akkor az átlapolási szabályt alkalmazzuk. Eszerint a pixelt vagy tovább osztályozzuk a parametrikus szabállyal, vagy figyelembe vesszük a rangot, vagy marad osztályozatlan.

A nem-parametrikus szabályok közül a parallelepipedon és a térbeli alakzat szabályt, a parametrikus szabályok közül a minimális távolságok, a Mahalanobis távolság, és a maximum likelihood módszert elemezzük részletesen.

Parallelepipedon szabály (nem-parametrikus)

A parallelepipedon döntési szabályban a vizsgált pixel értékeit összehasonlítjuk az alsó és a felső határokkal. Az alsó és a felső határok lehetnek:

a tanulón belüli pixelek értékeinek minimális és maximális értéke minden sávban,

minden sáv szerint az átlag és annak valamilyen skalárral szorzott szórású környezete,

bármilyen határ, amit a felhasználó definiál az adatok, vagy a tanuló ismerete szerint. Ezek az ismeretek származhatnak a korábban tárgyalt tanulóértékelési technikák alapján.

Az alábbi ábra egy kétdimenziós példát ad a parallelepipedon osztályozásra.

ábra

A sávpáronként értelmezett és a sávonként vett minimális és maximális értékekkel lehatárolható téglalapok adják a 3-dimenziós térben értelmezett téglatest határoló felületeit, míg n-dimenzióban egy n-dimenziós parallelepipedont definiálhatunk.

Az osztályozás lépései

Ha a pixel egyetlen tanulóhoz tartozó parallelepipedonba esik, akkor a tanuló által kijelölt osztályba soroljuk.

Ha kettő vagy több parallelepipedon közös térrészébe, átlapoló területébe helyezhető el a vizsgált pixel, akkor osztályozhatjuk a tanulók rangja, vagy parametrikus szabály szerint.

A pixelt a magasabb rangú (alacsonyabb értékű) tanuló által reprezentált osztályba soroljuk.

Ha rangot nem vehetjük figyelembe, akkor a pixelt csak az átlapoló tanulókra alkalmazott parametrikus szabály szerint osztályozzuk. Ha egyik tanuló sem parametrikus, akkor a pixel osztályozatlan marad, ha csak az egyik tanuló parametrikus, akkor a pixelt automatikusan ehhez az tanulóhoz, ill. az általa reprezentált osztályhoz soroljuk.

a pixel osztályozatlan marad

Ha a pixel nem esik egyik parallelepipedonba sem, akkor definiálni kell az osztályozást

a pixelt az összes tanulóra alkalmazott parametrikus szabály szerint osztályozzuk. Ha egyik tanuló sem parametrikus, akkor a pixel osztályozatlan marad.

a pixel osztályozatlan marad

PARALLELEPIPEDON döntési szabály előnyei

Gyors és egyszerű, miután a pixelértékeket olyan határokhoz hasonlítjuk, amelyek változatlanok maradnak az osztályozás során mindegyik tanulóra vonatkozóan. Gyakran használható egy első szintű, kiterjedt osztályozás elvégzésére. A döntési szabállyal gyorsan csökkenthető a lehetséges osztályok száma, mielőtt valamilyen időigényes (minimális távolság, Mahalanobis távolság, maximum likelihood) módszert alkalmaznánk. Nem függ az adatok normális eloszlásától.

PARALLELEPIPEDON döntési szabály hátrányai

Miután a parallelepipedonoknak sarkai vannak, olyan pixel is osztályozható, amely távol van az átlagértéktől.

Feature space

Ugyanaz, mint a parallelepipedon, csak a spektrális térben kijelölt pixelhalmaz határai tetszőlegesek lehetnek.

Minimális távolság döntési szabály

A minimális távolság döntéshozási módszere, vagy más néven a spektrális távolság módszere az osztályozni kívánt pixel és mindegyik tanuló átlagos értéke közötti n darab lehetséges spektrális távolság mérésén alapul.

ábra

A fenti ábrán a spektrális távolságokat a kétdimenziós vektortérben vastag szakaszok jelzik a pixel és a tanulók átlagértékei között. A pixelt ahhoz az osztályhoz rendeljük, melyet reprezentáló tanuló átlagértékéhez a legközelebb van, vagyis amelyre az alábbi kifejezés minimális ahol

n = a sávok száma (dimenzió)

i = az adott sáv indexe

c = az adott osztály index

Xxyi =az i sáv x,y pixelének az értéke

SD xyc = az x,y pixel és a c osztály közötti távolság

MINIMUM TÁVOLSÁG döntési szabály előnyök

A véges számú távolság között mindig van legalább egy legkisebb, így nem lesz osztályozatlan pixel. A küszöbérték térképen, amely megmutatja a pixel és az osztályközép távolságát, a túl távol lévő pixelek kiszűrhetők. A parallelepipedon módszer után a leggyorsabb döntéshozó módszer.

MINIMUM TÁVOLSÁG döntési szabály hátrányok

Azok a pixelek, amelyek más feltételek esetén osztályozatlanok maradnának, osztályozottak lesznek. Nem veszi figyelembe az osztály variabilitását. Például egy városi területet reprezentáló osztály esetén, melynek nagy a varianciája, a középtől távol lévő pixelek, más osztályközepek közelsége miatt, más osztályhoz sorolódnak, vagyis az osztály alulreprezentált lesz. Fordítva, a kis varianciájú, homogén osztályok esetén, mint pl. egy vízfelület, a nem az osztályhoz tartozó pixelek, más osztályközepek relatíve nagyobb távolsága miatt a vízfelületként osztályozódnak. A vízfelület túlreprezentált lesz. Ha a nagy varianciájú tanuló jól elkülöníthető résztanulókra bontható, akkor ezek egy tanulóként való kezelése azt eredményezi, hogy az átlagvektor a két tanulórész közé mutat, ahol lehet, hogy nincs is pixel, vagy egy másik tanuló van. Ez különösen a minimális távolság módszerénél okoz látványos hibát. Ezt úgy javíthatjuk ki, hogy a tanulót felbontjuk alkotó részeire. Ez viszont azt eredményezi, hogy megszűnhetnek olyan osztályok, mint a városi beépítés, mert felbomlik útfelületre, zöldfelületre, vízfelületre, stb. Nagy varianciájú tanulókat a fentiek szerint csak akkor alkalmazhatunk osztályok reprezentálására, ha

nem bontható homogén, elkülönülő résztanulókra,

a legközelebbi tanuló átlagvektora és a nagy varianciájú tanuló átlagvektorának a távolsága legalább kétszerese az utóbbi a tanulón belül mérhető legnagyobb spektrális távolságnak.

Mahalanobis távolság

A Mahalanobis távolság hasonló a minimális spektrális távolsághoz, csak a kovariancia mátrixot használja az egyenletben. A mátrixban szereplő varianciák és kovarianciák értékei továbbviszik a tanulóban lévő nagy változékonyságú pixelek tulajdonságait az osztályra. Például, ha városi területet osztályozunk, amely tipikusan nagy varianciájú pixeleket tartalmazhat, a jól osztályozott pixel messzebb lehet az osztályközéptől, mint esetleg egy nem nagy varianciájú osztály, pl. a vízfelület esetén. ahol

D = Mahalanobis távolság

c = adott osztály

X = pixel vektora

Mc = osztály tanulójának átlagvektora

Cov c = a c osztály tanulójában lévő pixelek alapján számított kovariancia mátrix

Cov c -1 = Cov c inverze

T = transzponált függvény

MAHALANOBIS TÁVOLSÁG döntési szabály Előnyök

A tanulók variabilitását is figyelembe veszi, nem úgy mint a minimális távolság vagy a parallelepipedon módszer. Sokkal használhatóbb lehet mint a minimális távolság módszere, ha a statisztikai paramétereket (amelyeket kifejezünk a kovariancia mátrixban) figyelembe kell venni, de a maximum likelihood módszernél alkalmazható súlyfaktorok nem állnak rendelkezésre.

hátrányok

A kovariancia mátrixban szereplő nagy értékek szereplése esetén túlosztályozott lehetnek egyes osztályok. Ez akkor fordul elő, ha a klaszterben vagy a tanulón belül a pixelek nagyon elszórva helyezkednek el (a spektrális térben). Lassabb, mint a parallelepipedon vagy a minimális távolság módszere. A Mahalanobis távolság módszere parametrikus, ami azt jelenti, hogy szükséges minden sáv adatainak normális eloszlása.

Maximum likelihood módszer

A Maximum likelihood módszer alkalmazhatóságához szükséges, hogy a sávonkénti adatok normális eloszlásúak legyenek. Ha ez nem áll fenn jobb eredményt kapunk a parallelepipedon vagy a minimális távolság módszerrel. A Maximum likelihood módszer azon alapul, hogy egy pixel milyen valószínűséggel tartozik egy adott osztályba. Az alapegyenlet feltételezi, hogy ezen valószínűségek egyenlők minden osztályra vonatkozóan és hogy a bemenő sávoknak normális az eloszlása.

Bayes osztályozó

Ha van előzetes, a priori információnk arról, hogy a valószínűségek nem egyenlők minden osztályra, akkor súlyokat adhatunk az egyes osztályoknak. A Maximum likelihood módszer ezt a változatát Bayes-féle döntési módszernek nevezik (Hord, 1982). Ha nincs előzetes információ a valószínűségekről, akkor a súlyok értéke 1.0 az egyenletben.

A Maximum likelihood és a Bayes-féle döntési módszer egyenlete:

MAXIMUM LIKELIHOOD/BAYES döntési szabály előnyök

A legpontosabb osztályozási módszer, ha a bemenő sávok adatai normális eloszlásúak, mert ez veszi figyelembe a legtöbb változót. A Mahalanobis távolság módszerhez hasonlóan a Maximum likelihood is a kovariancia mátrixot használja az osztályok variabilitásának jellemzésére.

Hátrányok

A bonyolult egyenlet miatt a számítás sok időt vesz igénybe. Az idő a sávok számának növekedésével egyenesen arányos. A Maximum likelihood parametrikus módszer. amely azt jelenti, hogy erősen függ az egyes sávok adatainak normális eloszlásától. A kovariancia mátrixban szereplő nagy értékek szereplése esetén túlosztályozott lehetnek egyes osztályok. Ez akkor fordul elő, ha a klaszterben vagy a tanulón belül a pixelek nagyon elszórva helyezkednek el a spektrális térben.

Az osztályozás eredményének értékelése

Az osztályozás pontosságának, eredményének az értékelésére több módszer is létezik:

küszöbérték vizsgálat - a túlosztályozott osztályokban lévő kritikus pixelek kiszűrésére alkalmazott módszer

pontosság becslés - a klasszifikáció eredményének és földi vagy más meglévő adatok összehasonlításának módszere.

Küszöbérték vizsgálat

A küszöbérték vizsgálattal azonosíthatjuk azokat a pixeleket, amelyeket valószínűleg (most likely) rosszul osztályoztunk. Ezeket a pixeleket egy másik osztályba, általában az nulla osztályba, a nem osztályozottak közé sorolunk át. Ezeket a pixeleket a döntési szabályban használt távolságmérés alapján azonosítjuk.

Távolság file

Ha minimális távolság, a Mahalanobis távolság, a Maximum likelihood osztályozási módszert alkalmazzuk, mindannyiszor létrehozható egy-egy távolság file a kimenő raszterréteg mellett. A távolság file egy egysávos file, az adatok 32 bites tárolásban folyamatos raszterréteget alkotnak, amelyben minden pixelérték az alkalmazott távolságmérés eredményét mutatja.

A minimum távolság osztályozásnál minden távolságérték Euklideszi spektrális távolság a pixel és az osztály átlagértéke között.

Mahalanobis távolság, vagy a Maximum likelihood osztályozási módszert alkalmazva a távolságérték a pixel vektora és az osztály átlagvektora közötti Mahalanobis távolság.

.ábra

A távolság file hisztogramja

Ez az eloszlási görbe a Chi2 eloszlási függvényéhez hasonló. A valószínűleg rosszul osztályozott pixelek távolságértékeik szerint a grafikon jobb oldalán helyezkednek el, melyek matematikai módszerekkel pontosan definiálhatók és levághatók a hisztogramról. A levágás helye a küszöbérték. A küszöbérték meghatározható:

interaktív módon a hisztogramon,

bemenő adatként, chi2 paraméterként.

Mindként esetben az eredmény az lesz, hogy a legnagyobb távolságértékű pixelek egy tematikus osztályba kerülnek, amely maszkként használható az osztályozás eredményeként létrejött tematikus raszterrétegen.

Pontosság becslés - Accuracy assessement

A pontosság becslése véletlenszerűen kiválasztott referencia pixelek és a tematikus raszterréteg összehasonlítását jelenti. A kiválasztott pixelek számának 250-nél nagyobbnak kell lenni ahhoz, hogy egy osztály átlagos pontosságát 5 %-kon belül megadhassuk. A referencia pixelek véletlenszerű kiválasztása történhet:

random módon - semmilyen szabályt nem használva,

stratégiai random módon - a referencia pixelek a tematikus osztályok területi arányának megfelelően oszlanak el véletlenszerűen az osztályokban,

kiegyenlített random módon - a referencia pixelek a tematikus osztályokban egyenlő számban oszlanak el véletlenszerűen.

A pontosság mérésének az eredménye vagy egy c x c méretű hibamátrixban jelenik meg, ahol c az osztályok száma, vagy egy egyszerű pontosság fileban, mely egy ASCII-file, tartalma a pontosság százalékos statisztikája a hibamátrix alapján.

Automatikus osztályozás

Automatikus osztályozást angolul Unsupervised training-nek hívják. Az ún. unsupervised osztályozás, nevezhetjük nem irányított osztályozásnak, csak minimális beavatkozást igényel a felhasználó részéről, de az osztályozás eredményét, az osztályokat megjelenítő térképet a felhasználónak kell értelmeznie, és az osztályoknak nevet adni, összevonni ha szükséges, stb. A nem irányított osztályozást, klaszterezésnek (clustering) is nevezik, mert a módszer a spektrális térben lehatárolható pixelcsoportok kialakítására törekszik. Ezeket a pixelcsoportokat, amelyek a statisztikai értelemben hasonló pixeleket tartalmazzák, klasztereknek hívják. Az osztályozás után kialakuló csoportokat térképi műveletekkel, GIS funkciókkal összevonhatjuk, elemezhetjük, illetve felhasználhatjuk a supervised osztályozásban mint a tanulóterületek.

Klaszterek

A klasztereket a klaszterező algoritmus határozza meg, amely az összes, vagy majdnem az összes pixelt felhasználja az elemzéskor. Az algoritmust az alábbi tulajdonságok jellemzik:

a, az ISODATA klaszterezési módszer a spektrális távolságot használja a csoportok elkülönítésekor, de iteratív módon osztályozza a pixeleket, vagyis újraértelmezi a kritériumokat minden osztályra és eszerint osztályozza újra a pixelek, így a spektrális távolságon alapuló csoportok egyre finomodnak.

b, az RGB klaszterezési módszer sokkal speciálisabb, mint az ISODATA módszer. Az RGB módszer 3 sáv 8 bites adatait használja fel az osztályokra bontásnál, úgy hogy a 3-dimenziós spektrális térben meghatározza a pixeleket befoglaló térrészleteket, s ezek lesznek az osztályok.

Ebben a fejezetben mindkét módszer részletes elemzésre kerül, bemutatva előnyeiket és hátrányaikat.

ISODATA

Az ISODATA osztályozás neve az Iterative Self-Organizing Data Analysis Technique (Gonzalez és Tou, 1974) kifejezés rövidítése. Jelentése: Ismétlődő önszervező adatelemző módszer. Ismétlődő (iteratív), mert a teljes klasszifikációt megismétli, amíg az eredmény meg nem felel a követelményeknek, és létrehozza a tematikus raszterréteget, s újraszámítja annak statisztikáját. Önszervező, mert minimális felhasználói segédlet szükséges a klaszterek kijelöléséhez. Az ISODATA módszer a minimális spektrális távolságok módszerét alkalmazza a pixelek osztályba sorolásakor. Az osztályozás meghatározott számú klaszter átlagértékének a megadásával kezdődik (beleértve a már létező tanulóterületek alapján számított osztályközepeket is), és ez ismétlődik, úgy hogy a klaszterközepek folyamatosan módosulnak egy új pixel osztályba sorolása után.

ISODATA klaszterezés paraméterei:

N a klaszterek maximális száma.

Minden klaszter a későbbi osztályt fogja meghatározni, így a klaszterek száma megadja az osztályok maximális számát is. Minden ISODATA osztályozási folyamat N klaszterközép meghatározásával kezdődik. Kevés pixelt tartalmazó klaszterek megszűnhetnek, ezért kevesebb mint N klaszter marad.

T - konvergencia küszöb, amely megadja, hogy maximálisan a pixelek hány százaléka maradhat változatlan az iterációk között.

M - az iterációk maximális száma.

Az ISODATA algoritmus első iteráció elején az N db klaszter átlagértékét határozza meg. Minden egyes iteráció után, az új klaszterközepeket ismét meghatározza az aktuális klaszterbeli pixelek szerint. Ezeket a klaszterközepeket használja majd a következő iterációban a klaszterek meghatározásához. Ez a folyamat addig folytatódik, amíg az iterációk eredményei között nagyon kicsi különbség nincs (Swain, 1973). A kezdő klaszterközepek a spektrális térben egy vektor mentén helyezkednek el, mely két végpontjának spektrális térbeli koordinátái az N-dimenziós térben:

(µ1-σ1, µ2-σ2, ... , µn-σn), ill. (µ1+σ1, µ2+σ2, ... , µn+σn).

Kétdimenzióban a kezdő klaszterközepek az A(µ1-σ1, µ2-σ2) és B(µ1+σ1, µ2+σ2) pontok között helyezkednek el.

A pixeleket egyenként soroljuk valamelyik osztályba a bal-felső sarokban lévő pixellel kezdve, majd soronként sorra kerül minden pixel. A pixel és a klaszterközepek térbeli távolságait kiszámítja az algoritmus és a pixelt ahhoz a klaszterhez rendeli, mely közepéhez a pixel legközelebb van a spektrális térben. Az ISODATA osztályozás eredménye egy tematikus raszterréteg és/vagy egy tanulóterület file. Az első iteráció eredménye hasonló a következő képhez. A második iteráció során minden klaszter átlagértékét újraszámítja az algoritmus. Minden pixel összemért az új klaszterközepekkel és hozzárendeli a legközelebbihez. Mindegyik iteráció után az ugyanabban a klaszterben maradó pixel százalékos aránya alapján indul el az újabb iteráció vagy, ha ez az arány eléri a konvergencia küszöböt, az algoritmus befejeződik. Lehetséges, hogy a változatlan pixelek százalékos aránya sohasem éri el ezt a küszöbértéket, ezért az iterációk számának (M) rögzítésével megakadályozható, hogy a program a végtelenségig fusson.

ISODATA klaszterezés előnyei

Iteratív. Ez az algoritmus nagyon alkalmas az egynemű adatokat tartalmazó spektrális klaszterek megtalálására. Nincs jelentősége, hogy a kezdő klaszterközepek hol helyezkednek el, ha elég sok iteráció engedélyezett. A kimenő tematikus raszterréteg hasonló a tanulóterületek alapján, a minimális távolságok módszerét alkalmazó osztályozás eredményéhez. Ezt a tematikus raszterréteget elemezhetjük és kezelhetjük a tanulóterületek szerint mielőtt az aktuális klasszifikációt végrehajtanánk.

ISODATA klaszterezés hátrányai

A klaszterezés sokszor ismételődő, ezért időigényes művelet. Nem veszi figyelembe a pixel térbeli homogenitást.

RGB klaszterezés

Az RGB klaszterezés egy egyszerű osztályozási és adattömörítési technika 3 sávra vonatkoztatva, 8 bites adatokon. Egyszerű és gyors algoritmus, amelyet akkor használunk, ha gyors osztályozási eredményre van szükség, de nem lényeges minden részlet teljes körű osztályozása. Alkalmas továbbá a 24 bites színes képek 8 bites színes képpé tömörítésére. Az algoritmus minden pixelt a 3 dimenziós spektrális térben helyez el, és utána egy térbeli háló szerint hozza létre a klasztereket. Minden klaszter egy osztály lesz a kimenő tematikus raszterrétegen. A 3-dimenziós tengelyek mentén a bemenő adatok szerinti hisztogramokat skálázza, majd a hisztogram alapján szétdarabolja az intervallumot, pl. a az átlaghoz képest valamilyen szórástávolságon belüli pixeleket, vagy a minimum és maximum értékek között. A sávonkénti osztályok száma alapértelmezésben: Vörös (Red) - 7 db, Zöld (Green) - 6 db, Kék (Blue) - 6 db, Definiálható, hogy a három sávot egyenként mennyi részre bontsa az algoritmus aszerint, hogy milyenek a sávok szerinti hisztogramok. A szélesebb hisztogram több szeletre, a keskenyebb hisztogram kevesebb szeletre bontható. Az IDRISI Composit parancsa a 3 bemenő sávot felbontja 6-6 intervallumra és a kimenő színes kép pixelértéke a következő képlettel számítható ki: pixelérték= B + 6*G + 36*R.

RGB klaszterezés előnyei

A leggyorsabb osztályozási módszer. A tervezésekor arra törekedtek, hogy gyors és egyszerű osztályozást adjon olyan alkalmazásokhoz, melyek nem igényelnek speciális osztályokat.

A pixelek vizsgálati sorrendje nem befolyásolja a kimenő adatokat.

Erősen interaktív funkció, iteratív módon változtathatjuk a paramétereket, amíg a klaszterek száma és a küszöb megfelel az analízis szempontjából.

Hátrányai

Pontosan három sávot használ az algoritmus, így nem lehetséges mindenféle alkalmazás.

Nem mindig hoz létre olyan tematikus filet, amely alkalmas a későbbi elemzésre.