Tietotekniikan LuK-tutkielma

Paikkatieto

Jukka Lepistö

4.12.2000

Jyväskylän yliopisto
Tietotekniikan laitos

Tekijä: Jukka Tapio Lepistö.

Yhteystiedot: Sähköposti julepist@cc.jyu.fi.

Työn nimi: Paikkatieto.

Title in English: Geographic Information Systems.

Työ: Tietotekniikan LuK-tutkielma.

Sivumäärä: 22.

Linja: Ohjelmistotekniikka.

Teettäjä: Jyväskylän yliopisto, tietotekniikan laitos.

Tiivistelmä:. Tutkielma käsittelee paikkatiedon rakennetta ja perusteita. Tarkoituksena on antaa lukijalle käsitys siitä, mitä sanalla paikkatieto tarkoitetaan. Hyvin pintapuolisesti käydään lävitse paikkatiedon ja kartoituksen historiaa. Tarkemmin tutustutaan paikkatiedon rakenteeseen ja käsitteisiin. Tutkielmassa käsitellään myös paikkatiedon laatuun vaikuttavia tekijöitä ja paikkatietojärjestelmien hallintaa.

Avainsanat: Paikkatieto, koordinaattijärjestelmät, laatu, paikkatiedon hallinta

Keywords: Geographic information systems, coordinate systems, quality, data management.

Sisällysluettelo

1. Johdanto

2. Paikkatiedon ja kartoituksen historiaa
2.1 Karttojen kehittyminen paikkatiedon esittämiseen
2.2 Tietokonepohjaisten paikkatietojärjestelmien kehittyminen
2.3 Paikkatietojärjestelmät nykyään ja tulevaisuuden trendejä

3. Paikkatieto
3.1 Paikkatiedon rakenne
3.2 Sijaintitieto
3.3 Topologiatieto
3.4 Ominaisuustieto
3.5 Yhteystieto

4. Koordinaattitieto
4.1 Kartastokoordinaattijärjestelmä
4.2 Yhtenäiskoordinaatisto
4.3 Muita koordinaatistoja
4.4 Korkeuden ilmoittaminen

5. Geometriatieto vektori- ja rasterigeometrisen mallin mukaan
5.1 Vektorigeometrinen malli
5.2 Rasterigeometrinen malli

6. Rasterimuotoisen tiedon tiivistysmenetelmiä
6.1 Run-lenght -koodaus
6.2 Nelipuukoodaus

7. Topologiatiedon lisääminen paikkatietoon
7.1 Spagettimalli
7.2 Topologinen malli
7.3 Epäsäännöllinen kolmioverkko

8. Paikkatiedon laatu
8.1 Mikrotason tekijät
8.2 Makrotason tekijät
8.3 Käyttäjäkohtaiset tekijät
8.4 Virhemahdollisuudet

9. Paikkatiedon hallinta
9.1 Tiedostopohjainen tiedonhallinta
9.2 Tietokantapohjainen tiedonhallinta

10. Yhteenveto

Lähdeluettelo

1. Johdanto

Paikkatiedolla tarkoitetaan kartta- ja ominaisuustiedon muodostamaa kokonaisuutta. Tietokonepohjaisiin rekistereihin tallennetaan tietoa ympäröivästä maailmasta. Koordinaateilla voidaan esimerkiksi määritellä rakennuksen sijainti. Rakennuksen ominaisuustietoihin voidaan esimerkiksi tallentaa tietoa siitä, kuka rakennuksen omistaa, mistä materiaalista rakennus on tehty ja kuinka korkea rakennus on.

Paikkatietojärjestelmät tarjoavat päättäjille tehokkaan ja nopean työvälineen, jolla voidaan tuottaa tarkkaa tietoa päätöksenteon tueksi. Perinteisesti paikkatietoa on käytetty havainnollistettaessa maastotietoja kartoilla. Nykyaikaiset tietokonepohjaiset järjestelmät tarjoavat apuvälineitä lisäksi luonnonvarojen käytön kartoitukseen, ympäristön tilan seurantaan ja rakennetun ympäristön tilan seurantaan. Mahdollisuudet ovat melkeinpä rajattomat.

Paikkatietojärjestelmät voivat olla pieniä yhden käyttäjän mikrosovelluksia, esimerkiksi kuljetusliikkeen reitinoptimointiohjelma. Toista ääripäätä edustavat konsernikokoluokkaa edustavat järjestelmät, jotka mahdollistavat useita satoja samanaikaisia käyttäjiä.

Luvussa 2 esitellään paikkatiedon ja paikkatietojärjestelmien kehityshistoriaa pintapuolisesti läpi. Luku 3 keskittyy paikkatiedon rakenteen kuvaamiseen. Neljännessä luvussa käsitellään tarkemmin koordinaattitiedon rakennetta. Viidennessä luvussa on kuvattu geometriatietoa ja sen rakennetta. Kuudennessa luvussa keskitytään rasterimuotoisen geometriatiedon tiivistämismenetelmiin. Luvussa 7 keskitytään topologiatiedon tallentamismenetelmien esittelemiseen. Paikkatiedon laatua ja laatuun vaikuttavia tekijöitä ja ilmiöitä käsitellään luvussa 8. Paikkatiedon hallintaan on paneuduttu luvussa 9.

2. Paikkatiedon ja kartoituksen historiaa

Luvussa tarkastellaan kartoituksen ja paikkatiedon kehitystä kivikauden ihmisten luolamaalauksista nykypäivän supertietokoneissa pyöriviin laajoihin ohjelmistoihin. Luku perustuu lähtei siin [Mapinfo] ja [Wisconsin].

2.1 Karttojen kehittyminen paikkatiedon esittämiseen

Kivikauden ihmiset piirsivät luolien seiniin erilaisia maamerkkejä (vuoria, jokia) ja saaliseläinten kuvia. Karttaa, johon on merkitty muutama maantieteellinen paikka ja siihen on liitetty kuva saaliseläimestä, voidaan pitää äärimmäisen yksinkertaisena esimerkkinä paikkatietojärjestelmästä.

Vuosisatojen aikana kartat kehittyivät vähitellen yhä tarkemmiksi ja tarkemmiksi. Erityisesti Rooman valtakunnan kukoistuksen aikana karttojen tekeminen ja maanmittaus olivat tärkeitä toimintoja. Valtakunnan romahtaminen vei monen muun asian ohella maanmittauksen ja karttojen piirtämisen vuosisadoiksi unohduksiin. Vasta 1700-luvulla huomattiin uudelleen, kuinka tärkeitä apuvälineitä kartat olivat maankäytön suunnittelussa. Erityisesti kaupunkien kaavoitus ja rakentaminen olivat vaikeita toteuttaa tarkasti ilman tarkkaa maanmittausta.

Alussa karttoihin merkittiin vain valtioiden ja maakuntien hallinnollisia rajoja ja yksinkertaista tietoa alueen pinnanmuodoista. Vähitellen alettiin myös laatimaan erityisiä teemakarttoja, joista kävi ilmi kasvillisuuden tyypit tai maaperätyypit. 1900-luvulla tarve saada suuria määriä paikkatietoa esitetyksi mahdollisimman nopeasti johtivat varsinaisten paikkatietojärjestelmien kehittymiseen.

Ennen tietokoneiden aikakautta paikkatieto esitettiin kartan muodossa, johon oli erilaisten viivojen, pisteiden ja värien avulla lisätty erilaista tietoa. Kartan yhteyteen lisättiin tieto siitä, mitä mikin symboli tarkoittaa. Tämä kokonaisuus muodosti paikkatietojärjestelmän. Paperinen kartta pystytään valmistamaan nopeasti ja se sisältää kohtalaisen määrän tietoa helposti omaksuttavassa muodossa. Negatiivisena puolena on se, että tietoa joudutaan yleistämään. Ollakseen luettavassa muodossa kartalta piti siten poistaa liian tarkat yksityiskohdat, jolloin sen käytettävyys toisaalta joidenkin käyttäjäryhmien osalta yleensä heikkeni.

2.2 Tietokonepohjaisten paikkatietojärjestelmien kehittyminen

Ensimmäisiä varsinaisia tietokonepohjaisia paikkatietojärjestelmäprojekteja oli Kanadassa 1960-luvun puolivälissä käynnistetty Canada Geographic Information System -niminen (CGIS) projekti. Tämän pioneeriprojektin tarkoituksena oli tuottaa maankäytön suunnittelussa käytettävää aineistoa.

Koska projekti oli ainutlaatuinen, kaikki käytetyt ohjelmistot ja laitteet jouduttiin suunnittelemaan ja rakentamaan ilman minkäänlaista tietoa aikaisemmista projekteista. Eräitä tämän projektin innovaatioita olivat alkukantaisen kuvanlukijan kehittäminen, pintojen (engl. layer) käyttöönotto sekä ominaisuus- ja sijaintitiedon sijoittaminen eri tietokantoihin.

Varsinaisesti projektin tuloksia päästiin hyödyntämään vasta 1970-luvun alkupuolella. Valitettavasti projekti kärsi koko ajan aikataulujen ylityksistä ja ennakoitua korkeammista kustannuksista. Projektin aikaansaannokset ovat kuitenkin kiistattomat ja monet nykypäivän paikkatietojärjestelmät ovat suuresti velkaa tälle pioneeriprojektille.

CGIS-projektia jatkettiin kaikesta huolimatta koko 1970-luvun. Ohjelmistoon lisättiin uusia ominaisuuksia, kuten etäkäyttömahdollisuus. 1970-luvun lopulla ja 1980-luvun alussa CGISiä pidettiin edistyneimpänä paikkatietojärjestelmänä. Tilanne oli kuitenkin nopeaan tahtiin muuttumassa. Uudet kaupalliset ohjelmistot, kuten ESRIn ArcInfo, sisälsivät uusia kehittyneempiä ominaisuuksia halvempaan hintaan. Tämä yhdistettynä tietotekniikan nopeaan kehitykseen johtivat paikkatietojärjestelmien leviämiseen yhä laajemmalle. Ominaista näille 1980-luvun paikkatietojärjestelmille oli ominaisuustiedon tallentaminen relaatiotietokantoihin sekä siirtyminen minitietokonesta tavallisiin PC-mikrotietokoneisiin ja yhden käyttäjän ohjelmistoista usean käyttäjän samanaikaisen toiminnan mahdollistaviin työkaluihin. Tyypillinen käyttötarkoitus oli erilaisten analyysien ja kyselyiden toteuttaminen sekä teemakarttojen tulostaminen.

2.3 Paikkatietojärjestelmät nykyään ja tulevaisuuden trendejä

Tämän kuluvan vuosikymmenen trendejä paikkatietojärjestelmissä ovat olleet erilaiset Internet-sovellukset. Paikkatietosovelluksia on siirretty kaikkien saataville World Wide Webiin. Hyvänä esimerkkinä tälläisestä sovelluksesta voidaan mainita Suomalaisen liikunnan tietopankki (katso sivu http://www.sport.jyu.fi).

Paikkatietojärjestelmien suosion jatkuva kasvu on johtanut paikkatieto-ohjelmistojen erikoistumiseen käyttäjien ja käyttötarkoituksen mukaan. Tehokäyttäjille ja päätöksenteon avuksi suunnatut ns. ammattilaistuotteet sisältävät työkalut laajojen paikkatietoaineistojen käsittelyyn, tehokkaaseen analysointiin ja sovelluskehitykseen. Esimerkkinä tälläisestä ohjelmistosta voidaan mainita ESRIn ArcInfo ja MapInfon MapXtreme. Hieman kevyempään käyttöön tarkoitetut GIS-ohjelmistot soveltuvat yksinkertaisia operaatioita sisältäviin tapahtuma- ja tiedonhallintapainotteisiin tietojärjestelmiin. ESRIn ArcView on hyvä esimerkki tälläisestä ohjelmistosta.

Tulevaisuudessa paikkatietojärjestelmät kehittyvät tekoälyä käyttäviksi päätöksenteon ja tutkimuksen apuvälineiksi. Ne tulevat sisältämään erilaisia syy-seuraus -suhteisiin liittyviä päättelysääntöjä tavallisten paikkatiedon käsittelyominaisuuksien lisäksi. Itse paikkatieto muuttuu yhä tarkemmaksi ja järjestelmät tulevat sisältämään entistä yksityiskohtaisempaa tietoa. Yksi täysin uusi alue paikkatiedon hyväksikäytössä on paikkatietojen käyttäminen erilaisten keinotodellisuusmaailmoiden luomiseen (katso sivu http://www.arenanet.fi/virtuaalihelsinki/ ).

Toisaalta paikkatietojärjestelmien kehittyminen ei välttämättä ole hyvä asia. Liiankin yksityiskohtaisen tiedon kerääminen ja eri lähteistä koottujen tietojen yhdistäminen voi pahimmassa tapauksessa johtaa orwelmaiseen todellisuuteen. Ihmisiä voidaan jaotella asuinpaikkansa ja yhteiskunnallisen asemansa mukaan hyvinkin tehokkaasti. Lainsäätäjien tulee ottaa tämä näkökohta hyvin tarkasti huomioon yksilönsuojaa koskevia lakeja käsiteltäessä.

3. Paikkatieto

Tässä luvussa perehdytään tarkemmin paikkatiedon rakenteeseen. Käsitteellä paikkatieto tarkoitetaan yleensä erilaisia kartta- ja rekisteritietoja, jotka kuvaavat maan pinnanmuotoa, maankäyttöä ja -omistusta, elinkeinotoimintaa sekä liikenne- ja yhdyskuntahuollon erilaisia verkkoja. Luku pohjautuu seuraaviin lähteisiin [Geodeettinen laitos], [Maanmittauslaitos] ja [Raivio].

3.1 Paikkatiedon rakenne

Erityistä paikkatiedossa on sen sitominen tiettyyn, ennaltamäärättyyn koordinaatistoon. Sitominen voidaan tehdä joko suoraan antamalla tarkat koordinaatit, tai epäsuorasti antamalla jonkinlainen tunnus, jonka perusteella voidaan paikalle hakea koordinaatit. Paikkatietoa havainnollistetaan kartan muodossa.

Olennaisia käsitteitä paikkatiedosta puhuttaessa ovat ominaisuustieto, sijaintitieto ja yhteystieto (katso kuva 1). Seuraavissa alaluvuissa selvitetään lyhyesti, mitä kullakin käsitteellä tarkoitetaan.

Kuva 1. Paikkatiedon rakenne.

3.2 Sijaintitieto

Sijaintitieto (engl. spatial data) sisältää tietoa kohteen sijainnista, geometriasta ja topologiasta. Tavallisen koordinaattidatan lisäksi sijaintitietoon sisällytetään tietoa siitä, kuinka tarkasti koordinaatit on annettu. Geometriatiedolla (engl. geographic data) määritetään, minkälaista yksilötyyppiä kohde on. Yksilötyyppi voi olla joko piste, viiva, alue tai hila-alkio. Näiden kahden lisäksi järjestelmään voidaan myös tallentaa topologiatietoa, joka kuvaa eri alueiden sijaintisuhteita toisiinsa nähden.

Koordinaattitiedolla tarkoitetaan tietoa siitä, missä paikassa maapalloa jokin kohde sijaitsee. Ilman tätä tietoa muu kerätty tieto menettää täysin merkityksensä, koska ei voida olla varmoja kohteen tarkasta sijainnista. Normaalissa elämässä paikan sijainti ilmoitetaan paikannimellä. Muita tapoja ilmoittaa jonkin paikan sijainti ovat kiinteistötunnus, havaintopaikkatunnus ja toimipaikkatunnus. Paikkatietojärjestelmän kannalta tärkein ja samalla ainoa tapa sijainnin ilmoittamiseen on koordinaattien käyttö.

Geometrisessa mielessä paikkatietoaineistot ovat yleensä pisteitä, viivoja, alueita, aluejakoja tai ruudustoja. Geometriatieto voidaan kuvata joko vektorigeometrisen mallin tai rasterigeometrisen mallin mukaan. Tarkemmin vektori- ja rasterimallia käsitellään luvuissa 5 ja 6.

3.3 Topologiatieto

Topologiatiedolla ilmoitetaan geometristen yksiköiden välisiä suhteita, jotka on suoraan esitetty ja joita ei siis tarvitse enää laskea koordinaattitiedosta. Tälläistä tapausta nimitetään myös eksplisiittiseksi spatiaaliseksi relaatioksi.

Eräs yksinkertainen esimerkki topologiasta on viiva, jonka pisteiden tallennusjärjestys on ilmoitettu jollain tavalla. Toisenlainen esimerkki topologiasta on katuverkko. Katujen risteykset määritellään solmuiksi ja kerrotaan, mitkä kadunpätkät missäkin solmussa kohtaavat. Tarkemmin topologiatietoa käsitellään luvussa 7.

3.4 Ominaisuustieto

Sijaintitiedon ohella paikkatiedon kohteita määrittelee ominaisuustieto (engl. attribute data). Se sisältää kuvausta kohteen erilaisista ominaisuuksista. Toisin sanoen kaikki ns. tavallinen kohteeseen liittyvä tieto on ominaisuustietoa.

Ominaisuustieto voidaan jakaa neljään eri tyyppiin. Yksilöivää tietoa ovat esimerkiksi nimet ja numerot. Yksilöivä tieto on tarkinta mahdollista ominaisuustietoa. Ajoittavaa tietoa ovat esimerkiksi lämpötilat. Paikantavaksi tiedoksi lasketaan esimerkiksi asuntojen osoitteet. Kuvaileva tieto kertoo esimerkiksi värin tai kasvillisuuden tyypin.

3.5 Yhteystieto

Topologiatieto määriteltiin geometristen yksilöiden välisiä suhteita kuvaavana tietona. Yhteystieto on todellisuuden kohteiden yksilöintiin perustuvaa, kohteiden välisiä suhteita kuvaavaa tietoa. Tätä paikkatiedon lajia ei yleensä edes kerätä, vaan suhteita kuvaava tieto on aina topologiatietoa.

4. Koordinaattitieto

Suomessa tasokoordinaatit ilmoitetaan virallisesti käyttämällä kartastastokoordinaattijärjestelmää. Se ei sinänsä ole mikään koordinaatisto, vaan pikemminkin kartanpiirron standardi, johon perustuvat topografisissa kartoissa käytetyt peruskoordinaatisto ja yhtenäiskoordinaatisto (lyh. YKJ). Näistä kahdesta peruskoordinaatisto eli kartastokoordinaatisto (lyh. KKJ) on yleisempi. Korkeuden ilmoittamiseen käytetään valtakunnallista N60-järjestelmää. Luku perustuu lähteisiin [Funet], [Geodeettinen laitos], [Ollikainen], [Maanmittauslaitos] ja [Raivio].

4.1 Kartastokoordinaattijärjestelmä

Kartastokoordinaattijärjestelmä perustuu Gauss-Krüger -projektioon. Projektio muodostetaan seuraavan menetelmän mukaan: maapallo asetetaan vaaka-asentoisen lieriön sisälle, ja sivuamisviivan (meridiaanin) molemmin puolin noin 3 asteen levyinen kaistale maapallon pintaa on oikaistu lieriön tasopinnalle. Kaistat ovat leveimmillään Etelä-Suomessa ja kapenevat pohjoiseen mentäessä.

Kartastokoordinaattijärjestelmässä Suomi esitetään yleensä neljässä kaistaleessa. Oikeastaan kaistaleita on yhteensä kuusi, mutta kaistalle 0 mahtuu vain Ahvenanmaan läntisimmät osat ja kaistalle numero 5 Itä-Suomen reuna. Tästä syystä näitä kaistaleita ei yleensä mainita. Kaistojen 1 - 4 keskimeridiaanit ovat 21, 24, 27 ja 30 astetta itäistä pituutta. Kuvassa 2 on esitetty projektiokaistojen sijainnit Suomen kartalla.

Kuva 2. Kartastokoordinaattijärjestelmä (KKJ) ja projektiokaistat.

Kunkin kaistan itäakseli on kaistan keskimeridiaanin kanssa samansuuntainen ja sijaitsee 500 000 m länteen projektiokaistan keskimeridiaanista. Tällä tavoin varmistetaan se, että kaikki saadut koordinaattilukemat ovat varmasti positiivisia. Pohjoisakseliksi on määritelty päiväntasaaja.

Koordinaatiston itäkoordinaatti (I) muodostuu siten, että otetaan etäisyys kaistan keskimeridiaanista ja lisätään siihen luku 1 500 000 m, 2 500 000 m, 3 500 000 m tai
4 500 000 m riippuen siitä, millä neljästä projektiokaistasta ollaan. Pohjoiskoordinaatti (P) ilmaisee etäisyyden päiväntasaajasta.

Koordinaatit ovat etäisyyksiä karttaprojektiolla ja projektiovirheen vuoksi ne ovat hieman todellisia maastoetäisyyksiä suurempia. Esimerkkinä karttakoordinaateista voidaan mainita Jyväskylän linja-autoaseman koordinaatit P=6905022m ja I=3434924m.

4.2 Yhtenäiskoordinaatisto

Yhtenäiskoordinaatisto (YKJ) on muuten täysin samanlainen kuin peruskoordinaatisto, mutta ykj:ssä käytetään vain yhtä leveää kaistaa. Tämän kaistan keskimeridiaani on 27 astetta, joka on sama kuin peruskoordinaatiston kolmas kaista. Tällä kohdalla itäkoordinaatin arvoksi tulee 3 500 000 m. Tällä kaistalla kummatkin koordinaatiston koordinaatit ovat samat. Yhtenäiskoordinaatiston koordinaatit muodostetaan samalla periaatteella kuin peruskoordinaatistonkin.

Käytettäessä yhtenäiskoordinaatistoa päästään eroon koordinaattien epäjatkuvuuskohdista kaistojen välissä. Toisaalta projektiovirheet ovat suuremmat yhtenäiskoordinaatistossa. Kun peruskoordinaatistossa (KKJ) virhe voi olla korkeintaan luokkaa 10 cm kilometrillä, on se yhtenäiskoordinaatistossa (YKJ) maksimissaan 2 m kilometrillä.

Uusissa peruskartoissa on merkitty kartan reunaan astekoordinaatit ja peruskoordinaatiston koordinaatit kilometreinä (mustalla) sekä yhtenäiskoordinaatiston punainen ruudukko ja sen asteikko. Yhtenäiskoordinaatiston kilometrimäärät ovat kartan reunalla nelinumeroisena lukuna, joista kaksi viimeistä numeroa (alle 100 km:n osa) ovat suuremmalla kirjasintyypillä. Samat kaksi viimeistä numeroa on merkitty myös karttaosalle punaisten viivojen kohdalle.

4.3 Muita koordinaatistoja

Näiden kahden edellä esitellyn koordinaatistojärjestelmän lisäksi Suomessa on vähäisessä määrin käytössä WGS84- ja EUREF98-järjestelmät. WGS84 (World Geodetic System) on Yhdysvalloissa kehitetty etenkin satelliitti- ja painovoimamittaukseen kehitetty kolmiulotteinen koordinaattijärjestelmä. Tätä järjestelmää käytetään GPS-järjestelmissä, jonka takia se on levinnyt ympäri maailman. EUREF98 (European Reference Frame) järjestelmä eroaa WGS-järjestelmästä siinä, että EUREF on sidottu Euraasian mannerlaatan liikkumiseen. Erot WGS- ja EUREF-koordinaatistojen välillä ovat noin metrin luokkaa. GPS-laitteiden alati kasvavan suosion vuoksi joihinkin Suomen tunturialuetta kuvaaviin karttoihin on alettu painaa myös WGS-koordinaatiston mukaisia ruudukkoa.

Suomessa on melkeimpä jokaisella suurella kaupungilla sisäisessä käytössään oma koordinaattijärjestelmä. Jyväskylässä käytössä olevan koordinaatiston kehitti kaupungin ensimmäinen geodeetti Veikko Tolamo vuonna 1937. Tolamo laski Laajavuoressa ja Kanavuoressa sijaitseviin kolmiopisteisiin koordinaatit ja totesi niiden olevan erilaiset kuin senaikaiset KKJ-koordinaatit. Hän otti nämä uudet koordinaatit käyttöön ja kehitti oman koordinaatiston käyttäen laskemiaan koordinaattiarvoja. Tämä koordinaatisto on edelleenkin käytössä, tosin Jyväskylän Säynätsalon kaupunginosassa on käytössä kkj-koordinaatisto.

4.4 Korkeuden ilmoittaminen

Korkeuksien esittämiseen käytetty N60-järjestelmän nollatasoksi on valittu Helsingin merenpinnan keskimääräinen arvo vuoden 1960 alussa. Tämä korkeuden määritysjärjestelmä on käytössä koko Suomen alueella. Maanpinta kuitenkin kohoaa Perämeren ja Merenkurkun seudulla selvästi nopeammin kuin Itä-Suomessa. Tästä syystä korkeuden määritykseen käytettyjen kiintopisteiden korkeudet kasvavat eri tahtiin.

Tämä on johtanut siihen, että N60-järjestelmä ei ole enää läheskään niin tarkka kuin alunperin. Tästä syystä maa- ja metsätalousministeriön alainen Geodeettinen laitos on valmistelemassa uutta korkeusjärjestelmää. Uusi järjestelmä otettaneen käyttöön 2000-luvun ensimmäisien vuosien aikana. Korkeudet tulevat olemaan vanhaan järjestelmään verrattuna läntisessä Suomessa 40 senttimetriä ja itäisessä osassa maata noin 10 senttimetriä suuremmat

5. Geometriatieto vektori- ja rasterigeometrisen mallin mukaan

Geometrisessa mielessä paikkatietoaineistot ovat yleensä pisteitä, viivoja, alueita, aluejakoja tai ruudustoja. Kuva 3 havainnollistaa näiden välisiä eroja, esitettynä viiden pinnan (engl. layer) avulla. Geometriatieto voidaan kuvata joko vektorigeometrisen tai rasterigeometrisen mallin mukaan. Luku perustuu lähteisiin [Aronoff] ja [Maanmittauslaitos].

5.1 Vektorigeometrinen malli

Vektorigeometrisen mallin mukaan kohteet kuvataan joko pisteinä, viivoina tai alueina. Pistemäisinä kohteina kuvataan yleensä erilaiset rakennukset, lentokentät ja kaupungit isolla kartalla. Viivamaisina kohteina kuvataan yleensä sellaiset kohteet, joiden leveys on liian pieni alueena kuvattavaksi. Viivamainen kohde koostuu alku- ja päätepisteistä sekä (mahdollisista) järjestetyistä välipisteistä. Viivamaiset kohteet voivat muodostaa verkoston (tiet), ne voivat rajata alueita (vesistöjen rantaviivat), tai esittää tasa-arvokäyriä (korkeuskäyrät). Alueet muodostuvat yhteenliitettyjen viivojen rajaamasta tilasta. Alueet voivat olla joko täysin erillään toisistaan (kuten suojelualueet) tai ne voivat muodostaa aluejakoja (kiinteistöjen rajat).

Kuva 3. Erilaiset geometriset yksilötyypit ylhäältä alas
piste, viiva, alue, aluejako ja ruudusto.

Kuvassa 4 on esitelty pisteen, viivan ja alueen koodaus xy-koordinaatistossa. Piste ilmoitetaan yhdellä koordinaattiparilla ( 2,3) ja viiva järjestetyllä listalla koordinaateista ( 1,6; 2,6; 3,5; 5,4). Alueen koordinaatit ilmaistaan samoin kuin viivankin. Ainoa ero on siinä, että ensimmäinen ja viimeinen koordinaattipari on sama (7,2; 7,5; 8,7; 9,2; 7,2). Kuvan 4 esimerkin koordinaatit ovat mielivaltaisia xy-koordinaatteja, kun oikeassa paikkatietojärjestelmässä koordinaatit ilmoitetaan aina jossain valitussa koordinaattijärjestelmässä.

Kuva 4. Vektorimuotoisen tiedon eri muodot.

5.2 Rasterigeometrinen malli

Rasterigeometrisen mallin mukaan alue kuvataan ruudustolla. Alue voi olla joko pikseleistä koostuva rasteri tai hila-alkioiden muodostama hila. Lähtökohtana ovat yleensä samankokoiset ruudut. Yksittäinen ruutu pystytään yksilöimään sen sarake- ja rivinumeron perusteella.

Jokaiseen ruutuun liittyy yleensä yksi reaalinen lukuarvo, joka kuvaa haluttua ominaisuutta. Vaihtoehtoisesti lukuarvo voi olla tunnus, joka toimii linkkinä erillisiin ominaisuustietoihin. Koska jokaiseen ruutuun voidaan liittää vain yksi luku, voidaan samaan ruudukkoon sijoittaa vain samankaltaista tietoa ja täten jokaista ominaisuutta varten on luotava oma rasteri.

Rasterimallia käytetään usein erilaisten jatkuvatyyppisten pintojen esittämiseen. Esimerkkeinä tälläisistä voidaan mainita kasvillisuuspeite, asukastiheys ja maanpinnan korkeus. Rastereiden ongelmana on niiden tallentamisen vaatima tila. Kymmeniä miljoonia soluja sisältävän rasteritiedoston tallentaminen vie tallennuskapasiteettia niin paljon, että on ollut pakko kehittää menetelmiä tiedon tiivistämiseen. Kahta tälläistä tiivistysmenetelmää tarkastellaan lähemmin luvussa 6.

6. Rasterimuotoisen tiedon tiivistysmenetelmiä

Eräs ongelma käytettäessä rasterimuotoista tietoa, on tiedostojen vaatima suuri tila. Jos esimerkiksi 1 neliökilometrin alue jaetaan 250 * 250 metrin kokoisiin paloihin, tarvitaan vain 16 ruutua. Jos palan kokoa pienennetään 100 * 100 metriin, tarvitaan jo peräti 100 ruutua peittämään sama alue.

Yleensä ruudustoissa on useita miljoonia soluja, joten tiedostojen suuri koko aiheuttaa ongelmia. Ratkaisuna tähän on tiedon pakkaaminen tiiviimpään muotoon. Kaksi eniten käytettyä tiedon tiivistysalgoritmiä ovat nimeltään run-lenght- ja nelipuukoodaus (engl. quadtree). Luku perustuu lähteisiin [Aronoff] ja [Ojala].

6.1 Run-lenght -koodaus

Run-Lenght -koodaus (lyh. RLE) perustuu samalla rivillä olevien peräkkäisten samanarvoisten rasterisolujen keräämiseen omaksi ryhmäksi (engl. run). Sen sijaan, että jokaisen solun arvo tallennettaisiin erikseen, tallennetaan koko ryhmän arvo vain kerran. Tämän lisäksi tallennetaan tieto siitä, missä kohdassa ruudukkoa ryhmä sijaitsee ja kuinka iso ryhmä on.

Tästä koodausalgoritmistä on kehitetty useita, hieman toisistaan poikkeavia muunnelmia. Kaksi suosituinta muunnelmaa ovat Standard Run-Lenght -koodaus ja Value Point -koodaus. Kuva 5 havainnollistaa näitä kahta muunnelmaa.

Kuva 5. Rasteridatan tiivistysmenetelmien vertailua.

Run-Lenght -koodauksessa ryhmän solujen arvo, lukumäärä ja sijainti tallennetaan. Esimerkkitapauksessa ilman pakkaamista tiedon tallentamiseen käytettiin 100 arvoa, kun Run-Lenght -koodauksella tieto saatiin puristettua 51 arvoon.

Vielä tehokkaampaan tiivistyssuhteeseen päästään, jos käytetään Value Point -koodausta. Tässä koodaustatavassa soluihin liitetään sen sijainnin kertova järjestysluku ja tallennetaan jokaisen ryhmän viimeisen solun sijainti ja ryhmän solujen yhteinen arvo. Järjestysluvun lasku aloitetaan vasemmasta ylänurkasta, loppuen oikeaan alanurkkaan.

RLE-pakkauksella rasterin tallentamiseen vaadittavaa tilaa voidaan pienentää ratkaisevasti. Jos rasterin solujen arvot vaihtelevat suuresti, pakkauksella ei saavuteta sanottavaa hyötyä. Itseasiassa voi käydä aivan päinvastoin kuin alunperin haluttiin, eli tiedoston koko kasvaakin. Value Point -koodauksen haittana suurissa rastereissa on sijainnin kertovan järjestysluvun tallentamiseen menevä tila. Parhaiten tämä pakkausmenetelmä toimii rastereissa, joissa on vähän erisuuruisia arvoja ja ne esiintyvät suurina alueina

Vaikka RLE-koodaus pienentääkin yleensä tiedoston kokoa, säilyy pienen solukoon ja tiedoston koon välinen yhteys. Valitsemalla suuri rasterisolmun koko, pienenee käytetyn tallennustilan tarve ja tiedoston käsittelyynkin kuluva aika pienenee. Negatiivisena puolena on menetetty tarkkuus. Jos taas valitaan pieni rasterisolukoko, kasvaa tiedoston koko pakkauksesta huolimatta ja samalla käsittelyajat kasvavat. Ratkaisuna tähän ongelmaan on kehitetty niin sanottu nelipuukoodaus. Se perustuu vaihtuvankokoisten solujen hyväksikäyttöön. Tällöin siis käytetään pientä solukokoa tarkkuutta vaativissa paikoissa ja suurta siellä, missä tarkkuutta ei vaadita.

6.2 Nelipuukoodaus

Nelipuukoodausta (engl. quadtree encoding) suoritettaessa, jaetaan alue ensin neljään yhtä suureen osaan ja jokainen näin saatu osa jaetaan samoin neljään yhtä suureen osaan. Tällä tavoin jatketaan, kunnes jaon seurauksena alueeseen jää vain saman luokan (saman arvon sisältäviä) edustajia. Kuva 6 havainnollistaa nelipuukoodausta

Kuvan 6 A-kohdassa on kartta kaupunkialueen maankäytöstä. B-kohdassa on sama alue nelipuukoodattuna. C-kohdassa on esitetty sama alue hierarkisena puurakenteena. Puun juuri (engl. root) on se piste, josta puun muut haarat saavat alkunsa. Lehti (engl. leaf ) on sellainen puun piste, jolla ei ole enää omia haaroja.

Kuva 6. Nelipuukoodaus.

Muita puun pisteitä sanotaan solmuiksi (engl. node). Isäsolmuksi nimitetään sellaista solmua, josta lähtee haaroja alaspäin. Lapsisolmuksi vastaavasti nimitetään sellaista solmua, johon tulee haaroja ylhäältä ja siitä mahdollisesti lähtee uusia haaroja alaspäin. Juuri on isäsolmun erikoistapaus, kuten lehti on erikoistapaus lapsisolmusta.

D-kohdassa on esitelty, kuinka aineisto voidaan jakaa eri tasoihin. Käyttämällä tasoja, käyttäjä voi valita, kuinka tarkan kartan hän haluaa käyttöönsä. Huonoimmalla tarkkuudella (taso 1) kartassa näkyy vain 4 eri kohdetta ja tason 3 mukaiselle kartalle piirretään kaikki mahdolliset kohteet.

Nelipuukoodauksen etuna on se, että jokaisen pisteen naapureiden etsimiseen kuluu hyvin vähän aikaa. Esimerkiksi tunnusnumeron 212 omaavan solun naapureita ovat kaikki 21x-solut ( 210, 211 ja 213) sekä 2x-solut ( 20, 21, 22 ja 23). Lisäksi nelipuut mahdollistavat sen, että käyttäjä voi valita, kuinka tarkan kartan hän haluaa käyttöönsä. Negatiivisena puolena nelipuissa on niiden luomiseen ja muuttamiseen kuluva aika. Etenkin monimutkaisen useita luokkia sisältävän nelipuukoodauksella tiivistetyn rasterin käsittely vie selvästi enemmän aikaa kuin tiivistämättömän rasterin käsittely. Suurin hyöty nelipuista saadaan rasterissa, joka sisältää vähän luokkia, luokat esiintyvät kohtalaisen suurina joukkoina ja rasteria ei tarvitse päivittää usein.

7. Topologiatiedon lisääminen paikkatietoon

Vektorigeometrisessa mallissa tieto kuvataan erilaisina pisteinä, viivoina tai alueina riippuen kohteen luonteesta. Kohteen sijainti ilmoitetaan jossain tunnetussa koordinaattijärjestelmässä ja sijainti voidaan ilmoittaa niin tarkasti kuin koordinaatit on mitattu. Tasolla kahden koordinaatin käyttäminen riittää. Jos taas halutaan tuottaa kolmiulotteista aineistoa, tulee sijainnin ilmoittavan koordinaattiparin lisäksi ilmoittaa myös korkeus. Korkeuden ilmoittamiseen käytetään Suomessa korkeusjärjestelmää N60.

Tieto tallennetaan vektoritietokantoihin yleensä hieman sattumanvaraisessa järjestyksessä ja kohteiden keskinäisiä suhteita ei oteta mitenkään huomioon. Yksi tälläinen tapa vektoritiedon tallentamiseen on ns. spagettimalli. Jos sen sijaan tiedon tallentamisessa otetaan huomioon erilaiset sijaintiin liittyvät asiat, puhutaan ns. topologisesta mallista. Erikoistapauksena topologisesta mallista käsitellään tässä luvussa epäsäännöllinen kolmiomalli. Luku perustuu lähteeseen [Aronoff].

7.1 Spagettimalli

Spagettimallissa ei siis kohteiden keskinäisiä sijaintisuhteita mallinneta mitenkään. Tallennettu tieto on vain joukko koordinaatteja vailla minkäänlaista sisäistä rakennetta. Tästä syystä mallia kutsutaan nimellä spagettimalli. Kuvan 7 kohdassa A on normaali karttakuva jostain alueesta. B-kohdassa se on muutettu vektorimuotoon ja C-kohdassa esitetään saman kuvan spagettimallin mukainen tallennusmuoto

Piste ilmoitetaan yhdellä koordinaattiparilla ja viiva on järjestetty lista koordinaattipisteistä. Alue muodostetaan samalla tavalla kuin viivakin. Ainoa ero on siinä, että ensimmäinen ja viimeinen koordinaatti ovat samoja. Kaikki alueeseen liittyvät koordinaatit tallennetaan välittämättä siitä, onko alueella mahdollisesti yhteisiä pisteitä muiden alueiden kanssa. Tämä malli on hyvin yksinkertainen ja helppo ymmärtää.

Kuva 7. Spagettimalli topologisten suhteiden tallennukselle.

Haittapuolena tässä mallissa on juuri sen yksinkertaisuus, sillä naapurisuhteita etsittäessä on käytävä koko tiedosto aina läpi ja laskettava koordinaateista naapurisuhteet erikseen. Sanomattakin on selvää, että tämä hidastaa paikkatietoanalyysien suorittamista. Toisaalta spagettimallilla koodattu vektoridata voidaan nopeasti muuttaa kartaksi, sillä, jokainen kohde on esitett y selvänä koordinaattilistana.

7.2 Topologinen malli

Topologisessa mallissa kohteet ja niiden väliset suhteet esitetään taulukoiden avulla. Kuvassa 8 on esitelty vektorimuotoinen kartta, joka on siirretty tietokantaan topologisen mallin mukaan. Taulukoihin tallennetaan viivojen alku- ja loppupisteet sekä mahdolliset välipisteet ja niiden koordinaatit. Lisäksi tallennetaan kuvattavan alueen monikulmiot ja niiden rajaviivat, solmupisteet ja niistä alkavat tai päättyvät viivat sekä viivojen suhteet solmuihin ja monikulmioihin. Näiden lisäksi tallennusrakenteeseen tulee tieto siitä, mikä on kunkin viivan alku- ja loppusolmu sekä vasemman ja oikeanpuoleinen alue.

Viiva (kuvassa 8 a1,...,a7) muodostuu siis alku- ja loppupisteistä sekä yhdestä tai useammasta välipisteestä. Solmupisteiksi ( N1,…,N6) sanotaan pisteitä, joissa kaksi tai useampi viiva kohtaa toisensa. Tämän lisäksi solmupiste voi olla yksittäisen viivan viimeinen piste (kuvassa solmu N4) tai se voi olla yksi erillinen piste ( N5 kuvassa). Monikulmio muodostuu toisiinsa liittyneistä viivoista, jotka muodostavat kartalla alueiden rajat.

Taulussa Monikulmioiden topologia määritellään monikulmiot ja niiden rajoina olevat viivat. Esimerkiksi monikulmio A muodostuu viivoista a4, a2, a3 ja a6. Alue A sisältää myös saarekemaisen C-alueen. Se ilmoitetaan listassa käyttämällä numeroa 0 ennen viivaa a6. Pistemäinen kohde ( D) käsitellään samalla tavoin. Kartan ulkopuolinen alue merkitään omaksi kohteekseen ( E). Taulussa Solmupisteiden topologia määritellään solmupisteiden ja viivojen väliset yhteydet. Viivojen ja solmupisteiden suhteita käsittelevässä taulussa määritellään, kuinka viivat ja solmupisteet liittyvät toisiinsa. Neljännessä taulussa säilytetään viivojen koordinaatteja. Alku- ja loppupisteiden lisäksi tauluun tulee tallentaa välipisteiden koordinaatit.

Kuva 8. Topologinen malli.

Tiedot tallennetaan yleensä relaatiotauluina ja yhtenä kenttänä käytetään paikkatiedon tunnistuskoodia. Tällä tavoin tiedon käsittely on joustavaa ja suurtenkin tietomäärien hallinta ei tuota vaikeuksia. Negatiivisena puolena topologisessa mallissa on sen luomiseen ja päivittämiseen kuluva aika.

Käyttämällä topologista mallia pystytään osa paikkatietoanalyyseistä suorittamaan ilman koordinaattitietoa. Esimerkiksi vierekkyys- (engl. contiguity) ja yhdistävyysanalyysejä (engl. connectivity) voidaan suorittaa melko pitkälle ilman, että on tarvetta käyttää koordinaatteja.

7.3 Epäsäännöllinen kolmioverkko

Epäsäännöllinen kolmioverkko (engl. triangulated irregular netvork, tin) on eräs topologisen mallin erikoistapaus, jota käytetään maaston korkeustiedon tallentamiseen. TIN-verkko kuvaa maanpintaa joukkona toisiinsa liitettyjä kolmiopintoja. Jokaisesta kolmion kärkipisteestä tunnetaan x- ja y-koordinaatin lisäksi myös z-koordinaatti eli korkeus merenpinnasta. Kuvassa 9 on kuvattu TIN-verkon periaatteellinen rakenne.

TIN-verkon tiedot tallennetaan neljään eri tauluun. Solmupistetaulussa on tallennettu jokainen kolmio ja siihen kuuluvat kulmapisteet. Reunataulussa on tallennettuna kolmiot ja näiden vieressä sijaitsevat kolmiot. Paikan (x, y) ja korkeuden (z) ilmoittavat koordinaatit tallennetaan myös omiin tauluihinsa. Näiden tietojen lisäksi jokaiselle kolmiolle voidaan laskea jyrkkyys ja viettosuunta. Nämä voidaan tämän jälkeen tallentaa kolmion ominaisuustiedoiksi ja käyttää myöhemmin analyyseissä apuna.

Kuva 9. TIN-verkko.

TIN-mallin etuna verrattuna rasterimalliseen kuvaukseen on mahdollisuus käyttää pienempää kolmiota tarkkuutta vaativissa paikoissa ja isompaa sellaisissa paikoissa, jossa maastossa ei ole suuria vaihteluita. Rasterimallissa solun koko on ennalta määrätty ja tämä aiheuttaa joskus turhaa tallennustilan käyttöä. Haittapuolena TIN-mallissa on tietorakenteen luomiseen kuluva aika. Toisaalta, kun malli on kerran luotu, on siitä huomattavasti helpompi luoda eri tarkkuudella olevia verkkoja.

8. Paikkatiedon laatu

Yleisesti laatu määritellään tuotteen kykynä täyttää ennalta määritellyt laatuvaatimukset ja/tai käyttäjän tuotteeseen kohdistamat odotukset. Paikkatiedon laatu voidaan siis määritellä tiedon soveltuvuutena siihen käyttötarkoitukseen, johon käyttäjä sitä aikoo käyttää ja tiedon tarjoaja sitä tarjoaa.

Tiedon digitalisoinnin johdosta laadun tarkkaileminen on vaikeutunut. Digitaalisten kartta-aineistojen laatua voidaan jotenkin arvioida yleisen tietämyksen pohjalta ja visuaalisen tutkimuksen perusteella. Numeerisen ominaisuustiedon laadun arviointiin tarvitaan erillistä tietoa siitä, kuinka saatu aineisto täyttää laatukriteerit. Stan Aronof on kirjassaan [Aronoff] esitellyt peräti yhdeksän erilaista laadun osatekijää, jotka on jaettu kolmeen pääluokkaan: mikro- ja makrotason sekä käyttäjäkohtaiset tekijät.

8.1 Mikrotason tekijät

Mikrotason tekijät vaikuttavat yksittäisen kohteen laatuun. Sijainnin tarkkuutta pystytään määrittelemään vertaamalla paikkatietojärjestelmässä olevaa sijaintitietoa johonkin ulkopuolisen toimittamaan aineistoon ja laskemalla näiden ero.

Ominaisuustiedon tarkkuutta voidaan arvioida samaan tapaan kuin sijaintitiedon. Tällöin siis valitaan joukko sijaintipisteitä ja verrataan paikkatietojärjestelmässä olevaa tietoa ulkopuoliseen tietoon. Looginen yhteensopivuus kertoo sen, kuinka hyvin tietojen keskinäiset suhteet vastaavat todellisuutta. Esimerkkinä tästä voidaan mainita se, että veteen rajoittuvan tontin tulee myös paikkatietojärjestelmässä rajoittua veteen.

Loogista yhteensopivuutta ei voi arvioida kovinkaan helposti. Avainasemassa on kartan huolellinen digitointi, jonka huolellinen suorittaminen vähentää selvästi eri pintojen yhteensopimattomuudesta johtuvia virheitä. Tosin jotkut paikkatieto-ohjelmistot osaavat automaattisesti korjata pieniä virheitä.

Resoluutio kertoo pienimmän mahdollisen kohteen koon, joka pystytään kuvaamaan erillisenä. Yleensä tämä luku on ilmavalokuvia käytettäessä noin 80 viivaa/mm. Satelliittikuvia tai muita digitaalisia kuvausvälineitä käytettäessä resoluutio tarkoittaa yksittäisen erillisen kuvapisteen kokoa. Rasterimuotoisissa teemakartoissa resoluutiolla tarkoitetaan solukokoa. Tämä solukoko valitaan rasteria laadittaessa ja se on yleensä kompromissi tarkkuuden ja tiedoston koon välillä.

8.2 Makrotason tekijät

Makrotason laatutekijät ovat koko tietojoukon yhteisiä ominaisuuksia. Tiedon kattavuus on eräs tärkeimmistä laadun osatekijöistä. Alueellisen kattavuuden lisäksi tarkastellaan myös luokittelun ja tiedonkeräyksen kattavuutta. Joskus voi olla järkevämpää käyttää hieman vanhempaa koko alueen kattavaa aineistoa kuin aineistoa, joka on yhdistelmä uutta ja vanhaa tietoa.

Luokittelun kattavuudella tarkoitetaan sitä, kuinka tarkasti joltain alueelta kerätty tieto pystyy kuvaamaan todellisuutta. Koko luokiteltavaksi otettu alue on luokiteltava kokonaan samalla tarkkuudella. Jos esimerkiksi kaikki metsät lajitellaan tietyn puulajin mukaisiin ryhmiin, ei luokittelun kannalta yhtään metsäpalaa saa nimetä pelkäksi metsäksi, vaan on käytettävä tarkempaa luokittelua (kuten havupuumetsä ja lehtipuumetsä).

Kattavuuden ohella aika on toinen avainasemassa oleva tekijä. Alueen käyttötarkoitus saattaa muuttua hyvinkin nopeasti. Yleensä aika-aspekti ilmoitetaan lähdemateriaalin luomispäivämääränä, kuten ilmavalokuvan ottopäivänä. Yleensä ominaisuustiedon mukana on myös tieto siitä, koska tieto on tallennettu. Jotkut tiedot, kuten tieto rakennusten omistajasta, vaativat jatkuvaa päivitystä. Toiset, kuten metsätietoa käsittelevät paikkatietojärjestelmät, vaativat päivitystä vain tietyn väliajoin.

Tiedon historia sisältää tietoa lähtötiedoista ja niistä käsittelyvaiheista, joita sen tuottamiseksi on tarvittu. Tällä tavoin voidaan arvioida tiedon laatua tiedettäessä käsittelyvaiheet, jotka se on läpikäynyt. Näin virhemahdollisuudet voidaan ottaa huomioon jo suunnitteluvaiheessa. Yleensä tämä historiatieto toimitetaan erillisen manuaalin tai ohjekirjasen muodossa. Valitettavan harvoin tämänkaltaista tietoa toimitetaan ja mikä pahinta kyseisen tiedon hyväksikäyttö vaatii erikoisosaamista.

8.3 Käyttäjäkohtaiset tekijät

Käyttäjäkohtaiset tekijät, kuten tiedon saatavuus ja kustannukset, eivät vaikuta itse tietoon, vaan sen käytettävyyteen. Saatavuutta rajoittavat tiedon salaaminen ja sen hankkimiseen kuluva kohtuuttoman suuri aika.

Kustannukset voidaan jakaa kahteen eri luokkaan. Suoria kustannuksia tulee tiedon ostamisesta toiselta organisaatiolta. Epäsuoria kustannuksia on vaikea arvioida. Esimerkiksi olemassaolevan tiedon liittäminen jo olemassaolevaan paikkatietojärjestelmään voi vaatia suuria työpanoksia.

8.4 Virhemahdollisuudet

Virheitä paikkatietoon voi ilmaantua sen elinkaaren jokaisessa vaiheessa. Alkuperäisen pohjatiedon puutteellisuus aiheuttaa virheitä tiedon keräysvaiheessa. Usein kartta-aineistojen pohjana käytetään satelliittivalokuvia, jotka saattavat sisältää epäselvyyksiä ja epätarkkuuksia.

Suurin osa paikkatietoon tulevista epätarkkuuksista tulee tiedon syöttämisessä paikkatietojärjestelmään. Karttojen digitointi on suurimmaksi osaksi ihmisen tekemää käsityötä, joten hyvin helposti syntyy pientä epätarkkuutta. Toisaalta ihmisen korvaaminen tietokoneella ei poistaisi epätarkkuuksia, vaan melkoisella todennäköisyydellä lisäisi niitä. Ominaisuustietoa käsiteltäessä tulee olla erityisen huolellinen, että esimerkiksi korkeutta kuvaavissa tiedoissa käytetään aina samaa ennalta valittua yksikköä.

Tietojen säilyttäminen paikkatietojärjestelmässä vaatii suurta tallennuskapasiteettia. Tästä johtuen tietojen tallennustarkkuudessa joudutaan tekemään kompromissejä. Periaatteessa tiedot pitäisi tallentaa parhaalla mahdollisella tarkkuudella, mutta 64-bittisten reaalilukujen käyttäminen vaatii paljon tallennustilaa. Rasterimuotoisen tiedon ollessa kyseessä, solukoon valitseminen on eräs keino vaikuttaa tarkkuuteen ja tallennustilan tarpeeseen. Solukoon pienentäminen 10 metristä 1 metriin kasvattaa tallennustilan tarpeen satakertaiseksi.

Käytettäessä useista tietolähteistä saatuja kartta-aineistoja samassa sovelluksessa alueiden rajojen yhteensopivuudessa voi esiintyä ongelmia. Tuloksen tarkkuuden määrää huonoimmalla tarkkuudella tehty kartta. Tulostettaessa karttaa voivat kartan mittasuhteet muuttua musteen kuivuessa. Tämä voi äkkiseltään tuntua mitättömältä asialta, mutta millimetrin heitto kartalla voi tarkoittaa useamman metrin vääristymää oikeassa maastossa.

9. Paikkatie don hallinta

Paikkatieto koostuu sijaintiedosta, joka määritellään geometria-, koordinaatti- ja topologiatiedolla, sekä ominaisuustiedosta, joka ilmoitetaan numeroina tai tekstinä. Paikkatiedon hallinta on järjestettävä niin, että käyttäjän on mahdollista tehdä hakuja sekä ominaisuustiedosta että sijaintitiedosta. Järjestelmän on myös kyettävä laajentumaan kasvavan tietomäärän mukaan. Järjestelmän suunnitteluvaiheessa on päätettävä tavat, joilla sijaintitiedot mallinnetaan ja kuinka tietoa hallitaan. Suunnitteluvaihe on erityisen tärkeä siitä syystä, että myöhemmin järjestelmän rakennetta on hyvin vaikea, ellei jopa mahdotonta muuttaa. Luku perustuu seuraaviin lähteisiin [Aronoff] ja [Maanmittauslaitos].

Tiedonhallinta voidaan toteuttaa joko sijoittamalla sijainti- ja ominaisuustiedot erillisiin tietokantoihin tai sijoittamalla kaikki paikkatieto samaan tietokantarakenteeseen. Valinta eri tiedon tallennustapojen välillä riippuu täysin järjestelmän käyttötarkoituksesta. Kevyeen karttojen käsittelyyn tarkoitettuun sovellukseen ei ole järkevää rakentaa raskasta tietokantajärjestelmää, joten kaikki tieto voidaan sijoittaa samaan tietokantarakenteeseen. Tutkimuksen ja suunnitteluun tarkoitetuissa ammattilaissovelluksissa tarvitaan usein geometrisiä ja topologisia kyselyjä ja valitun tietokantamallin tulee tukea niitä. Tällöin tiedon tallentaminen erillisiin tietokantarakenteisiin on yleinen ratkaisu.

Tiedonhallintaan vaikuttaa myös sijaintitiedon mallintamiseen käytetty tietomalli. Vektorimuotoista tietoa voidaan tallentaa yhtä hyvin tiedostoihin kuin tietokantoihinkin. Rasterimuotoisen tiedon hallinta yhdistää eräässä mielessä sijainti- ja ominaisuustiedot. Yksi rasteri sisältää tiedon omasta sijainnistaan sekä jotain ominaisuutta kuvaavan reaalisen lukuarvon.

9.1 Tiedostopohjainen tiedonhallinta

Tiedostoihin perustuvassa tietojenhallinnassa sijainti- ja ominaisuustietoja ylläpidetään erillisissä tietokannoissa. Se perustuu yleensä johonkin CAD-ohjelman tiedonhallintaan, jolloin käytetään niin sanottuja kuvatiedostoja (engl. design file). Tästä myös juontaa nimitys "tiedostopohjainen".

Kuvatiedostoissa eri teemat organisoidaan eri pinnoille (engl. layer) ja tiedot saadaan käyttöön taso kerrallaan. Tiedosto on vaihtuvanmittainen peräkkäistiedosto, jossa viivat, pisteet ja alueet on tallennettu vaihtuvanmittaisiin tietueisiin. Tietorakenteena käytetään linkitettyä listaa.

Pisteiden, viivojen ja alueiden tunnistaminen perustuu tunnistenumeron käyttämiseen. Tämän yksilöllisen tunnisteen avulla pystytään tunnistamaan erilaiset kohteet ja saman tunnisteen avulla pystytään hakemaan kohteeseen liittyvää ominaisuustietoa. Alueen tunnistus tapahtuu sitä rajaavan viivan tunnistenumeron perusteella, eikä itse alueen sisäosalla ole omaa tunnistetta. Tunnistenumeron lisäksi kuvatiedostoon tallennetaan koordinaatit, piirtotapa ja mahdollisesti jonkin verran kohteeseen liittyvää ominaisuustietoa. Varsinaisesti ominaisuustietoa hallitaan tavallisessa tietokannassa.

Tiedostopohjaisen lähtestymistavan suurin ongelma on versionhallinta ja sen ongelmat etenkin, jos tietoa päivittää useampi henkilö samanaikaisesti. Tällöin eri käyttäjillä voi olla useita erilaisia versioita paikkatiedoista.

9.2 Tietokantapohjainen tiedonhallinta

Tietokantapohjaisesta tiedonhallinnasta puhutaan silloin, kun ominaisuus- ja sijaintitieto tallennetaan samaan tietokantaa. Paikkatieto voidaan tallentaa erikseen relaatiotietokannan tauluina tai kaikki mahdollinen tieto voidaan tallentaa samaan paikkaan käyttäen erityisiä paikkatieto-olioita (engl. spatial objects).

Kun sijainti- ja ominaisuustiedot kootaan saman relaatiotietokannan eri tauluihin, helpottuu tiedon päivitys suuresti. Päivitystä ei nimittäin tarvitse suorittaa kuin yhteen tietokantaan. Lisäksi pystytään suorittamaan monimutkaisempia paikkatietokantakyselyjä. Tämän relaatiotietokantaan perustuvan mallin negatiivisena puolena on sen tehottomuus. Erilaisten geometristen kyselyiden suorittaminen vie paljon aikaa. Ratkaisuna tähän teho-ongelmaan on työtietokantojen käyttäminen. Siinä käsiteltävä tietokannan osa ladataan omaan selvästi pienempään tietokantaan, jolloin tietojen käsittely nopeutuu. Toinen ratkaisu teho-ongelmaan on työtietokannan lataaminen suoraan tietokoneen keskusmuistiin. Tämän ratkaisun ongelmana on tarvittavan muistin suuri määrä.

Suunniteltaessa sijaintitietokantaa ongelmaksi muodostuvat topologisten relaatioiden muodostaminen ja tallentaminen. Samalla tavoin kuin muidenkin relaatiotietokantojen suunnittelussa, tulisi usein tarvittavat ja vaikeasti laskettavat relaatiot tallentaa vain yhteen paikkaan ja muut helpommin laskettavat relaatiot jätetään laskettavaksi tarvittaessa.

Erilaiset oliopohjaiset tietokantaratkaisut ovat uusin suuntaus paikkatiedon hallinnassa. Näihin ns. spatialware-tietokantoihin pystyy tallentamaan kuvia, ääntä ja videokuvaa samalla tavalla kuin normaalia ominaisuustietoakin. Näin voidaan kaikki paikkatieto tallentaa yhteen paikkaan, josta seuraa selviä etuja tavalliseen relaatiomalliin verrattuna. Etenkin Internetin käytön lisääntyessä spatialware-ratkaisut ovat nousseet suureen suosioon.

10. Yhteenveto

Paikkatieto on kulkenut pitkän tie muinaisista kalliomaalauksista nykypäivän tietokoneiden näyttöruutuihin ja mobiileihin laitteisiin. Sen kehitykselle ja käytölle ei näy loppua. Paikkatiedon ja paikkatietojärjestelmien käyttö on kymmenkertaistunut viime vuosikymmenen aikana. Tietoverkkojen ja erilaisten mobiililaitteiden avulla paikkatietosovellukset saadaan tavallisten kansalaisten ulottuville.

Itse paikkatieto koostuu kahdesta erillisestä osasesta. Koordinaatit määrittelevät paikan sijainnin ja ominaisuustieto kertoo, minkälainen paikka todellisuudessa on. Koordinaattieto voidaan ilmoittaa vektorigeometrisen mallin mukaan koordinaattipareina. Rasterigeometrisessä mallissa alue jaetaan ruutuihin ja jokainen ruutu saa tietyn arvon. Kohteesta kerättävää ominaisuustietoa tallennetaan yleensä tietokantoihin, joista se voidaan yhdistää koordinaatteihin tunnistenumeroiden avulla.

Laatu on eräs tärkeä tekijä puhuttaessa paikkatiedosta. Alueiden käyttötarkoitukset voivat muuttua hyvinkin nopeasti ja tällöin materiaalista voi tulla osaksi käyttökelvotonta. Koordinaattien tarkkuus tulee tärkeäksi tekijäksi etenkin käsiteltäessä vektorigeometrista tietoa. Rakennusten ja tonttien rajat tulee tallentaa mahdollisimman suurella tarkkuudella.

Paikkatietojärjestelmien vaatima tallennustila voi kasvaa aikaa myöten varsin suureksi, joten järjestelmää suunniteltaessa tulisi ottaa huomioon mahdollinen tietomäärän räjähdysmäinen kasvu. Samalla tulee ottaa huomioon se tosiasia, että massiivinen järjestelmä vie koneresursseja huomattavasti enemmän kuin pieni yhden käyttäjän sovellus. Tarvittavan asiantuntemuksen määrä kasvaa myös järjestelmän koon kasvaessa.

Paikkatietojärjestelmät tuovat selviä kustannussäästöjä verrattuna perinteiseen tapaan toimia. Esimerkiksi kuljetusliikkeiden ajoreittejä voidaan helposti optimoida ja näin laskea suuria polttoainekustannuksia. Toinen hyvä esimerkki paikkatiedon hyväksikäytöstä on Suomalaisen liikunnan tietopankin tarjoama palvelu, jossa tavallinen Tietoverkon käyttäjä voi hakea tietoa suomalaisista liikuntapaikoista ja urheiluseuroista. Käyttäjä saa kartalle näkyviin liikuntapaikan sijainnin ja tietoa paikan ominaisuuksista.

Lähdeluettelo

Aronoff Stan "Geographic Information Systems - a Management Perspective", WDL Publications, Ottawa, Kanada, 1991.

Geodeettinen laitos, "Suomen Kolmas tarkkavaaitus ja maannousu", saatavilla WWW-muodossa <URL: http://www.fgi.fi/osastot/paino/projektit/>, Suomen geodeettinen laitos, viitattu 25.11.2000.

Funet-verkkopalvelut, "Koordinaattijärjestelmät", saatavilla WWW-muodossa <URL: http://www.funet.fi/resources/maps/koordinaatit/koordinaatit.html>, viitattu 25.11.2000.

Maanmittauslaitos, "Paikkatietojen yhteiskäyttö", saatavilla WWW-muodossa <URL: http://www.nls.fi/ptk/>,Maanmittauslaitos, viitattu 22.11.2000.

MapInfo Corporationin kotisivut, saatavilla WWW-muodossa <URL: http://www.mapinfo.com/>, viitattu 25.11.2000.

Ojala Pasi, "Compression Basics", saatavilla WWW-muodossa <URL: http://www.cs.tut.fi/~albert/Dev/pucrunch/packing.html>, viitattu 25.11.2000.

Ollikainen Marko, "The Finnish National Grid Coordinate System", saatavilla WWW-muodossa <URL: http://www.nls.fi/kartta/julkaisu/kkj.html> , viitattu 25.11.2000.

Raivio Tuomas, "Latitudi-longitudi", saatavilla WWW-muodossa <URL:http://www.hut.fi/~traivio/latlong.html>, viitattu 25.11.2000.

Wisconsin State Cartographer’s Officen kotisivut, saatavilla WWW-muodossa <URL: http://feature.geography.wisc.edu/sco/> , viitattu 25.11.2000.