Jyväskylän yliopisto         AgoraCenter         Data mining -projekti
Pääsivu                                        
Lähtökohdat
Tapahtumakalenteri                    
Uutiset                                         
Yhteystiedot                                
   Lähtökohdat-sivulla kerrotaan projektin sidosryhmistä, rahoittajista ja keskeisimmistä tutkimusongelmista, joihin projekti hakee vastauksia.



Tutkimuksen hallinnointi ja toteutus

OSKE-hanke on valtakunnallinen teknologiakeskusten hallinnoima projektikokonaisuus, jota Jyväskylän alueella hallinnoi JSP. PaperIT on yksi osa kokonaisuutta ja se keskittyy perinteisen paperiteollisuuden informaatioteknologian parempaan hyväksikäyttöön. Jyväskylän yliopiston puolelta projektia hallinnoi Agora Center ja vastuullinen johtaja on professori Tommi Kärkkäinen. Projektin kohteena on Paperiteknologiakeskus.



Sidosryhmät

Tutkimus kohdistettiin Jyväskylän Rautpohjassa sijaitsevaan Metso Paperin Koekoneympäristöön. Tutkimuksen rahoittajina Metson lisäksi toimivat JSP, TeliaSonera, TietoEnator sekä Agora Center, joiden edustajista muodostui myös projektin johtoryhmä. Muina yhteistyökumppaneina toimivat KCL ja TTY.



Lähtökohdat

Paperikoneen toiminnasta saadaan runsaasti valmistusprosessin tilaa kuvaavaa mittaustietoa. Tätä tietoa on mahdollista hyödyntää ja liittää osaksi prosessin säätöä sekä syntynyttä tuotteen laatua siten, että hallittu suunnittelu ja toiminnan ohjaus tehostuvat entisestään. Näin ollen myös palveluliiketoiminnan oletetaan kehittyvän samaa tahtia. Koska mittaustietoa on runsaasti, ongelmana on ollut oleellisen tiedon poimiminen tietomassasta. Projektin tutkimusongelma onkin, kuinka paperikoneen tuottamasta tiedosta löydetään oleellinen informaatio koneen toiminnan tehokkuuden kannalta.

Projekti jakautuu kolmeen osaan, joista kustakin vastaa yksi tutkija.

1) Tiedon louhinta. Paneudutaan keinoihin, joilla kootusta tiedosta saadaan käyttäjän kannalta tiivistettyä oleellinen esille.
2) Järjestelmäintegraatio. Etsitään vastausta siihen, kuinka tieto saadaan kulkemaan osajärjestelmien välillä.
3) Tietovirta-analyysi. Paneudutaan siihen, mitä tietoa, kuinka paljon ja missä muodoissa paperikoneen ajon yhteydessä liikkuu.

Kuviossa 1 on esitetty projektin osa-alueiden vuorovaikutus toisiinsa nähden. Lisäksi kuviossa 1 on esitetty jokaisen projektin osa-alueen merkitykset ja konkreettiset/odotetut tulokset. Tietovirta-analyysi toimii projektin kahden muun osan kannalta ajatellen yhdistävänä tekijänä. Esimerkiksi järjestelmäintegraatiota ajatellen liiketoimintaprosesseissa ilmenevien tietovirtojen formaatit ovat keskeisiä tekijöitä suunniteltaessa järjestelmien välistä integraatiota. Tiedonlouhintaa ajatellen tiedon omistajien ja hyödyntäjien sekä louhinnan eri tietojärjestelmille vaatimien oikeuksien löytyminen ovat keskeisimpiä selvitettäviä asioita. Näiden lisäksi tietovirta-analyysillä selvitetään Koekoneympäristön toiminnassa ilmenevän kommunikaation nykytila sekä siinä ilmenevät ongelmat niin tietovirtojen kuin konkreettisen työskentelyn suhteen. Konkreettisella työskentelyllä tarkoitetaan tässä yhteydessä esimerkiksi työntekijöiden kokemia epäkohtia, joita he henkilökohtaisesti haluaisivat muuttaa omassa työskentelyssään. Järjestelmäintegraatio puolestaan mahdollistaa hajallaan olevan informaation yhtenäistämisen, jolloin tiedonlouhinta mahdollistuu.



Projektin osat

KUVIO 1. Projektin osa-alueiden tulosten sisäinen hyödyntäminen.



Kuviosta 1 käy ilmi, että tietovirrat kuvaavat niin järjestelmäintegraatiota (EAI) kuin tiedonlouhintaa (Data mining). Kuvaamisella tarkoitetaan sitä, että tietovirtakartoituksen avulla kontekstista saadaan konkreettinen kuvaus muiden osien tutkimukselle siten, että niiden avulla voidaan perustella toteutettavat ratkaisut. Tiedonlouhintaa ajatellen raakadata ei yleisesti riitä, vaan sen erilaiset selittävät muuttujat muista tietovirroista ovat oleellisia osia tiedonlouhinnan tuloksen tulkinnan kannalta. Esimerkiksi ajon tilaa koskevan metatiedon avulla pystytään louhimaan tietoa "samasta tilanteesta", jolloin tuloksista tiedetään etukäteen, mitä ne tarkoittavat. Näin ollen vältytään turhalta työltä, eli louhimasta sellaista tietoa, millä todellisuudessa ei tutkimusmielessä ole mitään merkitystä. Tietovirtakartoituksen avulla saadaan selvitettyä myös yhteen kokonaisuuteen, esimerkiksi liiketoimintaprosessiin, kuuluvat tietovirrat, jotka näin ollen osataan ottaa mukaan louhintaan. Tämän ansiosta mitään keskeistä ei jää louhinnan ulkopuolelle.

Kuviossa 1 tiedonlouhinnan tietovirtojen jalostamisella tarkoitetaan sitä, että esimerkiksi kohtuuttoman suuresta tietovirrasta saadaan louhinnan avulla karsittua ylimääräinen, käyttäjän kannalta merkityksetön informaatio pois, jolloin tietovirta jalostuu. Järjestelmäintegraation tietovirtojen yhdistämisellä tarkoitetaan sitä, että tietovirrat, joista ilmenee duplikaatteja, voidaan mahdollisesti yhtenäistää yksikkö- tai jopa organisaatiokohtaisesti. Tällainen tilanne voi olla esimerkiksi eri toimijoiden tekemien analyysitulosten tallentamisessa yhteen paikkaan, kun ennen järjestelmäintegraatiota tallennukseen ei ollut käytössä yhteistä käytäntöä. Tällaisessa tapauksessa tulokset eivät ole suoraan kaikkien osapuolten saatavilla, joten integraation avulla saavutettaisiin liiketoimintaprosessin tehostumista ja näin ollen säästettäisiin aikaa ja rahaa.

Tiedonlouhinnan järjestelmäintegraatiolle luomalla tarpeella tarkoitetaan sitä, että louhinta ei usein, jos koskaan, ole mahdollista ilman järjestelmäintegraatiota. Ja taas toisinpäin, tiedonlouhinnan avulla löydetty uusi informaatio täytyy integraation avulla saada hyötykäyttöön kaikille tarvitsijoille - osaksi relevantteja tietovirtoja.








© Turo Kilpeläinen