Finnish slides for a presentation given at a Fortum's internal big data event. The presentation drafts out a journey from big data through sensor data in general into automated use of cutting edge sensors, drones and data technology in inspecting infrastructure.
I will hopefully translate these into English at some point :)
2. BIG DATA â ONKO SE NYT VAIN ISOA DATAA?
âą Dataa kerĂ€tÀÀn ja yhdistellÀÀn âepĂ€mÀÀrĂ€isistĂ€â lĂ€hteistĂ€
⹠Datan kÀyttö operatiivisesti usein hankalaa
âą âDatasta tietoonâ tarpeellinen vĂ€livaihe, mutta vain vĂ€livaihe
3. KUKA LUO DATAA?
Ihmisten tuottamaa dataa:
⹠5K tweettiÀ / s
⹠25K tapahtumaa / s mobiilipelistÀ (noin 200 Gt / pÀivÀ)
âą 40K Google-hakua / s
Konedataa:
âą 5M tarjousta / s USA:n optiomarkkinoilla
⹠120 Mt / s diagnostiikkaa yhdestÀ kaasuturbiinista
⹠1 Pt / s törmÀyshetkellÀ CERNin LHC-kiihdyttimestÀ
4. SENSORIDATA
âą Koneiden tuottamaa
âą Voi tarkkailla hallittua kohdetta: ydinvoimalan tuhannet ilmaisimet
⹠Voi tarkkailla ympÀristöÀ: ESAn Copernicus-satelliitit
âą Big data âmurros on nostanut odotuksia mahdollisuuksista
5. YMPĂRISTĂN HAVAINNOINTIA SENSOREIN
âą Datasovelluksissa yleensĂ€ aina âtosimaailma tulee ja sotkee kaikenâ
⹠Konedata vÀlttÀÀ tÀmÀn ongelman usein
⹠YmpÀristön havainnointi sensorein on poikkeus
6. MITĂ YMPĂRISTĂĂ SITTEN HAVAINNOIDA?
âą Avaruus
⹠Luonnonilmiöt
âą Ihmisten toiminta suuressa mittakaavassa
âą Infrastruktuuri
7. INFRASTRUKTUURIN VALVONTA
âą Yhteiskunnan infrastruktuurille asetetaan suuret odotukset
⹠HÀiriöillÀ ja hajoamisella korkeat kustannukset
âą Infrastruktuuria on todella paljon
âą Tyypillinen infra sallii vain ulkoista seurantaa
8. MIKSI INFRAN VALVONTA ON NIIN KALLISTA?
âą Seuranta on laajaa, jatkuvaa ja monimuotoista
⹠Jotkut tÀrkeÀt havainnot epÀmÀÀrÀisiÀ ja vaikeita myös ihmiselle
⹠Virheet ovat erittÀin kalliita
9. MITEN VOIMME SĂĂSTĂĂ TĂSSĂ?
âą Erotetaan tietojen keruu ja havaintojen teko
âą Automoidaan molemmat!
âą Kone pystyy suuriin ja monimutkaisiin arviointeihin luotettavammin
⹠Tiedolle odottamatontakin kÀyttöÀ, kunhan sitÀ pystyy saamaan
10. TIEDON KERUU LENNOKEIN
âą Lennokit minimoivat datan keruun kustannukset
⹠PÀÀsy myös hankaliin paikkoihin
⹠Tekniikka kehittyy nopeasti --> hinta vielÀ alemmas
⹠Euroopassa vain yksi yhtiö, jolla luvat BVLOS-lentoihin
11. DATAN AUTOMAATTINEN ARVIOINTI
⹠Kone ihmistÀ merkittÀvÀsti nopeampi ja luotettavampi arvioija
⹠Ongelmana ollut datan ja sen kÀytön monimutkaisuus
âą Tiedon laaja digitalisointi mahdollistaa aivan uusia ratkaisuja
12. SENSORIDATAN TULEVAISUUS
âą Sensorien koko ja hinta tippuvat, kyvyt ja laatu paranevat
âą Viimeinen portti: Tehokas tiedon keruu on vasta tulossa
âą Suunnaton mahdollisuus mullistaa vanhat liiketoimintamallit
Editor's Notes
Nopeus, mÀÀrÀ, monimuotoisuus, mutta ne vain seurausta ideologian erosta: kerÀÀminen ennen tarkoitusta, monimutkaisuuden tavoittelu
Dataa ei vain itsestÀÀn ilmesty ja toimi, vaan vaatii jatkuvaa huolenpitoa, strategista kÀsittelyÀ ja merkittÀvÀsti suurempaa teknistÀ kyvykkyyttÀ.
Oikein ymmÀrtÀminen ja pÀÀtökset hankalia: yksityiskohdat, ihmiset + tilastot.
YmmÀrrys tarvitaan ennen kÀyttöÀ.
YmmÀrtÀminen ei riitÀ, ymmÀrtÀminen ei ole pÀÀtös eikÀ se skaalaudu.
Ihmisten tuottama data lĂ€hes aina âpientĂ€â.
Voi olla ideologisesti big dataa, mutta absoluuttisesti aina vain pienempÀÀ.
LĂ€hes kaikki datat mahtuvat jo yhden koneen muistiin.
Esim. 1.5 sÀhköasiakkaan tuntitason mittaridata 25 vuodelta.
Sensoreita voidaan asentaa koneisiin, ripotella ympÀriinsÀ ja keskittÀÀ kalliisiin laitteisiin
Ei tarvitse rajoittua vain tiettyyn datapisteeseen, âmitĂ€ tietoa voisimme kerĂ€tĂ€ tĂ€stĂ€ kohteesta?â
PÀÀtapaukset:
Ihmisten luoma data on tÀynnÀ sotkua, esimerkiksi tweettien kirjoitusvirheet, mobiilidatan sekavat timestampit, hyppivÀt ID:t
Tosimaailman bisnes-vaatimukset
SisÀinen data on hallittua, helppoa. Ulkomaailma on se mikÀ sotkee kaiken.
YmpÀristön havainnoinnin kehitys: armeija -> avaruus -> turvallisuus -> tulevaisuus -> bisnes
MitÀ tekisit, jos tietÀisit tarkalleen peltojesi hyvÀt ja huonot kohdat ja syyt siihen?
Infran pitÀÀ olla ehdottoman luotettavaa.
Se on myös jatkuvasti ja *pitkÀÀn* ympÀristön armoilla.
Betoniin ei voi asentaa sensoreita eikÀ putkivuotoja havaita reaaliajassa.
Infraa paljon, se kÀrsii jatkuvasti, riskejÀ ei sovi ottaa ja mahdollisia ongelmia valtavasti.
Eri arviointeja voi joutua tekemÀÀn tuhansia samasta kohteesta, ihmiselle hankalaa olla systemaattinen.
Datan ja pÀÀtösten teon epÀmÀÀrÀisyys palaa kuvaan.
Aiemmin havainnoija kerÀsi silmin tietoja, joita sitten arvioi.
Voimme sen sijaan erottaa tiedon keruun, jolloin siihen ei kulu havainnoijan aikaa.
Seuraavaksi automoimme tiedon keruun.
Sitten automoimme havainnoinnin.
SÀÀstöt: bensa, iso laite ja sen capex, kuljetus
Sensorit nyt merkittÀvÀ kustannuserÀ, ts. sivukustannukset romahtaneet lennokeilla
BVLOS-lennot ItÀ-Suomessa
âKuvittele arvioija istumaan helikopteriin kun metsĂ€ virtaa ohiâ
Vaikka tietoa kerÀttÀisiinkin, sen tehokas kÀsittely ollut mahdotonta.
Me olemme ratkaisseet datan kÀytön monimutkaisuuden teknologiallamme.
Sensoridata on konedataa, se kasvaa kovalevyjen tahtia.
Sensoridata tulee totaalisesti muuttamaan ymmÀrryksemme ympÀristöstÀ ja itsestÀmme.
Juuri nyt enemmÀn vanhan mullistamista kuin aivan uuden luontia.
Sharper Shape on pidemmÀllÀ kuin kukaan kahdella teknologian rintamalla.
Lennokkien BVLOS-kÀytössÀ infran tarkistamiseen JA
2) automaattisessa sensorifuusion mallinnuksessa
Kiitos!