Tekoäly (AI) ja koneoppiminen (ML) – termit haltuun nopeasti

joulu 9, 2020 | General | 0 Kommenttia

Tekoäly ja koneoppiminen on kuuma puheenaihe monissa yrityksissä. Myös eri mediat ovat täynnä artikkeleita ja mielipiteitä tekoälystä (AI, lyh. Artificial Intelligence), koneoppimisesta (ML, lyh. Machine Learning), Big Datasta, datan käsittelyn automatisoinnista ja kaikki nämä yhdistävästä kattotermistä eli datalla johtamisesta.

Näiden artikkelien mukaan koneoppiminen muun muassa oppii todennäköisyyksiä datasta ja pystyy ennakoimaan sen avulla tulevaa kehitystä. Tekoäly voi kuulemma jopa analysoida itsenäisesti dataa sekä tehdä liiketaloudellisia päätöksiä sen perusteella.

Nämä saattavat kuulostaa tieteiselokuvan aiheilta tai abstraktiivisen tason keskustelulta, mutta koneoppimisen hyödyntäminen liiketoiminnassa on jo todellakin tullut pk-yrityksienkin saataville pilvipalveluiden yleistymisen myötä muutamia vuosia sitten. Valitettavasti vain pieni osa suomalaisista yrityksistä osaa vielä hyödyntää näitä mahdollisuuksia kunnolla saavuttaakseen niistä kilpailuetua.

Jotta näistä ylemmistä termeistä kuten AI ja ML voitaisiin keskustella tarkemmin, täytyy ymmärtää ero niiden välillä. Yritän seuraavaksi määritellä ne maallikollekin ymmärrettävin termein.

Määritellään tekoäly ja koneoppiminen

Tekoälystä ja koneoppimisesta puhutaan usein samassa asiayhteydessä ja monesti termejä käytetään virheellisesti toistensa synonyymeina. On tärkeä huomioida, että ne ovat erillisiä käsitteitä, erillisine implikaatioineen, vaikka useimmiten ne liittyvätkin läheisesti toisiinsa.

Mutta mikä sitten pohjimiltaan on se ratkaiseva ero tekoälyllä ja koneoppimisella? Määritelmiä näille on monia, mutta eräs tilanteeseen sopiva löytyy David Stephensonin Big Data Demystified kirjasta suomennettuna alta:

Tekoäly on sitä, kun kone reagoi asetettuun ympäristöönsä älykkäästi. Koneoppiminen on taas sitä, kun kone tulee älykkäämmäksi ilman, että ihminen sitä ohjelmoi”.

– David Stephenson

Käytännössä todellista ihmisen aivojen kaltaista tekoälyä, joka pystyisi reagoimaan kaikkiin ympäristössään tapahtuviin mahdollisiin tapahtumiin ja oppimaan niistä syy-seuraus suhteita, ei kuitenkaan ole vielä olemassa. Myöskään monen tieteiselokuvan tai -sarjan aiheena olevaa koneen saavuttamaa tietoisuutta itsestään ei ole vielä julkisesti esitetty.

Tekoälyn määritelmän sanotaankin liukuvan aina karkuun sitä mukaa mitä saavutuksia ollaan jo nähty. Eli englanniksi hieman humoristisesti tiivistettynä:

“AI is cool things that human can easily do, but computers yet can’t do”.

Tästä lausahduksesta huolimatta meidän täytyy tunnustaa, että koneoppiminen voi nykymaailmassa suorittaa joitain tiettyjä sille annettuja tehtäviä ihmistä moninkertaisesti nopeammin, tarkemmin ja tehokkaammin. Lisäksi sen oppimiskyky on miltei rajoittamaton verrattuna ihmiseen.

Esimerkki oppimisesta neuroverkossa

Koneoppiminen on siis tekoälyn yksi osa-alue, jonka tarkoituksena on saada ohjelmisto toimimaan entistä paremmin pohjatiedon ja mahdollisen käyttäjän toiminnan perusteella. Se voidaan karkeasti jakaa kahteen eri kategoriaan, valvottuun oppimiseen ja valvomattomaan oppimiseen.

Valvotulla oppimisella tarkoitetaan tilannetta, jossa koneelle opetetaan erilaisia tilanteita, joita koneen tulee tarkkailla ja huomioida. Valvomaton oppiminen on tilanne, jossa kone itse löytää tilanteita ja ehdottaa niiden lisäämistä tarkkailuun. Tälläinen valvomaton oppimiminen voi kuulostaa maallikolle mahdottomalta, joten tarkastellaan minkälaisella neuroverkolla se voisi onnistua.

Alla olevassa kuvassa on esitetty käytännön esimerkkinä takaisinkytketty neuroverkko (engl. recurrent neural network), jossa on kolme kerrosta. Matemaattisella esityksellä tai funktioiden toiminnalla ei ole tässä nyt väliä, vaan kiinnitetään huomio siihen, että Layer 0 on sisääntulokerros ja Layer 2 on ulostulokerros. Layer 1 on piilotettu kerros.

Kuvan lähde: Improvement of a Parallel Type Two-axial Actuator Controlled ..,
Kazuya EsumiMasahiro Ohka, Yasuhiro Sawamoto, Shiho MatsukawaTetsu Miyaoka

Tärkeätä tästä kuvasta on huomata, että alin viiva esittää kytkentää ulostulokerrokselta (Layer 2) takaisin sisääntulokerrokselle (Layer 0), jolloin voidaan käyttää sisäistä tilaa eli muistia syötteiden käsittelemiseen.

Takaisinkytketyt neuroverkot ovatkin omiaan ajallisesti jäsennetyn datan, kuten käsinkirjoituksen, tekstin tai puheen käsittelyyn. Tai tässä esimerkin tapauksessa anturittomien pietsosähköisten toimilaitteiden ohjauksen parantamisessa. Näin toimivien muidenkin algoritmien muodostamaa järjestelmää voidaan siten sanoa itsenäisesti oppivaksi ja älykkääksi syy-seuraus suhteiden tunnistamisessa.

Mutta antaisiko korkean profiilin omaavan henkilön selkeämpi esitys neuroverkoista riittävän ja ymmärrettävän kuvan tavalliselle pk-yritykselle koneoppimisen käytännön tekemisestä ja niiden avulla saavutettavista lisäarvomahdollisuuksista?

Niille, joita koneoppiminen todella kiinnostaa ja joilla on reilu tunti käytettävissä aiheseen, haluan esitellä suositun esityksen koneoppimisesta englanniksi, millä on lähes 100 000 katselukertaa YouTubessa.

Siilasmaan esitys koneoppimisesta

Nokian hallituksen puheenjohtaja Risto Siilasmaa julkaisi jo vuonna 2017 alla upotetun esityksensä, jossa valisti miten koneoppiminen toimii ja mitä käytännön sovellutuksia sillä nykypäivänä on. Siinä myös kannustetaan yrityksiä perehtymään koneoppimiseen ja kokeilemaan oman alan asiantuntijan roolissa niitä liiketoimessaan.

Datalla johtamisen ensiaskeleet

Tekoälyssä hyödynnettävä koneoppiminen perustuu yksinkertaistettuna käytännölle, että tietokoneelle opetetaan ensin jostakin tilanteesta perusasiat ja harjoitetaan sitten algoritmia havaitsemaan samankaltaisia asioita isoista tietomassoista.

Jotta näihin ylempiin datan käsittelyn teknologioihin päästäisiin käsiksi, yritysten huomio tulisi mielestäni ensiksi kääntää pois pelkkien toteutuneiden talouslukujen raportoinnista kohti monia modernin liiketoimintatiedon hallinnan eli BI:n (lyh. Business Intelligence) esille tuomia mahdollisuuksia ja sitä kautta kiinnostua datasta ja sen eri analysointitekniikoista.

Tekoäly ja koneoppiminen – vältettävät sudenkuopat

Digitalisaation potentiaali jää konkretisoitumatta ja päätöksenteon automatisointi on ennalta tuomittu epäonnistumaan, jos lähtödata on reikäistä, hajanaista ja jäsentämätöntä.

Tekoälystä puhuttaessa täytyy muistaa se, että data on ainoa asia, mitä koneella on käytettävissään. Siksi datan laatu pitää ensiksi varmistaa. Jos koneelle syötettävä opetusdata ei ole puhdasta ja laadukasta, se vähentää tulosten luotettavuutta.

“Garbage in, garbage out”

– Risto Siilasmaa on Machine Learning – videolla

Suomalaisten yritysten datatietoisuus on Siilasmaan esityksen jälkeen kolmessa vuodessa jo onneksi kasvanut, mutta edelleen täytyy muistuttaa aiheesta juuri kiinnostuneita yrityksiä lisäksi vanhasta viisaudesta:

”You need to learn to walk before trying to run”.

– tunnettu sanonta jo 1400-luvulta

Se tarkoittaa tässä tilanteessa sitä, että päästääkseen hyödyntämään näitä korkeampia teknologioita (AI ja ML), yritysten täytyy muuttaa ensin toimintaansa kohti dataohjautunutta päätöksentekoa BI:n avulla.

Datan kerääminen ja analysoiminen voidaan toki aloittaa jo aikaisemmassa vaiheessa tietämättä tarkasti sovellusta, johon sitä lopulta käytetään. Siksi yrityksissä yleensä tulee ensiksi selvittää mitä dataa on jo olemassa ja mitä sille tulisi tehdä, että se saataisiin valjastettua hyötykäyttöön.

Eli hyödynnetään ensiksi yrityksen digitaalisiin järjestelmiin jo kertynyttä dataa ja tutkitaan sitä BI:n avulla. Nämä vaiheet tulevat tehtyä esimerkiksi ASETin aloituspaketin yhteydessä.

Jos tulevaisuudessa aiotaan käyttää oikeaa koneoppimista ja automatisoitua päätöksentekoa, opetusdatan laadun pitää olla jo todella hyvä ja sitä tulee olla paljon. Vasta silloin “tekoäly” osaa toimia tehokkaana ja väsymättömänä työkaverina.

0 kommenttia

Lähetä kommentti

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

Share This