Tekoälyn testaus – laadukas harjoitusdata laadunvarmistuksen tukena

Julkaistu 12.6.2023
Lukuaika noin 1 min

Tekoäly (artificial intelligence) ja sen tämän hetken yleisin muoto koneoppiminen (machine learning) tuottavat hienoja tuloksia ohjelmistojen maailmaan. Tekoälyalgoritmit ovat harvoin itsenäisiä ohjelmistoja, vaan sen sijaan ne ovat yleensä jonkin perinteisen ohjelmiston osa.

Tekoälyalgoritmeissa data on kaiken A ja O. Ne tarvitsevat mahdollisimman paljon koulutusdataa, jotta se voivat sen perusteella oppia esimerkistä, aivan kuten ihmisetkin. Esimerkiksi ihminen voi oppia tunnistamaan auton on melko helposti yhdestä kuvasta, mutta tekoälylle on näytettävä tuhansia kuvia erilaisista autoista, jotta he tunnistavat auton tarkasti.

Datasta koneoppimisalgoritmit oppivat malleja ja ongelmanratkaisua aiempien datasta tehtyjen havaintojen perusteella. Mitä enemmän koneoppimisen malleja altistetaan merkitykselliselle harjoitusdatalle, sitä enemmän ne paranevat ajan myötä.
Tekoälymallit ovat ainoastaan yhtä hyviä kuin data, jolla sitä on koulutettu. Data usein on mallien ainoa ns. liikkuva osa, ja siksi datan on oltava mahdollisimman monipuolista ja vaihtelevaa.

Jos lähtödatassa on vääristymää, ulostulokin on vääristynyt. Koska tekoäly oppii käyttämänsä opetusdatan perusteella, sen tuottamat tulokset heijastavat suoraan niitä tietoja, joita se on opetusdatasta oppinut.

Katso alta Knowitin Mark Sevalnevin tiivistelmä siitä, miksi tekoälyn laadukas data on ensiarvoisen tärkeää tekoälyn vinoumien välttämiseksi.

Jos video ei näy, voit katsoa sen täältä.

Kaikkein edistyksellisin tilastollinen mallikaan ei voi mitenkään korjata virheellistä dataa. Tilastotieteilijöiden hokema ”roska sisään, roska ulos” (Garbage In, Garbage Out) muistuttaakin siitä: jos datassa on jonkinlainen vääristymä, ulostulokin todennäköisesti on vääristynyt.

Tekoäly ei toimi aina tismalleen samalla tavalla, siksi ohjelmistojen tekoälyosuutta ei voi tyhjentävästi testata samoilla keinoin kuin perinteisiä ohjelmistoja. Kun perinteiset järjestelmät on testattu, niitä ei tarvitse testata uudelleen ennen kuin ohjelmistoa muutetaan. On tärkeää muistaa se eroavaisuus, että tekoälyjärjestelmät jatkuvasti oppivat ja mukautuvat jatkuvasti uusiin tietoihin.

Tekoälyn yleistyessä on ratkaisevan tärkeää varmistaa järjestelmien perusteellinen testaus, jotta ne toimivat tarkoitetulla tavalla. Tekoäly on monimutkainen järjestelmä, jossa pienetkin viat tai vinoumat korostuvat, ja siksi sen testaus on tärkeää.

Tutustu tekoälyn testauksen pääkohtiin ja testaustapoihin Kuinka testata tekoälysovellusta? -tallenteelta.

Sinua saattaisi kiinnostaa

Tietoa kirjoittajasta:

Joop Tenhunen
Tuoteryhmäpäällikkö

Joop on yksi Tieturin tuoteryhmäpäälliköistä ja vastaa Tieturin tekoälykoulutuksista. Lisäksi Joopin alueisiin kuuluu mm. ohjelmistotestaus, Office-sovellukset ja tietoturva.

Asiasanat:

Tekoäly Koneoppiminen Ohjelmistotestaus