mutta mitä se oikeastaan on?
Tekoälystä puhutaan
Valtio Expo 2017Asko Relas
Asko Talent BaseTalent Base: 2013 -Senior konsultti, Head of Innovation
Altotech: 2013 - 2015Technical lead
IBM: 2007 – 2013 Ohjelmistokehittäjä, IT-konsultti, sisäinen yrittäjä
Riippumatonta IT-suunnittelua vaativiin hankkeisiin
Konseptoimme ja suunnittelemme asiakkaan tarpeisiin sopivan ratkaisun
Ohjaamme teknistä toteutusta
Huolehdimme jalkautuksen suunnittelusta
Tekoälyn hypevuosi 2017
Tekoälyn ominaisuudet
Kuuleminen: Puheen tunnistus eri kielillä ja muiden audiosignaalien tulkitseminen
Puhuminen eri kielillä
Keskustelun käyminen
Näkeminen: Kuvien ja videokuvan tulkitseminen
Neuvonanto, kysymyksiin vastaaminen
Liikkuminen ja esineiden liikuttelu
Puhekäyttöliittymät
1. Puhe muutetaan tekstiksi
2. Aikomus tulkitaan ja sitä vastaava toimenpide suoritetaan
3. Palaute annetaan puheena
Kuuleminen• Kyky ymmärtää puhetta eri kielillä ja tunnistaa muitakin äänisignaaleja
• Ei erityisen uutta: puheentunnistus jo Nokia 3310:ssa (v. 2000) ja Windows Vistassa (2006)• Edistystä ymmärrettyjen kielten määrässä ja tarkkuudessa
• Nykytoteutukset ns. rekursiivisilla neuroverkoilla (recurrent neural net)
Neuroverkko?Aivojen rakennetta imitoiva matemaattinen malli, joka oppii sille syötetystä datasta
Lähde: Indiana University
Puheen syntetisointi• Tehty jo pitkään:
• Ensimmäinen englanninkielinen järjestelmä 1968 (ElectrotechnicalLaboratory, Japan)
• Kuluttajakäyttöön Sound Blaster 16 (1992)
• Viimeaikoina saavutettu hyviä tuloksia käyttämällä konvolutionaalisia neuroverkkoja, esim. WaveNet
https://deepmind.com/blog/wavenet-generative-model-raw-audio/
Aloitus
Mitä näet?
Kuinkamonta?
Kuinkavahna?
”What do you see?””What do you see here?””Now what do you see?”
”How many X do you see?”How many X in this picture?”
”How old am I?””How old do you think I am?”
• Puu- tai verkkomainen malli mahdollisista toimenpiteistä• Jokaisessa haarassa esimerkkejä, miten asian voi ilmaista• Käyttäjän tavoite tunnistetaan siitä, mihin haaraan se todennäköisimmin
kuuluu
Keskustelu
Konenäkö• Konenäkö (computer vision) viittaa kykyyn
tunnistaa asioita valokuvista ja videosta • Kuvien ja videoiden luokittelu / tägäys• Objektien tunnistus: liikennemerkit, kaistaviivat,
autot, ihmiset
• Kts. esimerkiksi TensorFlow, Caffe, OpenCV
Neuvonanto• Kysymys-vastaus-järjestelmät (question answering systems)
osaavat vastata luonnollisella kielellä kysyttyyn kysymykseen
• Tyypillisesti kolmivaiheinen prosessi:1. Kysymyksen tulkinta: kieli, tyyppi ja aihe2. Potentiaalisten vastausten haku ja pisteytys3. Vastauksen muotoilu
Liikkuminen• Vahvistusoppiminen (reinforcement learning) on tämän hetken
varteenotettavimpia keinoja itsenäisen liikkumisen opettamiseen
• Toimija (robotti, auto, …) kokeilee erilaisia toimenpiteitä eri tilanteissa, ja saa palautetta onnistumisesta, esim. kuinka pitkälle se pääsi kaatumatta• Kokeiluista muodostetaan tilastollista mallia siitä, millainen
toimenpide toimii missäkin tilanteessa• Opettelu kannattaa tehdä aluksi simulaatiossa, josta opittu
toimintamalli siirretään fyysiseen maailmaan
Mitä tekoäly siis on?
Näkeminen: Konvolutionaaliset neuroverkot, konenäkö
Kuuleminen: Rekursiiviset neuroverkot
Puhuminen: Puheen syntetisointi nykyään neuroverkoilla
Keskustelu: Keskustelumallit, tekstisyötteen luokittelu
Neuvonanto: Kysymys-vastaus-järjestelmät
Liikkuminen: Vahvistusoppiminen
Tekoälyn sovelluskohteet• Tyypillisesti soveltuu tilanteisiin joissa
1. Täytyy tulkita rakenteetonta dataa (video, kuva, ääni, vapaa teksti)2. Ei löydy selvästi muotoiltavissa olevia sääntöjä
• Tekoäly usein sekoitetaan seuraaviin:1. Tilastotiede2. Matemaattinen optimointi3. Sääntöpohjaiset järjestelmät
Kiitos!Tule tapaamaan meitä!