Inimlik ja masinlik suhtlus

ARVI TAVAST

Masinõppesüsteemide areng üldise tehisintellekti (AGI) poole on üks viimase aja põnevamaid arutelukohti. Lisaks sellele, et vaieldakse tehnoloogia, eetika ja juura praktiliste küsimuste üle, puudub üksmeel ka suuremates küsimustes, alates juba AGI eesmärgist. Selle pooldajate üks suuremaid ootusi ja vastaste hirme on masinate jõudmine inimese tasemele. Samas pole üldse kindel, kas inimintellekt kui üks paljudest võimalikest intellekti vormidest on üldse mõistlik võrdlusalus või kas sellega sarnanemine võiks üldse olla midagi tähelepanuväärset. Igal juhul kujunevad tehissüsteemide kognitiivsed võimed lähiaastatel põhimõtteliselt teistsugusteks kui inimesel, mitte et nad jääksid lineaarses arengus maha. Eriti hästi on seda näha õppimise puhul, mis toob omakorda kaasa suhtlusviiside põhimõttelise erinevuse.

Praegune tehisintellekt on saavutatud toore jõuga. Arvutuskeskused kasvavad sellise kiirusega, et nende asukoha valikul on elektrijaama lähedus tähtis argument ja neist vabaneva jääksoojusega saab kütta linnu. Ka inimese aju oma kaalu ja energiakasutusega on kulukas organ ülal pidada. Anatoomias aga hakkavad edasise kasvu võimalused juba ammenduma, mis on loodust sundinud ette võtma põhjalikku optimeerimist.

Kogu laekuvat infot masina kombel salvestada ei ole inimese puhul realistlik. Lisaks on evolutsiooni käigus selgunud, et see pole ka vajalik, vaid liigina ellujäämiseks piisab juba tõenäosuslikust salvestamisest. Laps ei sünni uue tühja kõvakettaga, kuhu koguda teadmisi nagu entsüklopeediaartikleid. Neid artikleid ehk sisendit ennast me tegelikult ei salvestagi, mis muuseas teeb inimestevahelise mälumängu erinevalt masinatevahelisest spordina huvitavaks ning põhjustab palju lõbusaid olukordi faktilise info, näiteks kuupäevade või nimede mäletamisel.

Seevastu me mäletame hästi selle sisendi põhjal tehtud järeldusi ehk meie ettekujutust maailmast. Ajus on viimane esitatud kujuteldamatult suure hulga neuronite abil, millest igaühel saab olla väga palju varieeruva tugevusega seoseid. Protsessi, kus iga uus kogemus neid seosetugevusi hästi natuke nihutab, oleme hakanud nimetama õppimiseks. Ka siin on evolutsioon teinud oma optimeerimistööd ja jõudnud geniaalselt lihtsa lahenduseni – diskriminatiivse ehk eristava õppimiseni. Me eristame ainult neid asju, mida meil on tarvis eristada. Jaapani laps kasvab keskkonnas, kus l– ja r-hääliku eristus pole oluline, ning hiljem ta tõepoolest ei kuulegi neid erinevana. Meie ei tee samamoodi vahet hiina keele toonidel või vene tegusõnade perfektiivsusaspektil. Küll aga eristame väga peenelt, kusjuures elu jooksul järjest peenemalt, meie jaoks olulisi asju: eesti keele häälikuid, välteid, piirkondlikku ja sotsiaalset murdetausta, enamasti ka nalja, irooniat ja valetamist.

Peale kuuldu ja loetu aitavad õppimisele kaasa ka empaatia, mis samuti on inimesel arenenum kui praegustel masinatel, ja eksperimendid kõnelemisel. Oma ütlusi planeerides me lähtume oletusest selle kohta, milliseid kõnesignaale konkreetne kuulaja vajab meie öelda tahetu mõistmiseks. Need oletused võivad tõele vastata või mitte, kuid igal juhul sõnastame oma ütluse parimal viisil, mida sel hetkel oskame. Kuulajate reaktsioonidest saame öeldu kohta tagasisidet, mille põhjal jällegi natuke nihutame oma seosekaalusid, mis loodetavasti võimaldab järgmisel korral veelgi edukamalt kuulaja vajadustega arvestada ja seeläbi oma suhtluseesmärki saavutada.

Veel üks inimaju tähelepanuväärne omadus, mida püütakse, kuid pole seni päriselt suudetud tehisnärvivõrkudega järele teha, on võime omandada uusi sõnu nende ühekordse kuulmise põhjal. Miks see vajalik on? Lihtne on näha, et mõned sõnad (nt „olema“) esinevad väga palju sagedamini mõnest teisest (nt „kolletama“), ehk sõnade sagedusjaotus on tugevalt kaldu levinumate sõnade poole. Üks ootamatu tulemus korpuslingvistikast ehk suurte tekstikogumite statistilisest analüüsist on aga Zipfi seaduseks nimetatav tähelepanek, et see jaotus ei olene tekstide mahust. Ükskõik kui palju tekste me uuritavasse korpusse ei lisaks, ikka moodustavad „olema“ vormid umbes viis protsenti kõigist tekstisõnadest, samas kui koguni pooled sõnad esinevad vaid ühe korra. Praegused maailma suurimad korpused, millel seda hüpoteesi kontrollitud on, ületavad juba ammu oma mahult inimvõimete piiri ehk maksimaalse hulga teksti, mida üks inimene jõuaks oma eluea jooksul kuulda või lugeda. Seega saame olla üsna kindlad esmapilgul uskumatuna näivas järelduses: pooli sõnu, mida inimene on oma elus kuulnud, on ta kuulnud ühe korra.

Kuna aga täiskasvanute igapäevases suhtluses, kus neid haruldasi sõnu kuuldakse, mingit ilmutatud keeleõpetust ega tähenduste kokkuleppimist ei toimu, peabki inimese suhtlusvõime olema üles ehitatud kuidagi nii, et ühest kuulmisest piisaks ja sõna mõistmine ei eeldaks eelnevat kokkuleppimist. Veelgi enam, inimesed peavad isegi enda jaoks täiesti uusi tähendus(eristus)i suutma väljendada ja mõista ilma eelneva kokkuleppeta, kuna praktikast on näha, et selgesõnalisi kokkuleppeid tehakse ainult ebatavaliselt suurt täpsust nõudvates olukordades. Kõigil muudel juhtudel peab kuulaja ka endale uue tähenduse moodustamisega käigult hakkama saama, mis praeguste tehissüsteemide vahelises suhtluses oleks mõeldamatu.

Tehissüsteemid on tugevad jälle muudes valdkondades. Uusi sõnu nende esimesel kuulmisel nad küll ei mõista, nagu ka olemasolevate sõnade kasutamist uues tähenduses, küll aga mõistavad nad teadaolevaid sõnu nende teadaolevates tähendustes inimestest täpsemini ja kiiremini. Masinate keelte suur eelis on nende ülemaailmne standardsus. Kuskil ei ole mingeid keelebarjääre, sest isegi kui on kasutatud omavahel ühildumatuid keeli, on tõlkimine nende keelte ühemõttelisuse tõttu kergesti teostatav.

Inimeste suhtluse toimimine ilma koodi eelneva kokkuleppimiseta on nii intuitsioonivastane, et mõned keeleteadlased on eelistanud uskuda, nagu õppimist ei toimukski, vaid nii keel kui ka tähendused oleksid valmiskujul kaasa sündinud või asuksid muul viisil kuskil abstraktses ruumis väljaspool inimest. Tänapäeval on psühholingvistid siiski näidanud, et emakeelt õpib inimene kogu elu, sealhulgas täiustades oma võimet teha järjest peenemaid tähenduseristusi. Pidev õppimine, st pidev seosetugevuste ümberarvutamine sisendi põhjal, ongi tema olemise viis. Isegi inimese kognitiivsete võimete järsk langus 60ndate eluaastate keskel ei tarvitse olla mitte kinnitus pensioniea määramise täpsuse kohta, vaid vastupidi – just pensioneerumine võib selle languse põhjustada. Keelelise sisendi vaesestumine koju jäädes jätab aju ilma sellest tegevusest, milleks ta mõeldud on, ja aju väga kohanemisvõimelise organina reageeribki vastavalt.

Siit aga jõuame võimalike muutusteni, mida võiks tehnika areng põhjustada ühiskonnas, täpsemalt selle liikmete suhtlusmustrites. Ühest küljest suhtlevad praegused tehissüsteemid täiesti teistmoodi kui inimesed, kusjuures pole üldse võimatu, et nende edasinegi areng toimub mingis muus suunas kui meie suhtlusviisile lähenemine. Teisest küljest on just inimene väga osav kaasvestlejaga arvestamisel ja tema suhtlusviisiga kohanemisel.

Kas võib juhtuda, et nutikate kodu- jm abiliste laiem levik toob kaasa inimeste kohanemise masinlikuma suhtlusstiiliga? Esimesed Siri, Alexa ja Google Now taoliste süsteemide kasutajauuringud tõepoolest kinnitavad seda. Kes on otsustanud sellise süsteemi kasutusele võtta ning pole plaanist pärast esimesi ebaõnnestunud suhtluskatseid loobunud, hakkavad oma kasutatavale süsteemile suunatud ütlusi optimeerima vastavalt tolle omapäradele. Sama on ehk igaüks kogenud otsimootoritele oma otsinguid sõnastades – on ju needki mingis mõttes tehisintellektisüsteemid. Kui lapsele nädalavahetuseks meelelahutust välja mõeldes oleks vanasti infotelefonilt küsinud „Öelge palun, kas kuskil Tallinna lähedal saaks rentida laste krossimootorratast?“, siis nüüd toksime otsingusse midagi stiilis „tsikkel rent kross laste tallinn“. Üks põhjus on oletus, et märksõnade loend töötab täislausest paremini, teine on puhas mugavus ehk väljendusele kuluva jõupingutuse kokkuhoid.

Kolmas niisugust optimeerimist võimaldav asjaolu on aga oletus, et otsimootoril ega veidi keerukamatelgi praegustel tehissüsteemidel pole eneseteadvust ega tundeid, mistõttu nad kohe kindlasti ei solvu viisakusväljendite puudumise peale. Või kui solvuvadki, siis on nad programmeeritud või treenitud seda solvumist mitte välja näitama, mistõttu viisakuse ignoreerimine nendega suhtlemisel peaks kasutaja jaoks olema üsna ohutu, ja seda süstemaatiliselt ka tehakse.

Kas võib koguni juhtuda, et inimesed kannavad masinatega suhtlemisel avastatud kokkuhoiuvõimalused üle suhtlemisse teiste inimestega? Ikka võib. Väga kerge on see juhtuma olukordades, kus kõneleja näiteks klienditeenindusse helistades ei tea, kas kuulaja on inimene või masin. Nagu aga näha võrgusuhtluse konventsioonide (lühendid, emotikonid, muutunud kirjavahemärgikasutus jt) levikust üldkeelde, ei saa üldse välistada masinlikuma suhtluse levimist vähemalt mingil määral ka nendesse olukordadesse, kus liini teises otsas on teadaolevalt teine inimene.

Omaette teema väikese kõnelejaskonnaga keelte jaoks on masinatega suhtlemiseks kasutatava keele valik. Üks inglise keele kasvava mõju pärast muretsemisel mainitud hirmustsenaariume on see, et eesti keel taandub köögikeeleks. Ei taandu ta midagi, kui köögimasinad selleks ajaks eesti keelt ei oska, kui nende häälega juhtimine üleüldiseks saab. Eestis on see vajadus vägagi teadvustatud ja keeletehnoloogiasse investeeritavate ressursside otsustamisel arvesse võetud, aga mõne vähem arenenud keeletehnoloogilise toega keele kõnelejatel võib just köök osutuda esimeseks kohaks, kus kohtutakse ülemaailmse standardimisega ehk vajadusega kasutada mõnd edukamat keelt.

Leia veel huvitavat lugemist

Täheke
Õpetajate leht
Muusika
Kunstel
Akadeemia
Keel ja kirjandus
LR
Looming
Hea laps
Värske Rõhk
Sirp
Müürileht
TeMuKi