Deepfake – toden tuolla puolen

Nikolai Ylirotu
”Ymmärryksesi on kuin toistamasi mielikuvat. Mielikuvat näet värjäävät sielun.” – Marcus Aurelius
Syyskuussa CNBC:n haastattelussa University of Southern Californian virkaa tekevä professori Hao Li varoitti siitä, että vuoden sisällä uskottavien ja realististen deepfake-videoiden – eli synteettisten videoiden, jossa kuka tahansa voidaan laittaa tekemään mitä tahansa, – tuottaminen on jokaisen ulottuvilla. Erityisesti ohjelmistojen käytettävyyden kehittyminen avaa tämän uuden ja huolestuttavan teknologianalan jokaiselle.
Nykyisellään deepfake-videot ovat vielä erotettavissa paljaalla silmällä, kuten oli havaittavissa alla olevassa YLE:n esimerkissä Sauli Niinistöstä (linkki): 3D:llä tehdyt kasvot ja imitaattorilla toteutettu puhe eivät toimineet täysin uskottavasti. Tulevaisuudessa laadun edelleen kasvaessa ja realismin lisääntyessä joudumme vielä tilanteeseen, jossa tarkastelua ei enää voida tehdä ihmissilmin, vaan se täytyy antaa tietokoneiden tehtäväksi.
Vaikka suhtautuisimme varovaisestikin Hao Lin arvioon, olemme menossa vääjäämättä kohti aikakautta, jolloin synteettinen video, deepfake, on voimakas työkalu informaatiovaikuttamisessa.
Mielipidevaikuttaminen ajan medioilla
Ihmisten tunteisiin, mielikuviin ja ennakkoluuloihin on pyritty vaikuttamaan aina. Niin ulko- kuin sisäpolitiikassa. Niin rauhan kuin sodan aikana.
Ennen sähköisiä medioita kuvalla oli suurin voima. Muistamme amerikkalaiset ja englantilaiset julisteet, joissa vastustaja, saksalaiset, kuvattiin epäinhimillisenä olentona, jonka tehtävänä oli tuhota kulttuurimme ja yhteiskuntamme heikoimmat, eli naiset ja lapset. Iskettiin siihen, mikä yhteiskunnassa oli pyhää.

Amerikkalainen rekrytointijuliste
Julistetaiteen jälkeen otettiin käyttöön valokuva. Valokuvan todistusvoima oli suuri, koska sen katsottiin olevan osa todellisuutta tallentuneen todellisuuden kautta. Toisen maailmansodan aikaan erityisesti Neuvostoliitossa käytettiin tätä vallan välineenä: poistamalla kuvista epämiellyttävät hahmot poistettiin heidät myös olemasta.

Komissaarion katoaminen
Toinen käyttökohde oli todellisuuden muovaaminen neuvostokansan eetosta palvelevaksi. Muistamme kuvan, jossa Saksan valtiopäivätalon katolla lippua heiluttaa neuvostosotilas. Vähemmän tunnetussa, alkuperäisessä kuvassa, sotilaan kädessä oli useita saksalaisilta sotilailta kerättyjä kelloja.

Sotilas valtiopäivän katolla
Valokuvasta 3D-tekniikkaan
Valokuvan todistusarvo murtui entisestään kuvan ja kuvankäsittelyn tultua sähköiseksi. Kuka tahansa pystyi muokkaamaan valokuvaa muuttamalla kuvan sisältöä, yhdistämällä useita kuvia yhteen tai poistamalla siitä osia kuvasta huomaamattomasti.

3D-tekniikalla tehdyt kasvot. Kasvot koostuvat kolmioista, joiden jokaisen kulmapisteen paikka on tallennettu xyz -koordinaatistoon.
Oman sykäyksensä antoi 3D-tekniikan kehittyminen. Ohjelmistolla voitiin luoda avaruudellinen kappale ja antaa sille pintamateriaali. Kun tiedettiin, missä tässä synteettisessä maailmassa olivat valonlähteet ja kappaleet, voitiin laskea täysin synteettinen kuva, jota ei enää pystynyt erottamaan todellisesta maailmasta otetusta kuvasta.
3D-tekniikasta deepfake-videoihin
3D-tekniikka tuli osaksi arkipäiväämme peli- ja elokuvateollisuuden kautta. Suuret palvelinfarmit laskivat yksittäisiä kuvia, joita peräkkäin esittämällä syntyi elävää kuvaa.
Lastenelokuvassa Toystory saattoi yhtä kuvaa olla laskemassa jopa 256 tietokonetta. Yksittäisen kuvan laskemisaika saatiin yhteislaskennalla niin lyhyeksi, että parin tunnin elokuvan laskettaminen oli mahdollista. Yksittäisiä kuvia yhteen tuntiin menee 90 000 kappaletta, ja jokaisen kuvan laskenta kestää minuuteista tunteihin.
Elokuvateollisuuden myötä 3D-tekniikka on kehittynyt Toystoryn melko yksinkertaisesta jäljestä suurin harppauksin eteenpäin yhä monimutkaisempaan. Iho ei ole enää yksittäisen hahmon pinta vaan useammasta kerroksesta koostuva kokonaisuus, jossa jokaisella kerroksella on oma värinsä ja läpinäkyvyytensä. Kasvot eivät ole enää pelkkä kuori, vaan 3D-mallin ihon alla ovat lihakset ja luut, jotka käyttäytyvät todellisen maailman esikuvansa mukaan. 3D-mallin puhuessa suu ja kieli käyttäytyvät esikuvansa mukaisesti, mikä vaikuttaa myös 3D-mallin ääneen.
Tämä kaikki loi pohjan teknologialle, jossa muutamasta kuvasta voidaan tuottaa 3D-malli, joka edelleen voidaan istuttaa olemassa olevaan videofilmiin. Esimerkiksi 3D-mallinnettu pää, joka korvaa videolla olevan todellisen pään ja käyttäytyy kuten oikea, todellinen, esikuvansa.
Miten deepfake toimii?
Termi on yhdistelmä sanoista deep learning ja fake. Deep learning tulee käytettävän teknologian, neuroverkkojen, kyvystä oppia ja fake tuotetun videon keinotekoisuudesta, synteettisyydestä.
Deepfake on yhdistelmä neuroverkkoja, tekoälyä, 3D-mallinnusta ja pohjana toimivaa oikeaa videokuvaa. Oikeaa videokuvaa tarvitaan, jotta videon tausta ja ympäristö olisivat mahdollisimman todenmukaiset. Toisaalta videokuvaa tarvitaan myös laskenta-ajan säästämiseksi. Miksi mallintaa ostoskeskus taustalle, kun se on jo videolla?

Kasvot.
Ensimmäisen kerran tekniikka tuli julkisuuteen joulukuussa 2017, jolloin julkisuuden henkilöiden kasvot liitettiin aikuisviihteen tähteen muutaman valokuvan pohjalta luoduista kasvoista.
Tekninen pohja
Deepfake-videoita tuotetaan järjestelmällä, joka koostuu kahdesta tekoälypohjaisesta osasta. Videota tuottavaa osaa kutsutaan termillä generator ja toista, tuotettua videota arvioivaa, kutsutaan termillä discriminator. Käytän näistä jatkossa termejä Tuottaja ja Arvioija.
Arvioija määrittelee, onko video annetuissa laatumääritteissä, dataset. Mikäli poikkeamia esiintyy, Arvioija antaa ohjeet Tuottajalle seuraavaa tuotettavaa osiota varten. Kyseessä on siis virheistään oppiva järjestelmä, jonka tuotteiden laatu paranee tuotettujen videoiden myötä.
Tällä tavalla yhdessä toimivaa kahden neuroverkon järjestelmää kutsutaan nimellä GAN eli Generative Adversarial Network. Kaksi neuroverkkoa, joista toinen luo uutta ja toinen arvioi tulosta annettuun datasetiin, vaatimusmääritteisiin, onko laatu riittävä vai täytyykö sitä korjata.
Tämän järjestelyn vahvuus on mahdollisuus kehittymiseen ja oppimiseen. Kun tulokset alkavat parantua, myös videoiden tarkistus kehittyy. Aikaa myöden tulokset ovat sellaisia, että ihmisen on vaikea erottaa tuotettua synteettistä videota oikeasta.
Aikaisemmilla tekniikoilla videoiden muokkaaminen on ollut rajallista ja se on vaatinut kokenutta ja osaavaa väkeä niiden tekemiseen. Koska deepfake-videot tuotetaan tekoälyyn pohjautuvilla itseoppivilla järjestelmillä ja tekniikoilla, niitä voidaan jatkossa tuottaa yhä enemmän ja helpommin.
Kehitys avaa huolestuttavia näkymiä. Tuotannon helpottuessa ja tullessa myös harrastajien tavoitettavaksi käyttö laajenee voimakkaasti. Vastapuolen poliitikon häväistysvideon tuottamiseen ei tarvita enää koulutettuja ammattilaisia ja taiteilijoita.
Yhteiskunnalliset vaikutukset
Elämme aikaa, jossa mielikuvilla ja ensivaikutelmilla on yhä suurempi merkitys. Tähän on yhtenä syynä elinympäristön koettu monimutkaistuminen ja toisaalta lisääntynyt tarjonta vaihtoehtoisten medioiden kautta. Vaihtoehtoisten medioiden ensisijaisena tehtävänä on ollut ja tulee olemaan vastuullisen median vaikutusvallan tai uskottavuuden kaventaminen. Tämä ilmenee jo käytetystä kielestä eli siitä, miten vaihtoehtomediassa valtamediaa tai vastuullista mediaa kutsutaan eliitin mediaksi. Tavoitteena on luoda alati kasvava kuilu kansalaisten ja valtamedian välille.
Tähän mediailmastoon deepfake istuu hyvin. Kuvan ja erityisesti liikkuvan kuvan kautta luodaan mielikuvia, jotka vaikuttavat hyvinkin pitkän ajan päästä. Ehkä juuri silloin, kun ihminen äänestyskopissa miettimässä, kuka on hänen valintansa, kenelle hän antaa äänensä. Onko tarina oikein tai totta, sillä ei ole enää merkitystä. Tärkeintä on, miten se kansan kesken koetaan.
Keinoälytutkija Alex Champandard onkin huolissaan kehityksestä, ja hän korostaa sitä, miten internetin käyttäjille tulisi kertoa, miten nopeasti ja helposti disinformaatiota voidaan tuottaa. Hän myös korostaa sitä, miten ongelma ja sen vaikutukset ja ratkaisut eivät ole itse teknologiassa vaan hyvän journalismin tukemisessa ja tarjoamisessa suurelle yleisölle.
Pahimmassa tapauksessa olemme tilanteessa, jossa journalismin uskottavuus menetetään ja suuren yleisön kyky erottaa todellinen uutisointi häviää entisestään.
Vaikutukset lakiin
Deepfake-videolla on myös vaikutukset ihmisten oikeusturvaan. Joulukuussa 2017 tuli julki video, jossa näyttelijän pää oli istutettu toisen ihmisen pään tilalle. Video päätyi oikeuden käsittelyyn.
Ongelma oli asian uutuuden vuoksi se, ettei kyseistä rikosta ollut olemassa. Oikeus päätyi käsittelemään tapausta kunnianloukkauksen ja identiteettivarkauden käsitteistön kautta.
Ihmisten oikeusturvan lisäksi ongelmaksi tulee laki, joka ei osaa ottaa kantaa vahingollisten videoiden käyttöön, niiden tuottamiseen tai jakeluun.
Internetyhteisön reaktiot
Vaikka laki näyttää tulevan jälkijunassa, internetin suurimmat toimijat ovat jo ottaneet askeleita asian sääntelemiseksi.
Videoiden vaikuttavuuden vuoksi osa internetin some-palveluiden tarjoajista, kuten Twitter, on ilmoittanut poistavansa havaitun deepfake-materiaalin ja sulkevansa materiaalin lähettäjät pois palvelusta.
Verkkoalusta Discord on jo raportoinut sulkeneensa chat-kanavia, jotka jakoivat kuuluisuuksista tehtyjä pornovideoita. Myös yksi aikuisviihteen suurimpia jakelijoita, PornHub, on ilmoittanut huolensa vastaavan materiaalin käytöstä.
Google ilmoitti syyskuussa 2018 liittävänsä ”involuntary synthetic pornographic imagery” kieltolistalle ja sulkevansa sitä jakavia sivustoja pois hakutuloksista. Googlen myötä myös Facebook on ilmoittanut oman kielteisen kantansa videoiden levittämiseen.
Summa summarum
Aihe on uusi, eikä sen kaikkia vaikutuksia vielä osata ennakoida tai tunnistaa. Varmuudella voidaan kuitenkin sanoa, että tekniikan käyttöönoton kynnyksen mataloituessa ja laadun parantuessa yhteiskunta joutuu huomioimaan asian sekä nuorten koulutuksessa että lisäämällä disinformaatiota vastaan taistelevien yhteiskunnallisia toimijoiden resursseja.
Odotan mielenkiinnolla seuraavia presidentinvaaleja, niin Yhdysvaltojen kuin Suomenkin.
Kirjoittaja, AD & UID Nikolai Ylirotu on toiminut verkkoviestinnän parissa vuodesta 1993. Hän on ollut yrittäjänä ja opettajana mm. Taideteollisessa korkeakoulussa. Tällä hetkellä hän toimii myös Kadettikunnan webmasterina.
nikolai(at)ylirotu.fi