sunnuntai 11. helmikuuta 2018

Matikkatuhoaseet

Cathy O'Neil, Matikkatuhoaseet: Miten suuraineisto lisää eriarvoisuutta ja uhkaa demokratiaa. Englanninkielisestä alkuteoksesta Weapons of Math Destruction (2016) suomentanut Kimmo Pietiläinen. Terra Cognita, Helsinki, 2017.

Jotkut puhuvat kuhnilaisesta paradigmamuutoksesta, joka on käynnissä tieteissä. Digitaalinen taltiointi mahdollistaa suurien aineistojen kokoamisen ja yhdistelyn. Niinpä tilastollinen päättely on hiipimässä työkalujen joukkoon aloille, kuten tulkintatieteisiin, joissa on perinteisesti käytetty pääasiassa muita menetelmiä. 

Tietoja myös kerätään aikaisempaa aggressiivisemmin asiakkaista, työntekijöistä, kuluttajista ja kansalaisista. Esimerkiksi terveystietojen keskittämistä ja yhdistämistä perustellaan hoidon tehostamisella. Lainsäädäntö näiden osalta on liikkunut verkkaisesti; kesällä astuu voimaan EU:n uusi tietosuoja-asetus, jonka pitäisi parantaa kansalaisten asemaa suhteessa rekistereiden pitäjiin niin, että esimerkiksi päättäjien tai virkamiesten horjahdus ei (välttämättä) johda kaikkien tietojen päätymiseen yksityisiin käsiin (automaattisesti). Kun tiedon arvo nousee, kiusaus sen myymiseen kasvaa.

Yhdysvaltalainen matemaatikko Cathy O'Neil tarkastelee kirjassaan Matikkatuhoaseet (2017) tapoja, joilla suuraineistot (engl. big data) haittaavat ihmisten elämää ja heikentävät heidän välistään tasaveroisuutta. Hän on itse kehittynyt yliopistotutkijasta hedge-rahaston hoitajaksi ja edelleen suuraineiston vaaroista luennoivaksi maallikkosaarnaajaksi ja aktivistiksi.

Kaikki mallintaminen ei tietenkään ole pahasta, mutta jos mallinnuksen kohteet eivät tiedä, mihin kerättyä dataa käytetään, jos mallintamista käytetään sen kohteen etujen vastaisesti ja jos mallintaminen skaalautuu kattamaan laajoja joukkoja, puhutaan ”matikkatuhoaseista”. Se on kömpelö suomennos ontuvasta englanninkielisestä ilmaisusta ”weapon of math destruction”, joka on joukkotuhoaseeseen nojaava sanaleikki (”weapon of mass destruction”). Aseet suunnitellaan tiettyä tarkoitusta, tuhoamista, varten, mutta O'Neilin matikkatuhoaseissa tuho on toissijainen seuraus. Kirjan sinänsä tärkeä sanoma kompastelee huonosti valitun sanaleikin vuoksi.

Vallitsevan ideologian mukaan kaikki kilpailu on aina hyvästä. Kun 1980-luvun alkupuolella yhdysvaltalainen sanomalehti U.S. News julkaisi yliopistojen paremmuusjärjestyksen, se tuli samalla laukaisseeksi yliopistojen välisen kilpailun parhaista opettajista, parhaista oppilaista ja rahoituksesta. Lehden käyttämä mitta oli toimittajien hihasta vetämä, ja vaikka sitä on sittemmin muutettu, on se pakottanut yliopistot keskittymään niihin asioihin, joita mitataan.

Yliopistoja ei kuitenkaan pisteytetä suhteessa kustannuksiin niin, että halpa (x dollaria per piste) yliopisto voisi kiilata kärkisijoille. Lukukausimaksut ovat nousseet kilpailun seurauksena rajusti (viisinkertaistuneet välillä 1983-2013), koska opiskelijoille pitää rakentaa upeita asuntoloita ja kiipeilykeskuksia viihtyisyyden parantamiseksi. Pisteytys ohjaa O'Neilin mukaan keskittymään epäoleellisiin asioihin. Nousevat kustannukset kasvattavat opiskelijoiden velkataakkaa. 

Samanlainen pisteytys on käytössä joillain työpaikoilla. Esimerkiksi opettajien tehokkuutta mitataan oppimistuloksien kautta: oppilailla on jatkuvasti kokeita, ja heikosti pärjäävät opettajat potkitaan pihalle, mutta huoli heikkenevistä koulutuloksista perustuu vuonna 1983 julkaistun raportin tilastolliseen päättelyvirheeseen. Oppilaiden oppimista pisteytetään heistä tehtyä ennustetta vasten, ja tulokset heittelevät rajusti lukukaudesta toiseen. Yliopistojen tapaan opettajatkaan eivät voi valittaa pisteytyksestä. Myyjien keskenäisen kilpailun on pitkään tiedetty katkaisevan tiedonvaihdon yrityksen sisällä.

Kilpailun ohella korvikemuuttujien käyttäminen tuottaa epäreiluja ja sekä yksilön että kokonaisuuden kannalta ikäviä seurauksia. Esimerkiksi parempien tietojen puutteessa työnhakijoita arvioidaan luottotietojen tai asuinpaikan perusteella, mikä vahvistaa syrjäytymistä ja onnettomuuksien vaikutusta. Ihmisellä on näin heikommat mahdollisuudet parantaa asemaansa. Yhdysvalloissa autovakuutuksen hinnoittelua ohjaavat luottotiedot enemmän kuin onnettomuushistoria. Kun poliisit keskittävät voimiaan sinne, missä tilastollisesti häiriköidään eniten, eli köyhemmille alueille, he synnyttävät takaisinkytkennän, jossa heikoimmassa asemassa olevat saavat merkintöjä rekisteriin mitättömistä rikkeistä. Luulen, että jotkin verkkopalvelut kyselevät postinumeroa juuri tästä syystä: yhdistämällä sen asuntojen hintatietoihin voidaan arvioida käyttäjän varallisuutta ja tehdä siten kohdennettua markkinointia — tai myydä tiedot eteenpäin.

Jos internetissä oleva palvelu on ilmainen, käyttäjät ovat tuote. Yhteisösivustojen erilaisten pelien ja kyselyiden (esim. ”Mikä Star Wars -hahmo olet?") tarkoitus on kerätä yhteys- ja profiilitietoja niiden eteenpäin myymikseksi. The Guardian kertoi jokin aika sitten, etteivät internet-firmojen johtajat käytä itse omia palveluitaan. Palvelut on lisäksi suunniteltu addiktoiviksi eli tästä syystä pelkoa ja vihaa lietsoviksi ympäristöiksi. Niiden sisäinen päätöksenteko, esim. mitä viestejä tai mainoksia näytetään milloinkin, on niin monimutkaista, ettei edes jälkikäteen pystytä sanomaan, miksi mitäkin tapahtui. Sivustot, kuten Facebook, voivat polarisoida äänestäjät ja heiluttaa vaalien tulosta, kuten on nähty.

(Sivumennen sanoen, hieman samaan aiheeseen liittyy Yliopisto-lehdessä (1/2018) julkaistu juttu kirjallisuudentutkija Maria Mäkelän johtamasta Kertomuksen vaarat -hankkeesta. Se tutkii, miten käsityksemme todellisuudesta kehittyy kokemuspuheen ja kertomuksellistamisen kautta. Uudenlainen ansaintalogiikka ohjaa uutisoinnissakin tietynlaisiin kertomuksiin esimerkiksi hyvinvointivaltiosta:  kertomukseen nojaavassa uutisessa yksilön kokemus (”Kela pilasi ylioppilasjuhlat”) nousee kuvaamaan pääsääntöisesti hyvin toimivaa järjestelmää ja mahdollisesti rapauttaa luottamusta siihen.)

Byrokratia etäännyttää ihmisen muita koskevista päätöksistä. Algoritmi on tunteeton ja kohtelee kaikkia sisäisen ohjeistuksensa mukaisesti, joten se on lahjomaton, väsymätön ja ainakin periaatteessa halpa. O'Neil toteaa, että päätöksentekijänä ihminen kuitenkin korjaa käytöstään saadessaan uutta tietoa. Ihmiseltä voi vaatia perusteluita. Algoritmit voivat olla mustia laatikoita, joita harva, jos kukaan, ymmärtää. Niiden päätöksistä on vaikea valittaa, ja niitä on vaikea muuttaa.

O'Neilin esimerkit ovat Yhdysvalloista. Niiden menetelmät ovat kovin karkeita, enkä ole kuullut aivan vastaavista tapauksista ainakaan Suomessa. Toki päättäjiltä, järjestelmien tekijöiltä, tilaajilta ja käyttäjiltä vaaditaan erityistä moraalista valppautta. Hyvän liiketoiminnan tielle on joissain tapauksissa hyvä kasata esteitä, jos tuo moraalinen valppaus on sattunut jäämään taka-alalle.

Suomentaja Kimmo Pietiläinen pitää suomennettua tietokirjallisuutta ajattelun edellytyksenä. Vaikka asia ei ole aivan yksioikoinen, ajankohtaisten tietokirjojen suomentaminen on kulttuuriteko, johon muut kustantamot ovat tarttuneet hieman hitaammin. Suomennos toimii kuitenkin jossain määrin ylevää tarkoitustaan vastaan, kun sen alta paistavat alkukieliset ilmaukset ja lauserakenteet kuin pohjamaali kevyesti maalatusta seinästä. Joissain kohdin sanavalinnat ovat huolimattomia (esim. ”säätely” ”sääntelyn” sijaan), toisissa huonoa suomea (”kohtuuttoman rivoja summia”). Toistuvina nämä alkavat häiritä lukukokemusta (ja näin sanoessani yksilön kokemukset alkavat vaikuttaa käsityksiin suomennoksista).

6 kommenttia:

  1. Digitalisaatio, Big Data, GDPR ja AI. Ne on kovaa tulossa ja varsinkin jälkimmäinen tuo valtavia haasteita suomalaisille yrityksille. Eräs yhteistyökumppanimme kiteytti koko tilanteen hyvin: "Information is new oil". Eikä muuten tarvitse paljoa googlettaa aiheesta kun huomaa että ehkä olisi aika luopua internet-yhteydestä, älypuhelimesta ja kauppojen bonuskorteista. :)

    VastaaPoista
    Vastaukset
    1. Öljyn valjastaminen muutti yhteiskuntaa (so. kasvatti erikoistumista) rajusti. Jos informaatio yltää samaan, joudutaan aika moni asia miettimään vähän uusiksi. En ole ihan niellyt puheita loistokkaasta tulevaisuudesta (paitsi tietysti joillekuille): informaatio liikkuu verkossa, ja verkko rakenteensa vuoksi palkitsee epätasaisesti. Mutta minä olenkin historiaharrastuksen rampauttama kyynikko. :-)

      Poista
  2. On aivan käsittämätöntä että Pietiläinen on jatkanut suomennuksiaan samalla tasolla jo kolmannella vuosikymmenellä. Olisi odottanut että tässä ajassa joko oppisi, palkkaisi jonkun joka osaa tai jostain löytyisi kilpailija...

    VastaaPoista
    Vastaukset
    1. Terra Cognitalla on muitakin kääntäjiä, mm. joidenkin luonnontieteen klassikoiden kohdalla Anto Leikola, mutta kyllä rekeä kiskoo edelleen Kimmo Pietiläinen.

      Poista
  3. Vähän nurinkurista syyttää Pietiläistä, että hän sentään yrittää tuoda suomeksi luonnontiedettä ja historiaa popularisoivia teoksia.

    Ei kai ole Pietiläisen syytä, että isot kustantajat eivät tätä tehtävää hoida. Ja jos kustannusrakenne on se, ettei kaupaksi menevillä kappaleilla kustanneta ulkopuolisen suomentajan työpanosta, ei siitäkään oikein voi Pietiläistä syyttää.

    Eikö pitäisi syyttää lukijoita - suomalaisia jotka katselevat Putouksia ynnä realitysarjoja eivätkä lue?

    Välillä kuulee väitteen että ne jotka haluavat lukea, lukevat englanniksi, alkukielellä yleensä.

    Kuinkakohan monta heitä on? Kolme vai?

    Niin kuin tuossa todetaan: markkinat ovat avoimet, miksei kukaan ryhdy samaan? Ehkä juuri siksi ettei se "kannata"!

    VastaaPoista
    Vastaukset
    1. Suomennettujen tietokirjojen markkina on varmasti vaikea, eikä ilman käännösapurahaa ammattikääntäjää ole varaa palkata.

      Kielitaidosta on se kiusallinen seuraus, että lukijat todellakin lukevat alkukielisiä teoksia (tunnen tässä kohdin pistoksen). Tosin Matti Klingen mukaan englannin osaaminen ei ole vielä kielitaitoa; pitäisi osata ranskaa, saksaa tai espanjaa, mieluiten tietysti kaikkia.

      Poista