Cathy O'Neil,
Matikkatuhoaseet: Miten suuraineisto lisää eriarvoisuutta ja uhkaa demokratiaa. Englanninkielisestä alkuteoksesta
Weapons of Math Destruction (2016) suomentanut Kimmo Pietiläinen. Terra Cognita, Helsinki, 2017.
Jotkut puhuvat kuhnilaisesta paradigmamuutoksesta, joka on käynnissä tieteissä. Digitaalinen taltiointi mahdollistaa suurien aineistojen kokoamisen ja yhdistelyn. Niinpä tilastollinen päättely on hiipimässä työkalujen joukkoon aloille, kuten tulkintatieteisiin, joissa on perinteisesti käytetty pääasiassa muita menetelmiä.
Tietoja myös kerätään aikaisempaa aggressiivisemmin asiakkaista, työntekijöistä, kuluttajista ja kansalaisista. Esimerkiksi terveystietojen keskittämistä ja yhdistämistä perustellaan hoidon tehostamisella. Lainsäädäntö näiden osalta on liikkunut verkkaisesti; kesällä astuu voimaan EU:n uusi tietosuoja-asetus, jonka pitäisi parantaa kansalaisten asemaa suhteessa rekistereiden pitäjiin niin, että esimerkiksi päättäjien tai virkamiesten horjahdus ei (välttämättä) johda kaikkien tietojen päätymiseen yksityisiin käsiin (automaattisesti). Kun tiedon arvo nousee, kiusaus sen myymiseen kasvaa.
Yhdysvaltalainen matemaatikko
Cathy O'Neil tarkastelee kirjassaan
Matikkatuhoaseet (2017) tapoja, joilla suuraineistot (engl. big data) haittaavat ihmisten elämää ja heikentävät heidän välistään tasaveroisuutta. Hän on itse kehittynyt yliopistotutkijasta hedge-rahaston hoitajaksi ja edelleen suuraineiston vaaroista luennoivaksi maallikkosaarnaajaksi ja aktivistiksi.
Kaikki mallintaminen ei tietenkään ole pahasta, mutta jos mallinnuksen
kohteet eivät tiedä, mihin kerättyä dataa käytetään, jos mallintamista käytetään sen kohteen etujen vastaisesti ja jos mallintaminen skaalautuu kattamaan
laajoja joukkoja, puhutaan ”matikkatuhoaseista”. Se on kömpelö suomennos ontuvasta englanninkielisestä ilmaisusta ”weapon of math destruction”, joka on joukkotuhoaseeseen nojaava sanaleikki (”weapon of mass destruction”). Aseet suunnitellaan tiettyä tarkoitusta, tuhoamista, varten, mutta O'Neilin matikkatuhoaseissa tuho on toissijainen seuraus. Kirjan sinänsä tärkeä sanoma kompastelee huonosti valitun sanaleikin vuoksi.
Vallitsevan ideologian mukaan kaikki kilpailu on aina hyvästä. Kun 1980-luvun alkupuolella yhdysvaltalainen sanomalehti
U.S. News julkaisi yliopistojen paremmuusjärjestyksen, se tuli samalla laukaisseeksi yliopistojen välisen kilpailun parhaista opettajista, parhaista oppilaista ja rahoituksesta. Lehden käyttämä mitta oli toimittajien hihasta vetämä, ja vaikka sitä on sittemmin muutettu, on se pakottanut yliopistot keskittymään niihin asioihin, joita mitataan.
Yliopistoja ei kuitenkaan pisteytetä suhteessa kustannuksiin niin, että halpa (
x dollaria per piste) yliopisto voisi kiilata kärkisijoille. Lukukausimaksut ovat nousseet kilpailun seurauksena rajusti (viisinkertaistuneet välillä 1983-2013), koska opiskelijoille pitää rakentaa upeita asuntoloita ja kiipeilykeskuksia viihtyisyyden parantamiseksi. Pisteytys ohjaa O'Neilin mukaan keskittymään epäoleellisiin asioihin. Nousevat kustannukset kasvattavat opiskelijoiden velkataakkaa.
Samanlainen pisteytys on käytössä joillain työpaikoilla. Esimerkiksi opettajien tehokkuutta mitataan oppimistuloksien kautta: oppilailla on jatkuvasti kokeita, ja heikosti pärjäävät opettajat potkitaan pihalle, mutta huoli heikkenevistä koulutuloksista perustuu vuonna 1983 julkaistun raportin tilastolliseen päättelyvirheeseen. Oppilaiden oppimista pisteytetään heistä tehtyä ennustetta vasten, ja tulokset heittelevät rajusti lukukaudesta toiseen. Yliopistojen tapaan opettajatkaan eivät voi valittaa pisteytyksestä. Yrityksissä on kokemuksia, että myyjien keskenäinen kilpailu katkaisee tiedonvaihdon. Sitä pelataan, mitä mitataan.
Kilpailun ohella
korvikemuuttujien käyttäminen tuottaa epäreiluja ja sekä yksilön että kokonaisuuden kannalta ikäviä seurauksia. Esimerkiksi parempien tietojen puutteessa työnhakijoita arvioidaan luottotietojen tai asuinpaikan perusteella, mikä vahvistaa syrjäytymistä ja onnettomuuksien vaikutusta. Ihmisellä on näin heikommat mahdollisuudet parantaa asemaansa. Yhdysvalloissa autovakuutuksen hinnoittelua ohjaavat luottotiedot enemmän kuin onnettomuushistoria. Kun poliisit keskittävät voimiaan sinne, missä tilastollisesti häiriköidään eniten, eli köyhemmille alueille, he synnyttävät takaisinkytkennän, jossa heikoimmassa asemassa olevat saavat merkintöjä rekisteriin mitättömistä rikkeistä. Luulen, että jotkin verkkopalvelut kyselevät postinumeroa juuri tästä syystä: yhdistämällä sen asuntojen hintatietoihin voidaan arvioida käyttäjän varallisuutta ja tehdä siten kohdennettua markkinointia — tai myydä tiedot eteenpäin.
Jos internetissä oleva palvelu on ilmainen, käyttäjät ovat tuote. Yhteisösivustojen erilaisten pelien ja kyselyiden (esim. ”Mikä Star Wars -hahmo olet?") tarkoitus on kerätä yhteys- ja profiilitietoja niiden eteenpäin myymikseksi.
The Guardian kertoi jokin aika sitten, etteivät internet-firmojen
johtajat käytä itse omia palveluitaan. Palvelut on lisäksi suunniteltu addiktoiviksi eli tästä syystä pelkoa ja vihaa lietsoviksi ympäristöiksi. Niiden sisäinen päätöksenteko, esim. mitä viestejä tai mainoksia näytetään milloinkin, on niin monimutkaista, ettei edes jälkikäteen pystytä sanomaan, miksi mitäkin tapahtui. Sivustot, kuten Facebook, voivat polarisoida äänestäjät ja heiluttaa vaalien tulosta, kuten on nähty.
(Sivumennen sanoen, hieman samaan aiheeseen liittyy
Yliopisto-lehdessä
(1/2018) julkaistu juttu kirjallisuudentutkija
Maria Mäkelän johtamasta
Kertomuksen vaarat
-hankkeesta. Se tutkii, miten käsityksemme todellisuudesta kehittyy kokemuspuheen ja kertomuksellistamisen kautta. Uudenlainen
ansaintalogiikka ohjaa uutisoinnissakin tietynlaisiin kertomuksiin esimerkiksi hyvinvointivaltiosta: kertomukseen nojaavassa uutisessa yksilön kokemus (”Kela pilasi
ylioppilasjuhlat”) nousee kuvaamaan pääsääntöisesti hyvin toimivaa
järjestelmää ja mahdollisesti rapauttaa luottamusta siihen.)
Byrokratia etäännyttää ihmisen muita koskevista päätöksistä. Algoritmi on tunteeton ja kohtelee kaikkia sisäisen ohjeistuksensa mukaisesti, joten se on lahjomaton, väsymätön ja ainakin periaatteessa halpa. O'Neil toteaa, että päätöksentekijänä ihminen kuitenkin korjaa käytöstään saadessaan uutta tietoa. Ihmiseltä voi vaatia perusteluita. Algoritmit voivat olla mustia laatikoita, joita harva, jos kukaan, ymmärtää. Niiden päätöksistä on vaikea valittaa, ja niitä on vaikea muuttaa.
O'Neilin esimerkit ovat Yhdysvalloista. Niiden menetelmät ovat kovin
karkeita, enkä ole kuullut aivan vastaavista tapauksista ainakaan
Suomessa. Toki päättäjiltä, järjestelmien tekijöiltä, tilaajilta ja
käyttäjiltä vaaditaan erityistä moraalista valppautta. Hyvän
liiketoiminnan tielle on joissain tapauksissa hyvä kasata esteitä, jos tuo moraalinen valppaus on sattunut jäämään taka-alalle.
Suomentaja
Kimmo Pietiläinen pitää suomennettua tietokirjallisuutta ajattelun edellytyksenä. Vaikka asia ei ole aivan yksioikoinen, ajankohtaisten tietokirjojen suomentaminen on kulttuuriteko, johon muut kustantamot ovat tarttuneet hieman hitaammin. Suomennos toimii kuitenkin jossain määrin ylevää tarkoitustaan vastaan, kun sen alta paistavat alkukieliset ilmaukset ja lauserakenteet kuin pohjamaali kevyesti maalatusta seinästä. Joissain kohdin sanavalinnat ovat huolimattomia (esim. ”säätely” ”sääntelyn” sijaan), toisissa huonoa suomea (”kohtuuttoman rivoja summia”). Toistuvina nämä alkavat häiritä lukukokemusta (ja näin sanoessani yksilön kokemukset alkavat vaikuttaa käsityksiin suomennoksista).