Kes ja miks kogub suurandmeid?

2019. aasta sügisel lahvatas Apple Cardi teenusega skandaal: registreerimisel väljastas see meestele ja naistele erinevad krediidilimiidid. Isegi Steve Wozniakil ei vedanud:

Aasta varem selgus, et Netflixi platvorm näitab kasutajatele erinevaid plakateid ja teasereid, olenevalt nende soost, vanusest ja rahvusest. Selle eest süüdistati teenistust rassismis.

Lõpuks noomitakse Mark Zuckerbergi regulaarselt selle eest, et Facebook on väidetavalt kogunud, müünud ja manipuleerinud oma kasutajate andmetega. Aastate jooksul on teda süüdistatud ja isegi proovitud Ameerika valimiste ajal manipuleerimises, Venemaa eriteenistuste abistamises, vaenu ja radikaalsete vaadete õhutamises, sobimatus reklaamis, kasutajaandmete lekitamises, pedofiilide vastu suunatud uurimiste takistamises.

Facebooki postitus zuckilt

Samal ajal avaldab veebiteenus Pornhub igal aastal aruandeid selle kohta, millist pornot otsivad erinevast rahvusest, soost ja vanusest inimesed. Ja millegipärast see kedagi ei häiri. Kuigi kõik need lood on sarnased: kõigis neist on tegemist suurandmetega, mida XNUMX sajandil kutsuti "uueks naftaks".

Mis on suurandmed

Suurandmed – need on ka suurandmed (ing. Big Data) ehk metaandmed – on andmete massiiv, mis saabub regulaarselt ja suurtes kogustes. Neid kogutakse, töödeldakse ja analüüsitakse, mille tulemuseks on selged mudelid ja mustrid.

Ilmekas näide on Large Hadron Collider'i andmed, mida tuleb pidevalt ja suurtes kogustes. Nende abiga lahendavad teadlased palju probleeme.

Kuid suurandmed veebis ei ole ainult teadusuuringute statistika. Nende abil saab jälgida, kuidas erinevatest rühmadest ja rahvustest kasutajad käituvad, millele nad tähelepanu pööravad ja kuidas sisuga suhtlevad. Mõnikord kogutakse selleks andmeid mitte ühest, vaid mitmest allikast, võrreldes ja tuvastades teatud mustreid.

Sellest, kui olulised on suurandmed võrgus, hakati rääkima siis, kui neid oli tõesti palju. 2020. aasta alguses oli maailmas 4,5 miljardit Interneti-kasutajat, kellest 3,8 miljardit oli registreeritud sotsiaalvõrgustikes.

Kellel on juurdepääs suurandmetele

Küsitluste järgi usuvad enam kui pooled meie riikidest, et nende võrgus olevaid andmeid kasutavad kolmandad osapooled. Samal ajal postitavad paljud sotsiaalvõrgustikesse ja rakendustesse isiklikku teavet, fotosid ja isegi telefoninumbrit.

Siin on vaja seda selgitada: esimene inimene on kasutaja ise, mis paigutab oma andmed mis tahes ressurssi või rakendust. Samas nõustub (teeb lepingusse linnukese) nende andmete töötlemisega teine osapool – st ressursi omanikud. Kolmas osapool on see, kellele ressursi omanikud saavad kasutajaandmeid edastada või müüa. Sageli on see kirjas kasutajalepingus, kuid mitte alati.

Kolmas osapool on valitsusasutused, häkkerid või ettevõtted, kes ostavad andmeid ärilistel eesmärkidel. Esimesed saavad andmeid kohtu või kõrgema asutuse otsusega. Häkkerid loomulikult mingeid õigusi ei kasuta – nad lihtsalt häkivad serverites salvestatud andmebaase. Ettevõtted saavad (seaduse järgi) andmetele juurde pääseda vaid siis, kui olete seda ise lubanud – märkides lepingu all oleva ruudu. Vastasel juhul on see ebaseaduslik.

Miks ettevõtted kasutavad suurandmeid?

Suurandmeid on kommertsvaldkonnas kasutatud aastakümneid, see lihtsalt ei olnud nii intensiivne kui praegu. Need on näiteks valvekaamerate salvestised, GPS-navigaatorite andmed või internetimaksed. Nüüd, sotsiaalvõrgustike, võrguteenuste ja rakenduste arenedes, saab seda kõike ühendada ja saada kõige täielikuma pildi: kus potentsiaalsed kliendid elavad, mida neile meeldib vaadata, kuhu nad puhkusele lähevad ja mis marki auto neil on.

Ülaltoodud näidetest on selge, et suurandmete abil soovivad ettevõtted ennekõike reklaame sihtida. See tähendab, et pakkuda tooteid, teenuseid või individuaalseid valikuid ainult õigele vaatajaskonnale ja isegi kohandada toodet konkreetse kasutaja jaoks. Lisaks muutub reklaam Facebookis ja teistel suurtel platvormidel järjest kallimaks ning selle näitamine kõigile järjest pole sugugi tulus.

Avatud allikatest pärinevat teavet potentsiaalsete klientide kohta kasutavad aktiivselt kindlustusseltsid, erakliinikud ja tööandjad. Esimesed võivad näiteks kindlustustingimusi muuta, kui näevad, et otsite sageli infot teatud haiguste või ravimite kohta ning tööandjad saavad hinnata, kas olete altid konfliktidele ja asotsiaalsele käitumisele.

Kuid on veel üks oluline ülesanne, mis viimastel aastatel on hädas olnud: jõuda kõige maksevõimelisema publiku lähedale. Seda pole nii lihtne teha, kuigi ülesannet hõlbustavad oluliselt makseteenused ja elektroonilised tšekid ühe OFD (fiscal data operator) kaudu. Võimalikult lähedale jõudmiseks püüavad ettevõtted potentsiaalseid kliente isegi lapsepõlvest jälitada ja “kasvatada”.: võrgumängude, interaktiivsete mänguasjade ja haridusteenuste kaudu.

Kuidas see toimib?

Suurimad võimalused andmete kogumiseks on globaalsetel ettevõtetel, kes omavad mitut teenust korraga. Facebookil on praegu üle 2,5 miljardi aktiivse kasutaja. Samal ajal omab ettevõte ka muid teenuseid: Instagram - üle 1 miljardi, WhatsApp - üle 2 miljardi ja teised.

Kuid Google'il on veelgi suurem mõju: Gmaili kasutab maailmas 1,5 miljardit inimest, Androidi mobiilioperaator veel 2,5 miljardit inimest ja YouTube enam kui 2 miljardit inimest. Ja see ei hõlma Google'i otsingut ja Google Mapsi rakendusi, Google Play poodi ja Chrome'i brauserit. Jääb üle oma internetipank kinnitada – ja Google saab sinu kohta sõna otseses mõttes kõike teada. Muide, Yandex on selles osas juba sammu võrra ees, kuid see hõlmab ainult venekeelset publikut.

???? Esiteks tunnevad ettevõtted huvi selle vastu, mida me sotsiaalvõrgustikesse postitame ja meeldib. Näiteks kui pank näeb, et oled abielus ja sulle meeldivad aktiivselt tüdrukud Instagramis või Tinderis, siis kiidad suurema tõenäosusega tarbimislaenu heaks. Ja pere hüpoteek on kadunud.

Samuti on oluline, millistel reklaamidel, kui sageli ja millise tulemusega klikid.

(Ie Järgmine samm on privaatsõnumid: need sisaldavad palju rohkem teavet. Sõnumid lekitati VKontakte'i, Facebooki, WhatsAppi ja teiste kiirsõnumite kaudu. Nende sõnul on muide lihtne jälgida geograafilist asukohta sõnumi saatmise hetkel. Kindlasti olete märganud: kui arutate kellegagi millegi ostmist või lihtsalt pitsa tellimist, ilmub voos kohe asjakohane reklaam.

🚕 Suurandmeid kasutavad ja “lekivad” aktiivselt kohaletoimetamise ja taksoteenused. Nad teavad, kus te elate ja töötate, mida armastate, milline on teie ligikaudne sissetulek. Uber näiteks näitab hinda kõrgemalt, kui sõidad baarist koju ja oled ilmselgelt üle pingutanud. Ja kui teie telefonis on hunnik muid koondajaid, siis vastupidi, pakuvad nad odavamaid.

(Ie On teenuseid, mis kasutavad fotosid ja videoid, et koguda võimalikult palju teavet. Näiteks arvutinägemise raamatukogud – Google'il on üks. Nad skannivad teid ja teie ümbrust, et näha, mis suurus või pikkus te olete, mis kaubamärke te kannate, millise autoga sõidate, kas teil on lapsi või lemmikloomi.

(Ie Need, kes pakuvad pankadele oma kirjade jaoks SMS-lüüsi, saavad teie oste kaardil jälgida – teades nelja viimast numbrit ja telefoninumbrit – ning seejärel müüa need andmed kellelegi teisele. Sellest ka kogu see spämm koos allahindluste ja pitsaga kingituseks.

🤷️️ Lõpuks lekitame ise oma andmed vasakpoolsetesse teenustesse ja rakendustesse. Pidage meeles Getcontacti ümberkäimist, kui kõigil oli hea meel oma telefoninumbrit täita, et teada saada, kuidas teised selle kirjutasid. Ja nüüd leidke nende kokkulepe ja lugege, mis seal teie andmete edastamise kohta öeldakse (spoiler: omanikud võivad need oma äranägemisel kolmandatele isikutele edastada):

Ettevõtted võivad edukalt koguda ja isegi müüa kasutajaandmeid aastaid, kuni kohtusse pöördumiseni – nagu juhtus sama Facebookiga. Ja siis mängis otsustavat rolli ettevõtte GDPR-i rikkumine – EL-i seadus, mis piirab andmete kasutamist palju rangemalt kui Ameerika oma. Veel üks hiljutine näide on Avast viirusetõrjeskandaal: üks ettevõtte tütarteenuseid kogus ja müüs andmeid 100–400 miljonilt kasutajalt.

Kuid kas sellel kõigel on meie jaoks eeliseid?

Kui suured andmed meid kõiki aitavad?

Jah, sellel on ka helge pool.

Suurandmed aitavad tabada kurjategijaid ja ennetada terrorirünnakuid, leida kadunud lapsi ja kaitsta neid ohtude eest.

Nende abiga me saame pankadelt lahedaid pakkumisi ja personaalseid allahindlusi. Tänu neile me me ei maksa paljude teenuste ja sotsiaalvõrgustike eest, mis teenivad ainult reklaami. Muidu kuluks ainuüksi Instagram meile mitu tuhat dollarit kuus.

Ainuüksi Facebookil on 2,4 miljardit aktiivset kasutajat. Samal ajal ulatus nende 2019. aasta kasum 18,5 miljardi dollarini. Selgub, et ettevõte teenib reklaami kaudu igalt kasutajalt kuni 7,7 dollarit aastas.

Lõpuks, mõnikord on see lihtsalt mugav: kui teenused juba teavad, kus te olete ja mida soovite, ja te ei pea ise vajalikku teavet otsima.

Teine paljulubav valdkond suurandmete rakendamisel on haridus.

Ühes Ameerika ülikoolis Virginias viidi läbi uuring, mille käigus koguti andmeid nn riskirühma õpilaste kohta. Need on need, kes õpivad halvasti, jätavad tundidest eemale ja hakkavad koolist välja langema. Fakt on see, et osariikides arvatakse igal aastal maha umbes 400 inimest. See on halb nii ülikoolidele, mille reitinguid langetatakse ja rahastamist kärbitakse, kui ka üliõpilastele endile: paljud võtavad hariduseks laenu, mis pärast mahaarvamist tuleb ikkagi tagasi maksta. Rääkimata kaotatud ajast ja karjääriväljavaadetest. Suurandmete abil on võimalik mahajääjaid aegsasti tuvastada ning pakkuda neile juhendajat, lisatunde ja muud sihipärast abi.

See, muide, sobib ka koolidele: siis annab süsteem õpetajatele ja vanematele teada – öeldakse, lapsel on probleeme, aitame teda koos. Big Data aitab teil mõista ka seda, millised õpikud töötavad paremini ja millised õpetajad selgitavad materjali lihtsamalt.

Teine positiivne näide on karjääriprofiilide koostamine.: see on siis, kui teismelisi aidatakse tulevase elukutse üle otsustada. Siin võimaldavad suurandmed koguda teavet, mida traditsiooniliste testide abil ei saa: kuidas kasutaja käitub, millele ta tähelepanu pöörab, kuidas sisuga suhtleb.

Samas USA-s on karjäärinõustamisprogramm – SC ACCELERATE. Muuhulgas kasutab see CareerChoice'i GPS-tehnoloogiat: nad analüüsivad andmeid õpilaste olemuse, nende kalduvuste kohta ainetesse, tugevusi ja nõrkusi. Seejärel kasutatakse andmeid selleks, et aidata teismelistel valida nende jaoks õiged kolledžid.

Tellige ja jälgige meid Yandex.Zenis – tehnoloogia, innovatsioon, majandus, haridus ja jagamine ühes kanalis.

Jäta vastus