Jak se v Americe mění každodenní život velkých dat?

Myšlenka „velkých dat“ se stala všudypřítomnou, ale co je a jak mění způsob, jakým žijeme? Posadili jsme se s vědcem údajů, Harvardem PhD a nominantkou National Book Award Cathy O'Neil, abychom to zjistili.

CT: Začněme se základy - co přesně je „velká data“?

CO: Velká data jsou novým přístupem k předpovídání věcí. Přesněji řečeno, „velká data“ je použití náhodně shromážděných údajů - jako je to, jak vyhledáváte v prohlížeči nebo co děláte na Facebooku - k odvozování věcí o vás, jako je to, co si kupujete nebo jaké jsou vaše politické vztahy. Je to nepřímý způsob, jak zjistit lidi. Například kamera, která nás sleduje, se nezeptá: „Co to děláte?“ - prostě uvidíme, co děláme.

CT: A co je to algoritmus?

CO: Algoritmy jsou výpočty, které [interpretují] údaje, které se o vás shromažďují, aby vytvořily předpověď. Přemýšlejte o tom jako o matematické rovnici, která se snaží odpovědět na otázku, která je rámována jako predikce, například: „Chystá se tato osoba něco koupit?“ nebo „Chystá se tato osoba pro někoho hlasovat?“

CT: Proč o tom teď tolik slyším?

CO: Před „velkými daty“ by statistici dělali drahé věci, jako je dotazování lidí, aby zjistili budoucnost. Například kladení otázek lidem jako: „Pro koho chcete hlasovat?“ Nyní se stále více spoléháme na „datový výfuk“, což je to, čemu říkám data, která se o vás neustále shromažďují, aby z vás odvodili věci.

Před „velkými daty“ měly společnosti jen divoké odhady. Teď máme lepší než divoké odhady. Překvapivé je, že většina velkých datových algoritmů je naprosto nepřesná a není důvod si myslet, že mají pravdu. Ale jsou lepší než divoké odhady. A to je důvod, proč velká data vzlétla tak, jak mají.

CT: Pokud jsou nepřesné, co potom odráží?

CO: Chybné soubory dat, které je krmíme. Algoritmy nevědí nic jiného, než co jim řekneme. Takže když máme nerovnoměrná data a krmíme to algoritmu nebo zkresleným datům, bude to považovat za realitu.

Ailsa Johnson / © Culture Trip

CT: Co je to skutečný příklad?

CO: Příkladem může být to, že ve Spojených státech je pětkrát častěji zatčeno černých lidí za kouření než u bílých lidí. Není tomu tak proto, že černí lidé kouří hrnec častěji - obě skupiny kouří hrnec stejnou rychlostí. Černí lidé jsou za to mnohem častěji zatčeni. Pokud to podáte algoritmu, který děláme, správně usoudíme, že černoši budou v budoucnu mnohem častěji zatčeni za kouření. A pak poskytne černochům vyšší skóre rizika za trestnost, což má vliv na trestní odsouzení.

Dalším příkladem je myšlenkový experiment. Budu používat Fox News, protože Fox News má nedávno erupce související s vnitřní kulturou sexismu. Experiment zní: „Co by se stalo, kdyby se společnost Fox News pokusila použít svá vlastní data k vytvoření algoritmu strojového učení, aby v budoucnu najala lidi?“

Řekněme, že hledáme například lidi, kteří byli úspěšní ve Fox News. Záleží na tom, jak byste definovali úspěch, ale obvykle byste se podívali na lidi, kteří získávají povýšení, propagační akce nebo zůstanou na dlouhou dobu. Podle kteréhokoli z těchto opatření by údaje odrážely, že ženy ve Fox News neuspěly. Pokud by byl použit jako algoritmy náboru, tento problém by se šířil. Podívalo by se na skupinu žadatelů a řeklo by: „Nechci najímat žádné ženy, protože zde nejsou úspěšné. Nejsou to dobré nájemné. “ A nemusí to být jen Fox News - každá firemní kultura má zaujatost. Když zadáváte data algoritmu, pak to algoritmus zaujme. Stále posiluje zkreslení, která již ve společnosti existují.

CT: Jsou zkreslení úmyslné?

CO: Nemyslím si, že by se vědci snažili vytvořit sexistické nebo rasistické algoritmy. Algoritmy strojového učení jsou však výjimečně dobré při zachycování relativně jemných vzorců a jejich šíření. Není to něco, co by vědci vedli úmyslně, ale přesto je to zkreslení.

CT: Jakou roli hrají nepřesné algoritmy v našem každodenním životě?

CO: Používají se v nejrůznějších rozhodnutích pro životy lidí - vše od přijetí na vysokou školu až po získání zaměstnání.

Existují algoritmy, které rozhodují o tom, jak bude policie policie sousedit, a také algoritmy, které rozhodují o tom, jak soudci budou trestat obžalované. Existují algoritmy, které rozhodují o tom, kolik zaplatíte za pojištění, nebo jaký druh APR [úroková sazba] dostanete na vaší kreditní kartě. Existují algoritmy, které rozhodují o tom, jak se vám daří ve vaší práci, které se používají ke stanovení zvýšení mezd. Existují algoritmy na každém kroku od narození až do smrti.

CT: Tak kde nás to nechává?

CO: Skočili jsme do éry velkých dat a při každém problému, který máme, jsme použili algoritmy, za předpokladu, že tyto algoritmy musí být spravedlivější než lidé - ale ve skutečnosti jsou stejně nespravedlivé jako lidé. Musíme dělat lépe.

Klikněte sem a přečtěte si druhou část našeho rozhovoru s Dr. O'Neil. Její kniha Zbraně matematického ničení: Jak velká data zvyšují nerovnost a ohrožují demokracii, je nyní k dispozici.