Vizualizacija podataka 3. vala

Razumijevanje konvergencije alata, publike i načina

Ovo je pisanje moje glavne vijesti sa Konferencije o tapiseriji 2018. (gore). Ovdje možete vidjeti dijapozitive (iz kojih sam većinu slika snimio u nastavku) s notama zvučnika.

Zamislite kako je bilo raditi vizualizaciju podataka prije 30 godina. To je 1988. i upotrebljavate Excel 2.0 za jednostavne grafikone, poput pitanih i linijskih grafikona, ili možda nešto poput SPSS-a za složenije istraživanje i Arc / Info za vizualizaciju geoprostornih podataka. Neke vrste grafikona koje su postale prilično sveprisutne, poput mapa proizvoda još uvijek nisu izumljene. No, 1988. godine, vizualnom prikazu kvantitativnih informacija Edwarda Tuftea već je bilo pet godina.

Snimci analitičara koji rade na programu Excel 2.0 kako bi napravili dijagrame pita. 1988

Zamislite sada kako je izgledati vizualizacija podataka prije 15 godina. Nije bilo D3, nije bilo Tableaua, nije bilo ggplota, čak ni Prefuse / Flare. Ako želite napraviti mrežnu vizualizaciju, možete koristiti novoobjavljeni Cytoscape iako je bio usmjeren na bioinformatiku. Geoprostorne mogućnosti bile su naprednije, a ArcGIS je u brojnim crvenim okvirima s alatima pružio više i više kartografske funkcionalnosti.

Razlika u tradicijama koje podržavaju vizualizaciju geoprostornih podataka i vizualizaciju mrežnih podataka: 2003. već je bila verzija 8.0 ArcGIS-a, dok je iste godine objavljeno prvo moderno sredstvo za vizualizaciju mrežnih podataka: Cytoscape.

Znam koliko se promijenila vizualizacija podataka jer sam zadnjih deset godina proveo ili više izrađujući proizvode za vizualizaciju podataka u jednom ili drugom obliku. Veliki javni radovi poput ORBIS-a i Kindred Britain-a, kao i manje vizualizacije javnih podataka radi zabave ili kao podrška istraživanju, analizi i istraživanju. Uz praktični rad izrade vizualizacije podataka, napisao sam knjigu o najmoćnijoj biblioteci za vizualizaciju podataka danas na svijetu: D3. A onda sam opet napisao tu knjigu. Zadnjih godinu dana gradim vlastitu biblioteku za grafikone, Semiotic. U zadnje dvije godine također vodim godišnje istraživanje stručnjaka za vizualizaciju podataka. I usput sam pisao o vizualizaciji podataka ovdje na Mediumu.

Zbog toga nisam pozvan da dam glavnu riječ na Tapiseriji. Bila sam pozvana zato što upalim komentare na društvenim medijima, u intervjuima i povremeno u razgovorima. Dugo sam rekao da bismo se trebali više slagati s kritikom u vizualizaciji podataka, ali bez konteksta, primjedbe koje izrađujem mogu se činiti proizvoljnim i zlim.

Tako da sam bio sretan što imam priliku pružiti kontekst i izraziti zabrinutost zbog toga što je došlo do konvergencije alata i načina, ali bez odgovarajuće reorganizacije misli i prakse. Izgleda da još uvijek govorimo i ocjenjujemo vizualizaciju podataka kao da je to bilo 1988. ili 2003. kada je broj ljudi koji rade vizualizaciju podataka, mogućnosti njihovih alata i očekivanja njihove publike dramatično porastao.

Nastavljamo dijeljenje zajednice za vizualizaciju podataka na stare kategorije poput analitičara koji koriste BI alate za izradu izvještaja, programeri koji koriste kôd za izradu prilagođenih vizualizacija podataka, novinari koji stvaraju podatke temeljene na podacima ili znanstvenici koji koriste istražne podatke. Unutar tih grupacija ili između njih imamo umjetnike podataka, profesionalne znanstvenike, poslovne analitičare i proizvođače alata kakve možemo vidjeti besmrtnima u crtićima Susie Lu. Ove se kategorije prakse izravno preslikavaju na određene alate i načine koji su se, s kasnim vremenom, počeli transformirati.

1. val: Jasnost

I zato bih želio naglasiti da je u modernom smislu vizualizacije podataka postojao prvi val usmjeren na Edwarda Tuftea koji je naglasio jasnoću, jednostavnost i izravno mapiranje podataka sa točke 1 na 1, izbjegavajući što veću transformaciju , Iz ovog doba vidimo porast špartanskih shema boja - često usredotočenih na neutralne ili nezasićene boje s jednom istaknutom bojom - važnost naljepnica i naslova na prirodnom jeziku, te neku vrstu idealizacije savršenog grafikona koji je odmah čitljiv, dostupan i dostupan , Neka vrsta grafikona kao rečenice s jasnim strukturama i pravilima kao što biste mogli vidjeti u elementima stila.

Val 1: Jasnoća

2. val: sustavi

Drugi val fokusirao se na sistematizaciju kodiranja informacija potrebnih za razvoj alata za proizvodnju vizualizacije podataka. Usredotočeno je na najuticajnije djelo na ovu temu: Gramatika grafika Lelanda Wilkinson-a. Umjesto grafikona kao jezične analogije, grafikon je istiskivanje iz valjane specifikacije. Grafička gramatika težila je ljudima omogućiti stvaranje grafičkog ansambla, a ako pogledamo bilo koju biblioteku za vizualizaciju podataka, uključenu i moju, i vidimo tu filozofiju u djelovanju.

Ti alati i knjižnice oglašavaju ogromne količine primjera, a pažljiva upotreba boja i teksta zamijenjena je ljubavnim slovom do geometrije. Čitav pristup "na primjer" je toliko ugrađen u ove alate da je Mike Bostock napisao čitavo djelo na njemu.

Val 2: Sustavi

D3 je, kao i sve alate iz ovog razdoblja, izravno inspiriran Gramatikom gramatike ili je pod velikim utjecajem. Semiotički, Pobjeda, visoki rejtingi, Raspored: Sve ovo dolazi iz ili je pod velikim utjecajem D3. Dva grama u Gramatičkoj grafici po kojem je ggplot dobio ime. Leland Wilkinson, autor, bio je glavni znanstvenik u Tableauu. Gramatika grafike fokusira se na britki način na kodiranje podataka kanalima na geometriju. Ovo je sustav za kodiranje grafike iz podataka, pri čemu atributi podataka odgovaraju i dinamički utječu na duljinu, kut, boju ili položaj (ili bilo koji drugi grafički znak) na temelju podataka i promjena u podacima.

Val 2 je trebao preuzeti te teorijske sustave i proizvesti alate potrebne za svakog vježbača vizualizacije podataka za stvaranje bilo kojeg grafičkog izraza na temelju podataka. To je sjajno za inženjere i softverske arhitekte koji pokušavaju napraviti knjižnice kako bi omogućili vizualizaciju podataka, ali ne nužno i za praktičare koji stvaraju proizvode za vizualizaciju podataka. Zato smo vidjeli takvo širenje alata i knjižnica za vizualizaciju podataka, ali istodobni porast grozne grafike koja se predstavlja kao grafikon.

Potraga za savršenom specifikacijom za kodiranje atributa podataka putem grafičkih kanala predstavlja sredstvo za postizanje cilja. Ali snaga i uspjeh sustava izgrađenih tijekom ovog razdoblja postali su sami sebi svrha, što nailazi na osnovni propis Gramatičke gramatike:

Ovaj je sustav sposoban proizvesti neke odvratne grafike. … Međutim, ovaj sustav ne može stvoriti besmislenu grafiku.

Prema tome, Wilkinson znači da postoji logičan odnos između grafike i podataka, ali samo zato što grafika ima neku vrstu "recepta" ne znači da nekako nije "besmislena". Vizualizacija podataka oblik je komunikacije i ako stvorite grozne grafikone, to znači da su nečitljivi, a to znači da su besmislene.

Vizualizacija podataka oblik je komunikacije i ako stvorite grozne grafikone, to znači da su nečitljivi, a to znači da su besmislene.

Vizualizacija podataka drugog vala, s nedostatkom naglaska na dizajnu u korist sustava, stvorila je šumu užasnih nadzornih ploča i izvještaja. Svaki odjel za inženjering u svakoj tvrtki ima barem jedan ružni grafikon u stvarnom vremenu napisan s nekim okvirom izgrađenim na D3. Svaki izvršni direktor ima desetak nadzornih ploča s tablicama ispunjenim karticama i prikazima istih deset zasićenih linija. Vidimo snimke zaslona iz onoga što je naoko istraživačka analiza podataka pala u dokumente ili integrirala u nadzorne ploče bez ikakvog smisla za optimizaciju. Sve se to događa usprkos rastućem paritetu značajki među tehnologijama.

3. val: konvergencija

Očajnički trebamo preispitati i preimenovati svoje načine. Prije 5 ili 10 godina kakvu ste vizualizaciju podataka napravili - bilo da je to nadzorna ploča, bilježnica, izvještaj ili napisali komunikacijski komad - bilo je vrlo različito ovisno o jeziku, knjižnici ili alatu koji koristite. To više nije slučaj.

Moramo zamisliti nove pristupe koji priznaju da se konvergencija ne događa samo u mogućnostima alata, već i u očekivanju korisnika koji više nisu spremni prihvatiti da trebaju izaći iz jednog načina kako bi se optimizirali za drugi. To podrazumijeva prebacivanje našeg naglaska s pojedinih grafikona na konstrukciju, ocjenu i isporuku proizvoda na kojima se ti grafikoni pojavljuju.

Nteract platforma za prijenosna računala oglašava se ne samo tradicionalnim korisnicima prijenosnih računala (istraživačima i znanstvenicima podataka) već i širokoj publici koja je zainteresirana za više od svega

Prijenosna računala postaju sve sličnija nadzornoj ploči, nadzorne ploče postaju sve više pripovijedane i općenito postoji sve više unakrsnog oprašivanja i konvergencije među medijima / načinima. Možete napraviti prekrasnu grafiku pomoću R, možete imati hijerarhijske grafikone u Tableauu, lako možete implementirati izvješća e-pošte sa svoje prilagođene nadzorne ploče.

U Netflixu eksperimentiramo s analitičkim prijenosnim računalima dizajniranim ne za istraživačke analize podataka, već za vizualizaciju objašnjenih podataka i potrebe za suradnjom i komunikacijom u tom načinu. Tehnike pripovijedanja, uobičajene za podatkovno novinarstvo, najviše su na pameti dionicima koji su se usavršili u svom ukusu i očekuju umišljenu animaciju i personalizirane referentne okvire.

Sve je više ovih trendova koje trebamo bolje razumjeti:

  • Nekada ezoterični tipovi grafikona, poput treemaps-a i dijagrama veze čvorova, sada su toliko dostupni da se pojavljuju svugdje, a sada je potrebno stvarno čudan grafikon proglasiti ksenografskim.
  • Bilježnice se koriste kao nadzorne ploče i kao artefakti u procesu inženjeringa i transformacije podataka.
  • Vizualizacija podataka u R narasla je gotovo jednako robusno i interaktivno kao i vizualizacija podataka u BI alatima ili prilagođenim aplikacijama.
  • Ljudi postaju sve ugodniji uz stiliziranu vizualizaciju podataka (škakljiva, ali i ISOTYPE).

Kamo smo krenuli?

Svi ti faktori doprinose onome što mislim da će definirati treći val vizualizacije podataka u kojem se konvergiraju modusi poput bilježnica, nadzornih ploča i dugogodišnjeg pripovijedanja, kao i alati za njihovo stvaranje i pismenost publike za koju su stvoreni. To se događa već neko vrijeme i reagirali smo na to, ali mislim da je vrijeme da se aktivno razmotri što to znači.

Grafikon klika

To nas zahtijeva da se udaljimo od očekivanja da stvaramo izolirane grafikone optimizirane za neposrednu čitljivost. Trenutno ocjenjujemo i slavimo vizualizaciju podataka koja je osmišljena i optimizirana za jedan posjet. To je u redu, ali trebamo također promovirati i procijeniti i bolje razumjeti vizualizaciju podataka dizajniranu i optimiziranu za više posjeta. UI i UX moraju biti prvoklasni problemi, a interaktivnost ne može biti samo atribut geometrije. Da bismo to učinili, moramo se odmaknuti od modela izoliranog genija koji stvara narušavanje vizualizacije podataka i unijeti najbolje prakse iz suradničkih projekata zajedničkih većoj zajednici softverskog razvoja.

Potaknuti kritiku

Lako je umanjiti 3D grafikon pita ili najnoviju "zadivljujuću kartu". To se možda čini kako je pozicionirana posljednja točka, ali nije, to je pokušaj da nas potakne da ne samo da slavimo ono što je sjajno u vizualizaciji podataka, već i iskreno govorimo što je loše. Moramo učiniti više od toga ako želimo ići naprijed kao zajednica. Ali kritika je teška - teško je čuti i teško dati dobro.

Dio razloga zbog kojeg smo toliko loši u davanju, uzimanju i njegovanju kritike je taj što je vizualizacija podataka već dugo individualizam. Drugi razlog zbog kojeg nismo toliko dobri u kritici je taj što je naša zajednica slave. Ali proslava nije sasvim pozitivan čin kada dijeli i aktivira snažne mehanizme za unapređivanje komunikacije, podrazumijevajući da su dostupni samo novinarima ili slobodnjacima.

Djelomično mislim da to ima veze s našim naglaskom na pojedine kanale u akademskoj literaturi. Vrlo smo udobni u kritiziranju pitanih karte jer znamo da su uglovi loši na vrijednosti kodiranja. Ali nedostaju nam smjernice kako da cjelovitije procijenimo, tako da nismo u mogućnosti objasniti zašto se neki izbori kodiranja, iako nisu izolirani optimalni, u praksi mogu pokazati vrijednim. Također ne znamo kako procijeniti privlačnost, tako da nam nedostaje jezik ili struktura da bismo objasnili zašto ljudi vole krugove veličine na plodovima pčelinjaka i diplomirane crteže simbola jednako lako jer možemo objasniti zašto su krugovi loš izbor za vrijednost kodiranja.

Redizajn ljestvice Giorgia Lupija Alberto Cairo iz Funkcionalne umjetnosti.

Drugi razlog zašto nismo baš dobri u kritici je taj što imamo ovaj vrlo istaknuti model kritike (kojeg podržavaju Alberto Cairo, kao i Fernanda Viegas i Martin Wattenberg) koji podrazumijeva najbolji način kritike. Iako je ovo dragocjen pristup, to je toliko skupo ulaganje u radna i intelektualna ulaganja da ga čini prirodnim manje uobičajenim od pukog isticanja stvari koje ne rade u proizvodu za vizualizaciju podataka. Uporedo s ovim pristupom, moramo promovirati i povećavati razinu svoje komfora s manje uključenih oblika kritike.

To ne možemo učiniti samo tako što ćemo napisati gomilu razmišljanja o kritici, iako bi bilo dobro imati nekoliko taksonomija kritike kao što imamo taksonomije ljestvica. Moramo aktivno raditi na razvoju naše zajednice koja će biti mjesto za davanje, primanje i modeliranje kritičkog diskursa. Nedavni članak Ben Jonesa o izgradnji zdrave zajednice za vizualizaciju podataka pruža dobre savjete utemeljene na stvarnom iskustvu svijeta koje bismo svi trebali slijediti.

Shvatite dizajn

Neki rezultati dizajna ankete o vizualizaciji podataka za 2018. godinu.

Odgovori anketa i razgovora ukazuju da je dizajn važna tema za poboljšanje prakse vizualizacije podataka. Ali praktičari su izrazili zbunjenost što dizajn znači. Mislimo na grafički dizajn? UI dizajn? Opći koncepti dizajnerskog razmišljanja? Informacijski dizajn? Nedostaje mesnati dizajnerski pristup u vizualizaciji podataka koji profesionalci iz rane karijere mogu naučiti i naučiti.

Sjajne boje i gifovi poput onih pronađenih u vizualizaciji podataka Draiee Zball Zodie Nadieh Bremer ili jednostavni haksi poput proboja linije

Prigrlite ekonomiju pozornosti

Mislim da se dan 'svjesnosti oka' brzo bliži.
- Otto Neurath

Kad sam prvi put došao na Netflix iz Stanforda, naivno sam mislio da će to, budući da je to posao, biti prisiljen koristiti i naučiti vizualizaciju podataka koje sam napravio. Brzo sam otkrio da to nije slučaj. Netflixova vlastita kultura bila je protiv takvih diktatorskih mjera, ali još više, moji dionici pokušavali su donositi kritične odluke, a moji proizvodi za vizualizaciju podataka natjecali su se s desetak ili više drugih nadzornih ploča i izvještaja.

Kao rezultat toga, rad koji interno radimo na Netflixu koristi slike, gifove, razigrane boje i nove vizualne metode kako bi oduševio korisnike. Iako je opća zabrana protiv dijagnoze dobro pravilo, kao i sve stvari, ona se može strogo primjenjivati. Dekorativniji pristup koji priznaje postojanje ekonomije pozornosti čak i u organizaciji zasnovanoj na podacima rezultirat će učinkovitijom vizualizacijom podataka.

Nova krv

Već smo prošli jedno neuredno razdoblje u kojem je naša zajednica osjetila potrebu da se radikalno distancira od starijeg vodstva, do točke koja je Edwarda Tuftea na Twitteru blokirala postala svojevrsni obred prolaska. Ne bismo to trebali činiti da bismo čuli i pojačali nove glasove. Moramo identificirati i aktivno promovirati nove glasove u vodstvu za vizualizaciju podataka.

Tko su lideri za vizualizaciju podataka 3. vala? Tko koristi nove mogućnosti koje predstavlja konvergencija modusa, publike i alata? Kako izgleda novo djelo? Jesu li to prijenosna računala sa značajkama nadzornih ploča i pripovijedanja na temelju podataka, poput Boba Sciencea Krist Wongsuphasawat? Postoje li novi pristupi alata za oblikovanje grafikona poput Charticulator? Ili upotreba R za izradu grafike za vizualizaciju podataka za vijesti, poput one u djelu Johna Burn-Murdocha? Ili dataviz stila Giorgia Lupi u Tableauu kao Neil Richards? Ili je to nerazumljiva granica između vizualizacije podataka, marginalije, crtanog filma i teksta koji se vidi u INFO KOJIMA SMO TRGOVI? Ili je to nevjerojatan ručno nacrtan pristup Mona Chalabi? Ili je to nešto drugo?

Jedno je sigurno, imamo primjere onih koji su se optimizirali za prethodne najbolje prakse, sada su nam potrebni oni koji utječu na novi val vizualizacije podataka.