Print Friendly and PDF

Herkes yalan söyler. Arama motorları, Büyük Veri ve İnternet sizi biliyor

Bunlarada Bakarsınız



SETH STEVENS-DAVIDOVITZ

Herkes yalan söyler. Arama motorları, Büyük Veri ve İnternet sizi biliyor

Moskova 2018

Seth Stephens-Davidowitz

HERKES YALAN SÖYLER

Stevens-Davidowitz, Seth.

 Herkes yalan söyler. Arama motorları, Büyük Veri ve İnternet sizi biliyor

hepsi / Seth Stevens-Davidowitz; [başına. İngilizceden. L.I. Stepanov uluması]. - Moskova: Eksmo, 2018. - 384 s. — (BT en çok satanlar).

Bir Google veri bilimcisi olan kitabın yazarı, internetin bir araştırmacıya sağlayabileceği verilerin yanı sıra büyük veri (Big Data) bilimine dayalı bir çalışma yürütmüştür . Sonuç olarak, içinde yaşadığımız toplum hakkındaki modern fikirleri tamamen alt üst eden sansasyonel veriler aldı .

İçindekiler

giriş         7

Önsöz. 11. Devrimin Ana Hatları        

BÖLÜM I. VERİ, BÜYÜK VE KÜÇÜK

Bölüm 1. Sezgi sizi aldatıyor         39

BÖLÜM II. BÜYÜK VERİLERİN GÜCÜ

Bölüm 2. Belki de Freud haklıydı?         63

Bölüm 3 Verileri Yeniden Düşünmek         75

Bilgi olarak gövde         84

Veri olarak kelimeler         98

Veri olarak görüntüler         124

Bölüm 4 Dijital Gerçeklik Serumu         133

seks hakkındaki gerçek         142

Nefret ve Önyargı Hakkındaki Gerçek         161

İnternet Hakkındaki Gerçekler         176

Çocuk İstismarı ve Kürtaj Hakkındaki Gerçekler 182

Facebook Arkadaşlarınız         Hakkındaki Gerçekler 188

Müşterileriniz Hakkındaki Gerçek         192

Gerçeğe dayanabilir miyiz?         198

Bölüm 5. Yakından Bakmak         207

Bölgelerimizde, şehirlerimizde ve kasabalarımızda gerçekte neler oluyor?         215

Hayatın saatlerini ve dakikalarını nasıl dolduruyoruz         237

ikizlerimiz         245

Verilerin anlattığı hikayeler         255

Bölüm 6 _         _

A/B Testinin ABC'si         260

Acımasız ama aydınlatıcı saha deneyleri         274

BÖLÜM III. BÜYÜK VERİ:

DİKKATLİ TAŞIMA

Bölüm 7

Neyi yapamazlar?         301

Boyut sayısının laneti         305

Neyin ölçülebileceğine aşırı vurgu 312

Bölüm 8 Daha Fazla Veri, Daha Fazla Sorun?

Ne yapmamalıyız?         319

Veri silahlı şirketlerin tehlikesi         319

Verilerle donanmış hükümetlerin tehlikesi         329

Çözüm. kaç kişi okuyor

kitap sonuna kadar?         335

teşekkürler         351

Notlar         355

GİRİŞ

insan düşüncelerini ekranda gösteren efsanevi bir cihaz olan "beyin mikroskobu" hayal ettiler . Sosyologlar ise aktif olarak insan eylemlerini anlamak için araçlar arıyorlar . Deneysel bir psikolog olarak çalıştığım süre boyunca, bilim adamlarını hızla hayal kırıklığına uğratan çeşitli araçlar moda oldu . Hepsini denedim - derecelendirme ölçekleri, reaksiyon süreleri, gözbebeği genişlemesi, fonksiyonel nörogörüntüleme, hatta epilepsi hastalarını incelemek (bir atağı beklerken deney yaparak zaman geçirmekten mutluydular).

Ancak bu yöntemlerin hiçbiri zihne engelsiz bir içgörüye izin vermedi. Sorun, kaba bir uzlaşma ihtiyacıydı. İnsan düşünceleri karmaşık bir olgudur. Savaş ve Barış'ı birkaç cümleye indirgeyen Woody Allen'ın aksine , "Bu birkaç Rus hakkında bir hikaye" diye düşünmüyoruz. Bir bilim adamının cümleleri tüm çok boyutlu karmaşıklığıyla analiz etmesi zordur . Tabii ki , insanlar ruhlarını dışarı döktüklerinde, sonunda onların bilinç akışlarının tüm zenginliğini kavrayabiliriz. Ancak monologlar, hipotezleri test etmek için ideal veri seti değildir. Öte yandan, eğer odaklanırsak Bir kişinin kelimelere veya fotoğraflara tepki süresi gibi kolayca ölçülebilen ölçümler üzerinde istatistikler oluşturabiliriz. Ama bunu yaparken, bilincin karmaşık dokusunu tek bir sayıya indirgeriz. En karmaşık nörogörüntüleme teknikleri bile bize bir düşüncenin 3B uzayda nasıl dağıldığını söyleyebilir , ancak düşüncenin ne hakkında olduğunu söyleyemez .

Ek olarak, sosyal bilimciler küçük sayılar yasasının işleyişini dikkate aldılar - Amos Tversky ve Daniel Kahneman, ne kadar küçük olursa olsun, nüfusun herhangi bir örneğinde ortak özelliklerin yansıtılacağı yanılgısına bu adı verdiler . En büyük matematikçiler bile bazen verilerdeki rastgele sapmalardan soyutlanıp sonucu tüm Homo sapiensler bir yana tüm Amerikalılara genellemeden önce kaç nesne üzerinde çalışılacağı konusunda en talihsiz hatayı yaparlar . Örnek, ikinci sınıf öğrencilerine bira parası teklif etmek gibi uygun bir temelde toplandığında, bu daha da zordur .

Bu kitap, bilinci incelemenin tamamen yeni bir yolu hakkındadır. Tabii ki, İnternet aramalarından ve diğer çevrimiçi araştırmalardan elde edilen büyük veriler bir ensefaloskop değildir. Ancak Seth Stevens-Davidovich, insan ruhuna yeni bir bakış atmak için harika bir fırsat sunduklarını gösteriyor. Klavyeleriyle gözlerden uzak olan insanlar oldukça garip itiraflarda bulunurlar. Bazen (tanışma sitelerinde veya profesyonel tavsiye ararken olduğu gibi) bunun gerçek sonuçları olduğu için. Ve diğer durumlarda, çünkü bu eylemler, aksine, herhangi bir sonuca yol açmaz ve insanlar, birinin buna dehşetle tepki vereceğinden korkmadan şu veya bu arzunun veya korkunun varlığını kabul edebilir, kabul edebilir.

Her halükarda, insanlar sadece bir düğmeye basmakla veya bir düğmeyi çevirmekle kalmıyor , aynı zamanda düşüncelerini tüm patlayıcı kombinasyonlarında ifade etmek için trilyonlarca karakter dizisi yazıyorlar. Bu veriler hayatın her kesiminden geliyor. Bunu yaparken, insanlar uyaranları değiştiren ve yanıtları gerçek zamanlı olarak özetleyen incelikli deneylerde yer alarak bir araya getirilmesi ve analiz edilmesi kolay dijital ayak izleri bırakıyor . Ve bu verileri büyük miktarlarda sağlamaktan mutlular. “Herkes yalan söyler” böyle bir kavramın ispatından daha fazlasıdır. Stevens-Davidowitz'in keşifleri yurttaşlar ve kendi ülkem hakkındaki fikirlerimi defalarca alt üst etti . Donald Trump bu kadar beklenmedik desteği nereden alıyor? 1976'da Ann Landers, okuyucularına çocuk sahibi olmaktan pişman olup olmadıklarını sordu ve şok oldu: cevapların çoğu olumluydu. Temsili olmayan bir örnek tarafından yanıltıldı mı? 2010'ların sonundaki krizin - "bilgi balonunun" - gerçekten suçu İnternet mi? Nefret suçlarına ne yol açar ? İnsanların gülmek için şaka aradığı doğru mu? Hiçbir şeyin beni şok edemeyeceğini düşünmekten hoşlansam da , insan cinselliğinin internette nasıl ifşa edildiği karşısında şok oldum - buna her ay belirli sayıda kadının "lanet olası pelüş oyuncaklar" araması da dahil. Tepki süresi, gözbebeği genişlemesi veya fonksiyonel nörotıp kullanan hiçbir deney bu gerçeği ortaya çıkaramaz.

Herkes Yalanlar herkesi memnun edecektir. Stevens-Davidowitz, yorulmak bilmez merakı ve sabrı ile 21. yüzyılın sosyal bilimleri için yeni bir yol gösteriyor. İnsan tutkularının dünyasına açılan böylesine sonsuz büyüleyici bir pencere varken , kim bir ensefaloskopa ihtiyaç duyar ki?

Steven Pinker PhD, MIT'de profesör, The Clean Slate'in yazarı. İnsan doğası. Bugün kim ve neden onu tanımayı reddediyor”, 2017

ÖNSÖZ

DEVRİMİN ANAHTARLARI

Elbette kaybedecek” dediler.

2016 Cumhuriyetçi ön seçimlerinin sonuçlarına göre uzmanlar , Donald Trump'ın olası tüm azınlıkları gücendirdiği için hiç şansı olmadığı sonucuna vardı. Anketler, ne kadar az Amerikalının haklarının bu şekilde ihlal edilmesini onayladığını gösterdi.

O sırada ankete katılan uzmanların çoğu, Trump'ın genel seçimleri kaybedeceğine de inanıyordu. Çok fazla potansiyel seçmen, onun tavırlarından ve tavırlarından tiksindiklerini söyledi.

hem de genel seçimleri gerçekten kazanabileceğini gösteren gerçekler vardı . Ve bu ipuçları internette bulunabilir.

Ben bir internet veri uzmanıyım. Her gün World Wide Web'deki bağlantıları takip eden insanların dijital ayak izlerini takip ediyorum . Hangi bağlantılara veya tuşlara tıkladıklarını, gerçekten ne istediklerini, ne yaptıklarını ve kendilerinin (ve hepimizin) gerçekte kim olduğunu anlamaya çalışıyorum . Size bu alışılmadık yola nasıl çıktığımı anlatmak istiyorum.

Hikaye - şimdi çok uzun zaman önce gibi görünüyor - 2008 cumhurbaşkanlığı seçimleriyle başladı. Sosyologlar daha sonra uzun tartışmalar yaptılar: Amerika'da ırksal önyargı ne kadar güçlü?

, önde gelen partiden Amerika Birleşik Devletleri başkanlığına ilk Afrikalı-Amerikalı aday olarak aday gösterildi . Kazandı ve oldukça kolay. Anketler, Amerikalıların seçimini etkileyen faktörün ırk olmadığını gösterdi . Örneğin Gallup, Obama'nın ilk seçiminden önce ve sonra çok sayıda anket yaptı. Vardıkları sonuç: Amerikalı seçmenler, Barack Obama'nın siyahi olmasını pek umursamadılar . Seçimden kısa bir süre sonra, Kaliforniya'daki University of Berkeley 2'den iki seçkin profesör , araştırma sırasında toplanan materyalleri en gelişmiş veri işleme tekniklerini uygulayarak inceledi. Sonuç olarak, benzer bir sonuca vardılar.

Böylece, Obama'nın başkanlığı sırasında bu, birçok medya ve akademik çevrede yayılan geleneksel bir bilgelik haline geldi. Medyanın ve sosyal bilimcilerin dünyamızın nasıl çalıştığını anlamak için seksen yılı aşkın bir süredir güvendikleri kaynaklar , Amerikalıların büyük çoğunluğunun, Obama'nın kendi başkanları olup olmayacağına karar verirken siyahi olmasını umursamadığını söylüyor.

Uzun süredir kölelik ve Jim Crow yasalarıyla lekelenmiş olan bu ülke [1], sonunda insanları tenlerinin rengine göre yargılamayı bırakmış gibiydi. Bunun Amerika'daki ırkçılığın son ayağında olduğunu göstermesi gerekiyordu .

- sonrası bir toplumda yaşadığımızı beyan ettiler3 .

2012'de iktisat alanında yüksek lisans öğrencisiydim ve dünyanın nasıl işlediğine ve yirmi birinci yüzyılda insanların ne düşündüğüne ve neye önem verdiğine dair oldukça iyi bir anlayışa sahip olduğuma inanarak seçtiğim yönden hayal kırıklığına uğradım . Önyargı konusuna gelince, psikoloji ve siyaset bilimi üzerine yazılarda okuduklarımdan yola çıkarak, Amerikalıların çok sınırlı bir yüzdesinde açık ırkçılığın içkin olduğuna ve bunların çoğunun muhafazakar Cumhuriyetçiler olduğuna inanmaya izin verdim. güneyde taşrada yaşamak.

Sonra Google Trends'i keşfettim.

2009 yılında bu uygulamanın ortaya çıkışı neredeyse fark edilmeden gitti. Kullanıcıların , belirli bir kelimenin veya ifadenin farklı yerlerde ve farklı zamanlarda ne sıklıkla geçtiğini belirlemesine olanak tanır ve örneğin, şu anda hangi ünlülerin popüler olduğunu veya hangi kıyafetlerin moda olduğunu arkadaşlarıyla tartışmak için bir eğlence aracı olarak sunuldu . . Programın ilk sürümlerinde bu tür verilere dayanarak “doktora tezi yazmayın” şeklinde şakacı bir uyarı bile vardı ve bu beni hemen bunlara dayalı bir tez yazmaya yöneltti [2].

O zamanlar Google verileri, insan psikolojisini incelemek için bir araç olarak yaratılmadığından, ciddi bilimsel araştırmalar için değerli bir bilgi kaynağı olarak görülmüyordu . Google, araştırmacıların insanları incelemesi için değil, insanların dünyayı keşfetmesi için icat edildi. Ancak internette bilgi kırıntıları ararken bıraktığımız izlerin son derece aydınlatıcı olduğu ortaya çıktı .

Başka bir deyişle, bilgi arayan insanların kendileri bilginin kaynağıdır. Ne zaman ve nerede gerçekleri, alıntıları, fıkraları, yerleri, insanları, şeyleri veya yardımı aradıklarında , bize gerçek düşünceleri, arzuları, korkuları ve eylemleri hakkında hayal edebileceğimizden çok daha fazlasını anlatabilecekleri ortaya çıktı . Ve bu, özellikle insanlar arama motoruna ona güvenmek kadar soru sormadıklarında belirgindir : "Patronumdan nefret ediyorum", "Sarhoşum", "babam bana vurdu".

Düzgün beyaz bir kutuya bir sözcük veya tümcecik yazmak çok az gerçek ayak izi bırakır. Milyonlarla çarpılır, sonunda altta yatan gerçekleri ortaya çıkarır.

Google Trends'e yazdığım ilk kelime Tanrı'ydı . Google aramalarında Tanrı'ya en çok atıfta bulunulan eyaletlerin Alabama, Mississippi ve Arkansas - sözde İncil Kemeri olduğunu öğrendim . Ve bu aramalar çoğunlukla Pazar günleri yapılır . Bu şaşırtıcı değil, ancak veri araştırmasının bu kadar net bir tablo ortaya çıkarması ilginç. Rnicks'i [3]aradım ve taleplerin çoğunun New York City için olduğunu gördü. Yemek anlaşılır. O sırada adımı yazdım. Google Trends bana "Üzgünüz," dedi. "Sonuçları göstermek için yeterli arama hacmi yok." Google Trends'in yalnızca aynı aramayı yeterli sayıda kişi yaptığında veri sağladığını bu şekilde öğrendim .

Ancak Google arama motorunun gücü, Tanrı'nın Güney'de en popüler olduğunu, Rnicks'in New York'ta olduğunu veya benim hiçbir yerde popüler olmadığımı öğrenmek değildir . Herhangi bir anket bunu ortaya çıkarabilir. Google'ın gücü ve gücü, insanların başka kimseye söyleyemediklerini dev arama motoruna söylemesinde yatmaktadır .

Örneğin, seksi ele alalım (Bu konuya daha sonra döneceğim ve daha ayrıntılı olarak tartışacağım). Anket sonuçlarına güvenilemez çünkü insanlar cinsel yaşamları hakkında nadiren doğruyu söyler. Amerikan davranışı hakkında en güvenilir ve yetkili bilgi kaynağı olarak kabul edilen General Social Survey'den 4 verileri analiz ettim . Bu araştırmaya göre, heteroseksüel ilişki söz konusu olduğunda , kadınlar yılda ortalama elli beş kez, yüzde on altı oranında prezervatif kullanarak seks yaptıklarını söylüyor. Bu, yılda yaklaşık 1,1 milyar prezervatif üretiyor. Ancak heteroseksüel erkekler her yıl 1,6 milyar prezervatif kullanıldığını iddia ediyor . Tanım gereği, bu sayılar eşleşmelidir. Peki kim doğruyu söylüyor, erkekler mi kadınlar mı?

Anlaşıldığı üzere - ne biri ne de diğeri. Tüketici davranışını izleyen bir şirket olan Nielsen'e göre her yıl 600 milyondan az prezervatif satılıyor 5 . Yani ikisi de yalan söylüyor; tek fark ne kadar güçlü olduğu.

Yalan aslında çok yaygın. Hiç evlenmemiş erkekler yılda ortalama yirmi dokuz prezervatif kullandıklarını bildiriyor. Bu sayı , Amerika Birleşik Devletleri'nde evli ve bekar kişilere satılan prezervatif sayısına eklenmelidir . Evli insanlar muhtemelen cinsel aktivitelerini de abartırlar. Ortalama olarak, altmış beş yaşın altındaki evli erkekler haftada bir seks yaptıklarını söylüyor. Sadece yüzde biri bir yıldır seks yapmadığını itiraf ediyor. Evli kadınlar biraz daha az seks bildiriyor, ancak çok değil.

Bir Google araması daha az dramatik ama bence çok daha makul bir resim verecektir . Evlilikte seks eksikliği hakkında en çok şikayet . "Sekssiz evlilik" arama sorgusu, "mutsuz evlilik"ten üç buçuk kat ve "aşksız evlilik"ten sekiz kat daha olasıdır. Evli olmayan çiftler bile sıklıkla seks yapmamaktan şikayet eder. "Sekssiz ilişkiler" arama terimi, yalnızca "sert seks" için arama yapanlardan sonra ikinci sıradadır. (Tüm bu verilerin anonim olarak sağlandığını vurgulamak isterim . Google, elbette, belirli bir kişiye ait arama verilerini ifşa etmez.)

Google arama bize , anketlerin gösterdiği ırkçılık sonrası ütopyadan çok farklı bir Amerika resmi verdi . Ancak, Google Arama Trendleri'nde «Yönetici» araması yapabilirsiniz. Bana saf deyin ama kelimenin ne kadar "zehirli" olduğu göz önüne alındığında, arama hacminin çok küçük olmasını bekliyordum. Beyler, yanılmışım. «Nigгер» — В Соеди ненных Штатах слово «ниггер» — veya во множествен ном числе «ниггеры» — входило в поисковые запросы примен о столько же раз, сколько слова «мигрень», «эко- номист(ы)» ve «Лейкерс». Bu kelimeyi "rap" kelimesiyle ilişkilendirirseniz belki sonuç farklı olur diye düşündüm. Ama hayır. Rap'te kullanılan kelime neredeyse her zaman "zenci" dir. Amerika Birleşik Devletleri'nde nasıl bir yürüyüşe çıkıyorsunuz ? Genellikle Afrikalı Amerikalılarla dalga geçen şakalar arıyorlar. “Nigгер ” включают ve слово «анекдот», то гда к ак большинство подобных поисков включают фразы «тупые ниггеры» ve «я ненавижу ниггеров».

Ve her yıl bu tür milyonlarca arama yapılıyor. Evlerinde inzivaya çekilmiş pek çok Amerikalı şok edici derecede ırkçı taleplerde bulunuyor . Bu araştırmayı ne kadar çok yaptıysam , o kadar rahatsız edici bilgiler aldım .

Obama'nın seçimlerinden sonraki ilk gece, yorumların çoğu övgü dolu ve seçilmesinin tarihsel anlamını kabul ederken, Google'da "Obama" kelimesini içeren her yüz yüz arama sorgusundan yaklaşık birinde "kkk" [4]veya "nig" kelimeleri de yer alıyordu. -ger” ” . Belki de, dünyanın en önemli işini üstlenmek üzere olan, çekici bir aileye sahip bu genç yabancı hakkında ırkçı olmayan binlerce Google araması göz önüne alındığında pek bir şey değil . Stormfront 6'da Seçim Gecesi Arama ve Kayıtlar - ABD'de beklenmedik bir şekilde yüksek popülariteye sahip beyaz milliyetçi bir web sitesi - her zamankinden on kat daha büyüktü. В некоторых штатах поисков по запросам «ниггер-президент» 7 было намно го больше, чем по запросам «первый чер ный президент».

Geleneksel yöntemlerle ortaya çıkarılmayan karanlık taraf ve kırgınlık, insanların yaptığı arama sorgularını analiz ettikten sonra oldukça belirgin hale geldi.

, ırkçılığın önemsiz bir faktör olduğu bir topluma pek uymuyor . 2012'de Donald J. Trump'ı esas olarak bir iş adamı ve realite şov sunucusu olarak tanıyordum . Çoğu insan gibi ben de dört yıl sonra onun ciddi bir başkan adayı olacağını hayal edemezdim . Bununla birlikte, tüm bu çirkin arama sorguları, göçmenlere yönelik acımasız saldırılar kullanarak , nefreti ve hoşgörüsüzlüğü kışkırtarak , genellikle en kötü insan tezahürleri üzerinde oynayan adayın başarısıyla kolayca ilişkilendirilebilir .

Google arama analizi, ülkedeki ırkçı duyguların yerelleştirilmesi konusunda pek çok yanlış anlama yaşadığımızı da gösterdi . Anketlere ve geleneksel kanıya göre , modern ırkçılık ağırlıklı olarak Güney'de ve çoğunlukla Cumhuriyetçiler arasında bulunuyor . Bununla birlikte, en yüksek düzeyde ırkçı soruşturmaya sahip yerler - Batı Virginia , Güney Louisiana ve Mississippi'ye ek olarak - New York, Pennsylvania, Batı ve Doğu Ohio, Michigan, endüstriyel ve kırsal Illinois eyaletlerinde de bulundu. Google'a göre Güney ve Kuzey'i değil, Doğu ve Batı'yı karşılaştırmak daha doğru olur . Mississippi'nin batısında çok fazla bu düzeyde bir araştırma görmezsiniz . Ve ırkçılığın yayılması sadece Cumhuriyet ortamıyla sınırlı değil. Aslında, ırkçı soruşturmalar, yüksek oranda Cumhuriyetçilerin olduğu yerlerde, yüksek oranda Demokratların bulunduğu yerlere göre daha yüksek değildi. Başka bir deyişle, Google aramalarının analizi , Amerika Birleşik Devletleri'ndeki ırkçılığın yerinin yeni bir haritasının oluşturulmasına yardımcı oldu ve bu harita, hayal ettiğimizden tamamen farklı görünüyordu . Mesele şu ki, Kuzey'deki birçok Demokrat benzer görüşlere sahip olsa da, Güney'deki Cumhuriyetçilerin ırkçı olduklarını kabul etme olasılıkları daha yüksek.

Trump'ın siyasi başarısını açıklamakta oldukça önemli olacaktır .

2012'de, Google arama frekansından geliştirilen bu ırkçılık yerelleştirme haritasını, Obama'nın ırkının oynadığı rolü tamamen yeniden düşünmek için kullandım ve net bir tablo gördüm . Ülkenin en ırkçı aramaların yapıldığı bölgelerinde, Obama'nın notları , beyaz Demokrat başkan adayı John Kerry'nin notlarından önemli ölçüde düşüktü. Bu alanlarda böyle bir sonuç , eğitim düzeyi, yaş, dindarlık veya silah bulundurma gibi başka hiçbir faktörle açıklanamaz . Irkçı soruşturmalar, diğer herhangi bir Demokrat aday için düşük düzeyde bir popülerlik öngörmedi . Sadece Obama için.

Sonuç olarak, Obama düpedüz ırkçılık nedeniyle ulusal oyların yaklaşık yüzde dördünü kaybetti . Bu, anket verilerine göre beklenenden çok daha fazlaydı. Barack Obama, tabii ki, Demokratlar için çok elverişli bir ortamda, Başkan seçildi ve yeniden seçildi, ancak çoğu durumda yanlış olan geleneksel veri kaynaklarına güvenen herkesten çok daha fazla zorluğun üstesinden gelmek zorunda kaldı. Ülkede, Demokratlar için pek elverişli olmayan bir zamanda ön seçimleri veya genel seçimleri kazanabilecek yeterince ırkçı vardı .

Araştırmam başlangıçta beş bilimsel dergi 8 tarafından reddedildi . Eleştirmenlerin çoğu - homurdandığım için özür dilerim - bu kadar çok Amerikalının ırkçılığını sakladığına inanamadıklarını söylediler. Bu, kamuoyu yoklamalarında söylenenlerin tam tersiydi. Ayrıca , Google arama sorgularını araştırmak , veri elde etmenin çok garip bir yolu gibi görünüyordu.

Artık Başkan Donald J. Trump'ın yemin törenine tanık olduğumuza göre , sonuçlarım oldukça inandırıcı görünüyor.

anketlerde dikkate alınmayan ve diğer şeylerin yanı sıra seçim sonuçlarını anlamak için yararlı olabilecek birçok bilgiye sahip olduğunu o kadar çok anladım .

Örneğin, seçimlere fiilen kimlerin katılacağına ilişkin bilgiler. Oy vermeyen vatandaşların yarısından fazlası seçimlerden hemen önce anket araştırmacılarına oy vermeyi düşündüklerini söylerken, bu durum katılım tahminlerini çarpıtırken, Google'daki veriler "nasıl oy verilir" veya " nerede oy kullanılır" için arama yapar. seçim, sandık merkezlerinde daha fazla hareketlilik olması muhtemel olan yerlerin daha doğru bir şekilde tahmin edilmesine yardımcı olacaktır .

Hatta kime oy verecekleri hakkında bilgi bile bulabilirsiniz. Los Angeles California Eyalet Üniversitesi'nde profesör olan Stuart Gabriel ve insanların nasıl oy vermeyi planladıklarına dair şaşırtıcı bir ipucu buldum. Seçimle ilgili aramaların büyük bir yüzdesi, her iki adayın da adını içeren sorgular içeriyor. 2016 seçimleri sırasında , Trump ve Hillary Clinton yarışırken , bazı insanlar şu talepte bulundu: "seçim: Trump - Clinton." Diğerleri şunu aradı: "Clinton-Trump tartışması." Aslında, "Trump" için yapılan aramaların yüzde on ikisi aynı zamanda "Clinton" kelimesini de içeriyordu. Clinton soyadı için yapılan aramaların dörtte birinden fazlası Trump'ın soyadını da içeriyordu.

bir kişinin hangi adayı desteklediğine dair bazı ipuçları verebileceğini bulduk .

Nasıl? Her şey, adayların sorguda görünme sırasına bağlıdır. Araştırmamız, bir kişinin desteklediği adayın adını her iki adayın da adını içeren bir arama sorgusunda ilk sıraya koyma olasılığının önemli ölçüde daha yüksek olduğunu gösteriyor .

Önceki üç seçimde, soyadı arama sorgularında ilk görünen aday en çok oyu aldı. Daha da ilginci, adayların ağda aranma sırası, bir devletin hangi tarafta yer alacağını tahmin etmeyi mümkün kılıyordu.

Aday adlarının arama sorgularında görünme sırası da anketlerin gözden kaçırdığı bilgileri içerir. Obama ile Cumhuriyetçi Mitt Romney arasındaki 2012 seçimlerinde , virtüöz bir istatistikçi ve gazeteci olan Nate Silver, elli eyaletin tamamında sonucu doğru bir şekilde tahmin etti. Ancak, aramalarda Rom'u Obama'dan daha sık sıralayan eyaletlerde , Romney'nin aslında Silver'ın öngördüğünden daha iyi performans gösterdiğini bulduk. Obama'yı Romney'in önüne koyan eyaletlerde, Obama Silver'ın tahmin ettiğinden daha iyi performans gösterdi.

, anketlerde açığa çıkmayan bilgiler içerebilir , çünkü seçmenler ya kendilerini kandırırlar ya da gerçek tercihlerini anketörlere açıklamaktan rahatsız olurlar.

Muhtemelen, 2012'de henüz karar vermediklerini söyleseler, ancak aynı zamanda sürekli talepte bulunsalar : "seçimler: Romney-Obama", "Romney-Obama tartışmaları" ve "Romney-Obama, seçimler", bu şu anlama gelirdi: sonuçta Romney'e oy vermeyi planladıklarını.

Peki Google, Trump'ın zaferini tahmin etti mi? Seçim sonuçlarını tahmin etmek için Google verilerini en iyi nasıl kullanacağımızı bulmadan önce hâlâ yapacak çok işimiz var ve diğer birçok araştırmacıyla güçlerimi birleştirmem gerekecek . Bu yeni bir bilim ve şu ana kadar sadece birkaç geçmiş seçim için veriye sahibiz . Elbette, seçimleri tahmin etmeye yardımcı olacak bir araç olarak kamuoyu yoklamalarını tamamen terk edebileceğiniz anın -eğer gelirse- geldiğini söylemiyorum .

, internette Trump'ın başkan olma şansının anketler sırasında toplanan verilerden daha yüksek olduğuna dair pek çok kanıt olduğunu kesin olarak söyleyebilirim .

Genel seçimler sırasında, seçmenlerin Trump'ın tarafında olduğuna dair ipuçları vardı. Siyah Amerikalılar görüşmecilere toplu halde Trump'a karşı oy kullanacaklarını söylediler. Ancak , ağırlıklı olarak Afro-Amerikan oy verme yerlerinde oy kullanma hakkında bilgi arayan Google aramaları , etkinliklerinin gerilediğini gösterdi. Seçim Günü Clinton, düşük siyah katılımdan hoş bir şekilde şaşırmayacak.

seçmenlerin Trump'a sığındığına dair işaretler bile vardı . Gabriel ve ben, Clinton'ın kazanmayı umduğu Orta Batı'daki kilit eyaletlerde "Clinton-Trump"tan çok "Trump-Clinton" aramasının yapıldığını bulduk. Gerçekten de Trump, seçilmesinin çoğunu oradaki anketlerden çok daha iyi performans göstermesine borçlu.

ana işaretleri ortaya çıkarmaya yardımcı olan kilit ipucu - ve buna kesinlikle ikna oldum - başlangıçta, Obama'nın seçilmesi sırasında araştırmamın ortaya çıkardığı altta yatan ırkçılığın aynısıydı. Google aramalarının bir analizi , önemli sayıda Amerikalıda uzmanların yıllardır fark etmediği öfke ve hoşgörüsüzlüğü ortaya çıkardı . Bu veriler , bilim adamlarının ve gazetecilerin anketlere dayanarak bize sunduğundan oldukça farklı bir toplumda yaşadığımızı gösterdi . Seçmenlerin kendisine oy vermesini bekleyen bir adaya karşı tiksindirici, ürkütücü ve yerleşik bir öfkeyi açığa çıkardılar .

İnsanlar genellikle hem kendilerine hem de başkalarına yalan söyler. 2008'de Amerikalılar , anketlerde artık bir kişinin ırkını umursamadıklarını bildirdi . Sekiz yıl sonra, beyaz Amerikalıların öldürülmesinin çoğundan siyahların sorumlu olduğu şeklindeki yanlış iddiayı retweetleyen , siyahi Black Lives Matter (BLM) protestocularını dövmekle suçlanan destekçilerini savunan Donald J. Trump'ı başkan olarak seçtiler . mitinglerden birinde siyah nüfusa yönelik şiddete karşı çıkan uluslararası bir aktivist hareketi ve Ku Klux Klan'ın eski liderinin desteğini reddedip reddetmeme konusunda tereddüt etti. Barack Obama'yı inciten aynı gizli ırkçılık, Donald Trump'a yardım etti.

Ön seçimlerin başında Nate Silver kendinden emin bir şekilde Trump'ın kazanma şansının neredeyse hiç olmadığını ilan etti. Ancak seçim ilerledikçe , Trump'ın geniş bir desteğe sahip olduğu giderek daha açık hale geldi. Silver neler olup bittiğini anlamak için verilere bir göz atmaya mı karar verdi? Trump nasıl bu kadar başarılı bir şekilde ilerlemeyi başardı ?

Silver, Trump'ın en başarılı performans gösterdiği alanların tuhaf bir haritayı temsil ettiğini kaydetti. Trump, Güney'in yanı sıra Kuzeydoğu ve endüstriyel Ortabatı bölgelerinde iyi performans gösterdi. Batı'da, gözle görülür şekilde daha kötü karşılandı. Silver, bu resmi açıklamak için parametreler aramaya başladı. işsizlik sebebi? Bu bir din mi? Silah bulundurmak mı ? Göç seviyesi? Obama'ya muhalefet mi?

Sonunda Silver, Cumhuriyetçi ön seçimlerde Donald Trump'a verilen destekle en iyi ilişkili olan tek faktörün dört yıl önce keşfettiğim bir şey olduğu sonucuna vardı . Трампа поддержали те области, жители которых сдела ли большинство поисковых запросов Google со словом «ниггер».

Son dört yıldır neredeyse her gün Google veri analizi yapıyorum. Buna , ırkçılıkla ilgili araştırmamı öğrendikten sonra beni işe alan Google'da veri analisti olarak çalışmak da dahildi. Ve The New York Times için bir editör ve gazeteci olarak bu verilerle çalışmaya devam ettim . Yeni vahiylerin gelmesi uzun sürmedi. Ruhsal bozukluklar, seksoloji, çocuk istismarı, kürtaj, reklamcılık, din, sağlık oldukça ciddi konulardır. Ve birkaç on yıl önce var olmayan bu veri seti , onlara tamamen farklı bir şekilde bakmanıza izin veriyor. Ekonomistler ve sosyologlar sürekli olarak yeni veri kaynaklarının peşindeler, bu yüzden açık konuşayım: Bugün, Google aramalarının insan psikolojisi hakkında şimdiye kadar toplanmış en önemli veri kümesini sağladığına inanıyorum.

internetin dünyamızı anlamak için sağladığı tek araç değildir . Çok geçmeden altın içeren başka dijital damarlar olduğunu fark ettim . Tüm Wikipedia'yı indirdim, Facebook profillerini karıştırdım ve Stormfront'u taradım. Ek olarak, İnternet'teki en büyük pornografik sitelerden biri olan PornHub, dünyanın her yerinden insanların anonim aramaları ve video görüntülemeleriyle ilgili tüm verilerini bana verdi. Başka bir deyişle, şimdi büyük veri olarak adlandırılan şeye derinlemesine [5]daldım . Daha sonra bu yeni alanda araştırma yapan düzinelerce başka profesyonelle (bilim insanı, gazeteci ve girişimci) röportaj yaptım . Çalışmalarının çoğu bu kitapta tartışılacaktır.

Ama önce itiraf etmeliyim: "Büyük veri"nin ne olduğuna dair kesin bir tanım vermeyeceğim. Neden? Çünkü aslında oldukça belirsiz bir kavramdır. Büyük - ne kadar? 18.462 gözlem küçük veri ve 18.463 zaten büyük veri mi? Bu sınıfta ne olduğunun kapsayıcı bir şekilde anlaşılmasını tercih ederim: Çalıştığım verilerin çoğu internetten elde edildi, ancak tartışmada diğer kaynakları da dikkate alacağım . Mevcut farklı bilgi türlerinin nicelik ve niteliğinde bir patlama yaşıyoruz. Google ve sosyal medya aracılığıyla yeni bilgi akışları yağdı . Bazıları eskiden dolaplarda ve klasörlerde saklanan bilgilerin dijitalleştirilmesinin ürünüyken , bazıları da pazar araştırmalarına ayrılan kaynakların artmasının sonucudur. Bu kitapta gözden geçirilen araştırmaların bazıları hiç de büyük miktarda veri gerektirmiyor; bunun yerine, verilere, bu aşırı bilgi yüklemesi çağında özellikle değerli olan, yeni ve yaratıcı bir yaklaşım uyguluyor .

Peki büyük veri neden bu kadar güçlü? Sadece bir günde internette dolaşan tüm verileri hayal edin - aslında , bu bilgilerin miktarını saydık. Yirmi birinci yüzyılın başında, insanlar günde ortalama 2,5 milyon trilyon bayt veri üretmektedir 10 .

Ve bu baytlar ipucu.

Bir perşembe akşamı bir kadının canı sıkılır. Google'da biraz "düzgün komik videolar" arattı . E-postasını kontrol etti. Tweet attı . Затем она гуглит «анекдоты про ниггеров».

Adam üzgün. Google'da "depresyon semptomları" ve "depresyon hikayeleri" yazdı. Sonra solitaire oynadı.

Bir kadın Facebook'ta arkadaşının evleneceğine dair bir ilan görüyor. Kadın bekar, bekar ve arkadaşıyla ilgili bilgileri engelliyor.

NHL ve rap hakkında bilgi arayan bir adam arama motorunda şu soruyu sorar: "Rüyasında bir erkekle öpüşmeyi görmek normal mi?"

Bir kadın, 15 Sevimli Kedi hakkında bir BuzzFeed hikayesine tıklar.

Adam aynı hikayeyi kediler için de görüyor. Ama ekranında "En Sevimli 15 Kedi " olarak anılıyor. Linke tıklamıyor.

Kadın Googles: "Oğlum bir dahi mi?"

Adam Googles: "Kızıma nasıl kilo veririm?" En iyi altı arkadaşıyla tatilde olan bir kadın. Bütün arkadaşları sürekli olarak ne kadar eğlendiklerinden bahsediyorlar. Google'a şöyle yazar : "Kocasından uzakta yalnızlık."

en iyi altı arkadaşıyla tatildedir . Google'a şunu yazar : "Karınızın sizi aldattığının işaretleri."

Bu verilerin bir kısmı, başka hiç kimsenin bilmediği bilgileri içerir. Hepsini bir araya getirirsek, anonimliği korurken, kimsenin belirli bireylerin korkularını, arzularını ve davranışlarını öğrenmediğinden emin olursak ve bazı bilimsel veriler eklersek, insanlara yeni bir şekilde bakmaya başlayacağız - davranışları, arzuları, karakterleri.

dijital çağımızda daha erişilebilir hale gelen yeni verilerin insan doğası anlayışımızı kökten genişletme potansiyeline sahip olduğu sonucuna vardım . Mikroskop, bir göletten akan bir damla suda düşündüğümüzden çok daha fazlasını görmemizi sağladı. Teleskop bize gece gökyüzünde çıplak gözle gördüklerimizden çok daha fazlasını gösterdi. Ve şimdi yeni dijital veriler, insan topluluğunda gizlenmiş olan pek çok şeyi bize ifşa ediyor. Modern mikroskobumuz veya teleskopumuz haline gelebilirler ve aldıkları bilgiler en önemli , hatta devrim niteliğinde keşiflere yol açabilir.

başka bir riskli nokta daha var : sadece gösterişli değil , aynı zamanda modaya uygun olarak da algılanabilirler . Birçoğu , herhangi bir kanıt sunmadan büyük verinin gücü hakkında ciddi iddialarda bulundu . Bu , birçoğu olan büyük veri şüphecilerini büyük veri kümelerini keşfetme fikrini reddetmeye sevk etti . Yayıncı ve istatistikçi Nassim Taleb, "Büyük veride bilgi olmadığını söylemiyorum," diye yazıyor, "orada çok fazla bilgi var. Sorun - asıl sorun - sürekli büyüyen samanlıklarda iğne aramak zorunda olmanızdır .

Bu kitabın ana hedeflerinden biri, eksik kanıtları sağlamak ve büyük veri ile neler yapılabileceğini, yani dilerseniz sürekli büyüyen samanlıklarda iğneleri nasıl bulabileceğinizi göstermektir. Gerçekten devrim niteliğinde bir şeyin ana hatlarını görebilmeniz için büyük verinin insan psikolojisi ve davranışına nasıl yeni bir bakış açısı sağladığına dair yeterince örnek sunmayı umuyorum .

"Bekle, Seth," diyebilirsin şimdi. Devrim vaat ediyorsun. Bu büyük yeni veri kümeleri hakkında çok anlamlı konuşuyorsunuz . Ama şu ana kadar, tüm bu harika, etkileyici, akıllara durgunluk veren, çığır açan veri setini bana temelde iki şeyi göstermek için kullandınız : Amerika'da çok fazla ırkçı var ve insanlar, özellikle erkekler, bunu yaparken çok abartıyorlar. ne sıklıkta seks yaptıkları hakkında konuşun.”

olanı doğruladığını kabul ediyorum . Bu sonuçların bariz olduğunu düşünüyorsanız , erkeklerin suyla ilgili ciddi endişeleri ve güvensizlikleri olduğuna dair size Google aramalarından elde edilen açık ve kesin kanıtlar vereceğim 4. Bölüm'e gelene kadar bekleyin. - Penisinizin boyutu.

zaten şüphelenmiş olabileceğiniz , ancak şüphelerinizi doğrulamak için yeterli veriye sahip olmadığınız bir şeyin kanıtı olarak bir değeri olduğunu söyleyebilirim . Şüphelenmek başka, kanıtlamak başka. Ancak bu büyük verinin yapabileceği tek şey şüphelerinizi doğrulamaksa, bu devrim niteliğinde bir şey olmayacaktır. Neyse ki, büyük veri çok daha fazlasını yapabilir. İşlerin düşündüğüm gibi gitmediğini tekrar tekrar bana gösteriyorlar . Oldukça etkileyici ve beklenmedik bulabileceğiniz bazı örnekler.

ekonomik güvensizlik ve savunmasızlık olduğu varsayılabilir . İnsanlar işlerini kaybettiklerinde ırkçılıklarının yoğunlaştığından doğal olarak şüpheleniyorsunuz . Ama aslında işsizlik arttığında ne ırkçı arama sorgularının sayısı ne de Stormfront üye sayısı artıyor.

çok sayıda yüksek eğitimli insanın bulunduğu büyük şehir sakinlerinin doğasında olduğunu düşünmek gelenekseldir . Kentli nevrotik iyi bilinen bir klişedir. Ancak , "anksiyete semptomları" ve "anksiyete yardımı" gibi kaygıyı yansıtan Google aramalarının sayısı, eğitim düzeyinin düşük olduğu, ortalama gelirin düşük olduğu ve nüfusun çoğunun kırsal kesimde yaşadığı yerlerde daha yüksek olma eğilimindedir. alanlar. arazi. Yani, kaygıyla ilgili aramalar, New York'un kendisine kıyasla New York'un taşrasındaki kırsal alanlarda daha yüksek düzeydedir.

Onlarca, yüzlerce insanı öldüren bir terör saldırısının otomatik olarak yaygın bir kitle kaygısına yol açacağını düşünüyorsunuz . Terörizm, tanımı gereği, bir korku duygusu uyandırmalıdır. Google kaygı aramalarına baktım ve 2004'ten bu yana Avrupa veya Amerika'daki her büyük terör saldırısını takip eden günlerde, haftalarda ve aylarda ülke genelinde bu aramalardaki artışı takip ettim . Peki kaygıyla ilgili arama sorguları ortalama olarak ne kadar arttı ? Ne kadar değil. Hiç.

İnsanların üzgün olduklarında şaka arama olasılıklarının daha yüksek olduğunu düşünüyorsunuz. En büyük düşünürlerin çoğu, bir ağrı kesici olarak mizaha yöneldiğimizi savundu. Mizah uzun zamandır başa çıkmanın bir yolu olarak görülüyor

keder, acı, hayattaki kaçınılmaz hayal kırıklıkları ile. Charlie Chaplin'in dediği gibi: "Kahkaha bir lakaptır, rahatlamanın, acıyı unutmanın bir yoludur."

Ancak, en şanssız gün olarak bilinen Pazartesi günü, şaka arama oranları en düşük seviyededir . Aynı şey bulutlu ve yağmurlu günler için de söylenebilir. Ve bu seviye, 2013 Boston Maratonu sırasında iki bombanın üç kişiyi öldürmesi ve yüzlercesini yaralaması gibi büyük bir trajedinin ardından düşüyor . Aslında insanlar işler iyi giderken şakaları tercih ederler, tersi değil.

Bazen yeni bir veri seti, asla hayal bile edemeyeceğim davranışları, özlemleri veya tutumları ortaya çıkarır. Çok sayıda cinsel tercih bu kategoriye girer. Örneğin, Hindistan'da çoğu arama sorgusunun "kocam istiyor..." sözleriyle başladığını biliyor muydunuz? Örneğin : "Kocam onu emzirmemi istiyor" 11 . Bu istek Hindistan'da diğer ülkelere göre çok daha yaygın. Ayrıca, bir kadının bir erkeği emzirdiği porno resim sitelerindeki arama oranları , Hindistan ve Bangladeş'te diğer ülkelere göre dört kat daha yüksek. Tabii ki, bu verileri görmeden önce hiç böyle bir şeyden şüphelenmedim.

Erkeklerin penislerinin boyutuna takıntılı olması pek şaşırtıcı gelmeyebilir, ancak Google'a göre kadınların vücutlarıyla ilgili en çok endişe duydukları şey gerçekten şaşırtıcı. Bu yeni bulgulara dayanarak, penis boyutu kompleksinin dişi eşdeğeri, empatik bir duraklamadır! - vajinalarının nasıl koktuğu konusunda endişelenmek. Kadınlar, cinsel organlarıyla ilgili endişelerini dile getiren aramaların çoğunu erkeklerin kendi organlarının büyüklüğüyle ilgili yaptıkları kadar çok yapıyor . Bir kadının asıl endişesi kokusu ve onu nasıl iyileştirebileceğidir. Tabii ki, bu tür verileri keşfedene kadar bunu bilmiyordum.

, aklıma bile gelmeyen kültürel farklılıkları ortaya çıkarıyor . İşte bir örnek: dünyanın her yerindeki çok farklı insanlar, eşlerinin hamileliğine tepki gösteriyor. Meksika'da "hamile karım" için en çok yapılan sorgular arasında "frases de amor para mi esposa embarazada" ( hamile karıma aşk ilanı ) ve "poemas para mi esposa embarazada" ifadeleri yer alıyor. (hamile karım için şiirler). Amerika Birleşik Devletleri'nde en çok yapılan arama sorguları şu ifadelerden oluşur: "karım hamile - şimdi ne olacak?" ve "Karım hamile - ne yapmalıyım?".

, bu bilgilerin çoğunu içerecek olsa da, tuhaf gerçekler veya anekdot niteliğindeki çalışmalardan oluşan bir koleksiyondan daha fazlasıdır . Bu teknik yepyeni olduğu ve ivme kazandığı için burada nasıl çalıştığı ve onu bu kadar devrimci yapan şeyin ne olduğu hakkında bazı fikirler vereceğim . Büyük verinin de sınırları olduğunu kabul ediyorum.

Potansiyel bir bilgi devrimi karşısında duyulan coşku pek uygun değil. Büyük veriye deli olanların çoğu, bu muazzam miktardaki bilginin nasıl kullanılacağına dair fikirlerle dolup taşıyor . Bu takıntı yeni değil. Google, Amazon ve Facebook'tan önce , "büyük veri" kavramından önce , Dallas'ta bir konferans vardı - "Büyük ve karmaşık veri dizileri". Stanford Üniversitesi'nde istatistik profesörü ve Google'da meslektaşım olan Jerry Friedman 13 , 1977'deki bir konferansta saygın bir istatistikçinin inanılmaz, akıllara durgunluk veren beş gigabaytlık bir veri topladığını iddia ettiğini hatırlıyor . Sonra bir sonraki önde gelen istatistikçi ayağa kalktı ve söze başladı, “Son konuşmacı gigabaytlardan bahsediyordu . Mühim değil. Terabaytlarım var. Yani sunumların odak noktası, bu birikmiş verilerle neler yapılabileceğine veya hangi soruların cevaplanabileceğine odaklanmaktan çok, ne kadar bilgi biriktirilebileceğine kaydı. Friedman, "O zamanlar herkesin dinleyicileri ne kadar büyük bir veri seti toplayabildikleriyle etkilemeyi ummasının komik olduğunu düşünmüştüm," dedi. Ve bu güne kadar devam ediyor.”

Bugün çok fazla veri bilimcisi ve bilim adamı büyük miktarda bilgi biriktirdi, ancak bize çok az bilgi veriyorlar, örneğin Knicks basketbol kulübü New York'ta popüler . Çok fazla şirket, büyük miktarda veri içinde boğuluyor. Çok fazla terabayt bilgi var , ancak kendilerine ait çok az fikir var. Kanımca, veri miktarının önemi genellikle abartılıyor . Ve küçük ama çok önemli bir nokta göz önüne alındığında bunu fark etmek kolaydır: fenomen ne kadar önemliyse, onu tespit etmek için o kadar az gözlem gerekir . Ne kadar tehlikeli olduğunu anlamak için sıcak bir sobaya bir kez dokunmanız yeterlidir. Ama başınızın ağrıyıp ağrımadığını anlamak için binlerce kez kahve içmeniz gerekebilir . Hangi faktör daha ciddi?

yoğunluğu nedeniyle minimum miktarda veri ile anında sonuç almanızı sağlayan sıcak bir soba.

Bu nedenle, en akıllı büyük veri şirketleri genellikle ellerinde bulunan veri kümelerini kısaltır . Google'da önemli kararlar, ellerindeki verilerin yalnızca küçük bir kısmına dayanarak verilir . Önemli sonuçlara varmak için her zaman tonlarca bilgiye ihtiyacınız yoktur. Doğru verilere ihtiyacınız var . Google aramalarının en değerli bilgileri sağladığına dair temel argüman , bunların çok olması değil, içlerindeki insanların çok açık sözlü olmasıdır . Arkadaşlara, sevgililere ve metreslere, doktorlara , anketlere ve kendimize yalan söylüyoruz . Ancak Google, seks olmadan evlilik, akıl hastalığı, güvensizlik, siyahlara karşı düşmanlık gibi oldukça tartışmalı bilgiler dahil olmak üzere kişisel konuları tartışmak için bir fırsat sunuyor .

Büyük verilerle çalışırken en önemli şey, önemli sonuçlara varmak için doğru soruları sorabilmektir. Bir teleskopu yanlışlıkla gece gökyüzüne doğrultup orada Plüton'u bulmak imkansız olduğu gibi, bir yığın veriyi indirip insan doğasının sırlarını keşfetmek de imkansızdır . Örneğin Hindistan için en umut verici arama ifadelerini vurgulamanız gerekecek , bunlar "kocam istiyor ..." sözleriyle başlayan Google sorgularıdır.

Bu kitap size büyük verilerden en iyi şekilde nasıl yararlanabileceğinizi gösteriyor ve bu veri kümelerinin neden bu kadar önemli olduğunu ayrıntılı olarak açıklıyor . Ve bu arada, benim ve diğer insanların bu yöntemi kullanarak zaten keşfettiğimiz pek çok ilginç şey öğreneceksiniz, örneğin:

  • Kaç eşcinsel erkek var?
  • Reklamcılık gerçekten işe yarıyor mu?
  • Amerikan Firavunu neden en iyi yarış atıdır ?
  • Medya meşgul mü?
  • Herhangi bir Freudcu çekince var mı?
  • Kim vergi kaçırıyor?
  • Hangi üniversiteye gittiğin önemli mi?
  • Borsada kazanabilir misin?
  • Çocuk yetiştirmek için en iyi yer neresidir?
  • Hikayeler web üzerinde nasıl dağıtılır?
  • buluşma istiyorsanız, ilk buluşmada ne hakkında konuşmalısınız ?

...Ve daha birçokları.

Ancak buna gelmeden önce, temel bir soruyu tartışmamız gerekiyor : tüm bu verilere neden ihtiyacımız var? Ve bunun için seni büyükannemle tanıştırmak istiyorum.

BÖLÜM I

VERİ, BÜYÜK VE KÜÇÜK

Baba ve anne

Bölüm 1

SEZGİ
SİZİ KANDIRIR

33 yaşındaysanız ve arka arkaya birkaç Şükran Günü geçirdiyseniz, büyük olasılıkla bir eş seçme konusu gündeme gelecektir. Ve herkesin bu konuda kendi görüşü var.

Ablam, "Seth'in ona denk çılgın bir kıza ihtiyacı var," diyor.

"Sen delisin! Onu dengelemek için normal bir kıza ihtiyacı var ”diyor erkek kardeş.

Anne, "Seth deli değil," diye yanıt verir.

"Çılgınsın! Tabii ki Seth gerçek bir psikopat," diyor baba.

Aniden, utangaç, yumuşak dilli büyükannem sessizce sohbete giriyor. New York'un yüksek, agresif sesleri kayboluyor ve tüm gözler, hafif bir Doğu Avrupa aksanıyla konuşan, kısa altın saçlı, ufak tefek, yaşlı bir kadına çevriliyor .

Seth, senin iyi bir kıza ihtiyacın var. çok güzel değil Çok zeki. İnsanlarla arası iyi, sosyal, böylece birlikte çalışabilirsiniz. Bir mizah anlayışıyla, çünkü iyi bir mizah anlayışın var."

Bu yaşlı kadının tavsiyesi neden dinleniyor ? ailemde bu kadar dikkat ve saygı ile? 88 yaşındaki büyükannem hayatı boyunca masadaki herkesten daha fazlasını gördü. Bazıları mutlu, bazıları mutsuz olan birçok evlilik görmüştü . Ve onlarca yıldır, bir ilişkiyi başarılı kılan niteliklerin bir listesini derledi . Şükran Günü masasında en fazla verinin kaynağı Büyükanneydi. Büyükannemin kendisi de büyük veriydi.

Bu kitapta, veri biliminin gizemini çözmek istiyorum.

Hoşumuza gitsin ya da gitmesin, bilgi her birimizin hayatında giderek daha önemli bir rol oynuyor - ve bu rol giderek daha önemli hale gelecek. Gazeteler artık tamamen verilere ayrılmış tüm bölümlere sahip. Şirketlerin tek görevi topladıkları verileri analiz etmek olan ekipleri var. Yatırımcılar , büyük miktarda veri toplayıp depolayabilirlerse yeni kurulan şirketlere on milyonlarca dolar verir . Regresyonun nasıl çalıştığını asla bilmeseniz ve bir güven aralığı hesaplayamasanız bile, okuduğunuz kitapların sayfalarında, katıldığınız iş toplantılarında, dedikodularda muhtemelen pek çok veriyle karşılaşacaksınız. su içerken, sigara odasında veya soğutucunun yanında kulaklarınızı tanırsınız .

Birçok kişi bu gelişmeden endişe duyuyor. Verilerden korkarlar, kolayca kaybolurlar ve sayıların dünyasında tamamen kafaları karışabilir. Niceliksel bir dünya anlayışının kendilerine göre değil, seçilmiş birkaç sol beyin delisine göre olduğunu düşünüyorlar . Dolayısıyla sayılarla karşılaştıkları anda sayfayı çevirmeye, toplantıyı bitirmeye veya sohbetin konusunu değiştirmeye hazırdırlar.

alandaki en önemli kişilerin çoğuyla çalışma şansına sahip oldum . Öğrendiğim en önemli derslerden biri, bilgiyi doğru almanın birçok insanın düşündüğü kadar zor olmadığıdır . Veri biliminin en iyi örnekleri gerçekten ne kadar sezgisel olduğunu gösteriyor 1 .

Veri bilimini bu kadar sezgisel yapan nedir? Özünde bu disiplin, doğru verileri belirleyip seçmek ve bir değişkenin diğerini nasıl etkileyeceğini tahmin etmekle ilgilidir. İnsanlar bunu her zaman yapar.

Büyükannemin ilişkim hakkında bana nasıl tavsiye verdiğini bir düşünün. Neredeyse tüm hayatı boyunca beynine yüklenmiş olan geniş bir ilişki veri tabanı kullandı -aile üyelerinden, arkadaşlarından ve tanıdıklarından duyduğu hikayeler . İlk başta, analiz için verileri , adamın benim sahip olduğum niteliklerin çoğuna sahip olduğu ilişki örnekleriyle sınırladı - duyarlılık , kendini izole etme eğilimi, mizah duygusu. Sonra bu örnekte tanıdığı kadınların temel niteliklerine odaklandı : ne kadar kibar, zeki ve güzellerdi. Sonra kadınların bu temel niteliklerini ilişkinin en önemli unsuruyla karşılaştırdım : iyi olup olmadıkları. Ve sonunda sonucu bildirdi. Başka bir deyişle, kalıpları fark etti ve bir değişkenin diğerini nasıl etkileyeceğini tahmin etti. Bu durumda, büyükanne bir veri bilimcisi olarak hareket etti.

Siz de bir veri bilimcisisiniz . Çocukken şunu fark ettiniz: Ağlamaya başlar başlamaz anneniz hemen dikkatleri üzerinize çekti. Bu aynı zamanda veri biliminin bir parçasıdır. Yetişkinliğe ulaştığınızda , çok fazla sızlanıp şikayet ederseniz, insanların sizden kaçmaya başlayacağını fark edersiniz. Bu aynı zamanda veri bilimidir. İnsanlar sizinle daha az iletişim kurduğunda ruh haliniz bozulur, mutsuz olursunuz. Daha az mutlu olduğunuzda daha az arkadaş canlısı olursunuz ve daha az arkadaş canlısı olduğunuzda insanlar sizden daha da uzak durmayı tercih eder . Bu veri bilimidir. Veri bilimi her yerde. Veri bilimi her yerde.

hemen hemen her zeki kişi tarafından çözülebileceğini keşfettim . Araştırmanın ne hakkında olduğunu anlayamıyorsanız, sorun muhtemelen sizde değil, araştırmanın kendisindedir.

Büyük veri biliminin genellikle sezgisel olduğuna dair kanıta mı ihtiyacınız var ? Son zamanlarda , son birkaç yılın en önemli çalışmalarından biri olabilecek bir şeye rastladım . Aynı zamanda şimdiye kadar gördüğüm en sezgisel olanlardan biri . Sadece önemini değil, anneannemin yaptıklarına ne kadar doğal ve benzer olduğunu da düşünmenizi istiyorum .

Üniversitesi ve Microsoft'tan bilim adamlarından oluşan bir ekip tarafından gerçekleştirildi . Amaç, insanlarda pankreas kanseri başlangıcını tahmin eden semptomları bulmaktı 2 . Bu hastalıkta, hastaların sadece yüzde üçü beş yıldan fazla hayatta kalır, ancak hastalığın erken teşhisi hastanın şansını ikiye katlayabilir.

Araştırmacılar hangi yöntemi kullandı? Microsoft'un arama motoru Bing'in on binlerce anonim kullanıcısının verilerini kullandılar . Bu , "Bana pankreas kanseri teşhisi kondu" veya "Pankreas kanseri olduğum söylendi, ne bekleyebilirim?" gibi hatasız bir arama terimine dayalı olarak yakın zamanda pankreas kanseri teşhisi konan kullanıcıları hedefliyordu.

ortaya çıkan semptomlarla ilgili sorguları aradılar . Teşhislerini hemen bildirmeyen az sayıda kullanıcının verilerini, hiç bildirmemiş olanlarla karşılaştırdılar. Başka bir deyişle, teşhisini ancak birkaç hafta veya ay sonra kabul edenleri hangi semptomların rahatsız ettiğini bulmaya çalıştılar .

Sonuçlar tek kelimeyle muhteşemdi. Pankreas kanserinin belirtileri sırt ağrısı ve ardından cildin sararmasıydı. Sadece sırt ağrısıyla ilgili bir arama sorgusu, çoğunlukla kansere atıfta bulunmadı. Benzer şekilde, "Karın ağrısının ardından gelen hazımsızlık" arama terimi pankreas kanserine işaret ederken , ağrısız hazımsızlık bu korkunç tanıyı ima etmez . Araştırmacılar, çok az veya hiç yanlış pozitif olmayan vakaların %5 ila 15'ini tespit edebildiler. Kulağa özellikle iyi bir sonuç gibi gelmeyebilir, ancak pankreas kanseriniz varsa, hayatta kalma şansınızı ikiye katlamak için %10'luk bir şans bile beklenmedik bir nimet olarak görülecektir.

Makalede sunulan çalışmanın ayrıntılarını uzman olmayan birinin tam olarak anlaması zor olacaktır . Kholmogorov-Smirnov testi gibi birçok teknik terimi içerirler [6], itiraf etmeliyim ki anlamını çoktan unutmuşum.

Ancak, bu olağanüstü araştırmanın en temel düzeyinde ne kadar doğal ve sezgisel olduğuna dikkat edin. Bilim adamları çok çeşitli tıbbi vakaları incelediler ve semptomları belirli bir hastalıkla ilişkilendirmeye çalıştılar. Bir kişinin hasta olup olmadığını öğrenmeye çalışırken bu tekniği başka kimlerin kullandığını biliyor musunuz ? Karı kocalar, babalar ve anneler, hemşireler ve doktorlar. Tecrübe ve bilgilerine dayanarak ateş, baş ağrısı, burun akıntısı ve mide ağrısını çeşitli rahatsızlıklarla birleştirmeye çalışırlar. Başka bir deyişle , Columbia Üniversitesi ve Microsoft'tan araştırmacılar , en yaygın ve bariz yöntemi kullanarak çığır açan bir çalışma yürüterek teşhise dayalı yayınlar yaptılar.

Fakat bekle. Yavaşlayalım. En iyi bilimsel veri işleme, sıklıkla iddia ettiğim kadar doğal ve sezgiselse, bu, büyük verinin değeri hakkında temel bir soruyu gündeme getiriyor. İnsanlar doğal veri bilimciyse, veri biliminin kendisi sezgiselse , neden bilgisayarlara ve istatistiksel yazılımlara ihtiyacımız var? Kholmogorov-Smirnov testlerine neden ihtiyacımız var? Sadece sezgimizi kullanamaz mıyız ve hepsi bu mu? Anneannemin yaptığı gibi, hemşirelerin ve doktorların çalışma şeklini biz de yapamaz mıyız?

, Malcolm Gladwell'in insan içgüdülerinin büyüsünü öven , çok satan kitabı Blink'in yayımlanmasıyla pekiştirildi . Gladwell, yalnızca sezgilerine güvenerek, bir heykelin sahte olup olmadığını çarpmadan önce - tenisçinin topu kaçırıp kaçırmadığını veya müşterinin ne kadar ödemeye istekli olduğunu - heykel ağzını açmadan önce anlayabilen insanların hikayelerini anlatır . Bu kitaptaki karakterler regresyon hesaplamaz , güven aralıkları belirlemez ve Kholmogorov-Smirnov testleri yapmazlar, ancak şaşırtıcı tahminler yapma eğilimindedirler. Pek çok insan bilinçaltında Gladwell'in sezgi görüşünü destekler - içgüdülerine ve duygularına güvenirler . Romanın hayranları, büyükannemin bilgeliğine ve bilgisayarların yardımı olmadan insan ilişkileri hakkında tavsiye verme yeteneğine kesinlikle hayran kalacaklar. Blink hayranları , eminim ki, bilgisayar kullandığı için bu kitapta anlatılan araştırmama veya diğer gelişmelere hayran olmaya daha az meyillidir. Eğer büyük veri -büyükannemden gelen bilgi değil , bilgisayar verisi- devrim niteliğindeyse , onun bizim yardımsız sezgilerimizden daha fazlasını yapabileceğinin kanıtlanması gerekir . Gladwell'in işaret ettiği gibi, çoğu zaman şaşırtıcı sonuçlar üretebilir.

ve Microsoft tarafından titiz bilimsel veriler ve bilgisayar hesaplamaları kullanılarak yapılan bir araştırma , sezginin asla ulaşamayacağı şeyleri görsel olarak göstermeyi mümkün kılıyor . Bu, bilgi miktarının önemli bir rol oynadığı durumlarda da geçerlidir . Bazen sezgilerimiz yararlanacak kadar deneyime sahip değildir. Siz, arkadaşlarınız veya aile üyelerinizin, karın ağrısının eşlik ettiği hazımsızlık ile ağrısız sıradan hazımsızlık arasındaki farkı anlayacak kadar pankreas kanseri vakası görmeniz olası değildir . Bir noktada, arama sorguları dizisi giderek büyüyecek ve sonuç olarak, araştırmacılar kaçınılmaz olarak bu hastalığın veya diğer hastalıkların semptomları ve belirtileri arasında deneyimli doktorların bile gözden kaçırabileceği daha az fark edilebilir modeller bulacaktır.

Ayrıca, sezgilerimiz genellikle bize dünyanın nasıl çalıştığına dair iyi bir genel fikir verebilse de , çoğu zaman doğru bir sonuç vermez.

Görüntüyü keskinleştirmek için daha fazla veriye ihtiyacımız var . Örneğin, yılların ruh hali üzerindeki etkisini düşünün . +21 derece yerine -12 derecede insanların pek mutlu olmayacağını düşünebilirsiniz . Evet bu doğru. Ancak bu sıcaklık farkının etkisinin ne kadar büyük olduğunu fark etmeyebilirsiniz. Google'da depresyon aramaları ile ekonomik koşullar, eğitim düzeyi ve kiliseye devam gibi bir dizi faktör arasındaki ilişkileri aradım . Kış iklimi her şeyden ağır basar 3 . Kış aylarında, sıcak iklimlerde (Hawaii gibi), soğuk iklimlere (Illinois gibi) göre %40 daha az depresyon araması yapılıyor . Ancak bu etki ne kadar önemli? Antidepresanların etkinliği konusunda oldukça iyimser bir görüşünüz varsa , en iyi ilaçların bile depresyonu yalnızca %20 oranında azalttığını görünce şaşıracaksınız . Google'ın sağladığı rakamların söyleyebileceği kadarıyla , Chicago'dan Honolulu'ya taşınmak, herhangi bir kış hüznü tedavisinden en az iki kat daha etkili olacak [7].

Bazen sezgimiz - dikkatli bir bilgisayar analizi tarafından yönlendirilmezse - bizi yanlış yöne yönlendirebilir. Kendi yaşam deneyimlerimiz ve kökleşmiş önyargılarımız bizi kör edebilir. Gerçekten de, yılların deneyimini ailenin geri kalanından daha iyi ilişkiler tavsiyesi vermek için kullanabilen bir büyükanne bile , güçlü bir ilişkinin nedenleri hakkında hala bazı şüpheli fikirlere sahiptir . Örneğin, evliliğinin başarısında kilit bir faktör olarak ortak arkadaşlara sahip olmanın önemini sık sık vurguladı. En keyifli akşamları kocası, büyükbabamla Queens, New York'taki küçük arka bahçelerinde katlanır sandalyelerde oturup komşularla dedikodu yaparak geçirdi .

Bununla birlikte, sevgili büyükannemi günah keçisi yapma riskini alsam da, bilimsel kanıtlar onun teorisinin yanlış olduğunu gösteriyor. Bilgisayar bilimcilerinden oluşan bir ekip, yakın zamanda insan ilişkileri hakkında şimdiye kadar var olan en büyük gerçekleri 4 analiz etti - Facebook. Bir noktada "ilişki içinde" olan çok sayıda çifti izlediler . Bu çiftlerden bazıları kendilerinde kaldı, diğerleri "bekar" statüsüne geçti . Bilim adamlarının bulduğu gibi, ortak bir arkadaş grubuna sahip olmak, bir ilişkinin uzun SÜRMEYECEĞİNİN oldukça önemli bir göstergesidir. Partnerinizle ve aynı küçük insan grubuyla her gece takılmak o kadar da iyi olmayabilir, ancak farklı sosyal çevrelere sahip olmak ilişkinin sağlamlaşmasına yardımcı olabilir.

Gördüğünüz gibi, sadece sezgisel olarak hareket ederek ve bilgisayar kullanmayı reddederek, bazen şaşırtıcı sonuçlara ulaşıyoruz. Ancak bu da ciddi hatalara yol açabilir. Büyükanne bilişsel tuzaklardan birine düşmüş olmalı: Bazen kendi deneyimlerimizin önemini abartma eğilimindeyiz . Veri bilimcilerin dilinde, tek bir kaynaktan alınan gerçeklere çok daha fazla değer veriyoruz: kendimiz.

, büyükbabası ve arkadaşlarıyla yaptığı akşam toplantılarının anılarına o kadar odaklanmıştı ki, diğer çiftlerle yeterince ilgilenmiyordu. Örneğin, bütün akşam küçük bir düzenli arkadaş grubuyla sohbet eden , ancak sık sık kocasıyla tartışan kayınbiraderi ve güzel karısıyla durumu değerlendirme fırsatını kaçırdı . Sonunda anlaştılar. Büyükanne, ebeveynlerimin - kızı ve damadı - hikayesini tam olarak düşünmeyi unuttu. Akşamları genellikle kendi başlarına geçirdiler : babam arkadaşlarıyla bir caz kulübünde veya baloda oynadı ve annem arkadaşlarıyla bir restorana veya tiyatroya gitti, ancak bu onların evlilikte uzun yıllar mutlu yaşamalarını engellemedi.

olup bitenleri dramatize etmeye yönelik temel insan eğilimi tarafından da aldatılabiliriz . Unutulmaz bir hikayenin temelini oluşturabilecek her şeyin önemini abartmayı seviyoruz . Örneğin, bir araştırma kasırgaların astımdan daha yaygın bir ölüm nedeni 5 olarak görüldüğünü buldu . Aslında, yaklaşık 70 kat daha fazla insan AST 6'dan ölmesine rağmen . Astımdan ölümle ilgili etkileyici bir şey yok, bu vakalar haber olmuyor. Ancak kasırgalardan ölümler düşüyor.

Başka bir deyişle, yalnızca duyduklarımıza veya kişisel deneyimlerimize dayanarak, dünyanın yapısı hakkında genellikle yanlış kararlar veririz. Olguları doğru bir şekilde ele alma metodolojisi bir o kadar sezgisel olsa da, sonuçları genellikle paradoksaldır. Veri bilimi, doğal ve sezgisel bir insan niteliğini - kombinasyonları ve bağlantıları görme ve onlara anlam verme yeteneği - alır ve ona güç katarak dünyanın düşündüğümüzden tamamen farklı olduğunu gösterir. Basketbolda tahmini performans göstergelerini araştırdığımda olan tam olarak buydu .

Çocukken tek bir hayalim vardı. Ekonomist ve veri bilimcisi olmak için büyümek istedim . Hayır, tabii ki şaka yapıyorum. Tüm zamanların en iyi New York Knicks pivotu olan idolüm Patrick Ewing'in ayak izlerini takip edebilmek için umutsuzca profesyonel bir basketbol oyuncusu olmayı istiyordum .

Bazen bana öyle geliyor ki, veri toplayan, inceleyen ve analiz eden her bilim adamının içinde , çocukluk hayallerinin neden gerçekleşmediğini anlamaya çalışan bir çocuk var . Bu nedenle, son zamanlarda NBA'e girmek için gereken ölçütlere yakından bakmam şaşırtıcı değil . Çalışmanın sonuçları beklenmedikti. Aslında, veri biliminin dünya görüşünüzü ne kadar ciddi şekilde değiştirebileceğini ve sayıların ne kadar mantık dışı olabileceğini bir kez daha gösterdiler.

Şu soruyu düşündüm:
NBA'de kimin başarılı olma olasılığı daha yüksek - fakirler mi yoksa
orta sınıf mı?

Çoğu insan eski olduğuna inanır. Günün bilgeliği , zor koşullarda büyüyenlerin, belki de bekar bir genç anneden doğanların, bu rekabetçi sporda maksimum başarıya ulaşmak için gereken dürtüyü kazandığını söylüyor.

Bu bakış açısı, Philadelphia'da bir lise basketbol koçu olan William Ellerbee tarafından Sports Illustrated ile yapılan bir röportajda dile getirildi. "Banliyö çocukları kendi zevkleri için oynama eğilimindedir" dedi. "Şehir çocukları için basketbol oynamak bir ölüm kalım meselesi . " 8 Ne yazık ki ben, New Jersey banliyösünde mutlu bir şekilde yaşayan ve evli olan ebeveynler tarafından büyütüldüm . Neslinin en iyi oyuncusu olan LeBron James, Akron, Ohio'da 16 yaşında bekar bir annenin fakir bir ailesinde dünyaya geldi.

Doğal olarak, çevrimiçi anketimin 9 sonuçlarına dayanarak, çoğu Amerikalının Koç Ellerbee ve benimle aynı şekilde hissettiğini varsaydım - çoğu NBA oyuncusu yoksulluk içinde büyüyor.

Bu popüler inanç doğru mu?

Gerçeklere bakalım. NBA oyuncularının sosyoekonomisi hakkında kapsamlı bir veri kaynağı yoktur . Ancak bir dizi kaynağı dikkatlice araştırarak ( basketbol referansı.com, ancestry.com, ABD Sayım Bürosu ve birkaç kişi daha), NBA'de başarıya en çok hangi ailelerin katkıda bulunduğunu anlayabiliriz. Bu çalışmanın, bazıları daha büyük, bazıları daha küçük , bazıları çevrimiçi, diğerleri çevrimdışı olmak üzere çeşitli veri kaynakları kullandığını unutmayın . İlginç bir şekilde, iyi bir veri bilimcisi, aktif olarak yeni dijital kaynaklardan yararlanırken eski moda olanları kullanmaktan çekinmez - eğer faydalı olabilirse. Bir soruya doğru cevabı almanın en iyi yolu, mevcut tüm verileri birleştirmektir.

İlk ilgili bilgi, her oyuncunun vatanıdır . İlk olarak, 1980'lerde ABD'nin her bir ilçesinde kaç tane siyah beyaz erkek doğduğunu yazdım.

Sonra - kaç tanesi NBA'e girdi. Aynı zamanda bu verileri ilgili ilçedeki ortalama aile geliri ile karşılaştırdım . Ayrıca ilçenin ırksal demografisini de kontrol ettim çünkü (ama bu başka bir kitabın konusu) siyah erkeklerin NBA'e girme olasılığı beyaz erkeklere göre yaklaşık 40 kat daha fazla.

Gerçekler bize, bir kişinin daha zengin bir bölgede doğmuş olması durumunda NBA'e girme olasılığının önemli ölçüde daha yüksek olduğunu söylüyor. Örneğin, Amerika Birleşik Devletleri'nin en zengin ilçelerinden birinde doğan siyahi bir çocuğun NBA'e gitme olasılığı, en fakir ilçeden gelen siyahi bir çocuğa göre iki kat daha fazladır. En zengin ilçelerden birinde doğan beyaz bir çocuğun NBA'e girme olasılığı, en fakir ilçeden gelen beyaz bir çocuğa göre %60 daha fazla.

Bu, popüler inanışın aksine, fakir insanların NBA'e girme ihtimalinin aslında daha düşük olduğunu gösteriyor. Bununla birlikte, Amerika Birleşik Devletleri'ndeki New York County (Manhattan) gibi birçok zengin semt Harlem gibi fakir mahalleleri içerdiğinden, bu veriler mükemmel değildir . Yani zorlu bir çocukluk teorik olarak sizi NBA'e sokabilir. Hâlâ daha fazla potansiyel müşteriye, daha fazla veriye ihtiyacımız var.

İşte o zaman NBA oyuncularının ailelerini araştırmaya başladım. Haberlerde ve sosyal ağlarda onlar hakkında bilgi buldum . Bu metodolojinin oldukça zahmetli olduğu ortaya çıktı, bu yüzden analizimi sahada en çok gol atan 1980'lerde doğan 100 siyah oyuncuyla sınırladım . Ortalama bir Afrikalı Amerikalı ile karşılaştırıldığında , genç veya bekar bir annenin bir NBA süper yıldızına sahip olma olasılığı %30 daha azdır. Başka bir deyişle, en iyi siyah basketbolcuların aile koşulları da iyi bir ailenin başarı için bir değer olduğunu gösteriyor.

Bu nedenle, ne bölgedeki ortalama gelir düzeyi ne de sınırlı bir oyuncu örneğinin aile geçmişi, tüm basketbolcuların çocuklukları hakkında doğru bilgi vermemektedir . Bu yüzden, orta gelirli, orta gelirli ailelerin, tek ebeveynli, düşük gelirli ailelerden daha fazla NBA yıldızı ürettiğine hâlâ ikna olmamıştım. Bu soruyu cevaplamak için ne kadar çok gerçek toplayabilirsek o kadar iyi.

Sonra çok yardımcı olabilecek başka bir noktayı hatırladım. İki iktisatçı Roland da Fryer ve Stephen Lewitt'in çalışmasında , bir Afrikalı Amerikalının adının sosyoekonomik durumunun bir göstergesi olduğu ileri sürülmüştür10 . Fryer ve Lewitt , 1980'lerin California doğum belgelerine baktılar ve yoksul, eğitimsiz ve bekar siyah annelerin çocuklarına orta sınıf, eğitimli ve evli ebeveynlerden farklı isimler verdiğini gördüler.

Daha varlıklı geçmişlere sahip çocuklara Kevin, Chris ve John gibi daha tanıdık isimler verilmesi daha olasıdır. Bununla birlikte, dezavantajlı geçmişe sahip çocuklara, Knowshon, Unique veya Breyonshay gibi benzersiz bir ad verilmesi daha olasıdır. Yoksulluk içinde doğan Afrikalı-Amerikalı çocukların, aynı yıl doğan başka hiçbir çocuğun sahip olmayacağı bir isme sahip olma olasılığı iki kat daha fazladır .

Peki siyahi NBA oyuncularının isimleri ne olacak? Kulağa daha çok orta sınıf isimleri gibi mi yoksa fakir insanların isimleri gibi mi geliyor? Aynı zaman diliminde Kaliforniya'da doğan basketbolcuların benzersiz isimlere sahip olma olasılığı, aynı yaştaki ortalama siyah erkekle kıyaslandığında yarı yarıya daha fazlaydı. Bu istatistiksel olarak anlamlı bir farktır.

NBA'in getto çocukları için bir lig olduğunu düşünen birini tanıyor musunuz? Ona bir sonraki maçın raporunu dinlemesini söyle . Russell'ın ne sıklıkla Dwight'ı geçtiğine ve ardından Josh'un uzattığı elinin yanından geçip topu Kevy'nin bekleyen ellerine geçirmeye çalıştığına dikkat etmesini sağlayın . NBA gerçekten de fakir ailelerden gelen siyahlarla dolu olsaydı, rapor kulağa tamamen farklı gelirdi. LeBron'unki gibi isimlere sahip insanlara çok daha fazla gönderme olurdu.

Bu yüzden üç farklı temel ölçütü bir araya getirdik - en iyi oyuncuların annelerinin doğum yeri, medeni durumu ve isimleri. Hiçbir kaynak mükemmel değildir, ancak hepsi aynı sürümü destekler. Sosyo-ekonomik durum ne kadar yüksekse , NBA'e girme şansı o kadar yüksektir. Başka bir deyişle, geleneksel bilgelik yanlış tepti.

1980'lerde doğan tüm Afrikalı Amerikalıların yaklaşık %60'ının ebeveynleri evli değil11 . Ancak, tahminime göre, o on yılda doğan ve NBA'e girmeyi başaran siyahların büyük bir çoğunluğu tam bir ailede büyüdü. Başka bir deyişle, çoğu basketbolcu LeBron James'ten farklı bir çocukluk geçirdi. Aralarında daha çok, ona elektronik aletlere ilgi aşılayan iki ebeveynle birlikte Teksas'ta büyüyen Chris Bosh'a benziyordu. Ya da Kuzey Karolina, Lewisville'den orta sınıf bir anne babanın ikinci oğlu olan Chris Paul gibi .

Bir veri bilimcinin amacı, anlamaktır . dünya. Görünüşte mantıksız bir sonuç bulunduğunda , daha fazla bilimsel veri alınmaya çalışılabilir ve dünyanın neden bize göründüğü gibi çalışmadığı açıklanabilir. Örneğin, orta sınıf ailelerden gelen erkeklerin basketbolda yoksul ailelerden gelen erkeklere göre neden bir avantajı var? En az iki açıklama var.

Birincisi, fakir ailelerin erkekleri daha kısa olma eğiliminde olduğu için. Bilim adamları, çocuk bakımının ve doğru beslenmenin büyük bir rol oynadığını ve sağlığa katkıda bulunduğunu uzun zamandır biliyorlar. Bu nedenle gelişmiş ülkelerde ortalama bir insan 12 yıl öncesine göre artık 10 cm daha uzun . İstatistikler, fakir Amerikalıların kötü sağlık ve beslenme nedeniyle çocukken daha kısa büyüdüğünü gösteriyor .

İstatistikler ayrıca, yüksekliğin NBA'e girme üzerindeki etkisi hakkında bize bilgi verebilir. Uzun boylu olmanın basketbola yeni başlayan biri için bir avantaj olduğunu tahmin edebilirsiniz . Bu parametreyi sahadaki tipik bir oyuncu ve tribünlerdeki tipik bir taraftar için [8]karşılaştırmanız yeterli .

Uzun boylu olmak ne kadar önemli? Onun hakkında konuşurken , basketbolcular bazen biraz yalan söyler ve Amerikalı erkeklerin boy dağılımının tam bir listesi yoktur. Ancak kaba bir matematiksel tahminle çalışarak , bu dağılım tahmin edilebilir ve NBA oyuncularının büyümesiyle karşılaştırılabilir. Büyümenin etkisinin çok büyük olduğunu, belki de sandığımızdan da fazla olduğunu görmek zor değil . Kanımca, fazladan her bir santim NBA'e gitme şansınızı ikiye katlıyor. Ve bu tüm ölçek için geçerlidir. 170 cm boyundaki bir adamın NBA'e gitme olasılığı 167,5 cm olan bir erkeğe göre iki kat daha fazla. 211 cm boyundaki bir adamın NBA'e gitme olasılığı 208,5 cm olan bir erkeğin iki katı. Görünen o ki, ikide biri başarıyor Boyu 183 cm'den kısa NBA milyon erkeğe ve boyu 213 cm'nin üzerinde olanların NBA'e girme şansı beşte bir.

Lütfen dikkat: Bu veriler basketbolda zafer hayalimin neden gerçekleşmediğini gösteriyor. Banliyöde büyüdüğümden değil. Gerçek şu ki, 175 cm boyundayım ve beyazım (çok yavaş tepki verdiğim gerçeğinden bahsetmiyorum bile). Ayrıca tembelim. Ve zayıf bir dayanıklılığım var, berbat bir servisim var ve bazen top ellerime çarptığında ve panik ataklarım var.

Pek iyi olmayan ailelerden gelen bazı erkek çocukların NBA'e girememesinin ikinci nedeni, belirli sosyal becerilerin olmamasıdır. Ekonomistler, binlerce okul çocuğundan elde edilen verileri kullanarak , iki orta sınıf ebeveyni15 olan ailelerin toplamda önemli ölçüde daha iyi ebeveynlik yaptıklarını keşfettiler . Ve orada disiplin, azim, kararlılık ve organizasyon gibi becerilerin geliştirilmesine büyük önem veriyorlar.

beceriler potansiyel olarak başarılı bir basketbol kariyerini nasıl raydan çıkarır?

1990'ların en yetenekli ve gelecek vadeden basketbolcularından biri olan Doug Renn'in hikayesine bir göz atalım . Geleceğin birçok NBA yıldızını yetiştiren Connecticut Üniversitesi'nden kolej koçu Jim Kalan, Doug'ın birlikte çalıştığı tüm erkeklerden daha yükseğe sıçradığını söyledi . Ancak Rennes 17'nin karakteri çok karmaşıktı. Seattle'ın en yoksun mahallelerinden biri olan Blood Alley'de bekar bir anne tarafından büyütüldü. Connecticut'ta sürekli olarak başkalarıyla çatıştı. Oyuncularla dalga geçmeyi severdi , koçları sürekli sorularla taciz ederdi ve takım kurallarını ihlal ederek bol giysiler giyerdi. Ayrıca kanunla sorunları vardı - bir mağazadan ayakkabı çaldı ve polis memurlarına yumruklarıyla saldırdı. Calan'ın sabrı taştı ve Doug takımdan atıldı.

Rennes ikinci şansını Washington Üniversitesi'nde elde etti . Ama orada bile, insanlarla geçinememesi tamamen kendini gösterdi. Adam oyun süresi nedeniyle koçuyla ve top pasları nedeniyle ortaklarıyla tartıştı. Genelde burada da takımdan atıldı. Wrenn, NBA sahasını kaçırdı, çeşitli ikinci lig takımlarında oynadı, annesinin yanına taşındı ve sonunda hapse girdi. Renn, 2009'da Seattle Times'a "Kariyerim bitti" dedi . “Hayallerim, özlemlerim bitti. Doug Renn 18 yaşında öldü . Bir basketbolcu olarak öldüm. Herşey bitti". Rennes yetenekliydi ve sadece bir NBA oyuncusu değil, efsanevi bir oyuncu olabilirdi . Ama kolej takımında kalmak için bile öfkesine hakim olmaya çalışmadı . Belki daha pembe bir çocukluk geçirmiş olsaydı , bir sonraki Michael Jordan olabilirdi .

Bu arada, Michael Jordan az önce zirveye etkileyici bir sıçrama yaptı. Büyük bir kendine güveni ve yüksek rekabet gücü vardı - karakteri Rennes'in karakterinden pek farklı değildi. Jordan zor bir çocuktu 19 . 12 yaşında kavga ettiği için okuldan atıldı. Ama en azından Rennes'de olmayan bir şeye sahipti - iyi bir orta sınıf eğitimi. Babası General Electric'te makine mühendisi ve vardiya amiriydi , 20 ve annesi bir bankada çalışıyordu. Ve kariyer kararı vermesine yardımcı oldular.

, bu yetenekli ve rekabetçi kişiliğin içine düşebilecek tuzakları aşmasına 21 ailesinin nasıl yardım ettiğine dair öykülerle doludur . Michael okuldan atıldıktan sonra annesi onu işe götürdü. Arabadan inmesine izin verilmedi, bunun yerine çocuk park yerinde oturup kitap okumak zorunda kaldı. Chicago Bulls tarafından işe alındıktan sonra, ebeveynleri ve kardeşleri, şöhret ve paranın getirdiği ayartmalardan kaçındığından emin olmak için sırayla onu ziyaret ettiler.

Jordan'ın kariyeri, Wrenn'in Seattle Times'daki röportajında yaptığı gibi bitmedi. Michael , milyonlarca kişi tarafından izlenen Basketball Hall of Fame 22'ye girişinden önce yaptığı bir konuşmayla muhteşem koşusunu bitirdi . Jordan konuşmasında her zaman "yalnızca iyiye konsantre olmaya çalıştığını - onlara saygı duyarsanız insanların sizi nasıl algıladıklarını bilirsiniz ... toplum içinde nasıl algılandığınızı" söyledi. “ Bir dakika durun ve ne yaptığınızı düşünün. Ve hepsi ailem sayesinde."

Gerçekler bize Jordan'ın orta sınıf evli ailesine teşekkür etmekte kesinlikle haklı olduğunu söylüyor. Gerçekler bize, işlevsiz ailelerde, dezavantajlı topluluklarda, NBA'de oynamaya oldukça uygun, ancak oraya asla ulaşamayacak yetenekli insanlar olduğunu söylüyor. Bu insanlar doğru genlere sahipler, hırsları var ama basketbol süperstarı olmak için gerekli karakter yapısını hiçbir zaman yapmadılar.

Ve sezgilerimizin bize söylediği gibi, basketbolun “bir ölüm kalım meselesi” haline gelmesine neden olacak kadar korkunç koşullarda olmak bile yardımcı olmuyor. Bu, Doug Renn'in kaderi gibi hikayelerle kişisel olarak gösterilmektedir. Ve gerçekler sezgiyi destekler.

ikinci kez NBA şampiyonluğunu kazandıktan sonra 23 ile televizyonda röportaj yaptı . (Bu, o zamandan beri üçüncü kez .) Akron, Ohio'dan "Ben LeBron James," dedi . Kent sakini. Burada olmam bile gerekmiyordu." Twitter ve diğer sosyal ağlar anında eleştiri yağmuruna tutuldu. İnanılmaz derecede erken yaşta parlak bir basketbol geleceği için kaderinde olan bu kadar yetenekli bir adam nasıl olur da onun yabancı statüsü hakkında konuşabilirdi? Aslında , benzer şekilde zor başlangıç koşullarında olan birinin , atletik yetenekleri ne olursa olsun, hiç şansı olmazdı. Diğer bir deyişle, James'in başarıları ilk bakışta göründüğünden çok daha güzel ve anlamlıdır . Ve gerçekler de bunu destekliyor.

BÖLÜM II

BÜYÜK VERİLERİN GÜCÜ

Bölüm 2

FREUD HAKLI OLMUŞ OLABİLİR Mİ ?

Geçenlerde sokakta yürüyen bir adama "penistrian" (sözcük oyunu: yaya - yaya , penis - penis; "üyelik" çıkıyor) dendiğini duydum. Aldın mı ? "Yaya" ("Yaya") yerine "Penistrian" ("Üye"). Bunu birçok arama sorgusunda gördüm . Bir kişi yürüyen birini görür ve " Penis" ("penis") kelimesini yazar . Bir anlamı olmalı, değil mi?

, müstakbel eşiyle tanışmak için koridorda yürürken bir muzu fena halde özleyen bir adam hakkında bir şey duydum . Bunu , insanların çevrimiçi olarak paylaştığı fantezi büyük veri koleksiyonlarında gördüm . Bir erkek , bir kadınla evlenmek üzereyken fallik şekilli bir meyve yemeyi düşünür . Bu bir şey ifade ediyor mu?

Belki de Freud haklıydı? Teorileri halka ilk sunulduğu andan itibaren , bu soruya verilebilecek en dürüst cevap omuz silkmek olmuştur. Berraklık , Avusturya-İngiliz filozof Karl Popper tarafından tanıtıldı . İddia etti

Freud'un teorisi yanlışlanamaz. Doğru ya da yanlış olup olmadıklarını kontrol etmenin bir yolu yoktu.

Freud, "penistrian" yazan kişinin bastırılmış cinsel arzusunu bu şekilde dışa vurmuş olabileceğini söylemiş olabilir . Ve bir kişi, hiçbir şey göstermediğini, şarap dışı bir yazım hatası olabileceğini söyleyebilir - örneğin "pedaltrian" ("pedalehod") ile aynı . Tam bir "o dedi, o dedi" durumu. Freud, düğün gününde muz yemeyi hayal eden bir beyefendinin bir penis hakkında düşündüğünü ve bunun bir kadınla değil bir erkekle evlenme konusundaki gizli arzusunu ortaya çıkardığını iddia edebilir . Bu beyefendi, sadece bir muz istediğini söylemiş olabilir. Sunağa doğru yürürken aklına bir elma da gelebilirdi.

Freud'un teorisini
gerçekten test etmenin hiçbir yolu yoktu .
Şimdiye kadar.

Veri bilimi, Freud'un teorisinin birçok noktasını çürütülebilir kılar ve bu, onun gücünün test edilmesini sağlar. Rüyalardaki fallik sembollerle başlayalım. Kaydedilmiş rüyalardan elde edilen geniş veri dizisini kullanarak, fallik şekilli nesnelerin bu rüyalarda ne sıklıkta göründüğünü kolayca görebiliriz . Yiyecek, odaklanmak için iyi bir nesnedir . Birçok rüyada görünür ve birçok yiyecek fallik şekillidir 1 - muz, salatalık, sosis vb.

Belirli yiyecekleri diğerlerinden daha fazla hayal etmemize neden olan faktörleri ölçebiliriz: ne sıklıkta yendikleri, çoğu insanın onları ne kadar lezzetli bulduğu ve evet! Onlar gerçekten fallik mi?

Biri erkeklik organı şeklinde olan, eşit derecede popüler iki ürünü test edebilirsiniz. Bir veya başka bir ürün rüyalarda ne sıklıkla ortaya çıkıyor? Fallus şeklindeki yiyecekler rüyalarımızda diğer formlardaki yiyeceklerden daha sık görünmüyorsa , fallik semboller rüyalarımızda önemli bir faktör değildir. Büyük veri sayesinde, Freud'un teorisinin bu kısmı aslında çürütülebilir.

Kullanıcıları rüyalarını kaydetmeye davet eden bir uygulama olan Shadow'dan bilgi aldım ve on binlerce rüyada yer alan ürünleri inceledim.

Genel olarak, yemek hakkında rüya görmemize neden olan nedir? Ana prognostik faktör, bu belirli yiyecekleri ne sıklıkla yediğimizdir. Bir rüyada en sık gördüğümüz madde sudur. En iyi 20 rüya yiyeceği tavuk, ekmek, sandviç ve pirinci içerir . Bunun Freudyen olmadığına dikkat edin.

Belirli bir yiyeceğin rüyalarımızda ne sıklıkta görüneceğinin ikinci belirleyicisi, onun ne kadar lezzetli olduğunu düşündüğümüzdür. Rüyalarda en sık gördüğümüz iki yiyecek de Freud'un teorisine uymuyor: çikolata ve pizza.

Peki ya ürünlerin fallik şekli? Belki de bu tür yiyecekler beklenmedik bir şekilde rüyalarımıza sık sık giriyor? Hiçbir şekilde.

Muz, rüyalarda en sık görülen ikinci meyvedir. Ama aynı zamanda en çok yenen ikinci meyvedir . Bu nedenle , rüyamızda neden bu kadar sık muz gördüğümüzü açıklamak için Freud'a ihtiyacımız yok . Salatalık, rüyalarda en sık görülen yedinci sebzedir. Ancak en çok tüketilen sebzeler listesinde yedinci sırada yer alıyorlar. Yani rüyamızdaki varlıklarını bir şekil ile açıklamaya gerek yoktur . Sosisli sandviçler, hamburgerlerden çok daha az rüya görür. İnsanların sosisli sandviçten daha çok hamburger yediği gerçeği göz önüne alındığında bu doğrudur.

bilim adamlarının verileri toplarken ve analiz ederken çeşitli faktörlerin etkilerini ayırmasına olanak tanıyan bir yöntem ), fallus şeklindeki yiyeceklerin rüyalarımızda göründüğünden daha olası olmadığını buldum. her ürünün popülaritesi. . Ve bu tüm meyve ve sebzeler için geçerlidir. Dolayısıyla, bu Freudcu teori yanlışlanabilir ve en azından topladığım bilgilere göre yanlış.

Şimdi Freud'un sürçmelerine bakalım. Büyük psikolog, sözlü veya yazılı çekincelerimizin veya ihmallerimizin , genellikle cinsel olan bilinçaltı arzularımızı ortaya çıkardığını öne sürdü. Bunu test etmek için büyük verileri kullanabilir miyiz ? İşte bir yol: Çekincelerimizin cinsel güdülere inip düşmediğini görmek . Bastırılmış cinsel arzularımız yazıya veya konuşmaya dönüşebiliyorsa, "sik" ve "seks" gibi kelimelerin kullanılmasında büyük miktarda hata olmalı.

2 tarafından toplanan 40.000'den fazla yazım hatasını inceledim . Bu veriler, insanların yaptığı, ancak hemen düzelttiği hataları içeriyordu. Bu on binlerce hata arasında, birçoğunun çeşitli cinsel imaları vardı. Bahsi geçen "penistrian" da oradaydı . Ayrıca "güvenlik" ("güvenlik") yerine "cinsellik" ve "kayalar" ( "taşlar, kayalar " ) yerine "horoz" (penislerin konuşma dilindeki adı ) basılması yönünde bir talep vardı. Ancak birçok masum yanlış baskı da vardı . İnsanlar "pindows", "fegetables", "aftermoons" ve "refriderators" yazdı .

Belki cinsel yazım hatalarının sayısı
alışılmadık derecede yüksektir?

Bunu test etmek için, insanların belirli harfleri ne sıklıkta karıştırdığını simüle etmek için yukarıdaki seti kullandım . İlk olarak, t ve c, g ve h'yi ne sıklıkta değiştirdiklerini hesapladım . Sonra , insanların yaptığı gibi hatalar yapan bir program yazdı . Bu programa Error Bot diyebiliriz . Bu bot, Microsoft çalışmasında insanlarla aynı oranda t'yi c ile değiştirdi . Ve g'den h'ye. Ve benzeri. Programı çalıştırdım ve Microsoft çalışmasındaki insanların yazmak istediği sözcükleri yazdım . Yani bot "yaya", "kayalar", "pencereler" ve "buzdolabı" kelimelerini yazmaya çalıştı. Ancak, insanlar kadar sık \u200b\u200br ve t'yi karıştırdı ve örneğin "kayalar" - "tikler" (" dichka'nın meyveleri") yerine yazdı . Ve tıpkı insanlar gibi, r ve s'yi karıştırdı ve "kayalar" yerine "horozlar" yazdı.

sıradan sıradan insanlarla karşılaştırmaktan ne öğreneceğiz ? İnsanların yaptığı gibi sadece harfleri karıştırarak birkaç milyon hata yapan Error Bot , pek çok Freudcu yazım hatası yaptı . Program “deniz kabuğu” yerine “ sexshell” , “ruj” yerine “lipsdick”, “luckiest” yerine “fuckiest” yazdı ve bunun gibi birçok yazım hatası yaptı. Ve işte kilit nokta. Elbette bilinçaltına sahip olmayan Error Bot'un, yazım hataları cinsel olarak algılanan gerçek insanlar kadar hata yapma olasılığı vardı . Biz sosyologların söylemekten hoşlandığımız gibi, daha fazla araştırmaya ihtiyaç olduğu uyarısıyla. Bu, cinsel yönelimli hataların rastgele olanlardan daha yaygın olmadığı anlamına gelir.

Başka bir deyişle, insanlar hata yapıp "penistrian", "seks" ve "sikler" yazdıklarında, hata ile pis arasında mutlaka bir bağlantı yoktur. Bu sürçmelerle insanların zihninin gizli arzularını açığa çıkardığı bir gerçek değil. Bu baskı hataları, parmakların olağan kaymalarıyla açıklanabilir. İnsanlar çok hata yapar. Ve bunu yeterince düzenli yaparsan, sonunda "saçma sapan", "en boktan" ve "penistrian" gibi bir şeyle karşı karşıya kalırsın . Maymun tuşlara yeterince uzun basarsa, sonunda "olmak ya da olmamak" yazacaktır. Bir kişi yeterince uzun yazarsa, sonunda penistri yazabilir.

Dil sürçmelerinin bilinçaltımızın içeriğini gösterdiğine dair Freud'un teorisi, benim veri analizime göre yanlış.

sadece bir muz olduğunu ve "penistrian"ın sadece "yaya" olduğunu ancak yanlış yazıldığını söyler.

Fakat Freud tüm teorilerini kaçırdı mı? Tam olarak değil. PornHub verilerine ilk kez eriştiğimde, bir aydınlanma yaşadım: Sonunda bana en azından biraz Freudcu gibi görünen bir şey buldum. Aslında, verilerle çalışırken bulduğum en şaşırtıcı şeylerden biri de bu: En büyük porno sitelerini ziyaret eden şaşırtıcı sayıda insan ensest görüntüleri arıyor.

En popüler porno sitelerinden biri olan PornHub'da yapılan ilk 100 erkek aramasından 16'sı ensest videoları içindir . Adil uyarı: Bu oldukça pitoresk bir resim. Bunlar arasında “abi ve kız kardeş”, “üvey anne üvey oğlu sikiyor”, “anne ve oğul”, “anne oğlu sikiyor” ve “gerçek erkek ve kız kardeş” var. Erkeklerin yaptığı ensest aramalarının çoğu anne-oğul sahnesi içindir. Peki ya kadınlar? PornHub'da ensest videoları için yapılan ilk 100 kadın aramasından dokuzu benzer görseller içeriyor, ancak ebeveyn ve çocuğun cinsiyeti zıt olma eğiliminde. Yani kadınlar, babaların ve kızların dahil olduğu ensest sahneleri arıyor.

Bu gerçeklerde, Freud'un betimlediği Ödipal karmaşanın en azından hafif bir yankısını varsaymak zor değil. Çocuklukta hemen hemen herkesin karşı cinsten bir ebeveynle cinsel ilişkiye girme arzusu olduğunu ve bunun daha sonra bastırıldığını öne sürdü . Avusturyalı psikolog yeterince uzun yaşarsa, analitik becerilerini, yetişkinlerin karşı cinsin ebeveynine olan tamamen bastırılmamış ilgisini çok canlı ve net bir şekilde ifade eden PornHub verilerine uygulayabilirdi .

Tabii ki, PornHub'ın verileri, insanların böyle bir video izlerken neleri hayal ettiğini tam olarak gösteremez. Gerçekten kendi ebeveynleriyle seksi temsil ediyorlar mı? Google aramaları, dünyada benzer arzulara sahip birçok insan olduğunu doğrulayabilir .

"Seks istiyorum..." sözleriyle başlayan tüm istekleri dikkate alın 3 . Son sözlerin başında ise “anne” gelir. Genel olarak, bu formdaki arama sorgularının %82,7'si ensesttir. Ve belirli ifadelerle hiçbir ilgisi yoktur. Örneğin , "Ben çekiciyim" şeklinde arama yaparken. ensest arzularının daha da fazla itirafı var. Şimdi, Herr Freud'u hayal kırıklığına uğratma pahasına, bunların çok yaygın arama sorguları olmadığını göz ardı etmiyorum: ABD'de her yıl birkaç bin kişi annelerinden etkilendiğini itiraf ediyor. Hatta birisinin Herr Freud'u, Google'daki arama sorgularının ( bu kitapta daha sonra tartışılacak ) yalnızca ara sıra yasak olana yöneldiği haberine hazırlaması gerekecek .

Ama hala. İnsanların, arama sorgularında daha sık görünmesi gerektiğini düşündüğüm pek çok uygunsuz arzusu var. Patron? Çalışan? Öğrenci? Tera pevt? Hasta? Karının en iyi arkadaşı mı? Kızının en iyi arkadaşı mı ? Karının kız kardeşi mi? En yakın arkadaşının karısı mı? Arama sorgularında çıkan bu arzuların hiçbiri anne olma arzusuyla rekabet edemez. Belki de PornHub verileriyle birleştiğinde bu gerçekten bir anlam ifade ediyor.

Bu arada Freud'un cinselliğin çocuklukta oluşabileceğine dair temel iddiası Google ve PornHub'dan gelen verilerle destekleniyor . Erkeklerin en azından inanılmaz miktarda çocukluk fantezilerini koruduklarını açıkça ortaya koyuyorlar. Kadınların kocalarını aramalarına göre en popüler erkek fetişlerinden bazıları çocuk bezi giyme ve emzirilme isteğidir. Özellikle daha önce de belirtildiği gibi, bu Hindistan'da yaygındır . Porno çizgi filmlerin büyük popülaritesinden bahsetmiyorum bile 4 - genç erkekler tarafından sevilen şovdaki karakterlerin yer aldığı animasyonlu müstehcen seks sahneleri . Ya da en çok erkeklerin pornoda talep ettiği kadın mesleği sorununu düşünün . 18-24 yaş arası erkekler, arama sorgularında en çok dadı mesleğine giriyor 5 . Aynı durum 25-64 yaş arası erkekler ile 65 yaş ve üstü erkekler için de söylenebilir . Ayrıca her yaş grubundaki erkekler için en çekici ilk dört meslek öğretmenlik ve amigoluktur. Açıkçası, yaşamın ilk yılları yetişkin erkek fantezilerinin oluşumunda önemli bir rol oynar.

Cinsel tercihlerin tam olarak nasıl oluştuğunu belirlemek için yetişkin cinselliğine ilişkin tüm bu benzeri görülmemiş verileri henüz kullanamıyorum . Önümüzdeki birkaç on yılda, sosyologlar -ben dahil- yetişkin cinselliği hakkında yanlışlanabilir yeni teoriler üretebilecek ve bunları gerçeklerle test edebilecek.

yetişkin cinselliğine ilişkin veri ağırlıklı kuramın şüphesiz bir parçası haline gelecek olan bazı ana temaları şimdiden tahmin edebiliyorum . Çocukluk ve bastırmanın ayrı, iyi tanımlanmış evrensel aşamalarıyla, açıkça Freud'un teorisiyle özdeş olmayacaktır . Ancak PornHub verileriyle ilgili ilk incelememe dayanarak , Freud'un bazı temel temalarının yetişkin cinselliği hakkındaki nihai karara dahil edileceğinden kesinlikle eminim . Çocukluk önemli bir rol oynayacaktır. Ve annesi.

Muhtemelen on yıl önce Freud'un teorisini bu şekilde analiz etmek imkansızdı. Ve elbette , 80 yıl önce, Freud hala hayattayken böyle bir şey imkansızdı . Öyleyse , bu veri kaynaklarının bize neden yardımcı olabildiğini düşünelim . Bu alıştırma sayesinde, büyük verinin neden bu kadar güçlü olduğunu anlayacağız .

otomatik olarak yararlı sonuçlar üretmemize izin vermeyeceğini zaten söylemiştik . Bilim adamları veri miktarını abarttılar. Peki o zaman büyük veri neden bu kadar güçlü? Kendimizle ilgili vizyonumuzda neden devrim yaratmayı başardılar? Büyük verinin dört benzersiz özelliği olduğunu ve Freud'un analizinin bunun iyi bir örneği olduğunu iddia ediyorum.

Freud'un teorilerini tartışırken pornografiyi oldukça ciddiye aldığımızı fark etmiş olabilirsiniz . Ayrıca, bu kitapta porno sitelerinin analizine oldukça sık atıfta bulunmayı amaçlıyoruz. Bu oldukça garip, çünkü böyle bir kaynaktan elde edilen veriler çoğu bilim insanı tarafından nadiren kullanılıyor. İkincisi genellikle geleneksel anketlerin sonuçlarına güvenir ve kariyerlerini bunlara göre kurarlar. Ancak biraz düşünürseniz, bu porno sitelerinin yaygın kullanımının (ayrıca bunlarda arama yapılması ve bu şekilde elde edilen bilgilerin işlenmesinin) insan cinselliğinin daha iyi anlaşılmasını sağladığı ortaya çıkıyor . Aslında, bu muhtemelen dünyadaki en önemli şeydir. Bu tür verilerle Schopenhauer, Nietzsche, Freud ve Foucault sevinçten ciyaklayacaktı ama onların yaşadığı dönemde böyle bir veri yoktu . Birkaç on yıl önce yoktular, ama şimdi varlar. Çeşitli konularda birçok benzersiz bilgi kaynağı var ve daha önce sadece tahmin edebileceğimiz alanlara gözlerimizi açıyor . Bize yeni türde gerçekler sunabilme yeteneği, büyük verinin ilk güçlü özelliğidir.

Porno sitelerinin ve Google aramalarının verileri sadece yeni değil, aynı zamanda en doğru olanıdır. Dijital öncesi zamanlarda insanlar utanç verici düşüncelerini başkalarından sakladılar. Dijital çağda, onları gizlemeye devam ediyorlar - ancak İnternet'ten ve özellikle Google ve PornHub gibi anonimliğin korunduğu sitelerden değil . Bu siteler bir tür dijital hakikat serumu rolü oynuyor ve bu da ensest konusunun popülaritesini keşfetmemizi sağladı . Büyük veri, nihayet insanların ne söylediklerini veya yaptıklarını değil, gerçekten ne istediklerini görmemizi sağlar . En doğru gerçekleri sağlamak , büyük verinin ikinci güçlü özelliğidir.

Artık çok sayıda farklı bilgi olduğu için, en küçük nüfus kesimi hakkında bile anlamlı bilgiler bulmak mümkün. Örneğin, rüyasında salatalık gören insan sayısını, rüyasında domates görenlerle karşılaştırabiliriz . İnsan topluluklarının en küçük alt kümelerine bakma yeteneği, büyük verinin üçüncü güçlü özelliğidir.

Büyük verinin, Freud'un teorisine ilişkin kısa araştırmamda kullanmadığım ama gelecekte kullanacağımdan emin olduğum başka bir büyük fırsatı daha var: hızlı, kontrollü deneyler sağlıyor. Bu, sadece bir korelasyon değil, nedensel bir ilişki belirlemeyi mümkün kılar. Bu tür testler çoğunlukla ticari işletmeler tarafından kullanılır , ancak sosyologların elinde güçlü bir araç olacaktır. Birden çok neden-sonuç deneyi yürütme yeteneği, büyük verinin dördüncü güçlü özelliğidir.

Şimdi bu harika özelliklerin her biri hakkında daha ayrıntılı konuşmanın ve büyük verinin neden bu kadar önemli olduğunu anlamanın zamanı geldi.

3. Bölüm

VERİLERİ YENİDEN DÜŞÜNMEK

Her ayın belirli bir Cuma günü sabah 6:00'da Manhattan'ın büyük bir kısmının sokakları neredeyse boş olacak . Dükkanlar kapanacak, cepheleri çelik kepenklerin ardına gizlenecek, üstlerindeki apartmanlar karanlık ve sessiz olacak.

Aşağı Manhattan'da bulunan dünyaca ünlü yatırım bankacılığı kurumu Goldman Sachs binasının tüm katları parlak bir şekilde aydınlatılacak, asansörleri ileri geri koşarak binlerce insanı iş yerlerine doğru kaldıracak. Sabah 7'de masaların çoğu dolu olacak.

Hiç şüphe yok ki bu saate başka bir gün uykulu denebilir. Ancak bu Cuma burada enerji ve heyecan kaynayacak , çünkü bu gün borsa üzerinde önemli bir etkisi olacak bilgilerin olması gerekiyor.

Ortaya çıktıktan birkaç dakika sonra haber sitelerinde tekrarı yapılacak. Birkaç saniye içinde , Goldman ve diğer yüzlerce finans şirketinde her yönden tartışılmaya ve değerlendirilmeye başlayacak . Ancak bu günlerde finans alanındaki eylemlerin çoğu, kund'un bir milimetresinde gerçekleşiyor . Goldman ve diğer finans firmaları , Chicago'dan New Jersey'e bilgi aktarma süresini dört milisaniye ( 17'den 13'e) azaltan fiber optik kablolara erişim elde etmek için on milyonlarca dolar ödüyor. Finans firmaları , bilgileri okumak ve bunlar üzerinde ticaret yapmak için algoritmalara 1 sahiptir , hem de hepsi saniyeler içinde. Finans piyasası için kritik verilere sahip olduğunuzda , göz kırpabileceğinizden daha hızlı hareket edecektir.

Peki, Goldman ve bir dizi diğer finans kurumu için bu kadar değerli olan bu önemli veri nedir?

aylık işsizlik oranı

Ancak bu oranın hisse senedi piyasasına etkisi o kadar büyük ki, finansal kurumlar bu verileri elde etme, analiz etme ve alınan bilgilere göre tepki verme hızlarını artırmak için ellerinden gelen her şeyi yaptılar. İkincisi, Çalışma İstatistikleri Bürosu tarafından yürütülen bir telefon anketinin sonucudur ve yayınlandığı tarihte, yaklaşık üç hafta veya 2 milyar milisaniye kadar güncelliğini yitirmiş olacaktır.

Bilgi akışını milisaniyeler bazında hızlandırmak için milyonlarca dolar harcayan firmalar varken , hükümetin işsizlik oranını hesaplamasının bu kadar uzun sürmesi size garip gelebilir.

başkanlığını devraldığında Alan Krueger'in gündemindeki en önemli maddelerden biri bu rakamları hızlandırmaktı . Başaramadı. "Ya BLS'nin ( ABD Çalışma Bakanlığı Çalışma İstatistikleri Bürosu) kaynakları yetersiz ," diye bitirdi "ya da zihniyetleri 20. yüzyılda takılıp kaldı."

Hükümet yakın zamanda hızını artırmadığı için şu soru ortaya çıkıyor: işsizlik istatistikleri hakkında en azından kabaca bir fikir edinmenin daha hızlı bir yolu var mı? İnternetteki herhangi bir kişinin neredeyse her tıklamasının bir yere kaydedildiği bu yüksek teknoloji çağında, kaç kişinin işsiz kaldığını öğrenmek için gerçekten birkaç hafta beklememiz gerekiyor mu?

Olası bir çözüm, eski Google mühendisi Jeremy Ginsberg'in çalışmasından ilham aldı . Hükümetin işsizlik verileri gibi sağlık verilerini gecikmeli olarak yayınladığını fark etti. Hastalık Kontrol ve Önleme Merkezlerinin bir grip salgını hakkında veri üretmesi bir hafta sürer, 3 ancak doktorlar ve hastaneler bu tür verilere mümkün olduğunca erken sahip olmaktan fayda sağlayacaktır.

Ginsberg, grip hastalığının tedavisiyle ilgili arama sorgularıyla doğrudan ilişkili olduğundan şüpheleniyordu. Özünde, insanlar semptomlarını Google'a bildirir . Jeremy, bu sorguların gribin mevcut durumu hakkında oldukça doğru bir tahmin verebileceğine karar verdi . Gerçekten de, "grip belirtileri" ve "kas ağrısı" gibi arama ifadelerinin, hastalığın yayılma [9]hızının önemli göstergeleri olduğu kanıtlanmıştır .

Bu arada Google mühendisleri, harici araştırmacılara yalnızca sağlıkta değil, çok çeşitli alanlarda aynı türde analizler yapma olanağı sağlayan Google Correlate hizmetini oluşturdu. Araştırmacılar izledikleri herhangi bir veri kümesini alıp hangi Google aramalarının bununla en açık şekilde ilişkili olduğunu görebilir.

Örneğin, Google Correlate'i kullanarak, Google'ın baş ekonomisti Hal Varian ve ben, ev fiyat trendlerini takip etmede hangi arama terimlerinin en doğru olduğunu bulabildik 4 . İkincisi yükselirken, Amerikalılar "80/20 ipotek", "yeni inşaatçının evi" ve "sermaye takdiri" gibi ifadeleri arama eğilimindedir . Düştüklerinde, insanlar genellikle " açığa satış", "negatif ipotek değeri" ve "ipotek borcunu azaltma" gibi aramalar yapar.

Öyleyse, belki de Google aramaları, konut maliyetini veya grip salgınının yayılmasını tahmin etmek için kullanıldığı gibi, işsizliği tahmin etmek için bir turnusol testi olarak kullanılabilir ? İnsanların Google'da ne aradıklarına bakarak kaç kişinin işsiz olduğunu söyleyebilir miyiz? Ve bu, hükümet anket sonuçlarını toplayıp yayınlamadan önce yeterince doğru bir şekilde yapılabilir mi?

Bir gün Google Correlate'e "2004 ile 2011 arasındaki ABD işsizlik oranı" sorgusunu yazdım.

Google'da yapılan trilyonlarca aramadan hangisinin işsizlikle en yakından ilişkili olduğunu düşünüyorsunuz ? Bunun bir "iş değişimi" veya benzeri bir şey olduğunu düşünebilirsiniz . Evet, bu tür taleplerin sayısı arttı ancak bunlar listenin en başında yer almıyordu. "Yeni iş yerleri" mi? Çok fazla ama ilk değil.

için en yüksek talep "Slutload" kelimeleriydi . inanıyor musun Çoğu zaman, insanlar bu ada sahip bir pornografik site aradı. Bu ilk bakışta tuhaf görünebilir. Ancak işsiz insanların birdenbire çok fazla boş zamanı olur. Birçoğu evde yalnız ve sıkılmış durumda. Bir diğer çok yaygın istek ise "örümcek oyunu"dur. Yine, birdenbire çok fazla boş zamanı olduğu varsayılan bir grup insan için bu şaşırtıcı değil .

Şimdi tartışmak istemiyorum ama bu analize dayanarak, işsizlik oranlarını tahmin etmenin en iyi yolunun "Slutload" veya "Spider Game" izlemek olduğunu söyleyebilirim. Zamanla, bazı sapmalar ortaya çıkabilir: işsizler, örneğin , başka bir porno sitesi olan "rawtube" arayabilirler . Bu koşulların hiçbiri kendi başına işsiz sayısındaki artışla ilişkili değildir. Ancak genel olarak, bu aramaların bir karışımının işsizlik oranı için yeterli bir tahmin sağladığını ve işsizlik için en iyi tahmin modelinin bir parçası olduğunu buldum .

Bu örnek, büyük verinin gücünü göstermektedir: Neyin veri olarak nitelendirilebileceğini yeniden düşünme yeteneği. Genellikle büyük veriyle ilgili en değerli şey, onun boyutu değil, size daha önce hiç toplanmamış keşfedilecek yeni bilgi türleri sunabilmesidir.

Google ortaya çıkmadan önce, insanların ne kadar boş zamanı olduğuna dair ipucu verebilecek bazı faaliyetler (sinema bileti satmak gibi ) hakkında bilgiler vardı . Ancak kaç tanesinin solitaire oynadığını veya porno izlediğini öğrenebilmek yeni bir şey ve çok güçlü bir kaynak. Bu durumda, bu bilgiler ekonominin durumunu daha hızlı değerlendirmemize yardımcı olabilir - en azından hükümet anket yapmayı ve verileri daha hızlı bir şekilde toplamayı öğrenene kadar.

California, Mountain View'deki Google kampüsündeki yaşam, Goldman Sachs'ın Manhattan'daki genel merkezindeki yaşamdan çok farklı. Sabah saat 9'da Google ofisleri neredeyse boş. İşçilerden herhangi biri görünürdeyse , muhtemelen muzlu -yaban mersinli krep, omlet ve salatalık suyundan oluşan ücretsiz bir kahvaltı için buradadırlar. Bazı çalışanlar sadece şehir dışında olabilir; Las Vegas, Boulder'da tesis dışı bir toplantıya katılabilir veya belki de Tahoe Gölü'ne ücretsiz bir kayak gezisine katılabilir . Öğle yemeği saatlerinde voleybol sahası ve futbol sahası insanlarla dolacak. Şimdiye kadar sahip olduğum en iyi burrito, Google Mexican Restaurant'taydı.

Dünyanın en büyük ve en rekabetçi teknoloji şirketlerinden biri nasıl bu kadar rahat ve cömert olabilir ? Google, büyük verileri dünyadaki başka hiçbir şirketin hayal bile edemediği bir şekilde topluyor . Bu, otomatik bir nakit akışı oluşturmasına olanak tanır . Ve ayrıca bu kitabın kahramanı olmak, çünkü Google aramaları büyük verinin açık ara baskın kaynağı. Ancak, Google'ın başarısının yeni bir tür veri toplamaya dayandığını unutmamak önemlidir.

Yeterince uzun yaşarsanız ve 20. yüzyılda İnternet'i kullanırsanız , o zamanlar var olan çeşitli arama motorlarını - özellikle MetaCrawler, Lycos, AltaVista - hatırlayabilirsiniz . Ve muhtemelen bu arama motorlarının en iyi ihtimalle çok güvenilir olmadığını hatırlıyorsunuzdur. Bazen, eğer şanslıysanız, istediğinizi bulabildiler. Ancak çoğu zaman bu görevle baş edemediler . 1990'ların sonlarında "Bill Clinton" için en iyi arama motorlarında arama yaptıysanız , "Bill Clinton Berbat" başlıklı rastgele bir site veya müstehcen Clinton şakaları içeren bir site listenin başında olabilir. Bu , o zamanki Birleşik Devletler Başkanı hakkında en güncel bilgi olarak kabul edilemez .

Google 1998'de doğdu ve arama sonuçları inkar edilemez bir şekilde rakiplerinden daha iyiydi . 1998'de Google'da "Bill Clinton" için arama yaptıysanız , size onun web sitesi, Beyaz Saray e-posta adresi ve bu adamın o zamanlar internette var olan en iyi biyografileri verildi. Google'ın çalışması sihir gibi görünüyordu.

Google'ın kurucuları Sergey Brin ve Larry Page
neyi değiştirdi?

kullanıcıları için arama sorgusuna girilen ifadelerde en sık görünen web siteleri bulmuştur. Bill Clinton hakkında bilgi arıyorsanız , bu arama motorları internette Bill Clinton'a en çok atıfta bulunan siteleri bulurdu. Bu derecelendirme sisteminin kusurlu olmasının birçok nedeni var , bunlardan biri de hile yapmanın kolay olması. Sayfasında "Bill Clinton Bill Clinton Bill Clinton Bill Clinton Bill Clinton" yazan bir şaka sitesi, Beyaz Saray'ın [10]resmi web sitesinden daha üst sıralarda yer alacaktır .

Brin ve Page, yalnızca kelimeleri saymaktan çok daha değerli olan yeni bir bilgi türü yakalamanın bir yolunu buldu. Genellikle, web sitelerinde yayınlanan makaleler, tartışılan konuyu anlamak için yararlı olabilecek diğer kaynaklara bağlantılar sağlar. Örneğin , New York Times'ın elektronik versiyonundaki bir makale Bill Clinton'dan bahsediyorsa, okuyucular onun adına tıklayarak Beyaz Saray'ın resmi web sitesine gideceklerdir.

Bill Clinton hakkındaki bilgilere kendi bakış açısını ortaya koymaktadır . Brin ve Page, her konuda tüm bu bakış açılarını birleştirmeyi başardı. Arama motorları, New York Times görüşlerini , milyonlarca posta listesini, yüzlerce blogcu görüşünü ve İnternet'teki diğer her şeyi toplayabilir . Pek çok insan "Bill Clinton" için en alakalı bağlantının onun resmi web sitesi olduğunu düşündüğünden, çoğu kişi onu "Bill Clinton" yazarak arar.

, diğer arama motorlarının dikkate almadığı verilerdi . Bu veriler muhtemelen tahmin edici değildi ve belirli bir konuda en yararlı bilgileri belirledi. Mesele şu ki, Google'ın arama motorları üzerindeki hakimiyeti sadece herkesten daha fazla veri toplamakla ilgili değil , daha iyi veriler bulmakla ilgili. Google, lansmanından iki yıldan kısa bir süre sonra, bağlantıları analiz ederek İnternet'teki en popüler arama motoru haline geldi . Bugün, Brin ve Page birlikte 60 milyar dolardan fazla değere sahipler .

Hem Google hem de diğer tüm arama motorları , etrafımızdaki dünyayı anlamamıza yardımcı olmak için verileri kullanmaya çalışıyor . Büyük verinin devrim niteliğindeki özü, daha fazla bilgi toplamak değildir. Sadece ihtiyacınız olanı toplamakla ilgili.

Ancak İnternet, yeni gerçeklerin toplanabileceği ve doğru verilerin elde edilmesinin devrim niteliğinde sonuçlar doğurabileceği tek yer değil. Bu kitap büyük ölçüde internetten gelen bilgilerin insanları daha iyi anlamamıza nasıl yardımcı olabileceği hakkındadır. Ancak bir sonraki alt bölümde , İnternet verileriyle ilgilenmeyeceğiz . Hatta insanla alakası bile olmayacak. Ancak buradaki hikaye, bu bölümün ana mesajını açıklamaya yardımcı olacaktır: yeni, geleneksel olmayan verilerin muazzam değeri. Ve bu örnekten öğrenebileceğimiz ilkeler, dijital tabanlı veri devriminin özünü anlamamıza yardımcı olacaktır.

VÜCUT NASIL BİLGİ

2013 yazında, siyah yeleli, ortalamanın üzerinde bir defne atı, New York Eyaletindeki küçük bir ahırda bir ahırda duruyordu. O, Saratoga Springs'teki Ağustos satışı için bir yaşındaki 152 attan ve bu yıl müzayedeye çıkan bir yaşındaki 10.000 attan biriydi .

Bir ata büyük meblağlarda para ayırmaya ve yatırmaya hazır olan zengin erkekler ve kadınlar, at için kendi adlarını seçmek isterler. Sonuç olarak, doru atın henüz bir takma adı yoktu ve müzayededeki çoğu at gibi, bunun yerine durak numarası - 85 olarak adlandırıldı.

85 numarayı öne çıkarmak için neredeyse hiçbir şey yapılmadı . İyi bir soyağacı vardı ama istisnai değildi. Nil'in Öncüsü babası iyi bir yarış atıydı, ancak diğer Nil Öncüsü çocukları yarışta pek iyi değildi. 85 numaranın dış görünüşüne dayanan şüpheler de vardı : ayak bileğinde bir yaralanma kanıtı olabileceğinden endişeli alıcıları korkutan bir çizik vardı .

85 numara , bir atı satıp birkaç tane daha satın almak için New York'a gelen Mısırlı bira kralı Ahmed Zayat'a aitti .

Neredeyse tüm sahipler gibi, Zayat da satın alacağı atları seçmesine yardımcı olması için bir uzman ekibi tuttu. Ancak uzmanları her zamankinden farklıydı. Böyle bir olayda göreceğiniz tipik "uzmanlar" , çoğu Kentucky veya Florida kırsalından, az eğitimli, ancak ailesi yüzyıllardır at işinde olan orta yaşlı erkeklerdi . Ancak Zayat'ın uzmanları, EQB adlı küçük bir firmada çalışıyordu . Kafası eski usul bir binici değildi. Bunun yerine, Philadelphia'da doğan ve çok sayıda Harvard derecesine sahip olan eksantrik Jeff Seder'di .

Zayat daha önce EQB ile çalışmıştı, dolayısıyla seçim süreci ona tanıdık geliyordu. Seder ve ekibi önerilen atları birkaç gün değerlendirecek ve ardından 85 numaranın yerine satın alınmasını tavsiye edecekleri beş parçalık bir listeyle Ahmed'e döneceklerdi .

Ancak bu sefer farklıydı. Seder'in ekibi Zayat'a gelerek talebini yerine getiremediklerini söyledi. Uzmanlar, ona o gün satılık 151 attan herhangi birini almasını tavsiye edemezdi. Bunun yerine beklenmedik ve neredeyse umutsuz bir istekte bulundular : Zayat hiçbir koşulda 85 numarayı satmamalı. . Uzmanlar Zayat'a "Evinizi satın ama bu atı satmayın " diye ısrar etti .

diyen bir adam tarafından 300.000 dolara satın alındı . Daha sonra ortaya çıktığı gibi, bu Ahmed Zayat tarafından kullanılan takma addı. Seder'in ricasına cevaben Zayat, eşi benzeri görülmemiş bir şekilde kendi atını satın aldı. (Müzayede kuralları, Zayat'ın atı müzayededen basitçe geri çekmesini engelledi , bu da ticareti bir takma adla yapmak zorunda kalmasına neden oldu.) O müzayedede altmış iki at daha yüksek bir fiyata satıldı, hatta ikisi 1 milyon dolardan fazlaya .

Üç ay sonra, Zayat nihayet #85 için bir isim seçti: Amerikan Firavunu. On sekiz ay sonra, New York banliyösünde sıcak bir Cumartesi gecesi, Amerikan Firavunu, otuz yılı aşkın bir süredir Triple Crown'u kazanan ilk at oldu.

Jeff Seder #85 hakkında kimsenin bilmediği ne biliyordu? Bu Harvard denen adam nasıl oldu da atları bu kadar iyi değerlendirebildi?

O zamanlar 64 yaşında olan Seder ile Haziran ayında Ocala, Florida'da tanıştım , Amerikan Firavunu üçlü tacı kazandıktan bir yıldan fazla bir süre sonra. Zayat'ın 2013'te kendi atını satın aldığı müzayedeye benzer bir müzayedeyle sonuçlanan, iki yaşındaki çocukların bir hafta süren teftişi vardı .

Seder'in bir saç polisi olan Mel Brooks gibi gürleyen bir sesi var ve yürürken fark edilir şekilde zıplıyor. Askılı haki bir pantolon, üzerinde şirket logolu siyah bir gömlek ve kulağında bir işitme cihazı vardı.

Sonraki üç gün boyunca bana, atların geleceğini tahmin etmede ne kadar iyi olduğu da dahil olmak üzere hikayesini anlattı. Neredeyse düz bir çizgi değildi. Seder , Harvard ve Phi Beta Kappa'dan üstün başarı derecesiyle mezun olduktan sonra [11]burada hukuk ve işletme diploması aldı. 26 yaşında , zaten New York'taki Citigroup'ta bir analistti , ancak kendini mutsuz ve tükenmiş hissediyordu. Bir gün, şirketin Lexington Bulvarı'ndaki yeni ofis binasının avlusunda otururken , kendisini sonsuz bir alanı betimleyen büyük bir duvar resmini dikkatle düşünürken buldu. Resim ona kırlara ve atlara olan sevgisini hatırlattı. Jeff evde aynada kendine baktı ve üç parçalı bir takım elbise içinde umutsuz bir figür gördü. O anda artık bankacı olmak istemediğini ve New York'ta yaşamanın kaderinde olmadığını anladı. Ertesi sabah işinden ayrıldı.

Seder Pennsylvania kırsalına taşındı ve hayatını yarış atlarının başarısını tahmin etme tutkusuna adayamadan önce tekstil endüstrisinde ve hatta spor hekimliğinde çok çeşitli pozisyonlarda bulundu . Yarışlardaki sayılar yaklaşıktır. Ocala müzayedesinde sunulan iki yaşındaki 1.000 çocuktan en prestijlilerinden biri , belki de sadece beşi önemli bir ödül havuzu olan bir yarışı kazanacak . Peki diğer 995 ata ne olacak ? Yaklaşık üçte biri çok yavaş olacaktır 9 . Diğer üçte birlik kısım ise büyük olasılıkla bacaklarının çılgın bir yarışın muazzam stresine dayanamayacağı için yaralanacak (Amerikan yarış pistlerinde her yıl yüzlerce at ölüyor 10 - esas olarak bacak kırıkları nedeniyle 11 ). Kalan üçte biri, Bartleby sendromu olarak adlandırılabilecek bir hastalığa yakalanacak. Herman Melville'in öyküsündeki katip çalışmayı bırakır ve her işverenin talebine "istemiyorum" diye yanıt verir. Pek çok at , kariyerlerinin başlarında, canları istemiyorsa çalışmak zorunda olmadıkları sonucuna varmış gibi görünüyor. İlk başta hızlı koşabilirler, ancak bir noktada yavaşlarlar veya tamamen dururlar. Toynaklarınız ve eklemleriniz ağrırken neden tüm gücünüzle oval alanın kenarı boyunca koşuyorsunuz ? "Ben zorlamamayı tercih ederim" diye karar verirler. (Bartleby'ye hem atlara hem de insanlara zaafım var .)

Sahipleri, bu kadar çok hata yapma şansı olan karlı bir atı nasıl seçer? İnsanlar her zaman bir atın kazanıp kazanmayacağını tahmin etmenin en iyi yolunun soy ağacını analiz etmek olduğuna inanmışlardır. At seçiminde uzman olmak, müşteriyi ilgilendiren atın babası, annesi, dedeleri, büyükanneleri, erkek ve kız kardeşleri hakkında mümkün olan her şeyi parça parça demonte edebilmek demektir. Örneğin ajanlar, " bir atın büyük boyutunun doğal olduğunu, çünkü anne soyunda birçok uzun at olduğunu" bildiriyor.

Ama bir sorun var. Tabii ki, soyağacı çok önemlidir, ancak yine de bir spor atının başarısının sadece küçük bir bölümünü açıklayabilir . En prestijli yıllık ödülün - "Yılın Atı" unvanının tüm sahiplerinin erkek ve kız kardeşlerinin geçmiş performansını düşünün . Hepsi aynı en iyi soyağacına sahiptir. Yine de, bunların dörtte üçünden fazlası büyük yarışları kazanamadı 12 . Başarıyı tahmin etmenin geleneksel yolu, iyileştirme için çok yer bırakır.

Aslında, soyağacının doğru bir tahmin için yeterli bilgi sağlamaması şaşırtıcı değildir. İnsanların bu şekilde seçildiğini düşünün . Örneğin, bir NBA kulübünün sahibi, daha on yaşındayken , soyağaçlarına göre takımına oyuncu almaya karar verdi . "Magic" Johnson'ın oğlu Irvin Johnson'ı 13 incelemek için ajanlar tutardı . Bir uzman, "Artık iyi büyüyor" derdi. “Johnson'dan miras kalan doğal bir büyüme. Ek olarak , çocuğun mükemmel bir görüşü, kendine dönüşü ve hızı olmalıdır . Girişken görünüyor, iyi bir karakteri var. Kendinden emin yürüyüş. Temsilci. Bu iyi bir seçenek." Maalesef 22 yıl sonra bu adam 185 cm boyundaydı (profesyonel bir basketbolcu için çok kısaydı). Ve Irvin Johnson bir moda blog yazarı oldu! Forma tasarımında çok yardımcı olabilir, ancak basketbol sahasında faydalı bir şey yapması pek olası değildir.

birçok kişinin atları seçtiği gibi bir takım toplayacak olan NBA kulübünün sahibi, muhtemelen Michael Jordan'ın oğulları Jeffrey ve Marcus Jordan'ı satın alacak. Üniversitede ikisi de oldukça sıradan oyuncular olduklarını kanıtladı. Ancak Cleveland Cavaliers şanslıydı. Bu takımın başında, annesinin boyu sadece 165 cm14 olan LeBron James bulunuyor . Ya da liderlerini soylarına göre seçen bir ülke hayal edin. George W. Bush gibi insanlar tarafından yönetilirdik. (Üzgünüm, dayanamadım.)

, yalnızca soyağacına göre değil, aynı zamanda diğer bilgilere göre de yönlendirilir .

Örneğin, iki yaşındaki çocukların yürüyüşlerini analiz ederler ve önerilen atları dikkatlice düşünürler. Ocala'da çeşitli uzmanlarla saatlerce konuştum ve sonuç olarak hepsinde ortak olan tek bir arama kriterinin olmadığını fark ettim .

Bu tutarsızlıklara ve belirsizliklere, bazı alıcıların dipsiz cüzdanlara sahip göründüğünü ve oldukça verimsiz bir pazarla karşılaştığınızı ekleyin . 10 yıl önce, 153 numaralı at iki yaşındaydı, en hızlısıydı ve çoğu ajan için harika görünüyordu. Ek olarak, tüm zamanların en büyük yarış atlarından ikisi olan Northern Dancer ve Secretariat'ın soyundan geldiği için olağanüstü bir soyağacı vardı . İrlandalı bir milyarder ve Dubai'den bir şeyh onu satın almak istedi ve kısa sürede iki gurur arasında kavgaya dönüşen bir ihale savaşına girdi. Yüzlerce at sever, iki yaşındaki at nihayet bugüne kadar bir at için ödenen en yüksek fiyat olan 16 milyon dolara satılana kadar risklerin gittikçe arttığına tanık oldu. Daha sonra Green Monkey 15 adlı 153 numara üç yarış koştu, yalnızca 10.000 $ kazandı ve emekli oldu.

, atları değerlendirmenin geleneksel yöntemlerine asla girmedi . O sadece verilerle ilgileniyordu . Çeşitli yarış atı performanslarını ölçmeyi ve ardından hangisinin yarış performansıyla ilişkili olduğunu görmeyi planladı. Seder'in planını World Wide Web icat edilmeden on buçuk yıl önce yaptığını, ancak stratejisinin büyük ölçüde bilimsel verilere dayandığını ve hikayesinden çıkarılan derslerin büyük verilerle çalışan herkes tarafından uygulanabileceğini not etmek önemlidir .

Yıllardır Seder'in girişimleri hayal kırıklığından başka bir şey getirmedi. Drai atlarının burunlarının boyutunu ölçerek , bu tür verilerden oluşan dünyanın ilk ve en büyük veri setini ve buna karşılık gelen olası geliri yarattı. Jeff, arabanın burunlarının boyutunun başarıyı gösteremeyeceğini keşfetti . Sonra kalplerini incelemek için bir EKG yaptı . Hızlı kasılan kaslarının hacmini ölçmek için ölü atların bacaklarını kesti . Bir keresinde, bir yarıştan önce çok fazla şeyin onu yavaşlatabileceği teorisine dayanarak, at pisliği miktarını ölçmek için bir kürek bile çıkardı . Yarış sonuçlarıyla ilişkili hiçbir şey yok .

Ve sonra, 12 yıl önce, ilk büyük atılım gerçekleşti. Seder, atların iç organlarının büyüklüğünü ölçmeye karar verdi . Mevcut teknoloji ile bu mümkün olmadığı için kendi portatif ultrason makinesini yaptı. Sonuçlar harikaydı. Jeff, kalbin boyutunun ve özellikle sol ventrikülün boyutunun, en önemli değişkenlerden biri olan at başarısının güçlü bir göstergesi olduğunu buldu. Büyük öneme sahip diğer bir organ dalaktı: küçük bir dalağı olan atların ödülü kazanma şansı çok azdı.

Seder birkaç önemli gözlem daha yaptı. Dört nala koşan binlerce atın videolarını dijital ortama aktardı ve belirli yürüyüşlerin yarış pistindeki başarı ile ilişkili olduğunu buldu . Ayrıca iki yaşındaki bazı çocukların bir milin yalnızca sekizde birini koştuktan sonra hırıldamaya başladığını da fark etti . Bu tür atlar bazen bir milyon dolara bile satılıyor , ancak Seder'in verileri, bu tür "hırıltıların" neredeyse hiçbir zaman başarılı olmadığını gösterdi. Böylece Jeff, asistana bitiş çizgisine yakın oturmasını ve "hırıltıları" ayıklamasını emretti.

müzayedesinde sunulan yaklaşık 1.000 attan bir düzinesi Söder'in tüm testlerini geçti . Soy ağacını tamamen görmezden geldi - satıldığında atın fiyatını nasıl etkileyeceği dışında . "Şecere bize bir atın büyük olma şansının çok düşük olduğunu söyleyebilir" diyor. "Ama atın muhteşem olduğunu görürsem, onun kim için doğduğu ne fark eder?"

Bir akşam Jeff beni Ocala'daki Hilton Oteli'ndeki odasına davet etti. Orada bana çocukluğundan, ailesinden ve kariyerinden bahsetti. Karısının, kızının ve oğlunun resimlerini gösterdi. Philadelphia'da liseye giden üç Yahudi öğrenciden biri olduğunu ve okulu bıraktığında 145 cm olduğunu (daha sonra üniversitede 173 cm'ye çıktığını) söyledi. Ras , en sevdiği atı Pinky Pizwaanski'den bahsetti . Seder onu satın aldı ve ona eşcinsel bir jokeyin adını verdi. En başarılısı olmasa bile Pinky Horse'un her zaman elinden gelenin en iyisini yapmaya çalıştığını hissetti .

kariyerinin en başarılı tahmini haline gelen 85 numaralı at hakkındaki tüm verileri içeren dosyayı bana gösterdi . Sırrını açıkladı mı? Belki. Ama Jeff umursamadığını söyledi. Onun için bir sır saklamaktan daha önemli olan, davasını kanıtlamak, tüm dünyaya bu 20 yıllık iç organları kazmanın, gübre kürekle ve bir ultrason makinesini yanında taşımanın sonunda sonuç verdiğini göstermekti.

İşte 85 numaralı at hakkında bazı bilgiler.

85 (daha sonra Amerikan Firavunu), aynı yıl

Yüzdelik

Yükseklik

56

Ağırlık

61

soyağacı

70

sol ventrikül

99.61

Burada Seder ve ekibinin neden bu kadar saplantılı bir şekilde 85 numarayı önerdiğini açıkça görebilirsiniz. Sol ventrikül yüzdesi 99,61'di!

Sadece sol karıncık değil, kalp ve dalak da dahil olmak üzere diğer tüm önemli organlar olağanüstü büyüktü. Genel olarak konuşursak Seder, iş yarışa geldiğinde sol karıncık ne kadar büyükse o kadar iyi olduğunu keşfetti. Ancak boyutu, diğer organlar küçükse, bir hastalık belirtisi de olabilir. Amerikan Firavunu'nda en önemli organların tümü ortalamanın üzerindeydi ve sol karıncık tek kelimeyle devasaydı . Veriler, 85 numaranın benzersiz olduğunu haykırıyordu, 100 binde bir, hatta bu türden bir milyon at vardı.

Akademisyenler Seder projesinden hangi bilgileri toplayabilir?

İlk ve belki de en önemlisi. Bir durumu kökten değiştirmek için yeni verileri kullanmayı deneyecekseniz , önce kendinize şunu sormanız en iyisidir : Eski yöntemler nerede başarısız oluyor? At ajanlarının kan bağı takıntısı, Seder'a bol bol hareket alanı bıraktı. Aynı şey , Google'ın kelime sayımına takıntılı arama motorlarına karşı kazandığı zafer için de söylenebilir .

Google'ın iddia verilerini kullanarak yaklaşmakta olan influenza 16 salgınını tahmin etme girişiminin olumsuz yönlerinden biri , bunu kendi başınıza çok iyi bir şekilde yapabilmenizdi - yalnızca geçen haftanın verilerini kullanarak ve mevsimsel ayarlamalar ekleyerek. Arama sorgularından elde edilen bilgilerin basit ama güçlü bir modelden ne ölçüde daha iyi olduğu konusunda hala tartışmalar var . Kanımca, Google araması , mevcut verilerin temsili olmadığı koşulları ölçmek için daha pratiktir . Bu nedenle Google STD , uzun vadede Google Flu'dan daha faydalı olabilir .

İkinci ders şu ki, bir tahminde bulunmaya çalışırken , modelinizin ne yaptığını ciddi olarak sorgulamanıza gerek yok . Seder, sol karıncığın bir atın başarısını tahmin etmede neden bu kadar önemli olduğunu tam olarak açıklayamıyor. Ayrıca dalağın boyutunun başarıyı neden etkilediğini tam olarak söyleyemiyor . Belki bir gün at kardiyologları ve hematologları bu soruları cevaplayacaktır. Ama şimdi önemli değil. Seder , başarıyı açıklamakla değil tahmin etmekle ilgilenir . Yani, sadece işe yaradığını bilmelisiniz ve nedenini anlamaya çalışmamalısınız.

şimdilik beklemeye alınacağını bilmek için tüm mağazalarındaki satış verilerini kullanır . 2004'te Amerika Birleşik Devletleri'nin güneydoğusunu vuran yıkıcı bir fırtına olan Francis Kasırgası'ndan önce Walmart, şehrin fırtınayı atlatmasıyla insanların alışveriş alışkanlıklarının değişebileceğinden şüpheleniyordu (ve haklı olarak) . Şirketin uzmanları , insanların ne satın almak isteyebileceklerini anlamaya çalışarak önceki kasırgalardan elde edilen satış verilerine baktı. Hangi var en popüler oldu? çilekli kurabiye Kasırgaya giden günlerde bu ürün normalden yedi kat daha hızlı satılıyor.

kamyonlar dolusu Çilekli Pop Tart, 95 numaralı Otoyol boyunca (kasırga yolunda) süpermarketlere gitti . Ve gerçekten de: bu günlerde özellikle iyi sattı.

Neden Pop Tart? Muhtemelen soğutma veya pişirme gerektirmediği için.

Neden çilek? Hiçbir fikrim yok.

Ancak kasırgalar geçtiğinde insanlar
çilekli bisküvileri süpürür.

Şimdi, bir sonraki kasırgaya birkaç gün kala, Walmart bu ürünün raflardaki miktarını mutlaka artırıyor . Kasırganın çilek aromasıyla ilişkilendirilmesinin nedeni önemsizdir. Onun varlığı önemlidir. Belki bir gün beslenme bilimcileri kasırgalar ve doldurulmuş hamur işleri arasındaki bağlantıyı çözeceklerdir.

çilek reçeli. Ancak biz bir açıklama beklerken , Walmart yine de raflarını çilekli Pop Tart'larla dolduracak ve pirinç keklerini kasırgaların yaklaştığı güneşli günlere saklayacak.

hikayesinden de aynı sonuç çıkarılabilir . Seder için atlar neyse, Ashenfelter için de şarap oydu.

10 yıldan biraz daha uzun bir süre önce Eshenfelter şiddetli bir tahriş yaşadı. Fransa'nın Bordeaux bölgesinden bol bol kırmızı şarap aldı . Bazen lezzetliydi ve yüksek fiyatına layıktı, ancak birden çok kez güçlü bir çekiciliğe neden oldu .

Ashenfelter, tadı bu kadar farklı olan şarap için neden aynı fiyatı ödemesi gerektiğini sordu .

Orly bir kez tanıdık bir gazeteci ve şarap uzmanından tavsiye aldı. Bir şarabın iyi olup olmayacağını öğrenmenin bir yolu var . Ashenfelter'in arkadaşı, kilit noktanın bağın büyüme mevsimindeki hava durumu olduğunu söyledi.

Orly ilgilendi. Ve bunun doğru olup olmadığını ve her zaman en iyi şarabı alıp alamayacağını öğrenmeye başladı. 30 yıllık Bordeaux hava durumu verilerini indirdi . Şaraplar için müzayede fiyatlarını topladı : İlk şarap satışından yıllar sonra gerçekleşen müzayedeler, bunun gerçekte nasıl olduğunu gösteriyor.

Sonuç tek kelimeyle muhteşemdi. Gerçekten de , çoğunlukla, bir şarabın kalitesi, yetiştirme mevsimi boyunca hava durumu ile açıklanabilir. Aslında bağcılığın birinci yasası diyebileceğimiz basit bir formülle belirlenebilir :

Fiyat = 12,145 + 0,00117 kış yağmurları + 0,0614 sezon başına ortalama sıcaklık artışı - hasat zamanında 0,00386 yağmur .

Peki Bordeaux'da şarabın kalitesi neden bu şekilde tanımlanıyor? Bağcılığın birinci kanununu ne açıklar ? Eschenfelter'in iyi şarap formülünün bazı açıklamaları var: Üzümlerin düzgün bir şekilde olgunlaşması için sıcaklık ve erken sulama gereklidir. Bununla birlikte, tahmin formülünün kesin ayrıntıları, herhangi bir teorinin kapsamı dışındadır ve muhtemelen, alandaki uzmanlar tarafından bile hiçbir zaman tam olarak anlaşılmayacaktır.

Bir santimetrelik kış yağmuru neden bir şişe tamamen olgunlaşmış kırmızı şarabın fiyatına ortalama 0,1 sent ekler ? Neden 0,2 sent değil? Neden 0.05 değil? Bu sorulara kimse cevap veremez. Ancak kışın 1.000 santimetre fazladan yağmur yağarsa, bir şişe şarap için fazladan bir dolar ödemeye hazırlıklı olmalısınız .

Durum ne olursa olsun, Ashenfelter regresyonunun neden bu şekilde çalıştığını tam olarak bilmese de, onu yine de şarap almak için kullanıyordu. Onun sözleriyle , "harika çalıştı" 18 . O zamandan beri içtiği şarabın kalitesi önemli ölçüde arttı.

Amacınız geleceği tahmin etmekse - hangi şarabın tadı güzel olacak, hangi ürünler satılacak , hangi atlar diğerlerinden daha hızlı koşacak - modelinizin neden bu şekilde çalıştığı konusunda çok fazla endişelenmenize gerek yok . Sadece kullan. Bu, Jeff Seder hikayesinden alınacak ikinci derstir.

Seder'in potansiyel bir Triple Crown kazananını tahmin etmeye yönelik başarılı girişiminden öğrenilecek son ders , neyin veri sayıldığı konusunda açık ve esnek olmanız gerektiğidir. Bu , Seder'den önce atların şansını değerlendirirken uzmanların eksik olduğu şeydi . Çalışma süresini ve soy ağacını kontrol ettiler. Jeff'in dehası, kendisinden önce başkalarının bakmadığı yerlerde - yani geleneksel olmayan veri kaynaklarında - bilgi aramaya başlamasıydı . Bilim adamları böylesine taze ve orijinal bir vizyonu benimseyebilirlerse , kesinlikle işe yarayacaktır.

VERİ OLARAK SÖZCÜKLER

2004 yılında bir gün, medya geçmişi olan iki genç ekonomist, o zamanlar Harvard'da yüksek lisans öğrencileri olan Matt Gentzkow ve Jesse Shapiro , Massachusetts mahkemesinin eşcinsel evliliği yasallaştıran yakın tarihli bir kararını okudular .

Çocuklar ilginç bir şey fark ettiler: İki gazete aynı olayı anlatırken çarpıcı biçimde farklı ifadeler kullandı. Muhafazakar olmakla ünlü Washington Times, "Massachusetts'te Eşcinsel Bir 'Düğün'" başlıklı makaleye manşet attı. Ve liberal kabul edilen Washington Post, "eşcinsel çiftler için bir zafer" bildirdi.

aynı haberi farklı şekillerde yeniden anlatabilmesi şaşırtıcı değildir . Yıllarca Genzkow ve Shapiro, bu medya önyargısının nedenlerini anlamak için ekonomik geçmişlerini kullanıp kullanamayacaklarını merak ettiler. Neden bazıları daha liberal , bazıları daha muhafazakar görünüyor?

medyanın öznelliğini sistematik ve nesnel olarak nasıl ölçeceklerini anlayamadılar .

olayların tam olarak nasıl farklılaştığıyla ilgileniyorlardı . Sözcük seçiminde belirgin bir vurgu değişiminden bahsediyoruz. 2004 yılında The Washington Times tarafından kullanılan "homoseksüel" kelimesi , geyleri tanımlamanın eski moda ve aşağılayıcı bir yoluydu. Ancak Washington Post tarafından kullanılan "eşcinsel çiftler" terimi, eşcinsel ilişkilerin sadece başka bir aşk biçimi olduğunu vurguluyor.

Akademisyenler, dilin önyargıyı anlamanın anahtarı olup olmadığını merak ettiler. Beraller ve muhafazakarlar sürekli olarak farklı ifadeler kullanmış olabilir mi ? Ve gazetelerin şu ya da bu hikayeyi anlatırken kullandığı kelimeler veriye dönüştürülebilir mi ? Ve bu bilgi Amerikan basını hakkında neyi ortaya çıkarabilir ? Basının liberal mi yoksa muhafazakar mı olduğunu kelimelerle belirleyebilir miyiz ? Ve nedenini anlayabilir miyiz? 2004'te bunlar boş sorular değildi. Amerikan yayınlarındaki milyarlarca kelime artık gazete kâğıdına ya da mikrofilme sığmıyordu . Bazı web siteleri artık Amerika Birleşik Devletleri'ndeki hemen hemen her gazetede her makalenin her kelimesini kaydediyor . Genzkow ve Shapiro bu siteleri gözden geçirebilir ve dilin kağıdın bir şekilde ya da diğer şekilde çarpık olduğunu gösterme derecesini hızlı bir şekilde test edebilir. Bu testler, medya ilkeleri anlayışımızı geliştirmelerine yardımcı olacaktır .

bir an için Genzkow ve Shapiro'nun tarihini ve gazete dilini ölçme girişimlerini durduralım ve bilim adamlarının insan doğasını daha iyi anlamak için bu yeni tür verileri -sözcükleri- nasıl kullandıklarını tartışalım .

Elbette dil her zaman sosyologların ilgi konusu olmuştur . Ancak, onu incelemek için kural olarak metinlerin dikkatli bir şekilde okunması gerekir. Ve büyük metin yığınlarını verilere dönüştürmek daha önce mümkün değildi . Artık bilgisayarları ve sayısallaştırmayı kullanarak , çok sayıda belgeden alınan sözcükleri sınıflandırmak kolaydır . Böylece dil, büyük veri analizinin konusu haline gelmiştir. Google'ın birlikte çalıştığı bağlantılar da, çalıştığım Google arama terimleri gibi kelimelerden oluşur . Bilgi devriminde dil o kadar önemlidir ki, kitabın kendisine ayrılmış bir bölümünü hak etmektedir. Hatta artık o kadar yaygın bir şekilde kullanılmaktadır ki “veri olarak metin” kavramı bile ortaya çıkmıştır.

Bu alandaki ana gelişme Google Ngrams'tır. Birkaç yıl önce, iki genç biyolog , Erez Eiden ve Jean-Baptiste Michel, asistanlarından belirli kelimelerin içlerinde ne sıklıkta geçtiğini öğrenmek için tozlu eski metinlerdeki kelimeleri birer birer saymalarını istedi . Bir gün Aiden ve Michelle, Google'ın dünyanın her yerinden kitapları dijitalleştirmeye yönelik yeni projesini duydular ve neredeyse anında bu şekilde dilin tarihini anlamanın çok daha kolay olacağını anladılar.

, Discover dergisine verdiği bir röportajda, "Yöntemlerimizin umutsuzca modası geçmiş olduğunu fark ettik" dedi . " Her şeyi fetheden bu dijital güçle rekabet etmenin imkansız olduğu açıktı." Bu yüzden onunla işbirliği yapmaya karar verdiler . Aiden ve Michel, Google mühendislerinin yardımıyla dijitalleştirilmiş milyonlarca kitapta belirli bir kelimeyi veya tümceciği arayan bir hizmet oluşturdu . Uygulama daha sonra araştırmacılara bu kelimenin veya deyimin 1800 ile 2010 yılları arasında her yıl ne sıklıkta göründüğünü söyler .

, yıllar içinde kitaplarda geçen sözcük ve deyimlerin sıklığından ne öğrenebiliriz ? Her şeyden önce , sucuğun popülaritesindeki yavaş artış ve pizzanın popülaritesindeki nispeten yakın zamanda hızlı artış hakkında.

Ama çok daha ciddi sonuçlar da var. Örneğin Ngrams Google , ulusal kimliğimizin nasıl oluştuğunu gösterebilir. İşte Aiden ve Michel'in Uncharted'ından büyüleyici bir örnek .

Ama önce bir soru. Sizce bugün Birleşik Devletler birleşik mi yoksa bölünmüş bir ülke mi? Sıradan insanların çoğunluğu arasındaysanız, yüksek düzeyde siyasi kutuplaşma nedeniyle ABD'nin oldukça bölünmüş olduğunu söyleyeceksiniz. Hatta bugün ülkenin hiç olmadığı kadar bölünmüş olduğu bile söylenebilir . Ne de olsa Amerika artık renklere göre bölünmüş durumda: kırmızı eyaletler Cumhuriyetçi, mavi eyaletler Demokrat. Ancak Aiden ve Michel'in Uncharted'ında Birleşik Devletler'in geçmişte ne kadar bölünmüş olduğunu gösteren çarpıcı bir an var . Bu, insanların ülkelerinden bahsederken kullandıkları kelimelerle kanıtlanmaktadır .

Bir önceki paragrafta ülkenin bölünmüşlüğünden bahsederken kullandığım kelimelere dikkat edin. "ABD bölünmüş bir ülkedir" diye yazdım. ABD'den tekil bir isim olarak söz ettim. Bu doğaldır , doğru dilbilgisi ve sözcükleri kullanmanın standart yolu budur . Eminim fark etmemişsindir bile.

Ancak Amerikalılar her zaman bu şekilde konuşmazlar. Amerika Birleşik Devletleri'nin ilk günlerinde insanlar ülkelerinden bahsederken çoğul kullanırlardı . Örneğin, John Adams, 1799 tarihli Birliğin Durumu konuşmasında, "Amerika Birleşik Devletleri ve İngiliz Majesteleri ile yaptığı anlaşmalardan" söz etti. Kitabım 1800'de yazılmış olsaydı, " ABD bölündü" derdim . Kelime kullanımındaki bu küçük fark, uzun süredir tarihçileri ilgilendiriyor çünkü Amerika'nın kendisini bir devletler topluluğu olarak düşünmeyi bırakıp tek bir ulus olarak düşünmeye başladığı bir anı gösteriyor .

Peki ne zaman oldu? Tarihçiler, Uncharted'ın bize söylediği gibi, durumu netleştirmenin güvenilir bir yolu olmadığı için bunu hiçbir zaman kesin olarak bilemediler. Ancak birçoğu bunun İç Savaş sırasında olduğundan şüpheleniyor. Amerikan Tarih Derneği'nin eski başkanı ve Pulitzer Ödülü sahibi James McPherson, "Savaş, Birleşik Devletler'in çoğuldan tekil isme geçişini işaret etti" dedi.

Ancak McPherson'ın yanıldığı ortaya çıktı. Google Ngrams, Aiden ve Michel'e güvenilir bir doğrulama yöntemi sağladı. "The United States is..." ve "The United States is..." ifadelerinin her yıl Amerikan kitaplarında ne sıklıkta kullanıldığını görebiliyorlardı . Geçiş oldukça kademeliydi ve ne İç Savaş'tan önce ne de savaşın bitiminden sonra hızlanmadı .

İç Savaş'tan on beş yıl sonra, ülkenin hâlâ dilsel olarak bölünmüş olduğunu gösteren "Amerika Birleşik Devletleri ..." yerine "Amerika Birleşik Devletleri ..." yazmak oldukça yaygındı. Askeri zaferler, düşüncedeki değişiklikleri geride bıraktı.

Her şey ülkenin birleşmesi ile ilgili. Kadın ve erkek nasıl bir araya gelir? Kelimeler burada da yardımcı olabilir.

belirli bir erkek ve kadının ilk görüşmelerinde konuştuklarına dayanarak , ikinci bir randevuları olup olmayacağını tahmin edebiliriz.

Bu, Stanford ve Northwestern Üniversitelerinden oluşan disiplinler arası ekip, Daniel McFarland, Dan Juravsky ve Craig Rawlings tarafından gösterildi . Bir partnerle temasın ortaya çıkışını ve onunla ikinci bir randevuya gitme arzusunu etkileyen faktörleri belirlemek amacıyla yüzlerce heteroseksüel hızlı flört katılımcısıyla 19 röportaj yaptılar .

İlk başta, araştırmacılar geleneksel verileri kullandılar . Hızlı randevu katılımcılarına anket yaptılar, boylarını, kilolarını, hobilerini kaydettiler ve bu faktörlerin romantik ilgi kıvılcımının kiminle kaydedildiği ile ne kadar güçlü bir şekilde ilişkili olduğunu test ettiler. Ortalama olarak, kadınlar tutkularını paylaşan daha uzun erkekleri tercih ediyor ; ortalama olarak erkekler tutkularını paylaşan daha ince kadınları tercih ediyor. Herşey aynı.

Ancak bilim adamları yeni bilgiler de keşfettiler. Deneydeki katılımcılara yanlarında dijital ses kayıt cihazları almaları talimatını verdiler . Böylece sohbette kullanılan tüm kelimeleri bir araya toplamak, kahkahanın varlığını ortaya çıkarmak ve ses tonunu izole etmek mümkün oldu . Araştırmacılar, erkeklerin ve kadınların ilgilerini nasıl gösterdiklerini ve partnerlerin bu ilgiyi nasıl "kazandıklarını" test edebilirler.

Peki dilbilimsel veriler bize ne söylüyor? İlk olarak, bir erkek veya kadının ilgisini nasıl ilettiği hakkında. Bir kadının bir erkeğe ilgi duyduğunu göstermenin bir yolu açıktır - erkek onun şakalarına güler. Daha az belirgin olan başka bir faktör de , bir konuşma sırasında bir erkeğin ses ton aralığını sınırlamasıdır. Monoton bir sesin genellikle kadınlar tarafından erkeksi olarak algılandığını gösteren araştırmalar yapılmıştır . Bu, erkeklerin bir kadından hoşlandıklarında - belki de bilinçaltında - erkekliklerini abarttıkları anlamına gelir.

Öte yandan kadınlar, seslerindeki ton aralığını değiştirmekle ilgilendiklerini belirtirler - daha yumuşak ve daha kısa cümlelerle konuşmaya başlarlar . Bir kadının ilgisi hakkında iyi bir ipucu kullandığı kelimelerdir. Diyelim ki, konuşması "belki" veya "muhtemelen" gibi doğrudan bir cevaptan kaçınan kelimeler ve ifadeler içeriyorsa, bir erkekten hoşlanma olasılığı düşüktür.

Beyler, bir kadın herhangi bir konuda iddiasını korumaya başladıysa - içkisini "bir şekilde" seviyorsa veya "biraz" üşüyorsa veya "muhtemelen " daha fazla yiyebiliyorsa, bahse girerim o "bir nevi" “ Sanki "" kesinlikle "senin için tutkulu değilmiş gibi.

Bir kadın kendinden bahsediyorsa muhtemelen seninle ilgileniyordur. Bir erkek bir kadından hoşlanıyorsa , onun dudaklarından duyabileceği en güzel kelimenin "ben" olduğu ortaya çıktı: bu, kadının kendini rahat hissettiğinin bir işaretidir. Ayrıca, bir kadının " Anlıyor musun ?", "Gerçekten mi?" ve "Yani." Neden? Bilim adamları, bu ifadelerin dinleyicinin dikkatini çektiğini fark ettiler . Arkadaş canlısı ve sıcaktırlar, bir erkekle teması sürdürmeyi içerirler - ne demek istediğimi anlıyor musunuz?

Daha öte. Bir randevu partnerinin ilgisini çekmek için erkekler ve kadınlar nasıl iletişim kurmalıdır? İstatistikler, erkeklerin bir kadın tarafından beğenilme şanslarını artırmak için bu şekilde konuşmanın birçok yolunun olduğunu söylüyor . Hanımlar kendileriyle aynı fikirde olan erkeklerden hoşlanır. Bu nedenle, bir erkek şakalarına gülerse ve sürekli olarak değiştirmek yerine önerdikleri konularda sohbete devam ederse, ne hakkında konuşmak istediği hakkında bir sohbet başlatırsa, kadınların ortaya çıkan teması başarılı bulma olasılıklarının daha yüksek olması şaşırtıcı değildir. kendisi [12]. Kadınlar ayrıca kendilerine desteklerini ve sempatilerini ifade eden erkeklerden hoşlanırlar. Bir erkek "Bu harika" veya "Bu harika" derse, kadınların bağlantı hakkında düşünme olasılığı çok daha yüksektir. " Zor" veya "Üzgün olmalısın" gibi ifadeler kullandığında olduğu gibi .

İstatistikler erkekler hakkındaki çirkin gerçeği doğruluyor gibi göründüğü için kadınlar için kötü haberler var . Sohbet, kadınlara karşı tepkilerinde yalnızca küçük bir rol oynar . Bir erkekle teması tahmin ederken, bir kadının görünüşü her şeyden ağır basacaktır. Bununla birlikte, bir erkeğin sempati şansını biraz artırmak için kullanılabilecek bir kelime var ve bunu daha önce tartıştık: "Ben". Erkeklerin kendinden bahseden bir kadınla ilgilenme olasılığı daha yüksektir. Ve daha önce belirtildiği gibi, kadınların kendileri hakkında konuştukları bir tarihten sonra ilgilerini bildirme olasılıkları daha yüksektir. Bu nedenle, ilk buluşmada bir kadın hakkında önemli bir konuşma yapılırsa, bu çok ciddi bir işarettir. Bayan, bu ilişkide rahat olduğunu ifade ediyor ve adamın tüm konuşmayı devralmadığını takdir ediyor gibi görünüyor. Ve kadının onunla tanışmak için açtığı beyefendiyi seviyorum. Yani ikinci bir buluşma çok muhtemel.

Son olarak, tarihlerin transkriptlerinde sorunların net bir göstergesi bulundu - soru işareti. İlk buluşma sırasında çok fazla soru sorulduysa, bu, hem erkek hem de kadın tarafından ikinci bir soru olasılığını pratik olarak dışlar. Sorular sadece bir ilgi işareti gibi göründüğü için bu mantıksız görünüyor . Ama ilk buluşmada değil. İlk başta, çok sayıda soru can sıkıntısının bir işaretidir. "Hobilerin neler?" "Kaç erkek ve kız kardeşin var?" Konuşma durduğunda insanların söylediği şey bu. Bununla birlikte, birçok başarılı ilk buluşmanın sonunda tek bir soru olabilir: " Benimle tekrar buluşur musun?" Tüm toplantıdaki tek soru buysa, yanıtın "Evet" olması muhtemeldir.

Erkekler ve kadınlar, yalnızca birbirlerini kazanmaya çalışırken değil, farklı konuşurlar. Hep farklı konuşuyorlar .

, yüzbinlerce Facebook gönderisinde kullanılan kelimeleri analiz etti21 . Uzmanlar, her bir kelimenin hem erkekler hem de kadınlar tarafından ne sıklıkta kullanıldığını tespit etti . Sonuç olarak İngilizce dilindeki en “eril” ve en “dişil” kelimeler belirlendi.

Ne yazık ki bu kelimelerin çoğu açıktı. Örneğin , kadınlar erkeklerden çok daha fazla "alışveriş" ve "saçlarım" diyor . İkincisi, kadınlardan çok daha sık "futbol" ve "Xbox" diyor. Muhtemelen aynı iddiayı ileri sürmek için büyük veri analizlerine sahip bir psikolog ekibine ihtiyacınız olmaz.

Ancak bazı bulguların daha ilginç olduğu ortaya çıktı . Kadınlar "yarın" kelimesini erkeklerden çok daha sık kullanıyor, belki de erkekler ileriyi düşünmekte o kadar iyi değiller. "So" kelimesine "o" harfinin eklenmesi ("so" kelimesine "A" harfi) en tipik kadın dil özelliklerinden biridir. Kadınlar tarafından orantısız olarak kullanılan kelimeler arasında "öyle", "eee", "eeee" yer aldı.

kazara lanetlerden kaçmaktan korkmayan kadınlara olan çocukluk ilgimdendir , ama her zaman her iki cinsiyetin temsilcilerinin eşit şekilde yemin ettiğini düşünmüşümdür . Ama hayır. Erkeklerin kadınlardan çok daha sık kullandığı kelimelerin listesi "lanet olsun", "sikmek", "saçmalık", "enayiler" içerir.

İşte en çok erkeklerin kullandığı kelime bulutları, ardından kadınların en sık kullandıkları kelime bulutları. Kelime ne kadar büyük olursa, ilgili cinsiyetin temsilcileri tarafından o kadar sık kullanılır.

Erkekler

nfl sezonu

beyzbol

futbol fantezisi

spor oynamak ligi

oynayan         oyuncu ,

basketbol oyunu

takım oyuncu koçu

durum

hükümet gücü , ülke özgürlüğü thomas ulus ״»g, ? ölçüm politik VS mühendislik

■ k<kn < ⅛ erkek ~~ .        

haklar demokrasi devlet י® o         G _ ile ortak olacak

l yaz

kazanç

her ikisi         de kavga

sen ״ grish bigvy savaşı yen ∩WTR Ya tiya call of duty ωa τ 4 HIS         HAYATI dünyanın düşmanıdır

plLlpeii.^ M r 1 vv ' r ' ju         vp         kaybedenler

zafer ligi nfl         toplantısı

NSL         dövüşü

sh ve ben inanç         ekibi ψ kaltak ״ zafer

xbox onun http:// dünya kupası onu seviyor ps3 youtube.com pf^ m dünya sırrı ciid jee kız arkadaşım mae f **king " -k Λ r⅜ ^/lΨ ana m0lie ח aDliu:> fifa takım         üyesi ° on

üye şampiyonası         modern savaş _ _ _ albüm

Arsenal _         _ _ _

lanet olası         nba

piçler         burada olanlar! *II⅜ ∣∣ V≡ ■ hale ■■■■

^ havistaiki cehennem _ lebron         ■ ¾∙ ■         ■ ■

saçmalamayı kes fakee κ bok sürtükler _

3ÖU iktisat fikrini sakladığını sanıyor

IlaIa 0 bschestatash

ttpoit TAX STATE reb o ire ülke gelir         vergileri

borç _ devlet

obama AUJET 3 dorovier d geldi _

çevrimiçi

"gr ־ gerçek beşli oyna
, P c cod
" ve γhoγ oyunları _

■A.MVF.A. oynar

oyun ps etiketi

ek

Kadınlar

Sevimli

kız gibi aşk .r

* <3 aşık

tatlım         çok

Canım

süper çoooook

Mükemmel

son derece Se! bir gün çok m- çok azgın

Yarın aşırı derecede tatmin edici " TV " veya " vay canına çok heyecan verici "

onun yeni ben yani en
iyi arkadaşı çikolata onu alışverişe
ah ! <3

sevimli bebek

m ila shka çok sevimli o harika çocuklar çok oyuncak bebek o g plpmpl lllfflllll 1/1 S I evi ¾         bebek kız kardeş uuuuuiii!

LL benimkiyle ShopPit ah <3g orzh R s         oochen

- Annemin doğum günü         bekleyemedi

/g 1         VI(J ∕IK(JJI( JLnl)

PUPITRR ■כ aΛflΩ11aTΩΠLU L 1 ” 1 '“״ * , J^*∕∕ IV/ v⅛∕ι         '

lu ѵ ve | onu harika ben çok        

çok mutlu n o _ _ _ _ _ _ _ _ _         _

sevgili         harika

elbise seni seviyorum mi pui
oochen eeee! :(         mil.

”"■““.“favori

harika f         tia

inanılmaz U bo R ka ^״״A ״ aile kocası arkadaşlarına yardım etti minnettar ist iiii sevgili kutsanmış kız minnettar mutlu

ΓKVUAI∩ llallpiiga kızlar döngüleri n lemien ik miss mommy         ^י*«^־»

mutlu yıllar

GZKLZ sadece glima t , ^i∕λu ιrs ιz , ⅛ιz         yıl

kadar seksi doğum günü harika dileklerimle

erkek kardeş kızı özel

yeğen

kardeş oğul

∩∩∩ι pHk onu seviyorum benim ≡ a UUU4C∏D         sooo

Tanrım! m _ _ sevilen

kız arkadaş yorgun

:) en iyi arkadaş akraba
yalt sevgili =1

l d         şaplak

bebek arkadaş

bebek maması <3

Bu çalışma hakkında en sevdiğim şey, yeni verilerin bize uzun süredir var olan ancak bizim bilmediğimiz sonuçlar sunması. Erkekler ve kadınlar her zaman farklı konuşmuşlardır. Ancak yüzbinlerce yıl boyunca, sesler uzayda çözünür çözülmez bu bilgi yok oldu. Artık bilgisayarlarda saklanıyor ve akıllı makineler kullanılarak analiz edilebiliyor.

Kullandığın kelimeler kahrolasıca yok oluyor " demeliydim . Artık futbol izlemeye ve Xbox oynamaya bir ara verebilir ve bu saçmalığı keşfedebiliriz. Tabii, eğer bu konuda bir bok yapmazsan.

Ama farklı konuşan sadece erkekler ve kadınlar değil . Yaşla birlikte insanlar başka kelimeler de kullanmaya başlar. Hatta bize yaşlanma süreci hakkında bazı ipuçları verebilir . İşte aynı çalışmanın verileri - çeşitli yaşlardaki insanlar tarafından Facebook'ta en sık kullanılan kelimeler . Ben bu dağıtıma “İçki” diyorum. İş. Dua etmek". Gençler içer. 20 yıl sonra çalışırlar. 30 ve üstüne çıkınca namaz kılarlar.

Güçlü bir yeni metin analiz aracına bazen ruh hali analizcisi denir. Akademisyenler artık belirli bir pasajın ne kadar mutlu ya da üzücü olduğunu değerlendirebilecek durumda.

Nasıl? Bir araştırma ekibi, çok sayıda insandan on binlerce İngilizce kelimeyi olumlu ya da olumsuz olarak derecelendirmelerini istedi. Bu tekniğe göre en olumlu olanı "mutluluk", "aşk" ve "havalı" idi. En olumsuz olanları “üzgün”, “ölüm” ve “depresyon”dur. Böylece, çok sayıda kelime temelinde, bir ruh hali belirleyicisi yaratıldı.

İÇMEK. İŞ. DUA ETMEK

перерыв типа тусовка
не дай-ка присоединиться
что-то ЙК™ захватчики
.        ѵлплтт

трусца займ холод 1 хотелось бы <3 черт побери дерьмо иди домой квартирант сосед разбуди меня скучает 2І־й профессор хотелоХсХапартамен4 иди В класс колледж лист бумагичертов учиться кампус формальный затраханный        у

™,ил изучениеспальняв библиотеке ״?״״та״ст”тЬя        нокаут не могу

семестр        дьЯд        ■ л

гребаныйчерт возь™трах семестр
дерьм°ый финалы занятиячертов лекции я
таѵаитліт интервью ф^я        универ

экзамен соседи
законченный взносы
экзамены занятия решающий
конец домашнее задание
статьи проекты
домашняя работанеделя недели
семестр ТесТЫ письменная работа

веота он-лайн расписание зарегистрирован благодарИосТИ класс осень официально реп1страш1я колледж семестр разговоры занятия подписан лето

чувак т

суки

сука траханый

сраный задница

факи хрень

чушь дерьмо

заметки последний

заме1к״мен занятие

философия экзамен

обучение нЯуЕЯ

исторІдокадатедьстао Профессор

лекция психология
тест психолог
семестр

алкоголь

״■!я!’1 универ пьянка тусовка

лаба        й наркоман

А'^1аокончательный / выпивкапьян

бар

траханый тусовка

ѵпикшийся протрезвевший упивши ся

завизатъ обкуренный слегка зависать

под мухой

повторить

ярД не , универ аботаДневной

LzUv∕V∕ Х «• расписание волонтер размещение признательный женат оттянуться бакалея .,״״״!возбужденный,        

пожелания

Должность интервью
״ нанимать
заинтересованный резюме продажи карьера
ассистент менеджер
опыт
офис бизнес работа
"lta компания

19-22 yaşında

yer değiştirme kiralama gidiş taşınma kiracı yatak odası _

zor

aylık daireler

ev taşımak sen sor d şirket alanı         D ™ Giden

içki dilekleri yeni çalışma         "°=™"™

bar dairelerinin keyfini çıkarın _

içki içmek ... vergiler ״ ζ⅝ anlamsız VE 3 POTO ״ en ״ la ““ yeni ( pch üzerindeki yer >•׳ “* rao ו e denodlyavsel”         ~         kadın         ■ pggtppoiio

gevşeme

koca yarın çalışmak mübarek ״ nop0D gitmeye hazır         C ~ DUIVΛΓIIJLIA ״ІПВ м ׳*

пиво д барбикю

гженек после работы кореньвыпивка наслаждаться ВЫПИВаТЬ 6’™'1“ банки эль имбирный

ХОЛОДНЫЙ пиво воньпаб напиться

zavallı bebek düğün hafta sonu çamaşırhane

nllog para faturası “““ 1         י "^ bira çok gerekli. m ° i de™

aylık borç kocanı kontrol et _

yıllık ödeme hesapları tatil için iş gezileri ödedi

para borcu limiti öde ״׳ ™ ™™ ־־ ■ sch ׳ tebrikler kutluyoruz _ _

iş ödeme D         başlığı

erken ev, koca

serin yatak öğle yemeği •׳t

kestirme

hazır r a , bsh' ta .'" n ' s

duş gevşeme

23-29 yaşında

desteklenen
aile harika
koca arkadaşlar sevgili
gerçekten yardımcı oldun        

служил женщинажизни умер

с!!ужба страна araι служить свобода помнить        америка

американец метжр™на

müthiş; chastl " Minnettar ol ״ r , τ⅛τιτ gururlu         minnettar kutsanmış

p en         küçük         kızının favorisi

karısı baba ml anne doğdu         e -         tedavi <

işine geri dön        

kızı i-konuştu         b         fiili ödemeler

kızları koca küçük çaba         kızları

çocuğun babası Sonuç, facebook kocanızın         mahremiyetine dikkat ederek         arkadaşlarınızı yeniden yayınlayın . kopyalamak

oğlunun en büyük         kızı onun sahibi olacak

ailenin hoş onurunu         saymaktan mutluluk duyuyorum

bunu aileye ve arkadaşlara yapıştırın

içine koy         ben sadece         harika biri değilim

facebook'taki oyuncular arkadaşlar çocuklarım
kutsanmış         güvenlik " awn         ≡ n"! ״™™

тратить объединение в емя“ семья время чудесно ״.ТРаТИ.״״великий выходные подвешивать невероятный посещать

Р схватывать потрачено

1ы люоишь больше ■        илпллт;

установки В течение жизни репост6л־гословенныи пожалуйста, напиши это молЯЩИЙСЯ День для всех

ребенок меня

родитель ^"выросший дети перед молодой дети родители взросшіе        взрослыйобучагь

Hayatının tüm yosunlarım için ilginç olması için dua ediyorum çocuklar aile tanrısı senin hayatını inşa etmen için kızım o         bilinçli karar         birini tanıyorsun

kral köstebek         rasіYulozhenk'e cevap verir

daha çok sevdiğini cevaplar        

1 dua         - -         ppplgt"״״״t11״״״״״sh

F kızı kutsama zinciri         _ _ _ _ _ _ _

MPIITPL devlet dua direği

30-65 yaşında

Bunu kullanarak, bir metin pasajındaki kelimelerin ortalama ruh halini ölçebilirsiniz. Birisi "Mutluyum, aşığım ve harika hissediyorum" yazarsa ayrıştırıcı bunu çok mutlu bir metin olarak işaretler. Birisi şöyle yazarsa: "Ölüm ve depresyon hakkında düşünmek beni üzüyor", analizci çok üzücü bir metne karşılık gelen bir sonuç üretecektir . Parçaların geri kalanı ortada bir yere yerleştirilecek.

metnin yapısı üzerindeki belirleyiciler yardımıyla neler öğrenilebilir ? Facebook veri bilimcileri dikkate değer bir fırsat gösterdiler. Bir ülkenin gayri safi milli mutluluğunu neredeyse her gün tahmin edebilirler. İnsanlar durumları hakkında olumlu tonlarda mesajlar yazma eğilimindeyse , bu gün ülke mutlu kabul edilir. Metinler çoğunlukla olumsuzsa, ülkede gün açıkça iyi ayarlanmamış demektir.

Facebook veri bilimcilerinin bulgularından biri: Noel, yılın en mutlu günlerinden biridir. Bu analiz ve genel olarak tüm proje hakkında şüpheliydim. Aslında bence pek çok insan Noel'de yalnız oldukları ya da aileleriyle kavga ettikleri için gizliden gizliye üzgündür. Genel olarak, çevrimiçi yaşamlarımız hakkında yalan söyleme eğilimimiz nedeniyle Facebook güncellemelerine güvenme eğiliminde değilim (bunu bir sonraki bölümde tartışacağız).

Noel'de yalnız ve mutsuzsanız, ne kadar mutsuz olduğunuzu paylaşarak tüm arkadaşlarınızı gerçekten üzmek ister misiniz? Kasvetli bir Noel geçiren birçok insanın Facebook'ta bu "harika, harika, şaşırtıcı, mutlu yaşam" için ne kadar minnettar olduklarını ve böylece ülkenin brüt mutluluğunu artırdığını bildirdiğinden şüpheleniyorum . Ancak, Gayri Safi Milli Mutluluğun gerçek seviyesini belirleyeceksek, Facebook besleme güncellemelerinden daha fazla kaynak kullanmamız gerekiyor .

Noel'in genellikle neşeli bir olay olduğu iddiası doğru olacaktır. Google'ın depresyon aramaları ve Gallup anketleri de Noel'in yılın en mutlu günlerinden biri olduğunu gösteriyor . Ve sanılanın aksine tatillerde intihar sayısı azalıyor . Noel'de üzgün ve yalnız insanlar olsa da, daha birçok neşeli ve mutlu insan var.

Günümüzde bir insan kitap okumak için oturduğunda zamanının çoğunu dikkatlice Facebook gönderilerini inceleyerek geçiriyor . Ama çok da uzun olmayan bir zaman önce, insanlar kitap okurdu ve burada duygu analizi bize çok şey söyleyebilir.

Üniversitesi'nden Andy Reagan ve Berkeley Bilgi Okulu'ndan yönetilen bir bilim insanı ekibi, binlerce kitap ve film senaryosunun metinlerini indirdi 22 . Araştırmacılar daha sonra her metnin her bir parçasının ne kadar mutlu ya da üzgün olduğunu belirlediler.

Örneğin, Harry Potter ve Ölüm Yadigarları'nı düşünün. Akademisyenler , kilit olay örgüsü noktaları açıklanırken bir öykünün havasının nasıl değiştiğini göstermişlerdir .

İnceleme ekibi tarafından binalarda tanımlanan iniş ve çıkışların birçoğunun önemli olaylara karşılık geldiğine dikkat edin.

Çoğu hikaye daha basit yapılara sahiptir . Örneğin, Shakespeare'in trajedisi Kral John'u ele alalım. Bu oyunda her şey yolunda gidiyor. Topraksız Kral John'dan tahttan çekilmesi istenir. Papa'ya itaatsizlik ettiği için aforoz edildi. Savaş çıkar . Yeğeni muhtemelen intihar ederek ölür. Diğer insanlar ölüyor. Ve sonunda, John hoşnutsuz bir keşiş tarafından zehirlenerek ölür.

Ve işte oyun sırasındaki ruh hallerinin analizi.

Başka bir deyişle, bilgisayar sadece metni analiz ederek olayların kötüden kötüye, hatta daha da kötüye gittiğini gösterebildi .

Veya 127 Saat filmini düşünün. Ana konusu aşağıdaki gibidir.

Bir dağcı, Utah'taki Canyonlands Ulusal Parkı'nda yürüyüşe çıkıyor. Diğer turistlerle tanışır ama sonra onlardan ayrılır. Birdenbire elini sıkıştıran gevşek bir taşın üzerinden kaydı ve devrildi. Tırmanıcı kendini kurtarmak için çeşitli yollar dener , ancak her seferinde başarısız olur. Umutsuzluğa düşer . Sonunda elini keser ve kaçar . Daha sonra evlenir, bir aile kurar, ancak dağlara gitmeye devam eder - ancak şimdi giderken bir not bırakmayı unutmaz.

Reagan bilim adamları ekibi tarafından filmin duyarlılığının bir analizi var .

Öyleyse, bu tür binlerce hikayenin ruh halini inceleyerek ne öğreniyoruz ?

, hikayelerin büyük bir yüzdesinin Reagan ekibinin keşfettiği nispeten basit altı yapıdan birine uyduğunu keşfetti :

Yoksulluktan zenginliğe (yükseliş)

Zenginlikten yoksulluğa (düşüş)

Çukurdaki adam (düş, sonra yüksel)

Icarus (yüksel, sonra düş)

Külkedisi (yüksel, sonra düş, sonra yüksel)

Oedipus (düş, sonra yüksel, sonra düş)

Basit bir devre tarafından dikkate alınmayan küçük sapmalar mümkündür. Örneğin, "127 Saat" filmi, "Çukurdaki Adam" olarak kategorize edilir, ancak duygusal arka planın geçici olarak düzeldiği anlar vardır. Ancak hikayelerin büyük çoğunluğu altı kategoriden birine giriyor. Harry Potter ve Ölüm Yadigarları bir istisnadır.

Hala cevaplamamız gereken birçok ek soru var. Örneğin tarihin yapısı zaman içinde nasıl değişti? Hikayeler yıllar geçtikçe daha mı karmaşık hale geldi ? Hikaye türlerinde kültürel farklılıklar var mı? İnsanlar en çok ne tür hikayeleri sever 23 ? Erkekler ve kadınlar farklı hikaye yapılarına mı ilgi duyuyor yoksa aynı mı? Peki ya farklı ülkelerden gelen insanlar?

Sonuç olarak, veri olarak metin bize izleyicilerin gerçekten ne istediğine dair benzeri görülmemiş bir içgörü sağlayabilir. Bu anlayış , yazarların ve film yapımcılarınınkinden önemli ölçüde farklı olabilir .

Wharton Okulu'ndaki iki profesörün, Jonah Berger ve Katherine L. Milkman'ın araştırmasını düşünün. Hangi tür hikayelerin insanları en çok çektiğini, olumlu ya da olumsuz hangilerinin e-posta ile en çok paylaşılan listede olma olasılığının daha yüksek olduğunu anladılar (The New York Times'a göre). Araştırmacılar her New York Times makalesini üç ay boyunca indirdiler. Profesörler, bir duygu analizi programı kullanarak makalelerin ruh halini deşifre ettiler. Patronaj için Tony Ödülü'nün olumlu bir hikayeye dönüştüğünü varsayalım . Ancak "Koreli bir aktrisin intiharına ilişkin internette söylentiler" ve "Almanya : kutup ayısının hemşiresi öldü" - ki bu şaşırtıcı değil - olumsuz bir karaktere sahipti.

Profesörler ayrıca her makalenin tam olarak nerede yayınlandığıyla ilgili bilgileri de kaydetti. Ana sayfada mı? Sağ üst? Sol üst? Ayrıca, makalenin yayınlandığı zaman hakkında bilgi kaydettiler. Salı gecesi geç mi? Pazartesi sabahı?

New York Times web sitesinde aynı yerde çıkan ve aşağı yukarı aynı zamanlarda çıkan iki makaleyi (olumlu ve olumsuz) karşılaştırarak New York Times e-postasında hangisinin daha aktif paylaşılacağını görebilirler.

Peki hangi yazılar daha çok tepki alıyor, olumlu mu olumsuz mu?

Pozitif. Çalışmanın yazarlarının şu sonuca vardığı gibi, "içerik ne kadar olumluysa, internette paylaşılma olasılığı o kadar yüksektir."

İnsanların şiddet içeren hikayelere ve felaket hikayelerine çekildiği şeklindeki olağan gazetecilik anlayışıyla bu beklenmedik karşıtlığa dikkat edin . Gerçekten de medya, insanların kafasına bir sürü kasvetli yazı döküyor. Belki de başyazıda tartışacak bir şeyimiz var : "Ne kadar çok kan o kadar çok çeker." Ancak Wharton Okulu'ndaki profesörler tarafından yapılan bir araştırma, insanların aslında daha komik hikayeler istediğini gösteriyor. Yeni bir söz sunabilirler: "Eğer bir şey seni gülümsetirse, insanlar bunu başkalarıyla paylaşır."

İşte hüzünlü ve neşeli metinler hakkındaki tüm gerçek. Hangi kelimelerin liberal veya muhafazakar olduğunu nasıl belirlersiniz ? Bu bize modern medya hakkında ne söylüyor? Bu biraz daha karmaşık ve bizi Genzkow ve Shapiro'ya geri getiriyor. Hatırlayacağınız gibi, eşcinsel evliliğin iki farklı gazetede farklı şekilde anlatıldığını fark eden ve bu nedenle siyasi önyargıları tespit etmek için dili kullanıp kullanamayacaklarını merak eden ekonomistlerdi .

Bu ikisinin yaptığı ilk şey kongre transkriptlerini kontrol etmek oldu. Bu kayıtlar halihazırda dijital ortama aktarıldığı için , bilim adamları 2005 yılında hem Demokrat hem de Cumhuriyetçi her kongre üyesi tarafından kullanılan her kelimeyi indirebildiler . Daha sonra Demokratların hangi ifadeleri kullanmayı tercih ettiğini ve hangi Cumhuriyetçilerin kullanmayı tercih ettiğini anlamaya çalıştılar .

Ve bu tür ifadeler gerçekten vardı. İşte her kategoride bazı örnekler.

Demokratlar Tarafından Çok Daha Sık Kullanılan İfadeler

Cumhuriyetçiler Tarafından En Sık Kullanılan İfadeler

emlak vergisi

Veraset vergisi

Sosyal güvenlik sisteminin özelleştirilmesi

refah reformu

Rosa Parkları

Saddam Hüseyin

İşçi hakları

Özel mülkiyet hakları

Fakir

Devlet harcamaları

Kelime dağarcığındaki bu farklılıkları açıklayan nedir?

Bazen Demokratlar ve Cumhuriyetçiler aynı kavramı tanımlamak için farklı diller kullanırlar . 2005 yılında, Cumhuriyetçiler federal miras vergisini düşürmeye çalıştı. Buna "ölüm vergisi" deme eğilimindeler (yakın zamanda ölenlerden alınan bir vergi gibi geliyor). Demokratlar bunu “emlak vergisi” olarak etiketlediler (zenginlerin vergisine benziyor ). Benzer şekilde, Cumhuriyetçiler Sosyal Güvenliği bireysel emeklilik hesaplarına dönüştürmeye çalışıyorlar. Onlar için bu bir "reform"du. Demokratlar için kulağa daha tehditkar geliyordu - "özelleştirme ".

Bazen dil farklılıkları bir vurgu meselesidir . Elbette hem Cumhuriyetçiler hem de Demokratlar , sivil haklar mücadelesinin kahramanı Rosa Parks'a büyük saygı duyuyor. Ancak Demokratlar onun adını daha sık anıyor. Ayrıca Irak'ın eski cumhurbaşkanı Saddam Hüseyin, her iki tarafça da şeytani bir diktatör olarak görülüyor. Ancak Cumhuriyetçiler, Irak'taki savaşı meşrulaştırma girişimlerinde ondan çok daha sık söz ettiler. Aynı şekilde "işçi hakları" için mücadele etmek ve "yoksullara" sahip çıkmak Demokrat Parti'nin kuruluş ilkeleridir . "Özel mülkiyet hakkı" ve "devlet harcamalarının" kısılması, Cumhuriyetçilerin temel ilkeleridir.

Ve kelime dağarcığının kullanımındaki bu farklılıklar oldukça önemlidir . Örneğin 2005'te Kongre'deki Cumhuriyetçiler 365 kez "ölüm vergisi" ifadesini kullanırken , "emlak vergisi" sadece 46 kez kullandı . Demokratlar için tablo tam tersi oldu: 35 kez "ölüm vergisi" ve 195 "vergi" gayrimenkul üzerine".

Bu sözler bize bir kongre üyesinin Demokrat mı yoksa Cumhuriyetçi mi olduğunu söyleyebiliyorsa , bilim adamları bunların sağcı veya solcu gazeteleri tanımlamak için de kullanılabileceğini fark ettiler. Muhafazakar gazeteler, sayfalarında Kongre'deki Cumhuriyetçilerle hemen hemen aynı şeyi yapıyor: Kongre'dekiler, insanları buna direnmeye ikna etmek için "ölüm vergisi" terimini kullanmayı tercih ediyor. Örneğin, nispeten liberal olan Washington Post, "emlak vergisi" ifadesini "ölüm vergisi" ifadesinden 13,7 kat daha sık kullandı. Ve daha muhafazakar Washington Times, kabaca eşit oranlarda "ölüm vergisi" ve "servet vergisi" ifadesini kullandı .

İnternetin harikaları sayesinde, Genzkow ve Shapiro çoğu ulusal gazetenin kelime dağarcığını analiz edebildiler . Araştırmacılar, 433 gazetenin sayısallaştırılmış arşivine sahip olan newslibrary.com ve proquest.com adlı iki web sitesini kullandı . Ardından, medyanın siyasi yönelimini belirlemek için bu siyasi içerikli ifadelerden bin tanesinin orada ne sıklıkta kullanıldığını saydılar . Philadelphia Daily News bu göstergede en liberal çıktı . Ve en muhafazakar olanı Billings (Montana) Gazetesi.

Bu kadar geniş bir medya yelpazesinin önyargılarının ilk kapsamlı ölçümlerine sahip olduğunuzda, belki de basınla ilgili en önemli soruyu yanıtlayabilirsiniz : neden bazı yayınlar sola, diğerleri sağa 24 kayma gösteriyor ?

Ekonomistler, dikkatlerini hızla tek bir kilit faktöre odakladılar: belirli bir bölgedeki siyasi duyarlılık. Philadelphia ve Detroit gibi geniş ölçüde liberalse, baskın gazetenin liberal olma olasılığı daha yüksektir. Daha muhafazakarsa -Billings ve Amarillo, Texas gibi- oradaki gazetelerin çoğu muhafazakar olacaktır. Başka bir deyişle, gerçekler, gazetelerin okuyucularına istediklerini verme eğiliminde olduğunu güçlü bir şekilde göstermektedir.

Gazete sahibinin yayınının yönü üzerinde etkisi olduğunu söyleyebilirsiniz. Ama hayır. Kural olarak , gazetenin siyasi yönünü düşündüğümüzden daha az etkiler. Aynı kişi veya şirket farklı pazarlarda gazete sahibi olduğunda ne olduğuna dikkat edin . The New York Times'ı düşünün. Gentzkow ve Shapiro, onun hem nüfusun yaklaşık %70'inin Demokrat olduğu New York City'deki liberal New York Times'ın hem de (çalışma sırasında ) Güney Amerika, Spartanburg'daki muhafazakar Spartanburg Herald-Journal'ın sahibi olduğunu keşfettiler. , nüfusun yaklaşık% 70'i Cumhuriyetçidir. Elbette istisnalar vardır: Rupert Murdoch'un 25 News Corporation'ı, beğenilen muhafazakar New York Post'un sahibidir. Ancak genel olarak elde edilen veriler, piyasanın gazetelerin yönünü, sahiplerinin iradesinden çok daha fazla belirlediğini göstermektedir.

, haber medyası hakkında nasıl düşündüğümüz üzerinde büyük bir etkisi var . Pek çok insan, özellikle Marksistler, Amerikan gazeteciliğini, insanları belirli siyasi görüşlere itmek için kitleleri etkilemek amacıyla bir grup varlıklı kişi veya şirket tarafından yürütülen bir şey olarak görüyordu . Ancak Genzkow ve Shapiro'nun makalesi, gazete sahiplerinin ana motivasyonunun bu olmadığını gösteriyor. Her şeyden önce, kitlelere istediklerini vermeye çalışıyorlar, böylece gazete sahipleri daha da zenginleşebilsin.

Evet, bir soru daha var - önemli, tartışmalı ve belki de daha da kışkırtıcı. Amerikan medyası ortalama olarak nereye daha fazla eğiliyor - sola mı yoksa sağa mı? Başka bir deyişle, Amerika'daki medya daha liberal mi yoksa muhafazakar mı?

Genzkow ve Shapiro, gazetelerin çoğunlukla sol eğilimli olduğunu keşfetti. Ortalama bir gazete, kullandığı kelimelerle, Cumhuriyetçi bir kongre üyesinden çok Demokrat bir kongre üyesine benziyor .

"Aha! muhafazakar okuyucular bağırabilir. "Sana söyledim!" Pek çok muhafazakar , kitleleri manipüle etme girişiminde bulunan gazetelerin solu desteklemek için önyargılı olduğundan uzun süredir şüpheleniyor.

Hayır, bu doğru değil, makalenin yazarları cevap veriyor. Aslında, gazetelerdeki liberal önyargı iyi ayarlanmış ve okuyucuların görmek istediklerine göre uyarlanmıştır. İkincisi, ortalama olarak, sola doğru hafif bir eğime sahiptir. (Araştırmacıların bu konuda verileri var). Ve gazeteler de okuyucularına görmek istedikleri bakış açısını vermek için ortalama olarak biraz sola eğilirler.

Bunda büyük bir komplo yok. Sadece kapitalizm var.

Gentzkow ve Shapiro'ya göre haber medyası, genellikle gezegendeki herhangi bir endüstri gibi hareket ediyor. Nasıl ki süpermarketler insanların hangi dondurmayı tercih ettiğini anlayıp raflarını bununla dolduruyorsa, gazeteler de insanların hangi reytingleri görmek istediğini anlıyor ve sayfalarını bunlarla dolduruyor. Shapiro bana "Bu sadece bir iş," dedi 26 . Haberler, analizler ve görüşler gibi zor şeyleri parçalara ayırdığınızda ve nicelleştirdiğinizde öğrenebileceğiniz şeyler burada .

VERİ OLARAK GÖRÜNTÜLER

Geleneksel olarak, bilim adamları veya iş adamları bilgi toplamak istediklerinde araştırma yaparlardı. Veriler, anket kutularındaki sayılara veya işaretlere göre düzgün bir şekilde oluşturuldu. Şimdi her şey farklı. Yapılandırılmış, temiz ve basit araştırma verilerinin günleri sona erdi. Bugün hayattan geçerken , her yerde temel bilgi kaynağı haline gelen kirli ayak izlerimizi bırakıyoruz.

Gördüğümüz gibi, kelimeler veridir. Tıklamalar veridir. Bağlantılar veridir. Yazım hataları veridir. Bir rüyadaki muzlar - veri. Ses tonu veridir. Hırıltı - veri. Nabız verileri. Dalağın boyutu - veri. Arama sorgularının en açıklayıcı veriler olduğunu iddia ediyorum.

Fotoğrafların da veri olduğu ortaya çıktı.

Tıpkı kitaplarda, dergilerde toplanıp tozlu raflarda saklanan sözler gibi, fotoğraflar da fotoğraf albümlerinden, karton kutulardan çıkarılarak dijital ortama aktarıldı. Onlar da bitlere ve baytlara dönüştürüldü ve buluta gönderildi. Tıpkı metinlerin - örneğin insanların kendilerini ifade etme biçimlerinin nasıl değiştiğini göstererek - bize bir ders vermesi gibi, fotoğraflar da örneğin insanların kameraya karşı duruşlarını değiştirerek bize Amerika Birleşik Devletleri tarihini öğretebilir .

Brown ve Berkeley Üniversitelerindeki dört bilgisayar bilimcisinden oluşan bir grubun araştırmasının dahiyane olduğunu düşünüyorum . Dijital çağın ilerlemesinden yararlandılar: birçok üniversite yıllık 27 mezun fotoğrafını taradı ve bunları çevrimiçi olarak kullanıma sundu. İnternette , araştırmacılar 1905-2013 dönemi için Amerikan liselerindeki öğrencilerin fotoğraflarının olduğu 949 yıllık buldular . Bu koleksiyonda on binlerce fotoğraf vardı. Bilim adamları, bilgisayar programlarını kullanarak, fotoğraflardan her on yılın "normal" yüzünü yaratmayı başardılar. Başka bir deyişle, burun, gözler, dudaklar, saçın ortalama yerini ve konfigürasyonunu anlayabildiler . İşte bir yüzyıldan uzun süredir tipik yüzler - cinsiyete göre ayrılmış:

Bir şey fark ettin mi? Amerikalılar - ve özellikle kadınlar - gülümsemeye başladı. 20. yüzyılın başında neredeyse taş bir ifadeyle fotoğraflandılar ve sonunda sadece parladılar.

Peki sebep ne? Amerikalılar onunla mutlu oldu mu?

HAYIR. Diğer bilim adamları bu sorunun yanıtlanmasına yardımcı oldular . Nedeni - en azından benim görüşüme göre - tek kelimeyle harika. Fotoğrafın şafağında, insanlar ona resim yapıyormuş gibi davrandılar 28 . Bu süreci başka hiçbir şeyle karşılaştıramadılar . Böylece, fotografikler resimlerin çizimlerinden kopyalandı. Resim için sanatçıya poz verenler de uzun saatler boyunca gülümsemelerini tutamadıkları için ciddi bir bakış attılar . Fotoğrafçının fotoğrafladığı kişiler de ciddi yüz ifadeleri oluşturdu.

Sonunda yüz ifadelerini değiştirmelerine ne sebep oldu? İş, kâr, pazarlama elbette. Yirminci yüzyılın ortalarında, film ve fotoğraf makinesi satan şirket olan Kodak , insanların çok fazla fotoğraf çekmemesinden rahatsızdı. Daha sonra insanlara daha fazla ateş etmeyi öğretmek için bir strateji geliştirildi . Kodak reklam kampanyaları, fotoğrafları mutlulukla ilişkilendirmeye başladı . Amaçları, insanlara hayatlarında iyi bir şey olduğunu başkalarına göstermek istediklerinde fotoğraf çekme alışkanlığı kazandırmaktı . Yani yıllıklardaki gülümsemeler, bu başarılı kampanyanın sonucudur (bugün Facebook ve Instagram'da gördüğünüz çoğu fotoğrafta olduğu gibi ).

Ancak fotoğraf verileri bize , lise öğrencilerinin "Gördün mü?" demeye başladıkları dönemi belirlemekten çok daha fazlasını söyleyebilir . Şaşırtıcı bir şekilde, resimler bize ekonomideki durum hakkında bile bilgi verebiliyor.

Kışkırtıcı başlıklı bir makaleye göz atın : Ekonomik Büyümeyi Uzaydan Ölçmek. Bir belgenin böyle bir başlığı olduğunda, onu kesinlikle okuyacağıma bahse girebilirsiniz. Makalenin yazarları —Vernon Henderson, Adam Sorigard ve David N. Weill—gelişmekte olan birçok ülkede mevcut gayri safi yurtiçi hasıla (GSYİH) ölçütlerinin etkisiz olduğunu belirterek işe başladılar . Bunun nedeni , birçok ekonomik faaliyetin defterlerde kayıt dışı kalması ve ekonominin performansını ölçmekle görevli devlet kurumlarının kaynaklarının oldukça sınırlı olmasıdır.

Yazarlar olağanüstü bir fikir dile getirdiler. GSYİH'yı bu ülkelerde gece 29'un ne kadar aydınlık olduğuna bağlı olarak ölçebileceklerini söylüyorlar - bu bilgiyi Dünya'yı günde 14 kez dolaşan bir ABD Hava Kuvvetleri uydusundan alınan fotoğraflardan alarak .

Geceleri ışık neden GSYİH'nın iyi bir göstergesi olabilir ? Dünyanın çok fakir bölgelerinde insanlar elektriği ödemekte zorlanıyor. Sonuç olarak, kötü ekonomik koşullar altında, sakinlerin evlerinde geceleri açmalarına izin verdikleri ışık miktarı keskin bir şekilde azaldı.

Endonezya'da, 1998'deki Asya mali krizinin bir sonucu olarak, gece ışık miktarı keskin bir şekilde düştü. Ve Güney Kore'de, 1992 ile 2008 arasında , gece aydınlatması, o dönemdeki olağanüstü güçlü ekonomik performansa paralel olarak %72 arttı . Kuzey Kore'de aynı zamanda geceleri aydınlatma miktarı azaldı, bu da

kasvetli ekonomik göstergelere karşılık geldi .

1998'de Madagaskar'ın güney kesiminde büyük bir yakut ve safir birikimi keşfedildi . Gorodish ko Ilakaka, bir kamyon durağından büyük bir alışveriş merkezine dönüşmüştür . 1998 yılına kadar gece aydınlatması neredeyse hiç yoktu ve yatağın bulunmasından sonra beş yıl içinde gece ışık miktarı patlayıcı bir şekilde arttı.

, gece aydınlatması açısından ekonomik faaliyet tahminlerinin ideal olmaktan uzak olduğunu kabul ediyor . Bir uydunun ne kadar ışık aldığına bakarak ekonominin durumunu tam olarak ölçemezsiniz. Yazarlar , mevcut ekonomik verilerin daha doğru bir tablo sağladığı gelişmiş ülkeler için bu göstergenin kullanılmasını önermemektedir. Ve gerçekte , gelişmekte olan ülkelerde bile gece ışık miktarı tahminlerinin resmi rakamlar kadar yararsız olduğunu keşfettiler . Ancak kusurlu hükümet verileri ile yetersiz gece kapsamının birleşimi, tek bir kaynağın sağlayabileceğinden daha doğru bir sonuç verir. Başka bir deyişle , uzaydan alınan görüntüler yardımıyla, bir ülkenin ekonomilerinin gelişmişlik düzeyi hakkındaki anlayışınızı kolayca geliştirebilirsiniz.

Joseph Reisinger, Ph.D. bilgisayar bilimi , gece aydınlatması fikrinin yazarlarının hayal kırıklığını, gelişmekte olan ülkelerin ekonomileri hakkında mevcut bilgi veritabanlarıyla paylaşıyor. Nisan 2014'te Reisinger , Nijerya'nın GSYİH rakamlarını oradaki yetkililerin önceki tahminlerde gözden kaçırmış olabileceği yeni sektörleri içerecek şekilde güncellediğini kaydetti . Mevcut tahminlerine göre , Nijerya'nın GSYİH'si şu anda 30'un %90 üzerinde .

31 yaşındaki Reisinger, "Bu, Afrika'nın en büyük ekonomisi" dedi ve sesi yavaş yavaş ivme kazanmaya başladı. "Bu ülke hakkında hangi temel parametreleri bilmek istediğimizi bile bilmiyoruz ."

ekonomik göstergeleri daha net değerlendirmenin bir yolunu bulmak istiyordu . Onun çözümü, verilerin nasıl yeniden düşünülebileceğine ve gerçek değerinin ne olduğuna dair harika bir örnek.

, gelişmekte olan ülkelerden akıllı telefonlarla donanmış çalışan gruplarını istihdam eden "Premise" şirketini kurdu . Onların işi nedir ? Bazı ekonomik öneme sahip olabilecek ilginç olayları fotoğraflayın .

, süpermarketlerdeki benzin istasyonlarının veya meyve sepetlerinin fotoğraflarını çekebilir . Aynı yerleri tekrar tekrar fotoğraflıyorlar. Fotoğraflar şirketin genel merkezine gönderilir ve burada ikinci bir grup çalışan - bilgisayar bilimcileri - fotoğrafları bilgiye dönüştürür.

Şirketin uzmanları, benzin istasyonlarındaki kuyrukların uzunluğundan süpermarketteki sepette kaç elma olduğuna ve bu elmaların fiyatına kadar her şeyi analiz edebilir. Herhangi bir faaliyetin çeşitli fotoğraflarına dayanarak , bir şirket ekonomik faaliyet ve enflasyon seviyesini tahmin etmeye başlayabilir . Gelişmekte olan ülkelerde benzin istasyonlarındaki uzun kuyruklar ekonomik sorunların ana göstergesidir. Olgunlaşmamış elmalar ve bunların yokluğu gibi . Çin'de çekilen fotoğraflar, resmi verilerden çok önce, 2011'deki gıda enflasyonunun ve 2012'deki gıda deflasyonunun tespit edilmesine yardımcı oldu.

Premium, bu bilgileri bankalara veya hedge fonlara satar ve ayrıca Dünya Bankası ile ortak olur.

Pek çok iyi fikir gibi, "Premise" da faydalı olmaya devam ediyor . Geçenlerde Dünya Bankası, Filipinler'deki sigarayla ilişkili kayıt dışı ekonominin boyutunu sordu. Özellikle, vergiye meydan okuyan sigara üreticilerine yapılan rastgele baskınları içeren son hükümet hamlelerinin sonuçlarını bilmek istiyordu . Premium ne buldu? Sokaktaki tütün dükkanlarının fotoğraflarını çekin. Bakalım kaç tanesinde yasal sigaraları ayırt eden özel tüketim damgası var. 2015 yılında oldukça yaygın olan kayıt dışı ekonominin bu bölümünün 2016 yılında önemli ölçüde küçüldüğü tespit edilmiştir . Gizli malın (kaçak sigara) hacmini anlamak için yeni verilere ihtiyaç duyulsa da, hükümetin çabaları sonuç verdi .

Gördüğümüz gibi, dijital çağ, neyin veri sayıldığına dair yepyeni bir anlayış getirdi ve yeni bilgilerden pek çok ilginç içgörü elde edildi. Medyanın konuşma tonunu neden sağa sola kaydırdığını bilmek, ilk buluşmanın başarısını sağlamak ve iyi gelişen bir ekonomiyi belirleme olasılığını sağlamak sadece başlangıçtır.

- on milyarlarca Brin ve Page ile başlayarak - çok para kazanılması tesadüf değildir . Joseph Reisinger da kârlı çalışıyor. Gözlemciler, bugün Premise'nin yıllık gelirinin on milyonlarca dolar olduğunu hesapladılar . Yatırımcılar kısa bir süre önce şirkete 50 milyon daha aktardı 32 . Bu, bazılarının, öncelikle fotoğraf oluşturma ve kullanma alanında, dünyanın en karlı işlerinden biri olan "Tesis" i düşündüğü anlamına gelir. Yani Playboy ile aynı ligde.

Başka bir deyişle, yeni veri türleri hem bilim adamları hem de girişimciler için büyük önem taşıyor . Aynı zamanda, veri kavramı son zamanlarda önemli ölçüde genişledi. Bugün, uzmanlar kendilerini dar veya geleneksel bir görüşle sınırlamak zorunda değiller . Bu günlerde, süpermarket kuyruklarının fotoğrafları değerli verilerdir. Rafları aynı yerde doldurmak - veriler. Elmaların olgunluğu - veriler. Uzaydan gelen fotoğraflar veridir. Dudak çizgisinin eğriliği de veridir. Herhangi bir bilgi!

Ve sonunda tüm bu yeni bilgileri, onları örten yalanların arasından bile görebiliriz.

Bölüm 4

DİJİTAL
GERÇEK SERUMU

onlar yalan. Eve giderken ne kadar içtikleri hakkında.

Spor salonuna ne sıklıkta gittikleri , bu yeni ayakkabıların ne kadara mal olduğu, bu kitabı okuyup okumayacakları hakkında. Tamamen sağlıklı olduklarında hasta olduklarını söylüyorlar. Ulaşamayacakları halde ilgileneceklerini söylüyorlar . Tartıştıkları kişi siz olmanıza rağmen, sizin hakkınızda konuşmadıklarını iddia ediyorlar. Gerçekten sevmedikleri halde seni sevdiklerini söylüyorlar . Mutlu olduklarını söylüyorlar, oysa gerçekte üzülüyorlar. Erkekleri tercih ederken kadınları sevdiklerini söylüyorlar . İnsanlar arkadaşlarına yalan söyler. patronlar Çocuklar. ebeveynler _ Doktorları ve kocaları aldatıyorlar. Karılarına yalan söylerler. Kendilerine yalan söylerler.

Ve - bundan oldukça eminim - sandıklar sırasında yalan söylüyorlar.

İşte size kısa bir genel bakış:

Hiç sınavda kopya çektin mi?

Hiç birini öldürmeyi hayal ettin mi?

Hiç yalan söylemek istedin mi? Anketlerdeki birçok kişi, garip davranışların ve kötü düşüncelerin sayısını hafife alıyor . Anketlerin çoğu isimsiz olsa da iyi görünmek istiyorlar . Buna "sosyal olarak kabul edilebilir yer değiştirme" denir .

1950'deki ciddi bir makale1 anketlerin bu olgunun kurbanı olabileceğine dair güçlü kanıtlar sağladı . Araştırmacılar, Denver sakinleri hakkında resmi kaynaklardan veri topladı: yüzde kaçının oy kullandığı, hayır kurumlarına para verdiği ve bir kütüphane kartı olduğu. Daha sonra, bu rakamların nasıl olduğunu görmek için Denver sakinlerini kendileri araştırdılar. gerçeklikle eşleşir. Sonuçlar şok ediciydi. İnsanların anketlerde bildirdikleri, bilim adamlarının topladığı bilgilerden çok farklıydı. Hiç kimse anketi imzalamasa da , hepsi seçmen kayıt durumunu, oy kullanma isteklerini ve hayır kurumlarına katılımlarını büyük ölçüde abarttı.

Anket sırasında bildirilen , %

Resmi veriler, %

Seçmen kayıt durumu

83

69

Son cumhurbaşkanlığı seçiminde oy kullandı

73

61

Son belediye başkanlığı seçiminde oy kullandı

63

36

kütüphane kartı var

20

13

Hayır kurumuna para verdi

67

33

65 yılda bir şey değişti mi? İnternet çağında artık kütüphane kütüphane kartı olmaması kimseyi rahatsız etmiyor. Ancak neyin uygunsuz ya da istenmeyen olduğuna dair fikirlerin değişmesine rağmen , insanların sosyologları aldatma arzusu çok güçlü.

Yakın zamanda yapılan bir çalışmada, Maryland Üniversitesi mezunlarına öğrenimleri sırasındaki yaşamları hakkında çeşitli sorular soruldu 2 . Yanıtlar resmi raporlarla karşılaştırıldı . İnsanlar sürekli olarak yanlış bilgiler verdiler, bu da onları gerçekte olduğundan daha iyi gösterdi. Ankete katılanların %2'sinden azı, 2.5'in altında bir not ortalaması ile mezun olduklarını bildirdi (aslında bu yaklaşık %11'di). %44'ü ise geçen yıl üniversiteye bağış yaptığını söyledi (aslında bu sayı %28 civarındaydı).

2016'da Donald Trump'ın zaferini tahmin edemeyen anket 3'ün başarısızlığında yalanın rol oynaması oldukça olası . Çalışmalar, desteğini ortalama olarak yaklaşık yüzde iki puan hafife aldı. Bazı insanlar ona oy vereceklerini söylemekten utanabilirler . Diğerleri, belki de, başından beri Trump'tan yanayken, cevap veremediklerini söylediler .

İnsanlar anonim anketlerde neden yanlış bilgi veriyor ? Michigan Üniversitesi'nde fahri profesör ve belki de sosyal olarak arzu edilen davranışlardan sapma konusunda dünyanın en iyi uzmanı olan Roger Turango'ya bunu sordum. " Beyaz yalanlarla başa çıkma konusundaki zayıflığımız, sorunun önemli bir parçası" diye açıkladı. Gerçek hayatta, insanlar zamanın yaklaşık üçte birinde yalan söyler. Bu alışkanlık anketlere de yansıyor” 4 .

Yani, garip bir alışkanlık var - bazen kendimize yalan söylüyoruz. Turango, " Bir öğrenci olarak her şeyi batırdığınızı kendinize itiraf etme konusunda bir isteksizlik var ," diyor.

Kendine yalan söyleme alışkanlığı, neden bu kadar çok insanın ortalamanın üzerinde olduğunu iddia ettiğini açıklayabilir . Bu sorun ne kadar büyük?

Bir şirketteki mühendislerin
%40'ından fazlası, çalışanların ilk %5'lik diliminde yer aldıklarını söyledi.

Üniversite öğretmenlerinin %90'ından fazlası ortalamanın üzerinde olduklarını söylüyor. Lise öğrencilerinin dörtte biri, diğer insanlarla iyi geçinme konusunda ilk %1 içinde olduklarına inanıyor. Kendinize karşı dürüst değilseniz, muhtemelen bir ankette de dürüst olmayacaksınız.

Görüşmelerde yalan söylemeye katkıda bulunan diğer bir faktör, görüşmeyi yapan yabancı üzerinde iyi bir izlenim bırakmaya yönelik güçlü bir istektir (eğer görüşme sözlü olarak yapılıyorsa). Turango'nun da eklediği gibi, “Sevgili teyzenize benzeyen biri geliyor... Geçen ay nasıl esrar içtiğinizi sevgili teyzenize anlatmaya hazır mısınız?” [13]Eski mezun olduğun okula para vermediğini kabul etmeye hazır mısın?

Bu nedenle, bilgi edinme koşulları ne kadar kişisel değilse, o kadar dürüst yanıtlar alırsınız. Bunu yapmak için, telefon anketleri yerine İnternet anketleri yapmak daha iyidir ve bu da görüşmecilerin yürüttüğü anketlerden daha iyidir. İnsanlar , odada yanlarında başka biri varken olduğundansa, yalnız kaldıklarında doğru yanıtlar vermeye daha isteklidirler.

Ancak, hassas konularda görüşme yapılırken, her bir anket yöntemi önemli ölçüde yanlış beyanlara yol açacaktır. Bu durumda Turango, ekonomistler tarafından sıklıkla kullanılan bir kelimeyi kullanır: "teşvik". İnsanların doğruyu söylemek için hiçbir dürtüsü yok.

Peki gerçekten ne düşündüklerini ve yaptıklarını nasıl bilebiliriz?

Bazı durumlarda gerçeği öğrenebileceğimiz resmi veri kaynakları vardır. Örneğin , insanlar hayır kurumlarına yaptıkları bağışlar hakkında yalan söyleseler bile , hayır kurumlarının kendilerinden gerçek bölgesel rakamlar elde etmek mümkündür . Ama resmi kayıtlarda kayıtlı olmayan davranışları öğrenmeye çalışırken veya insanların ne düşündüklerini yani gerçek inançlarını, duygu ve arzularını öğrenmek istediğimizde insanların tenezzül ettikleri şeylerden başka bir bilgi kaynağı yoktur. anket sırasında söylemek . Şimdiye kadar öyle oldu.

Ve bu, büyük verinin ikinci önemli yönüdür: bir tür dijital doğruluk serumu görevi gören bazı İnternet kaynakları, insanları başka hiçbir yerde tanımadıkları şeyi kabul etmeye zorlar . Google'daki arama terimlerini düşünün. İnsanları daha dürüst yapan koşulları hatırlayın. Çevrimiçi? Yemek yemek. Yalnız? Evet. Anketi yapan kimse yok mu? Elbette.

İnsanların doğruyu söylemesini sağlamak için Google aramanın başka bir büyük faydası daha var : teşvikler. Irkçı şakalardan hoşlanıyorsanız, bu gerçeği ankette paylaşmanız için hiçbir neden yok. Ancak, çevrimiçi olarak en iyi yeni ırkçı şakaları bulmak için öyleler. Depresyondan muzdarip olduğunuzu düşünüyorsanız, görüşme sırasında bunu kabul etmek için hiçbir nedeniniz yoktur. Ancak semptomlar ve olası tedaviler için Google'ı başlattığınızda buna sahipsiniz .

Kendinize yalan söyleseniz bile, Google yine de gerçeği bulabilir. Seçime birkaç gün kala siz ve bazı komşularınız mutlaka sandık başına gidip oy kullanacağınızı düşünebilir. Ancak ne siz ne de onlar nasıl ve nerede oy kullanılacağına dair bilgi aramıyorsanız, benim gibi veri bilimcileri size bölgenizde katılımın düşük olacağını söyleyebilir. Aynı şekilde, Google'da kontrol edilemeyen ağlama ve yataktan kalkmakta zorlanma hakkında soru sorduğunuzda bile depresyondan muzdarip olduğunuzu kendinize itiraf etmemiş olabilirsiniz . Bu , daha önce bahsettiğim depresyon aramalarından anlaşılacaktır .

Google ile deneyiminizi analiz edin. Sanırım zaman zaman sorgu alanına kibar bir toplumda itiraf etmekten utanacağınız davranış veya düşünceleri ele veren bir şeyler giriyorsunuz. Gerçekten de, Amerikalıların büyük çoğunluğunun Google'a bazı çok kişisel bilgiler sağladığı açıktır . Örneğin, "hava"dan daha sık "porno" ararlar 7 . Bu arada, bu, erkeklerin yalnızca yaklaşık %25'inin ve kadınların %8'inin pornografi 8 izlediğini kabul ettiği bir anketin sonuçlarıyla pek uyuşmuyor .

sorgularınızı otomatik olarak nasıl yerine getirmeye çalıştığına bakarak, Google'ın arama sonuçlarında belirli bir dürüstlük olduğunu fark edebilirsiniz . Önerileri, diğer kişiler tarafından yapılan en yaygın aramalara dayanmaktadır. Böylece, istek üzerine bilgilerin otomatik olarak seçilmesi, insanların Google'da ne aradığını bize gösterir . Aslında, otomatik tamamlama biraz yanıltıcı olabilir . Google, küfür ve "porno" gibi uygunsuz olduğunu düşündüğü belirli kelimeleri eklemez 9 . Bu, otomatik tamamlamaya göre, bir kişinin Google'da ifade ettiği düşüncelerinin gerçekte olduğundan daha az müstehcen olduğu anlamına gelir. Ancak buna rağmen, bazen oldukça keskin yanlış anlamalar meydana gelir.

Arama sorgusu dizesine "neden..." yazarsanız , şu anda soruları otomatik olarak tamamlayan Google'daki ilk iki seçenek " Gökyüzü neden mavi?" ve "Neden artık yıl var?" Sistem, bunların en yaygın iki arama hedefi olduğunu varsayar. Üçüncü seçenek: "Yulaf lapam neden yeşil?" Ve bu Google otomatik tamamlaması sizi endişelendirebilir. Bugün, arama çubuğuna “İstemek sorun olur mu…” yazarsanız, otomatik tamamlamanın ilk cümlesi “öldürmek” olur. "Öldürmek istemek sorun değil mi?" yazarsanız , ilk otomatik tamamlama seçeneği "ailem" olur.

Bir Google aramasının dünyanın genellikle gördüğümüzden farklı bir resmini ortaya çıkarabileceğine dair daha fazla kanıt mı istiyorsunuz? Çocuk sahibi olup olmama kararıyla ilgili pişmanlıklarla ilgili arama sorgularını değerlendirin . Bu kararı vermeden önce , bazı çiftler yanlış bir seçim yapmaktan korkarlar ve neredeyse her zaman soru şu şekilde sorulur: Çocuk sahibi olmadıkları için pişman olacaklar mı? İnsanların Google'a çocuk sahibi olmaktansa pişman olup olmayacaklarını sorma olasılıkları yedi kat daha fazladır .

İnsan, çocuk doğurup doğurmayacağına (evlat edinip/evlat edinmeyeceğine) karar verdikten sonra bazen bu tercihinden tövbe ettiğini itiraf eder. Şaşırtıcı gelebilir ama karar verildikten sonra rakamlar tersine döner. Çocuklu yetişkinlerin Google'a kararlarından pişman olduklarını söyleme olasılıkları, çocuksuz yetişkinlere göre 3,6 kat daha fazladır10 .

Bu bölümü okurken aklınızda bulundurmanız gereken bir uyarı var: Google, insanların muhtemelen başka kimseyle tartışamayacakları yakışıksız düşüncelere karşı bir önyargı gösterebilir . Bununla birlikte, bu düşünceleri ortaya çıkarmaya çalışıyorsak , Google'ın yetenekleri çok yardımcı olabilir. Ve çocuk sahibi olma ve çocuk sahibi olmama kararından duyulan pişmanlık arasındaki büyük fark, bu uygunsuz düşünceler hakkında bize çok şey anlatabilir.

Bir an duralım ve "Çocuk sahibi olduğum için pişmanım" gibi bir arama teriminin gerçekte ne anlama geldiğini düşünelim. Google kendisini, hava durumu, dünkü maçı kimin kazandığı veya Özgürlük Heykeli'nin ne zaman dikildiği gibi konularda doğrudan bilgi çekebileceğimiz bir kaynak olarak konumlandırıyor . Ama bazen düşüncelerimizi Google'a sansüre aldırmadan, bu sistemin bize doğrudan bir cevap vereceğine dair pek umut beslemeden yazıyoruz . Bu durumda, arama penceresi bir tür itirafçı görevi görür.

İnsanlar beni rahatsız ediyor" ve "Üzgünüm" gibi binlerce arama sorgusu kaydediliyor . Tabii ki, bu binlerce "üzgünüm", bu yıl üzgün olan yüz milyonlarca insanın sadece küçük bir kısmı . Araştırmam, belirli bilgileri aramak yerine düşünceleri ifade eden sorguların, bu fikirlerin akla geldiği kişilerin yalnızca küçük bir kısmına ait olduğunu göstermiştir. Benzer şekilde, araştırmam, her yıl Google aramasına "Çocuklarım olduğu için üzgünüm" yazan binlerce Amerikalının, bu fikri ortaya atanların yalnızca küçük bir örneği olduğunu gösteriyor.

Çocuklar kesinlikle birçokları için büyük bir zevktir - büyük olasılıkla çoğunluk için. Ve annemin "sen ve senin aptal veri analizinin" torunlarının sayısını sınırlayabileceğinden korkmasına rağmen, bu çalışma benim çocuk sahibi olma arzumu değiştirmedi. Ancak bu çirkin pişmanlık ilginçtir - bu, insanlığın geleneksel verilere dayanarak pek bilemeyeceğimiz başka bir yönüdür . Kültürümüz bizi sürekli olarak güzel, mutlu ailelerin resimleriyle bombardıman ediyor. Çoğu insan , çocuk sahibi olduklarına pişman olabileceklerini asla hayal bile edemezdi . Ama bazıları pişman. Ve bunu Google dışında kimseye itiraf edemiyorlar .

SEKS HAKKINDAKİ GERÇEK

Kaç eşcinsel Amerikalı erkek var? Bu, cinsellik araştırmalarında efsanevi bir sorudur. Bununla birlikte, sosyologlar için en zor olanlardan biri olmaya devam ediyor , çok uzun zamandır bir cevap arıyor. Psikologlar, Alfred Kinsey'in mahkumlar ve fahişeler üzerinde yaptığı anketlere dayanan, Amerikalı erkeklerin %10'unun gey olduğu yönündeki iyi bilinen tahminine uzun süredir güvenmemektedirler. Şimdi temsili anketler % 2-3 bildiriyor. Bununla birlikte, cinsel tercihler, insanların yanıtlarken yalan söyleme eğiliminde olduğu sorular arasında kesinlikle yer alıyor. Bu soruya şimdiye kadarki en iyi yanıtı vermek için büyük verileri kullanabileceğimi düşünüyorum .

sandık sonuçları üzerinde daha detaylı durmak gerekiyor . İkincisi, hoşgörülü devletlerde hoşgörüsüz devletlerden çok daha fazla gey olduğunu iddia ediyor . Örneğin, bir Gallup araştırmasına göre , eşcinsel evliliğe en yüksek desteğin verildiği eyalet olan Rhode Island'da eşcinsellerin oranı , eşcinsel evliliğe en düşük desteğin verildiği eyalet olan Mississippi'de olduğundan neredeyse iki kat daha fazla .

Bunun iki olası nedeni vardır. Örneğin eşcinseller hoşgörüsüz bir durumda doğarlar ve sonra daha hoşgörülü bir duruma geçebilirler. Ek olarak, hoşgörüsüz durumlardaki eşcinsel erkekler yönelimlerini bildirmeye hazır değiller - bu soruyu cevaplarken yalan söyleme olasılıkları daha yüksek.

kullanıcıların hangi cinsiyetle ilgilendiklerini belirtmelerine olanak tanıyan başka bir büyük veri kaynağı olan Facebook'tan toplanabilir . Bu sosyal ağın erkek kullanıcılarının yaklaşık %2,5'i erkeklerle ilgileniyor. Bu yaklaşık olarak araştırma sonuçlarına karşılık gelmektedir. Ayrıca Facebook, toleransın yüksek ve düşük olduğu eyaletlerdeki eşcinsellerin yüzdesinde büyük farklılıklar gösteriyor: Facebook'a göre, Rhode Island'daki eşcinsellerin yüzdesi Mississippi'dekinin iki katı .

Facebook ayrıca insanların hareketleri hakkında bilgi sağlayabilir. Açıkça eşcinsel olan Facebook kullanıcılarının bir kısmının daimi ikamet yerini tanıyabildim . Bu, ülkenin daha hoşgörülü bölgeleri için hoşgörüsüz eyaletlerden kaç eşcinselin ayrıldığını hemen tahmin etmeyi mümkün kıldı. Cevap? Belli ki bir hareketlilik var. Örneğin, eşcinsel erkekler Oklahoma City'den San Francisco'ya taşındı. Ama bence, Judy Garland CD'lerini toplayıp daha liberal yerlere giden erkekler, hoşgörülü ve hoşgörüsüz durumdaki eşcinsel nüfus arasındaki farkın yarısından fazla olmayabilir [14].

Ayrıca Facebook, lise öğrencilerine odaklanmamızı sağlıyor. Bu özel bir gruptur, çünkü okul çocukları ikamet edecekleri yeri nadiren seçerler . Hareketlilik, farklı eyaletlerdeki açık eşcinsellerin sayısındaki farkı açıklıyorsa , o zaman bu fark Facebook kullanan okul çocukları arasında görülmemelidir . Peki ikincisiyle ilgili veriler bize ne söylüyor ? Hoşgörüsüz eyaletlerde çok daha az açık eşcinsel okul çocuğu var. Mississippi'de sadece 2.000 lise öğrencisi açıkça eşcinsel . Yani hareketlilik her şey değildir.

, bazı bölgelerde neden bu kadar çok açık eşcinsel olduğunu tam olarak açıklayamıyorsa , o zaman gizlilik çok büyük bir rol oynamalıdır . Bu da bizi insanların çok şey paylaşmaya istekli olduğu Google'a geri getiriyor .

Her eyalette gerçekte kaç gey olduğunu kontrol etmek için porno aramalarını kullanmanın bir yolu var mı ? Gerçek ama var. Google ve Google AdWords arama verilerini kullanarak, ülke çapında erkek pornosu aramalarının yaklaşık %5'ini gey pornosunun oluşturduğunu tahmin ediyorum 12 . (Bu, popüler bir gey pornografi sitesi olan "Rocket Tube" ve "gay pornosu" gibi terimler için yapılan aramalar için geçerlidir ).

Bu sayı ülkenin farklı bölgelerinde nasıl değişiyor ? Genel olarak , hoşgörüsüz eyaletlerde, hoşgörüsüz eyaletlere göre daha fazla gey pornosu araması yapılıyor . Bazı geylerin hoşgörüsüz yerlerden daha hoşgörülü yerlere taşındığı göz önüne alındığında bu mantıklı . Ancak farklılıklar, anketlerden veya Facebook'tan elde edilen veriler kadar büyük değil . Mississippi'de porno grafik aramalarının %4,8'inin gey pornosu ile ilgili olduğunu tahmin ediyorum - araştırma veya Facebook'ta bulunan sayılardan çok daha fazla ve Rhode Island'da yapılan benzer aramaların %5,2'sine yeterince yakın.

Peki kaç Amerikalı erkek eşcinseldir? Erkek pornografisi aramalarından elde edilen rakam - yaklaşık %5 - Amerika Birleşik Devletleri'ndeki gey topluluğunun boyutuna ilişkin oldukça doğru bir tahmin gibi görünüyor . Bu sayıyı elde etmenin daha az belirgin başka bir yolu daha var . Bazı bilimsel veriler gerektirir. Hoşgörü ile açıkça gey olan nüfusun büyüklüğü arasındaki ilişkiyi kullanabiliriz . Bir dakika bekle.

Ön araştırmam, söz konusu eyalette eşcinsel evliliğe verilen her yüzde 20'lik desteğin, Facebook'ta açıkça eşcinsel olarak tanımlanan erkeklerin sayısında neredeyse bir buçuk kat artış anlamına geldiğini gösteriyor. Buna dayanarak, varsayımsal olarak tamamen hoşgörülü bir durumda (sakinlerin %100'ünün eşcinsel evliliği desteklediği ) doğan kaç erkeğin açıkça eşcinsel olacağını tahmin edebiliriz. Tahminlerime göre bu, porno arama sorguları veritabanından elde edilen verilere karşılık gelen yaklaşık %5'tir . Buna en yakın örneği Kaliforniya Körfezi'ndeki bir erkek okulunun tamamen hoşgörülü ortamında bulabiliriz . Bunların yaklaşık %4'ü Facebook'ta açıkça eşcinsel. Bu da benim hesaplamalarımla mükemmel bir uyum içinde görünüyor.

Kadınlar için eşcinsel çekiciliği ölçmek için henüz bir yöntem bulamadığımı belirtmeliyim. Pornografi arama verilerinin de aynı derecede kullanışlı olduğu yer burasıdır . Bununla birlikte, çok daha az kadın pornografi izliyor, bu da örneklemi daha az temsil ediyor . Ve onu izleyenler arasında - gerçek hayatta ağırlıklı olarak erkeklerden hoşlanan kadınlar dahil - lezbiyen olan en popüler olanıdır. Genel olarak, PornHub'da video izleyen kadınların yalnızca %20'si lezbiyen.

Eşcinsel Amerikalı erkeklerin % 5'i elbette bir tahmindir. Bazı insanlar biseksüeldir, diğerleri - özellikle gençler - yönelimleri konusunda kararsızdır. Elbette bunu oy veren ya da sinemaya giden insan sayısını sayabildiğiniz kadar doğru bir şekilde belirleyemezsiniz.

Ancak değerlendirmemin bir sonucu oldukça açık: Amerika Birleşik Devletleri'ndeki pek çok insan -özellikle hoşgörüsüz eyaletlerde- cinsel tercihlerini hâlâ gizliyor . Bunları Facebook'a ifşa etmiyorlar . Ve anketler sırasında onları kabul etmiyorlar. Ve çoğu durumda kadınlarla evli bile olabilirler.

kocalarının gey olduğundan haklı olarak sıklıkla şüphelendikleri ortaya çıktı . Bu düşünceler, şaşırtıcı derecede sık otomatik tamamlamada ortaya çıkıyor: "Kocam... eşcinsel." "Eşcinsel" kelimesinin "Kocam" ile başlayan bir arama terimini tamamlama olasılığı, ikinci sıradaki "dolandırıcı" kelimesine göre %10 daha fazladır. Ayrıca "alkolik" den sekiz kat, "depresif" den 10 kat daha yaygındır .

Belki de çok anlamlı bir şekilde, bir kocanın cinselliğiyle ilgili sorular en az hoşgörülü bölgelerde çok daha yaygındır. Bu soruları soran kadınların yüzdesinin en yüksek olduğu eyaletler Güney Carolina ve Louisiana'dır. Aslında, bu sorunun en sık sorulduğu 25 eyaletten 21'i eşcinsel evliliğe ulusal ortalamanın altında destek veriyor.

Google ve porno siteleri yararlı kaynaklar değildir . Büyük verilerle, birçoğunun saklanarak yaşadığına dair daha da fazla kanıt var . İnternetteki Craigslist'te erkeklerin erkeklerle "tek gecelik ilişkiler" aradığı reklamları inceledim . Daha az eşcinsel dostu olan eyaletlerde, bu tür reklamların yüzdesi daha yüksek olma eğilimindedir. En az hoşgörülü olanlar Kentucky, Louisiana ve Alabama'dır.

Ancak Google'da veri aramaya geri dönelim. "Eşcinsel pornosu"ndan hemen önce veya sonra çıkan en yaygın arama terimlerinden biri "eşcinsel testi"dir. (Bu testler, bir erkeğin eşcinsel olup olmadığını belirlemeye cesaret eder

.) En az hoşgörülü olan eyaletlerde, "eşcinsel testi" için yapılan aramalar, ulusal ortalamanın yaklaşık iki katıdır.

Peki "gay pornosu" ve "gay testi" arasındaki bu savurma ne anlama geliyor? Muhtemelen, bu oldukça güçlü - dayanılmaz değilse de - bir utancı işaret ediyor . Bazı erkeklerin gey pornosuna olan ilgilerinin eşcinsel oldukları anlamına gelmediğinden emin olmak istediklerini varsaymak mantıklıdır .

Google arama verileri, belirli bir kişinin istatistiklerini bir süreliğine görmemize izin vermiyor. Ancak 2006'da AOL, bilim insanlarına kullanıcılarından gelen bir sorgu örneği verdi . Burada, örneğin, altı gün boyunca bir isimsiz kullanıcının bazı verileri var.

Пятница 03:49:55 пятница, 03:59:37 пятница 04:00:14 пятница 04:00:35 пятница 05:08:23

пятница 05:10:00 пятница 05:25:07

пятница 05:26:38

пятница 05:27:22 пятница 05:29:18

Bedava eşcinsel fotoğrafları(!)

Soyunma odası eşcinsel fotoğrafı

eşcinsel fotoğraf

Eşcinsel seks fotoğrafları

Eşcinselliği kontrol etmek

Tam teşekküllü bir eşcinsel için test edin

Adam İçin Eşcinsel Testleri

Eşcinsellik testleri

Testler "Ben eşcinsel miyim?"

eşcinsel fotoğraf

Cuma 05:30:01

çıplak erkek fotoğrafları

Cuma 05:32:27

erkeklerin ücretsiz çıplak resimleri

Cuma 05:38:19

Fotoğraf sıcak eşcinsel seks

Cuma 05:41:34

Sıcak homoseksüel anal seks

Çarşamba, 13:37:37

Testler "Ben eşcinsel miyim?"

Çarşamba 13:41:20

Eşcinsellik testleri

Çarşamba 13:47:49

Sıcak homoseksüel anal seks

Çarşamba, 13:50:31

Bedava gay videosu(!)

cinselliğinden rahatsız olduğu anlaşılıyor . Google verileri bize bu tür birçok erkek olduğunu ve gerçekte çoğunun eşcinsel ilişkilere daha az toleranslı eyaletlerde yaşadığını söylüyor.

uzmanlaşmış bir Mississippi psikiyatristine hastalarından herhangi birinin benimle konuşmak isteyip istemediğini sordum. Bir kişi hazır olduğunu ifade etti. Altmış yaşlarında emekli bir profesör olduğunu ve 40 yılı aşkın süredir aynı kadınla evli olduğunu söyledi .

Yaklaşık 10 yıl önce, çok yoğun bir stresle bunaldığında bir psikoloğa başvurdu ve sonunda cinsel yönelimini öğrendi. Erkeklere olan ilgisini her zaman bildiğini, ancak bunun hakkında konuşmanın alışılmış bir şey olmayan tüm insanların ortak bir özelliği olduğunu düşündüğünü söyledi . Terapiye başladıktan kısa bir süre sonra, yaklaşık 30 yaşında olan öğrencilerinden biriyle ilk ve tek eşcinsel ilişkisini yaşadı . Deneyimi "inanılmaz" olarak tanımlıyor.

Karısıyla cinsel ilişkisi yoktur. Boşanırsa veya bir erkekle açıkça çıkmaya başlarsa kendini suçlu hissedeceğini söylüyor . Aynı zamanda, hayatındaki en önemli kararların neredeyse hepsinden pişmanlık duyuyor.

Emekli bir profesör ve eşi, aşksız ve sekssiz bir geceyle daha karşı karşıyadır. Muazzam ilerlemeye rağmen , geylere karşı hoşgörüsüzlüğün sürmesi, milyonlarca başka Amerikalının da aynı şekilde yaşamak zorunda olduğu anlamına geliyor.

Erkeklerin %5'inin gey olması, diğerlerinin ise yönelimlerini gizlemesi sizi şaşırtmayabilir . Ancak çoğu insanın bunu duyunca şok olacağı zamanlar oldu . Ve şimdi bile çoğu insanın bu tür bilgilerden bunaldığı yerler var.

İran Cumhurbaşkanı Mahmud Ahmedinejad 2007'de "İran'da hiç eşcinsel yok , sizin ülkenizdekinden farklı olarak 13 kişi var " diye ısrar etti . "İran'da benzeri yok" Soçi Belediye Başkanı Anatoly Pakhomov, şehrinde düzenlenen 2014 Kış Olimpiyatları'ndan kısa bir süre önce , “Şehrimizde hiç eşcinsel yok” 14 dedi . Ancak internet davranışı, hem Soçi'de hem de İran'da gey pornosuna büyük ilgi gösteriyor15 .

Bu, bariz soruyu gündeme getiriyor: Bugün Amerika Birleşik Devletleri'nde hala şok edici olarak kabul edilen herhangi bir ortak cinsel ilgi var mı? Tam olarak neyin ortak olduğunu düşündüğünüze ve kafanızı karıştırmanın ne kadar kolay olduğuna bağlıdır .

PornHub'daki en popüler aramalar arasında erkekler için "genç", "üçlü" ve "oral seks" gibi kelimelerin yanı sıra kadınlar için "tutkulu aşk", "meme yalama", "am yiyen adam" gibi ifadeler yer alıyor.

PornHub'dan aldığımız bilgilere dayanarak bazı fetişler hakkında bilgi sahibi olduk - aksi halde onların varlığını tahmin bile edemezdik. "Anal elma" ve "yumuşak oyuncaklarla seks" arayan kadınlar var . "Sümük fetişi" ve "çıplak çarmıha gerilme" arayan erkekler var. Ancak bu arama sorguları nadirdir; bu devasa porno sitesinde bile ayda yalnızca 10 tane vardır.

PornHub verilerini incelerken bir şey daha bariz hale geliyor : Herkes için herkes var. Kadınlar, şaşırtıcı olmayan bir şekilde, genellikle "uzun boylu", "esmer", "yakışıklı" erkekleri ararlar. Ama bazen "kısa", "solgun" ve hatta "çirkin" erkeklere de bakarlar. "Engelli erkekler", "küçük sikli tombul erkekler" ve "şişko çirkin yaşlı erkekler" ile ilgilenen kadınlar var. Erkekler genellikle "büyük memeli" ve "sarı saçlı" "sıska" kadınları ararlar . Ama bazen "şişman", "küçük göğüslü" ve "yeşil saçlı" kadınlara da bakarlar.

", "cücelere" ve ayrıca "meme ucu olmayan kadınlara" ilgi duyan erkekler var . Bu veriler uzun boylu olmayanları, esmer olmayanları, çirkin olmayanları ya da iri göğüslü zayıf sarışınları memnun edebilir [15].

Peki ya diğer oldukça sık ama oldukça şaşırtıcı arama terimleri? Erkeklerde en sık görülen 150 şey arasında benim için en şaşırtıcı olanı, Freud ile ilgili bölümde bahsettiğim ensest ilişkilerdir. Erkeklerin genellikle bahsetmediği diğer sorgular "travesti" ("kadın özelliklerine ve erkek cinsel organına sahip bir transseksüel "; en çok arananlar arasında 77.) ve "büyükanne"dir (en sık arananlar arasında 110. sırada). Genel olarak, erkeklerin PornHub'daki aramalarının yaklaşık %1,4'ü penisi olan kadınlar içindir . Yaklaşık %0,6'sı (%0,4'ü 34 yaşın altındaki erkekleri ifade eder ) yaşlı insanların resimlerini arıyor . PornHub'daki 24.000 erkek aramadan yalnızca 1'inde çocuklardan bahsediliyor; bunun nedeni, PornHub'ın anlaşılır bir şekilde her türlü çocuk pornografisini yasaklaması ve bu tür bilgilere sahip olmanın yasa dışı olması olabilir .

En yaygın kadın sorularından biri , sizi uyarıyorum, pek çok okuyucunun kafasını karıştıracak ve rahatsız edecek bir pornografi türüdür: kadına yönelik şiddet içeren seks. Kadınların en az %25'i, bir kadının acı çekmesi ve/veya aşağılanmasıyla ilgili porno arıyor - örneğin, "hıçkırarak acı veren anal seks", "topluluk içinde aşağılama" ve "aşırı şiddetli toplu tecavüz". Yüzde beşi, bu videolar PornHub'da yasaklanmış olmasına rağmen, "tecavüz" veya "zorla seks" gibi şiddetli seks arıyor. Ve kadınlarda bu tür arama sorgularının sayısı erkeklere göre en az iki kat daha fazladır. Bir kadına yönelik şiddetin işlendiği bir porno varsa , veri analizim gösteriyor ki buna neredeyse her zaman erkeklerden çok kadınlar erişiyor.

hayal ile gerçek hayat arasında büyük bir fark olduğunu hatırlamak önemlidir . Evet, PornHub'ı ziyaret eden ve başarısız da olsa tecavüz sahneleri arayan kadın azınlığın bir alt kümesi var . Doğal olarak bu, bu tür kadınların gerçek hayatta tecavüze uğramak istedikleri anlamına gelmez ve kesinlikle tecavüzü korkunç bir suçtan daha az yapmaz. Porno taleplerinden elde edilen veriler bize yalnızca, bazen insanların gerçek hayatta yaşamak istemeyecekleri bir şeyi hayal ettiklerini ve bunu başkalarına yapmaya hiçbir şekilde hazır olmadıklarını söylüyor.

Sırları saklayan dolaplar, sadece fantezi hazineleri değildir. Seks söz konusu olduğunda , 16 insanların hayatlarında ne kadar çok seks olduğu gibi pek çok şeyi açığa vururlar .

Giriş bölümünde, ankette Amerikalıların her yıl satılandan çok daha fazla prezervatif kullandıklarını bildirdiklerini belirttim.

gerçekte kullandıklarından çok seks sırasında prezervatif kullandıklarını söylemelerinin daha muhtemel olduğunu düşünebilirsiniz . Ancak araştırmalar aynı zamanda insanların cinsiyetlerinin sıklığını da abarttığını gösteriyor . 15 ila 44 yaşları arasındaki 17 kadınların yaklaşık %11'i cinsel olarak aktif olduklarını , şu anda hamile olmadıklarını ve doğum kontrol yöntemi kullanmadıklarını söylüyor. Kaç kez seks yaptıklarına dair nispeten muhafazakar varsayımlarla bile , bilim adamları her ay %10'unun hamile kalması gerektiğini tahmin ediyorlardı 18 . Ancak bu, ABD'deki toplam gebelik sayısından daha fazla olacaktır ( 19 doğurganlık yaşındaki 113 kadından 1'i ). Seks takıntılı kültürümüzde, muhtemelen söylediğin kadar seks yapmadığını kabul etmek zor.

Ancak içgörü veya tavsiye arıyorsanız, yine Google'a başvurmak için bir teşvikiniz var. Bir eşin konuşmak istemediğinden 16 kat daha fazla seks istemediğine dair şikayet var . Evli olmayan bir partnerin (partnerin) SMS'e cevap vermemesine göre seks istemediğine dair 5,5 kat daha fazla şikayet var .

Google aramaları, bu seks dışı ilişkilerin çoğu için beklenmedik bir neden öneriyor. Google'da bir erkeğin seks yapmak istemediğine dair şikayet sayısı, bir kızın istemediğine göre iki kat daha fazladır. Ayrıca, arama sorgularında kızların bu tür iddialarının en yaygın biçimi "Erkek arkadaşım benimle seks yapmak istemiyor" şeklindedir . ( Google aramaları cinsiyete göre ayrılmamıştır, ancak önceki analizin gösterdiği gibi, erkeklerin %95'i heteroseksüeldir, dolayısıyla erkeklerden "erkek arkadaşım"ı içeren çok fazla sorgu olmadığını varsayabiliriz .)

Bu nasıl yorumlanmalıdır? Bu, erkeklerin seksten kızlardan daha fazla kaçındığı anlamına mı geliyor ? Gerekli değil. Daha önce de belirtildiği gibi, insanların açıkça konuşmaktan utandıkları şeyler söz konusu olduğunda Google aramaları çarpık olabilir . Bir erkek, kız arkadaşının cinsel isteksizliği hakkında arkadaşlarıyla konuşurken, bir kadının erkek arkadaşının cinsel isteksizliği hakkında arkadaşlarıyla konuşmasından daha rahattır. Bununla birlikte, Google verileri erkeklerin kızlardan iki kat daha fazla seks yapmak istemedikleri anlamına gelmese de , yine de erkeklerin kabul etmeye istekli olduklarından daha fazla seks yapmaktan kaçındıklarını gösteriyor.

Google verileri, insanların neden bu kadar sık seks yapmaktan kaçınabileceklerine de işaret ediyor : yoğun kaygı nedeniyle. Ve çoğunlukla, insanların sakladığı bu kaygının nedenleri tam da budur. Erkekleri bunaltan endişelerden başlayalım. Gelir düzeyleri hakkında endişe duydukları uzun zamandır biliniyor , ancak bu endişenin derecesi genel olarak inanıldığından daha büyük.

Erkekler, Google'a penisleri hakkında vücudun diğer tüm bölümlerinden (akciğerler, karaciğer, bacaklar, kulaklar, burun, boğaz ve beyin) daha fazla soru soruyor. Erkekler, Google'da gitar akortlamak, omlet yapmak veya çark değiştirmekten daha çok nasıl daha büyük bir penis sahibi olunacağı konusunda arama yapıyor. Google aramalarına göre erkeklerin steroidlerle ilgili en büyük endişesi potansiyel sağlık tehlikeleriyle ilgili değil . Hayır, insanlar daha çok steroid almanın penislerinin boyutunu küçültüp küçültmeyeceği konusunda endişeleniyorlar . Erkekler Google'da yaşa bağlı değişikliklerle ilgili sorular sorduğunda , vücuttaki veya beyindeki değişikliklerle değil, penislerinin küçüleceği korkusuyla daha çok ilgileniyorlar.

Not: Google'daki en yaygın erkek cinsel organı sorularından biri "Penisim ne kadar büyük?" sorusudur. Erkeklerin benzer bir soruyla her zamanki hükümdara değil de arama motoruna yönelmesi bence dijital çağın tipik bir tezahürüdür [16].

Kadınlar penis boyunu önemser mi? Nadiren , Google aramalarına göre . Bir partnerin penis boyutu için yapılan her kadın araması için , kendi penisi için yaklaşık 170 erkek talep edilmektedir. Bununla birlikte, kadınların partnerlerinin penisinin boyutuyla ilgili endişelerini dile getirdikleri ender durumlarda , bunun çok küçük olduğu anlamına gelmez - şikayetlerin % 40'ından fazlası penisin çok büyük olduğu gerçeğiyle ilgilidir. "Acı" , Google aramalarında "...seks sırasında" ifadesiyle birlikte kullanılan en yaygın ilk kelimedir. ("Kanama", "idrara çıkma", "ağlama" ve "osuruk " en sık kullanılan ilk beş kelimedir .) Bununla birlikte, Google'da penis boyutunu araştıran erkeklerin yalnızca %1'i bunun nasıl yapılacağı hakkında bilgi arıyor. daha küçük

Erkeklerin seks hakkında en sık sordukları ikinci soru, nasıl daha uzun süre dayanacağıdır . Yine bu güvensizlik kadınların kaygılarıyla örtüşmüyor . Bir partnerle nasıl daha hızlı doruğa ulaşılacağı ve bunun nasıl yavaşlatılacağıyla ilgili arama sorgularının sayısı yaklaşık olarak aynıdır. Aslında, kadınlar erkek orgazmıyla ilgilendiklerinde en çok ilgilendikleri şey bunun ne zaman olduğu değil, hiç olmamasıdır.

Erkekler söz konusu olduğunda, vücutlarının görünümüyle ilgili konulardan nadiren bahsederiz. Görünüş meseleleri esas olarak kadınları ilgilendirse de, önyargı, hakim olan basmakalıplara dayanarak tahmin edilebileceği kadar büyük değildir. Google AdWords'ün yardımıyla yaptığım analize dayanarak ( insanların ziyaret ettiği sitelerin sayısı tahmin edildi), güzellik ve sağlığa ilgi duyanlar arasında - erkeklerin %42'si, kilo vermek - erkeklerin %33'ü, plastik cerrahide - erkeklerin %39'u . “Nasıl” kelimesiyle başlayan ve göğüslerle ilgili tüm soruların yaklaşık %20'si göğüslerden nasıl kurtulacağına dair erkek sorularıdır.

Ancak vücut güveninden yoksun erkeklerin sayısı sanıldığından fazla olsa da , nasıl göründükleri konusunda endişe duyma konusunda kadınlar hala onlardan önde. Peki bir dijital doğruluk serumu, kadınların görünüşleriyle ilgili endişeleri hakkında neleri ortaya çıkarabilir? Amerika Birleşik Devletleri'nde her yıl yedi milyondan fazla arama meme implantlarıyla ilgilidir. Ve resmi istatistikler, her yıl yaklaşık 300.000 kadının bu prosedürü uyguladığını bildiriyor .

kendilerinde tam olarak neyi sevmediklerine dair fikirlerini değiştirmiş olsa da, bayanlar da kalçalarının görünümü hakkında ciddi endişeler gösteriyor .

2004'te Amerika Birleşik Devletleri'nin bazı bölgelerinde, popo ölçülerini değiştirmekle ilgili en yaygın soru, onları nasıl küçülteceğimizdi. Ancak bunu artırmak isteyenler ezici bir çoğunlukla siyah nüfusun baskın olduğu bölgelerde yoğunlaştı. Ancak 2010 yılından itibaren daha büyük popoya sahip olma isteği tüm ülkeye yayıldı . Sonraki dört yılda bu ilgi üç katına çıktı. 2014 yılında, zaten tüm eyaletlerde kalçaların nasıl küçültüleceğinden daha fazla nasıl artırılacağına dair talepler vardı . Bugün ABD'de meme implantları için yapılan her beş aramadan biri kalça büyütme ile ilgili. (Teşekkürler Kim Kardashian!)

Kadınların büyük kalça tercihi erkeklerinkine uyuyor mu? İlginç olan, evet. Daha önce çoğunlukla siyah bölgelerden yapılan büyük götlü porno aramaları , son zamanlarda Amerika Birleşik Devletleri'nde popüler hale geldi.

Erkekler kadın vücudundan başka ne ister? Daha önce de belirtildiği gibi - ve çoğu kişinin kesinlikle açık bulacağı gibi - erkekler büyük göğüsleri tercih eder. Porno aramalarının yaklaşık %12'si "büyük göğüsler" kelimesini içeriyor - bu, küçük göğüslü kadınlar için yapılan porno aramalarının sayısından neredeyse 20 kat daha fazla.

Yine de bu, erkeklerin meme implantlı kadınları görme arzusunu göstermez. Büyük göğüslü porno kadın arayanların yaklaşık %3'ü doğrudan doğal görmek istediğini belirtiyor.

Google'da eşi ve meme implantları için yapılan aramalar , "Ona implant yaptırması nasıl sağlanır" ve "Neden implant yaptırmak istiyor?" şeklinde eşit olarak bölünmüştür.

Veya bir kızın göğüsleri için en yaygın arama terimini düşünün: "Arkadaşımın göğüslerini seviyorum ." İnsanların bu ifadeyle Google'da ne bulmayı umdukları net değil .

Erkekler gibi kadınlar da cinsel organları hakkında pek çok soru sorarlar. Aslında, vajinalarıyla neredeyse erkeklerin penisleriyle ilgilendikleri kadar ilgileniyorlar . Kadınların vajinalarına dikkati genellikle sağlıkla ilişkilendirilir. Ancak soruların en az %30'u tamamen farklı problemlerle ilgilidir. Bayanlar kasıkları nasıl tıraş edeceklerini, sıkacaklarını ve daha lezzetli hale getireceklerini bilmek isterler. Şaşırtıcı bir şekilde, daha önce belirtildiği gibi , en yaygın endişe kokunuzu nasıl iyileştireceğinizdir.

Kadınlar genellikle vajinalarının balık, ardından sirke, soğan, amonyak, sarımsak, peynir, vücut kokusu, idrar, ekmek, çamaşır suyu, dışkı, ter, metal, ayak, çöp ve çürümüş et gibi kokmasından endişe duyarlar.

bir Google ortağının cinsel organları konusunda özellikle endişeli değildir . Kadınların penisle ilgilendikleri kadar vajinayla da ilgileniyorlar .

arama yaparken eşlerinin vajinasından bahsettiklerinde , genellikle kadınların en çok endişelendiği şey olan kokudan şikayet ederler. Çoğunlukla insanlar

bir bayana kötü bir kokuyu duygularını incitmeden nasıl anlatacağını bulmaya çalışmak. Ancak bazen erkeklerin kokuyla ilgili soruları kendi güvensizliklerini ortaya çıkarır. Genellikle aldatmayı tespit etmek için koku kullanmanın yollarını sorarlar - örneğin, prezervatif veya başka bir adamın meni kokusu alıp almadığınız.

Tüm bu gizli kompleksler hakkında ne yapabiliriz ? İyi haberler var. Google bize endişelenmememiz için geçerli nedenler sunuyor. Cinsel partnerlerimizin bizi nasıl algıladıklarına dair en derin korkularımızın çoğu tamamen asılsızdır .

Bilgisayarlarının başında tek başına oturan insanlar,
yüzeysel yargılarla
yetinmek yerine yalan söylemek ve en içteki düşüncelerini ortaya çıkarmak için hiçbir neden görmüyorlar
.

Aslında hepimiz kendi bedenlerimizi incelemekle o kadar meşgulüz ki diğer insanların bedenlerini yargılamak için çok az gücümüz kaldı .

Google aramaları tarafından tanımlanan cinsiyetle ilgili en acil iki sorun arasında bir bağlantı olması muhtemeldir : seks eksikliği ve kişinin kendi cinsel çekiciliği ve etkililiği konusunda güvensizlik . Belki de akrabadırlar. Belki de sekse daha az önem verseydik, daha fazlasına sahip olurduk.

arama sorgularına dayalı olarak seks hakkında başka neler öğrenebilirsiniz ? Kimin en güçlü, enerjik ve cömert olduğunu görmek için cinsiyetler arasındaki rekabeti anlatabiliyoruz. Karşı cinsle daha iyi oral seks isteyen tüm sorguları seçebilirsiniz 20 . Kim daha sık bilgi arar - erkekler mi kadınlar mı? Kim cinsel açıdan daha cömert - erkekler mi kadınlar mı? Bayanlar, belli ki. Sonuç olarak, oranı 2:1 olarak, eşleriyle en iyi nasıl oral seks yapacakları konusunda tavsiye arayan kadınlar lehine değerlendiriyorum.

Erkekler benzer bilgileri aradıklarında, genellikle diğer kişiyi nasıl memnun edecekleriyle ilgilenmezler . Bir kadına nasıl orgazm yaşatılacağıyla değil, çoğunlukla nasıl oral seks yapılacağıyla ilgileniyorlar (bu, Google aramalarına göre en sevdiğim gerçeklerden biri ).

NEFRET VE ÖNYARGI HAKKINDAKİ GERÇEK

, utanç sisi içinde örtülen tek konu değil ve sonuç olarak, insanlar bunlardan daha fazlası hakkında sessiz kalmayı tercih ediyor. Birçoğu - oldukça makul bir şekilde - önyargıları hakkında konuşmamayı tercih ediyor. Sanırım bugün insanların başkalarını etnik köken, cinsel yönelim veya din temelinde yargılamaya istekli oldukları için yargılanacakmış gibi hissetmelerine ilerleme diyebilirsiniz . Ancak birçok Amerikalı bugün hala bunu yapıyor. (Bu, okuyucuları rahatsız edebilecek ve kafalarını karıştırabilecek materyaller içerdiği konusunda uyarmam gereken başka bir bölüm.)

Google'da "Siyahlar neden bu kadar kaba ve kaba ?" gibi kullanıcı sorularını kolayca bulabilirsiniz. veya "Yahudiler neden kötüdür?" Aşağıda, azalan sıklık sırasına göre, çeşitli etnik gruplar hakkında bilgi ararken kullanılan olumsuz çağrışımlara sahip beş kelime listelenmiştir21 .

1

2

3

4

5

Afrikalı Amerikalılar

Hama

ırkçılar

aptallar

ucubeler

tembel

Yahudiler

Fenalık

ırkçılar

ucubeler

Aç gözlü

bencilce seven

Müslümanlar

Fenalık

terör

yüz

kötüler

acımasız

Tehlikeli

Meksikalılar

ırkçılar

aptallar

ucubeler

tembel

köreltmek

Asyalılar

ucubeler

ırkçılar

can sıkıcı _

aptal

Aç gözlü

gey

Fenalık

doğanın hatası

aptallar

can sıkıcı _

kendine aşık _

Hıristiyanlar

aptal

Psikopatlar

köreltmek

Çılgın

evet

doğanın hatası

Bu stereotipler arasında bazı özellikler ayırt edilebilir. Örneğin, yalnızca Afrikalı Amerikalılar "yüksek sesle" klişesiyle ilişkilendirilir. Yahudiler ve Müslümanlar olmak üzere ikisi dışında hemen hemen her grup "aptal" olarak kabul edilir. Yahudiler, Müslümanlar ve geyler basmakalıp bir şekilde "kötü" olarak kabul edilir, ancak siyahlar, Meksikalılar, Asyalılar ve Hıristiyanlar böyle görülmez.

Sadece Müslümanlar basmakalıp bir şekilde teröristlerle ilişkilendirilir . Müslüman bir Amerikalı kendisine hitap eden bu terimi duyduğunda, tepkisi ani ve acımasız olabilir. Google arama verileri bize her dakika öfkeyle beslenen nefret patlamaları yaşatabilir .

2 Aralık 2015'te Kaliforniya, San Bernardino'daki silahlı saldırıdan kısa bir süre sonra bakın ne oldu . O sabah Rizwan Farouk ve Tashfin Malik, Faruk'un yarı otomatik tabancalar ve yarı otomatik tüfeklerle silahlanmış meslektaşlarıyla bir araya geldi ve 14 kişiyi öldürdü. O akşam - medyanın tetikçilerin Müslüman gibi görünen isimlerini ilk kez yayınlamasından tam anlamıyla dakikalar sonra - önemli sayıda Kaliforniyalı, Müslümanlara ne yapmak istediklerini bildirdi: hepsini öldürün .

O zamanlar Kaliforniya'da Google'da "Müslümanlar" için yapılan en popüler arama "Müslümanları öldürün" idi. Genel olarak, Amerikalılar bu ifadeye yönelik talepleri "martini tarifi", "migren semptomları" ve "Kovboy takımı dizisi" ile yaklaşık aynı sıklıkta yazdılar. San Bernardino saldırısını takip eden günlerde, ilgili hemen hemen her Amerikalı "İslamofobi"den muzdaripti. Saldırıdan önce, Müslümanlarla ilgili tüm aramaların yaklaşık %20'si nefretle doluydu, ancak saldırıdan sonra, Müslümanlarla ilgili tüm aramaların yarısından fazlasında Müslümanları öldürme çağrıları zaten mevcuttu .

Bu dakika dakika arama verileri, bize bu tür bir öfkeyi yatıştırmanın ne kadar zor olabileceğini söyleyebiliyor . Saldırıdan dört gün sonra, o zamanki Başkan Obama, ülke vatandaşlarına birinci sınıf bir konuşma yaptı. Hükümetin terörizmi durdurabileceğini ve belki de daha da önemlisi bu tehlikeli İslamofobiyi bastırabileceğini söyleyerek Amerikalıları rahatlatmaya çalıştı .

, sosyal içerme ve hoşgörünün öneminden bahsederek en iyilerimizin ilgisini çekti . Retorik canlı ve hareketliydi. Los Angeles Times, başkana "korkunun zihninizi bulandırmasına izin vermemek için [uyarı] verdiği" için övgüde bulundu. New York Times, performansı hem "sert" hem de "yatıştırıcı" olarak nitelendirdi. Think Progress bunu "Amerikalı Müslümanların hayatlarını kurtarmak için iyi yönetişim için temel bir araç " olarak övdü. Diğer bir deyişle, Obama'nın konuşması büyük bir başarı olarak değerlendirildi. Ama öyle mi?

Google arama istatistikleri aksini söylüyor. Evan Soltas ile birlikte bu kez Princeton'da veri öğrettim. Başkan konuşmasında, " Ayrımcılıktan vazgeçmek her mezhepten tüm Amerikalıların görevidir" dedi . Ancak konuşma sırasında ve konuşmadan kısa bir süre sonra, Müslümanlara "terörist " ve "şeytan", "şiddet" ve "vahşet " ifadelerinin kullanıldığı aramaların sayısı ikiye katlandı. Obama ayrıca, " Bu ülkede bize gelenlere karşı dini önyargıları bir kenara bırakmak bizim sorumluluğumuzdur" dedi . Bunun ardından, çaresizce sığınma arayan Suriyeli mültecilerle (çoğunlukla Müslüman) ilgili arama sorgularındaki olumsuzluk %60 arttı . Aynı zamanda, kendilerine nasıl yardım edilebileceğine ilişkin sorular da %35 oranında düştü. Obama Amerikalılara sordu: "Özgürlüğün korkudan daha güçlü olduğunu unutmayın." Konuşmasında "Müslümanları öldürün" yazılı taleplerin sayısı ise üçe katlandı . Nitekim Obama'nın konuşması sırasında ve sonrasında, Müslümanlarla ilgili aklımıza gelen ve test edebildiğimiz negatif arama sorgularının sayısı, aynı konudaki hemen hemen tüm negatif arama terimlerinde artarken, aynı konudaki pozitif olanların sayısı önemli ölçüde azaldı.

Başka bir deyişle, Obama her konuda haklıymış gibi görünüyor. Tüm ana akım medya, iyileştirici sözleri için ona teşekkür etti. Ancak internetten dijital doğruluk serumu yardımıyla elde edilen yeni veriler, konuşmanın aslında geri teptiğini ve asıl amacını kaçırdığını gösterdi. İnternetteki istatistiklere göre Obama, herkesin düşündüğü gibi öfkeli kalabalığı yatıştırmak yerine, aslında onların öfkesini alevlendirdi. Bazen olması gerektiği gibi görünen şey, beklenenin tam tersi bir etkiye sahip olabilir . Bazen, iyi yapılmış bir iş için kendimizi övmeye yönelik içgüdüsel arzuyu düzeltmek için yine de bağımsız verilere ihtiyacımız var.

, Amerika'daki bu en kötü nefret biçimini ortadan kaldırmak için ne söylemeli ? Buna daha sonra geri döneceğiz . Şimdi Amerika Birleşik Devletleri'ndeki en eski önyargı türünü, aslında diğerleri arasında ilk sırada yer alan nefret biçimini ele alalım . En yıkıcı olan ve bu kitabın başladığı çalışma konusu haline gelen . В моей работе со статистикой поисковых запросов в Google наиболее красноречивым фактом, связанным с проявлениями ненавис ти в интернете, является часто та использования слова «ниггер».

Используемое в единственном veya множественном числе, слово «ниггер» каждый год входит в семь миллио нов поисковых з aпросов американцев. (Опять же, в пес нях почти всегда это слово употребляется как «нигга», а не «ниггер», поэтому не следует считать, что о на упо требление этого слова оказала значительное влияние влияние лирика хип-хопа.) Bakın «анекдотов о нигерах» встре "kikeler hakkında şakalar", "aptalca şakalar", "Latinler hakkında şakalar", "Çinliler hakkında şakalar" ve "eşcinseller hakkında şakalar" toplamından 17 kat daha sık 23 .

«ниггер(-ы)» veya «анекдоты о ниггерах» встречаются чаще всего? Ne zaman Afrikalı Amerikalılar haberlerde olsa. Bu tür taleplerin hızla arttığı dönemlerden biri de Katrina Kasırgası'nın hemen sonrasıydı. O zamanlar televizyon ve gazeteler, New Orleans'ta hayatta kalmak için savaşan çaresiz siyah insanların görüntülerini yayınladı. Bu tür taleplerde bir başka artış, Obama'nın ilk seçimi sırasında gözlemlendi. Yaklaşık %30, Martin Luther King'i anma gününde “Nijerler hakkında Jupens” arama hacmi 24 artıyor .

Bu tür ırk ayrımcılığının ürkütücü yaygınlığı, bugünün ülkede ırkçılığın bulunmadığına dair düşüncelerini sorgulamaktadır .

Amerika'daki sonuncusu gerçek bir bulmaca . Bir yandan, siyah Amerikalıların büyük çoğunluğu ön yargıdan mustarip olduklarına inanıyor ve polisin, iş görüşmeleri sırasında ve mahkeme kararı sırasında ayrımcılığa uğradığına dair çok sayıda kanıtları var. Öte yandan, çok az beyaz Amerikalı ırkçı olduğunu kabul etmeye istekli.

Yakın zamana kadar, siyaset bilimciler tarafından yapılan baskın açıklama , bunun çoğunlukla kabul edilmeyen yaygın önyargılardan kaynaklandığı şeklindeydi . Beyaz Amerikalılar - teorik olarak - her şeyi doğru anlayabilirler, ancak siyahlara karşı tutumlarını etkileyen bilinçaltı bir önyargıları vardır. Bilim adamları bu önyargıyı test etmek için ustaca bir yol buldular. Buna örtülü ilişkilendirme testi denir.

siyah yüzleri olumlu sözcüklerle ( "iyi" gibi) ilişkilendirmesinin, olumsuz sözcüklerle ("korkunç" gibi) ilişkilendirmesinden birkaç milisaniye daha uzun sürdüğünü gösterdi . Beyaz tenli yüze gelince, resim tersine çevrilir. Fazladan zaman, üstü kapalı, bilinçsiz bir önyargının -kişinin farkında bile olmayabileceği bir önyargının- açık kanıtıdır .

Afrikalı Amerikalıların hissettiği ve beyazların reddettiği ayrımcılığın alternatif bir açıklaması var : örtülü, açık ırkçılık. Yani, oldukça yaygın bir bilinçli ırkçılıktan bahsediyoruz , insanların gayet iyi bildiği, ancak bunu - özellikle anketler sırasında - kabul etmek istemedikleri.

Google aramaları analizimizden elde ettiğimiz veriler bize şunu söylüyor . "Jupeceles'in Nijerlerle ilgili" talebinde üstü kapalı hiçbir şey yok . И трудно предста вить, что amериканцы без явного расизма могут искать Google слово «ниггер» с такой же частотой, как «ми грень» ve «экономист» — ve что это не оказывает суще ственного влияния на афроамериканцев. Google'dan istatistikler gelene kadar , bu acımasız hoşnutsuzluğa dair kesin bir kanıtımız yoktu . Şimdi öyle. Ve şimdi bunun neyi açıkladığını gösterecek durumdayız.

Bu, daha önce tartışıldığı gibi, 2008 ve 2012'de birçok bölgede Obama'ya neden bu kadar az oy verildiğini açıklıyor. Ek olarak, bir ekonomist ekibi tarafından yakın zamanda bildirildiği üzere , siyah ve beyaz işçiler arasındaki ücret farkı25 ile de ilişkilidir . En ırkçı aramaların yapıldığını gördüğüm alanlar, aynı zamanda siyahlar ve beyazlar arasındaki ücret farkının en belirgin olduğu yerlerdir. Ve sonra Donald Trump'ın adaylığı olgusu var. Giriş bölümünde belirtildiği gibi , anket gurusu Nate Silver, 2016 Cumhuriyetçi ön seçimlerinde Trump'a verilen destekle en güçlü şekilde ilişkili olan coğrafi bileşeni aradığında , bunu benim geliştirdiğim bir ırkçılık haritasında buldu. Bu değişiklik, "nijerler" ile ilgili arama sorgularıydı.

Araştırmacılar yakın zamanda siyah vatandaşlara karşı örtük önyargıyla ilgili eyalet bazında verileri bir araya getirdiler . Arama terimleri ve gizli önyargılar yoluyla bulunan açık ırkçılığın etkilerini karşılaştırmama izin verdiler . Örneğin, başkanlık seçimlerinde her bir seçeneğin Obama aleyhine nasıl işlediğini test ettim . Regresyon analizini kullanarak, ırkçı aramaların en yaygın olduğu alanların, Obama'nın oy kaybettiği yerler için iyi bir gösterge olduğunu buldum. Örtülü ilişkilendirme testinin sonuçlarının ekleyecek çok az şeyi vardır.

düzenli olarak karşı karşıya kaldığı ayrımcılığın , örtülü değil, açık düşmanlıktan kaynaklanması muhtemeldir. Bununla birlikte , diğer popülasyonlar söz konusu olduğunda, bilinçaltı önyargı daha önemli bir etkiye sahip olabilir. Örneğin , kızlara ve genç kızlara karşı üstü kapalı önyargı olduğuna dair kanıt bulmak için Google arama analizini kullanabildim .

kızlara karşı bir önyargıya sahip olabilir (ve gizleyebilir) diye sorabilirsiniz .

Ebeveynleri 26 .

Küçük çocukların ebeveynlerinin, çocuklarının üstün zekalı olabileceği düşüncesiyle genellikle heyecanlanmaları şaşırtıcı değildir. Aslında, "iki yaşındaki oğlum..." ile başlayan çoğu Google araması "yetenekli ", "yetenekli" ile biter. Ancak bu istek, erkek ve kızları hiçbir şekilde eşit olarak ilgilendirmez. Ebeveynlerin "oğlum yetenekli mi?" diye sorma olasılığı, "kızım yetenekli mi?" sorusuna göre iki buçuk kat daha fazladır. "Oğlum bir dahi mi? "

Ebeveynler kız ve erkek çocuklar arasındaki gerçek farklılıkları gözlemliyor mu ? Belki de ilki karmaşık kelimeleri ikincisinden daha sık kullanıyor ya da başka bir şekilde üstün zekalılığın nesnel belirtilerini gösteriyor? HAYIR. Bilirsin, tam tersi. Genç yaşta, kızların çok daha geniş bir kelime dağarcığına sahip oldukları ve daha karmaşık cümleler kullandıkları defalarca kanıtlanmıştır . Amerikan okullarında kızların üstün yetenekliler programına girme olasılığı erkeklerden %9 daha fazladır 27 . Bütün bunlara rağmen, nedense, ebeveynler kızlardan çok erkekleri daha yetenekli görüyorlar [17]. Aslında, zeka ile ilgili test ettiğim her aramada (eksikliği dahil), ebeveynlerin kızlarından çok erkek çocuklarından bahsetme olasılığı daha yüksektir. "Oğlum gerçekten geri zekalı mı" ya da "aptal" gibi sorular kızlarla ilgili aynı şüphelerden çok daha fazla . Bununla birlikte, kulağa olumsuz gelen aramalar ( "başarısız" ve "aptalca" gibi) oğullara, kulağa olumlu gelen aramalardan ("yetenekli" veya "zeki" gibi) daha az eğilimlidir.

kızları için asıl sorun olarak hangi sorunları görüyor ? Her şeyden önce, görünüşle ilgili her şey. Çocuğun ağırlığı ile ilgili soruları düşünün. Ebeveynler Google'da " Kızım kilolu mu ?" diye soruyor. "Oğlum fazla kilolu mu?" sorusunun yaklaşık iki katı . Kızları için nasıl kilo verilir diye sorma olasılıkları, aynı soruyu oğulları için sorma olasılıklarının neredeyse iki katı. Üstün yeteneklilikte olduğu gibi , bu cinsiyet önyargıları gerçekliğe dayanmaz. Kızların yaklaşık %28'i ve erkeklerin %35'i fazla kilolu 28 . Buna rağmen, ebeveynler obez erkeklerden çok daha fazla kilolu kızları görüyor veya onlar hakkında endişeleniyor .

Ayrıca ebeveynler, kızlarının güzel olduğunu, oğullarının yakışıklı olduğundan bir buçuk kat daha fazla bildiriyor. Ve çirkin bir kızları hakkında şikayet etme olasılıkları , aynı şeyi oğulları hakkında söyleme olasılıklarından neredeyse üç kat daha fazladır . (Bir çocuğun güzel mi yoksa çirkin mi olduğunu Google'ın nasıl belirlemesi gerektiğini düşündüklerini söylemek zor.)

Genel olarak, ebeveynler oğulları ile ilgili sorularda olumlu kelimeleri daha sık kullanıyor gibi görünüyordu. "Oğulları mutlu mu" diye sorma olasılıkları daha yüksektir ve "oğul" ve "depresyon" gibi kelimeleri bir araya getirmeye daha az isteklidirler.

muhafazakar bölgelerinde daha yaygın olduğunu düşünebilir , ancak ben buna dair bir kanıt bulamadım. Aslında, bu önyargıların hiçbiri ile bölgenin siyasi veya kültürel yapısı arasında anlamlı bir bağlantı bulamadım . Google arama verilerinin ilk kez analiz için kullanıma sunulduğu 2004 yılından bu yana bu önyargıların azaldığına dair hiçbir kanıt yok . Görünüşe göre kızlara yönelik bu ön yargı sandığımızdan daha yaygın ve derin.

Önyargı hakkındaki klişelerimizin işe yaramadığı tek konu cinsiyetçilik değil.

Amerika'nın en popüler nefret sitesi Stormfront.org'un kullanıcısı Vikingmaiden88 26 yaşında. Roman okumayı ve şiir yazmayı çok sever. İmzası Shakespeare'den bir alıntıdır. Bütün bunları profilinden ve paylaşımlarından öğrendim. Ayrıca Vikingmaiden88'in çalıştığım gazete The New York Times'ın web sitesinin içeriğini beğendiğini öğrendim . Makalelerden biri hakkında coşkulu bir inceleme yazdı.

Stormfront 29'da kayıtlı üyelerin konum, doğum tarihi , ilgi alanları ve diğer bilgileri sağlayabildiği on binlerce bu tür profili analiz ettim.

Ku Klux Klan'ın eski lideri Don Black tarafından kuruldu . Bu sitedeki en popüler "sosyal gruplar" Nasyonal Sosyalistler Birliği ve Adolf Hitler Hayranları ve Destekçileridir. Quantcast'e göre geçen yıl boyunca siteye aylık 200.000 ila 400.000 ziyaret yapıldı . Southern Poverty Law Center'ın yakın tarihli bir raporu, son beş yılda Stormfront'un kayıtlı kullanıcıları tarafından işlenen yaklaşık 100 cinayetin işlendiğini ortaya koydu.

Stormfront üyeleri düşündüğüm gibi değil.

verilen doğum tarihlerine göre genç olma eğilimindedirler . İnsanların bu siteye kaydolduğu en yaygın yaş 19'dur. Buradakiler 40 yaşındakilerin dört katı. İnternet ve sosyal ağların kullanıcıları çoğunlukla genç insanlardır. Ama çok genç değil.

Profillerde cinsiyet alanı yoktur. Ancak rastgele bir Amerikalı kullanıcı örneğinin tüm gönderilerini ve tamamlanmış profillerini inceledikten sonra , sitenin çoğu üyesinin cinsiyetinin hesaplanabileceği ortaya çıktı: Stormfront üyelerinin yaklaşık %30'unun kadın olduğunu tahmin ediyorum .

Kişi başına en fazla site üyesine sahip eyaletler Montana, Alaska ve Idaho'dur. Bu bölgelerin nüfusu ezici bir çoğunlukla beyazdır. Bu, daha az ırksal çeşitliliğin olduğu bir ortamda büyüyen insanların nefrete daha fazla doymuş olduğu anlamına mı geliyor?

Muhtemelen henüz değil. Bunun yerine, bu eyaletlerde yüksek oranda Yahudi olmayan beyazlar olduğu için , Yahudilere ve siyahlara saldıran grupların potansiyel üyeleri daha fazladır . Stormfront'un hedef kitle yüzdesi, etnik azınlık nüfusunun yüksek olduğu mahallelerde aslında daha yüksektir . Bu, özellikle bu sitenin 18 yaşında veya daha küçük üyeleri için geçerlidir - dolayısıyla nerede yaşayacaklarını seçmezler.

Bu yaş grubu söz konusu olduğunda, Kaliforniya, çeşitli ulusal azınlıkların en fazla temsil edildiği eyalettir. Ve bu eyaletteki Fırtına cephesi üyelerinin sayısı ülke ortalamasının %25 üzerinde.

Sitedeki en popüler sosyal gruplardan biri Anti-Semitizmi Destekliyor. Siteye katılan site üyelerinin yüzdesi, her bölgedeki Yahudi nüfusunun büyüklüğü ile pozitif olarak ilişkilidir. Dolayısıyla, bu gruba dahil olan New York Eyaleti (Yahudi nüfusunun en fazla olduğu bölge) sakinlerinin sayısı da ülke ortalamasının üzerindedir.

2001 yılında, Dna88 Stormfront'a kaydoldu ve kendisini "Yahudi-York" ta yaşayan 30 yaşındaki "yakışıklı, ırksal olarak uygun" bir web geliştiricisi olarak tanımladı . Önümüzdeki dört ay içinde, "Yahudilerin İnsanlığa Karşı Suçları" ve "Yahudilerin Kan Parası" gibi iki yüzden fazla gönderi yazdı ve insanları " Siyonist" konulu materyallerle kendisini "bilimsel bir kütüphane" olarak ilan eden jewwatch.com'a yönlendirdi. suçluluk."

Stormfront üyeleri , etnik azınlık mensuplarının başka dilleri konuşmalarından ve çeşitli suçlar işlemelerinden şikayetçi. Ama benim için en ilginç olanı flört pazarındaki rekabetle ilgili şikayetleriydi.

Kendisine William Lyon MacKenzie King diyen bir adam -bir zamanlar "Kanada beyazların ülkesi olmalı" diyen eski Kanada başbakanından sonra- 2003'te bir beyaz gördükten sonra "öfkesini" "bastırmak" için mücadele ettiğini yazmıştı. kadın "çirkin siyah melez bir piçle kucaklaşıyor". Los Angeles'tan 41 yaşındaki bir öğrenci olan Whitepride26 profilinde , "Siyahları , Hispanikleri ve bazen Asyalıları sevmiyorum - özellikle de erkekler kadınlarını [beyaz kadınlardan] daha çekici bulduğunda."

Bazı siyasi olaylar da rol oynar. Stormfront üyeliğinde tarihindeki en büyük artışın görüldüğü gün açık ara 5 Kasım 2008 , Barack Obama'nın başkan seçilmesinin ertesi günüydü . Bununla birlikte, Stormfront'ta Donald Trump'ın adaylığına 30 ilgi artışı görülmedi , yalnızca seçim zaferinin hemen ardından ilgide hafif bir artış görüldü. Trump bir beyaz milliyetçilik dalgasına bindi, ancak bu dalgayı kendisinin yarattığına dair hiçbir kanıt yok.

Obama'nın seçilmesi, beyaz milliyetçi harekette bir dalgalanmaya yol açtı . Trump'ın seçilmesi bu patlamanın sonucu gibi görünüyor.

Stormfront'a kaydolmakla hiçbir ilgisi yok gibi görünüyor . Siteye aylık yeni üye kaydı ile ülkedeki işsizlik oranı arasında bir bağlantı yoktur . Büyük Durgunluğun eyaletler arasında farklı etkileri oldu , ancak bununla Google'da Stormfront aramalarındaki göreli artış arasında belirgin bir bağlantı yok .

Ancak belki de en ilginci ve en şaşırtıcısı , site üyelerinin sohbet için konu seçimi gibi görünebilir. Arkadaşlarla konuştuğumuz şeylere benziyorlar. Belki çok safım ama bana beyaz milliyetçiler arkadaşlarımdan ve benden tamamen farklı bir dünyada yaşıyormuş gibi geldi. Bunun yerine Game of Thrones hakkında övgüler yağdırıyorlar ve PlentyOfFish ve OkCupid gibi tanışma sitelerinin yararlarını karşılaştırıyorlar .

diğer insanlarla aynı dünyada yaşadığı gerçeği : Aralarında New York Times'ın popülaritesi. VikingMaiden88 gazetenin makalelerini övmekle kalmıyor , aynı zamanda Stormfront'un birçok üyesi arasında popüler . Aslında, bu sitenin kullanıcılarını Yahoo haber sitesini ziyaret eden kişilerle karşılaştırırsanız , Stormfront üyelerinin [18]nytimes.com ile ilgilenme olasılığı iki kat daha fazladır.

Çok liberal nytimes.com'da gezinen nefret dolu bir sitenin üyeleri mi ? Bu nasıl olabilir ? Stormfront'un önemli sayıda üyesi nytimes.com'dan gelen haberleri duyarsa, bu, beyaz milliyetçiler hakkındaki geleneksel görüşümüzün yanlış olduğu anlamına gelir. Bu aynı zamanda, İnternet'in nasıl çalıştığına dair genel anlayışımızın da yanlış olduğu anlamına gelir.

İNTERNET İLE İLGİLİ GERÇEK

Bu sıradan bilgeliğe karşı kanıtlar, çalışmalarını daha önce tartıştığımız iki ekonomist olan Matt Gentzkow ve Jesse Shapiro tarafından 2011 yılında yapılan bir çalışmadan geldi.

Gentzkow ve Shapiro, büyük bir Amerikalı örneğinin neyi ve nasıl gördüğüne dair veri topladı . Bunlar, ideoloji ve özgüven gibi parametreleri içeriyordu: Araştırmacılar, örneklemdeki insanların kendilerini daha liberal mi yoksa muhafazakar mı gördüklerini öğrendiler. Araştırmacılar bu verileri İnternet'teki siyasi ayrımcılığı değerlendirmek için kullandılar.

Nasıl? İlginç bir düşünce deneyi yaptılar.

Diyelim ki aynı haber sitesini ziyaret eden iki Amerikalıyı rastgele seçtiniz. Birinin liberal, diğerinin muhafazakar olma olasılığı nedir ? Başka bir deyişle, liberaller ve muhafazakarlar haber sitelerinde ne sıklıkla “buluşuyor”?

Durumu daha ayrıntılı olarak ele alalım. Her ikisi de asla aynı yerden çevrimiçi haber almayabilir. Başka bir deyişle, liberaller yalnızca liberal web sitelerini ziyaret ederken, muhafazakarlar yalnızca muhafazakar web sitelerini ziyaret eder. Durum böyle olsaydı, aynı haber sitesini ziyaret eden iki Amerikalının karşıt siyasi görüşlere sahip olma şansı sıfır olurdu. İnternet mükemmel bir şekilde ayrılmış olacaktır . Liberaller ve muhafazakarlar asla karışmaz.

Aksine, her ikisinin de haberleri okuyacak yerler konusunda aynı tercihe sahip olduğunu varsayalım . Başka bir deyişle, hem bir liberal hem de bir muhafazakar aynı haber sitesini ziyaret etme olasılığı eşittir.

Durum böyle olsaydı, bu sitedeki iki Amerikalı'nın karşıt siyasi görüşlere sahip olma şansı yaklaşık %50 olurdu . İnternet tamamen ayrıştırılacaktır . Liberaller ve muhafazakarlar karışacak.

Peki Genzkou ve Shapiro'nun verileri bize ne söylüyor? Amerika Birleşik Devletleri'nde, aynı haber sitesini ziyaret eden iki kişinin farklı siyasi görüşlere sahip olma olasılığı yaklaşık %45'tir. Başka bir deyişle, İnternet, mükemmel ayrışmaya olduğundan çok daha yakındır. Liberaller ve muhafazakarlar orada sürekli olarak "buluşuyor".

İnternetteki ayrımcılık eksikliğinin gerçek bir değerlendirmesi, hayatımızın diğer alanlarındaki ayrımcılıkla karşılaştırılabilir. Gentzkow ve Shapiro, analizlerini İnternet dışındaki farklı etkileşim türleri için tekrarlayabildiler . İki aile üyesinin farklı siyasi görüşlere sahip olma olasılığı nedir? İki komşu mu? İki meslektaş mı? İki arkadaş?

Anket verilerini kullanan araştırmacılar, tüm bu sayıların aynı haber sitesini ziyaret eden iki kişiden daha düşük olduğunu buldu.

Karşıt siyasi görüşlere sahip biriyle tanışma olasılığınız,%

Bir haber sitesinde         45.2

iş arkadaşları         41.6

Komşular, çevrimdışı         40.3

Aile üyeleri         37

Arkadaşlar         34.7

sahip biriyle internette tanışma olasılığınız gerçek hayatta olduğundan daha yüksektir.

Ağda neden sıradan yaşamdan daha az ayrım var? Onu internete sınırlayan iki faktör var .

Birincisi ve oldukça şaşırtıcı bir şekilde, web'deki haber kaynakları yalnızca birkaç büyük haber portalından geliyor. İnterneti genellikle dışlanmışlar için bir araç olarak düşünürüz. Gerçekten de, bakış açıları ne olursa olsun herkes için siteler var. Silahsız ve silahsız ifade özgürlüğü, sigara içen özgürlük savaşçıları ve dolardan para kazanma aktivistleri, anarşistler ve beyaz milliyetçiler için yer var. Ancak bu sitelerin tümü, İnternet'in haber trafiğinin yalnızca küçük bir bölümünü oluşturuyor . Aslında, 2009'da dört site —Yahoo News, AOL News, msnbc.com ve CNN.com— haber görüntülemelerinin yarısından fazlasını oluşturuyordu . İlki , aylık yaklaşık 90 milyon veya Stormfront'tan 600 kat daha fazla ziyaretçiyle Amerikalılar arasında en popüler haber sitesi olmaya devam ediyor. Yahoo News gibi kitle iletişim siteleri, geniş ve politik olarak farklı bir kitleye hitap ediyor.

İnternetin neredeyse sıfıra yakın ayrışmasının ikinci nedeni, güçlü siyasi görüşlere sahip pek çok kişinin sinirlenmeye (ve içinden tartışmaya) başladığı anda hemen karşıt görüşteki sitelere gitmesidir . Siyasi keşler , kendilerini fikirlerine hitap eden sitelerle sınırlamazlar . Son derece liberal iki site olan thinkprogress.org ve moveon.org ziyaretçilerinin sağcı foxnews.com sitesini ziyaret etme olasılığı ortalama bir İnternet kullanıcısından daha fazladır. Rushlimbaugh.com veya glennbeck.com ziyaretçilerinin -son derece muhafazakar iki site- daha liberal nytimes.com'u ziyaret etme olasılıkları ortalama bir İnternet kullanıcısından daha fazladır .

Genzkow ve Shapiro'nun araştırması 2004-2009 yıllarındaki verilere dayanıyordu . - İnternet tarihinde nispeten erken bir dönem. Belki de ağ o zamandan beri daha fazla parçalanmış hale gelebilirdi? Sosyal medya ve özellikle Facebook değişmiş olabilir mi? Açıktır ki, arkadaşlarımız siyasi görüşlerimizi paylaşma eğilimindeyse , o zaman sosyal ağların büyümesi, onay sayısında bir artış anlamına gelmelidir. Sağ?

Yine, o kadar basit değil. Facebook arkadaşlarının büyük olasılıkla aynı siyasi görüşleri paylaştığı doğru olsa da , bir grup bilim insanından (Eitan Bakshi, Solomon Messing ve Lada Adamik) elde edilen veriler , insanların Facebook'ta edindiği şaşırtıcı miktarda bilginin Facebook'a sahip kullanıcılardan geldiğini gösterdi. karşıt görüşler

Bu nasıl olabilir? Arkadaşlarımız genellikle siyasi görüşlerimizi paylaşmazlar mı? Paylaşım Ut. Ancak Facebook, çevrimdışı iletişimden daha çeşitli siyasi tartışmalara yol açabilir ve bunun büyük bir nedeni vardır. İnsanlar, ortalama olarak , Facebook 32'de gerçek hayatta olduğundan çok daha fazla arkadaşa sahiptir. Ve bu uzak bağların birleşmesi muhtemeldir karşıt siyasi görüşlere sahip insanlar .

Başka bir deyişle, Facebook bize zayıf sosyal bağlantılar sağlıyor 33 : üniversiteden tanışıklık, psikotik ikinci kuzen, birbirimiz ve tüm bunlar - muhtemelen biliyorsunuz. Bunlar asla birlikte bowlinge veya barbeküye gidemeyeceğiniz insanlar . Onları yemeğe davet etmezdin. Ancak onları Facebook'ta arkadaş olarak eklemenizi hiçbir şey engelleyemez . Ve başka türlü asla göremeyeceğiniz fikirleri ifade eden makalelere olan bağlantılarını görürsünüz .

Genel olarak, İnternet farklı siyasi tercihlere sahip insanları bir araya getirir. Ortalama bir liberal hanım, sabahı liberal kocası ve liberal çocuklarıyla, öğleden sonrasını liberal meslektaşlarıyla geçirebilir . Liberal tampon çıkartmaları ile çevrilidir . Ve akşam yoga dersindeki liberal arkadaşları onu bekliyor.

Ancak eve gelip CNN.com'daki birkaç muhafazakar yorumu incelediğinde veya Cumhuriyetçi tanıdığından bir Facebook bağlantısı aldığında, bu onun o günkü en muhafazakar izlenimi olabilir.

Brooklyn'deki en sevdiğim kahve dükkanında büyük ihtimalle asla beyaz milliyetçilerle karşılaşmayacağım . Ama VikingMaiden88 ve ben sık sık New York Times web sitesinde yazışıyoruz.

İSTİSMAR HAKKINDAKİ GERÇEK ÇOCUKLAR VE kürtaj

İnternet bize sadece aşırı tutumlar hakkında değil, aynı zamanda aşırı davranışlar hakkında da fikir verebilir . Gerçekten de, Google verileri, tüm olağan kaynakların gözden kaçırdığı sorunlara karşı sizi etkili bir şekilde uyarabilir . Sonuçta, ciddi zorluklar ortaya çıktığında, insanlar genellikle çevrimiçi aramaya yönelirler.

Büyük Durgunluk sırasında çocuk istismarı konusunu ele alalım.

bu büyük ekonomik durgunluk başladığında , doğal olarak birçok uzman bu olgunun çocuklar üzerindeki etkisi konusunda endişeliydi . Sonuçta, birçok ebeveyn şiddetli stres ve depresyon yaşayabilir ve bunlar istismar için ana risk faktörleridir : bu tür vakaların sayısı önemli ölçüde artabilir.

Ancak resmi verileri aldıktan sonra endişenin asılsız olduğu görülmeye başlandı. Çocuk koruma kurumları, istismar raporlarında bir azalma olduğunu bildirdi. Ayrıca, bu bulgular durgunluktan en çok etkilenen eyaletlerde en iyimser olanıydı. Pennsylvania Üniversitesi'nde çocuk sağlığı ve refahı uzmanı Richard Helles, 2011'de Associated Press'e " Korkunç tahminler gerçekleşmedi" dedi. Evet, her ne kadar mantıksız görünse de, durgunluk döneminde çocuk istismarı vakalarının düştüğü görülüyor.

Ancak çok sayıda yetişkinin kendilerini son derece tatsız bir durumda bulduğu göz önüne alındığında, durum gerçekten böyle olabilir mi ? İnanmakta zorlandım. Bu yüzden Google istatistiklerine döndüm .

Bazı çocukların arama motoruna "Annem bana vuruyor" veya "Babam bana vuruyor" gibi kesinlikle trajik ve yürek burkan sorgular girdiği ortaya çıktı. Bu zor dönemde yaşananların tamamen farklı - son derece acı verici - bir resmini sunuyorlar . Büyük Durgunluk sırasında bu tür aramaların sayısı, işsizlik oranındaki değişiklikle yakından eşleşti.

bildirilen çocuk istismarı vakalarında bir azalma olması , çocuk istismarı vakalarında değil. Çeşitli tahminlere göre , çocuk istismarı vakalarının yalnızca küçük bir yüzdesi yetkililerin dikkatine sunuldu. Bir durgunluk sırasında , bu tür olayları rutin olarak bildiren ve bunlarla ilgilenen kişilerin çoğu (öğretmenler ve polis memurları gibi ) ( çocuk koruma çalışanları ) muhtemelen fazla çalışacak veya hiç işsiz kalacaktır.

durgunluk döneminde çocuk istismarı vakalarının gerçekten arttığına dair başka kanıtlar da var - bu sefer Google'dan değil . Bir çocuk, ebeveyn zulmü veya ihmali nedeniyle öldüğünde, yetkililere bildirilir . Bu tür ölümlerin sayısı (her ne kadar bu hala nadir olsa da ) durgunluktan en çok etkilenen eyaletlerde arttı.

Çocuk istismarından en çok etkilenen bölgelerden insanları şüphelendirmek için Google'dan bazı bilgiler var. Ulusal eğilimlerin yanı sıra durgunluk öncesi verilere dayanarak , durgunluktan en çok etkilenen eyaletlerde çocuk istismarı aramalarında artış görüldü. İşsizlikteki her %1'lik artış, “çocuk istismarı” veya “evsiz çocuklar” kelimeleriyle yapılan aramalarda %3'lük bir artış sağlıyor. Bu bölgelerde raporlamada düşüş yaşandığından , bu Google aramalarına yol açan olayların çoğu muhtemelen hiçbir zaman bilinmeyecek .

Acı çeken çocuklardan gelen arama sorguları artıyor . Çocuk ölüm oranları hızla artıyor. İstismardan şüphelenen kişilerden giderek artan sayıda soruşturma geliyor . Ancak resmi olarak kaydedilen şiddet vakalarının sayısı azalıyor. Ekonomik durgunluk nedeniyle, daha fazla çocuk Google'a ebeveynlerinin onları dövdüğünü ve hatta dövdüğünü bildiriyor . Giderek daha fazla insan şiddete tanık olduklarından şüpheleniyor. Ancak aşırı yüklenmiş kamu hizmetleri, giderek daha az sayıda bu tür olaya yanıt verebilmektedir.

geleneksel yöntemlerle tespit edilmese de çocuk istismarı vakalarının arttığını söylemek sanırım yanlış olmaz .

resmi istatistiklere yansımadığından şüphelenmeye başlasam , Google bilgilerine dönüyorum. Bu yeni verilere sahip olmanın ve bunları yorumlayabilmenin potansiyel faydalarından biri, aksi takdirde acıları yetkililer tarafından fark edilmeyebilecek olan nüfustaki en savunmasız gruplara yardımcı olabilmesidir .

Bu nedenle, Yargıtay yakın zamanda kürtajı kısıtlayan bir yasanın işleyişini incelediğinde, Google'a döndüm. Bu yasadan etkilenen kadınların gebeliklerini sonlandırmak için resmi olmayan yollar arıyor olabileceğinden şüphelendim . Ve yaptılar. Bu tür taleplerin sayısı , yasayı çıkaran eyaletlerde en fazlaydı .

Arama sorgularından elde edilen veriler sadece yararlı değil, aynı zamanda oldukça rahatsız ediciydi .

Amerika Birleşik Devletleri'nde kendi kendine kürtaj için Google'da 700.000'den fazla arama yapıldı . Karşılaştırma için, aynı yıl insanlar kürtaj kliniklerini yaklaşık 3,4 milyon kez aradı . Yani, kadınların önemli bir yüzdesi kendi başlarına kürtaj olma olasılığını düşündü.

resmi olmayan kanallardan kürtaj hapı almanın yollarını aradılar - "çevrimiçi kürtaj hapları satın al " ve "hazır kürtaj hapları". Google'a maydanoz veya C vitamini gibi bitkilerle kürtaj hakkında sorular sordular . Doğum kontrol yöntemleriyle kürtaj için yaklaşık 4.000 talep bulundu, bunlardan yaklaşık 1.300'ü net bir ifade içeriyordu: "Doğum kontrol yöntemleriyle nasıl kürtaj olunur?" Ek olarak, rahme ağartma solüsyonları enjekte edilerek ve biri karına darbe ile kürtaj için birkaç yüz talep vardı .

Kendi kendine kürtaj konusunda ilgi uyandıran nedir ? Dağıtım coğrafyası ve Google aramalarının tarihleri olası bir nedene işaret ediyor: Hamileliği resmi olarak sonlandırmak zor olduğunda, kadınlar sorunlarını çözmek için yeraltı yollarını aramaya başlıyor.

Evde kürtaj taleplerinin oranı 2004 ile 2007 yılları arasında oldukça istikrarlıydı ve 2008'in sonlarında mali krizin patlak vermesi ve ardından bir durgunluğun gelmesiyle yükselmeye başladı. 2011 yılında bu tür taleplerin sayısı hızla artarak %40'a ulaştı. Bir üreme hakları örgütü olan Guttmacher Enstitüsü, kürtajı kısıtlayan 92 hükümet düzenlemesiyle 2011'de kürtaja karşı büyük bir baskının başladığını söyledi . Ancak, kadınların üreme haklarına yönelik saldırının henüz başlamadığı Kanada'da , kendi kendine kürtaj taleplerinde herhangi bir artış olmamıştır.

Google'da kendi kendine kürtaj aramalarındaki en büyük artış , şu anda üç milyon kişinin yalnızca bir klinikte kürtaj yaptırdığı bir eyalet olan Mississippi'de oldu . Guttmacher Enstitüsü'ne göre , kendi kendine sonlanan gebelikler için en fazla talebin olduğu on eyaletten sekizinde , tıbbi kürtajlar olumsuz veya çok düşmanca görülüyor. Evde kürtaj talebinin en az olduğu 10 eyalette ise durum tam tersi.

Elbette, Google aramalarına dayanarak, tam olarak kaç kadının kendi başına başarılı bir şekilde kürtaj yaptığını söyleyemeyiz, ancak deneyimler, çok sayıda olduğunu göstermektedir. Bu konuya ışık tutmanın bir yolu, kürtaj ve doğum verilerini karşılaştırmaktır.

tam bir resmini elde ettiğimiz son yıl olan 2011'de , kürtaj kliniğinin daha az olduğu eyaletlerde yaşayan kadınların çok daha az yasal kürtajı oldu.

10 eyaleti (liste New York ve California'yı içerir) kişi başına en düşük sayıya sahip ilk 10 bölgeyle (liste Mississippi ve Oklahoma'yı içerir) karşılaştırın. En az kürtaj kliniğine sahip eyaletlerdeki kadınlar %54 daha az yasal kürtaj yaptı. Aradaki fark , 15 ile 44 yaş arasındaki her 1000 kadın için 11 kürtajdır . Aynı zamanda, kürtaj kliniğinin en az olduğu bölgelerde yaşayan kadınların doğum yapma olasılığı daha yüksekti . Ancak bu, kürtaj sayısındaki düşüşü telafi etmeye yetmiyor . Aradaki fark, doğurganlık çağındaki her bin kadın için altı doğumdur.

Başka bir deyişle, ülkenin kürtajın daha zor olduğu bölgelerinde "kayıp" gebelikler varmış gibi görünüyordu. Resmi kaynaklar bize her bin kadın için kaçırılan beş doğuma ne olduğunu söylemiyor.

Ancak, Google iyi ipuçları verir.

Devlet verilerine körü körüne güvenemeyiz . Hükümet bize çocuk istismarının veya kürtajın azaldığını söyleyebilir ve politikacılar bunu başarıları olarak kutlayacaklar. Ancak, daha önce gördüğümüz gibi, bu tür sonuçlar yanlış veri toplama yönteminden kaynaklanıyor olabilir. Gerçek farklı olabilir ve bazen çok tatsız olabilir.

FACEBOOK ARKADAŞLARINIZ HAKKINDAKİ GERÇEK

Genel olarak, kitabım büyük verilerle ilgili. Ancak bu bölüm daha çok , anladığım kadarıyla, etrafımızda gördüklerimizden çok farklı, önceden gizlenmiş bir dünyanın bize sunulduğu Google'da arama yapmakla ilgili . Ancak diğer büyük veri kaynakları da dijital doğruluk serumu mu? Aslında, birçoğu - Facebook gibi - genellikle tam tersidir.

Tıpkı anketlerde olduğu gibi sosyal medyada da dürüst olmak için hiçbir teşvikiniz yok. Aksine, orada - anketlerden çok daha fazla - daha iyi görünmek istersiniz . Sonuçta, her şeyden önce, İnternet'teki varlığınız anonim değildir - izleyicilere iyi davranırsınız ve arkadaşlarınıza, aile üyelerinize, meslektaşlarınıza, tanıdıklarınıza ve yabancılara kendinizden bahsedersiniz.

ne kadar yanlış ve taraflı olabileceğine dair bir fikir edinmek için, saygın, entelektüel aylık Atlantik'in göreceli popülaritesini düşünün . ve dedikodu ve sansasyonellikle dolu National Enquirer . Her iki baskının da benzer ortalama tirajı var - her biri birkaç yüz binlerce kopya. ("The National Enquirer" haftalık olarak çıkıyor, bu yüzden aslında daha fazla kopya satıyor.) Her biri için Google aramalarının sayısı da öyle .

Bununla birlikte, Facebook'ta yaklaşık 1,5 milyon 37 kişi profillerinde Atlantik'ten makaleleri tartışıyor . ve sadece yaklaşık 50.000 kişi National Enquirer'ı okuduğunu veya içeriğini tartıştığını kabul ediyor.

Atlantik ve Ulusal Enquirer

Çeşitli kaynaklara dayalı karşılaştırma

Dolaşım         Tahmini 1 Atlantik _

1 "Ulusal Araştırmacı" için

"National Enquirer" için 1 " Atlantic" araması yapar

Google'da

Facebook Beğenileri 1 NationalEnquirer'a 27 Atlantic

medya popülerliğini değerlendirmek için bir ölçüttür . Google'daki arama sorgularının istatistikleriyle karşılaştırılabilirler . Ve Facebook'taki sarı paçavrayla ilgili olumsuz yorumlar çoğunlukla önyargılıdır, bu da onu insanların neyi sevdiğini belirlemek için en kötü veri kaynağı haline getirir.

Facebook'ta bu resim her yerde - hem dergilerle ilgili olarak hem de dünyevi tercihler açısından . Sosyal ağda, gerçek yüzümüzü değil, geliştirilmiş, ekili portremizi ortaya koyuyoruz. Bu kitapta, özellikle bu bölümde, Facebook verilerini kullanıyorum - ancak bu özelliği her zaman aklımda tutuyorum.

Sosyal medya bilgilerinde neyin eksik olduğunu daha iyi anlamak için bir an için pornografiye geri dönelim. İlk olarak, internete pislik ve müstehcenliğin hakim olduğu şeklindeki genel inancı ele almalıyız. Bu doğru değil. İnternetteki içeriğin çoğu pornografik değildir. Örneğin, en çok ziyaret edilen 10 web sitesinin 38 hiçbiri pornografi ile ilgili değil, bu nedenle pornonun popülaritesi - kuşkusuz oldukça yüksek - abartılmamalıdır.

ve içeriğin ne kadarlık bir paya sahip olduğuna yakından baktığımızda , Facebook, Instagram ve Twitter'ın internette gerçekten popüler olanların yalnızca çok sınırlı bir seçkisi olduğunu söyleyebiliriz . Web'de inanılmaz derecede popüler olan ancak pek göze çarpmayan büyük veri alt kümeleri vardır.

bu yazının yazıldığı sırada ) , Koreli moda tutkunlarıyla dalga geçen şapşal bir pop müzik videosu olan Psy'nin "Gangnam Style" videosudur. 2012'deki ilk çıkışından bu yana yalnızca YouTube'da yaklaşık 2,3 milyar kez görüntülendi . Ve popülaritesi anlaşılabilir - onu hangi sitede bulursanız bulun. Çeşitli sosyal medya platformlarında on milyonlarca kez paylaşıldı .

Tüm zamanların en ünlü pornografik videosu "Harika vücut, harika seks, harika mi no"dur. 80 milyondan fazla kez görüntülendi . Diğer bir deyişle, "Gangnam Style" ın her 30 görüntülenmesi için en az bir "Great Body..." görüntüsü vardır. Sosyal medya , insanların ne tür videolar izlediği konusunda bize doğru bir fikir verdiyse , o zaman " Özel vücut." milyonlarca insan yeniden paylaşım yapmak zorunda kaldı. Bununla birlikte, sosyal ağlarda yalnızca birkaç düzine kez ortaya çıktı - ve her zaman sıradan kullanıcıların değil, porno yıldızlarının sayfalarında . İnsanlar açıkça bu videoya olan ilgilerini arkadaşlarına duyurma ihtiyacı hissetmiyorlar .

Facebook , " hayatımdaki her şeyin ne kadar iyi
olduğuyla
övünmenin bir yolu ."

Facebook dünyasında, ortalama bir yetişkin mutlu bir şekilde evli ve Atlantik'te gezinirken Karayipler'de tatil yapıyor gibi görünüyor . Gerçek dünyada, birçok insan süpermarket kasalarında küfür ediyor, National Enquirer'a göz atıyor. ve yıllardır yatmadıkları bir eşten gelen telefon görüşmelerini görmezden gelin. Facebook dünyasında aile hayatı mükemmel görünüyor. Gerçek dünyada , o tam bir enkaz. Bazen öyle bir karmaşa olabiliyor ki bazıları çocuk sahibi olduklarına bile pişman oluyor. Facebook dünyasında , cumartesi günleri her genç havalı bir partiye gidiyor gibi görünüyor . Gerçek dünyada çoğu kişi evde tek başına oturup Netflix dizilerini kesintisiz izliyor . Facebook dünyasında bir arkadaş, erkek arkadaşıyla geçirdiği mutlu bir tatilin 26 fotoğrafını paylaşır. Gerçekte, bu yayından hemen sonra Google'a şöyle yazar : "Erkek arkadaşım benimle seks yapmak istemiyor." Bu arada, belki aynı zamanda erkek arkadaşı da "Harika vücut, harika seks, harika oral seks" izliyordur.

dijital gerçek

dijital yalanlar

  • Arama terimleri
  • Görüntüleme
  • tıklamalar
  • Metin vurguları
  • Sosyal medya gönderileri
  • Sosyal medyadaki beğeniler
  • Arkadaşlık sitelerindeki profiller

MÜŞTERİLERİNİZ HAKKINDAKİ GERÇEK

5 Eylül 2006'nın erken saatlerinde 39 Facebook ana sayfasında büyük bir güncelleme yaptı . Bu sosyal ağın ilk sürümlerinde kullanıcılar, arkadaşlarının ne yaptığını ancak profillerine tıklayarak öğrenebiliyordu . Sitede aynı anda 9,4 milyon kişi varsa , site büyük bir başarı olarak kabul edildi .

tüm arkadaşlarının ne yaptığı hakkında bilgi vermesi gereken Haber Kaynağı adını verdikleri şeyi yarattı .

haber akışından nefret ettiklerini bildirdi . Northwestern Üniversitesi'nde bir lisans öğrencisi olan Ben Parr, Facebook Haber Kaynağına Karşı Öğrenciler grubunu oluşturdu . "Çok ürkütücü, çok müdahaleci ve özellik kaldırılmalı" dedi. Birkaç gün içinde 700.000 kişilik bir grup Parr'ın fikrini destekledi. Michigan Üniversitesi'ndeki genç öğrencilerden biri Michigan Daily ile yaptığı röportajda şunları söyledi: “ Yeni Facebook'tan cidden korkuyorum . Sürekli avlanıyormuşum gibi hissettiriyor."

sitenin tarihçesindeki hesabında "Facebook Impact : The Inside Story of a Company That Connects the World" başlıklı hesabında anlattı. Haber Kaynağının tanıtımını "Facebook'un şimdiye kadar karşılaştığı en büyük kriz" olarak nitelendirdi. Ancak Kirkpatrick, Facebook'un kurucu ortağı ve CEO'su Mark Zuckerberg ile röportaj yaptığında hiç etkilenmedi.

Neden? Zuckerberg'in dijital bir doğruluk serumuna erişimi vardı : insanların Facebook'ta yaptıkları tıklama ve ziyaretlerin sayısı . İşte Kirkpatrick'in yazdığı şey:

“Aslında Zuckerberg, gruplarda ne söylerlerse söylesinler, insanların haber akışını sevdiğini biliyordu. Elinde bunu kanıtlayacak veriler vardı. Ortalama olarak, insanlar Facebook'ta Haber Kaynağı kullanıma sunulmadan öncesine göre daha fazla zaman harcıyor - çok daha fazla. Ağustos ayında kullanıcılar sitenin 12 milyar sayfasını görüntülerken , Ekim ayında haber akışıyla birlikte bu sayı şimdiden 22 milyar oldu.

Ve Zuckerberg'in elindeki tüm kanıtlar bu değildi. Haber akışı besleme karşıtı grubun viral popülaritesi bile yeniliğin cazibesinin kanıtıydı. Kurdele sayesinde grup çok hızlı büyüyebildi. Pek çok kullanıcı, arkadaşlarının ona katıldığını öğrenebildi - ve bunu haber akışından öğrendiler.

artık hayatlarının her detayını gösterdiğini kabul etmediklerini dile getiren gruplara katılırken , arkadaşlarının hayatlarının her detayını görmek için Haber Kaynaklarını açıyorlardı . Ve bant kalır. Facebook'un artık her gün bir milyardan fazla aktif kullanıcısı var .

Sıfırdan Bire kitabında . Geleceği değiştirecek bir startup nasıl kurulur ” Facebook'un ilk yatırımcılarından biri olan Peter Thiel, büyük işletmelerin 40'ın sırları üzerine inşa edildiğini savunuyor - ister doğanın sırları, ister insanların sırları. Jeff Seder, 3. Bölüm'de tartışıldığı gibi, sol karıncık boyutunun bir atın gelecekteki performansını tahmin edebileceğini bularak doğanın gizemini çözdü . Google, insanlar arasındaki bilgi ve bağlantıların ne kadar güçlü olabileceğinin sırrını ortaya çıkardı .

Thiel, "insanların sırlarını" "kendileri hakkında bilmedikleri veya başkalarının bilmesini istemedikleri için sakladıkları şeyler" olarak tanımlar. Yani bu tür işler yalan üzerine kuruludur.

, Zuckerberg'in Harvard'dayken öğrendiği insanlar hakkında iğrenç bir sırra dayandığını iddia edebilirsiniz . İkinci sınıfın başında, öğrenci arkadaşları için Facemash [19]adını verdiği bir web sitesi oluşturdu . " Sıcak mı değil mi?" adlı bir siteden sonra modellendi. (“Çekici mi değil mi?”). Facemash'ta iki Harvard öğrencisinin fotoğrafları gösterildi ve arkadaşları kimin daha iyi göründüğünü değerlendirebildi.

İkinci sınıf öğrencisinin web sitesi öfkeyle karşılandı. Bir Harvard Crimson başyazısında Mark, "erkeklerin en aşağılık tutkularına kapılmakla" suçlandı . Hispanik ve Afro-Amerikan gruplar onu cinsiyetçi ve ırkçı olmakla suçladılar. Ancak Harvard yöneticileri Zuckerberg'in İnternet erişimini kapatmadan önce (site açıldıktan birkaç saat sonra ), 450 kişi Facemash'i görüntülemeyi ve şu veya bu resme 22.000 kez oy vermeyi başardı .

Zuckerberg önemli bir sır öğrendi: İnsanlar
deli olduklarını söyleyebilirler, bir şeyi azarlayabilirler
ama yine de içeri girerler,
bakarlar ve tıklarlar.

Ayrıca önemli bir şey daha öğrendi: Tüm profesyonelliklerine, ciddiyetlerine, sorumluluklarına ve özel hayatlarına saygılarına rağmen, insanlar (Harvard öğrencileri bile) insanları görünüşlerine göre yargılamaya büyük ilgi gösteriyor. Görüşler ve oylarla istendi . Ve daha sonra -Facemash verileri çok tutarsız olduğu için- insanların başkaları hakkında yüzeysel gerçekleri öğrenmekle ne kadar ilgilenebileceklerini fark etti . Bu , kuşağının en başarılı girişimini yaratmasını sağladı .

Netflix bu dersi aldı ve başlangıcından beri kullanıyor: insanların söylediklerine güvenmeyin, yalnızca yaptıklarına inanın.

Şirket, başlangıçta kullanıcıların gelecekte görmek istedikleri ancak şu anda izlemeye zamanları olmayan filmlerin bir listesini oluşturmalarına izin verdi. Böylece insanların daha fazla zamanı olduğunda, Netflix onlara bu filmleri hatırlatabilirdi.

Yine de, bu verilerde garip bir şey fark edildi. Kullanıcılar listeyi çok sayıda filmle doldurdular, ancak birkaç gün sonra kendilerine bu hatırlatıldığında nadiren üzerlerine tıkladılar.

Öyleyse problem neydi? İnsanlara önümüzdeki birkaç gün içinde ne izlemeyi planladıklarını sorun , istek listelerini 2. Dünya Savaşı'ndan siyah beyaz belgeseller veya ciddi yabancı filmler gibi gösterişli filmlerle dolduracaklar . Ancak birkaç gün sonra, yalnızca genellikle izledikleri filmleri izlemek isterler: sade komediler veya romantik filmler. İnsanlar her zaman kendilerine yalan söyler.

Bu paradoksla karşı karşıya kalan Netflix, insanlara gelecekte ne izlemek istediklerini sormayı bıraktı ve milyonlarca tıklama ve görüntülemeye dayalı bir model oluşturmaya başladı . Şirket, ziyaretçilerin teorik tercihlerine göre değil , en sık izlenme istatistiklerine dayalı bir film listesi sunarak kullanıcılarını ağırlamaya başladı . Sonuç : müşterilerin Netflix'i ziyaret etme ve daha fazla film izleme olasılığı daha yüksektir .

eski bir veri bilimcisi olan 41 yaşındaki Xavier Amatrian, "Algoritmalar sizi sizin kendinizi bildiğinizden daha iyi tanıyor" diyor .

İnsanların size söylediklerini görmezden gelmek ne kadar önemli

insanlar ne diyor

gerçeklik

Sonuç olarak

Arkadaşlarını takip etmek istemiyorlar .

Bu dünyada arkadaşlarını gözetlemek ve onları tartışmaktan daha fazlasını istedikleri çok az şey vardır .

Facebook'un kurucusu Mark Zuckerberg'in serveti 55.2 milyar dolar .

Yer altı atölyelerinde üretilen ürünleri almak istemiyorlar .

, "ucuz" ürünler satın alacaklar .

Nike'ın kurucusu Phil Knight'ın serveti 25.4 milyar dolar.

Sabah haberleri dinlemek istiyorlar .

Cücelerin akşamları porno yıldızlarıyla seviştiklerini duymak istiyorlar.

Howard Stern'in değeri 500 milyon dolar.

tahakküm ve sadomazoşizm hakkında okumak istemiyorlar .

Genç bir üniversite mezunu ile bir iş adamı arasındaki BDSM ilişkisini okumak istiyorlar.

125 milyon kopyası satıldı.

Politikacıların pozisyonlarını netleştirmelerini istiyorlar .

Politikacıların onları ayrıntılardan kurtarmasını, ancak kararlı ve kendinden emin görünmesini istiyorlar .

Donald Trump.

DAYANABİLİR MİYİZ? DOĞRUSU?

Bu bölümün bazı kısımları sizi üzebilir. Digital Truth Serum, insanları görünüşlerine göre yargılamaya devam eden eğilimi ve milyonlarca bekar gey erkeğin varlığını ortaya çıkardı, kadınların önemli bir yüzdesinin tecavüz hakkında fanteziler kurduğunu ve Afrikalı Amerikalılara karşı önyargının oldukça yaygın olduğunu gösterdi. Çocuk istismarının ve kendi kendine kürtajın gizli katmanları olduğu ortaya çıktı . Son zamanlarda öfkeli İslamofobik duyguların olgunlaştığı ortaya çıktı ve bu duygular, ancak cumhurbaşkanının halka hoşgörü çağrısıyla hitap etmesinden sonra yoğunlaştı . Hiç eğlenceli değil! Araştırmam hakkında konuştuktan sonra insanlar sık sık bana gelip "Seth, bunların hepsi çok ilginç, ama çok karanlık ve yorucu !" diyorlar.

karanlık alt tonları ortaya çıkarmadığını iddia edemem . İnsanlar bize sürekli olarak sadece duymak istediğimizi düşündüklerini söylüyorsa, o zaman genellikle sadece gerçeklerden daha rahat şeyler duyarız.

Ortalama olarak, dijital doğruluk serumu dünyanın düşündüğümüzden daha kötü olduğunu gösteriyor .

Bunu bilmemiz gerekiyor mu? Google aramalarını , porno sitelerinden gelen verileri, kimin nereye tıkladığını bilmek... “Harika. Artık gerçekte kim olduğumuzu anlayabiliriz." Ama aksini düşünebilirsiniz: “Korkunç. Artık gerçekte kim olduğumuzu anlayabiliriz."

Ancak gerçek, yalnızca Mark Zuckerberg veya bunu isteyen diğer kişiler için değil, tıklama veya müşteri elde etmeye yardımcı olur. Bu bilginin hayatımızı iyileştirmesinin en az üç yolu vardır.

Birincisi, kendinizden şüphe duymanız ve beceriksiz davranışlarınızda yalnız olmadığınızı bilmekten memnun olabilirsiniz . Diğer insanların da vücutları hakkında güvensiz olduklarını bilmeniz gerekebilir. Dünyadaki herkesin tavşanlar gibi çiftleşmediğini öğrenmek, özellikle hayatlarında fazla seks yapmayanlar için muhtemelen bir rahatlama olacaktır . Ve belki de, bir oyun kurucuya aşık olan bir Mississippi lisesi öğrencisi için , çevresindeki açıkça eşcinsel erkeklerin resmi sayılarının düşük olmasına rağmen, çevresinde hala benzer bir çekiciliği deneyimleyen birçok insan olduğunu bilmek değerli olabilir .

Henüz değinmediğim başka bir alan daha var; burada bir Google araması yalnız olmadığınızı ortaya çıkarabilir. Gençliğinizde bir öğretmen size bir sorunuz varsa elinizi kaldırıp sormanız gerektiğini söylemiş olabilir. Çünkü bir şeyi siz anlamazsanız, muhtemelen başkaları da anlamaz. Benim gibiyseniz, öğretmenin tavsiyesini görmezden geldin ve ağzını açmaya korkarak sessizce oturdun. Sorularınız size çok aptalca geldi (başkalarının çok derin soruları olduğunu düşünebilirsiniz ). Google'ın anonim birleştirilmiş verileri, öğretmenlerimizin ne kadar haklı olduğunu bir kez ve tamamen kapatabilirdi . Ne de olsa, diğer insanlar da pek çok temel soru biriktirdi.

yaptığı konuşma sırasında Amerikalıların kafasında beliren ana soruları ele alalım42 .

Sadece siz ilgilenmediniz:

Kongre Konuşması Sırasında Google'da Sorulan Temel Sorular

Obama kaç yaşında?

Biden'ın yanında kim oturuyor [20]?

yeşil kravatı var ?[21]

Beiner neden bu kadar turuncu?

Bu soruları okuyabilirsiniz ve bence bunlar demokrasimizden yana değil. Görünüşe göre insanlar , Cumhurbaşkanı'nın konuşmasının içeriğinden ve bizi nasıl etkileyeceğinden çok, birinin kravatının rengine veya ten rengine önem veriyor . John Beiner'in (o zamanki Temsilciler Meclisi Başkanı ) kim olduğunu bilmemek de ülkenin siyasi yaşamına katılımımız için pek iyi değil.

öğretmenlerimizin bilgeliğini göstermek olarak düşünmeyi tercih ederim . Bunlar, insanların genellikle çok aptal olduklarından korktukları için gündeme getirmedikleri konulardır. Ancak birçoğu onlara soruyor ve Google'a soruyor.

Aslında, büyük verinin şu ünlü sözü yenilemeye yardımcı olacağını düşünüyorum: "İçinizde olanı asla başkalarının sergiledikleri ile kıyaslamayın." Yeni bir yorumla kulağa şöyle gelebilir: " Google aramalarınızı asla diğer kişilerin sosyal medya gönderileriyle karşılaştırmayın. "

Sosyal ağlarda ve anonim arama sorgularında kocalarının eşlerinin açıklamalarını karşılaştırın.

Kadınlar kocalarını en çok nasıl tanımlar?

Sosyal medya gönderileri

Arama terimlerinde

En iyisi

gey

En iyi arkadaşım

Sarsmak

İnanılmaz

İnanılmaz

en harika

Sinir bozucu

Çok tatlı

Vasat

Başkalarının arama terimlerini değil de sosyal medya gönderilerini okuduğumuz zaman , kocalarının "en iyi", "harika " ve "çok tatlı " [22]olduğunu düşünen kadınların sayısını abartma eğilimindeyiz . Kocalarının "hiç kimse", "sinir bozucu" ve "aptal" olduğunu iddia eden kadınların sayısını en aza indirme eğilimindeyiz . Anonim toplu verilere bakıldığında , evliliği ve aslında hayatın kendisini oldukça karmaşık bulanların sadece biz olmadığımızı görmek kolaydır . Artık arama sorgularımızı diğer kişilerin sosyal medya gönderileriyle karşılaştırmayı bırakabiliriz .

Dijital doğruluk serumunun ikinci faydası, acı çeken insanları belirlemesidir. İnsan Hakları Kampanyası, bazı eyaletlerdeki erkeklere gey olma konusunda açık olma fırsatı vermek için benimle çalışmamı istedi. İnsan Hakları , kaynaklarını en iyi nereye yönlendireceğine karar vermek için Google'ın anonim birleştirilmiş arama verilerini kullanmak istiyor . Aynı şekilde, Çocuk Esirgeme Hizmetleri, ülkenin hangi bölgesinde çocuklara resmi belgelerin gösterdiğinden çok daha zalimce davranılabileceğini öğrenmek için benimle temasa geçti .

Daha önce bahsettiğim harika bir konu var : vajinal kokular. The New York Times'da onun hakkında ilk yazdığımda, bunu ironik bir şekilde yazmıştım. Sonra konu bende kıkırdama isteği uyandırdı.

Bununla birlikte, bazı ilan panolarına ve aramalara bakmaya başladığımda, vajinal kokudan endişe duydukları için hayatlarının mahvolduğuna ikna olmuş genç kızların birçok gönderisinin olduğu ortaya çıktı. Şaka yapmıyorum. Seks eğitimcileri benimle temasa geçti ve genç kızlar arasındaki paranoyayı azaltmak için internetten bazı verileri en iyi nasıl dahil edebileceğimi sordu .

tartışırken biraz konu dışı hissetsem de , bunlar çok ciddiydi. Ve bilimsel verilerimin onlara yardımcı olabileceğini düşünüyorum.

Ve en önemlisi, bu dijital hakikat serumu aslında bizi sorunlardan çözümlere götürebilir . İşler bizim için daha net hale geldiğinde, sorunları küresel ölçekte azaltmanın yollarını bulabiliriz .

Obama'nın İslamofobik konuşmasına geri dönelim. Hatırlatmama izin verin, Obama ne zaman Müslümanlara daha fazla saygı duymamız gerektiğini söylese, hoşgörüye ikna etmeye çalıştığı insanlar giderek daha fazla öfkeleniyordu.

Yine de Google aramaları, mesajında Obama'nın beklediği yanıtı tetikleyen bir satır olduğunu gösteriyor . “Amerikalı Müslümanlar bizim dostumuz, komşumuz, iş arkadaşımız, spor kahramanlarımızdır. Ve evet, onlar ülkemizi savunurken ölmeye hazır üniformalı erkeklerimiz ve kadınlarımızdır .”

O satırdan sonra bir yılı aşkın süredir ilk kez Google'da "Müslümanlar" kelimesinden sonra "terörist", "aşırılık yanlısı" veya "mülteci" içermeyen aramalarda artış oldu . Şimdi "sporcular" ve ardından - "askerler" geldi. Üstelik "sporcular" Cumhurbaşkanı'nın konuşmasının ardından bir gün içinde birinci sırayı aldı .

Öfkeli insanlara ders verdiğimizde, arama sorguları öfkelerinin yalnızca artabileceğini gösteriyor . Ancak ince bir şekilde insanların merakını uyandırarak, onlara yeni bilgiler vererek ve çileden çıkaran grubun yeni görüntülerini önererek, kişi düşünceleri farklı, daha olumlu bir yöne çevirebilir.

bu kez bir camiden televizyonda İslamofobi üzerine başka bir konuşma yaptı . Belki başkanın ofisinden biri, bir önceki adreste neyin işe yarayıp neyin yaramadığını tartışan Times köşemi okudu. Ne olursa olsun, bu konuşmanın içeriği bir öncekinden önemli ölçüde farklıydı.

Obama hoşgörünün öneminden çok kısaca bahsetti . Bunun yerine, esas olarak insanların merakını uyandırdı ve Müslüman Amerikalılara yönelik algılarını değiştirmeye çalıştı. Obama, Afrika'dan gelen birçok kölenin Müslüman olduğunu söyledi. Thomas Jefferson ve John Adams'ın kendi Kuran nüshaları vardı . Amerika Birleşik Devletleri'ndeki ilk cami Kuzey Dakota'da inşa edildi. Müslüman bir Amerikalı, Chicago'da gökdelenler tasarladı. Obama yine Müslüman sporculardan ve askeri personelden bahsetti ve ardından Müslüman polis ve itfaiyecilerden , öğretmenlerden ve doktorlardan bahsetti.

Google arama sorguları analizim, bu konuşmanın bir öncekinden daha başarılı olduğunu gösterdi. Başkanın mesajını takip eden saatlerde, nefret dolu aramaların sayısı önemli ölçüde düştü .

Nefretin nedenlerini ve yoğunluğunu azaltmanın yollarını anlamak için , arama istatistiklerini kullanmak için başka seçenekler de vardır . Örneğin, yerel bir takımda siyahi bir oyun kurucu göründükten sonra ırkçı taleplerin sayısının nasıl değiştiğine bakabiliriz . Ya da bir kadın üst düzey bir göreve seçildikten sonra cinsiyetçi talepler nasıl değişecek ? Irkçılığın değişen sosyal düzene nasıl tepki verdiğini ve cinsiyetçiliğin yeni cinsel taciz yasalarına nasıl tepki verdiğini takip edebiliriz .

Bilinçaltımızın derinliklerinde gizlenen önyargıları incelemek de faydalı olabilir. Örneğin , küçük kızların zihinlerini sevindirmek için ekstra çaba sarf edebilir ve görünüşleriyle daha az ilgilenebiliriz. Google aramalarından ve internetteki diğer güvenilir kaynaklardan toplanan veriler, bize insan ruhunun en karanlık köşelerine dair eşi görülmemiş bir içgörü sağlıyor. Ve bazen, itiraf ediyorum, oldukça zor olabiliyor. Ama aynı zamanda güçlendirme anlamına da gelir. Karanlıkla savaşmak için verileri kullanabiliyoruz . Dünyanın sorunları hakkında mümkün olduğunca fazla bilgi edinmek, onları ortadan kaldırmanın ilk adımıdır.

Bölüm 5

DİKKATLİ BAKALIM

ah kardeşim Noah benden dört yaş küçük. Bizimle ilk görüştüğümüzde çoğu insan birbirimize çok benzediğimizi söylüyor. İkimiz de çok yüksek sesle konuşuyoruz, aynı şekilde kel kalıyoruz ve dairelerimizi düzende tutmakta büyük zorluk çekiyoruz.

Ancak farklılıklar da var. Ben eli sıkıyım ve Noah en iyisini alıyor. Leonard Cohen ve Bob Dylan'ı seviyorum ve Noah, Cake ve Beck'i seviyor.

Belki de aramızdaki en belirgin fark beyzbola karşı tavrımızdır. Onu ve özellikle New York Mets'i seviyorum. Noah ise beyzbolu inanılmaz derecede sıkıcı buluyor ve spora olan nefreti uzun zamandır kişiliğinin ayrılmaz bir parçası [23].

Сет Стивенс-Давидовиц, обожает бейсбол

Ной Стивенс-Давидовиц, ненавидит бейсбол

Nasıl oluyor da bu kadar benzer genlere sahip, aynı ebeveynler tarafından aynı şehirde yetiştirilmiş iki adam beyzbol hakkında bu kadar zıt duygular besliyor? Büyüyünce ne tür yetişkinler olacağımızı ne belirler? Ya da daha temelde: Noah'ın nesi var? Cevap , büyük veritabanlarını toplayan, filtreleyen ve analiz eden ve bunları önemli çocukluk olaylarıyla ilişkilendiren gelişim psikolojisi alanında mı yatıyor ? Bu, bu ve ilgili sorunları çözmemize yardımcı olabilir . Böyle bir süreç, büyük verinin gelişmiş kullanımı olarak adlandırılabilir .

yaptığım çalışmalardan birine bir göz atalım . Bu, çocukluk deneyimlerinin hangi beyzbol takımını desteklediğinizi veya herhangi bir takımı desteklemek isteyip istemediğinizi nasıl etkilediğiyle ilgiliydi . Bu çalışma için, Facebook'un beyzbol takımları için "beğeniler" ile ilgili istatistiklerini kullandım . Önceki bölümde , hassas konular söz konusu olduğunda Facebook'un verilerinin gerçeklikten uzak olabileceğini belirtmiştim . Bu durumda, hiç kimsenin, hatta Philly hayranlarının bile , belirli bir takımla ilgilendiklerini Facebook'ta itiraf etmekten utanmayacağına inanıyorum .[24]

iki New York BASE hasta ekibinden birinin sayfalarını havlayan adamların yaşını analiz ettim . İşte doğum yılına göre Mets hayranlarının sayısını gösteren bir grafik .

Процент болельщиков «Метс» в зависимости от года их рождения

0,48

0,44

0,40

0,36

0,32

1950        1960        1970        1980        1990

Puan ne kadar yüksek olursa, takımın o kadar çok taraftarı olur. Popülaritesi yükselir ve düşer, sonra tekrar yükselir ve tekrar düşer. Mets, 1962 ve 1978 doğumlular arasında çok ünlüydü . Bence beyzbol hayranları bunun neyle ilgili olduğunu anlıyor. Mets, 1969 ve 1986'da yalnızca iki World Series şampiyonluğu kazandı . O yıllarda 1962 ve 1978 doğumlu erkekler doğdu. yedi sekiz yaşlarındaydı. Bu yüzden Mets'i sevmenin önemli bir göstergesi - en azından erkekler arasında - takımın onlar yaklaşık yedi veya sekiz yaşındayken Dünya Serisini kazanıp kazanmadığıdır.

Aslında bu analizi genişletebiliriz. Farklı yaşlardaki farklı takımların kaç hayranının çok çeşitli MLS [25]takımlarından herhangi birini beğendiğini gösteren Facebook bilgilerini öğreniyorum. ve 1962 doğumlu, Baltimore Orioles'i destekleyen alışılmadık derecede çok sayıda erkek olduğunu keşfetti . Ve Pittsburgh Pirates'i destekleyen 1963 doğumlu adamlar. Söz konusu takımlar şampiyon olduğunda, bu insanlar sekiz yaşında çocuklardı. Çalıştığım tüm takımların taraftarlarının yaş zirvesini hesapladıktan sonra aşağıdaki grafiği yaptım:

bir erkeğin hayatındaki en önemli yıl 2 , yetişkinlikte en sevdiği hasta üs ekibinin seçimini belirleyen - artı veya eksi sekiz yıl. Genel olarak, 5 ila 15 yaşları, bir erkeğin kalbini kazanmak için kilit dönemdir . 19 veya 20 yaşında bu rakam tepe değerinin 1/8'ine kadar düşer . Ve tam bu sırada şu soruya nihayet karar verilecek : ya adam bir takıma ömür boyu aşık olacak ya da bu sporla hiç ilgilenmeyecek .

Şunu sorabilirsiniz: Beyzbolu seven kadınlar ne olacak? Burada bağımlılık çok daha az belirgindir ve yaş zirvesi 22 yaş civarında görünmektedir.

Bu benim en sevdiğim çalışma. En değer verdiğim iki konuya, beyzbola ve yetişkin memnuniyetsizliğimin kaynaklarına değiniyor. 1986'da beyzbol bağımlısı oldum ve Mets'i destekleyerek tek başıma acı çektim - ve hala da çekiyorum. Nuh dört yıl sonra doğdu ve ondan kurtuldu.

Beyzbol bugün dünyadaki en önemli konu değil ya da en azından danışmanım , Ph.D., bana bunu defalarca söyledi. Ancak metodolojim, insanların siyasi veya cinsel tercihlerini, müzik zevklerini ve finansal alışkanlıklarını nasıl şekillendirdiği dahil olmak üzere bu soruları ele almamıza yardımcı olabilir. ( Kardeşimin son iki alandaki çılgın fikirlerinin kaynağını bilmek özellikle ilgimi çekerdi .) Sanırım yetişkin alışkanlıklarımızın ve ilgi alanlarımızın birçoğunun (temel olduğunu düşündüklerimiz bile) keyfi gerçeklerle açıklanabileceğini göreceğiz. Evet, doğumumuz ya da gençliğimizdeki o birkaç kilit yılda olanlar.

Tabii ki, benzer çalışmalar zaten yapıldı, bunlar siyasi tercihlerin kökeni ile ilgiliydi. Veri analizi şirketi Catalist'in baş bilim adamı Yair Gitza ve Columbia Üniversitesi'nde siyaset bilimci ve istatistikçi olan Andrew Gelman, çoğu insanın liberal fikirlerle yola çıktığı, ancak yaşlandıkça muhafazakarlığa kaydığı şeklindeki geleneksel bilgeliği test etmeye çalıştı. Bu görüş, genellikle Winston Churchill'e atfedilen ünlü bir alıntıda ifade edilir : “Bir kişi henüz 30 yaşında değilse ve liberal değilse, o zaman kalbi yoktur; bir insan zaten 30'un üzerindeyse ve muhafazakar değilse, o zaman beyni yoktur.

Gitz ve Gelman, 300.000'den fazla seçmen tercihi gözlemi içeren çalışmalardan elde edilen verileri işlemek için 60 yıl harcadılar. Ve Churchill'in iddiasının aksine, gençlerin bazen liberal bazen de muhafazakar olduğunu gördüler. Aynı şey orta yaşlılar ve yaşlılar için de geçerli.

Çalışmaları, siyasi görüşlerin aslında spor tercihleriyle tamamen aynı şekilde şekillendiğini açıkça gösterdi. Hayatın geri kalanı üzerinde belirleyici bir etkiye sahip olan kritik bir dönem vardır . 14 ila 24 yaşları arasında pek çok Amerikalı, başkanın şöhretine dayanarak fikirlerini oluşturuyor. Popüler bir Cumhuriyetçi veya popüler olmayan bir Demokrat ve birçok genç Cumhuriyetçi olacak . Aksine, gelecek nesil Demokratların sütunlarını dolduracak. Ve çok önemli bir zamanda edinilen bu görüşler, çoğu Amerikalı için hayatlarının geri kalanında kalacak .

1941'de doğan Amerikalıların tercihlerini on yıl sonra doğanlarla karşılaştırın.

İlk grup, popüler Cumhuriyetçi Dwight Eisenhower'ın başkanlığı sırasında reşit oldu . 1960'ların başında, bu insanlar 30'lu yaşlarının sonunda olmalarına rağmen , çoğunlukla Cumhuriyetçi partiye oy verdiler. Yaşlandıkça bile, bu nesil sürekli olarak Cumhuriyetçi desteğe yöneldi.

10 yıl sonra doğan Amerikalılar - baby boomers - çok popüler bir Demokrat olan John F. Kennedy'nin başkanlığı sırasında reşit oldular . Lyndon Johnson aslen ünlü bir Demokrattı. Richard Nixon, sonunda utanç içinde emekli olan bir Cumhuriyetçiydi . Bu neslin üyeleri, yaşamları boyunca liberal bir düşünce tarzına yöneldiler.

siyasi görüş belirtmek için en önemli yaşı belirleyebildiler : 18 yaş.

Bu damgalama etkisinin çok önemli olduğunu buldular. Modelleri, Eisenhower başkanlığının bir sonucu olarak , 1941'de doğan Cumhuriyetçilerin sayısının %10 arttığını öne sürüyor. Kennedy, Johnson ve Nixon, 1952 doğumlu Amerikalılar arasında Demokratların sayısını %7 artırdı.

Çalışmanın verileri hakkında şüpheci olduğumu açıkça belirttim, ancak incelenen yanıtların sayısından etkilendim . Aslında, böyle bir çalışma küçük bir anket temelinde yapılamaz . Tercihlerin yaşla birlikte nasıl değiştiğini tam olarak görmek için bilim insanlarının yüzbinlerce gözleme ve birçok çalışmanın özetine ihtiyacı vardı.

Beyzbolun sevilip sevilmemesine ilişkin analizim için veri miktarı da kritikti. Sadece her takımın taraftar sayısını değil, aynı zamanda onları yaşa göre ayırmam gerekiyordu. Bu, milyonlarca gözlem gerektirir ve Facebook, diğer dijital kaynaklarla birlikte bize bu tür bilgileri sağlayabilir .

Bu, çalışılan istatistiklerin hacminin devreye girdiği yerdir . Küçük parçalarından birinin görüntüsünün netliğini artırabilmeniz için bir fotoğrafta çok sayıda piksele sahip olmanız gerekir. Aynı şekilde, küçük bir alt kümenin netliğini artırabilmek için , örneğin Mets ekibinin 1978 doğumlu erkekler arasında ne kadar popüler olduğunu söylemek için, genel veri kümesinde birçok gözlem gereklidir . Birkaç bin kişilik büyük bir anket, yeterince büyük bir örneklem olmayacaktır .

Bu, büyük verinin üçüncü avantajıdır: kim olduğumuz hakkında yeni bilgiler elde etmek için büyük bir dizinin küçük bölümlerine yakından bakmanıza olanak tanır. Yaş dışında başka parametrelere de bakabiliriz . Yeterli bilgiye sahip olursak , belirli şehir ve kasabalarda yaşayan insanların nasıl davrandıklarını anlayabiliriz. Saatlik ve dakikalık olarak nasıl davrandıklarını bile görebiliriz .

Bu bölümde insan davranışına yakından bakacağız.

BÖLGELERİMİZDE, ŞEHİRLERİMİZDE VE KÖYLERİMİZDE GERÇEKTEN NELER OLUYOR?

Geriye dönüp bakınca her şey harika görünüyor. Ancak o zamanlar Harvard'da profesör olan Raj Chetty ve onun küçük araştırma ekibi oldukça büyük bir veri kümesini -1996'dan beri tüm Amerikalıların vergi kayıtları- incelediklerinde, herhangi bir işe yarayacağından emin olamadılar . IRS bu bilgiyi onlara aktardı çünkü yönetimi, araştırmacıların bunu vergi politikasının sonuçlarını açıklığa kavuşturmak için kullanabileceğini hissetti.

Chatty ve ekibinin bu istatistikleri kullanmaya yönelik ilk girişimleri, onları sayısız çıkmaza soktu . Federal ve eyalet vergi politikasının sonuçlarına ilişkin analizleri, yalnızca bu bilgilerle çalışan diğer tüm araştırmacılarla temelde aynı sonuçlara götürdü. Belki de Chetty'nin yüz milyonlarca IRS verisini kullanan sonuçları biraz daha doğruydu. Ancak diğerleriyle hemen hemen aynı sonucu elde etmek, sosyal bilimin ciddi bir başarısı değildir. Bu , en iyi bilimsel dergilerin yazmaya hazırlandığı türden bir iş değil .

Ayrıca, vergi dairesinden tüm verilerin toplanması ve analizinin organize edilmesi uzun zaman aldı. Bilgi içinde boğulan Chetty ve ekibi, aynı sonuçları elde etmek için diğer tüm bilim adamlarından daha fazla zaman harcadı.

Büyük veri fikrine şüpheyle yaklaşan insanlar haklıymış gibi görünmeye başladı. Vergi politikasını anlamak için yüz milyonlarca Amerikalının verilerini kürekle karıştırmanıza gerek yok ; on bin kişiyle yapılacak bir anket yeterli olacaktır. Chetty ve ekibi doğal olarak cesaretlerini kırmıştı.

Ve sonunda, bilim adamları hatalarını anladılar. Chetty 3 , "Bu, daha büyük bir veriye dayanan basit bir çalışma değil " diye açıklıyor . Araştırmacılar kendilerine verilen veriler hakkında çok az soru sordular. Chetty, "Büyük veriler, anketlerde kullanılanlardan çok farklı yapılar kullanmanıza olanak tanır" diye ekliyor. "Örneğin, veri dağılımının coğrafyasına daha yakından bakabilirsiniz."

Başka bir deyişle, Chetty ve ekibi, yüz milyonlarca insan hakkındaki bilgilerle , irili ufaklı şehirler ve bölgeler için geçerli olan kalıpları belirlemeyi başardı.

her Amerikalının vergi kayıtlarını kullanarak ilk sonuçlarını sunduğunda konferans odasındaydım . Sosyologlar çalışmalarında gözlemlere yönelirler: kaç tane öğeye sahiptirler. Bir sosyolog 800 kişilik bir anketle çalışsa , "Sekiz yüz gözlemimiz var" der . 70 kişiyle bir laboratuvar deneyi yapıyorsa "Yetmiş gözlemimiz var" diyecektir.

Chetty, "1,2 milyar gözlemimiz var" dedi. Seyirci gergin bir şekilde kıkırdadı.

Ve Chetty ve ortak yazarları, önce bir konferans salonunda, ardından bir dizi makaleyle bize Amerikan toplumu hakkında önemli yeni bulgular göstermeye başladılar.

Şu soruyu düşünün: Amerika büyük fırsatlar ülkesi mi? Ailen zengin değilse bir servet kazanma şansın var mı ?

Bu soruyu cevaplamanın geleneksel yolu, temsili bir Amerikalı örneğine bakmak ve bunu diğer ülkelerden benzer istatistiklerle karşılaştırmaktır.

İşte fırsat eşitliğine ilişkin farklı ülkeler için veriler . Şu soru soruldu: Ülkedeki en fakir insanların %20'sinde yer alan bir ebeveyni olan bir kişinin, en yüksek gelirli insanların %20'sinde olma olasılığı nedir ?

Yoksul ebeveynleri olan bir kişinin zengin olma şansı (seçilen ülkeler)

Amerika Birleşik Devletleri

7.5

Büyük Britanya

9.0

Danimarka

11.7

Kanada

13.5

Gördüğünüz gibi ABD en yüksek puana sahip değil .

Ancak bu basit analiz, ayrıntılardan yoksundur. Chetty'nin ekibi bölgeye göre veri aradı ve zengin olma şansının ülkenin hangi bölgesinde doğduğunuza bağlı olarak büyük ölçüde değiştiğini buldu .

Yoksul ebeveynleri olan bir kişinin zengin olma şansı (ABD bölgelerine göre)

12,9

10,5

7,5

6,5

4,4

San Jose, Kaliforniya Washington İlçe

ABD ortalaması

Şikago, İllinois

Charlotte, Kuzey Karolina

Amerika Birleşik Devletleri'nin bazı bölgelerinde, fakir bir çocuğun başarılı olma şansı dünyadaki herhangi bir gelişmiş ülkeninkine eşittir. ABD'nin diğer bölgelerinde, yoksul bir çocuğun zengin olma olasılığı dünyanın herhangi bir ülkesinde olduğundan daha düşüktür.

Bu sonuçlar, Charlotte ve San Jose'den sadece birkaç kişiyi içeren küçük bir anketten asla gelmezdi. Doğal olarak bu, Chetty'nin ekibinin yaptığı türden bölgelere göre dökümü engelleyebilirdi .

coğrafi bölünmeyi daha da hassaslaştırmayı başardılar . Ülkedeki her Amerikalı hakkında çok büyük bir veriye sahip olduklarından , şehirden şehre göç eden küçük insan gruplarını bile hesaba katmayı başardılar. Ve bunun New York'tan Los Angeles'a, Milwaukee'den Atlanta'ya, San Jose'den Charlotte'a taşınanların geleceğini nasıl etkileyebileceğini anlayabildik . Bu onların sadece korelasyonu değil, sebep ve sonucu test etmelerini sağladı (bu kavramlar arasındaki farklar bir sonraki bölümde tartışılacaktır). Ve evet, oluşum yıllarında "doğru" şehre taşınmanın nihai sonuç üzerinde önemli bir etkisi oldu.

Peki Amerika bir "fırsatlar ülkesi " mi?

Cevap: ne evet ne de hayır. Bazı bölgeler var, bazıları yok.

Yazarların yazdığı gibi, "Birleşik Devletler en iyi şekilde, bazıları nesiller arası yüksek düzeyde hareketliliğe sahip bir 'fırsatlar ülkesi' olan ve diğerleri yalnızca az sayıda çocuğun yoksulluktan kurtulduğu bir toplumlar toplamı olarak tanımlanabilir . . "

Peki, Amerika Birleşik Devletleri'nin gelir hareketliliğinin yüksek olduğu bölgeleri ne olacak? Fakir bir çocuğun daha iyi bir yaşam sürmesine izin vererek ülkenin bazı bölgelerini daha iyi yapan nedir ? Eğitime daha fazla para harcanan bölgeler daha fazla şans sunar. Daha fazla dindar nüfusa ve daha düşük suç oranlarına sahip yerlerde, çocukların yoksulluktan kurtulmak için daha fazla fırsatı var. Ancak büyük siyah nüfusa sahip bölgeler bu şansı azaltır. İlginç bir şekilde, bu sadece siyahi çocuklar için değil, orada yaşayan beyazlar için de geçerli. Çok sayıda bekar annenin olduğu yerlerde durum daha kötü. Orada, bu etki sadece bekar annelerin çocuklarını değil, aynı zamanda tam ailelerde büyüyen akranlarını da etkiler. Elde edilen sonuçlardan bazıları, çocuğun çevresinin, akranlarının şüphesiz önemine tanıklık ediyor. Eğer arkadaşları zor bir aile geçmişine ve sınırlı fırsatlara sahipse, yoksulluktan kurtulmak için daha çok mücadele etmesi gerekecektir.

Veriler bize, ABD'nin belirli bölgelerinin çocuklara yoksulluktan kurtulma konusunda daha iyi bir şans sağladığını söylüyor. Ve insanların "tırpanlı yaşlı kadın" 4 ile tanışmaktan kaçınma olasılığı daha yüksek olan alanlar hangileridir ?

Ölümün herkesi eşitlediğini düşünmeyi tercih ediyoruz. Kimse bundan kaçamaz - ne bir dilenci, ne bir kral, ne evsiz, ne Mark Zuckerberg. Herkes ölecek.

Ama zenginler ölümden kaçamıyorlarsa, en azından gelişini erteleyebilirler. En tepedeki % 1'deki Amerikalı kadınlar, en alttaki %1'deki Amerikalı kadınlardan ortalama 10 yıl daha uzun yaşıyor. Erkeklerde ise bu fark 15 yıla ulaşıyor.

Sonuçlar ABD'nin bölgeleri arasında nasıl farklılık gösteriyor? Yaşam beklentiniz yaşadığınız yere bağlı mı? Bu veriler zengin ve fakir için farklılık gösteriyor mu ? Raj Chetty'nin ekibi , yine veri miktarını artırarak ve coğrafyaya göre ayrıştırarak bu soruların yanıtlarını buldu.

İlginç bir şekilde, varlıklı Amerikalıların ortalama yaşam süresi yaşadıkları yerden neredeyse bağımsız. Fazla paranız varsa, bir kadın olarak yaklaşık 89 yıl, bir erkekseniz yaklaşık 87 yıl yaşamayı bekleyebilirsiniz . Her yerde zengin insanlar sağlıklı alışkanlıklar geliştirmek için çabalıyor. Ortalama olarak , daha fazla egzersiz yaparlar, daha iyi beslenirler, daha az sigara içerler ve obez olma olasılıkları daha düşüktür. Zenginler koşu bandını, organik avokadoları , yoga derslerini karşılayabilir . Ve hepsini Amerika'nın herhangi bir yerinden satın alabilirler.

Yoksulların farklı bir hikayesi var. En fakir Amerikalıların yaşam beklentisi, yaşadıkları yere göre büyük ölçüde değişir. Hatta uygun bir yerde yaşarsanız, bir fakirin ömrünü beş yıl uzatabilirsiniz.

Peki neden bazı yerlerde fakirler çok daha uzun yaşıyor? Bu şehirlerde neler var?

İşte şehrin dört özelliği. Bunlardan üçü , yoksulların yaşam beklentisiyle ilişkili değil , ancak biri var. Bakalım hangisi olduğunu tahmin edebilecek misin ?

Fakir bir kişinin belirli bir şehirde daha uzun yaşamasını sağlayan nedir?

Şehrin sakinleri çok daha dindar.

Şehir, düşük kirlilik seviyelerine sahiptir.

Şehirde yaşayanların yüksek bir yüzdesi sağlık sigortasına sahiptir .

Şehirde birçok zengin insan yaşıyor.

İlk üçü -din, çevre ve sağlık sigortası- yoksulların yaşam beklentisiyle ilişkili değil . Chetty ve diğerlerine göre can alıcı değişken, şehirde yaşayan varlıklı insanların sayısıdır. Ne kadar çok olursa, fakir o kadar uzun yaşar. Örneğin, New York'ta Detroit'tekinden çok daha uzun yaşıyorlar.

Zenginlerin varlığı, yoksulların ömrünün uzun olmasında neden bu kadar güçlü bir faktördür? Tartışılabilecek hipotezlerden biri, çalışmanın yazarlarından biri ve danışmanlarımdan biri olan David Cutler tarafından öne sürüldü. Nedeni farklı davranışlar olabilir.

Alışkanlıkların bulaşıcı olduğunu gösteren çok sayıda araştırma vardır 5 . Zenginlerin yanında yaşayan fakirler, onlardan bir takım alışkanlıklar öğrenebilirler. Bazıları - örneğin, acınası kelime dağarcığı - sağlık üzerinde bir etkiye sahip olamaz. Ancak beden eğitimi gibi diğerleri olumlu bir etki yaratabilir. Gerçekten de, zenginlerin yanında yaşayan fakir insanlar daha çok çalışır, daha az sigara içer ve obez olma ihtimalleri daha düşüktür.

Chetty'nin ekibi tarafından yapılan ve bir sığınak teftişinde bir veri kümesine erişim sağlayan bir çalışmayı beğendim . Bilim adamları neden bazı insanların vergi kaçırırken bazılarının kaçmadığını anladılar 6 . Bu fenomenin nedenlerini açıklamak biraz daha zordur.

Tek çocuklu serbest meslek sahipleri için devletten aldıkları para miktarını en üst düzeye çıkarmanın kolay bir yolu olduğunu bilmek çok önemlidir . Vergiye tabi gelirinizin yılda tam olarak 9.000 dolar olduğunu bildirirseniz , hükümet size çalışan yoksullar için bir tür hibe olan gelir vergisi indirimini yansıtan 1.377 dolarlık bir çek yazacaktır. Daha yüksek gelir bildirirseniz, vergileriniz hemen artacaktır. Daha küçük bir miktar bildirin ve vergi indirimi azalacaktır. 9.000 $ vergiye tabi gelir en iyi seçenektir.

Ve garip bir şekilde, bir çocuğu olan serbest meslek sahibi kişiler genellikle sadece 9.000 $ gelir bildiriyor .

miktarda gelir elde etmek için çalışma programlarını özel olarak ayarladılar mı ? Tabii ki değil. Bu tür işçiler rastgele test edildiğinde -çok nadir görülen bir olay- neredeyse her zaman ya 9.000 dolardan önemli ölçüde daha az ya da önemli ölçüde daha fazla kazandıkları ortaya çıktı .

Başka bir deyişle, tam olarak devletten kendilerine en büyük çeki sağlayacak miktarı kazanmış gibi davranarak vergilerle hile yaptılar.

Bu tür bir vergi kaçakçılığı ne kadar tipikti ve bir çocuğu olan serbest meslek sahipleri arasında bunu işleme olasılığı en yüksek olan kim? Chetty ve meslektaşlarına göre, bu tür dolandırıcılıkların yaygınlığı bölgelere göre büyük farklılıklar gösteriyordu . Bu kategorideki kişilerin %30'u Miami'de 9.000$ kazandığını bildirirken , Philadelphia'da yalnızca % 2 .

Aldatanlara bizi ne gösterecek? Bu tür dolandırıcıların en çok olduğu ve en az olduğu yerler hakkında ne biliniyor ? Postscript seviyelerini farklı şehirlerin diğer demografik bilgileriyle ilişkilendirebiliriz . Sonuç olarak, iki güçlü öngörücünün olduğu ortaya çıktı: Bölgede mesleği vergi avantajları sunan insanların yüksek bir konsantrasyonu ve vergi uzmanlarının yüksek bir konsantrasyonu.

Bu faktörler neyi gösteriyor? Chetty ve ekibi bir açıklama sağlar. Bu vergiden kaçınmanın ana katalizörü bilgiydi.

Serbest meslek sahibi tek çocuklu vergi mükelleflerinin çoğu, devletten en fazla parayı almak için sihirli sayının 9.000 dolar olduğunu bilmiyor . Ancak bilenlere yakın yaşarlarsa - komşular veya bir vergi danışmanı olabilir - bundan haberdar olma şansları çok daha yüksektir.

Aslında, Chetty'nin ekibi bilginin aldatmaya yol açtığına dair daha da fazla kanıt buldu. Amerikalılar, bu tür dolandırıcılığın düşük olduğu bir bölgeden oldukça yüksek seviyeye sahip bir bölgeye taşındığında , bu numarayı benimsediler. Yavaş yavaş, aldatma Amerika Birleşik Devletleri'nde bölgeden bölgeye yayıldı . Vergi kaçakçılığı bir virüs gibi bulaşıcıdır.

bu çalışmanın sonuçlarının ne kadar ilginç olduğunu düşünün . Vergi kaçakçılığı söz konusu olduğunda , en önemli şeyin kimin dürüst kimin sahtekar olduğunu belirlemek olmadığını gösterdi. En önemli şey, kimin nasıl hile yapacağını bilip kimin bilmediğini anlamak olacaktır.

Yani birisi size asla vergi kaçırmadığını söylediğinde, yalan söyleme ihtimali oldukça yüksektir. Chetty'nin araştırması, birçok kişinin nasıl yapılacağını bilseler hile yapacağını gösteriyor.

Vergilerinizde hile yapmak istiyorsanız (ama sizi önermiyorum), bir vergi uzmanının yanında yaşamalı veya size ne yapmanız gerektiğini söyleyebilecek vergi dolandırıcılarının komşusu olmalısınız.

olmasını
istiyorsanız nerede yaşamalısınız?

Büyük veri, dünyaya daha yakından bakma ve sorulan herhangi bir soruya gerçekten ayrıntılı bir yanıt alma fırsatı sunar - ve bu da.

En başarılı Amerikalıların nereden geldiğini merak ediyordum ve bir gün Wikipedia 7'ye göz atmaya karar verdim . (Bugün siz de yapabilirsiniz.)

Biraz programlamayla, Wikipedia editörlerinin yeterince görünür ve değerli buldukları 150.000'den fazla Amerikalıdan oluşan bir veri setine sahibim. bu veritabanına gir. Bilgiler doğum yeri ve tarihini, mesleği ve cinsiyeti içeriyordu. Bunu Sağlık Bakanlığı Ulusal İstatistik Merkezi tarafından toplanan bölgesel doğum verileriyle birleştirdim . Sonra, Amerika Birleşik Devletleri'nin her bir ilçesinde doğan insanların Vikipedi'ye girme şanslarını hesapladı.

Wikipedia'daki bahsin dikkate değer bir başarı olduğunu söyleyebilir miyiz? Tabii ki, bazı sınırlamalar var. Wikipedia editörleri, örnekleme yanlılığına neden olabilecek genç erkeklere daha fazla ilgi gösterdi . Ve bazı karakterler özellikle değerli kabul edilemez. Örneğin, Ted Bundy düzinelerce genç kadını öldürdüğü için Wikipedia'ya girdi. Sonuç olarak , sonuçlar üzerinde önemli bir etkisi olmayan suçluları ortadan kaldırmak zorunda kaldım .

Çalışmayı baby boomers (1946 ile 1964 arasında doğan insanlar) ile sınırlandırdım çünkü kendilerini ifade etmek için zamanları oldu -neredeyse bir ömür boyu. Yaklaşık 2.058 Amerika doğumlu baby boomer'dan biri Wikipedia'da listelenecek kadar öne çıkıyordu. Sanat veya eğlence alanındaki başarılar için yaklaşık %30, sporcular için %29, politikacılar için %9 ve bilimsel sonuçlar için %3.

Fark ettiğim ilk çarpıcı şey, en azından Wikipedia standartlarına göre, büyük başarı elde etme olasılığındaki devasa coğrafi değişkenlikti . Tanınmış bir figür olma şansınız büyük ölçüde nerede doğduğunuza bağlıdır.

Kaliforniya'da doğan yaklaşık 1.209 bebek patlamasından biri Wikipedia'ya girdi. Batı Virginia yerlileri ise 4496 baby boomer'dan biri var. İlçelere göre ayrıldığında, sonuçlar daha da etkileyici hale geliyor. Massachusetts, Suffolk County'de doğan 748 Baby Boomers'dan yaklaşık biri Wikipedia'ya girdi . Ve diğer bazı eyaletlerde başarı oranı 20 kat daha düşüktü.

Neden ülkenin bazı bölgelerinde güçlü insanları ortadan kaldırmanın çok daha kolay olduğu ortaya çıktı? En iyi ilçelere daha yakından baktım ve neredeyse hepsinin iki kategoriden birine girdiğini gördüm.

Birincisi, bu beni şaşırttı, bu bölgelerin çoğunun büyük kampüsleri var 8 . Neredeyse bir ilçe adını her gördüğümde ( örneğin Washtenaw, Michigan), orada klasik bir üniversite şehri olduğunu öğreniyorum , bu örnekte Ann Arbor. İlk %3, aşağıdaki gibi ilçeleri içerir: Madison, Wisconsin; Atina, Gürcistan; Kolombiya, Missouri; Berkeley, Kaliforniya ; Chapel Hill, Kuzey Karolina; Gaines Villas, Florida; Lexington, Kentucky; Ithaca, New York.

Nedenmiş? Wikipedia'daki bazı kişiler, profesörlerin ve lisansüstü öğrencilerinin oğulları ve kızları olabilir . İkincisi, kural olarak oldukça zekidir (büyük başarı mücadelesinde çok yararlı olabilecek bir özellik). Gerçekten de, bir bölgedeki çok sayıda üniversite mezunu, orada doğan insanların başarısının güçlü bir göstergesidir.

Ancak, büyük olasılıkla, başka bir şeyin de etkisi vardır - yeni olan her şeye erken aşinalık. Kolejlerin bulunduğu kasabalarda müzikle ilgili her şey özellikle iyi gelişiyor. Kampüsteki bir çocuk, benzersiz bir ortama girmek için daha fazla fırsata sahip olacaktır. konserler, sıra dışı radyo istasyonları dinleyin , hatta bağımsız plak mağazaları bile var. Ve sanatla sınırlı değil. Kampüsler, önde gelen iş adamlarının oldukça büyük bir yüzdesini sağlar. Belki de en yeni sanat ve fikirlere erken maruz kalmak, bir iş organize etme yeteneğinin gelişmesine katkıda bulunur.

Kampüslerin başarısı bölgelerle sınırlı değildir. Bunun ırkla da ilgisi var. Afrikalı Amerikalılar , özellikle iş ve bilim söz konusu olduğunda, Vikipedi'de (sporcular hariç) yeterince temsil edilmiyor . Kesinlikle ayrımcılıkla çok ilgisi var . Ancak, 1950 doğumlu nüfusun %84'ünün siyah olduğu küçük bir ilçede , neredeyse Wikipedia'da listelenen insan yüzdelerinin en yüksek olduğu ilçeler kadar yüksek profilli Baby Boomers var .

Alabama, Macon County'de doğan 13.000'den az Baby Boomers'tan 15'i Wikipedia'ya girdi - veya 852'de biri. Ve her biri siyah. Bunlardan 14'ü , Booker T. Washington tarafından kurulan tarihsel olarak siyahi bir kolej olan Tuskegee Üniversitesi'nin evi olan Tuskegee'dendi . Bu bölgeden gelen göçmenlerin listesi yargıçlar, yazarlar ve bilim adamlarını içeriyor. Aslında , Tuskegee'de doğan siyahi bir çocuğun spor dışında fark edilme olasılığı , ağırlıklı olarak beyaz bir üniversitenin olduğu bir şehirde doğan beyaz bir çocuk kadar muhtemeldi .

İkincisi, büyük olasılıkla, yerliler büyük bir şehrin içinde bulunduğu bölge. San Francisco, Los Angeles veya New York'ta doğanlar Wikipedia'ya girme şansı en yüksek olanlardır. (New York'un beş ilçesini bir arada gruplandırdım çünkü Wikipedia makalelerinin çoğu doğum bölgesini listelemiyor.)

Kentsel bölgeler genellikle başarı modelinin bir unsurudur. Gençken başarılı profesyonellerle birlikte olma fırsatına sahip olmanın değerini anlamak için New York, Boston ve Los Angeles'ı karşılaştırın . Bunlardan birincisi en üst düzeyde en çok gazeteci üretir, ikincisi en önde gelen bilim adamlarını ve üçüncüsü en ünlü aktörleri üretir. Unutmayın , orada doğmuş, oraya taşınmamış insanlardan bahsediyoruz . Ve bu, ebeveynleri aynı alanda mükemmel olan insanları çıkardıktan sonra bile geçerlidir.

Büyük üniversite kasabalarına sahip olmayan ilçeler, kentsel bölgelerden çok daha kötü performans gösteriyor .

Birçok Baby Boomers gibi ailem de kalabalık kaldırımlardan yeşil sokaklara taşındı - benim durumumda Manhattan'dan New Jersey, Bergen County'ye. Bu , en azından ünlü çocukları yetiştirmek açısından potansiyel olarak yanlış bir karardı. New York'ta doğan bir çocuğun Wikipedia'da olma olasılığı, Bergen County'de doğan bir çocuğa göre %80 daha fazladır. Bu sadece bir korelasyon ama harika fikirler etrafında büyümenin büyük bir arka bahçede yaşamaktan daha iyi olduğunu söyleyebilirsin.

Tüm bu insanların çocukluklarında nerede yaşadıkları hakkında daha fazla bilgim olsaydı, gözlemlenen etki daha da güçlü olabilirdi - sonuçta çoğu doğdukları eyalette büyümedi.

Verilere bakıldığında üniversite kampüslerinin ve büyük şehirlerin başarısı hayret verici. Ama daha derine indim ve daha sofistike ampirik analizler yaptım.

, Wikipedia'da bir kişinin adının güçlü bir tahmincisi haline gelen başka bir değişkenin varlığını hesaplamamı sağladı . Doğduğunuz ülkedeki göçmenlerin oranıyla ilgili. Başka bir ülkenin bir bölgesinde doğan vatandaşların yüzdesi ne kadar yüksekse , orada doğan bir çocuğun gözle görülür bir başarı elde etme olasılığı o kadar yüksektir . (İşte buradasın, Donald Trump!) Kentsel peyzaj ve üniversite mevcudiyeti açısından iki yer aynıysa , o zaman daha fazla göçmenin olduğu bir bölgeden daha seçkin Amerikalılar çıkacaktır. Neden?

Birçok ünlü isim göçmen çocuklarıydı. En ünlü 100 beyaz baby boomers'ın biyografilerinin kapsamlı bir incelemesini yaptım (Wikipedia verileriyle de çalışan MIT Pantheon projesine göre). Çoğu sanatçıydı. Oliver Stone, Sandra Bullock ve Julianne Moore da dahil olmak üzere en az 13 göçmen anneden doğdu . Bu rakam, bu dönem için ulusal ortalamanın üç katından fazladır . (Steve Jobs ve John Belushi de dahil olmak üzere birçoğunun babası göçmendir , ancak bu rakamların ulusal ortalamalarla karşılaştırılması zordur çünkü baba bilgileri her zaman doğum belgelerinde yer almaz.)

Peki ya başarıyı etkilemeyen değişkenler? Bulduğum bir tanesi oldukça şaşırtıcı : bir devlet eğitime ne kadar para harcarsa harcasın . Kentlerde yaşayanların benzer yüzdelere sahip olduğu eyaletlerde, eğitim harcamaları , orada büyüyen tanınmış yazarların, sanatçıların veya iş liderlerinin sayısıyla ilişkili değildir .

insanların üst orta sınıfa erişmesine izin verdiğini bulmaya çalıştığı çalışmalardan biriyle karşılaştırmak ilginç . Hangi alanların şöhret kazanmalarına yardımcı olduğunu bulmaya çalıştım . Sonuçlar çarpıcı biçimde farklı.

Yüksek eğitim maliyetleri, çocukların orta sınıfın üst kesimlerine ulaşmalarına yardımcı olur, ancak ünlü yazarlar , sanatçılar veya iş liderleri olmalarına hiçbir şekilde yardımcı olmaz. Kayda değer bir başarı elde edenlerin çoğu okuldan nefret etti ve hatta birkaçı okulu bıraktı.

Chetty'nin ekibinin, orta sınıfın zirvesine ulaşmasını istiyorsanız, New York'un bir çocuk yetiştirmek için en iyi yer olmadığını öğrendiğine göre. Ve araştırmam, zafere bir şans vermek istiyorsanız, buranın harika bir yer olduğunu gösterdi .

oluşturan faktörlere baktığınızda bölgeler arasındaki ciddi farklar anlam kazanmaya başlıyor. Birçok eyalet, başarının tüm temel bileşenlerini birleştirir. Boston'a geri dönelim. Çok sayıda üniversite, bu şehri yenilikçi fikirlerin buluşma noktası haline getiriyor. Bu bölge, gençler için büyük bir başarı örneği olan son derece başarılı birçok kişiye ev sahipliği yapmaktadır . Ve bu, çocukları bu dersleri kullanmaya zorlanan göçmenleri cezbediyor.

Peki ya alan bu niteliklerden hiçbirine sahip değilse ? Bu, kaderinde daha az süperstar "büyüteceği " anlamına mı geliyor? Gerekli değil. Başka bir yol daha var: son derece dar bir uzmanlaşma. Harika bir örnek, az sayıda "gelen " ve büyük üniversitelerin bulunduğu küçük bir kırsal alan olan Minnesota, Roseau County'dir . Burada doğan yaklaşık 740 kişiden biri kendini Wikipedia'da buldu. Sırları mı? Dokuz kişinin tamamı profesyonel hokey oyuncularıydı ve yerel okullarda ve kolejlerde hokey programlarının bulunması şüphesiz buna yardımcı oldu .

Yani, özellikle bir hokey yıldızı olmayı arzulamıyorsanız, ancak gelecekteki çocuklarınıza mümkün olan her avantajı vermek istiyorsanız, belki de Boston'a veya Tuskegee'ye taşınmalısınız? Onlara zarar vermez. Ama daha ciddi şeyler de var . Tipik olarak ekonomistler ve sosyologlar, yoksulluk ve suç gibi olumsuz sonuçlardan nasıl kaçınılacağına odaklanır . Ancak toplumun karşı karşıya olduğu büyük hedef, yalnızca geride kalanları ayağa kaldırmak değildir. Mümkün olduğu kadar çok insanın öne çıkmasına yardımcı olmak önemlidir. Yüzbinlerce Amerika'nın en ünlü insanının doğum yerlerini belirleme çabaları, göçü teşvik etmek, üniversiteleri desteklemek ve sanatı desteklemek gibi başlangıç stratejilerinden bazılarının oluşturulmasına yardımcı olabilir .

Genellikle ABD için verileri inceliyorum. Bu nedenle, coğrafi bilgilere yakından baktığımda , onu şehirlerimiz ve kasabalarımız için seçiyorum - Macon County, Alabama veya Roseau County, Minnesota gibi bölgeler. Ancak İnternet'ten gelen verilerin bir başka büyük (ve büyüyen) avantajı da benzer şekilde dünyanın her yerinden kolayca bilgi toplayabilmeniz ve ülkelerin nasıl ve hangi açılardan farklılık gösterdiğini görebilmenizdir. Ve verileri toplayan ve analiz eden veri bilimcileri , antropolojiye gizlice girme fırsatı elde eder .

Geçenlerde oldukça sıra dışı bir soru araştırdım: Dünyanın farklı ülkelerinde hamilelik nasıl ilerliyor? Hamile kadınlar için Google aramalarının sayısını kontrol ettim . Ve fark ettiğim ilk şey , kadınların şikayet ettiği fiziksel belirtilerdeki çarpıcı benzerlikti .

Arama sorgularında "hamile" kelimesiyle ne sıklıkta çeşitli semptomları birleştirdiğimizi analiz ettim . Örneğin, "hamilelik" ile birlikte ne sıklıkla "mide bulantısı", "sırt ağrısı" veya "kabızlık" için arama yaptınız ? Kanada ve Amerika Birleşik Devletleri'nde semptomlar çok benzerdi. İngiltere, Avustralya ve Hindistan gibi ülkelerde de aşağı yukarı aynıydı.

Görünüşe göre dünyanın her yerindeki hamile kadınlar aynı şeyi özlüyor. Amerika Birleşik Devletleri'nde Google en çok "Hamilelikte buz yemek istiyorum" kelimesini arar. Sonraki dört seçenek, tuzlu, tatlı, meyve ve baharatlı yiyecekler yeme isteğidir. Avustralya'da hamile kadınların hayalini kurduğu yiyeceklerin listesi pek farklı değil : tuz, tatlılar, çikolata, dondurma ve meyve . Peki ya Hindistan? Benzer hikaye: baharatlı yiyecekler, tatlılar, çikolata, tuz ve dondurma. Aslında, baktığım her ülkede istenen ilk beş yiyecek hemen hemen aynı.

, dünyanın hiçbir yerinde hamileliğin fiziksel hissini önemli ölçüde değiştiren hiçbir diyet veya çevre olmadığını göstermektedir .

Ancak hamileliği çevreleyen düşünceler oldukça değişkendir.

Hamile kadınların güvenle neler yapabileceğini sorarak başlayın. ABD'de en çok sorulan sorular: Hamile kadınlar "karides yiyebilir", "şarap içebilir", "kahve içebilir" veya "Tylenol alabilir" mi?

Bu endişeler söz konusu olduğunda, diğer ülkelerin ne Amerika Birleşik Devletleri ne de birbirleriyle çok az ortak noktası var. Şarap seçeneği Kanada, Avustralya ve Birleşik Krallık'ta ilk on içinde değil. Yeşil Kıta'daki sorunlar, çoğunlukla hamilelik sırasında süt ürünlerinin , özellikle de krem peynir kullanımıyla ilişkilidir . Ve nüfusun %30'unun internet kullandığı Nijerya'da en yaygın soru, hamile kadınların soğuk su içip içemeyeceğidir.

Bu endişeler gerçek mi? Duruma göre değişir. Hamile kadınların pastörize edilmemiş peynirden Listeria'ya yakalanma riskinin arttığına dair güçlü kanıtlar vardır . Çok fazla alkol içmenin çocuk üzerinde olumsuz bir etkisi olduğu tespit edilmiştir. Dünyanın bazı yerlerinde, bir anne soğuk su içtiğinde fetüsün zatürre olabileceğine inanılıyor - gerçi ben bu gerçeğin herhangi bir tıbbi teyidini bilmiyorum.

her birindeki farklı kaynaklardan gelen tükenmez bilgi akışından kaynaklanmaktadır : resmi bilimsel araştırma, bilimsele yakın araştırma, büyükanne hikayeleri ve sıradan gevezelikler. Kadınların nelere daha çok dikkat etmeleri gerektiğini ve buna bağlı olarak Google'a ne soracaklarını belirlemesi zor .

"Nasıl… hamilelik sırasında" gibi popüler sorgulara baktığımızda, ülkeler arasında net bir fark görüyoruz . Amerika Birleşik Devletleri, Avustralya ve Kanada'da soruların çoğu şu metinle birliktedir: " Hamilelik sırasında çatlaklar nasıl önlenir? " Ve Gana, Hindistan ve Nijerya'da çatlakları önleme ilk beşte bile değil . Orada, kadınlar seks yapmak veya uyumak konusunda daha fazla endişe duyma eğilimindedir.

"Nasıl... hamilelik sırasında" gibi en çok aranan 5 arama

Amerika Birleşik Devletleri

Hindistan

avustralya _

İngiltere _ _

Nijerya

Güney Afrika

Çatlakları önleyin _

Uyumak

Çatlakları önleyin

Kilo vermek

seks yap

seks yap

Kilo vermek

seks yap

Kilo vermek

Çatlakları önleyin _

Kilo vermek

Kilo vermek

seks yap

seks yapmak

Çatlaklardan kaçının _

Çatlaklardan kaçının _

aşka iyi bak

Çatlakları önleyin _

Çatlaklardan kaçının _

Seks

Uyumak

Uyumak

sağlığını koru _

Uyumak

Fit kalmak

Dikkat etmek

seks yap

seks yap

Bulantı ile başa çıkmak

Bulantı ile başa çıkmak

"Hamile bir kadın yapabilir mi..." ile başlayan ilk beş arama

Amerika Birleşik Devletleri

küçük karides var

Şarap içmek

Kahve içmek için

Anne "Tay lenol" al

suşi ye

büyük britanya

büyük karides var

Bir şeyin polisi var çok emiyor

peynirli kek al

zarella var

Onez var

avustralya _

krem peynir var

büyük karides var

pastırma ye

ekşi krema var

Beyaz peynir var

Nijerya

soğuk su iç

Şarap içmek

Kahve içmek için

seks yap

bitkiler ) vardır.

Singapur

yeşil çay iç

bebek var

aptallık var

Kahve içmek için

biz var

ispanya

pate var

jamon var

Parasetamol (ağrı kesici) alın

ton balığı ye

güneşlenmek

Almanya

Uçmak

salam var

saunayı ziyaret et

bal var

zarella var

Brezilya

saç boyamak

Dipirona (ağrı kesici ) alın

paraceta mol almak

bisiklet sürmek

Uçmak

, farklı veri kümelerine bakılarak dünyanın farklı yerlerinde sağlık ve kültür hakkında çok daha fazla şey öğrenilebilir . Ancak ön analizim , iş biyolojimizin ötesine geçmeye geldiğinde , büyük verilerin bize insanların düşündüğümüzden daha az güçlü olduğunu göstereceğini gösteriyor.

HAYATIN SAAT VE DAKİKALARINI NASIL DOLDURUYORUZ

İlgi Alanları Tecavüz, Aşırı Şiddet ve Beethoven Olan Genç Bir Adamın Maceraları ."

Stanley Kubrick'in tartışmalı filmi Otomatik Portakal'ın reklamı gibiydi. Senaryoda, siz hayali bir genç kahramansınız, Alex DeLarge, korkutucu bir tarafsızlıkla, şok edici şiddet eylemleri gerçekleştiriyorsunuz. Filmin en ünlü sahnelerinden birinde "Singing in the Rain" şarkısını avaz avaz söylerken bir kadına tecavüz etti.

Neredeyse anında, taklitçilerin raporları vardı. Nitekim bir grup erkek, bu şarkıyı söylerken 17 yaşındaki bir kıza tecavüz etti. Filmin birçok Avrupa ülkesinde gösterimi yasaklandı ve daha şok edici sahnelerden bazıları Amerikan versiyonundan kaldırıldı.

Aslında, insanların gerçek hayatta Art 9'u nasıl taklit ettiklerine dair pek çok örnek var - erkekler ekranda gördükleri şey tarafından basitçe büyülenmiş gibi göründüğünde . Haydutlarla ilgili "Renkler" filminin gösteriminin ardından ciddi bir çatışma çıktı. "New Jack City" filminin gösteriminin ardından kitlesel isyanlar çıktı .

Belki de en rahatsız edici olanı, Para Treni filminin vizyona girmesinden dört gün sonra, erkekler bir metro bilet gişesini ateşe vermek için çakmak sıvısı kullandılar ve neredeyse tam olarak filmde görülen bir sahneyi taklit ettiler. Kurgusal ve gerçek kundaklama arasındaki tek fark, filmde kasiyerin kaçması, gerçek hayatta ise yanarak ölmesidir.

Şiddet sahneleri olan bir filmi izleyen insanların, gördükleri sahnelerin hiçbirini birebir taklit etmeden bile daha fazla öfke ve düşmanlık sergilediklerine dair psikolojik deneylerden elde edilen bazı kanıtlar da vardır10 .

Başka bir deyişle, hikayeler ve deneyler, şiddet içeren filmlerin saldırgan davranışları kışkırttığını gösteriyor. Ama etki ne kadar büyük? Her 10 yılda bir veya iki cinayetten mi yoksa her yıl yüzlerce cinayetten mi bahsediyoruz ? Hikayeler ve deneyler bu soruyu cevaplayamaz.

Büyük verilerin yardımcı olup olmayacağını görmek için iki ekonomist -Gordon Dahl ve Stefano della Vigna- 1995'ten 2004'e kadar üç büyük veri setini birleştirdi : FBI'ın saatlik suç rakamları, gişe rakamları ve çocuklar-in-mind.com'daki tüm filmlerdeki şiddet. .

Kullandıkları bilgiler kapsamlıydı ; Amerika Birleşik Devletleri'nde her saat başı işlenen her film ve her suç . Bu çok önemli kanıtlar sağlayabilir.

Araştırmalarının anahtarı, bir hafta sonu Hannibal veya Dawn of the Dead gibi en popüler filmin çok şiddetli olması ve diğer hafta sonlarında Runaway Bride veya Toy Story gibi olumlu olmasıydı .

, şiddet içeren filmin gösterildiği günlerde tam olarak kaç cinayet, tecavüz ve saldırı olduğunu söyleyebilir ve bu rakamları , komik, sakin filmin gösterildiği hafta sonu boyunca meydana gelen cinayet, tecavüz ve saldırıların sayısıyla karşılaştırabilir.

Peki ne buldular? Bazı deneycilerin öne sürdüğü gibi şiddet içeren filmlerden sonra suç arttı mı ? Yoksa aynı mı kaldı?

, popüler bir şiddet filmi gösterildikten
sonra suçun
azaldığını keşfettiler.

yanılmıyorsun Hafta sonları, popüler bir şiddet filmi gösterimdeyken ve milyonlarca Amerikalı insanların başka insanları öldürmesini izlerken, suç sayısı önemli ölçüde azaldı.

Bu garip ve beklenmedik sonucu aldığınızda ilk düşünceniz "Neyi yanlış yaptım ?" olacaktır. Her deneyci her şeyi dikkatlice kontrol etti. Hatalar yok. İkinci düşünce: “ Bu sonuçları açıklayan herhangi bir değişken var mı?” Bilim adamları, sonuçların yılın zamanından etkilenip etkilenmediğini kontrol ettiler. HAYIR. Belki de önemli olduğunu düşünerek hava durumu hakkında veri topladılar. Hayır ve onun bununla hiçbir ilgisi yok.

Dahl, "Yaptığımız her varsayımı, her şeyi kontrol ettik," dedi. "Ve herhangi bir hata bulamadılar."

Dedikodulara, laboratuar deneylerine ve sonuçlar ne kadar beklenmedik olursa olsun , filmlerde şiddet gösterilmesi suç oranlarında keskin bir düşüşe neden oldu. Bu nasıl olabilir?

Bir ipucu bulmak için Dahl ve della Vigna, büyük verileri daha yakından analiz ederek kullanmaya karar verdiler. Geleneksel olarak, anket sonuçları bilgileri yıllık olarak veya en iyi ihtimalle aylık olarak sağlar. Biraz şansla, hafta sonları veri almak mümkün olacaktır . Şimdi karşılaştırın: küçük örnekler (anketler) yerine karmaşık veri kümeleri kullanarak saatlik ve hatta dakika dakika grafikler oluşturabildik . Bu, insan davranışı hakkında çok daha fazla şey öğrenmemizi sağladı.

Bazen, hayati bir bilgi değilse, zamansal dalgalanmalar komik bile olabilir. Kanada , Edmonton'da bulunan bir kamu hizmeti şirketi olan EPCOR , 2010 ABD-Kanada altın madalyalı hokey maçında ( Kanadalıların %80'i tarafından izlendiği tahmin ediliyor ) su tüketimi hakkında dakika dakika veri yayınladı . İstatistikler bize, her dönemin bitiminden kısa bir süre sonra su tüketiminin arttığını gösteriyor; Edmonton'daki tuvaletler açıkça tam kapasite çalışıyordu.

Hatta dakika dakika Google arama verileri elde edilebilir12 ve bazı ilginç modeller ortaya çıkacaktır. Örneğin, "oyunun engellemesini kaldır" aramaları hafta içi sabah 8'de hızla fırlıyor ve saat 15.00'te zirveye ulaşıyor ; şüphesiz okulların , öğrencilerin cep telefonlarını yasaklamadan kendi tesislerinde mobil oyunlara erişimi engellemeye çalışmasına bir yanıt .

", "dua" ve "haberler" kelimelerini aramalar sabah 5:30 civarında zirve yapıyor; bu, çoğu insanın benden çok daha erken uyandığını kanıtlıyor . "İntihar" kelimesi için yapılan aramaların sayısı 12:36'da zirveye ulaşırken, 09 :00'da düşüyor. Bu , çoğu insanın sabahları benden çok daha az mutsuz olduğunu kanıtlıyor .

sabahın 2'si ile 4'ü arasındaki zamanın varoluşun ana sorularını çözmek için en iyi zaman olmadığını gösteriyor . Bilincin anlamı nedir? Özgür irade var mı? diğer gezegenlerde yaşam var mı? Bu soruların gece geç saatlerde popüler olması , kısmen esrar kullanımının bir sonucu olabilir. " Bir eklem nasıl yenilir?" Metni ile yapılan aramaların zirvesi 1 ile 2 arasında gerçekleşir .

Dahl ve della Vigna, büyük bir veri setiyle, filmlerin gösterildiği hafta sonları suç oranının saat başı nasıl değiştiğini anlayabildiler. Şiddet içeren filmlerin gösterildiği hafta sonlarında diğer hafta sonlarına göre suç oranındaki düşüşün akşamın erken saatlerinde başladığını buldular . Başka bir deyişle, şiddet sahneleri başlayana kadar, insanlar sadece sinemalara yürürken suç azalıyordu .

Nedenini tahmin edebilir misin? Her şeyden önce, aynı eski filme gitme olasılığı en yüksek olanları düşünün . Bunlar genç -özellikle genç- saldırgan adamlar.

suçların genellikle nerede işlendiğini düşünmelisiniz . Bu nadiren sinemada olur. 2012'de Colorado'da bir sinema salonunda çekim olduğu zamanlar da dahil olmak üzere istisnalar olmuştur . Ama genelde erkekler sinemaya silahsız gider ve sessizce otururlar.

Agresif genç adamlara Hannibal'i görme şansı verin, sinemaya gitsinler. Agresif genç erkeklere Runaway Bride'ı izleme fırsatı verirseniz reddederler . Bunun yerine, suç oranının potansiyel olarak daha yüksek olduğu bir bara, kulübe veya bilardo salonuna gidebilirler .

Şiddet içeren filmler, şiddet yanlısı insanları sokaklardan uzak tutar.

Bulmaca çözüldü mü? Tam olarak değil. İstatistikler başka bir tuhaflık gösterdi. Belirtilen etki, filmlerin gösterime girmesiyle başlamış, ancak sinemanın kapanmasıyla kasetlerin bitmesiyle bitmemiştir. O akşamlarda suç daha düşüktü ve daha sonra - gece yarısından sabah 6'ya kadar.

Gençler sinemadayken azaldıysa da, onlar oradan ayrıldıktan ve artık hiçbir şeyle meşgul olmayınca yoğunlaşmasını ne engelledi? Ne de olsa, deneylerin gösterdiği gibi insanları daha öfkeli ve saldırgan yapan şiddetli bir film izlemişler .

Bu fenomen için herhangi bir açıklama bulabildiniz mi? Uzun müzakerelerden sonra, suç uzmanları olan müfettişler bir aydınlanma yaşadılar. Alkolün başlıca suç nedenlerinden biri olduğunu biliyorlardı 13 . Ek olarak, Amerika Birleşik Devletleri'ndeki sinema salonlarına bir kereden fazla gitmişlerdi , bu yüzden orada alkollü içeceklerin pratikte satılmadığını biliyorlardı. Nitekim bilim adamları, şiddet içeren filmlerden sonra akşam saatlerinde alkolle ilgili suçların sayısının azaldığını bulmuşlardır .

Elbette, Dahl ve della Vigna'nın araştırmasının belirli sınırlamaları vardı. Örneğin bilim adamları, suç oranlarındaki düşüşün ne kadar sürebileceğini anlamak için uzun vadeli etkiyi test edemediler . Belki de bir dizi şiddet içeren filme sürekli olarak maruz kalmak, sonunda daha fazla şiddete yol açar. Ancak yaptıkları çalışma, deneylerin ana teması olan bu tür bantların doğrudan etkisini değerlendiriyor . Muhtemelen şiddet içeren bir film bazı insanları etkiler ve onları olağanüstü derecede öfkeli ve saldırgan yapar . Ancak, insanları tam olarak neyin olumsuz etkilediğini biliyor musunuz ? Diğer potansiyel olarak şiddet içeren kişilerle iletişim . Ve sarhoşluk [26].

uçsuz bucaksız veri dağını analiz etmeye başlayana kadar var olmadığı anlaşılıyor .

Bilgiyi daha ayrıntılı olarak ele almaya başladığımızda , önemli bir nokta daha netleşir: dünya karmaşıktır. Bugün attığımız adımların çoğu öngörülemeyen uzun vadeli sonuçları olabilir . Fikirler bazen yavaş bazen de katlanarak virüsler gibi yayılır. İnsanlar uyaranlara en öngörülemeyen şekillerde tepki verirler.

Bu bağlantılar ve ilişkiler, bu patlamalar ve bozulmalar, küçük araştırmalar veya diğer geleneksel veri toplama ve işleme yöntemleriyle izlenemez . Dünya, az miktarda bilginin yardımıyla anlaşılamayacak kadar karmaşık ve mecazi .

ÇİFTLERİMİZ

Haziran 2009'da David "Big Papi" Ortiz, eserine zevkle baktı. Son on beş yılda Boston, Dominik doğumlu iri yarı adamına dostça bir gülümsemeyle ve dişlerinin arasında bir boşlukla aşık olmuştu [27].

Beş All-Star maçında oynadı, MVP ödülünü kazandı [28]ve 86 yıl sonra ilk kez Boston'ın şampiyonluğu kazanmasına yardımcı oldu. Ancak 2008'de 32 yaşına geldiğinde başarılı kariyeri açıkça sona eriyordu. Vuruş ortalaması 68 sayı, taban yüzdesi 76 ve vuruş yüzdesi 114 idi. 2009 sezonunun başında Ortiz'in sonuçları daha da düştü.

Boston Red Sox'un hevesli hayranı Bill Simmons, 2009 sezonunun ilk aylarında olanları şöyle anlatıyor: 16 “Açıkçası, David Ortiz artık oyunda farklı değil... NBA'in merkezi ve genç kızların hayali: geçti. Sporseverler gözlerine ve Simmons'ın gözlerine güveniyor: Ortis bitti. Aslında Simmons, Ortiz'in yakında yedek kulübesinde olacağını ve hatta spordan emekli olacağını tahmin etti.

Ortiz gerçekten bitti mi? 2009'da Sox'un genel müdürü olsaydınız, onu kovar mıydınız ? Ve daha genel olarak, bir beyzbol oyuncusunun gelecekte ne kadar başarılı olacağını nasıl tahmin edebiliriz ? Ve daha da genel olarak: İnsanların gelecekte ne yapacaklarını tahmin etmek için büyük verileri nasıl kullanabiliriz?

Sizi veri biliminin vahşi doğasına götürecek teori şudur: sabermetristlerin (beyzbol çalışmak için verileri kullananlar ) ne yaptığına bakın ve bunu veri toplama ve analiz biliminin diğer alanlarına genişletin. Beyzbol, neredeyse her şey hakkında büyük miktarda veri üreten ilk alanlardan biriydi. Ve hayatlarını bu verilerin anlamını anlamaya adamaya hazır olan koca bir akıllı insanlar ordusu vardı . Artık neredeyse her parametre kapsamlı bir şekilde incelenmiştir . Beyzbol, diğer her şeyi öğrenmek daha kolay hale geldikten sonra yolu açtı .

Bir oyuncunun geleceğini tahmin etmenin en kolay yolu, şimdi oynadığı gibi oynayıp oynamayacağını tahmin etmektir. Bir adam son bir buçuk yıldır elinden gelenin en iyisini yaptıysa , gelecek bir buçuk yılda da aynı çabayı göstereceğini varsayabilirsiniz .

Bu metodolojiyi izlerseniz, Boston, David Ortiz'e veda etmeliydi.

Ancak, daha alakalı bilgiler var. 1980'lerde, birçok kişi tarafından sabermetrics'in kurucusu olarak kabul edilen Bill James, yaşın önemini vurguladı. Beyzbol oyuncularının zirveye oldukça erken, 27 yaş civarında ulaştığını buldu . Ancak takımlar, aktivitelerinde daha sonra meydana gelen düşüşü görmezden gelme ve yaşlanan oyuncular için fazla ödeme yapma eğilimindedir.

Bu daha gelişmiş puanlama yöntemine göre Sox, David Ortiz'i çıkarmalıydı.

Ancak yaşla olan bağlantı nedeniyle bir şeyi gözden kaçırabilirsiniz. Tüm oyuncuların kariyerleri aynı değildir. Bazıları 23'te, diğerleri 32'de bitebilir. Kısa beyzbol oyuncuları uzun boylu beyzbol oyuncularından farklı yaşlanır, şişman kariyerler sıska olanlardan farklıdır. Beyzbol istatistikçileri, her biri farklı şekilde yaşlanan farklı tipte oyuncular olduğunu keşfettiler . Bu dağılım da Ortiz'in lehine değil: "ağır vurucular" ortalama olarak 18'den önce zirve yapıyor ve 30'dan kısa bir süre sonra emekli oluyor.

Sox, onun son performanslarını, yaşını ve fiziksel özelliklerini değerlendirirse, yönetim şüphesiz David Ortiz ile olan sözleşmesini feshedmelidir.

2003 yılında istatistikçi Nate Silver , oyuncu performansını tahmin etmek için PECOTA adını verdiği yeni bir model tanıttı . O en iyisiydi - ve en havalısı. Silver çift beyzbolcular arıyordu. İşte nasıl çalıştığı. Nate , tüm zamanların en büyük Beyzbol Ligi oyuncularından oluşan bir veritabanı oluşturdu ; 18.000'den fazla kişi. Toplanabilecek tüm bilgileri içeriyordu : boy, yaş, vücut yapısı, takımdaki konumu, ev koşusu sayısı, ortalama koşu oranı ve kariyerin her yılı için grev sayısı. Şimdi iş , kariyerleri Ortiz'inkine en çok benzeyen 20 oyuncu bulma meselesiydi - onun gibi 24, 25, 26, 27, 28, 29, 30, 31, 32 ve 33 yaşlarında oynayan oyuncular. Başka bir deyişle, ikizleri bulun . Ve sonra kariyerlerinin gelecekte nasıl geliştiğini görün.

detaya inmenin kullanımına başka bir örnektir . Belirli bir kişiye en çok benzeyen küçük bir insan grubuna odaklanır . Ve herhangi bir ayrıntı gibi, elinizde ne kadar çok veri varsa sonuç o kadar doğru olur. Ortiz 19'un ikizlerinin, Ortiz'in geleceği için tamamen farklı bir tahmin verdiği ortaya çıktı. Bunların arasında Jorge Posada ve Jim Tome da vardı. Bu adamlar kariyerlerinde biraz yavaş bir başlangıç yaptılar ve bunu performanslarında inanılmaz artışlar izledi . 30 yaş civarında dünya standartlarında bir seviyeye ulaştılar ve 30'dan sonraki ilk yıllarda yavaş yavaş pes ettiler.

O zaman Silver, çiftlerinin kaderine dayanarak Ortiz'in kariyerinin nasıl sonuçlanacağını tahmin etti. Güçlerini geri kazandıklarını gördü . Kadın hayranlarla ilgili olarak Simmons haklı olabilirdi. Ancak Ortiz'in ikizlerine gelince , burada her şey farklı - geçtiler ama sonra geri döndüler.

, bir beyzbol oyuncusunun performansını tahmin etmek için şimdiye kadar kullanılan en iyi tekniktir . Ona göre Sox katlanmak zorundaydı. Kulüp gerçekten omuz kesmedi. Ve 2010'da Ortiz'in vuruş ortalaması 270'e yükseldi. 32 home run yaptı ve All-Star Takımına seçildi. Ve sonra arka arkaya dört yıl daha girdi.

2013'te, 37 yaşındaki geleneksel smaçör pozisyonunda oynayan Ortiz, Dünya Serisi 4-2'de Boston, St. Louis'i yenerken .688'i vurdu .

Ortiz, Dünya Serisinin MVP'si (En Değerli Oyuncu) seçildi [29].

Nate Silver'ın oyuncu performansını değerlendirme yaklaşımıyla ilgili bir makaleyi okumayı bitirir bitirmez, benim de bir görsel ikizim olabilir mi diye merak etmeye başladım.

Böyle arayışlar sadece sporda değil birçok alanda umut verici. İlgi alanlarımı paylaşan birini bulabilir miyim ? Belki bana en çok benzeyen birini bulsaydım, birlikte vakit geçirebilirdik. Belki beğenebileceğim restoranları bilirdi. Belki de beni bilmediğim bir şeyle tanıştırabilir ve bu ilgimi çekerdi.

İkiz arama, kişilik özelliklerine göre bile mümkündür. Ve herhangi bir ayrıntıda olduğu gibi, elinizde ne kadar çok veri varsa benzerlik de o kadar güçlenir. Diyelim ki on kişilik bir veri kümesinde bir ikiz arıyorum . Kitaplara olan ilgimi paylaşan birini bulabilirim . Diyelim ki binlerce insandan oluşan bir veri kümesinde bir görsel ikiz arıyorum . Benim gibi popüler sağlık kitaplarını seven birini bulabilirim. Ama diyelim ki yüz milyonlarca insandan oluşan bir veri kümesinde bir ikiz arıyorum. O zaman gerçekten bana benzeyen birini bulabilirim.

Bir keresinde sosyal medyada bir görsel ikiz aradım . Tüm Twitter profillerini kullanarak, benimle en çok ortak ilgi alanlarına sahip insanları aradım .

hesabımdaki bilgilere dayanarak ilgi alanlarım hakkında çok şey söyleyebilirsiniz . Genel olarak, spor, politika, komedi, bilim ve karanlık Yahudi şarkıcılara olan tutkumu paylaşan yaklaşık 250 kişiyi takip ediyorum.

Peki evrende benim gibi 250 hesabı takip eden var mı, twitter ikizim? Tabii ki değil. İkizler bizimle aynı değiller, sadece bize benziyorlar. Ve en az aynı 200 hesaba abone olan kimse yok. Hatta 150.

Ancak sonunda 250 takipçimin 100'ünde bir hesap buldum: Country Music Radio Today. Gerçekten mi? Country Music Radio Today'in , aynı şekilde yanıt vermeleri umuduyla 750.000 Twitter profiline abone olan (artık yok olan) bir bot olduğu ortaya çıktı .

Bu sonuçtan hoşlanacağından şüphelendiğim eski bir kız arkadaşım var . Bir keresinde benim bir insandan çok bir robota benzediğimi söylemişti.

Ama şaka bir yana! İkizimin bir bot olması önemli bir sonuca varmamızı sağlıyor. Benzerleri aramada gerçekten doğru olmak için, sadece sizinle aynı şeyi seven birini bulmaya çalışmamalısınız. Sevmediğiniz aynı şeyi sevmeyen birini aramalısınız.

İlgi alanlarım sadece takip ettiğim hesaplardan değil, seçmediğim hesaplardan da belli oluyor. Spor, politika, komedi ve bilimle ilgileniyorum, yemek, moda ya da tiyatroyla değil . Aboneliklerim, Bern Sanders'ı [30]sevdiğimi ama Elizabeth Warren'ı sevmediğimi , Sarah Silverman'ı Amy Schumer'ı değil [31], The New Yorker'ı sevdiğimi ancak Atlantic'i [32], arkadaşlarım Noah ve Emily Sands ve Josh Gottlieb'i sevdiğimi ama Sam Usher'ı sevmediğimi gösteriyor. (Üzgünüm Sam, ama Twitter gönderilerinizden sıkıldınız .)

200 milyon Twitter hesabından kim benimkine benzer bir profile sahip? Görsel ikizimin Vox [33]için yazdığı ortaya çıktı Dylan Matthews. Dylan'ı zaten Twitter ve Facebook'ta takip ettiğim ve Vox'taki makalelerini sürekli okuduğum için sosyal medya kullanımını geliştirmek açısından büyük bir cazibe oldu . Bu nedenle onun benim ikizim olduğu bilgisi hayatımda hiçbir şeyi değiştirmedi. Ama dünyada sana en çok benzeyen birinin varlığını öğrenmek çok güzel . Özellikle de hayran olduğun biriyse. Ve bu kitabı bitirdiğimde ve bir münzevi olarak yaşamayı bıraktığımda, belki Matthews ve ben iletişim kurabileceğiz ve James Surowetsky'nin yazılarını tartışabileceğiz.

Ortiz görsel ikizini bulmak birçok beyzbol hayranı için önemliydi ve görsel ikizimi bulmak sadece beni ilgilendiriyordu. Bu tür çalışmalar başka ne gösterebilir ? Her şeyden önce, bu tür verilerin yardımıyla, en büyük İnternet şirketlerinin çoğu hizmetlerini iyileştirmeye ve kullanıcılarla çalışmaya çalışıyor. Amazon, hangi kitapları satın almak istediğinizi anlamak için benzer bir şey kullanır . Sizin parametrelerinize sahip kişilerin ne seçtiğini görüyorlar ve tavsiyelerini buna göre veriyorlar.

Pandora, hangi şarkıları dinlemek istediğinizi belirleyerek aynı şeyi yapar. Netflix'in hangi filmleri izlemek istediğinizi bilmesi gibi. Sonuç tek kelimeyle büyüleyici. Amazon mühendisi Greg Lynden benzerleri okuyucu tercihlerini tahmin etmek için ilk kez kullandığında ve tavsiyelerin çok doğru olduğu ortaya çıktığında, Amazon'un kurucusu Jeff Bezos Linden'in önünde diz çökerek "Seni hak etmiyorum!"

Ancak ikiz arayışıyla ilgili en ilginç şey, artık neredeyse her yerde kullanılması değil, çoğu zaman kullanılmamasıdır. Kişiselleştirme yoluyla büyük ölçüde iyileştirilebilecek birkaç geniş alan vardır . Örneğin sağlığımızı ele alalım.

Harvard'da bir bilim adamı ve araştırmacı olan Isaac Kogan, bu prensibi tıbba çevirmeye çalışıyor. Doktorların herkese aynı şekilde davranmak yerine size benzeyen hastaları araması için tüm tıbbi bilgilerimizi toplamak ve düzenlemek istiyor . Daha sonra daha kişiselleştirilmiş teşhis ve daha hedefli tedavi kullanabilirler .

Kogan, bunu tıbbın doğal bir gelişimi olarak görüyor ve özellikle radikal bir gelişme bile değil. “Tanı nedir ? O sorar. - Teşhis, aslında, daha önce incelenen birçok insanla aynı durumda olduğunuzun bir ifadesidir. Allah korusun, size kalp krizi teşhisi koyarsam, kalp krizi geçiren diğer insanlarda gördüğüm patofizyolojinin aynısına sahip olduğunuzu söyleyeceğim.

Teşhis, aslında, bir çift arayışının ilkel bir versiyonudur. Sorun şu ki, doktorların onu kurmak için kullandıkları veri kümeleri çok küçük. Bugün tanı, hastalarını tedavi eden doktorun deneyimine dayanmaktadır ve diğer araştırmacıların birlikte çalıştığı popülasyonlar hakkındaki bilimsel makalelerden elde edilen verilerle desteklenebilir . Gördüğümüz gibi, bir görsel ikizi bulmak gerçekten yararlı bir şey olabilir - sadece çok daha fazla istatistik içermesi gerekiyor.

İşte büyük verilerin gerçekten yardımcı olabileceği bir alan. Peki yöntemi uygulamak neden bu kadar uzun sürüyor? Neden hala yaygın olarak kullanılmıyor? Sorun bilgi toplamada yatmaktadır. Tıbbi raporların çoğu hala yalnızca kağıt üzerinde var ve klasörlerde gömülü . Sayısallaştırılanlar ise genellikle uyumsuz formatlar nedeniyle kullanılamaz . Kogan 20 , "Beyzbol hakkında genellikle sağlıktan daha fazla bilgiye sahibiz " diyor . Ancak basit önlemler genellikle uzun bir yol kat eder. Bilim adamı defalarca "düşük asılı meyvelerden" bahsetti. Örneğin, çocukların boyu ve kilosu ile olası tüm çocukluk hastalıkları hakkında bilgi içeren bir veri tabanı oluşturmanın bile pediatride devrim niteliğinde bir gelişme olacağına inanıyor. Bundan sonra, her çocuğun gelişimi diğer herhangi bir çocuğun gelişimi ile karşılaştırılabilir. Bir bilgisayar, gelişimi birisinin zaten kat ettiği yolu takip eden çocukları bulmaya yardımcı olur ve tüm endişe verici anları otomatik olarak uyarır. Örneğin, bir çocukta erken büyümeyi saptayabilir , bu bazı durumlarda iki olası nedeni gösterebilir: hipotiroidizm veya beyin tümörü. Erken teşhis her iki durumda da büyük yarar sağlar . Kogan, "Bu tür hastalıklar oldukça nadiren, yaklaşık on binde bir ortaya çıkıyor " diyor. Aksi takdirde, bu çocuklar sağlıklıdır. Hastalığı en az bir yıl önce teşhis edebileceğimizi düşünüyorum. Kesinlikle yapabiliriz."

James Heywood 21, tıbbi verilerin birleştirilmesi sorununu çözmek için farklı bir yaklaşım benimseyen bir girişimcidir . İnsanların hastalıklarını , tedavilerini ve yan etkilerini bildirebilecekleri bir site olan PatientLikeMe.com'u yarattı . Ve James zaten bir dizi hastalıkta büyük başarı elde etti .

Amacı, benzer koşullara sahip insanlar hakkında yeterli bilgi toplamaktır, böylece daha sonra herkes sağlıkta muadilini bulabilir. Haywood, bu şekilde, benzer geçmiş ve semptomlara sahip doğru yaş ve cinsiyetteki insanları bulmanın ve onlara neyin yardımcı olduğunu görmenin mümkün olacağını umuyor . Tamamen farklı bir ilaç türü olacak.

HİKAYELER, SÖYLENMİŞ VERİ

görmenin ve tanımlamanın yeni bir yolunu sunduğu için, verilerin arıtılması benim için belirli bir çalışma için yerel arama yapmaktan daha değerlidir .

İnsanlar benim hem veri bilimcisi hem de yazar olduğumu öğrendiğinde bazen bir gerçeği veya bir anketi paylaşıyorlar. Sıklıkla bu bilgileri sıkıcı, genelleştirilmiş ve cansız buluyorum. Bana ilginç hikayeler anlatmıyorlar .

Ayrıca arkadaşlarım beni çeşitli romanları ve biyografileri okumaya ikna etmeye çalıştı. Ama bu da beni ilgilendirmiyor. Her zaman kendime şunu soruyorum: “Bu başka durumlarda oldu mu? Daha genel ilke nedir? Hikayeleri küçük ve göze çarpmayan görünüyor.

Bu kitapta bence benzeri olmayan bir şeyi sunmaya çalıştım. Verilere ve sayılara dayalıdır; açıklayıcıdır ve ileriye bakmanıza izin verir . Yine de büyük veri o kadar geniş bir malzemedir ki, tanımladığı belirli insanları hayal etmemize izin verir . Edmonton'da dakika dakika su tüketimi grafiği yaptığımızda, bir hokey periyodunun sonunda koltuktan kalkan insanlar görüyorum. Hareket eden insanlara daha yakından baktığımızda

Philadelphia'dan Miami'ye gidip vergi kaçırmaya başladıklarında, komşularıyla nasıl konuştuklarını ve vergi hilelerini öğrendiklerini görüyorum. Her yaştan beyzbol taraftarının istatistiklerine baktığımızda , kendi çocukluğumun, erkek kardeşimin ve milyonlarca yetişkin erkeğin hâlâ sekiz yaşında kalplerini kazanan takımlar için tezahürat yaptığını görüyorum.

Bir kez daha acımasızlığa düşme riskini göze alarak, bu kitapta adı geçen, bilgi toplama ve analiz etme işleriyle uğraşan iktisatçıların ve bilim adamlarının yalnızca yeni bir araç değil, yeni bir tür yarattıklarını söylemeliyim. Bu bölümde ve bu kitabın çoğunda, son derece kesin ayrıntılara ulaşmamızı sağlayacak kadar ayrıntılı ve çok sayıda veriyi açıklamaya çalıştım. Herhangi bir sıradan insan hakkındaki bilgilerle sınırlı olmamakla birlikte , onların yardımıyla çeşitli ve unutulmaz hikayeler anlatabiliriz.

Bölüm 6

BÜTÜN DÜNYA BİR LABORATUVARDIR

1 Şubat 2000, Google'ın Mountain View kampüsünde sıradan bir gün gibi başladı. Güneş parlıyordu , bisikletçiler pedal çeviriyor, masözler masaj yapıyor, çalışanlar salatalık suyuyla ciltlerini nemlendiriyordu. Ve aniden, bu çok sıradan günde, birkaç Google mühendisi , İnternet'in gelişimi üzerinde inanılmaz etkisi olan bir fikir buldu. Geliştiriciler, siteleri ziyaret etmenizi, sitelerde kalmanızı ve tekrar oraya dönmenizi sağlamanın en iyi yolunu bulmuşlardır .

Ne yaptıklarını açıklamadan önce, veri analizinde henüz ele almadığımız büyük bir problem olan korelasyon ve nedensellik arasındaki farktan bahsetmeliyiz .

Medya bizi her gün korelasyona dayalı araştırma bombardımanına tutuyor. Örneğin, ölçülü içicilerin fiziksel durumunun kural olarak nasıl duracağını bilmeyenlerden daha iyi olduğunu söylemiştik . Yani bir korelasyon var .

Bu, biraz içerseniz sağlığın düzeleceği anlamına mı geliyor - bu nedensel bir ilişki mi? bence hayır Aksine, insanların küçük dozlarda alkol tüketmesine izin veren şey sağlıktır. Sosyologlar buna ters nedensellik diyorlar . Veya belki de hem çok içme isteksizliğine hem de sağlığın iyi olmasına yol açan bağımsız bir faktör vardır. Örneğin, arkadaşlarınızla çok zaman geçirirseniz, bu alkol tüketimine ve sağlıklı olmaya yol açar. Sosyologlar buna atlanan değişken yanlılığı diyorlar .

ilişkiyi nasıl daha doğru bir şekilde kurabiliriz ? Altın standart, randomize kontrollü bir çalışmadır. İşte nasıl çalıştığı. İnsanlar rastgele iki rastgele gruba ayrılır. Birinden, bir işçiden bir şey yapması veya alması istenir. Başka, kontrol, sorma. Sonra her grubun tepkisini gözlemleyin. Sonuçlardaki fark nedensel bir ilişkidir.

Örneğin, ölçülü içmenin sağlığa yol açıp açmadığını test etmek için birkaç kişi rastgele seçilebilir. Bazıları bir yıl boyunca günde bir kadeh şarap içerken bazıları içmez. Ve sonra sağlık durumlarını karşılaştırın. İnsanlar rastgele iki gruba ayrıldığından, bir grubun katılımcılarının daha sağlıklı veya daha sosyal olmasını beklemek için hiçbir neden yoktur . Şarabın etkisinin oldukça yaygın olduğuna inanabilirsiniz. Randomize kontrollü deneyler, herhangi bir alandaki en güçlü kanıttır. Bir tablet bu testi başarıyla geçerse pazarlanabilir . Geçemezse eczane raflarında olmayacak.

sosyal bilimlerde giderek daha fazla kullanılmaya başlıyor . Massachusetts Institute of Technology'den Fransız ekonomist Esther Duflo , dünyanın en fakir insanlarına yardım etmenin en iyi yollarını bulmaya çalışan bir çalışma alanı olan kalkınma ekonomisinde bu tür araştırmaları daha geniş bir alana yaymak için bir kampanya yürüttü. Ortaokul öğrencilerinin yarısından fazlasının basit bir cümleyi okuyamadığı Hindistan kırsalında eğitimi iyileştirmek için Duflo ve meslektaşları tarafından yapılan bir deneyi düşünün . Sorunların potansiyel nedenlerinden biri öğretmen eksikliğidir. Şu anda, Hindistan kırsalındaki bazı okullarda %40'tan fazla öğretmen açığı var.

Duflo testinin özü nedir? O ve meslektaşları okulları rastgele iki gruba ayırdılar. Birinde (çalışma grubu), öğretmenlere temel maaşlarına ek olarak küçük bir miktar olan 50 rupi veya her gün yaklaşık 1,15 dolar ödeniyordu . Diğerlerinde öğretmenler ek ücret almadan çalıştı. Sonuçlar gösterge niteliğindeydi. Öğretmenlere fazladan ödeme yapıldığında, işlerini kaçırma olasılıkları bir buçuk kat daha azdı 2 . Okul çocuklarının performansı da özellikle genç kızlar için önemli ölçüde iyileşti. Deneyin sonunda, öğretmenlerin derslere katılmaları için para aldığı okullarda %7 oranında daha fazla okuma yazma bilen kız çocuğu vardı.

The New Yorker'daki bir makaleye göre , Bill Gates , Duflo'nun çalışmaları hakkında 3 öğrendiğinde o kadar etkilendi ki, "Sana fon sağlamalıyız " dedi.

A/B TESTİNİN ABC'Sİ

nedenselliği kanıtlamada altın standarttır ve kullanımları sosyal bilimlere yayılmıştır. Şimdi 27 Şubat 2000'de Google ofisine geri dönelim . O zaman internet devrimine ne sebep oldu ?

O gün, birkaç mühendis Google sitesinde bir deney yapmaya karar verdi. Kullanıcıları rastgele iki gruba ayırdılar. Çalışma grubu, 20 bağlantı içeren yeni arama sonuçları sayfasını gösterirken, kontrol grubu, 10 bağlantı içeren eski arama sonuçları sayfasını gösterdi. Daha sonra , Google'a ne sıklıkta döndüklerine bağlı olarak her iki grubun memnuniyetini karşılaştırdılar .

Devrim? İlk başta çok devrimci görünmedi . Bu tür deneylerin ilaç şirketleri ve sosyologlar tarafından kullanıldığını daha önce belirtmiştim . Peki onları başka bir alana nakletmeyi bu kadar büyük bir mesele olarak düşünmek mümkün mü ?

Kilit nokta -ki Google mühendisleri bunu çabucak anladılar- sanal dünyada deney yapmanın gerçek dünya keşfine göre çok büyük bir avantajı olduğuydu . Onlar kadar inandırıcıdırlar , ancak daha az kaynak yoğundurlar. Yol boyunca Duflo'nun okullarla iletişim kurması, finansman düzenlemesi , öğretmenlere pay ödemesi yapması ve tüm öğrencilerin seviyesini kontrol etmesi gerekiyordu. Gerçek deneyler binlerce veya yüzbinlerce dolara mal olabilir ve tamamlanması aylar veya yıllar alabilir.

Dijital dünyada, bu tür araştırmalar ucuz ve hızlı bir şekilde yapılabilir. Üyeleri işe almanıza ve onlara ödeme yapmanıza gerek yoktur. Bunun yerine, sadece bir satır kod yazabilir ve rastgele gruplar oluşturabilirsiniz. Araştırma için kullanıcılara ihtiyacınız yok ; fare hareketlerini ve tıklamaları ölçebilirsiniz. Manuel olarak kod yazmaya ve yanıtları ayrıştırmaya gerek yoktur ; bunu sizin için otomatik olarak yapan bir program yazabilirsiniz . Kimseyle iletişime geçmek zorunda değilsin. İnsanlara bir deneyin parçası olduklarını açıklamanıza bile gerek yok.

Bu, büyük verinin dördüncü avantajıdır: Herhangi bir zamanda ve neredeyse her yerde gerçek nedensel ilişkileri bulmayı çok daha kolaylaştıran rastgele denemelere izin verir - önemli olan tek şey İnternet erişimidir . Büyük veri çağında, tüm dünya büyük bir laboratuvardır.

Bu farkındalık hızla Google'a ve ardından rastgele denemelerin "Â/B testleri" olarak yeniden adlandırıldığı Silikon Vadisi'ne yayıldı . 2011'de Google mühendisleri 7.000 A/B testi4 gerçekleştirdi ve bu sayı o zamandan beri yalnızca arttı.

Google, insanların sitelerindeki reklamlara nasıl tıklayacağını öğrenmek istiyorsa , şirket banner'larda biri Grup A ve diğeri Grup B için olmak üzere iki mavi ton kullanabilir ve ardından tıklama sayısını karşılaştırabilir. Tabii ki, bu tür testlerin basitliği kötüye kullanıma yol açabilir. Bazı çalışanlar, test etme çok kolay olduğu için Google'ın deneyler içinde boğulacağını hissetti . 2009'da başarısız bir tasarımcı, başka bir A/B testinde mavinin biraz farklı 41 tonu kullandıktan sonra işi bıraktı 5 . Ancak bu tasarımcının takıntılı pazar araştırmasına ve sanata verilen desteğe karşı protestosu, bu metodolojinin yayılmasını durdurmak için çok az şey yaptı .

Bugün Facebook günde 6.000 A/B testi gerçekleştiriyor, bu da az sayıda mühendisin o dönemde tüm ilaç endüstrisinin bir yılda yaptığından daha fazla randomize kontrollü deney yürüttüğü anlamına geliyor.

A/B testi, en büyük teknoloji şirketlerinin ötesine geçti. Eski Google çalışanı Dan Siroker, bu tekniği Barack Obama'nın ilk başkanlık kampanyasında kullandı. A/B , kampanya web sitesinin ana sayfasının, e-posta alanlarının ve bağış formunun tasarımını test etti . Siroker daha sonra kuruluşlara hızlı A^ test hizmetleri sağlayan bir şirket olan Optimizely 7'yi kurdu. 2012'de hem Obama hem de rakibi Mitt Romney kayıtları , gönüllüleri ve bağışları en üst düzeye çıkarmak için Optimizely'den yardım istedi . Hizmetleri TaskRabbit ve New York dergisi tarafından kullanılmaktadır .

Bu tür testlerin değerini anlamak için , Obama'nın bunu daha fazla insanı kampanyasına çekmek için kullandığını düşünün . Başkanın web sitesinin ana sayfası, orijinal olarak onun bir resmini ve onun altında insanları kaydolmaya davet eden bir düğme içeriyordu.

İnsanları çekmenin en iyi yolu bu muydu? Optimizely ile Obama ekibi, farklı bir görselin ve düğmenin daha fazla insanı çekmeye yardımcı olup olmayacağını görebildi. Fotoğrafta Obama'nın yüzü daha ciddiyse, insanlar düğmeye daha sık mı basacak? Ya düğme "Katıl" derse? Kullanıcılara çeşitli resim ve düğme kombinasyonları gösterildi ve ardından hangi seçenek için düğmeye kaç kişinin tıkladığını saydı. Bir sonraki sayfadaki seçeneklere bakın ve kazanan kombinasyonu tahmin etmeye çalışın.

, Obama ailesinin fotoğrafı ve " Daha Fazla Bilgi Edinin" düğmesi oldu. Bu bir zaferdi. Bu kombinasyonla, Obama %40 daha fazla kayıtlı kullanıcı kazandı ve kampanyaya yaklaşık 60 milyon dolar ekstra fon sağladı .

Deneme çekimleri

şimdi bize katılın

Daha fazlasını bul

Kayıt olmak

Ve bir başka büyük artı, bu tür testlerin ucuz ve kolay bir şekilde yapılabilmesidir: bu bizi, Bölüm 1'de belirtildiği gibi sınırlamaları olan sezgiye olan sonsuz bağımlılıktan kurtarır. A/B testinin önemli olmasının ana nedeni , insanların öngörülemez olmasıdır. Sezgi genellikle tepkilerini tahmin etmekte başarısız olur.

Kazanan kombinasyon

Altıncı hissiniz, Obama'nın web sitesinin en uygun görünümü konusunda haklı mıydı?

İşte sezginiz için birkaç kontrol daha. Boston Globe A/B, hangi manşetlerin insanların en çok dikkatini çekeceğini bulmak ve makaleye tıklamalarını sağlamak için 9 başlığı test etti. Kazananları tahmin etmeye çalışın :

, tıklama açısından en iyi olarak oylandı

Başlık A

Başlık B

1

SnotBot drone balinaları kurtarabilir mi?

Bu insansız hava aracı balinaları kurtarmaya yardımcı olabilir mi?

2

Tabii ki, "balonlar " Massachusetts'te en sık kullanılan arama terimidir .

Massachusetts'teki bu en yaygın arama terimi kafa karıştırıcı olabilir

3

Bağlantı yarışması tecavüz davasına yol açtı

Seks skandalından sonra okul öğretmenleri hakkında suçlama yok

4

Nadir bir beyzbol kartında büyük ikramiye kazanan kadın

Nadir beyzbol kartından 179.000 dolar kazanan kadın

5

MBTA projelerinin yıllık operasyonel açığı 2020'ye kadar ikiye katlanacak

Kendinizi Hazırlayın: MBTA Açığı Neredeyse İki Katına Çıktı

6

Massachusetts, Doğum Kontrolüne Uygun Olmanıza Nasıl Yardımcı Oldu?

Boston Üniversitesi " İffete Karşı Suçların" Sona Ermesine Nasıl Yardımcı Oldu?

7

Boston'da ilk metro ne zaman açıldı?

Boston'da ilk metronun açıldığı dönemin karikatürleri

8

İlkokul tecavüz davasındaki kurbanlar ve aileleri modern kültürü suçluyor

İlkokuldaki tecavüz davasında mağdurlar ve aileleri ifade verdi

"Özgür Brady" şapkalı adam, Miley Cyrus şakasını bozan tek kişiydi.

Herkes kılık değiştirmiş Miley Cyrus'u tanıyan hayrandan memnun

Tahmin mi ettin? cevaplar aşağıda

Başlık A

Başlık B

Kazanan?

1

SnotBot drone balinaları kurtarabilir mi ?

Bu insansız hava aracı balinaları kurtarmaya yardımcı olabilir mi ?

A'ya %53 daha fazla tıklama

2

Tabii ki, "sönmüş balonlar" Massachusetts'teki en yaygın arama terimidir.

bu en yaygın arama terimi kafa karıştırıcı olabilir.

B'de %986 daha fazla tıklama

3

Bağlantı yarışması tecavüz davasına yol açtı

Seks skandalından sonra okul öğretmenlerine suçlama yok

B'de %108 daha fazla tıklama

4

hasta kartında ikramiyeyi vurdu

Nadir beyzbol kartından 179.000 dolar kazanan kadın

A'ya %38 daha fazla tıklama

5

projelerinin yıllık operasyonel açığı 2020 yılına kadar ikiye katlanacak

Kendinizi Hazırlayın: MBTA Açığı Neredeyse İki Katına Çıkıyor

B'de %62 daha fazla tıklama

6

Massachusetts, Doğum Kontrolüne Uygun Olmanıza Nasıl Yardımcı Oldu ?

Boston Üniversitesi " İffete Karşı Suçları" Durdurmaya Nasıl Yardımcı Oldu?

B'de %188 daha fazla tıklama

7

Boston'da ilk metro ne zaman açıldı ?

ilk metronun açılmadığı dönemin karikatürleri

A'ya %33 daha fazla tıklama

8

İlkokul Tecavüz Davasındaki Kurbanlar ve Aileler Modern Kültürü Suçluyor

İlkokulda tecavüz davası görülen mağdurlar ve aileleri açıklama yaptı

B'de %76 daha fazla tıklama

9

"Özgür Brady" şapkalı adam, Miley Cyrus şakasını bozan tek kişiydi.

kılık değiştirmiş Miley Cyrus'u tanıyan hayrandan memnun

B'de %67 daha fazla tıklama

yarısından fazlasını doğru bir şekilde belirttiğinize inanıyorum - belki de neye tıklamak istediğinizi düşündünüz . Ancak, büyük olasılıkla, her şeyi doğru tahmin etmediniz .

Neden? Neyi özledin? İnsan davranışı hakkında hangi sonuçlara sahip değilsiniz? Hatalarınızdan hangi dersleri öğrendiniz?

Bu tür soruları genellikle kötü tahminlerin ardından sorarız .

Ancak Globe manşetlerinden genel sonuçlar çıkarmanın ne kadar zor olduğuna bir bakın . İlkinde, yalnızca bir kelime değiştirildi - "bu", zafere yol açan "SnotBot" olarak değiştirildi. İnsanların daha ayrıntılı açıklamaları sevdikleri varsayılabilir . Ancak ikinci başlıkta, "sönmüş balonlar" - özel terim - yenilgiye yol açar. Dördüncü manşette, "179.000$'ın önünde" "büyük ikramiyeyi vur". Bu, argonun kazanmaya yardımcı olduğu anlamına gelebilir. Ama argo tabiri “pihon tüy yarışması ” üçüncü başlıkta kaybediyor.

Bu Â/B testinden çıkarılan ders, normal olanlardan çok farklıdır.

Haber ve eğlence sitesi ranker.com'un CEO'su Clark Benson 10 , manşetler ve tasarım için büyük ölçüde A/B testine güveniyor . “Günün sonunda sunacak hiçbir şeyin yok ” diyor. "Kelimenin tam anlamıyla her şeyi kontrol edin."

Test etmek, insan doğası anlayışımızdaki boşlukları doldurur. Her zaman var olacaklar. Yaşam deneyimine dayalı olarak kesin yanıtı bilebilseydik, test yapmak anlamsız olurdu . Ancak bu bizim için mevcut değil, bu yüzden testler kullanmak zorundayız .

A/B testinin önemli olmasının bir başka nedeni de, görünüşte küçük değişikliklerin çok büyük sonuçlara yol açabileceğini açıkça göstermesidir . Benson'ın dediği gibi, " Küçük, önemsiz faktörlerin bu kadar büyük bir etkiye sahip olabilmesi beni her zaman şaşırtmıştır ."

Aralık 2012'de Google, reklamlarını kutulara sağı gösteren oklar ekleyecek şekilde değiştirdi 11 .

Oteller

wιw⅛J3n⅝je.ccm

Ay sonuna kadar özel fiyatlar. Fecπ≡nσo rezervasyonu yok. Bir Seim As odası ayırtın!

s Dublin otelleri

m⅛⅜a rnd⅜.ca n

Uluslararası, bölgesel ve konuk değerlendirmelerine göre sıralanmış yüzlerce Dublin oteline göz atın.

İrlanda otelleri

w⅛ ⅛⅜ar∏de.cσn

Выбор рекламы [>

İrlanda'daki 1000'den fazla oteli karşılaştırın

Bu okların ne kadar tuhaf göründüğüne dikkat edin - kesinlikle hiçbir şeye işaret etmiyorlar. Aslında, ilk ortaya çıktıklarında, birçok Google ziyaretçisi onları eleştirdi 12 . Reklamların üzerine neden anlamsız oklar konulduğunu merak ettiler.

Google iş sırlarını korur, dolayısıyla çalışanları bu okların ne kadar değerli olduğunu söylemedi. Bulabildiğimiz tek bilgi, bu varyantın Â/B testini kazandığıydı . Google'ın bunları eklemesinin nedeni, birçok kişinin oraya tıklamak istemesidir. Sonuç olarak , bu küçük ve görünüşte anlamsız değişiklik, Google'a ve reklamcılık ortaklarına çok para kazandırdı .

Bu kadar büyük kazançlar sağlayan o küçük hileleri bulabilir misin ? Pek çok noktayı kontrol etmelisiniz - önemsiz görünenleri bile. Aslında, Google kullanıcıları , reklamların önce biraz değiştiğini ve ardından orijinal hallerine döndüğünü defalarca fark etmişlerdir . Bu gibi durumlarda, farkında olmadan A/B test ekibinin bir üyesi olurlar, ancak bunu yaparken yalnızca bu küçük değişiklikleri görme fırsatı elde ederler.

Deneysel merkezleme (çalışmıyor)

En Çok Satan iPad 2 Kılıfları

Dahili bluetooth klavyeli
ZAGGmate™ darbeye dayanıklı
alüminyum kasa
www.zagg.com

Yeşil Yıldız Deneyi (çalışmıyor)

Foster's Holliwood Restoranların İncelemesi, Madrid, İspanya...

www.tripadvisor.co.uk > ... > Madrid > TripAdvisor ile Madrid Restoranları

* *         Derecelendirme 3 - 118 yorum

Foster's Holliwood , Madrid: Foster's Holliwood hakkında TripAdvisor tarafından 3 ile 5 arasında 3 ile derecelendirilen 118 tarafsız yoruma bakın. 6489 restorandan 3647'si açıklandı

Yeni bir yazı tipiyle deneme yapın (çalışmıyor)

Dinamik borsa haberleri

UTVi uzmanlarından ücretsiz grafikler, haberler ve ipuçları. Hemen gel!

UTVi.com∕S+ocks

Yukarıda gösterilen değişiklikler işe yaramadı. Çalışmadılar. Ancak kazananlar için seçim sürecinin bir parçasıydılar . Tıklanabilir oka giden yol, çirkin yıldızlar, yanlış yerleştirilmiş metin ve işe yaramaz yazı tipleriyle döşenmiştir .

İnsanların düğmeleri tıklamasına neden olan şeyin ne olduğunu tahmin etmek eğlenceli olabilir . Demokratsanız, test yapmanın Obama'ya daha fazla para kazandırdığını bilmek sizi memnun edebilir. Ancak A/B testinin karanlık bir tarafı da vardır.

Muhteşem kitabı "Dayanılmaz" da ("Karşı Konulamaz ") Adam Alter, modern toplumda davranışsal bağımlılıkların yaratılması hakkında yazıyor 13 . Bugün birçok insan, interneti kapatmanın kendileri için giderek zorlaştığını kabul ediyor .

Favori veri grubum olan Google aramaları , insanların en çekici bulduğu şeyler hakkında bize bazı ipuçları verebilir . Google istatistiklerine göre, uyuşturucu, seks ve alkol gibi insanların onlarca yıldır mücadele ettiği bağımlılıkların çoğu aynı kalıyor . Ancak İnternet bu listedeki varlığını giderek daha yüksek sesle göstermeye başlıyor - "porno " ve Facebook en yaygın on bağımlılık arasında.

2016'nın en güçlü bağımlılıkları,

Google istatistiklerine göre 14

Uyuşturucu         Alkol         Kumar         _

Seks         Şeker         Facebook

porno         aşk

bu kadar yüksek oranda bağımlılık yaratan bir web oluşturmada önemli bir rol oynayabilir .

Irresistible'da alıntılanan "ahlakçı" Tristan Harris , insanların belirli sitelerin çekimine direnmesinin neden bu kadar zor olduğunu açıklıyor: "Ekranın diğer tarafında , işi kendi kendini düzenleme yeteneğinizi kırmak olan binlerce insan var ."

Ve bu insanlar A/B testi kullanıyor.

Testler sayesinde Facebook, belirli bir renkteki belirli bir düğmenin insanların siteye daha sık geri dönmesini sağladığını belirleyebilir. Ardından kaşifler düğmenin rengini değiştirir. Daha sonra , belirli bir yazı tipinin insanların siteye daha sık geri dönmesini sağladığını anlayabilirler . Böylece yazı tipini değiştirirler. Daha sonra, belirli zamanlarda insanlara e-posta almanın onların siteye daha sık gelmelerini sağladığını anlayabilirler. Bu nedenle, bu belirli zamanda e-posta gönderirler.

Kısa bir süre sonra Facebook, insanların üzerinde harcadıkları süreyi artırma açısından oldukça optimize hale geldi .

Başka bir deyişle, kazanan
Â/B test
sonuçlarından olabildiğince fazlasını kullanın ve sonunda çok çekici bir site elde edeceksiniz.

sigara üreticilerinin sahip olmadığı türden bir geri bildirimdir .

A / B testi, çoğunlukla oyun endüstrisinin bir aracıdır. Alter'e göre, World of Warcraft'ın çeşitli sürümlerinin A/B testleri var. Bir görevde birini öldürebilirsin. Diğerinde, birini kurtar. Tasarımcılar, oyunculara farklı görevlerden farklı örnekler verebilir ve ardından hangilerinin en popüler olacağını görebilir. Örneğin, birini kurtarma görevinin %30 daha fazla kullanıcı çektiğini görebilirler . Pek çok görevi test ederlerse, giderek daha fazla A/B testi kazananı bulmaya başlarlar . Bu %30'luk kazanç, birçok yetişkin oyuncunun oynadığı oyunu alana kadar toplanır .

Bu konuda biraz tedirginseniz, benim de öyle olduğumu bilin. Ve bu kitabın sonunda, büyük verinin diğer yönlerinin yanı sıra etik sonuçları hakkında da biraz konuşacağız . İyi ya da kötü, deneyler bilim adamlarının cephaneliğindeki ana araçtır. Bu araç kutusunda başka bir keşif biçimi var . TV reklamlarının ne kadar etkili olduğu da dahil olmak üzere çeşitli sorular sormak için kullanıldı .

AĞIR AMA GÖLGELENDİRİCİ HAFİF ALAN DENEYLERİ

22 Ocak 2012'de New England Patriots, [34]Baltimore Ravens ile NFL Şampiyonası Yarı Finallerini oynadı.

Oynamak için sadece bir dakika kalmıştı. Kuzgunlar kaybediyordu ama top onlardaydı. Önümüzdeki 60 saniye , Super Bowl'da hangi takımın oynayacağını belirleyecek . Önümüzdeki 60 saniye , oyuncuları zaferin zirvesine çıkarabilecek . Ve bu oyunun son dakikası, bir ekonomist için çok daha önemli olan şeyi yapacak: Bu son 60 saniye, reklamcılık işe yarıyor mu?

Reklamın satışları artırdığını bilmek ekonomimiz için çok önemlidir . Ancak bunu kanıtlamak son derece zordur. Aslında bu, korelasyon ve nedensellik arasında ayrım yapmanın ne kadar zor olduğunun bir ders kitabı örneğidir .

Hiç şüphe yok ki reklamı en çok yapılan ürünler en çok satan ürünlerdir. Film şirketi 20th Century Fox, sonunda tüm zamanların en çok hasılat yapan filmi olan Avatar'ı tanıtmak için 150 milyon dolar harcadı. Ancak 2,7 milyar dolarlık bilet satışının ne kadarı güçlü pazarlamadan geldi? Bu çılgın promosyon maliyetlerinin nedenlerinden biri basit: 20th Century Fox, ürünün talep göreceğini kesinlikle biliyordu.

Firmalar reklamlarının ne kadar etkili olduğunu bildiklerine inanırlar. Ekonomistler bundan şüphe ediyor. Bir elektronik tasarım ve satış şirketiyle çalışan Chicago Üniversitesi ekonomi profesörü Steven Levitt , firma onu reklamlarının ne kadar işe yaradığını bildiğine ikna etmeye çalıştığında pek de heyecanlanmadı. Levitt, şirket yönetiminin neden bu kadar kendinden emin olduğuyla ilgilendi.

Kendisine her yıl Babalar Günü arifesinde televizyon reklam harcamalarının arttığı anlatıldı. Ve tabii ki her yıl Babalar Günü arifesinde en yüksek satışlar oluyor. Ama belki de bunun nedeni, pek çok çocuğun babasına hediye olarak ve özellikle de Babalar Günü'nde, reklamı ne olursa olsun, elektronik eşya almasıdır.

15. Derste "Nedensel ilişkiyi ters yüz ettiler," dedi . Elbette, reklamcılık işe yarayabilir. Bunu henüz bilmiyoruz. “Bu çok ciddi bir sorun” diye ekliyor.

Bu sorunu çözmek çok önemli olduğu için firmalar derinlemesine araştırma yapmak isterler. Levitt, reklamların tam olarak ne kadar etkili olduğunu öğrenmek için şirketi kontrollü deneyler yapmaya ikna etmeye çalıştı . Televizyonda A /B testi yapmak mümkün olmadığından, bazı bölgelerde reklam kullanılmadan neler olup bittiğini anlamak gerekiyordu .

Ancak firma temsilcileri cevap verdi: “Deli misin? Yirmi pazarda reklam veremiyoruz. CEO bizi öldürecek.” Bu, Levitt'in şirketle olan işbirliğinin sonuydu.

Bu da bizi Patriots'un Ravens ile oynadığı oyuna geri getiriyor. Bir futbol maçının sonucu, reklamın etkisini belirlememize nasıl yardımcı olabilir? Belli bir reklam kampanyasının etkisini gösteremiyor . Ancak birçok büyük şirketin ortalama reklam etkisini gösterebilir.

Bu tür oyunlarda reklamlarla gizli bir deney yapıldığı ortaya çıktı. İşte böyle gidiyor. Yarı finaller yapıldığında , şirketler zaten Super Bowl için reklamlar satın almış ve üretmişti. Aynı zamanda firmalar hangi reklamları yayınlayacaklarına karar verirken finalde hangi takımların oynayacağını henüz bilmiyorlar.

Ancak yarı finallerin sonuçları, Super Bowl seyircisinin kompozisyonunu büyük ölçüde etkileyecektir. İki takımın her biri çok sayıda seyirci çekecek. Boston yakınlarında bulunan Patriots kazanırsa, Super Bowl'u Maryland'den çok Massachusetts'ten izleyen çok daha fazla insan olacak. Ve tam tersi.

Baltimore'da veya Boston'da on binlerce kişinin daha reklama maruz kalıp kalmayacağını belirlemek için yazı tura atmaya eşdeğerdir . Bu, reklam alanı satın alındıktan ve reklam oluşturulduktan sonra bilinecektir.

Şimdi, CBS'den Jim Nantz'ın bu deneyin nihai sonuçlarını açıkladığı sahaya dönelim.

Ravens takımından Billy Cundiff, sahadan bir tekme atarak durumu eşitlemeye hazırlanıyor ve büyük ihtimalle maçı uzatmaya gönderiyor . Gole 32 yarda. Vurmak! Kendine iyi bak ! Dikkat! Oh, ne kadar kötü... Ve Patriots, 46. Super Bowl için Indianapolis'e gidiyor.

İki hafta sonra Super Bowl'da Boston'daki seyirci payı 60.3 ve Baltimore'da 50.2 idi. Bosto'da 2012 reklamını 60.000 kişi izleyecek .

Aynı iki takım gelecek yıl yarı finalde karşılaşacak. Baltimore bu kez kazanır. Super Bowl 2013 için ek reklam Baltimore'da olacak.

2012 Super Bowl Reytingi (Boston'da oynandı)

2013 Super Bowl Reytingi (Baltimore'da oynandı)

Boston

56.7

48.0

Baltimore

47.9

59.6

Google Baş Ekonomisti Hal Varian ve Carnegie Mellon Üniversitesi Ekonomisti Mike Lom D. Smith ve ben, bu iki oyunu ve 2004 ile 2013 arasındaki diğer tüm Super Bowl'ları işe yarayıp yaramadığını, öyleyse nasıl işe yaradığını test etmek için kullandık. Özellikle şunları test ettik: Bir şirket bu etkinlik sırasında bir filmin tanıtımını yaptığında , seyirci sayısının yüksek olduğu şehirlerde bilet satışlarında önemli bir artış görüyor mu ?

Evet bu doğru. Finale kalan takımların şehirlerindeki insanlar, bu maç sırasında reklamı yapılan filmlere diğer bölgelerden çok daha fazla sayıda seyirci katılıyor. Sadece daha fazla insan reklamı görüyor ve sinemaya gitmeye karar veriyor.

Bu fenomen için alternatif bir açıklama, favori takımınız Super Bowl'daysa, bir film izlemeye gitme olasılığınızın daha yüksek olmasıdır. Ancak benzer dönemlerde benzer bütçelere sahip olan ancak Super Bowl sırasında tanıtılmayan bir grup filmi test ettik . Finale kalan takımların şehirlerinde katılım artışı olmadı.

Tamam, tahmin ettin, reklamlar işe yarıyor. Şaşmamalı.

Ama sadece işe yaradığı için değil. Reklam inanılmaz derecede etkili oldu. Aslında, sonuçları ilk gördüğümüzde, gerçek olduklarından emin olmak için iki kez üç kez dört kez kontrol ettik - yanıt inanılmaz derecede yüksekti. Örneğimizdeki distribütörler, Super Bowl reklam alanı için film başına ortalama 3 milyon dolar ödedi . Artan bilet satışlarından 8,3 milyon dolar elde ettiler ; yani 2,8:1 yatırım getirisi .

, bizden önce bağımsız olarak bu fikri ortaya atan diğer iki ekonomist olan Wesley R. Hartman ve Daniel Clapper tarafından doğrulandı . Bu uzmanlar , kazanan takımların şehirlerinde daha sık görülebileceklerini de hesaba katarak Super Bowl 16 sırasında bira ve meşrubat reklamlarını incelediler . Bu reklam çok pahalıydı, ancak hem bizim sonuçlarımız hem de onların sonuçları, artan talep açısından o kadar etkili olduğunu gösterdi ki, aslında şirketler bunun için büyük ölçüde eksik ödeme yapıyor.

Ve tüm bunlar, Levitt'in çalıştığı elektronik şirketindeki arkadaşlarımız için ne anlama geliyor? Super Bowl sırasındaki reklamların başka herhangi bir yerden daha etkili olması oldukça olasıdır. En azından araştırmamız, Babalar Günü için reklam vermenin iyi bir fikir olduğunu gösteriyor.

Super Bowl deneyinin olumlu yönlerinden biri, çalışma ve kontrol gruplarına özel olarak birini atamak zorunda olmamanızdır . Her şey oldukça doğal bir şekilde gerçekleşti, bu nedenle bu tür çalışmalara saha çalışmaları deniyordu. Bu avantaj nereden geldi? Gerçek şu ki, keyfi kontrollü deneyler, ne kadar etkili ve basit olursa olsun, dijital çağda hala her zaman mümkün olmuyor.

Bazen eylemleri zamanında birleştiremiyoruz. Bazen, bir elektronik şirketinde olduğu gibi , işletme sahipleri, sonucu test etmek için çok fazla yatırım yaptıkları için reklam kampanyalarını deneme konusunda isteksizdirler.

Bazen araştırma yapmak mümkün değildir. Diyelim ki bir ülkenin liderinin kaybına nasıl tepki verdiğiyle ilgileniyorsunuz. Savaşa mı gelecek? Ekonomi işleyişini durduracak mı? Yoksa hiçbir şey değişmeyecek mi ? Açıkçası, önemli sayıda cumhurbaşkanı ve başbakanı öldürüp ne olacağını göremeyiz. Sadece imkansız değil, aynı zamanda ahlaksız da olurdu. On yıllardır üniversiteler, önerilen bir deneyin etik olup olmadığını belirleyen kurumsal inceleme listeleri (IRB'ler) biriktirdiler .

, belirli bir senaryodaki nedenselliği bilmek istiyorsak ve araştırma yapmak etik değil veya başka bir şekilde mümkün değilse, ne yapabiliriz? Doğa kavramını oldukça geniş bir şekilde ele alan ekonomistlerin - futbol maçlarına kadar - doğal deneyler dediği şeyi kullanabiliriz .

İyi ya da kötü (tamam, tabii ki kötü), yaşamda genellikle önemli miktarda rastgeleliğe yer vardır. Evreni neyin veya kimin yönettiğini kimse kesin olarak bilemez . Ancak bir şey açık: Bu gösterinin başında kim varsa -kuantum mekaniğinin yasaları, Tanrı, bilgisayarında evreni simüle eden şortlu sivilceli bir adam- bunların hepsi IRB'nin izin verdiğinin dışında .

Doğa sürekli bizimle deneyler yapıyor. İki kişi vuruldu. Birinde, mermi hayati bir organın milimetre yakınından geçer. Başka biri ölür. Hayat adil değil. Ancak, bir teselli olacaksa, kötü sonuçlar ekonomistlerin öğrenmesine olanak tanır. Ekonomistler neden ve sonucu test etmek için şansı kullanırlar .

43 Amerikan başkanından 18'i 16'sı ciddi suikast girişimlerinin kurbanı oldu, dördü öldürüldü. Bazılarının hayatta kalmasının nedenleri çoğunlukla tesadüfiydi.

John F. Kennedy ve Ronald Reagan'ı karşılaştırın 19 . Her iki kurşun da vücudun en savunmasız bölgelerine isabet etti. Kennedy'nin kurşunu beyninde patlayarak onu öldürdü. Reagan'ın durumunda, mermi kalbinden birkaç santim ötede durarak doktorların hayatını kurtarmasına izin verdi. Reagan, Kennedy ölürken hayatta kaldı - çok şanslıydı.

Liderlerin hayatlarına yönelik bu suikast girişimleri ve bazılarının hayatta kalmasına ve bazılarının ölmesine neden olan kazalar dünyanın her yerinde meydana geliyor. Çeçenya'daki Akhmat Kadırov ile Almanya'daki Adolf Hitler'i karşılaştırın . Her ikisi de patlayan bombanın birkaç santim yakınındaydı . Kadirov öldü. Hitler programını 20 değiştirdi , trene yetişmek için bubi tuzaklı odadan birkaç dakika erken ayrıldı ve böylece hayatta kaldı. Kadırov anında öldü 21 .

Bir ülke liderinin ölümünden sonra ortalama olarak ne olduğunu görmek için sadece şansı kullanabiliriz - Reagan'ın değil, Kennedy'nin suikastı . İki ekonomistin, Benjamin Jones ve Benjamin Olken'in yaptığı buydu . Buradaki kontrol grubu, cumhurbaşkanlığına suikast girişiminden hemen sonraki yıllardaki herhangi bir ülkedir. Örneğin, 1980'lerin ortalarında Amerika Birleşik Devletleri. Ve çalışma grubu, suikasttan sonraki ilk yıllarda herhangi bir ülkedir. Örneğin, 1960'ların ortalarında Amerika Birleşik Devletleri.

Liderin ölümünün sonucu nedir? Jones ve Olken, ülkeler temelde farklı bir gelişme yolu izlediğinden , bu tür suikastların dünya tarihini çarpıcı biçimde değiştirdiğini keşfettiler . Yeni lider, daha önce barışçıl olan ülkeleri savaşa girmeye ve daha önce savaşan tarafları da katlanmaya zorluyor. Yeni lider, ekonomik olarak gelişmekte olan ülkelerin yıkımına ve yıkıma uğramış ülkelerin ekonomik kalkınmasının keskin bir şekilde başlamasına neden olur.

Aslında, suikast deneyinin sonuçları, ülkelerin nasıl işlediğine dair birkaç on yıllık geleneksel bilgeliği alt üst etti. Birçok iktisatçı daha önce başkanların temelde güçsüz, dış güçlerin emriyle hareket eden kukla yöneticiler olduğuna inanma eğilimindeydi . Ancak Jones ve Olken tarafından yapılan bir saha deneyi, durumun hiç de böyle olmadığını gösterdi.

Birçoğu, dünya liderlerine yönelik suikast girişimleriyle ilgili bu çalışmayı iş başındaki büyük verinin bir örneği olarak görmüyor. Öldürülen veya yaralanan cumhurbaşkanlarının sayısı, sonuç olarak başlayan ve biten savaşların sayısı gibi elbette azdı . Ekonomik yörüngenin parametrelerini belirlemek için gereken çok miktarda veri vardı, ancak bunların atıfta bulundukları zaman çoğunlukla dijital çağdan önceydi.

Yine de, bu tür saha deneyleri -artık neredeyse yalnızca iktisatçılar tarafından kullanılsalar da- doğru ve büyük veri setleri çağında önemi giderek artan güçlü silahlardır . Veri toplayan ve analiz eden bilim adamlarının çok uzun bir süre kullanacakları bir araçtır .

Ve evet, şimdiye kadar açık olması gerektiği gibi, ekonomistler veri biliminin gelişmesinde önemli bir rol oynuyorlar. En azından ben öyle düşünmek istiyorum çünkü bunda benim de parmağım var.

rastgele olayların insanları bir çalışma veya kontrol grubuna yerleştirdiği durumlar başka nerede bulunabilir ?

Bunun en açık örneği piyangodur. Ekonomistlerin onları bu kadar çok sevmesinin nedeni budur - mantıksız olan katılmak için değil , çalışmak için. Üç numaralı top çıkarsa, Bay Jones zengin olacak. Altı topsa, Bay Johnson kaybedecek.

meydana gelmesindeki neden-sonucu test etmek için piyangoyu kazananlarla bilet alıp kaybedenleri karşılaştırır . Bunun gibi araştırmalar , piyangoyu kazanmanın sizi kısa vadede22 mutlu edeceğini , ancak uzun vadede mutlu etmeyeceğini bulma [35]eğilimindedir .

, piyangoların olasılıksal doğasını, komşusu aniden zengin olan bir kişinin hayatındaki değişimi gözlemlemek için de kullanabilirler . Veriler , komşunuzun piyangoyu kazanmasının sizin hayatınızı etkileyebileceğini gösteriyor 23 . Örneğin, gerçekten o kadar şanslıysa, BMW gibi pahalı bir araba alma olasılığınız daha yüksektir. Neden? Ekonomistler, bunun neredeyse kesin olarak, zenginleşen ve pahalı bir araba satın alan komşunuzu kıskanmanızdan kaynaklandığını iddia ediyorlar. Bunu insan doğasına indirgeyelim. Bay Johnson, Bay Jones'un yepyeni bir BMW kullandığını görürse, Bay Johnson bir tane isteyecektir.

Ne yazık ki, Bay Johnson genellikle bir BMW alacak paraya sahip değil: ekonomistler, piyango kazanan komşularının iflas etme olasılığının önemli ölçüde daha yüksek olduğunu keşfettiler . Bu durumda Jones'a ayak uydurmak imkansız.

Ancak saha deneylerinin, piyango kadar açık bir şekilde rastgele olması gerekmez. Tesadüfleri aramaya başlar başlamaz, onları her yerde görmeye başlarsınız ve onları dünyamızın nasıl çalıştığını anlamak için kullanabilirsiniz.

Doktorlar doğal bir deneyin parçası. Hükümet, sağlık sigortası olan hastalarla çalışan hekimlerin maaşını hesaplamak için kullanılan formülleri zaman zaman esasen keyfi nedenlerle değiştirmektedir . Bazı eyaletlerdeki doktorlar, belirli prosedürler için ücretlerinin arttığını tespit ettiler. Ve diğer eyaletlerdeki meslektaşları, ücretlerinde bir düşüş olduğunu kaydetti.

İki ekonomist - eski sınıf arkadaşları Geoffrey Clemens ve Joshua Gothlieb - bu keyfi değişikliğin sonuçlarını test ettiler. Hekimler hastalarına her zaman en gerekli gördükleri tedaviyi mi reçete ederler? Yoksa maddi teşviklerle mi yönlendiriliyorlar?

parasal teşviklerle motive edilebileceğini açıkça göstermektedir25 . Prosedürler için daha yüksek geri ödeme yapılan ilçelerde, bazı doktorlar rutin olarak daha fazla katarakt , kolonoskopi ve MRI yapmak gibi en pahalı prosedürleri reçete eder .

tüm bu gereksiz prosedürleri uyguladıktan sonra hastaları iyileşiyor mu ? Clemens ve Gottlieb yalnızca " pek bir gelişme olmadığını" bildirdi. Yazarlar mortalite oranı üzerinde istatistiksel olarak anlamlı herhangi bir etki bulmadılar . Bu saha deneyi, doktorların belirli prosedürleri reçete etmesi için daha güçlü finansal teşvikler yaratmanın, bazı doktorları hastaların sağlığını önemli ölçüde etkilemeyen ve yaşamlarını uzatmaya veya iyileştirmeye yardımcı olmayan tedaviler yazmaya yönelttiğini göstermektedir .

Saha deneyleri, yaşam ve ölüm sorularını yanıtlamaya yardımcı olabilir. Ayrıca bazı gençler için önemli olan soruların yanıtlanmasına da yardımcı olabilirler.

Stuyvesant Lisesi (genellikle The Sty olarak bilinir) , Aşağı Manhattan'daki Dünya Ticaret Merkezi'nden birkaç blok ötede, Hudson Nehri'ne bakan 150 milyon dolarlık, 10 katlı bej tuğla bir binada yer almaktadır . Tek kelimeyle, "Kal" etkileyici. Yedi dilde 55 Gelişmiş Yerleştirme (AP) programının yanı sıra Yahudi tarihi, bilim kurgu ve Asya Amerikan edebiyatında seçmeli dersler sunmaktadır . 28 mezunun yaklaşık dörtte biri Ivy League üniversitelerine [36]veya bazı prestijli kolejlere kabul ediliyor. Stuyvesant, 29. Harvard profesörü fizikçi Lisa Randall, Obama stratejisti David Axelrod, Oscar ödüllü aktör Tim Rob Beans ve yazar Gary Steingart tarafından öğretiliyor . 30 Bill Clinton, Kofi Annan ve Conan O'Brien mezuniyet töreninde sahne aldı .

Burada daha da etkileyici olan tek şey, eğitim maliyeti - 0 (sıfır) dolar. Bu bir devlet okulu, muhtemelen ülkenin en iyisi. Gerçekten de , Amerika Birleşik Devletleri'ndeki tüm devlet okullarını sıralayan yakın tarihli bir araştırma, 300.000 öğrenci ve velilerinden gelen 27 milyon değerlendirmeyi inceledi. Bu çalışmada “Kal” 31. sırada yer aldı . Hırslı New York orta sınıf ebeveynlerinin ve onların eşit derecede hırslı torunlarının buraya gelmek için can atmasına şaşmamalı .

bir sigorta satıcısının oğlu ve öğretmen olan Ahmet Yılmaz için [37]The Stay "O lise" idi.

Yılmaz, "İşçi sınıfı ve göçmen aileler, Sürü'yü sosyal basamakları yükseltmek için bir fırsat olarak görüyor" diye açıklıyor. "Çocuğunuz The Flock'a giderse, ülkedeki en iyi yirmi üniversiteden birine girecek . Ailen iyi olacak."

Peki Stuyvesant Okuluna nasıl girilir? Belirlenmiş beş New York ilçesinden birine yerleşmeniz ve giriş sınavlarında belirli bir sayının üzerinde puan almanız gerekecek . Bu kadar. Referanslar, denemeler, mirasın tanınması veya diğer pekiştirici eylemler yok . Bir gün, bir test, bir değerlendirme. Puanınız belli bir eşiğin üzerindeyse kabul ediliyorsunuz.

Her yılın Kasım ayında yaklaşık 27.000 New Yorklu çocuk giriş sınavlarına girmek için sıralarının başına oturur . Rekabet ciddi. Sınavlara gelen tüm çocukların “Sürü” oranı %5'ten az olacak 32 .

Yılmaz, annesinin " deli gibi çalıştığını" ve bütün parasını oğlunu sınava hazırlamak için verdiğini anlatıyor. Hafta içi her gün ve her hafta sonu sınava hazırlanmak için arka arkaya birkaç ay geçirdikten sonra Yılmaz, "Kal" a gireceğinden emindi. Sonuçların olduğu zarfı aldığı günü hâlâ hatırlıyor. İki soruyu cevaplarken hata yaptı.

Ona ne hissettiğini sordum. " Dünyanın başına yıkılması ve sadece bir okul çocuğu olman nasıl bir şey sanıyorsun? " o cevapladı.

bir başka seçkin ve oldukça prestijli devlet okulu - ona perişan göründü . Ama bu Kalmadı. Ayrıca Yılmaz, Bronx Science'ın geleceğin teknisyenleri için daha uzmanlaşmış bir okul olduğunu düşünüyordu. Dört yıl sonra Princeton Üniversitesi'nden reddedildi. Tufts Üniversitesi'ne gitti ve ardından birkaç kariyer yolu denedi. Bugün "aptalca" bir işi olduğunu ve istediği gibi maaş alamadığını söylese de, şirketlerden birinde oldukça başarılı bir çalışan .

"Kal" a düşseydi hayatının nasıl olacağını düşündüğünü itiraf etti . “Farklı olurdu” diyor. "Kelimenin tam anlamıyla tanıdığım herkesin farklı bir hayatı oldu." Stuyvesant Lisesi'ne girmenin kendisine Princeton veya Harvard'da daha yüksek giriş sınavı puanları (her ikisinin de Tufts'tan çok daha iyi olduğuna inanıyor) ve muhtemelen daha iyi maaşlı bir iş sağlayacağına inanıyor.

İnsanlar hipotezleri çözmeye bayılırlar ve bu, eğlenceden kendi kendine eziyete kadar her şey olabilir. O kıza doğru bir adım atsam hayatım nasıl olurdu ya da

o çocuğa? Bu işi kabul edersem? Bu okula gidersem? Ancak bu “ya eğer”lerin bir cevabı yok. Hayat bir video oyunu değildir. İstediğiniz sonucu elde edene kadar çeşitli senaryolarda çoğaltamazsınız .

Ünlü yazar Milan Kundera, Varolmanın Dayanılmaz Hafifliği adlı romanında bunu meşhur bir şekilde söylemiştir : “İnsan yalnızca bir kez yaşar ve bu nedenle hangi kararların iyi, hangilerinin kötü olduğunu belirleyemeyiz. Herhangi bir durumda yalnızca tek bir karar verebiliriz; farklı çözümleri karşılaştırabileceğimiz ikinci, üçüncü veya dördüncü bir hayata sahip olmayacağız .

Yılmaz hiçbir zaman sınavdan iki puan fazla aldığı bir hayat yaşayamayacaktır.

hayatının ne kadar farklı olabileceğine (ya da olmayabileceğine) dair bir fikir edinmenin bir yolu vardır - çok sayıda Stuyvesant mezunu üzerinde çalışmak.

Aptalca, naif yöntem, Stuyvesant'a giren tüm öğrencileri ve olmayanları karşılaştırmaktır . AP testleri ve sınavlarının sonuçlarını, hangi üniversitelere kabul edildiğini inceleyebiliriz . Bunu yaparak, Flock'a giren öğrencilerin standart testlerde önemli ölçüde daha iyi performans gösterdiğini ve önemli ölçüde daha prestijli üniversitelere kabul edildiğini görecektik . Ancak, bu bölümde gördüğümüz gibi, bu tür kanıtlar kendi başına ikna edici değildir. Belki de Stuyvesant mezunlarının çok daha iyi sonuçlarının nedeni en başta Sty'nin en iyi öğrencileri çekmesidir? Korelasyon nedenselliği kanıtlamaz .

Lisesi'nde nedenselliği test etmek için , neredeyse özdeş iki grubu karşılaştırmalıyız : The Flock'a gidenler ve gitmeyenler. Doğal bir deneye ihtiyacımız var . Ancak verileri nerede bulabiliriz?

Cevap: Stuyvesant'a kabul için gerekli olana çok yakın bir sonuç gösteren Yılmaz gibi öğrencilere teşekkürler [38]. Geçme puanının biraz gerisinde kalan okul çocukları kontrol grubu olacak ve bunu puanlayanlar çalışma grubu olacak.

yetenek veya çalışma yeteneği açısından önemli ölçüde farklılık gösterdiğinden şüphelenmek için hiçbir neden yoktur . Sonuçta, bir kişinin sınavda diğerinden yalnızca bir veya iki puan daha fazla puan aldığı gerçeğini ne belirler? Birkaç puan alan kişi on dakika daha az uyumuş veya yeterince besleyici olmayan bir kahvaltı yapmış olabilir mi ? Testte daha yüksek puan alan kişi , sınavdan üç yıl önce büyükannesiyle yaptığı bir konuşmada duyduğu özellikle zor bir kelimeyi zamanında hatırlamış olabilir mi ?

Aslında, bu fiziksel deney kategorisi ( açık bir sayısal limitin kullanılması) o kadar etkilidir ki, ekonomistlerden kendi adını almıştır - "süreksizlik". Herhangi bir zamanda, insanları iki farklı gruba ayıran kesin bir sayı vardır ; bir boşluk (ekonomistler karşılaştırabilir) veya bir gerileme (insanların sonuçları kırılma noktasına çok çok yakındır).

hapishanelerde sert hapishane koşullarının gelecekteki suçların olasılığı üzerindeki etkisini test etmek için kullandılar . Amerika Birleşik Devletleri'ndeki federal mahkumlara, suçlarının niteliğine ve sabıka geçmişine göre puanlar atanır. Puanların toplamı, bakım koşullarını belirler. Yeterince yüksek puan alanlar ceza kolonilerine gidecek, bu da diğer insanlarla daha az temas, daha az hareket özgürlüğü ve büyük olasılıkla gardiyanlardan veya diğer mahkumlardan daha fazla şiddet gelmesi anlamına geliyor.

azami güvenlikli cezaevlerine gönderilen mahpuslarla, özgürlüğü daha yüksek olan cezaevlerine gönderilen mahpusları karşılaştırmak haksızlık olur . İlki arasında daha fazla katil ve tecavüzcü olacak, ikincisi arasında uyuşturucu bağımlıları ve küçük hırsızlar olacak.

Ancak sınırlayıcı değerin biraz üstünde ve biraz altında olanlar adli sicil ve geçmiş açısından hemen hemen aynı çıktı. Ancak bu ufak fark, çok farklı bir hapishane deneyimine yol açar.

Sonuç? Ekonomistler , daha zor koşullarda yaşayan mahkumların yeniden suç işleme olasılığının daha yüksek olduğunu bulmuşlardır . Hapishanelerdeki sert koşullar onları suçtan çok caydırmadı, yumuşattı ve onları daha acımasız yaptı.

Öyleyse, "süreklilik" Stuyvesant Lisesi ortamına nasıl uygulanır? Massachusetts Institute of Technology ve Duke Üniversitesi'nden bir ekonomist ekibi —Atila Abdulkadir-oglu, Joshua Engrist ve Parag Pathak—çalışmayı yönetti. Bilim adamları, New York'tan okul çocuklarının hayatlarını karşılaştırdı - hem "Sürüye" girenler hem de değiştirme sınavında birkaç puan almayanlar . Yani Stuyvesant sınavında bir iki soruya cevap veremeyen Yılmaz gibi yüzlerce öğrencinin akıbetini incelediler. Ve sonra bunları, en iyi sonucu gösteren ve geçme puanını bir veya iki puan aşan yüzlerce okul çocuğunun hayatlarıyla karşılaştırdılar . Başarı ölçütleri AP puanları [39], SAT puanlarıydı.[40] ve sonunda geldikleri kolejlerin sıralamaları .

Bu bilim adamlarının şaşırtıcı sonuçları, çalışmanın sonuçlarına dayanarak yazılan makalenin başlığında çok doğru bir şekilde belirtilmiştir : "Elit Yanılsaması." Stuyvesant Lisesi sonuçları 34 ? Hiçbiri. Nada. Sıfır. HAYIR. Geçme puanının her iki tarafındaki öğrenciler neredeyse aynı AP puanları, ayırt edilemez SAT puanları aldılar ve eşit oranlarda prestijli üniversitelere girdiler.

Bilim adamları, "Sürü" mezunlarının hayattaki en iyi başarılarının tek nedeninin, en yetenekli çocukların bu okula gitmesi olduğu sonucuna vardılar. The Flock'ta okumak , öğrencilerinin sınavlarda daha başarılı olmalarını veya daha iyi kolejlere girmelerini sağlamaz .

Ekonomistler, "Çok sayıda öğrenci için, okuldaki bir yer için yapılan sınavdaki yoğun rekabet, öğrenmeyi geliştirmede haklı görünmüyor" diye yazmıştı.

Hangi okula gittiğin neden önemli değil? Birkaç hikaye bu soruya cevap verebilir. İki öğrenciyi daha düşünün , iki genç New Yorklu Sarah Kaufman ve Jessica Eng. Her ikisi de erken yaşlardan itibaren Sürü içinde olmayı hayal etti. Kaufman'ın sonucu, geçme puanından bir yüksek çıktı. Sadece bir sorunun cevabı, bunu başarmasına izin verdi . Sarah, "Bu kadar heyecan verici başka bir şey olabileceğini sanmıyorum ," diye hatırlıyor. Eng'in sonucu pasın bir puan altındaydı. Kaufman hayalindeki okula gitti ama Ang gitmedi.

Peki onların hayatı nasıldı? Her ikisi de başarılı ve ödüllendirici kariyerlere devam ettiler - sınavlarda ilk %5'e giren çoğu insan gibi . İronik bir şekilde Eng, okul günlerini büyük bir zevkle hatırlıyor. Okuduğu Bronx Science, Holokost müzesi olan tek liseydi. Jessica küratörlük yapmaktan hoşlandığını keşfetti ve ardından Cornell'de antropoloji okudu.

Kaufman ise tüm öğrencilerin reytinglere aşırı önem verdiği The Flock'ta biraz kaybolmuş hissetti. Öğrenmeye değil, test etmeye çok fazla önem verilmiş gibi görünüyordu. Deneyimini "doğal hodgepodge" olarak adlandırdı. Ama bu bir öğrenme deneyimiydi. Okulda, yalnızca öğrenmeye daha fazla önem verilen bir liberal sanatlar üniversitesinde okuyacağını fark etti. Ve hayallerinin üniversitesine girdi - Wesleyan Üniversitesi. Orada, Sarah başkalarına yardım etme tutkusunu keşfetti ve bugün bir halkla ilişkiler avukatı.

İnsanlar koşullara uyum sağlayabilir ve başarılı olacak olanlar her durumda bir avantaj bulacaktır. Sizi zirveye taşıyan unsurlar, yeteneğiniz ve enerjinizdir. En iyi moda okullarından moral konuşmalarına veya diğer avantajlara ihtiyacınız yok .

Bu sadece bir çalışma. Ve vardığı sonuçlar muhtemelen "Stuyvesant" a girmeyen öğrencilerin çoğunun kişisel bir eğitim kurumundan farklı bir yerde kalması gerçeğiyle zayıfladı. Ancak, en iyi okula gitmek başarı olasılığına çok az katkıda bulunsa da, iyi bir okula gitmenin çok önemli olduğuna dair artan kanıtlar var .

Üniversiteye gidelim. Harvard gibi dünyanın en iyi üniversitelerinden birine veya Pennsylvania Eyalet Üniversitesi gibi ciddi bir okula girmek önemli mi ?

okuldaki test puanları ile insanların ne kadar para kazanacağı arasında net bir ilişki vardır . Kariyerine başladıktan on yıl sonra, ortalama bir Harvard mezunu 123.000 dolar kazanıyor . Ve başka bir üniversiteden ortalama mezun 87.800 dolar .

Ancak bu korelasyon nedensellik anlamına gelmez .

İki ekonomist, Stacey Dale ve Alan Krueger, seçkin okulların mezunlarının gelecekteki kazançları üzerindeki etkisinin nedenselliğini test etmenin ustaca bir yolunu buldular . Bilim adamları, lise öğrencileri hakkında, üniversiteye nerede başvurdukları , üniversiteye nerede kabul edildikleri , üniversiteye gittikleri yer, aileleri, yetişkin olarak gelirleri dahil olmak üzere geniş bir veri setine sahipti .

Çalışma ve kontrol gruplarını bir araya getirmek için Dale ve Krueger, öğrencileri aynı lise tarafından kabul edilen ancak başkaları tarafından seçilen benzer hikayelerle karşılaştırdı. Harvard'a kabul etmek istediğiniz öğrencilerden bazıları Pensilvanya Üniversitesi'ne gitti. Belki bir kıza veya bir erkeğe daha yakın olmak için. Ya da öğrenmek istedikleri bir öğretmen olduğu için . Başka bir deyişle , kabul ofisine göre bu öğrenciler, Harvard'a gidenler kadar yetenekliydi. Ama sonunda, farklı öğrenme deneyimleri yaşadılar.

Yani benzer geçmişleri olan iki öğrenci vardı ama biri Harvard'a, diğeri Pennsylvania Eyalet Üniversitesi'ne gitti . Sonra ne oldu? Araştırmacıların sonuçları, Stuyvesant Lisesi çalışmasından elde edilen veriler kadar etkileyiciydi. Bu öğrenciler kariyerlerini aşağı yukarı aynı gelirle sonlandırdılar. Gelecekteki maaşlar kıstas ise , prestijli okullara kabul edilen ancak farklı üniversitelerde okumak isteyen benzer öğrenciler, kariyer basamaklarında aşağı yukarı aynı basamaklarda yer alırlar .

, Ivy League kolejlerine giden son derece başarılı insanlarla ilgili makalelerle dolu . Örneğin , Microsoft'un kurucusu Bill Gates ve Facebook'un kurucuları Mark Zuckerberg ve Dustin Moskovitz - hepsi Harvard'da okudu. (Bu arada, hepsi okulu bıraktı, bu da bir Ivy League eğitiminin değeri hakkında başka soruları gündeme getiriyor.)

Bir Ivy League üniversitesine gidecek kadar yetenekli olan , ancak daha az prestijli bir kuruma36 gitmeyi seçen ve daha sonra hayatta son derece başarılı olan insanların hikayeleri de var . Örneğin Warren Buffett, kariyerine Ivy League University of Pennsylvania's Wharton School of Business'ta başladı, ancak daha ucuz olduğu için University of Nebraska-Lincoln'a transfer oldu. Ayrıca Philadelphia'dan nefret ediyordu ve Wharton'u sıkıcı buluyordu. Araştırmalar, kazanç açısından daha az prestijli bir okul seçmenin harika bir karar olduğunu gösteriyor. En azından Buffett ve onun gibiler için.

Bu kitabın adı Herkes Yalan Söyler. Bu, tüm insanların
en iyi şekilde görünmek için - arkadaşlarına, anketlerde ve kendilerine - yalan söylediği anlamına gelir.

Ama dünya da yanlış, yanıltıcı bilgiler vererek bizi kandırıyor. Dünya bize Harvard'dan çok sayıda başarılı mezun gösteriyor, ancak Pennsylvania Üniversitesi gibi devlet üniversitelerinden daha az başarılı mezun veriyor. Sonuç olarak , Harvard'a girmenin büyük bir avantaj olduğuna inanıyoruz .

dünyanın sağladığı verileri doğru yorumlayabilir ve neyin gerçekten faydalı neyin işe yaramadığını anlayabiliriz.

Saha deneyleri, önceki bölümde tartışılan problemlere de uygulanabilir. Genellikle daha fazla ayrıntı, çalışma ve kontrol gruplarına bölünmeyi gerektirirler: Super Bowl örneğinde şehirlere ; tıbbi prosedürler için fiyatları araştırırken ilçeler; Stuyvesant okulu ile yapılan bir deneyde, geçer puanın biraz gerisinde kalan ve biraz daha fazla puan alan öğrenciler üzerinde. Ve bir önceki bölümde tartışıldığı gibi ayrıntı düzeyi , genellikle dünya dijitalleştikçe giderek daha fazla kullanılabilir hale gelen çok daha büyük —kapsamlı— veri kümeleri gerektirir. Doğanın bir sonraki saha deneylerini ne zaman yapmayı planladığını bilmediğimiz için, sonuçları ölçmek için küçük bir araştırma yapamayız. Bizi neyin ilgilendirdiğini izole etmek için, zaten var olan birçok veriye ihtiyacımız var. Büyük veriye ihtiyacımız var .

Bu bölümde ayrıntılı olarak açıklanan saha deneylerinden (bizimki veya doğanın kendisi tarafından düzenlenen ) bahsederken belirtilmesi gereken önemli bir nokta daha var. Bu kitabın çoğu, bize çevremizdeki dünyayı anlamayı öğretmeye odaklandı - Obama'nın ne kadar ırkçılıkla uğraşmak zorunda kaldığı, gerçekte kaç kişinin gey olduğu, kadın ve erkeklerin bedenleri hakkında ne kadar güvensiz oldukları. Ancak bu kontrollü veya doğal deneylerin pratik uygulamaları da vardır . Karar verme sürecini iyileştirmeyi, hangi eylemlerin faydalı olup hangilerinin olmadığını anlamaya yardımcı olmayı amaçlarlar .

Şirketler nasıl daha fazla müşteri elde edeceklerini öğrenebilirler . Hükümetler, doktorları daha iyi motive etmek için tazminatı nasıl kullanacaklarını öğrenebilirler . Öğrenciler hangi okulların en çok yardımcı olacağını öğrenebilirler. Bu deneyler, büyük verilerin varsayımların, dünyevi bilgeliğin ve güvenilmez bağıntıların gerçekte doğru olan şeyle, yani nedensellikle yer değiştirme potansiyelini gösteriyor .

BÖLÜM III

BÜYÜK

VERİ: DİKKATLİ TAŞIMA

7. Bölüm

«С

BÜYÜK
VERİ SCHMAN'DIR:
NE YAPAMAZLAR?

Hayır, Lawrence Summers sizinle tanışmak istiyor ," biraz şifreli bir mektup aldım . Akademik danışmanlarımdan biri olan Lawrence Katz'dandı . Katz, Summers'ın neden işimle ilgilendiğini söylemedi , ancak daha sonra bunun farkında olduğunu öğrendim.

Summers'ın ofisinin dışındaki bekleme odasında oturuyordum. Biraz gecikmeden sonra , eski ABD Hazine Bakanı, Harvard Üniversitesi'nin eski Rektörü ve ekonomi alanında en büyük ödüllerin sahibi beni katılmaya davet etti.

, sekreterinin kendisi için yazdırdığı ırkçılığın Obama'nın çalışmaları üzerindeki etkisine ilişkin makalemi okuyarak başladı . Summers, hızlı okuma yöntemine sahiptir. Bu sırada bazen dilinin ucunu sağa doğru uzatırken gözleri hızla sola, sağa ve sayfada aşağı doğru hızla kayar. Mears'ın kendisi , bilimsel bir çalışmanın metnini okurken, bana büyük bir piyanistin bir sonat icra etmesini hatırlatıyor. O kadar odaklanmış ki diğer her şeyi unutmuş görünüyor . Beş dakikadan az bir sürede 13 sayfalık bir makale okudu .

«Örneğin, Google'da arama yapmak için «ниггер» предполагают расизм, — сказал Саммерс. - Gerçeğe benziyor. Obama'nın nerede Kerry'den daha az destek alacağını tahmin ediyorlar. Bu ilginç ama. Gerçekten Obama ve Kerry'nin birbirine benzediğini söyleyebilir miyiz ?"

"Siyaset bilimciler tarafından benzer ideolojilere sahip olarak sınıflandırıldılar," diye yanıtladım. “Ayrıca ırkçılık ile Beyaz Saray'daki değişiklikler arasında hiçbir bağlantı yok . Demografi, kiliseye devam ve silah bulundurmayı eklesek bile sonuç aynı kalıyor." Biz ekonomistler böyle söylüyoruz . Çok heyecanlıydım.

Summers durup bana baktı. Bir an için CNBC'ye ayarlı televizyona döndü . Sonra tekrar bana baktı, sonra televizyona , sonra tekrar bana. Summers, "Tamam, bu makaleyi beğendim," dedi. Başka ne üzerinde çalışıyorsun?

Sonraki 60 dakika, belki de hayatımın entelektüel açıdan en baş döndürücü dakikasıydı . Summers ve ben faiz oranları ve enflasyon, polislik ve suç, ticaret ve hayırseverlik hakkında konuştuk. Summers ile tanışan birçok insan onun büyüsüne kapılır. Şüphesiz şimdiye kadar tanıştığım en zeki adamla konuşma zevkini yaşadım . Summers bana inanılmaz derecede akıllıca göründü. Yeni fikirler onu her şeyden çok cezbeder - ve bu genellikle onun için önemli sorunlar yaratır gibi görünür. Bilimde kadın eksikliğinin nedenlerinden birinin erkekler arasındaki IQ'daki çok daha fazla değişkenlik olabileceğini öne sürdükten sonra Harvard'daki görevinden ayrılmak zorunda kaldı. Summers bir fikri ilginç bulursa, birinin kulağını acıtsa bile genellikle onun hakkında konuşur.

planlanan bitiş saatinden bir buçuk saat geçti . Sohbet uzadı ama Summers'ın bana neden ihtiyacı olduğu, ne zaman gitmem gerektiği ve bunu nasıl bileceğim konusunda hâlâ hiçbir fikrim yoktu. Görünüşe göre Summers o anda bu toplantıyı neden ayarladığını muhtemelen unutmuş.

Ve sonra milyon veya belki de milyar dolarlık soruyu sordu. “Herhangi bir veriye dayanarak borsayı tahmin edebileceğinizi düşünüyor musunuz ?”

Aha! Sonunda buraya neden çağrıldığımı anladım.

Summers bana bu soruyu soran ilk kişi değildi. Babam çoğunlukla geleneksel olmayan bilimsel ilgilerimi destekliyordu. Ama konuyu bir kez gündeme getirdi. Irkçılık, çocuk istismarı, kürtaj” dedi. "Bundan kendin için para kazanamaz mısın?" Diğer aile üyeleri ve arkadaşlar da bundan bahsetti. İnternetteki meslektaşlardan ve yabancılardan bahsetmiyorum bile. Hisse senedi satın almak için Google aramalarını ve diğer büyük veritabanlarını kullanıp kullanamayacağımı herkes bilmek istiyor gibiydi . Şimdi onlara eski bir Birleşik Devletler Hazine Bakanı katıldı. Zaten daha ciddiydi.

Peki yeni büyük veri kaynakları, hangi hisse senetlerinin en iyi performansı göstereceğini başarıyla tahmin edebilir mi ? Kısa cevap hayır.

Önceki bölümlerde, büyük verinin dört güçlü faydasını tartışmıştık. Bu sefer sınırlamalarından, onlarla neleri yapamayacağımızdan ve bazen onları nasıl kullanmamamız gerektiğinden bahsedeceğiz. Bu sohbete benim ve Summers'ın borsalarda başarısız kazanma girişimiyle ilgili bir hikayeyle başlamaya karar verdim .

Bölüm 3'te , bir alanda veya başka bir alanda halihazırda yürütülen çalışmaların sonuçsuz sonuçları durumunda yeni verilerin yararlı olma olasılığının daha yüksek olduğunu belirtmiştik . Acı bir gerçek: Irkçılık, çocuk istismarı veya kürtaj hakkında yeni içgörüler elde etmek, bir işletmenin nasıl çalıştığıyla ilgili olmaktan çok daha kolay. Bu , iş verimliliğinde en ufak bir avantaj arayışına gerçekten büyük kaynakların harcanmasının bir sonucudur . Finans alanında rekabet son derece şiddetlidir.

Diğer insanların zihinlerine övgüler yağdırmaya meyilli olmayan Summers, hedge fonların şimdiden önümüzde olduğundan emindi . Sohbetimiz sırasında, onlardan bu kadar saygılı bahsetmesinin yanı sıra, tekliflerimin çoğunu beklediklerine olan inancından çok etkilendim . Yanıt olarak, Google Trends'i kullanarak daha eksiksiz veriler elde etmemi sağlayan, kendi geliştirdiğim bir algoritmayı onunla gururla paylaştım . Çok havalı olduğunu söyledi. Kantitatif bir serbest fon olan Rönesans'ın böyle bir algoritma bulup bulamayacağını sorduğumda kıkırdadı ve "Evet, elbette tahmin edebilirlerdi" dedi.

Borsaları kazanmak için yeni büyük veri kümelerini kullanmayı düşünürken Summers ve benim karşılaştığımız tek sorun hedge fonlarla rekabet etmenin zorluğu değildi .

BOYUT SAYISININ LANETİ

Diyelim ki borsa tahmin stratejiniz yazı tura atmak. Ancak aynı zamanda zorlu testler temelinde oluşturulmuştur. İşte tekniğiniz: 1'den 1.000'e kadar bin madeni parayı etiketlersiniz İki yıl boyunca her sabah tüm madeni paraları çevirirsiniz, yazı mı tura mı geldiğini kaydedersiniz ve ardından Standard & Poor's endeksinin o gün yükselip yükselmediğine bakarsınız. veya aşağı. Sürekli olarak tüm istatistikleri analiz ediyorsunuz . Ve işte! Bir şey mi keşfettin ? Atışların %70,3'ünde, S&P yükseldiğinde 391 numaralı madeni paranın yazıya düştüğü ortaya çıktı . İlişki istatistiksel olarak anlamlıdır, düzeyi yüksektir. Şanslı paranı buldun!

Şimdi her sabah çöpe atın ve yazı geldiğinde hisse satın alın. Tişört giyip boş erişte yeme günleriniz sona erdi. Mo neta 391, iyi yaşama biletiniz!

Ya da değil.

Vol'un "boyutların laneti"nin en şeytani yönlerinden birinin bir başka kurbanı oldunuz . Çok fazla değişkeniniz (veya "boyutunuz") olduğunda ve çok fazla gözleminiz olmadığında vurabilir : bu durumda, bu iki yılda sırasıyla bin madeni para ve 504 işlem günü. Bu boyutlardan biri - madeni para 391 - büyük olasılıkla şanslı. Değişken sayısını azaltın - sadece 100 jeton atın . Ve şanslı olma olasılığınız önemli ölçüde azalacaktır. S&P endeksinin 20 yıllık davranışını tahmin etmeye çalışarak gözlem sayısını artırın ve madeni paralar itibarını kaybetmemeye çalışacaktır.

"Boyutsallığın laneti", büyük verilerle çalışırken büyük bir sorundur, çünkü yeni veri kümeleri bize asla geleneksel kaynaklardan katlanarak daha fazla değişken vermez - her arama sorgusu, her tweet kategorisi vb. Bazı büyük veri kaynaklarından piyasa hareketlerini tahmin edebildiğini iddia eden birçok kişi, bu lanetin altına düştü. Gerçekten yaptıkları tek şey 391 madeni paranın eşdeğerini bulmaktı.

Örneğin, Indiana Eyalet Üniversitesi ve Manchester Üniversitesi'nden bilgisayar bilimcilerinden oluşan bir ekibi ele alalım . Bu uzmanlar, tweet'lere dayalı olarak pazar dinamiklerini tahmin edebildiklerini iddia ettiler 1 . Bölüm 3'te tartışılan duygu analizine benzer yöntemler kullanarak, dünyanın dört bir yanından gelen tweetlerin günlük ruh halini işlemek için bir algoritma oluşturdular. Ancak, bir değil, mutluluk, öfke, nezaket ve diğer pek çok ruh halini hesaba kattılar. . Ve "Sakinim" gibi artan sayıda sakin tweet'lerin bundan altı gün sonra Dow Jones Sanayi Ortalamasında yükselme olasılığının arttığını öne sürdüğünü buldular. Sonuçlarını kullanmak için bir hedge fonu kuruldu .

Buradaki sorun nedir?

Ana yakalama, bilim adamlarının çok fazla elementi test etmeleridir. Yeterince değişkeni rastgele incelerseniz , bunlardan biri istatistiksel olarak anlamlı olacaktır. Pek çok duyguyu incelediler, her duyguyu borsanın tahmin etmeye çalıştığı günden bir, iki, üç, yedi gün önce test ettiler . Ve tüm bu değişkenler , Dow'un sadece birkaç aydaki iniş çıkışlarını açıklamaya çalışmak için kullanıldı .

borsanın meşru bir göstergesi değildi . O zamanlar varsayımsal 391 madeni paramızın büyük veri eşdeğeriydi . Tweet tabanlı koruma fonu, düşük getiri nedeniyle piyasaya sürüldükten bir ay sonra kapandı 2 .

"Boyutsallığın lanetinden" muzdarip olan piyasaların dinamiklerini tahmin etmeye çalışan sadece hedge fonları değil . Aynı problemler, kim olduğumuzu açıklayan genetik ipuçlarını bulmaya çalışan bilim adamları için de ortaya çıktı.

İnsan Genomu Projesi sayesinde artık tam insan DNA'sı toplanıp analiz edilebilir. Bu projenin potansiyeli muazzam görünüyordu.

şizofreniden sorumlu geni bulabiliriz . Belki Alzheimer hastalığına, Parkinson hastalığına ve amiyotrofik lateral skleroza neden olan bir gen bulabiliriz . Belki bir gen bulabiliriz - vay canına! - yüksek düzeyde zeka için. IQ'ya birkaç puan ekleyebilecek bir gen var mı ? Dehayı yaratan bir gen var mı?

1998'de önde gelen bir davranışsal genetikçi olan Robert Plomin, cevabı bulduğunu iddia etti. Yüzlerce öğrencinin DNA ve zeka seviyelerini içeren bir veri seti aldı. "Akıllıların" (160 veya daha yüksek IQ'lu öğrenciler) DNA'sını, ortalama IQ'lu öğrencilerin DNA'sıyla karşılaştırdı.

Ve bu iki grubun DNA'sında çarpıcı bir fark bulundu. Bu fark , beyin metabolizmasında yer alan, belirsiz ama güçlü bir gen olan kromozom 6'nın küçük bir köşesinde bulunuyordu . Bu genin IGF2r adı verilen bir versiyonu, daha zeki insanlarda iki kat daha yaygındı.

New York Times, "Yüksek Zekayla Bağlantılı İlk Gen Bildirildi ," manşetlerini attı.

Plomin'in keşfinden bu yana ortaya çıkan birçok etik soru hakkında düşünebilirsiniz . Ebeveynler bir kez daha çocuklarını IGF2r geninin varlığı için test etmeye karar vermeli mi ? Fetüsün IQ'su düşükse kürtaja izin verilmeli mi? İnsanlara yüksek IQ'lar vermek için genetik olarak değiştirilebilir mi ? IGF2r ırkla ilişkili midir ? Bu sorunun cevabını bilmek istiyor muyuz? IQ ile bağlantılı olarak genetik araştırmalara devam edilmeli mi ?

zorunda kalan biyoetikçiler sorunu çözmeye başlamadan önce, Plomin'in kendisi de dahil olmak üzere genetikçilerin daha basit bir sorusu vardı : Sonuç ne kadar doğruydu? IGF2r'nin zeka seviyesini belirlediği gerçekten doğru mu ? Dahilerin bu geni taşıma olasılığının iki kat daha fazla olduğu gerçekten doğru mu ?

HAYIR. İlk çalışmadan birkaç yıl sonra Plomin, DNA ve IQ puanları da dahil olmak üzere başka bir insan örneğinden alınan verilere erişim sağladı . Bu kez IGF2r, IQ ile ilişkili değildi. Plomin - ve bu vicdanlı bir bilim adamının işaretidir - açıklamalarını geri aldı .

Aslında bu, genetik ve IQ alanındaki genel araştırma şemasının uygulanmasıdır. İlk olarak, bilim adamları IQ seviyesini belirleyen genetik bir faktör bulduklarını bildirdiler. Sonra yeni veriler aldılar ve orijinal ifadenin yanlış olduğunu gördüler.

Örneğin, son zamanlarda Christopher Chabry liderliğindeki bir bilim insanı ekibi, IQ ile ilişkili genom varyantları hakkında 12 yüksek profilli iddiayı inceledi. Uzmanlar 10.000 kişinin verilerini incelediler ve 12 uygulamanın 3 hiçbiri için korelasyon oluşturamadılar .

Tüm bu durumlarda sorun nedir? "Boyutluluğun Laneti ". Bilim adamlarının artık bildiği gibi, insan genomu milyonlarca element tarafından ayırt edilir. Yani, basitçe söylemek gerekirse , test edilecek çok fazla gen var.

Borsa ile ilişkili olup olmadığını görmek için yeterince tweet'i analiz ederseniz , yalnızca ara sıra gerçekten ilişkili olan bir tweet bulacaksınız. IQ ile ilişkili olup olmadıklarını bilmek için yeterince genetik varyant denerseniz , doğru olanı yalnızca şans eseri bulacaksınız.

"Boyutsallığın laneti"nin üstesinden nasıl gelinir? İşiniz konusunda alçakgönüllü olmalısınız ve sonuçları konusunda kafanızı kaybetmemelisiniz. Bunları ek testlerle doğrulamanız gerekir . Örneğin, tüm birikiminizi 391 jetonuna yatırmadan önce, önümüzdeki birkaç yıl içinde neler olacağına bakmakta fayda var . Sosyologlar buna "örnek dışı" test diyorlar. Ve ne kadar çok değişken eklerseniz, o kadar mütevazı olmanız gerekir. Ne kadar çok değişken eklerseniz, örneklem dışı testin o kadar sıkı olması gerekir. "Boyutların laneti"nin kurbanı olma olasılığınızın ne kadar yüksek olduğunu ve sonuçlar hakkında ne kadar şüpheci olmanız gerektiğini tam olarak söyleyebilmeniz için her çalışmanın performansını dikkatle izlemek de önemlidir . Bu da bizi Larry Summers ile yaptığımız sohbete geri getiriyor . Bu şekilde piyasayı yenmeye çalıştık .

, bir şirketin (Apple gibi) hisse senetlerinin gelecekteki performansına ışık tutabilecek önemli ürünlerin (iPhone gibi) satışlarını tahmin etmek için arama sorgularını kullanmaktı . Gerçekten de, iPhone aramaları ile iPhone satışları arasında bir ilişki var . İnsanlar Google'da sık sık "iPhone" yazdığında, bu telefonlardan çok sayıda indirimde olduğuna bahse girebilirsiniz . Ancak bu bilgi daha şimdiden Apple hisselerinin fiyatına dahil edilmiş durumda. Görünüşe göre, Google'a iPhone'lar hakkında çok şey sorulduğunda, hedge fonları , arama sorgusu verilerini veya başka bir kaynağı kullanıp kullanmadıklarına bakılmaksızın iyi satış yapacaklarını da anladılar .

Summers'ın bir sonraki fikri, gelişmekte olan ülkelerdeki yatırımları tahmin etmekti. Yakın gelecekte çok sayıda yatırımcı örneğin Brezilya veya Meksika'ya yatırım yapmaya başlarsa, bu ülkelerdeki şirketlerin payları şüphesiz artacaktır . Belki de "Meksika'da yatırım" veya "Brezilya'da yatırım fırsatları" gibi önemli Google aramalarını kullanarak yatırım büyümesini tahmin edebiliriz . Bunun bir çıkmaz sokak olduğu ortaya çıktı. Sorun? Bu tür arama sorguları çok nadirdi. Önemli kalıpları ortaya çıkarmak yerine, bu veriler sürekli olarak birinden diğerine sıçradı.

Tek tek şirketlerin hisse senetlerini incelemeye çalıştık . Belki de insanlar "GOOG" kelimesini ararlarsa bu, Google hisselerini satın alacakları anlamına gelirdi . Bu tür soruşturmaların, bu hisse senetlerinin düzgün bir şekilde işlem göreceğinin sinyalini vermesi gerekiyor. Ancak borsanın yükselip düşmeyeceğini tahmin etmiyorlar . Önemli bir sınırlama, bu aramaların bize birisinin hisse alıp satmakla ilgilenip ilgilenmediğini söylememesidir .

Bir gün, Summers ile heyecanla yeni bir fikrimi paylaştım : son "altın satın al" talepleri, altın fiyatının gelecekteki artışlarıyla ilişkili görünüyordu. Summers, bunu kontrol etmem ve sonucun doğru olduğundan emin olmam gerektiğini söyledi . Korelasyon çalışmayı durdurdu , belki de bazı hedge fonları da korelasyonu bulduğu için.

Sonuç olarak, birkaç ay boyunca yararlı bir şey bulamadık . Kuşkusuz, milyarlarca Google arama teriminin her birinde pazar performansıyla korelasyon arayacak olsaydık , marjinal de olsa işe yarayacak bir tane bulurduk. Ama bu büyük olasılıkla bizim 391 madeni paramız olurdu.

NELERİN ÖLÇÜLEBİLECEĞİNE AŞIRI ODAKLANMAK

Mart 2012'de Yale Üniversitesi'nde pazarlama profesörü olan Zoe Chance, postayla küçük beyaz bir pedometre aldı . Gün içinde attığınız adım sayısını ölçen ve ona puan veren bu cihazın sizi daha fazla egzersiz yapmaya nasıl teşvik edebileceğini keşfetmeye karar verdi .

Bundan sonra olanlar bir büyük veri kabusuydu. Chance, cihaza o kadar takıntılı hale geldi ve hızlanmaya bağımlı hale geldi ki, onu mutfaktan oturma odasına , yemek odasına, bodruma ve ofisine kadar her yere götürdü. Sabahın erken saatlerinde, gece geç saatlerde, neredeyse bütün gün yürüdü - 24 saatte 20 bin adım. Günde yüzlerce kez pedometreye baktı ve insan etkileşimlerinden geriye kalan tek şey, diğer pedometre kullanıcılarıyla sonuçları iyileştirme stratejilerini tartışan çevrimiçi sohbetlerdi . Zoe, üç yaşındaki kızına yürürken bir pedometre koyduğunu, çünkü iyileşmeyi takıntı haline getirdiğini hatırladı.

Chance o kadar takıntılı hale geldi ki her şeyin nasıl başladığını unuttu. En yüksek sonuca ulaşmanın ana hedefini unuttu - iyi bir fiziksel şekle girmek, bu yüzden kızının pedometre olmadan birkaç adım bile yürümesine izin vermedi. Ancak herhangi bir bilimsel araştırma yapmadı . Bir akşam geç saatlerde birkaç adım daha atmaya çalışırken yere yığıldıktan sonra nihayet cihazdan kurtuldu . Zoe bir veri bilimcisi olmasına rağmen , bu deneyim onun üzerinde derin bir etki yaratmıştır. Chance, " Daha fazla bilgi edinme ve fazladan verinin her zaman iyi bir şey olmadığını fark etme konusunda şüphe duymama neden oldu " dedi.

Bu hikaye, elbette aşırı bir hikaye, ancak karar vermek için verileri kullanan insanlar için potansiyel sorunlara işaret ediyor . Rakamlar cezbedici olabilir 5 . Onları takıntı haline getirebilir ve daha önemli şeyleri gözden kaçırabiliriz . Örneğin, Zoe hayattaki diğer her şeyi fark etmeyi fiilen bıraktı.

Daha az saplantılı bir sayı sevgisinin bile sakıncaları olabilir. 21. yüzyılda Amerikan okullarında ön plana çıkan sınava yapılan vurguyu düşünün . Testlere dayanarak, öğretmenler öğrenci performansını değerlendirir. Tabii ki, daha nesnel performans göstergeleri elde etme arzusu anlaşılabilir, ancak sayılarla ifade edilmesi kolay olmayan pek çok şey var. Dahası, tüm bu testler birçok öğretmeni öğrencileri kasıtlı olarak onlara hazırlamaya zorlar. Hatta bazıları, Brian Jacob ve Stephen Levitt'in bir makalesinde kanıtlandığı gibi , bu testleri yaparken kopya çekiyorlar 6 .

Sorun şudur: Ölçülebilen şey çoğu zaman tam olarak ilgilendiğimiz şey değildir. Birden çok yanıt arasından seçim yaparak öğrencilerin sorulara nasıl yanıt verdiğini değerlendirebiliriz. Ancak eleştirel düşünmeyi, merakı veya kişilik gelişimini ölçemeyiz . Kolayca ölçülebilen bir metriği (günlük test puanları veya adım sayısı) artırmaya çalışmak her zaman elde etmeye çalıştığımız şeyi başarmaz.

Kendini geliştirme çabalarında Facebook bu hatadan kaçmadı. Şirket, insanların siteyi nasıl kullandıkları hakkında tonlarca bilgiye sahiptir. Belirli bir gönderinin kaç beğeni aldığını, kaç kez tıklandığını, kaç kez paylaşıldığını görmek kolaydır . Ancak, kendisine bu önemli noktalar hakkında daha önce yazdığım bir Facebook bilgi bilimcisi olan Alex Peisakhovich'e göre , bu parametrelerin hiçbiri daha önemli soruları yanıtlamıyor: Siteyi kullanma deneyimi nasıl ? Belirli bir gönderi, kullanıcıları arkadaşlarıyla buluşturuyor mu? Bir şey öğretebilir mi? Seni güldürdü mü?

Veya 1990'larda beyzboldaki bilgi devrimini düşünün. Birçok ekip , karar vermede eski moda insan yöntemine güvenmek yerine, giderek daha karmaşık hale gelen istatistik türlerini kullanmaya başladı . Hücum ve servis sayılarını ölçmek kolaydı ama sahadaki işi ölçmek kolay değildi, bu nedenle bazı takımlar savunmanın önemini hafife almaya başladı . Nate Silver , The Signal and the Noise adlı kitabında , örneğin Moneyball verilerine bağımlı olan Oakland A'ların 1990'ların ortalarında tam olarak berbat savunma nedeniyle yılda sekiz ila on maç kaybettiğine dikkat çekti.

Bilgi miktarındaki artış nedeniyle karar her zaman verilmez . Büyük verinin daha iyi çalışmasını sağlamak için özel bir çeşniye ihtiyaç vardır: insan kararı ve küçük veri diyebileceğimiz küçük çalışmalar. Moneyball genel müdürü ve baş karakter Billy Bean, Silver ile yaptığı bir röportajda veri toplama bütçesini artırmaya çoktan başladığını söyledi .

Devasa veri havuzundaki boşlukları doldurmak için Facebook, insanlara ne düşündüklerini sormak gibi eski moda bir yaklaşımı da benimsemek zorunda kaldı. Her gün haberleri yüklerken yüzlerce Facebook kullanıcısına orada okuduklarıyla ilgili sorular soruluyordu . Başka bir deyişle, Facebook artık verileri (beğeniler, tıklamalar, yorumlar) otomatik olarak topluyor ve bunları küçük verilerle tamamlıyor ("Bu gönderiyi Haber Kaynağınızda gerçekten görmek istiyor musunuz? Neden?"). Evet, Facebook gibi inanılmaz derecede başarılı ve büyük bir şirket bile bazen bu kitapta daha önce küçümsenen bir bilgi kaynağını mümkün olan her şekilde kullanmak zorunda kalır - küçük bir anket.

ana bilgi gövdesine - çok sayıda tıklama, beğeni ve gönderi - ek olarak bu küçük veri koleksiyonu nedeniyle, Facebook ekibi istatistiklere düşünüldüğünden farklı bakabilir. Facebook , ham sayıların bize söyleyemediklerini bulmak için sosyal psikologlar, antropologlar ve sosyologlar kullanır .

Bazı eğitimciler de büyük verilerdeki kör noktaların daha fazla farkına varıyor. Testleri küçük verilerden elde edilen bilgilerle desteklemek için artan bir ulusal çaba düzeyi vardır . Öğrenci anketleri artık yaygınlaştı ve velilerle anket yapmaya ve ders sırasında öğretmenleri (diğer deneyimli öğretmenler) gözlemlemeye ilgi arttı .

Harvard'da profesör olan 7 yaşındaki Thomas Kane, "Okul bölgesi liderleri, yalnızca test puanlarına odaklanmamaları gerektiğini anlıyor " diyor. Bill & Melinda Gates Vakfı tarafından yapılan üç yıllık bir araştırma, eğitimde hem büyük hem de küçük verilerin önemini doğruluyor. Yazarlar , okul çocuklarının eğitiminin kalitesini değerlendirmek için en iyi seçeneğin test puanlarına, öğrenci anketlerine veya öğretmenlerin gözlemlerine dayalı model olduğunu analiz ettiler . Maksimum sonuç, üç bileşenin de birleştirilmesiyle elde edilir. Raporun yazarları, "Her öğe büyük resme katkıda bulunur 8 " sonucuna varıyor.

Ocala, Florida'da Jeff Seder ile yaptığım bir toplantıda öğrendiğim gibi, aslında birçok büyük veri operasyonu boşlukları doldurmak için küçük verileri kullanır. Harvard'da eğitim görmüş olan Seder'in atlar dünyasında bir guru olduğunu hatırlatayım. Amerikan Firavununun başarısını doğru bir şekilde tahmin etmesini sağlayan çok sayıda deneyden öğrendiği dersleri kullandı .

Benimle bilgi, bilgisayar dosyaları ve hesaplamaları paylaştıktan sonra Seder, kendisinin de gizli bir silahı olduğunu itiraf etti - Patty Murray.

Seder gibi Murray de yüksek bir zekaya ve elitist bir eğitime sahip - Bryn Mawr diploması. Ayrıca New York'tan taşraya taşındı. Patty, "Atları insanlardan daha çok seviyorum " diye itiraf ediyor. Ancak Murray, at seçimine yaklaşımı açısından biraz daha geleneksel . Birçok at temsilcisi gibi o da onları bizzat inceler, hareketlerini izler, yara ve bere olup olmadığını kontrol eder ve sahipleriyle konuşur.

Murray daha sonra Seder ile iletişime geçer ve hangi atları tavsiye edecekleri konusunda nihai kararı onlar verir. Murray, at sorunlarının kokusunu alıyor - en yenilikçi ve önemli verilerinin tümüne rağmen Seder'in yakalayamadığı sorunları.

Büyük veri keşiflerinin yönlendirdiği bir devrim öngörüyorum . Ancak bu, bilgileri basitçe gözden geçirebileceğimiz ve herhangi bir soruya yanıt alabileceğimiz veya etik hususları göz ardı edebileceğimiz anlamına gelmez . Ve büyük veri, insanların bin yıl boyunca geliştirdikleri her şeyi, çevrelerindeki dünyayı anlamaya çalışırken kullanma ihtiyacını engellemez. Sadece birbirlerini tamamlarlar.

8. Bölüm

DAHA ÇOK VERİ , DAHA ÇOK
SORUN? BİZE NE YAPARIZ

YAPMALI MISINIZ?

Bazen büyük verinin olasılıkları o kadar etkileyici ki korkutucu hale geliyor. Bu bizim için etik soruları gündeme getiriyor.

VERİ SİLAHLI ŞİRKETLERİN TEHLİKESİ

Son zamanlarda, üç ekonomist1 —Columbia Üniversitesi'nden Oded Netzer ve Alain Lemar ve Delaware Üniversitesi'nden Michal Herzenstein— bir borçlunun krediyi geri ödeme olasılığını tahmin etmenin yollarını arıyordu. Bilim adamları , karşılıklı borç verme web sitesi Prosper'dan veri kullandılar . Potansiyel borç alanlar, kredi için kısa bir gerekçe ve sağlayabilecekleri teminatı sunar ve potansiyel borç verenler parayı sağlayıp sağlayamayacaklarına karar verir. Genel olarak, borçluların yaklaşık %13'ü 2 kredi yükümlülüklerini yerine getirmemektedir .

Potansiyel borçluların dilinin, bir krediyi geri ödeme olasılıklarının güçlü bir göstergesi olduğu ortaya çıktı. Ve bu, kredi verenler, kredi notları ve gelirleri dahil olmak üzere potansiyel borçlular hakkında diğer ilgili bilgileri izleme olanağına sahip olsalar bile, önemli bir ölçümdür .

, bir kredi başvurusunda bulunurken yaygın olarak kullanılan araştırmacılar tarafından bulunan 10 kelime öbeği listelenmiştir . Bunlardan beşi kredi geri ödemesi ile pozitif, diğer beşi ise negatif ilişkilidir . Başka bir deyişle, ilk beş güvenilebilecek kişiler tarafından, ikinci beş ise güvenilmemesi gereken kişiler tarafından kullanılma eğilimindedir . Hangilerinin nerede olduğunu tahmin edip edemeyeceğinize bakın .

Tanrı

daha düşük faiz oranları

vergilerden sonra

söz veriyorum

ödeyeceğim

hastane

borçsuz

mezun olmak

kadınların asgari ödemesi

Teşekkür ederim

Kibar, açıkça dindar ve şeref sözü veren birinin borcunu geri ödeme olasılığı en yüksek olanlar arasında olacağı düşünülebilir -en azından ben öyle umuyorum. Aslında öyle değil. İstatistiklerin gösterdiği gibi, bu tür insanların dürüstlüğü ortalamanın altındadır.

kredinin geri ödeme olasılığı derecesine göre gruplandırılmış birkaç ifade .

Geri ödeme olasılığı yüksek kişilerin kredi başvurularında kullandığı ifadeler

borçsuz vergi sonrası mezun eşler

daha düşük pro-minimum ödeme

faiz oranları

Temerrüde düşme olasılığı yüksek kişilerin kredi başvurularında kullandığı ifadeler

Hastanenin parasını Allah         verecek        

söz veriyorum         teşekkürler

Bu çalışmanın etik sonuçlarını tartışmadan önce, yazarlarının da yardımıyla, bu çalışmanın insanlar hakkında neler söylediğine bir göz atalım. Sözcüklerin iki kategoriye ayrılmasından ne anlamalıyız ?

kredi ödemelerini yapma olasılığının daha yüksek olduğu konusunda varsayımda bulunabileceğimiz ifadeleri ele alalım . "Düşük faiz oranı" veya "vergi sonrası" gibi ifadeler, borçlunun belirli bir mali gelişmişlik düzeyine işaret eder . Bu nedenle, krediyi geri ödeme niyetiyle ilişkili olmaları belki de şaşırtıcı değildir . Ayrıca, "mezun olmak" ve "borçsuz olmak" gibi olumlu başarılarından bahsederse , bu krediyi de ödeme olasılığı daha yüksektir.

Şimdi, borçlunun krediyi geri ödeme olasılığının düşük olduğunu ima eden ifadeleri düşünün. Genel olarak, biri size kesinlikle her şeyin parasını ödeyeceğini söylerse, bunu yapmayacaktır. Ödeme taahhüdü ne kadar güvenli bir şekilde yapılırsa, ihlal edilme olasılığı o kadar yüksek olur. Biri “Söz vereceğim, Allah yardımcın olsun” diye yazarsa, krediyi geri döndürme olasılığı en düşük olan kişilerden biridir. Merhametinize itiraz ve hastanedeki bir akrabaya itiraz, kredinin geri verilme ihtimalinin düşük olduğu anlamına da gelir. Aslında, herhangi bir aile üyesinden - koca, eş, oğul, kız, anne veya baba - bahsetmek, paranızı geri alamayacağınızın bir işaretidir. Kapının geri dönmediğini gösteren bir diğer kelime de "açıkla" dır. Bu, insanlar krediyi neden ödeyeceklerini açıklamaya çalışırlarsa, büyük olasılıkla bunu yapmayacakları anlamına gelir.

Yazarların, başvurudaki minnettarlığın neden kredinin temerrüde düşme olasılığında bir artışa işaret ettiğine dair bir açıklaması yoktur.

gösteren ayrıntılı bir ödeme planının sağlanması, bu borçlunun bu krediyi geri ödeyeceği anlamına gelmez . Söz vermek, merhamet dilemek, kişinin borcunu ödemeyeceğine açık bir işarettir. Nedenleri ne olursa olsun (veya insan doğası bize ne derse desin, bu kimsenin gerçekten tutmaya niyeti olmadığı sözler verme arzusu ), bilim adamları bu testin kredi temerrüdünü tahmin etmek için son derece değerli bilgiler sağladığını bulmuşlardır . Tanrı'dan bahseden kişilerin temerrüde düşme olasılığı 2,2 kat daha fazladır, bu en yüksek temerrüt oranlarından biridir.

Ancak yazarlar, çalışmalarının etik soruları gündeme getirdiğine de inanıyor. Bu sadece akademik bir çalışma olsa da , bazı şirketler kredileri onaylarken benzer internet verilerini kullandıklarını iddia ediyor. Buna izin veriliyor mu?

Yazdığımız kelimelerin
bir krediyi geri ödeyip ödemeyeceğimizi tahmin edebildiği bir dünyada yaşamak istiyor muyuz ?
En hafif tabirle tüyler ürpertici
- ve bazen sadece korkutucu.

Yakın gelecekte, kredi arayan bir tüketici, yalnızca mali geçmişi hakkında değil, aynı zamanda çevrimiçi faaliyetleri hakkında da endişelenmek zorunda kalabilir . Ve sonuç , gönderilerin "teşekkür ederim" kelimesini kullanıp kullanmadığı veya bir tanrıdan bahsetmesi gibi saçma görünen faktörlere bağlı olabilir. Daha öte. Ya hastanede ablasına yardım etmesi gereken ve krediyi mutlaka ödeyecek olan bir kadın? Sırf tıbbi harcamalar için yardım isteyen insanların ortalama olarak genellikle yalan söylediği gerekçesiyle onu reddetmek korkunç görünüyor . Bu şekilde işleyen bir dünya çirkin görünmeye başlar.

, hizmetleri almaya uygunluğumuzu, bu hizmetlerle doğrudan ilgili olmayan soyut ama istatistiksel olarak tahmine dayalı kriterlere dayalı olarak yargılama hakları var mı ?

Finans dünyasını bırakalım. Daha ciddi sonuçları olan durumlara bakalım - örneğin işe alırken. İşverenler, adayları değerlendirirken giderek daha fazla sosyal medyaya bakıyor . Önceki işverenlerine kötü söz söylemek veya önceki bir işten gizli bilgileri ifşa etmek için kanıt arıyorlarsa sorun yok . Facebook veya Instagram gönderilerinde aşırı içki içtiği görülen birini işe almayı reddetmek için bile bir bahane bulabilirsiniz . Ancak İK, kendilerini endişelendiren bir şeyle ilişkili olan tamamen zararsız bir gösterge bulursa ne olur ?

Cambridge Üniversitesi ve Microsoft'tan araştırmacılar , 58.000 ABD'li Facebook kullanıcısına kişilikleri ve zekaları ile ilgili çeşitli testler verdi. Ve Facebook'taki beğenilerin genellikle IQ 3 , dışadönüklük ve vicdanlılıkla ilişkili olduğunu buldular . Örneğin, Mozart'a , gök gürültülü fırtınalara ve sarmal patateslere olan aşklarını itiraf eden insanların IQ'ları daha yüksek olma eğilimindedir . Ve Harley-Davidson motosikletlerini, ülke grubu Lady antebellum'u veya Anne Olmayı Seviyorum sayfasını sevenlerin IQ'ları daha düşük olma eğilimindedir. Bu korelasyonlardan bazıları "boyutsallığın laneti" ile ilgili olabilir. Yeterince parametreyi test ederseniz, bazıları rastgele korelasyon gösterecektir. Ancak bazı ilgi alanları meşru olarak IQ ile ilişkilendirilebilir.

Harley'lerden hoşlanan zeki bir kişinin sırf bilmeden düşük bir IQ sinyali verdiği için niteliklerine uygun bir iş bulamayabileceği haksızlık gibi görünüyor .

Adil olmak gerekirse, bu sorun yeni değil. İnsanlar uzun süredir , el sıkışmanın sertliği veya giysilerin temizliği gibi performansla doğrudan ilgili olmayan faktörlerle yargılanıyordu . Ancak bilgi devriminin tehlikesi, yaşamlarımız daha dijital hale geldikçe, bu yaklaşık yargıların giderek daha fazla kafa karıştırıcı ve aynı zamanda daha müdahaleci hale gelmesidir. Daha iyi tahmin, giderek daha fazla çirkin ayrımcılığa yol açabilir .

, ekonomistlerin "fiyat ayrımcılığı" dediği başka bir ayrım biçimine yol açabilir . İşletmeler genellikle mal veya hizmetler için ne kadar ücret almaları gerektiğini bulmakta zorlanırlar. İdeal olarak, mümkün olan maksimum kârın elde edilmesi için müşterilerinden ödemeye hazır oldukları kadar ücret almak isterler .

tüketicinin ödemeye istekli olduğu tek bir fiyatla sonuçlanma eğilimindedir . Ancak bazen belirli bir grubun üyelerinin ortalama olarak daha fazla ödediğini bilirler . Bu nedenle orta yaşlı müşteriler için sinema bileti fiyatları daha yüksektir - öğrencilerden veya emeklilerden daha yüksek gelirleri vardır. Bu nedenle havayolları genellikle son dakikada satın alan müşterilerden bir bilet için daha fazla ücret alır. Bu fiyat ayrımcılığıdır.

Büyük veri, işletmelerin müşterilerin ne için ödeme yapmaya istekli olduklarını ve insanları nasıl gruplandıracaklarını daha iyi anlamalarına olanak tanır. Optimal Decisions Group, tüketicilerin sigorta için ödemek istedikleri fiyatı belirlemek için bilimsel verilerin kullanılmasına öncülük etmiştir . Nasıl yapıldı? Şirketin uzmanları, bu kitapta zaten tartışılan metodolojiyi kullandı. O sırada sigorta satın almaya istekli olanlara en çok benzeyen müşterileri buldular ve almaya istekli oldukları sigorta priminin ne kadar yüksek olduğunu tahmin ettiler. Yani ikizler yöntemi kullanıldı. Görsel ikizleri aramak, bir beyzbol oyuncusunun eski büyüklüğüne dönüp dönmeyeceğini tahmin etmemize yardımcı oluyorsa harikadır. Birini iyileştirmemize yardımcı olacaksa, benzerleri aramak harikadır . Ama bir şirketin sizden son kuruşuna kadar sömürmesine yardım edecek görsel ikizler mi arıyorsunuz? Artık o kadar havalı değil. Zavallı kardeşim cimri olan benden çok ondan alıyorsa şikayet etme hakkı olacak.

müşteri sayısını artırma olasılığının potansiyel olarak tehlikeli olduğu bir alandır . Büyük bir kumarhane , müşterilerini daha iyi anlamak için benzer bir şey kullanır . Hedef? Mümkün olan en yüksek kârı elde edin ve paranızın giderek daha fazlasının onun hazinesine gitmesini sağlayın.

İşte nasıl çalıştığı. Kumarhane, her oyuncunun bir "acı noktası" olduğuna inanır. Bu , onu kumarhaneye uzun süre dönmemesine yetecek kadar korkutan kayıp miktarıdır . Örneğin, Helen'in 3.000 dolarlık bir "sıcak noktası" olduğunu varsayalım. Bu, eğer onları kaybederse, kumarhanenin bir müşterisini - belki birkaç hafta veya ay boyunca - kaybedeceği anlamına gelir. Helen 2,999$ kaybederse bundan hiç hoşlanmayacak. Ne de olsa kim paradan ayrılmayı sever? Ama yarın gece geri gelmeyecek olması onun moralini o kadar bozmaz.

Bir an için bir kumarhanenin yöneticisi olduğunuzu hayal edin . Ve Helen'in slot makineleri oynamaya geldiğini hayal edin . Optimum sonuç nedir? Anlaşılır bir şekilde, "baskı noktasına" basmadan mümkün olduğunca yaklaşmasını istiyorsunuz. Kumarhanede 2.999 dolar bırakmasını istiyorsun - bu sana büyük bir kâr sağlayacak kadar, ama geri dönmeyeceksin kadar değil.

Bunu nasıl yapabilirim? Belli bir miktar kaybettikten sonra Helen'i oynamayı bırakmanın yolları var. Örneğin, ona bedava yemek sunabilirsiniz. Böyle bir teklifi kabul etmek yeterince caziptir ve yemek için makineli tüfeği bırakacaktır.

Ancak bu yaklaşım ciddi bir sorunu da beraberinde getiriyor. Helen'in "sıcak noktasını" nereden biliyorsun? Sonuçta, insanlar farklıdır. Helen için 3.000$ olabilir ama John için 2.000$ ve Ben için 26.000$ olabilir Helen'i 2.000$ kaybettikten sonra oyunu durdurmaya ikna ederseniz, karınızı kaybetmiş olursunuz. 3.000 $ kaybettikten sonra çok uzun süre beklerseniz, onu bir süreliğine kaybetmişsinizdir. Daha öte. Helen size ağrılı noktasından bahsetmek istemeyebilir. Onun bundan haberi bile olmayabilir.

Peki ne yapmalı? Kitapta bu noktaya geldiyseniz , muhtemelen cevabı tahmin edebilirsiniz. Bilimsel verileri kullanmamız gerekiyor. Müşterileriniz hakkında yaş, cinsiyet, posta kodu ve kumar davranışı gibi bilmeniz gereken her şeyi öğreneceksiniz . Kayıplar, galibiyetler, ziyaretler ve geçişler hakkındaki bilgilere dayanarak “acı noktaları” değerlendirilebilir.

Helen hakkında olası tüm bilgileri topladınız ve ona benzer oyuncular buldunuz - aşağı yukarı tıpatıp aynısı. Ardından “ağrı eşiğini” öğrenin. Muhtemelen Helen'inkiyle aynı miktarda olacaktır . Harrah's , büyük verilere erişimi olan Te Rabite'yi işe alarak tam olarak bunu yapıyor .

Terabyte'ın genel müdürü Scott Gnow, mükemmel kitabı Super Crunchers'ta kumarhane yöneticilerinin "bo sol nokta"ya yaklaşan bir müşteri gördüklerinde yanına gelip "Zor bir gün geçirdiğini görüyorum. Et lokantamızı seveceğinizi biliyorum. Şimdi masrafları bize ait olmak üzere karını yemeğe çıkarmanı öneriyorum.

Cömertliğin zirvesi gibi görünebilir - bedava bir öğle yemeği. Ama aslında öyle değil. Kumarhane, müşterilerin bir daha geri dönmeyecek kadar çok kaybetmeden oyunu bırakmalarını sağlamaya çalışıyor . Başka bir deyişle, yönetim, uzun vadede müşterilerden mümkün olduğu kadar çok para çekmeye çalışmak için gelişmiş veri analizini kullanır .

Çevrimiçi verilerin artan kullanımının kumarhanelere, sigorta şirketlerine, borç verenlere ve diğer tüzel kişilere bizim üzerimizde çok fazla güç vereceğinden korkma hakkımız var .

Öte yandan, büyük veri, tüketicilerin kendilerinden çok fazla ücret alan veya düşük kaliteli ürünler tedarik eden işletmelerden bir miktar tazminat almasına da olanak tanır.

sunan restoranların ve şirketlerin incelemelerini yayınlayan Yelp gibi sitelerdir . Harvard iktisatçısı Michael Luke tarafından yakın zamanda yapılan bir araştırma, işletmelerin Yelp 4'ün insafına ne ölçüde zarar verdiğini gösterdi . İncelemeleri Washington Eyaletindeki satış verileriyle karşılaştırdığında , Yelp'te [41]bir yıldızın düşmesinin bir restoranın gelirini %5-9 oranında azalttığını gördü.

Kayak ve Booking.com gibi pazar yerlerini ve otelleri karşılaştıran siteler de tüketicilere ticaretle mücadelelerinde yardımcı oluyor. Freakonomics'te [42]tartışıldığı gibi , İnternet siteleri çeşitli sigorta şirketleri için fiyat raporları yayınlamaya başladığında, bu fiyatlar düştü. Sigortacılar çok fazla ücret alırsa, müşteriler öğrenecek ve başkalarını bulacaktır. Tüketiciler için toplam tasarruf ne kadardı ? Yılda bir milyar dolar.

Başka bir deyişle, internetteki veriler şirketlere hangi müşterilerden uzak durmaları ve hangilerini takip etmeleri gerektiğini söyleyebilir. Ayrıca müşterilere hangi firmalardan kaçınmaları gerektiğini ve hangilerinin onlardan yararlanmaya çalıştığını söyleyebilirler. Bugüne kadar , büyük veriler her iki tarafın da birbiriyle savaşmasına yardımcı oluyor . Dövüşün hala adil olduğundan emin olmalıyız.

VERİ SİLAHLI HÜKÜMETLERİN TEHLİKESİ

, eski erkek arkadaşı doğum günü partisine geldiğinde onun üzgün olduğunu biliyordu . Onun deli olduğunu düşündü. Depresyonla mücadele ettiğini biliyordu. 20 yaşındaki zooloji öğrencisi Donato, onu arabaya binmeye davet ettiğinde tek bir şey bilmiyordu. Onun haberi olmadan, 22 yaşındaki eski erkek arkadaşı James Stoneham, önceki üç haftayı, Adrian'ın kendisiyle ilgili ara sıra soruşturmaların arasına serpiştirilmiş, birinin nasıl öldürüleceği ve cinayetin cezası hakkında bilgi arayarak geçirmişti .

Bunu bilseydi, muhtemelen onunla arabaya binmezdi. Ve muhtemelen o gece onu bıçaklamazdı.

Azınlık Raporu filminde medyumlar, suçları gerçekleşmeden önce durdurmak için polisle birlikte çalışır. Büyük veriler aynı amaçla emniyet birimleriyle paylaşılmalı mı? Donato en azından eski erkek arkadaşının aramaları konusunda uyarılmalı ve polis Stoneham'ı sorgulamalı mıydı?

İlk olarak, bununla yüzleşelim: Google'ın suç faaliyeti aramalarının doğrudan suç faaliyetinin kendisiyle ilişkili olduğuna dair artan kanıtlar var . Ma-Kellams'ta Christie , Flora Ohr, Zhi Hyun Baek ve Ichiro Kawachi, intihar 5 ile ilgili Google aramalarının sayısının intihar sayısıyla güçlü bir şekilde ilişkili olduğunu gösterdi. Ayrıca Evan Soltas ve ben, "Müslümanlardan nefret ediyorum" veya "Müslümanlar öldürülmeli" gibi haftalık İslamofobik aramaların sayısının, o hafta Müslümanlara karşı işlenen suçların sayısıyla doğrudan ilişkili olduğunu bulduk. Daha fazla insan bir şeyi yapmak istediğini söyleyen bir mesajla arama yapıyorsa, bu daha fazla insanın bunu yapacağı anlamına gelir.

Peki bu bilgilerle ne yapıyoruz? Basit ve tartışılmaz bir fikir var: Bölgelerdeki verileri kullanabiliriz. Bir şehirde intiharla ilgili aramalarda büyük bir artış varsa , oradaki intihar sayısının da artacağından emin olabiliriz. Bu nedenle , yerel makamların veya kar amacı gütmeyen kuruluşların, insanların psikolojik yardım alabileceği yerleri açıklayan reklamlar yayınlamasının zamanı geldi. Benzer şekilde, şehirdeki “Müslümanları öldürme” taleplerinde büyük bir artış olursa, polis departmanları sokaklarda devriye gezme şeklini değiştirmeli - örneğin, yerel camiye daha fazla polis gönderebilirler .

Ama bizim için atılması gereken bir adım pek hoş değil: insanlara suç işlemeden önce zulmetmek . Bunun mahremiyet ihlali olduğunu düşünüyoruz. Etik açıdan, hükümetin binlerce veya yüz binlerce kişinin arama sorguları hakkında bilgi toplama yeteneği ile polisin belirli bir kişinin benzer verilerini kaydetme yeteneği arasında büyük bir fark vardır. Ahlak açısından yerel bir camiyi korumakla başkasının evini yağmalayabilmek arasında büyük bir fark vardır. Etik bir bakış açısıyla , intiharı önlemeyi teşvik etmekle birini iradesi dışında bir psikiyatri hastanesine yatırmak arasında büyük bir fark vardır .

Ancak kişisel bilgilerin kullanımında son derece dikkatli olunmasının nedeni, etik değerlerin bile ötesine geçmektedir. Verinin kendisinde yatıyor. Veri bilimi açısından bakıldığında, bir şehirdeki belirli olayların olasılığını tahmin etmeye çalışmak ile bir bireyin eylemlerini tahmin etmeye çalışmak arasında büyük bir fark vardır.

Tekrar intihara dönelim. ABD'de her ay yaklaşık 3,5 milyon intiharla ilgili arama yapılıyor6 . Aynı zamanda, çoğunun belirli ipuçları var - "intihar ", "intihar" ve "intihar yöntemleri" kelimeleri. Basitçe söylemek gerekirse, her ay her 100 Amerikalı için birden fazla intihar talebi oluyor . Filozof Friedrich Nietzsche'yi burada nasıl hatırlayamazsınız : "İntihar düşüncesi büyük bir teselli: kişinin gecenin karanlığını yenmesine yardımcı olur." Google arama verileri bunun ne kadar doğru olduğunu ve intihar düşüncelerinin ne kadar yaygın olduğunu gösteriyor. Yine de Amerika Birleşik Devletleri'nde her ay 4.000'den az intihar işleniyor. Yani intihar düşünceleri oldukça yaygındır, ancak intihar değildir. Bu nedenle, birisi internette beyinlerini uçurmak istediğini her bildirdiğinde polislerin kapıları çalması mantıklı değil - eğer polisler bunu yaparsa, başka hiçbir şey için zamanları olmayacak.

Veya inanılmaz derecede kısır İslamofobik talepleri düşünün. 2015 yılında Amerika Birleşik Devletleri'nde "Müslümanları öldür" ifadesi yaklaşık 12.000 kez arandı. 12 Müslümanın da kin ve nefret nedeniyle öldürüldüğü bildirildi7 . Bu korkunç talepte bulunanların büyük çoğunluğunun gerekeni yapmadığı aşikar .

Belirli bir kişinin davranışını tahmin etmekle şehirdeki genel durumu tahmin etmek arasındaki farkı açıklayan matematiksel hesaplamalar vardır. İşte basit bir düşünce deneyi. Bir şehirde bir milyon insan olduğunu varsayalım. Ve bir cami var. Diyelim ki birisi Google'a "Müslümanları öldürme" talebiyle gitmezse, 100 milyonda sadece 1 olasılıkla camiye saldıracak . Diyelim ki birisi internette "Müslümanları öldürün" ifadesini aramaya başladı . Sonra bu olasılık keskin bir şekilde 10.000'de 1'e yükselir . Diyelim ki İslamofobi fırladı ve “Müslümanları öldür” arama terimlerinin sayısı 100'den 1.000'e çıktı .

Matematiğin gösterdiği gibi, bu durumda camiye saldırı şansı yaklaşık beş kat arttı - yüzde 2'den yüzde 10'a. Ama "Müslümanları öldürün" yazan kişinin camiye saldırma ihtimali hala 10.000'de 1'dir.

Bu durumda verilecek doğru cevap, "Müslümanları öldürme" arayışında olanların hepsini hapse atmak değildir. Evlerini aramayın. Evet, herhangi birinin yine de suç işlemesi için küçük bir şans var. Ancak doğru cevap, saldırıya uğrama olasılığı %10'a çıkmış olan camiyi korumak olacaktır.

Açıkçası, pek çok korkunç arama, korkunç eylemlere yol açmaz.

yüksek bir olumsuz sonuç olasılığı sunan bazı arama sorgusu sınıfları vardır . Ve en azından teorik olarak mümkün, örneğin, veri bilimcilerin gelecekte Stoneham'ın Donato ile ilgili arama sorgularının ciddi bir endişe kaynağı olması gerektiğini belirleyebilecek bir model oluşturması.

2014'te "kız arkadaş nasıl öldürülür" ifadesini içeren yaklaşık 6.000 arama sorgusu ve 400 kız cinayeti vardı. Bu katillerin tümü bir suç işlemeden önce bir Google araması yapsaydı, bu, 15 kişiden 1'inin konuşmaktan yapmaya geçtiği anlamına gelirdi . Tabii ki, çoğu - muhtemelen kız arkadaşlarını öldüren insanların çoğu - suç hakkında bu şekilde bilgi aramadı . Bu , bu özel aramanın bir cinayetle sonuçlanma olasılığının çok daha düşük olduğu anlamına gelir .

belirli bir kişiye yönelik tehdidi (diyelim ki 100'de 1) hesaplayan bir model oluşturabilseydi, bu bilgiyle bir şeyler yapmak isteyebilirdik . En azından, tehlikede olan bir kişinin muhtemelen bu konuda bilgilendirilmeye hakkı vardır - belirli bir fail tarafından öldürülme ihtimalinin 100'de 1 olduğu.

Ancak genel olarak, suçu bireysel düzeyde tahmin etmek için arama verilerini kullanırken çok dikkatli olmalıyız. İstatistikler bize açıkça söylüyor: Nadiren korkunç sonuçlara yol açan pek çok korkunç talep var. Ve şimdiye kadar, hükümetin yalnızca bu arama sorgularının incelenmesine dayanarak belirli bir eylemi yüksek olasılıkla tahmin edebileceğine dair hiçbir kanıt yok . Bu nedenle, yetkililerin talep verilerini kullanarak bireysel düzeyde işlem yapmasına izin vermemek için çok dikkatli olmalıyız . Ve bu sadece etik veya yasal nedenlerle değil. Bu - en azından şimdilik - veri bilimi.

Çözüm

KAÇ KİŞİ
KİTABI
SONUNA KADAR OKUDU?

P

Yayıncıyla sözleşme imzaladıktan sonra, bu kitabın nasıl yapılandırılması gerektiğine dair net bir vizyonum vardı. Başlangıçta -hatırlayabilirsiniz- Şükran Günü'nde evimdeki masadaki sahneyi anlatmıştım . Ailem aklı başında olup olmadığımı tartıştı ve neden 33 yaşıma geldiğimde doğru kızı bulamadığımı anlamaya çalıştı.

Bu kitabın sonucu neredeyse kendi kendine yazılmıştı. Güzel bir kızla çıkmak ve onunla evlenmek istiyorum . Daha da iyisi, doğru kızla tanışmak için büyük veriyi kullanmak istiyorum . Belki kitaba bir kur yapma hikayesi örebilir ve ardından herkesin nasıl bir araya geldiğini anlatarak bitirebilirim . Ve son sayfalarda düğün günümün bir tarifi ve genç karıma bir aşk mektubu yer alırdı.

Ne yazık ki hayat fanteziyle örtüşmüyor. Bu kitabı yazarken kendimi daireme kapatmak zorunda kalmam ve neredeyse gerçek dünyayla bağlantımı kaybetmem, kesinlikle hayatımın romantik yönünün gelişmesine katkıda bulunmadı. Ve - ne yazık ki - henüz bir eş bulamadım. Ve daha da önemlisi, hala yeni bir sonuca ihtiyacım var.

Harika bir sonsöz yazmama izin verecek bir şey bulmaya çalışarak en sevdiğim kitapların çoğunu inceledim . Ve en iyi sonuçların tüm kitap boyunca uzanan en önemli fikri vurguladığı sonucuna vardım . Bu kitabın ana fikri şudur: sosyal bilimin kendisi gerçek bir bilim haline gelir. Ve bu yeni gerçek bilim, hayatımızı iyileştirmek için tasarlandı.

İkinci bölümün başında Karl Popper'ın Sigmund Freud'un yazılarına yönelik eleştirisini ele aldım. Popper'ın Freud'un sıra dışı düşüncelerini bilimsel bulmadığına dikkat çektim. Ama Popper'ın eleştirisinden bahsetmedim. Aslında, Freud'a aşık olmaktan çok daha önemli bir şeydi . Popper, herhangi bir sosyal bilimcinin kelimenin tam anlamıyla bilim adamı olduğuna inanmıyordu . Charles , bu sözde bilim adamları tarafından ifade edilen pozisyonlardaki kesinlik eksikliğinden hoşlanmadı .

Popper 1'i harekete geçiren neydi ? Zamanının en iyi entelektüelleriyle - fizikçiler, tarihçiler, psikologlar - iletişim kurarak çarpıcı bir fark fark etti. Fizikçiler konuştuğunda , Popper onlara inandı. Elbette bazen hatalar da yaptılar. Elbette bazen - bilinçaltı önyargıları nedeniyle - aldatıldılar . Ancak , Einstein'ın görelilik teorisinin ortaya çıkmasıyla sona eren, dünya hakkındaki derin gerçeklerin kavranma sürecine dahil oldular . En ünlü sosyologlar konuştuğunda, Karl'a açıkça saçma sapan konuşmuyormuş gibi geldi .

Farklı bilimlerin temsilcilerine bu kadar farklı davranan tek kişi Popper değil . Fizikçilerin, biyologların ve kimyagerlerin gerçek bilim adamları olduğu konusunda herkes hemfikirdir. Fiziksel dünyanın fenomenlerine bir açıklama bulmak için titiz deneyler yaparlar. Tersine , pek çok insan ekonomistlerin, sosyologların ve psikologların sadece işlerini almak için saçma sapan jargon kullanan aşağılık bilim adamları olduğunu düşünüyor.

Yakın zamana kadar bu doğruydu. Ancak büyük verilerin devrim niteliğinde ortaya çıkışı her şeyi değiştirdi. Karl Popper bugün hayatta olsaydı ve Raj Chetty, Jesse Shapiro, Esther Duflo veya (en azından!) benimkinin bir sunumuna katılmış olsaydı , tepkisinin çok farklı olacağından kesinlikle şüpheleniyorum . Gerçekte, muhtemelen sicim teorisyenlerinin gerçekten bilim adamı olup olmadıklarını veya zihin jimnastiğiyle sadece eğlenip eğlenmediklerini merak ederdi .

Bir şehirde şiddet içeren bir film gösteriliyorsa, suç sayısı artıyor mu yoksa azalıyor mu? Reklamı daha fazla kişi izlerse, reklamı yapılan ürünün satışlarında artış olur mu ? Bir kişi 20 yaşına geldiğinde bir beyzbol takımı kazanırsa , 40 yaşında hala onu destekleyecekler mi ? Bunların hepsi "evet" veya "hayır" olarak cevaplanabilecek sorulardır. Ve doğru bilgi dağları bunu yapmanıza izin verir.

Bu bilimdir, sözde bilim değil.

Ancak bu, sosyal bilimlerdeki devrimin basit, ebedi yasalar biçiminde geleceği anlamına gelmez.

yapay zekanın olanaklarını ilk keşfedenlerden biri olan Marvin Minsky , her yerde ve her zaman doğru olan basit yasaları bulmayı başaran doğa bilimlerini kopyalamaya çalışırken psikolojinin yoldan çıktığını öne sürdü.

bu tür yasalara tabi bir nesne olamayacağına inanıyordu . Tersine, beyin, büyük olasılıkla, bir bölümün diğerlerinde ortaya çıkan hataları düzelttiği karmaşık bir sistemdir. Ekonomi ve siyasi sistem daha az karmaşık olamaz.

2 gibi düzgün formüller olarak tanımlanması pek olası değildir . Gerçekten de, birisi sosyal bilimin kuru formüllere dayanabileceğini iddia ederse, bu büyük bir şüpheyle karşılanmalıdır.

Sosyal bilimlerin devrimci dönüşümü , araştırma üstüne araştırma , araştırma üstüne araştırma, kademeli olarak gerçekleşecektir. Zamanla, insan bilincinin ve toplumun yapısının karmaşık sistemlerini daha iyi anlamaya başlayacağız .

Doğru bir sonuç, kişinin sonuçları özetlemesine ve daha fazla çalışmanın yönünü belirlemesine olanak tanır.

Bu kitap söz konusu olduğunda, oldukça kolay. Bahsettiğim veri kümeleri devrim niteliğindedir, ancak çok az anlaşılmıştır . Daha keşfedeceğimiz çok şey var. Dürüst olmak gerekirse , bilim adamlarının büyük çoğunluğu dijital çağdaki bilgi patlamasını görmezden geldi. Dünyanın en ünlü seks araştırmacıları hala denenmiş ve test edilmiş yöntemlere bağlı kalıyor. PornHub gibi sitelerden veri toplamadan birkaç yüz kişiye arzularını soruyorlar . Dünyanın ünlü dilbilimcilerinin çoğu , milyarlarca kitabın analizinde bulunan kalıpları büyük ölçüde göz ardı ederek tek tek metinleri analiz eder . Dijital devrim, lisansüstü öğrencilerine psikoloji, siyaset bilimi ve sosyoloji alanlarında öğretilen yöntemleri büyük ölçüde etkilemedi . Veri patlamasından ortaya çıkan uçsuz bucaksız, neredeyse keşfedilmemiş bilgi genişlikleri , yalnızca az sayıda ileri görüşlü öğretmeni , asi öğrenciyi ve amatörü ilgilendirdi.

Ama bu değişecek.

Bu kitapta bahsettiğim her fikir için, çözülmeyi bekleyen aynı derecede önemli yüzlerce fikir var . Burada tartışılan çalışmalar buzdağının görünen kısmı, yüzeydeki çizikler.

Peki başka ne öngörüyoruz?

en başarılı halk sağlığı çalışmalarından birinde kullanılan metodolojinin radikal bir uzantısı . 19. yüzyılın ortalarında, İngiliz doktor John Snow, Londra'daki kolera salgınının nedeni ile ilgilenmeye başladı.

2 buldu : şehirdeki bu hastalığın tüm vakalarını karşılaştırmak . Bunu yaparken, hastalıkların büyük ölçüde belirli bir su pompası etrafında toplandığını buldu. Ardından, hastalığın suyun kirlenmesi yoluyla yayıldığını öne sürdü - böylece kötü hava hakkındaki yaygın fikri çürüttü.

Büyük veri ve sağladığı ayrıntı, bu tür araştırmaları çok kolaylaştırır. Herhangi bir tıbbi durum için, Google veya diğer dijital sağlık kaynaklarındaki arama sorgularını analiz edebiliriz . Bir hastalığın prevalansının alışılmadık derecede yüksek veya alışılmadık derecede düşük olduğu dünya haritasındaki en küçük yamaları bile bulabiliriz . Ve sonra ortak yönlerini değerlendirin. Belki havada? Veya suda? Yoksa sosyal normlarda mı?

Aynı şeyi migren için de yapabiliriz. Aynı şeyi böbrek taşları için de yapabiliriz . Bunu kaygı ve depresyon, pankreas kanseri ve Alzheimer, yüksek tansiyon ve sırt ağrısı, kabızlık ve burun kanamaları için yapabiliriz . Bunu her şey için yapabiliriz. Snow'un bir zamanlar yaptığı analiz 400 kez yapılabilir ( bu kitabı yazarken biraz araştırmaya başladım).

ve büyük veriyi kullanarak kısa sürede yüzlerce kez analiz yapmak, üst düzeyde bilim diyebiliriz . Evet, sosyal bilimler ve davranış bilimleri kesinlikle bu pozisyonlara doğru ilerliyor . Tıp alanında yapılacak detaylı araştırmalar, bu bilimlerin gerekli ölçeğe ulaşmasına yardımcı olacaktır. Bu, AQ testi kullanılarak da kolaylaştırılabilir . Bu yöntemi iş bağlamında tartıştık - kullanıcıların reklamları daha sık tıklamasını nasıl sağlayacağımızı. Günümüzde bu etkili teknik her yerde kullanılmaktadır. Ancak A/B testi , reklam tıklama sorunundan daha temel ve sosyal açıdan önemli soruları yanıtlamak için de kullanılabilir .

Benjamin F. Jones3, Northwestern Üniversitesi'nde çocukların daha iyi öğrenmesine yardımcı olmak için A/B testini kullanan bir ekonomisttir . Okulların farklı ders planlarını rastgele test etmesine olanak tanıyan EDU STAR platformunu oluşturabildi.

Birçok şirket, eğitim yazılımının oluşturulmasında yer almaktadır . Öğrenciler EDU STAR'a girerler ve rastgele çeşitli ders planları ile tanıştırılırlar . Daha sonra, belirli görevlerde ne kadar başarılı olduklarını belirlemek için kısa testler yaparlar. Başka bir deyişle , okullar hangi eğitim yazılımının en iyi öğrenmeyi garanti ettiğini öğrenebilir.

EDU STAR, herhangi bir A/B test platformu gibi şimdiden harika sonuçlar veriyor. Pek çok eğitim kurumunu etkileyen bir ders planı, öğrencilere kesirlerle nasıl çalışacaklarını öğretmekti . Matematiğe dönersek inanılıyordu Bu oyunda, öğrenciler yeni şeyler öğrenmekten ve testlerde daha başarılı olmaktan keyif alacaklar. Evet? Yanlış. Kesirleri oyun yoluyla öğrenen çocuklar, kesirleri standart yolla öğrenen çocuklara göre testlerde daha kötü performans gösterdi .

Öğrencilerin öğrenmeye ilgi duymasını sağlamak, A/B testinin insanların reklamları tıklamasını sağlamak için kullanmaktan daha heyecan verici ve sosyal açıdan faydalı bir kullanımıdır .

Ortalama bir Amerikalı her gece 6,7 saat uyur . Çoğu daha fazla uyumak istiyor. Ama burada akşam 11 geliyor ve - TV'de veya YouTube'da spor denir.

Yani uyku bekleyebilir. Yüzbinlerce müşterisi olan bir gadget şirketi olan Jawbone , kullanıcıların yapmayı çok istedikleri şeyi yapmalarına yardımcı olacak bir çözüm bulmak için binlerce test yapıyor: erken yatın.

Jawbone ikili bir amaçla harika sonuçlar elde etti. İlk olarak, şirketin uzmanları müşterilerden en iddialı hedefi gerçekleştirmemelerini istiyor. Onlara şu mesajı gönderirler: “Görünüşe göre son 3 gündür yeterince uyumamışsınız . 23:30'da yatmaya çalışın! Genellikle sabah 8'de kalktığınızı biliyoruz . Kullanıcı daha sonra Kabul Et düğmesini tıklama seçeneğine sahiptir.

Ardından saat 22:30'da Jawbone başka bir mesaj gönderdi : "23:30'da yatmak istedin . Şimdi saat 22:30. Neden şimdi başlamıyorsun?"

dakikalık ek bir uykuyla sonuçlandığını buldu . Şirket , müşterilerini saat 22:30'da yatmaya zorlamaz , aksine erken yatmalarını sağlar.

Tabii ki, bu stratejinin her parçası birçok deneyle optimize edilmelidir. Kullanıcılardan saat 23 :00'te yatmalarını istemenin asıl amacı çok erkense, çok az kişi aynı fikirde olacaktır. Kullanıcılardan gecenin yarısında yatmalarını isteyin , fazla bir şey elde edemezsiniz.

Jawbone, sağ okun Google eşdeğerini bulmak için Â/B testini kullanır. Ancak şirket , Google iş ortağı reklamlarında birkaç tıklama daha almak yerine , bitkin insanlara dinlenmeleri için birkaç dakika daha veriyor .

Aslında, bir psikolog ordusu , araştırmalarının başarısını önemli ölçüde artırmak için Silikon Vadisi'nin araçlarını kullanabilir . Birkaç öğrenciyle yapılan birkaç hızlı Â/B testini anlatmak yerine, bu konudaki ilk makaleyi sabırsızlıkla bekliyorum .

Bilim adamlarının aylarca az sayıda lisans öğrencisini tek bir sınava girmeleri için işe aldığı günler sona eriyor. Bunun yerine analistler, yüzlerce veya binlerce fikri birkaç saniye içinde test etmek için dijital verileri kullanacak. Çok daha kısa sürede çok daha fazlasını öğrenebiliriz.

Metin biçimindeki veriler bize çok daha fazlasını öğretecektir. Fikirler nasıl yayılır? Yeni kelimeler nasıl oluşturulur ? Kelimeler nasıl kaybolur? Şakalar nasıl yapılır? Neden bazı kelimeler komikken bazıları komik değil? Lehçeler nasıl gelişir? Bahse girerim 20 yıl içinde bu sorulara ilginç cevaplar alacağız .

Bence, geleneksel testlere ek olarak, nasıl öğrendiklerini ve geliştiklerini anlamak için çocukların çevrimiçi davranışlarını inceleyebiliriz - tabii ki anonim olarak. Disleksi belirtileri gösteriyorlar mı? Olgun entelektüel ilgi alanları geliştiriyorlar mı ? arkadaşları var mı Tüm bu soruları yanıtlamanın ipuçları, her çocuğun her gün yaptığı binlerce tıklamada bulunur.

Bu tür yöntemleri kullanmak için tamamen önemsiz ve çok daha değerli başka bir alan var.

"Shattered"da Mick Jagger , New York'u - Büyük Elma - bu kadar büyülü yapan her şeyi anlatıyor. Kahkaha Neşe. Yalnızlık. Sıçanlar. Tahta kurusu.

Gurur. Açgözlülük. Kağıt torbalar giymiş insanlar . Ancak Jagger'ın sözlerinin çoğu, bu şehri gerçekten özel kılan şeyin ne olduğunu anlatmaya ayırıyor: "seks, seks, seks ve seks."

Büyük veride de durum aynı. Dijital devrim sayesinde sağlık hizmetlerinde ve uyku biliminde heyecan verici keşifler bizi bekliyor. öğretimde. Psikolojide. dilde. Ve sekste, sekste, sekste, sekste.

Şu anda şu soruyu inceliyorum: cinselliğin kaç yönü vardır? Genellikle insanların gey veya heteroseksüel olduğunu düşünürüz ve hepsi bu. Ancak cinsellik açıkça daha karmaşıktır. Eşcinseller ve doğallar arasında benzer farklılıklar vardır - örneğin, bazı erkekler sarışınları severken, diğerleri esmerleri sever. Bu tercihler cinsiyet tercihleri kadar güçlü olabilir mi? Başka bir soru: nereden geliyorlar? Tıpkı beysbola bağlılığı veya siyasi görüşü belirleyen kilit yaşı bulabildiğimiz gibi , belki de bir kişinin yetişkinlikte cinsel tercihlerinin oluşumu için kilit yaşı bulabiliriz ? Veterinerden öğrenmek için , geçici olarak Herkes (Hala) Yalanlar adlı bir sonraki kitabımı satın almanız gerekecek.

Porno'nun varlığı ve bu alanda üretilen veriler, insan cinselliği araştırmalarında devrim niteliğinde bir gelişme sağladı.

Doğa bilimlerinin hayatımızı değiştirmeye başlaması zaman alıyor. Yavaş yavaş penisilin, uydular ve bilgisayarlar yaratıldı. Aynı şekilde, büyük verinin sevmemize, öğrenmemize ve yaşamamıza yardımcı olan sosyal ve davranış bilimlerinde büyük adımlar atması zaman alabilir. Ama şimdiden bazı ilerlemeler kaydedildiğine inanıyorum ve umarım bu kitapta böyle bir gelişmenin en azından ana hatlarını görebilmişsinizdir. Umarım bu kitabı okuyan bazılarınız işleri yoluna koymaya yardımcı olur.

Bir sonucu düzgün bir şekilde yazmak için, yazar her şeyden önce bu kitabı neden yazdığını düşünmelidir. Hangi hedefe ulaşmaya çalışıyordu?

Sanırım bu kitabı elime almamdaki en önemli sebep, sonucunda edindiğim ve gelişimime büyük katkı sağlayan yaşam deneyimiydi . Biliyorsunuz, 10 yıldan biraz daha uzun bir süre önce harika bir kitap olan Freakonomics çıktı. Chicago Üniversitesi'nde mükemmel bir ekonomist olan Stephen Levitt'in araştırmasını anlatıyordu . Levitt, "becerikli bir ekonomist" olarak görülüyordu . Tuhaf zihninin düşünebileceği herhangi bir soruyu yanıtlamak için verileri kullanabilecekmiş gibi görünüyordu . Sumo güreşçileri hile yapar mı? Oyuncular ayrımcılık yapıyor mu ? Emlakçılar bize kendilerinin alacaklarını teklif ediyor mu?

felsefe bölümünden yeni mezun olmuştum ve hayatımla ne yapacağım hakkında çok az fikrim vardı. Freakonomics'i okuduktan sonra Steven Levitt'in yaptığını yapmak istediğimi biliyordum. Dünyamızın gerçekte nasıl çalıştığını öğrenmek için veri dağlarını aşmak istedim. Onu takip etmek istedim ve ekonomi alanında doktora yapmaya karar verdim .

Geçen 12 yılda çok şey değişti. Levitt'in bazı çalışmalarında veri işleme hataları bulundu . Küresel ısınma hakkında politik olarak yanlış şeyler söyledi . Bu nedenle, Freakonomics entelektüel çevrelerde gözden düştü .

Ama bence yaptığı bazı hatalara rağmen geçen yıllar Levitt'in yapmaya çalıştığı şeyin önemini gösterdi. Bize merak, yaratıcılık ve büyük verinin birleşiminin dünyayı anlamamızı büyük ölçüde geliştirebileceğini söyledi . Alınan bilgilere dayanarak pek çok ilginç hikaye anlatılabilir ve bu defalarca kanıtlanmıştır.

Umarım bu kitap diğer insanlar üzerinde Freakonomics'in benim üzerimde yarattığı etkiyi yaratabilir. Umarım şu anda bunu okuyan bir genç, tıpkı bir zamanlar benim gibi bir yol ayrımındadır ve hayatta ne yapmak istediğini bilmiyordur. Biraz istatistiksel yeteneğiniz , yaratıcılığınız ve merakınız varsa, bilgi analizi dünyasına hoş geldiniz.

Aslında bu kitap, eğer bu kadar cesurca ifade edersem , Freakonomics'in bir sonraki seviyesi olarak kabul edilebilir. Orada açıklanan çalışmalar ile burada açıklanan çalışmalar arasındaki temel fark, iddialarıdır. 1990'larda Levitt adından söz ettirirken çok fazla veri yoktu. Veri analizine dayalı tuhaf soruları yanıtlamaktan gurur duyuyordu. Ve bilginin olmadığı alanlardaki önemli konuları büyük ölçüde görmezden geldi. Ancak bugün her yerde o kadar çok veri var ki, doğrudan en önemli ve en derin sorulara gitmek , insan olmanın ne anlama geldiğinin özüne inmek mantıklı geliyor .

Veri analitiğinin parlak bir geleceği var. Bir sonraki Kinsey'nin veri analizi yapacağından şüpheleniyorum . Bir sonraki Foucault veri analiziyle ilgilenecek . Bir sonraki Freud veri analiziyle ilgilenecek. Bir sonraki Marx veri analizi yapacak. Bir sonraki Salk da veri analizi yapabilir.

Her durumda, doğru sonucu çıkarmaya çalıştım . Ama büyük sonuçların daha fazlasını yapabileceği sonucuna vardım. Daha fazla. Büyük sonuç ironik olmalı. Seni harekete geçirmeli. Hem derin hem komik, hem mizah dolu hem de hüzünlü olmalı. Harika bir sonuç olarak, bir veya iki cümlede, daha önce söylenen ve gelecekte olacak her şey özetlenmelidir. Harika bir kitap akıllı, eğlenceli, neşeli, kışkırtıcı bir patlamayla bitmeli !

nasıl yazdığım hakkında biraz konuşmanın zamanı geldi . Ben çok üretken bir yazar değilim. Bu kitapta sadece yaklaşık 75 bin kelime var ve bu kadar geniş bir konu için çok fazla değil.

Ama ayrıntıda eksikliğimi saplantıyla telafi ediyorum . Beş ayda, New York Times'ta seks üzerine ilk köşe yazımın 47 müsveddesini, yani iki bin kelimeyi yazdım . Bu kitabın bazı bölümlerini 60 kez düzelttim. Bir dipnotta bir cümle için doğru kelimeyi arayarak saatlerimi harcayabilirim.

Geçen yılın büyük bölümünde bir münzevi olarak yaşadım . Sadece ben ve bilgisayarım. New York'un sosyetik bir bölgesinde yaşadım ve neredeyse hiç dışarı çıkmadım. Bence bu kitap benim şaheserim, hayatımda yaptığım en iyi şey . Ve işleri düzeltmek için her şeyi feda etmeye hazırdım. Bu kitaptaki her kelimeyi cilalamak istedim . Telefonum cevaplamayı unuttuğum e-postalar ve görmezden geldiğim [43]mesajlarla doluydu .

13 aylık sıkı çalışmanın ardından nihayet tamamlanmış kitap taslağını yayıncıya gönderebildim. Ancak bir kısım eksikti - sonuç.

Editörüm Denise'e bunun birkaç ay daha sürebileceğini söyledim. Ona bunun için altı aya daha ihtiyacım olduğunu düşündüğümü söyledim. Sonuç bence kitabın en önemli kısmı. Ve harika sonuçların nasıl yazılacağını öğrenmeye yeni başladım. Söylemeye gerek yok, Denise memnun değildi.

Sonra bir gün bir arkadaşım bana Jordan Ellenberg'in bir çalışmasını gönderdi. Wisconsin Üniversitesi'nden bir matematikçi olan Ellenberg , kaç kişinin gerçekten sonuna kadar kitap okuduğunu sordu. Büyük verileri kullanarak bunu test etmenin dahiyane bir yolunu buldu . Amazon , kaç kişinin kitaplardan birden çok satır alıntı yaptığını bildiriyor . Ellenberg , bir kitabın başından sonuna kadar ne sıklıkta alıntı yapıldığını karşılaştırabileceğini fark etti . Bu, okuyucuların kitabı son sayfasına kadar okuma eğilimleri hakkında gösterge niteliğinde bilgiler verecektir. Sonuç olarak, okuyucuların% 90'ından fazlasının Donna Tartt'ın Saka Kuşu romanını bitirdiği ortaya çıktı . Bu kitabın aksine, Nobel ödüllü iktisatçı Daniel Kahneman'ın Yavaş Düşün Ama Hızlı Karar Ver adlı yapıtının yalnızca yaklaşık %7'si sona erdi . Bu kaba tahmine göre, ekonomist Thomas Piketty'nin çok tartışılan kitabı Capital in the KKI Century'nin sonuna kadar okuyucuların %3'ünden azı ulaştı . Başka bir deyişle, insanlar iktisatçıların 4 incelemelerini okumayı bitirmek istemiyorlar .

Bu kitaptan çıkarılacak önemli sonuçlardan biri, her zaman büyük verinin bizi götürdüğü yere gitmemiz ve buna göre hareket etmemiz gerektiğidir . Çoğu okuyucunun burada yazılan her şeyi dikkatle takip edeceğini ve son sayfaların içeriğini daha önce söylenenlerle birleştiren kalıpları belirlemeye çalışacağını umuyorum . Ama ne kadar cümlelerimi keskinleştirmeye çalışsam da çoğu insan muhtemelen ilk 50 sayfayı okuyacak, bazı ilginç gerçekleri öğrenecek ve işine devam edecek.

Bu nedenle, bu kitabı tek uygun şekilde -insanların ne söylediklerine göre değil, ne yaptıklarına ilişkin verilere göre- bitiriyorum. Arkadaşlarımla bir bira içeceğim ve bu lanet sonuca varmayı bırakacağım . Büyük veriler bana, çok azınızın hala bu kitabı okuduğunu söylüyor.

TEŞEKKÜRLER

- ״״. ^״_∏

o kitap birçok insanın ortak çabasının meyvesidir.

Fikirleri, ben Harvard'da Google'da veri bilimcisi olarak çalışırken ve The New York Times için yazarken geliştiriliyordu.

Google'da birlikte çalıştığımız Hal Varian'ın bu kitaptaki fikirleri anlamamda büyük etkisi oldu. Söyleyebileceğim kadarıyla, Hal sürekli olarak zamanının 20 yıl ilerisinde.Karl Shapiro ile birlikte yazılan Bilgi Kuralları adlı kitabında gelecek, çoğunlukla şaşırtıcı bir şekilde doğru bir şekilde tahmin edildi. Ve Yunyang Choi ile birlikte yazdığı "Bugünü Tahmin Etmek" adlı makalesi , birçok yönden bu kitapta anlatılan sosyal bilimlerdeki büyük veri devriminin temeliydi . Aynı zamanda , onunla çalışan birçok kişinin onaylayabileceği gibi, inanılmaz derecede nazik bir akıl hocasıdır. Bir makale üzerinde işbirliği yaparken, Hal'in en iyisini yapması ve ardından adınızın yazarlar listesinde ilk sırada yer alması konusunda ısrar etmesi alışılmadık bir durum değildir. Hal'in deha ve cömertlik kombinasyonu nadirdir.

Yazma sürecime büyük ölçüde The New York Times'ta editörüm olan ve her makaleyi benimle tartışan Aaron Rethika rehberlik etti. Aaron gerçekten ansiklopedik bilgiye sahip bir adamdır. Müzikten, tarihten, spordan, politikadan, sosyolojiden , ekonomiden ve Tanrı bilir başka nelerden - neredeyse her şeyden - anlıyor . Onun sayesinde benim adımla imzalanan makalelerde pek çok ilginç ve önemli bilgi ortaya çıktı. Ekibimizin diğer oyuncuları , grafikleri beni hâlâ çıldırtan Bill March, Kevin McCarthy ve Geeta Daneshyo. Bu kitap onların makalelerinden alıntılar içermektedir ve izinleri alınarak yeniden basılmıştır. Önsözü yazmayı nezaketle kabul eden Stephen Pinker, uzun zamandır benim kahramanım . Çeşitli bilgi alanlarından gelen en son verileri kullanarak insan doğasının temellerini derinlemesine inceleyen modern bir sosyoloji kitabı için çıtayı yükseltti . Bundan sonraki çalışmalarımda onun verdiği yüksek seviyenin altına asla düşmemeye çalışacağım .

Alberto Alesina, David Cutler, Ed Glaser ve Lawrence Katz gibi parlak ve sabırlı danışmanların rehberliğinde yazıldı . Denise Oswald harika bir editör. Editörlüğünün ne kadar iyi olduğunu bilmek istiyorsanız, bu kitabı benim ilk taslağımla karşılaştırın. Aslında bunu yapamazsınız, kimseye göstermeye niyetim olmadığı için kafamı çok karıştırıyor. Ayrıca Michael Barrs, Lynn Grady, Lauren Janek, Shelby Meizlik ve Amber Oliver dahil tüm HarperCollins ekibine teşekkür ederim .

Temsilcim Eric Lupfer, bu projenin potansiyelini en başından beri gördü. Teklifin şekillenmesinde ve uygulanmasında yardımcı oldu.

profesyonel ve bilimsel hayatım için birçok yeni ve önemli şey öğrendiğim diğer birçok kişiye minnettarım - Susan Athey, Shlomo Benartzi, Jason Bordoff, Daniel Bowers, David Bruckman, Bo Cowgill, Stephen Delpome, John Donahue, Bill Gale, Claudia Goldin, Suzanne Greenberg, Shane Greenstein, Steve Grove, Michael Hoyt, David Leibson, A. I. Magnuson, Dana Maloney, Jeffrey Oldham, Peter Orszag, David Reilly, Jonathan Rosen Berg, Michael Schwartz , Steve Scott, Rich Shavelzon, Michael D. Smith, Lawrence Summers, John Waver, Michael Wiggins ve Qing Wu.

Metni geliştirmedeki yardımları için Tim Requart ve NeuWrite'a minnettarım . Araştırmamı yorumlamada yardımları için Christopher Chabris, Raj Chetty, Matt Gentzkow, Solomon Messing ve Jesse Shapiro'ya da minnettarım .

Emma Pearson ve Katya Sobolsky'ye bu kitabın çeşitli bölümleri hakkında bana herhangi bir tavsiyede bulunup bulunamayacaklarını sordum. Anlamadığım nedenlerle önce tüm kitabı okumaya ve ardından her noktada akıllıca tavsiyeler vermeye karar verdiler.

Annem Esther Davidowitz, tüm kitabı tekrar tekrar okudu ve önemli ölçüde geliştirmesine yardımcı oldu. Örneğin bana, nereye götürürse götürsün merakımı takip etmeyi de öğretti. Danışmanımla tezimin içeriği hakkında konuştuğumda bana şunu sordu: “Yaptığın şey hakkında annen ne düşünüyor?” Seks ve diğer tabu konuları çalıştığım için annemin utanmış olabileceğini düşündü. Ama her zaman ilgi alanlarımdaki çeşitlilikten gurur duyduğunu biliyordum .

Pek çok kişi yakında çıkacak olan kitabın çeşitli bölümlerini okudu ve faydalı yorumlarda bulundu. Edouard do Acevedo, Coren Apichella, Sam Asher, David Cutler, Steven Dubner , Christopher Glazek, Jessica Goldberg, Lauren Goldman, Amanda Gordon, Jakob Leshno, Aleksey Peisakhovich, Noah Popp, Ramon Rouillard, Gregg Sobolski, Evan Soltas , Noah Stevens'a teşekkür ederim . -Davidovitz, Lauren Stevens-Davidovitz ve Jane Young. Aslında, bu kitabı yazdığım sırada Jane benim en iyi arkadaşımdı ve bunun için ona özellikle minnettarım.

Verilerin toplanmasındaki yardımları için MindGeek'ten Brett Goldenberg, James Rogers ve Mike Williams'a ve Baseball Prospectus'tan Rob McCune ve Sam Miller'a teşekkür ederim. Alfred Sloan Vakfı'na mali desteği için minnettarım.

Bu kitabı yazarken bir noktada ciddi bir şekilde sıkışıp kaldım - öyle ki her şeyi bırakıp projeden vazgeçmeye hazırdım. Sonra babam Meat Chell Stevens ve ben köye gittik. Bir hafta içinde babam beni toparladı. Beni aşk, ölüm, başarı, mutluluk ve kitabın metnini tartıştığımız yürüyüşlere çıkardı. Daha sonra yanıma oturdu ve kitabın her cümlesini tekrar gözden geçirmemi sağladı. O olmadan bu çalışmayı tamamlayamazdım. Tüm hatalar elbette bana aittir.

NOTLAR

Önsöz

  1. Katie Fretland, "Gallup: Irk Seçmenler İçin Önemli Değil", The Swamp, Chicago Tribune, Haziran 2008.
  1. Alexandre Mas ve Enrico Moretti, "2008 Başkanlık Seçimlerinde Irkçı Önyargı", American Economic Review 99, no. 2 (2009).
  1. Lou Dobbs, 12 Kasım 2009'da programının bir bölümünde "ırk sonrası bir toplumda" yaşadığımızı söyledi. 27 Ocak 2010'da Chris Matthews programında Başkan Obama'nın "her bakımdan ırkçılık sonrası" olduğunu söyledi. Diğer örnekler için bkz. Michael C. Dawson ve Lawrence D. Bobo, "One Year After and the Myth of a Post-Racial Society", Du Bois Review: Social Science Research on Race 6, no. 2 (2009).
  1. Tüm bu hesaplamalar hakkında ayrıntılı bilgi sitem sethsd.com'da CSV formatında "cinsiyet verileri" başlığı altında bulunabilir. Genel sosyal anket verileri http://gss.norc.org/ adresinde bulunabilir .
  1. Yazar tarafından sağlanan veriler.
  1. Yazarın Google Trends'i kullanarak yaptığı analiz. Ayrıca Seth Stephens-Davidowitz, "The Data of Hate" , New York Times, 13 Temmuz 2014, sr4'te açıklandığı gibi tüm Stormfront üyeleri hakkında veri topladım . İlgili veriler sethsd.com'da "Stormfront" başlığı altında bulunabilir.
  1. Google verilerini kullanarak trendlerin yazarı tarafından yapılan analiz. Bunun doğru olduğu eyaletler Kentucky, Louisiana, Arizona ve Kuzey Carolina'dır.
  1. , Journal of Public Economics 118 (2014) adıyla yayınlandı . Çalışma hakkında daha fazla bilgiye buradan ulaşabilirsiniz. Ayrıca veriler web sitem sethsd.com'da "ırkçılık" başlığı altında bulunabilir.
  1. “Google arama sorgularında Trump'ın desteğiyle en güçlü Korelasyon “Karadeniz” kelimesidir. Başkaları da bildirdi” (28 Şubat 2016, tweet). Ayrıca bkz. Nate Cohn, "Donald Trump's Strongest Supporters: A New Kind of Democrat" , New York Times, 31 Aralık 2015, A3.
  1. Büyük Veriyi Kuruluşa Getirmek” , IBM, https://www-01.ibm.com/software/data/bigdata/what-is-big-data.html .
  1. Bu, Seth Stephens-Davidowitz tarafından "Hamile Kadınlar Ne İstiyor?" ("Hamile bir kadın ne ister?"), New York Times , 17 Mayıs 2014, SR6.
  1. Stephens-Davidowitz, "Hamile Kadınlar Ne İster?" (“Hamile bir kadın ne ister?”)
  1. 27 Ekim 2015'te Jerry Friedman ile telefonla görüştüm.

Bölüm 1

  1. insan davranışını açıklamaya ve tahmin etmeye çalışan kısmından bahsediyorum . Araba sürmeye çalışan yapay zekadan bahsetmiyorum.
  1. " Web Arama Günlüklerinden Sinyalleri Kullanarak Pankreatik Adenokarsinoma Taraması: Fizibilite Çalışması ve Sonuçları" sonuçları”), Journal of Oncology Practice (2016).
  1. Bu çalışma Seth Stephens-Davidowitz, "Dr. Google Sizi Şimdi Görecek, New York Times, 11 Ağustos 2013, SR12.
  1. Lars Backstrom ve Jon Kleinberg. "Romantic Partnerships and the Dispersion of Social Ties: A Network Analysis of Relationship Status on Facebook" 17. ACM Konferansı Bildiri Kitabında Bilgisayar Destekli İşbirliğine Dayalı Çalışma ve Sosyal Hesaplama ( 2014).
  1. Kahneman, Düşünmek, Hızlı ve Yavaş (“Yavaş düşün, hızlı karar ver”).
  1. 1979 ile 2010 arasında ortalama 55.81 Amerikalı kasırgalardan ve 4.216.53 Amerikalı astımdan öldü. Ulusal Hava Durumu Servisi'nin ABD kasırga ölümlerine ilişkin yıllık istatistiklerini görüntüleyin : http://www.spc.noaa.gov/climo/tom/fatalmap . php ve Amerikan Akciğer Derneği, Epidemiyoloji ve İstatistik'te astım insidansı ve mortalitesindeki eğilimler.
  1. , YouTube'da 18 Eylül 2015'te yayınlanan "Patrick Ewing'in En İyi 10 Kariyer Oyunu" , https://www.youtube.com/watch?v=Y29gMuYymv8 ; ve 12 Mayıs 2006'da yayınlanan "Patrick Ewing Knicks Tribute" YouTube videosu, https://www.youtube . com/watch?v=8T2l5Emzu-ı.
  1. SL Price, "Beyaz Sporcuya Ne Oldu?" (“ Beyaz atlete ne oldu?”), Sports Illustrated , 8 Aralık 1997.
  1. Bu Google tüketici anketini 22 Ekim 2013 tarihinde gerçekleştirdim . " NBA oyuncularının çoğunun nerede doğduğunu düşünüyorsun?" diye sordum. İki yanıt seçeneği vardı: "yoksul mahalleler" ve "orta sınıf mahalleler"; Ankete katılanların %59,7'si "yoksul bölgeyi" seçti.
  1. Roland G. Fryer Jr. ve Steven D. Levitt, "Belirgin Siyah İsimlerin Nedenleri ve Sonuçları ", Quarterly Journal of Economics 119, no. 3 (2004).
  1. Hastalık Kontrol ve Önleme Merkezleri, ABD, 2009, Tablo 9, Annenin ırkına, kökenine ve yaşına göre ayrıntılı dökümle birlikte evlilik dışı doğan çocuklar: ABD, 1970-2006.
  1. Chris Paul: "Sadece Tipik Sporcunuz Değil: Miami Heat Forveti Chris Bosh'un İlgi Alanları Basketbolun Çok Ötesine Gidiyor " PalmBeachPost.com, 15 Şubat 2011, http://www. palmbeachpost.com/news/sports/basketball/not-just-a-typical-jock-miami-heat-forward-chris-b/nLp7Z/; Dave Walker, "Chris Paul'ün Ailesi 'Family Feud' Konusunda Yarışacak", nola.com, 31 Ekim 2011, http://www.nola.com/tv/index.ssf/2011/10/chris_pauls_family_to_compete.html .
  1. "Türümüz neden uzuyor?" Scientific American, http://www.scientificamerican.com/article/why-are-we-getting-taller/ . İlginç bir şekilde , Amerikalılar büyümeyi durdurdu. Amanda Onion, "Amerikalılar Neden Boy Uzatmayı Durdurdu?" (“Amerikalılar Neden Büyümeyi Durdurdu?”), ABC News, 3 Temmuz 2016, http://abc news. go.com/Technology/story?id=98438&page=1. Diğer ülkelerde doğan NBA oyuncularının büyük akışının nedenlerinden birinin, diğer ülkelerin boyut olarak Amerika Birleşik Devletleri'ni yakalaması olduğunu iddia ediyorum. 1946 ile 1980 yılları arasında Amerika Birleşik Devletleri'nde 180 cm'den uzun NBA basketbolcularının sayısı 16 kat arttı . Amerikalılar büyümeyi durdurduğundan beri bu rakam dengelendi . Bu arada, diğer ülkelerden 210 cm'den uzun oyuncuların sayısı önemli ölçüde arttı. Aşırı uzun boylu yabancı basketbolcular, son yıllarda çocukların sağlığında belirgin bir iyileşme ve yetişkinlerin büyümesinde artış olan Türkiye, İspanya ve Yunanistan gibi ülkelerden geliyor.
  1. Carmen R. Isasi ve diğerleri, "Hispanikler/Latinler Arasında Yetişkin Boyu ve Yetişkin Adipozitesi ile Çocukluk Dönemi Ekonomik Zorluğu İlişkisi: HCHS/SOL Sosyo-Kültürel Yardımcı Çalışma", PloS One 11, no . 2 (2016); Jane E Miller ve Sanders Korenman, "Amerika Birleşik Devletleri'nde Yoksulluk ve Çocukların Beslenme Durumu " , American Journal of Epidemiology 140, no. 3 (1994); Harry J. Holzer, Diane Whitmore Schanzenbach, Greg J. Duncan ve Jens Ludwig, The Economics of Childhood Poverty in the United States в Соеди нетатах »), Journal of Children and Poverty 14, no. 1 (2008).
  1. Cheryl D. Fryar, Qiuping Gu ve Cynthia L. Ogden, Çocuklar ve Yetişkinler için Antropometrik Referans Verileri: Amerika Birleşik Devletleri , 2007-2010, Sağlık Bakanlığı İstatistikleri , Seri 11, no. 252 (2012).
  1. " Fostering and Measuring Skills: Improviving Cognitive and Non - Cognitive Skills to Promote Lifetime Success" ( katkıda bulunan yaşamda başarıya), Ulusal Ekonomik Araştırma Bürosu Çalışma Belgesi 20749, 2014.
  1. Desmond Conner, "Wrenn için Sky's the Limit", Hartford Courant, Hartford Courant, 21 Ekim 1999.
  1. Doug Wrenn'in hikayesi Percy Allen'da anlatılmıştı, "Eski Washington ve O'Dea Yıldızı Doug Wrenn Zor Zamanlar Buldu", Seattle Times , 29 Mart 2009.
  1. Orada.
  1. Melissa Isaacson, "Bir Efsanenin Portresi", ESPN. com, 9 Eylül 2009, http://www.espn.com/chicago/columns/story?id=4457017&columnist=isaacson_melissa . Roland Lazenby , Michael Jordan: The Life (Boston: Back Bay Books, 2015) tarafından Ürdün'ün iyi bir biyografisi yazılmıştır .
  1. Barry Jacobs, "Yüksekten Uçan Michael Jordan, Kuzey Carolina'da Başka Bir NCAA Ünvanına Doğru Seyrediyor", People, 19 Mart 1984.
  1. Isaacson, "Bir Efsanenin Portresi" ("Bir Efsanenin Portresi").
  1. Michael Jordan'ın Basketball Hall of Fame konuşması, YouTube videosu, 21 Şubat 2012'de yayınlandı, https://www.youtube . com/watch?v=XLzBMGXfK4c. Jordan'ın konuşmasının en ilginç yönü, ebeveynleri hakkında konuşurken çok ölçüsüz olması değil, kariyerinin ilk yıllarındaki sıkıntılarına hâlâ dikkat çekme ihtiyacı hissetmesi . Belki de ömür boyu sürecek bir kin, tüm zamanların en iyi basketbolcusu olmak için gerekli bir koşuldur.
  1. "Ben Akron, Ohio'dan LeBron James" YouTube videosu, 20 Haziran 2013'te yayınlandı, https://www.youtube.com/watch?v=XceMbPVAggk .

Bölüm 2. Belki de Freud haklıydı?

  1. genişliklerinden önemli ölçüde büyükse ve genellikle yuvarlaksa, fallus şeklinde olduğunu düşündüm . Saydım: salatalık, mısır, havuç, patlıcan, kabak ve muz .
  1. https://www.microsoft adresinden indirilebilir HYPERLINK "https://www.microsoft". com/en-us/download/details.aspx?id=52418. Bilim adamları, Amazon Mechanical Turk kullanıcılarından görselleri açıklamalarını istedi . Tıklama günlüklerini analiz ettiler ve birinin bir kelimeyi ne zaman düzelttiğini not ettiler. Daha fazla bilgi Yukino Baba ve Hisami Suzuki'de bulunabilir , “Yazım Hataları Nasıl Oluşur ve Düzeltilir? Tuş Günlükleri Kullanılarak Düzeltilmiş ve Düzeltilmemiş Yazım Hataları Üzerine Bir Araştırma , Hesaplamalı Dilbilim Derneği'nin Ellinci Yıllık Toplantısı Tutanakları, 2012 .
  1. Tam veri - uyarı: grafik biçiminde - şöyle görünüyorsunuz:

"Seks yapmak istiyorum..."

Belirtilen kelime öbeği için aylık Google arama sayısı

anne

720

oğul

590

kız kardeş

590

kuzen

480

baba

480

adam

480

Erkek kardeş

320

kız çocuğu

260

arkadaş

170

kız arkadaşı

140

  1. aşağıda gösterildiği gibi , porno, son derece eğlenceli çeşitli animasyon programları için Google aramalarında en üstteki anahtar kelimelerden biridir .

porno karikatürler

(en sık Google'da aranır)

Гриффины порно эпизоды Гриффины

Гриффины бесплатно

Смотреть Симпсонов

Симпсоны порно

Симпсоны фильм

Футурама порно

Футурама Лила

Футурама онлайн

Скуби Ду игры

Скуби Ду мультфильм

Скуби Ду велма

  1. Yazarın hesaplamalarına göre, erkek pornosu arama sorgularındaki en popüler kadın meslekleri, ikincisinin yaşına göre ayrılmış durumda :

Yaşa göre erkek pornosu arama sorgularındaki meslekler

18-24

25-64

65+

Dadı

Dadı

Dadı

Öğretmen

Yoga eğitmeni

ponpon kız

Yoga eğitmeni

Öğretmen

doktor

ponpon kız

ponpon kız

Öğretmen

doktor

emlakçı _

emlakçı _

Bir fahişe

doktor

Hemşire

emlakçı _

Bir fahişe

Yoga eğitmeni

Hemşire

Sekreter

Sekreter

Sekreter

Hemşire

Bir fahişe

Bölüm 3 Verileri Yeniden Düşünmek

  1. Matthew Leising, "Haber Yayınlandığında HFT Hazine Ticareti Piyasayı Acıtıyor" , Bloomberg Markets, 16 Aralık 2014; Nathaniel Popper, "Robotlar Wall Street'e Geliyor", New York Times Magazine, 28 Şubat 2016, MM56; Richard Finger, "Yüksek Frekanslı Ticaret: Sıradan İnsan Tüccarlarına ve Yatırımcılarına Karşı Karanlık Bir Güç mü?" (“Yüksek frekanslı ticaret: sıradan tüccarlara ve yatırımcılara karşı karanlık güçler mi ?”) Forbes, 30 Eylül 2013 , http://www.forbes.com/sites/richardfinger/2013/09/30/high-frequency- trade-is-it-a-karanlık-güç-sıradan-insan-trader-ve-yatırımcılara karşı/#50875fc751a6.
  1. 8 Mayıs 2015'te Alan Kruger ile telefonla görüştüm.
  1. Arka Plan Belgesi - Jeremy Ginsberg, Matthew H. Mohebbi, Rajan S. Patel, Lynnette Brammer, Mark S. Smolinski ve Larry Brilliant, "Arama Motoru Sorgu Verilerini Kullanarak Grip Salgınlarını Tespit Etmek" Nature 457, no. 7232 (2009). Orijinal modeldeki zayıflıklar David Lazer, Ryan Kennedy, Gary King ve Alessandro Vespignani, The Parable of Google Flu: Traps in Big Data Analysis , Science 343, no. 6176 (2014). ShihaoYang, Mauricio Santillana ve SC Kou tarafından sunulan düzeltilmiş model, " ARGO Yoluyla Google Arama Verilerini Kullanarak Influenza Salgınlarının Doğru Tahmini " , Ulusal Bilimler Akademisi Bildiriler Kitabı 112, no. 47 (2015).
  1. Seth Stephens-Davidowitz ve Hal Varian, "Google Verileri İçin Uygulamalı Kılavuz", Mimeograph, 2015.
  1. Sergey Brin ve Larry Page, "The Anatomy of a Large-Scale Hypertextual Web Search Engine" , 7th International World Wide Web Konferansı, 14-18 Nisan 1998, Brisbane, Avustralya.
  1. John Battelle, Arama: "Google ve Rakipleri İş Kurallarını Nasıl Yeniden Yazdı ve Kültürümüzü Nasıl Dönüştürdü", New York: Penguin, 2005.
  1. "In the Plex: How Google Thinks, Works, and Shapes Our Lives" , New York: Simon & Schuster, 2011'de bulunabilir .
  1. , New York Times , 5 Haziran 2015, A1'de de yer aldı . Ancak makale yanlışlıkla alıntıyı Seder'e atfediyor. Aslında , ekibinin başka bir üyesi bunu söyledi.
  1. 12-14 Haziran 2015 tarihleri arasında Ocala, Florida'da Jeff Seder ve Patty Murray ile röportaj yaptım.

Yarışların başarısız olmasının nedenleri , Jeff Seder tarafından bu işteki tecrübesine dayanarak kabaca tahmin edildi.

Ek İstatistiksel Veri Tabloları ve At Yaralanması Veritabanı, http://jockeydub.com/pdfs/eid_7_year_tables .

"Patolojik Araştırma Programı", California Hayvan Sağlığı ve Gıda Laboratuvar Sistemi, 2013.

Avalyn Hunter, "A Case for Full Siblings", Bloodhorse, 18 Nisan 2014, http://www.bloodhorse.com/horse-racing/articles/115014/a-case-for-full- sisters .

Melody Chiu, "EJ Johnson 50 lbs kaybetti. Tüp Mide Ameliyatından Beri, İnsanlar, 1 Ekim 2014. Eli Saslow, Lost Stories of LeBron, Part 1, ESPN.com, 17 Ekim 2013, http://www.espn . com /nba/story/_/id/9825052/how-lebron-james-life-changed-dördüncü sınıf-espn-dergisi.

Bakınız Sherry Ross, "The 16 Million Baby", New York Daily News, 12 Mart 2006 ve Jay Privman, "16 Milyon Dolara Satılan Green Monkey, Emekli " milyon dolara, tatile gitti"), ESPN.com , 12 Şubat 2008, http://www.espn.com/sports/horse/news/story?id=3242341 . 16 Milyon Dolarlık At müzayedesi videosu, YouTube videosu, 1 Kasım 2008'de yayınlandı, https://www.youtube . com/watch?v=EyggMC85Zsg.

Sharad Goel, Jake M. Hofman, Sebastien Lahaie, David M. Pennock ve Duncan J. Watts, "Predicting Consumer Behavior with Web Search", Proceedings of the National Academy of Sciences 107 , no. 41 (2010).

Constance L. Hays, "Wal-Mart Müşterilerin Alışkanlıkları Hakkında Bildikleri," New York Times, 14 Kasım 2004.

27 Ekim 2016'da Orly Aschenfelter ile telefonla görüştüm. Daniel A. McFarland, Dan Jurafsky ve Craig Rawlings, "Bağlantı Kurmak: Kur Yapma Durumlarında Sosyal Bağlanma", American Journal of Sociology 118, no. 6 (2013).

  1. Jonathan Greenberg, "Bilge Amcam Leonard Cohen'den Ne Öğrendim", Huffington Post, 11 Kasım 2016.
  1. H. Andrew Schwartz ve diğerleri, Kişilik, Cinsiyet ve Yaş in the Language of Social Media: The Open -Vocabulary Approach , PloS One 8 , no. 9 (2013). Makale ayrıca insanların kişilik testlerine verdiği yanıtları da kategorize ediyor.
  1. Andrew J. Reagan, Lewis Mitchell, Dilan Kiley, Christopher M. Danforth ve Peter Sheridan Dodds, "The Emotional Arcs of Stories Are Domination by Six Basic Shapes" EPJ Data Science 5, no. 1 (2016).
  1. Jonah Berger ve Katherine L. Milkman, "Çevrimiçi İçeriği Viral Yapan Nedir?" ("Çevrimiçi İçeriği Viral Hale Getiren Nedir?"), Journal of Marketing Research 49, no. 2 (2012).
  1. Bu çalışmalar Matthew Gentzkow ve Jesse M. Shapiro'ya dayanmaktadır, “What Drives Media Slant? ABD Günlük Gazetelerinden Kanıt, Econometrica 78 , no. 1 (2010). Gentzkow ve Shapiro, bu proje başladığında yeni mezun öğrenciler olmalarına rağmen , artık ekonomi dünyasının yıldızlarıdır. Şu anda Stanford Üniversitesi'nde profesör olan Gentzkow , 2014 yılında John Bates Clark Madalyası aldı ve 40 yaş altı lider ekonomist ilan edildi. Şu anda Brown Üniversitesi'nde profesör olan Shapiro, prestijli ekonomi politik dergisinin editörüdür. Medya yanlılığı hakkındaki ortak makaleleri, her birinin bibliyografyasında en çok alıntı yapılan makalelerden biridir.
  1. Murdoch'un muhafazakar New York Post'a sahip olması, New York şehrinin çok büyük olması ve farklı bakış açılarına sahip gazetelerin bulunabilmesiyle açıklanabilir. Ancak Post'un sürekli para kaybettiği açık. Bakınız, örneğin , Joe Pompeo, "'New York Post' Aslında Ne Kadar Kaybediyor?" (“New York Post Bugün Ne Kadar Kaybediyor?”), Politico , 30 Ağustos 2013, http://www.politico.com/media/story/2013/08/how-much-does-the-new-york -aslında-kaybettikten sonra-001176.
  1. Matt Gentzkow ve Jesse Shapiro ile 16 Ağustos 2015'te Royal Hotel Boston'da röportaj yaptım.
  1. Uluslararası bilgisayar görselleştirme konferansında sunulan bildiri, 2015. Fotoğraf, izniyle yeniden basılmıştır . Yazarlar.
  1. Bakınız, örneğin, Christina Kotchamidova, "Neden 'Peynir' Diyoruz: Enstantane Fotoğrafçılığında Gülümsemeyi Üretmek" , Critical Studies in Media Communication 22, no. 1 (2005).
  1. J. Vernon Henderson, Adam Storeygard ve David N. Weil, "Measuring Economic Growth from Outer Space", American Economic Review 102, no. 2 (2012).
  1. Kathleen Caulderwood, " Ekonomistler Telekom , Nollywood'u Ekledikçe Nijerya GSYİH'sı %89 Arttı " /www.ibtimes.com/nigerian-gdp-jumps-89-economists-add-telecoms-nollywood-1568219 .
  1. Joe Reisinger ile 10 Haziran 2015'te telefonla görüştüm.
  1. Leena Rao, "SpaceX ve Tesla Destekçisi '1 his Startup'a 50 Milyon Dolarlık Yatırım Yaptı", Fortune, 24 Eylül 2015.

4. Bölüm

  1. Hugh J. Parry ve Helen M. Crossley, "Anket Sorularına Yanıtların Geçerliliği", Public Opinion Quarterly 14, 1 (1950).
  1. Frauke Kreuter, Stanley Presser ve Roger Tourangeau. " CATI, IVR ve Web Anketlerinde Sosyal İstenirlik Önyargısı" , Public Opinion Quarterly 72(5), 2008.
  1. Yalan söylemenin Trump desteğini tahmin etmede sorun olabileceğini belirten bir makale için bkz. Thomas B. Edsall, "How Many People Support But Don't Want to It It?" (“Kaç kişi Trump'ı destekliyor ama kabul etmiyor?”), New York Times, 15 Mayıs 2016, SR2. Ancak bunun en büyük faktör olmadığı argümanı , Andrew Gelman'ın "Explanations for That Shocking 2% Shift", with Statistical Modeling, Causal Inference, and Social Science, 9 Kasım 2016, http://andrewgelman.com/'da bulunur. 2016/11/09/ açıklamalar-şok edici-2-vardiya/.
  1. 5 Mayıs 2015'te Roger Turango ile telefonla görüştüm.
  1. "Orijinaller: Uyum Dışı Olanlar Dünyayı Nasıl Hareket Ettiriyor " (New York: Viking 2016) adlı kitabında tartışılmaktadır . Orijinal kaynak — David Dunning, Chip Heath ve Jerry M. Suls, “Flawed Self- Assessment: Implications for Health, Education, and the Workplace,” Psychological Science in the Public Interest 5 (2004).
  1. Anya Kamenetz, "Mischievous Responders' Confound Research on Teens", nprED, 22 Mayıs 2014, http://www.npr.org/sections/ ed/2014/05/22/ 313166161/mischievous-responders-confound-research- on-teens. Bu makalede ele alınan kaynak araştırma, Joseph P. Robinson-Cimpian, "Inaccurate Estimation of Disparities Due to Mischievous Responders " , Eğitim Araştırmacısı 43 , No. 4 (2014).
  1. https://www.google.com/trends/explore?date=all&geo=US& q=porn, hava durumu.
  1. Amanda Hess, "Kaç Kadın Porno İzlediklerini Pew'e Kabul Etmiyor?" ("Kaç kadın porno izlediğini kabul etmez?"), 11 Ekim 2013, Slate, http://www.slate.com/blogs/xx_factor/2013/10/11/pew_online_viewing_study_percentage_of_women_who_watch_online_porn_is_growing.html .
  1. Nicholas Diakopoulus, "Sex, Violence, and Autocomplete Algorithms", Slate, 2 Ağustos 2013, http://www.slate.com/articles/technology/future_tense/2013/08/words_banned_from_bing_and_google_s_autocomplete_algorithms.html .
  1. Amerikalıların Google'da her ay çocuk sahibi olduklarından pişmanlık duyduklarını açıkça ifade eden çeşitli ifadelerle yaklaşık 1.730 arama yaptığını tahmin ediyorum . Ve sadece yaklaşık 50'si çocukları olmadığı için pişmanlık duyuyor. 45 yaş üstü yaklaşık 15.9 milyon çocuksuz Amerikalı var . Çocuk sahibi olan yaklaşık 152 milyon Amerikalı var. Bu, çocuğu olan kişilerin Google'a pişmanlık ifade etme olasılığının çocuğu olmayan kişilere göre yaklaşık 3,6 kat daha fazla olduğu anlamına gelir. Açıkçası, daha önce kitabın metninde bahsedildiği ve burada tekrar vurgulandığı gibi, Google'daki bu itiraflar çok az sayıda insandır. Görünüşe göre , bu duygular yeterince güçlü, o kadar ki insanlar bir an için Google'ın onlara yardım edemeyeceğini unutuyor.
  1. FiveThirlyEighl , 26 Mart 2013, http://fifthirtyeight.blogs'tan alınmıştır . nytimes.com/2013/03/26/nasıl-görüs-on-eşcinsel-evlilik-is-degisiyor-ve-ne-means/?_r=0.
  1. Daha önce tartışıldığı gibi, Google Arama Trendleri bilgileri cinsiyete göre ayıramaz . Google AdWords, farklı kategoriler için sayfa görüntülemelerini cinsiyete göre ayırır, ancak bu veriler çok daha az doğrudur. Aramaları cinsiyete göre tahmin etmek için, önce eyalete göre gey pornosu aramalarının yüzdesinin bölgesel bir tahminini elde etmek için arama verilerini kullandım . Daha sonra Google Adwords kullanarak bu verileri cinsiyete göre analiz ettim . Cinsiyet istatistiklerini almanın başka bir yolu da PornHub verilerini kullanmaktır. Bununla birlikte, birçok gey erkek PornHub yerine yalnızca gey pornosu siteleri kullanabildiğinden , buradaki örnekleme çok seçici olabilir . PornHub, erkeklerin Google aramalarının önerdiğinden daha az gey pornosu istediğini bildiriyor. Ancak bu, eşcinselliğe hoşgörü ile eşcinsel pornosu arasında yakın bir ilişki olmadığını doğrulamaktadır. Tüm bu veriler web sitem sethsd.com'da "cinsiyet" bölümünde mevcuttur.
  1. Ivy League izleyicilerine 'İran'da gey yok' dedi, Daily Mail.com, 25 Eylül 2007, http://www. dailymail.co.uk/news/article-483746/We-dont-gays-Iran-Iranian-president-tells-Ivy-League-audience.html.
  1. Brett Logiurato, "Sochi Belediye Başkanı Şehirde Eşcinsel Olmadığını İddia Ediyor", Sports Illustrated, 27 Ocak 2014.
  1. Google Adwords verilerine göre her yıl "gey pornosu" için onbinlerce arama sorgusu yapılıyor . Pornografik arama sorgularında, eşcinsel porno yüzdesi Sochi ve ABD'de hemen hemen aynı. Google AdWords, İran için veri içermez. PornHub ayrıca İran hakkında haber yapmıyor . Ancak PornMD, arama verilerini inceledi ve İran'daki on aramadan beşinin gey pornosu olduğunu bildirdi. Bunlar, Joseph Patrick McCormick'in gey pornosu anketinde belirtildiği gibi, "baba sevgisi" ve "otel iş adamı"nı içerir, "Anket, Eşcinselliği Yasaklayan Ülkelerde Eşcinsel Porno Aramalarının İlk Sırada Olduğunu Ortaya Çıkardı . " en iyi eyaletler, PinkNews, http://www.pinknews.co.uk/2013/03/13/survey-reveals-searches-for-gay-porn-are-top-in -countries-banning-homosexuality/ Göre Google Trends'e göre, İran'daki porno aramalarının yaklaşık %2'si gey pornosu içindir; bu, Amerika Birleşik Devletleri'ndekinden daha düşüktür, ancak yine de bu tür sekse yaygın bir ilgi olduğunu göstermektedir.
  1. Stephens-Davidowitz, "Seks Arıyor." ("Seks arayın"). Bu bölümün verileri web sitem sethsd.com'da "cinsiyet" bölümünde bulunabilir .
  1. 15-44 Yaş Arasındaki Kadınlarda Modern Doğum Kontrolü : ABD, 2011-2013, Hastalık Kontrol ve Önleme Merkezleri , http://www.cdc.gov/nchs/data/databriefs/db173_table.p df#1. David Spiegelhalter, "Seks: Şanslar Nelerdir?" (“Sex: Şansınız nedir?”), BBC News, 15 Mart 2012, http://www.bbc.com/future/story/20120313-sex-in-the-city-or-elsewhere .

Her yıl yaklaşık 6,6 milyon gebelik ve 15 ila 44 yaş arası 62 milyon kadın.

Google araması yapan kişilerin cinsiyetini bilmiyorum . Tahminime göre, oral seks taleplerinin büyük çoğunluğu erkeklerden geliyor ve oral seks taleplerinin büyük çoğunluğu kadınlardan geliyor. Gerçek şu ki, çoğu insan heteroseksüeldir . Ve eşcinseller için hemcins partnerlerini nasıl memnun edeceklerini öğrenmek kesinlikle daha kolay .

Google AdWords ile yazar analizi.

Evan Soltas ve Seth Stephens-Davidowitz, "The Rise of Hate Search," New York Times, 13 Aralık 2015, SR1. Veriler ve daha fazla bilgi web sitem sethsd.com'da "İslamofobi" başlığı altında bulunabilir .

Yazarın Google veri trendlerine ilişkin analizi.

Yazarın Google Trendler verilerinin analizi.

Ashwin Rode ve Anand J. Shukla, "Önyargılı Tutumlar ve İşgücü Piyasası Sonuçları", mimeo, 2013, mimeographed bülten, 2013.

Seth Stephens-Davidowitz, Google, Söyle. Oğlum Bir Dahi mi? (“Google, söyle bana, oğlum bir dahi mi?”), New York Times, 19 Ocak 2014, SR6.

"Gender Equity in Education: A Data Snapshot", ABD Eğitim Bakanlığı Sivil Haklar Bölümü, Haziran 2012, http://www2.ed.gov/about/offices/list/ocr/docs/gender-equity-in-education. pdf .

Çocuk ve Ergen Sağlığı Veri Merkezi, http://www. childhealthdata.org/browse/survey/results?q=2415&r=455&a=3879&p=1.

  1. Stevens-Davidovich "Nefret Verisi", ilgili veriler "Stormfront" adlı bir bölümde sethsd.com'a yüklenir .
  1. Ekim 2015 ve 2016'da Stormfront için yapılan Google aramalarının sayısı hemen hemen aynıydı . Obama'nın ilk seçimleri sırasındaki durumla keskin bir tezat oluşturuyor. Ekim 2008'de Stormfront için yapılan aramaların yüzdesi, bir önceki Ekim ayına göre neredeyse %60 arttı. Obama'nın seçilmesinin ertesi günü Google'da "Stormfront" aramaları yaklaşık 10 kat arttı. Trump seçildikten sonraki gün, Stormfront hakkındaki sorular yaklaşık 2,5 kat arttı. 2004'te George W. Bush'un seçilmesinin ertesi günüydü ve birçok yönden siyasi keşlerin çıkarlarını yansıtıyor olabilir.
  1. Matthew Gentzkow ve Jesse M. Shapiro, "Çevrimiçi ve Çevrimdışı İdeolojik Segregasyon" , Üç Aylık Ekonomi Dergisi 126, no. 4 (2011).
  1. Bakınız Ben Quinn, "Sosyal Ağ Kullanıcıları Çevrimiçi Olarak Gerçek Hayattakinin İki Katı Kadar Arkadaşa Sahiptir", Guardian, 8 Mayıs 2011 . Bu makale , Cystic Fibrosis Trust tarafından 2011 yılında yapılan ve ortalama bir sosyal medya kullanıcısının 121 çevrimiçi arkadaşı varken gerçek hayatta sadece 55 olduğunu ortaya koyan bir araştırmayı inceliyor . 2014 Pew Research araştırmasına göre, ortalama bir Facebook kullanıcısının 300'den fazla arkadaşı var . . Bkz. Aaron Smith, "Facebook Hakkında 6 Yeni Gerçek", 3 Şubat 2014, http://www.pewresearch.org/fact-tank/2014/02/03/6-new - facts-about-facebook/ .
  1. Eytan Bakshy, Itamar Rosenn, Cameron Marlow ve Lada Adamic, "Sosyal Ağların Bilgi Yayılımındaki Rolü" , 21. Uluslararası World Wide Web Konferansı Tutanakları , 2012.
  1. "Çalışma: Çocuk İstismarı ve ABD Ekonomik Gerileme", Associated Press, 12 Aralık 2011.
  1. Kendin Yap Kürtajın Dönüşü ", New York Times, 6 Mart 2016, SR2. Veriler ve daha fazla bilgi web sitem sethsd.com'da "spontan düşük" bölümünde bulunabilir.
  1. Denetlenmiş Medya Birliği, Tüketici Dergileri, http://abcas3 . auditedmedia.com/ecirc/magtitlesearch.asp.
  1. Yazarın 4 Ekim 2016 tarihinde Facebook Reklam Yöneticisini kullanarak yaptığı hesaplamalar.
  1. "En popüler sitelerin listesi", Wikipedia. Çevrimiçi davranışları takip eden Alexa'nın verilerine göre XVideos , 4 Eylül 2016 tarihinde en popüler porno sitesi oldu ve en popüler 57. site oldu. 4 Eylül 2016 tarihi itibariyle SimilarWeb'e göre en popüler porno sitesi XVideos oldu ve en popüler 17. site oldu. Alexa'ya göre ilk on Google, YouTube, Facebook, Baidu, Yahoo!, Amazon, Wikipedia, Tencent QQ, Google Hindistan ve Twitter.
  1. Bu, David Kirkpatrick tarafından anlatılan hikayedir, The Facebook Effect: The Inside Story of the Company That Connecting the World , New York: Simon & Schuster, 2010.
  1. Peter Thiel ve Blake Masters, Zero to One: Notes on Startups, or How to Build the Future, New York: The Crown Publishing Group, 2014.
  1. Xavier Amatrian ile 5 Mayıs 2015 tarihinde telefonla görüştüm.
  1. Yazarın Google veri trendlerine ilişkin analizi.
  1. 3 Şubat 2016'da yayınlanan "Başkan Baltimore'daki İslam Topluluğuna Sesleniyor " YouTube videosu , https://www.youtube.com/watch?v=LRRVdVqAjdw .

Bölüm 5

  1. Seth Stephens-Davidowitz, "Seni Gençken Kandırırlar", New York Times , 20 Nisan 2014, SR5. Bu çalışmanın verileri sitem sethsd.com'da Beyzbol bölümünde bulunabilir.
  1. Yair Ghitza ve Andrew Gelman, "The Great Society, Reagan's Revolution, and Generations of Presidential Voting" , yayınlanmamış el yazması.
  1. Raj Chetty ile 30 Temmuz 2015'te telefonla görüştüm.
  1. Raj Chetty ve diğerleri, Amerika Birleşik Devletleri'nde Gelir ve Yaşam Beklentisi Arasındaki İlişki , 2001-2014 , JAMA 315, no. 16 (2016).
  1. Julia Belluz, Gelir Eşitsizliği Amerikalıların Yaşam Beklentisi'ni Azalıyor , vox.com, 11 Nisan 2016.
  1. Raj Chetty, John Friedman ve Emmanuel Saez, "EITC'nin Kazançlar Üzerindeki Etkilerini Ortaya Çıkarmak İçin Mahallelerdeki Bilgi Farklılıklarını Kullanma", American Economic Review 103 , no. 7 (2013).
  1. Bu, Seth Stephens-Davidowitz, "The Geography of Fame " , New York Times, 23 Mart 2014, SR6'dan. Veriler sitem seths.com'da "Wikipedia, ilçeye göre doğumlar" bölümünde bulunabilir . Vikipedi'ye katkıda bulunan her kişinin doğum bölgesini indirme ve analiz etme konusunda yardımları için Noah Stevens-Davidovich'e teşekkür ederim.
  1. Şehirlerin değerine dair ek kanıtlar için bkz. Ed Glaeser, Triumph of the City (New York: Penguin, 2011). (Glaser benim doktora danışmanımdı).
  1. David Levinson, ed., Encyclopedia of Crime and Punishment (Thousand Oaks, CA: SAGE, 2002).
  1. Craig Anderson ve diğerleri, "Medya Şiddetinin Gençlik Üzerindeki Etkisi", Psychological Science in the Public Interest 4 (2003).
  1. Gordon Dahl ve Stefano DellaVigna, "Film Şiddeti Şiddet Suçunu Artırır mı?" (“Filmde Şiddet ve Şiddet Suçunun Yükselişi ”), Quarterly Journal of Economics 124, no. 2 (2009).
  1. Seth Stephens-Davidowitz, "Days of Our Digital Lives", New York Times, 5 Temmuz 2015, sr4.
  1. Anna Richardson ve Tracey Budd, "Genç Yetişkinler, Alkol, Suç ve Düzensizlik, Suçlu Davranış ve Akıl Sağlığı", 13, no. 1 (2003); Richard A. Scribner, David P. MacKinnon ve James H. Dwyer, "Los Angeles County'de Saldırı Şiddeti ve Alkol Bulunabilirliği Riski" , American Journal of Public Health 85, no. 3 (1995); Dennis M. Gorman, Paul W. Speer, Paul J. Gruenewald ve Erich W. Labouvie, "Spatial Dynamics of Alcohol Availability, Neighbourhood Structure and Violent Crime", Journal of Studies on Alcohol 62, no. 5 (2001); Tony H. Grubesic, William Alex Pridemore, Dominique A. Williams ve Loni Philip-Tabb, "Alcohol Outlet Density and Violence: The Role of Risky Retailers and Alcohol- Related Harcamalar" ve alkolle ilgili giderler"), Alkol ve Alkolizm 48 , HAYIR. 5 (2013).
  1. 3 Aralık 2015'te yayınlanan YouTube videosu, "Ed McCaffrey başından beri Christian'ın iyi olacağını biliyordu," https://www . youtube.com/watch?v=boHMmp7DpX0.
  1. Araştırmacılar, küçük zaman dilimlerine bölünmüş bu suç verilerini kullanmaktan çok şey kazandı. Örnek? Şehrin futbol takımının kazanması beklenen bir maçı kaybetmesinin hemen ardından aile içi şiddet şikayetleri artıyor. Bkz. David Card ve Gordon B. Dahl, "Aile Şiddeti ve Futbol: Beklenmedik Duygusal İpuçlarının Şiddet Davranışı Üzerindeki Etkisi", Üç Aylık Ekonomi Dergisi 126, no . 1 (2011).
  1. Bill Simmons, "David Ortiz'e Veda Etmek Zor", ESPN.com, 2 Haziran 2009, http://www.espn.com/espnmag/story?id= 4223584 .

, "Sinyal ve Gürültü: Neden Pek Çok Tahmin Başarısız - Ama Bazıları Dont", New York: Penguin, 2012'de tartışılmaktadır .

Ryan Campbell, Prince Fielder Nasıl Yaşlanacak? (“Prens Fielder kaç yaşında olacak?”), 28 Ekim 2011, http://www.fangraphs . com/blogs/how-will-prince-fielder-age/.

Bu veriler bana Baseball Prospectus'tan Rob McKone tarafından nazikçe sağlandı.

15 Haziran 2015'te Isaac Kogan ile telefonla görüştüm. 17 Ağustos 2015'te James Heywood ile telefonla görüştüm.

Bölüm 6

Bu hikaye, diğerlerinin yanı sıra Brian Christian'ın The A/B Test: Inside the Technology That Changeing the Rules of Business, 25 Nisan 2012, http://www.wired.com/2012/04/ff_abtesting/ makalesinde ele alınmıştır .

Esther Duflo, Rema Hanna ve Stephen P. Ryan, "Teşvikler İşe Yarar: Öğretmenleri Okula Getirmek " , American Economic Review 102, no. 4 (2012).

Ian Parker, The Poverty Lab, New Yorker, The New Yorker, 17 Mayıs 2010.

Christian, "A/B Testi".

Douglas Bowman, Elveda, Google, 20 Mart 2009, http://stopdesign.com/archive/2009/03/20/goodbye-google.html .

Eytan Bakshy, "Büyük Deneyler: Karar Vermek İçin Büyük Verilerin Arkadaşı", 3 Nisan 2014 , https://www.facebook.com/notes/facebook-data-science /big-experiments-big-datas-friend-for- karar verme/10152160441298859/. Farmasötik araştırmalarla ilgili bilgi kaynakları, Her yıl kaç tane klinik deney başlatılıyor? (“Her yıl kaç klinik deney yapılıyor?”), https://www.quora.com/How-many-clinical-trials-are-started-each-year .

  1. Dan Siroker ile 29 Nisan 2015 tarihinde telefonla görüştüm.
  1. Basit Bir Deney Yaparak 60 Milyon Doları Nasıl Topladı , " 29 Kasım 2010, Optimizely blogu, https://blog.optimizely.com/ 2010/11/29/how-obama-raised-60-million- by-running-a- simple-experiment/.
  1. Â/B-testleri ve sonuçları yazar tarafından sunulmuştur. Boston Globe testiyle ilgili bazı ayrıntılar "The Boston Globe: Discovering and Optimizeing a Value Proposition for Content", Marketing Sherpa Video Archive, https://www adresinde bulunabilir . marketingsherpa.com/video/boston-globe-optimization-summit2. Buna The Globe'dan Peter Doucette ve MECLABS'tan Pamela Markey arasında kaydedilmiş bir konuşma da dahildir.
  1. 23 Temmuz 2015'te Clark Benson ile telefonla görüştüm.
  1. "Google Görüntülü Reklam Ağı'ndaki Metin Reklamları Geliştirme", Âdsense içinde, 3 Aralık 2012, https://adsense.googleblog.com/2012/12/enhancing-text-ads-on-google-display.html .
  1. Örneğin, "Google reklamlarında görünen büyük oklar - lütfen kaldırın" , Doubleclick Yayıncı Yardım Forumu, https://productforums.google.com/forum/ #!topic/dfp/p_TRMqWUF9s konusuna bakın.
  1. Adam Alter , Dayanılmaz: Bağımlılık Yapan Teknolojinin Yükselişi ve Bizi Bağlama İşi , New York: Penguin, 2017.
  1. Yazarın Google veri trendlerine ilişkin analizi.
  1. Bu, şu anda Harry Walker Speakers Bureau'daki Freakonomics sayfasında yer alan bir videoda tartışılmaktadır, http://www.harrywalker.com/speakers/authors-of-freakonomics/ .
  1. Wesley R. Hartmann ve Daniel Klapper. "Super Bowl Reklamları" , yayınlanmamış el yazması, 2014 .
  1. Bir bilgisayar simülasyonunda yaşadığımıza dair güçlü bir örnek için bkz. Nick Bostrom, "Bir Bilgisayar Simülasyonunda mı Yaşıyoruz?" (“Belki de bir bilgisayar simülasyonunda yaşıyoruz?”), Philosophical Quarterly 53, no. 211 (2003).
  1. Los Angeles Times personeli, ABD Başkanlık Suikastları ve Girişimleri, Los Angeles Times, 22 Ocak 2012 http://timelines . latimes.com/us-presidential-assassinations-and-attempts/.
  1. Jones ve Olken, "Suikastçılar Gerçekten Tarihi Değiştiriyor mu?" (“ Katiller Gerçekten Tarihi Değiştiriyor mu?”), The New York Times, 12 Nisan 2015, SR12.
  1. Bu hikaye aynı zamanda Jones ve Olken'in "Suikastçılar Gerçekten Tarihi Değiştiriyor mu?" ("Katiller gerçekten tarihi değiştirir mi?").
  1. Saldırının korkunç videosu , 31 Mart 2009'da yayınlanan bir YouTube videosu olan "Geçit Sürprizi (Çeçenya 2004 )" adresinde görülebilir, https://www.youtube.com/watch?v=fHWhs5QkfuY .
  1. İle. 281 Bir Liderin Ölümünün Sonuçları: Benjamin F. Jones ve Benjamin A. Olken. Vur ya da ıskala? Suikastların Kurumlar ve Savaş Üzerindeki Etkisi , Amerikan Ekonomi Dergisi: Makroekonomi 1, no. 2 (2009).
  1. New York Times, 27 Mayıs 2014, D5'te ele alınmıştır . Tierney, Benedicte Apouey ve Andrew E. Clark'ın "Kazanmak Büyük Ama Daha İyi Hissetmiyor mu?" Araştırmasını tartışıyor. Piyango Ödüllerinin Fiziksel ve Ruh Sağlığı Üzerindeki Etkisi , Sağlık Ekonomisi 24, no. 5 (2015); Jonathan Gardner ve Andrew J. Oswald. "Para ve Ruh Sağlığı: Orta Ölçekli Piyango Kazançlarına Dair Uzun Süreli Bir Çalışma", Journal of Health Economics 26, no. 1 (2007); ve Anna Hedenus, Gökkuşağının Sonunda: İsveç Piyango Kazananları Arasında Kazanma Sonrası Yaşam , yayınlanmamış el yazması, 2011. Tierney ayrıca ünlü 1978 gazetesi Philip Brickman, Dan Coates ve Ronnie Janoff-Bulman'dan bahseder : "Piyango Kazananlar ve Kaza Kurbanları : Mutluluk Göreceli midir?" (“Piyango Kazananlar ve Kaza Mağdurları: Mutluluk Göreceli mi?” Journal of Personality and Social Psychology 36, no. 8 (1978), piyango oynamanın sizi mutlu etmeyeceğini gösteriyor . Bu makale çok küçük bir örneğe dayanıyordu.
  1. Bkz. Peter Kuhn, Peter Kooreman, Adriaan Soetevent ve Arie Kapteyn, "The Effects of Lottery Prizes on Winners and Their Neighbors: Evidence from the Dutch Postcode Lottery " Postal Lottery), American Economic Review 101, no. 5 (2011) ve Sumit Agarwal, Vyacheslav Mikhed ve Barry Scholnick, “Eşitsizlik Mali Sıkıntıya Neden Olur mu? Piyango Kazananları ve Komşu İflaslardan Elde Edilen Kanıtlar , Çalışma Kağıtları, 2016.
  1. Agarwal, Mikhed ve Scholnick, Eşitsizlik Mali Sıkıntıya Neden Olur mu? (“Eşitsizlik finansal krize neden olur mu?”)
  1. Jeffrey Clemens ve Joshua D. Gottlieb. "Hekimlerin Maddi Teşvikleri Tıbbi Tedaviyi ve Hasta Sağlığını Etkiler mi?" (“ Finansal Teşvikler Tedaviyi ve Hasta Sağlığını Etkiler mi?”), American Economic Review 104, no. 4 (2014). Bu sonuçların doktorların kötü adam olduğu anlamına gelmediğini unutmayın . Aslında, doktorlar tarafından reçete yazmaları için para ödendiğinde reçete edilen ek prosedürler gerçekten hayat kurtarırsa, sonuçlar daha da iç karartıcı olabilir . Durum böyle olsaydı, hayat kurtarıcı tedaviler yazmaları için doktorlara ödeme yapılması gerektiği anlamına gelirdi. Bunun yerine, Clemens ve Gottlieb tarafından elde edilen sonuçlar, doktorların , bunları gerçekleştirmeleri için ne kadar para verilirse verilsin, hayat kurtaran prosedürleri reçete edeceğini gösteriyor . Çok gerekli olmayan prosedürlere gelince, doktorlara reçete yazmaları için iyi ödeme yapılması gerekir. Başka bir deyişle , doktorlar, hastalık nedeniyle hastanın hayatı tehdit edildiğinde maddi teşviklere çok fazla önem vermiyorlar , küçük sebeplerle kendilerine geldiklerinde ödeme konusunda çok ilgileniyorlar.
  1. Robert D. McFadden ve Eben Shapiro, “Sonunda Stuyvesant'a Sığdıracak Bir Yüz; Başarılı Bir Lise, Yüksek Fiyatlı Bir Ev Alır, New York Times, 8 Eylül 1992.
  1. Kurslar Stuyvesant'ın web sitesinde mevcuttur, http://stuy.enschool . org/index.jsp
  1. Anna Bahr, "Üniversiteye Kabul Savaşı 3 Yaşında Başladığında", New York Times, 29 Temmuz 2014, http://www.nytimes.com/2014/07/30/upshot/When-the-college-admissions- battle-starts-at-age-3.html.
  1. Sewell Chan, "Obama Ekibinin New York Bağları", New York Times, 25 Kasım 2008; Evan TR Rosenman, "1984 Sınıfı: Lisa Randall", Harvard Crimson, 2 Haziran 2009; "Gary Shteyngart on Stuyvesant Lisesi: My New York", YouTube, 4 Ağustos 2010'da yayınlanan video , https://www.youtube.com/watch?v=NQ_phGkC-Tk ; Candace Amos, "NYC Devlet Okullarına Katılan 30 Yıldız", New York Daily News, 29 Mayıs 2015.
  1. Carl Campanile, «Çocuklar Bubba'ya Karşı Yüksek Kalır; Ground Zero School'un Mezuniyetine Hitap Edecek», New York Post, 22 Mart 2002; Birleşmiş Milletler Basın Bülteni, Genel Sekreter Mezuniyet Konuşmasında «Stuyvesant Lisesinin 'Çok Kültürlü Goblen' Nefrete Karşı Etkili Tepkisi, Diyor», 23 Temmuz 2004; «Conan O'Brien'ın Lincoln Center'daki Stuyvesant's Class of 2006 Graduation in Lincoln Center'daki Konuşması», YouTube, 6 Mart 2012'de yayınlanan video, https://www.youtube.com/watch?v=zAMkUE9Oxnc .
  1. См. https://k12.niche.com/rankings/public-high-schools/best-overall/ .
  1. Pamela Wheaton, «8. Sınıflar Liseye Kabul Sonuçlarını Alıyor», Insideschools, 4 Mart 2016, http://insideschools.org/blog/item/ 1001064-8th-graders-get-high-school-admissions-results.
  1. M. Keith Chen ve Jesse M. Shapiro, “Daha Sert Hapishane Koşulları Tekrar Suç İşlenmesini Azaltıyor mu? Süreksizlik Temelli Bir Yaklaşım», American Law and Economics Review 9, no. 1 (2007).
  1. Atila Abdulkadiroğlu, Joshua Angrist ve Parag Pathak. “Elit Yanılsaması: Boston ve New York Sınav Okullarında Başarı Etkileri,” Econometrica 82, no. 1 (2014). Başarılı Akranları Olan Bir Okula Gitmenin Etkisinin Ötesinde : Will Dobbie ve Roland G. Fryer Jr'ın New York City Sınav Okullarından Kanıtları», American Economic Journal: Applied Economics 6, no. 3 (2014).
  1. См. http://www.payscale.com/college-salary-report/bachelors .
  1. Stacy Berg Dale ve Alan B. Krueger. "Daha Seçici Bir Üniversiteye Gitmenin Getirisini Tahmin Etmek : Gözlemlenebilirler ve Gözlemlenemeyenler Üzerine Bir Seçim Uygulaması ", Quarterly Journal of Economics 117, no. 4 (2002).
  1. Alice Schroeder, "The Snowball: Warren Buffett and the Business of Life", New York: Bantam, 2008.

Ders 7. Dil-konuşma: Ne demek istiyorsun?

  1. Johan Bollen, Huina Mao ve Xiaojun Zeng, "Twitter Mood Predicts the Stock Market", Journal of Computational Science 2, no. 1 (2011).
  1. James Mackintosh, «Sosyal Medya Sinyallerine Dayalı İşlem Yapan Serbest Fon İşe Yaramadı», Financial Times, 25 Mayıs 2012.
  1. Christopher F. Chabris ve diğerleri, «Genel Zeka ile En Çok Bildirilen Genetik İlişkiler Muhtemelen Yanlış Pozitiflerdir», Psychological Science (2012).
  1. Bu hikaye, 14 Mayıs 2013 tarihli YouTube videosu "How to Make a Behavior Addictive: Zoe Chance at TEDx Mill River" adlı TEDx Talks'ta tartışılmaktadır, https://www.youtube.com/watch?v=AHfiKav9fcQ . Röportajda adımsayarın rengi gibi hikayenin bazı detayları belirtildi. Chance ile 20 Nisan 2015'te telefonla ve 11 Temmuz 2016 ile 8 Eylül 2016'da e-posta yoluyla görüştüm .
  1. Bu bölüm Alex Peisakhovich ve Seth Stevens -Davidovich'ten, "How Not Drowned in Numbers", The New York Times, 3 Mayıs 2015, IR6.
  1. Brian A. Jacob ve Steven D. Levitt, "Rotten Apples: An Investigation of the Prevalence and Predictors of Teacher Hile", Quarterly Journal of Economics 118, no. 3 (2003).
  1. 22 Nisan 2015'te Thomas Kane ile telefonla görüştüm.
  1. Bill ve Melinda Gates Vakfı, " Etkili Öğretimin Adil ve Güvenilir Ölçütlerini Sağlama", http://k12education.gatesfoundation.org/wp-content/uploads/2015/05/MET_Ensuring_Fair_and_Reliable_MeasuresPractitionerBrief.pdf .

Bölüm 8: Daha Fazla Veri, Daha Fazla Sorun?

ne yapmamalıyız

  1. Oded Netzer, Alain Lemaire ve Michal Herzenstein, "Kelimeler Terlediğinde: Kredi Başvuruları Metninde Kredi Temerrüdü için Sinyallerin Belirlenmesi", 2016.
  1. Peter Renton, "Lending Club and Prosper'daki Temerrüt Oranlarının Başka Bir Analizi", 25 Ekim 2012, http://www.lendacademy.com/lending-club-prosper-default-rates/ .
  1. Michal Kosinski, David Stillwell ve Thore Graepel, «Private Traits and Attributes Are Predictable from Digital Records of Human Behavior», PNAS1 10, no. 15 (2013).
  1. Michael Luca, «İncelemeler, İtibar ve Gelir: Yelp Örneği», неопубликованная рукопись, 2011.
  1. Christine Ma-Kellams, Flora Or, Ji Hyun Baek ve Ichiro Kawachi, "İntihar Gözetimini Yeniden Düşünmek: Google Arama Verileri ve Kendinden Bildirilen İntihar Diferansiyel Olarak Tahmin Edilen Tamamlanmış İntihar Riski", Clinical Psychological Science 4, no. 3 (2016).
  1. Bu, web sitemde notlarda belirtilen tekniği kullanır . "İntihar" için bir Google aramasını "kravat nasıl bağlanır" aramasıyla karşılaştırıyorum . 2015 yılında Google'da "nasıl kravat bağlanır" araması yapıldı. Ve "intihar" kategorisinde 6,5 kat daha fazla arama yapıldı. 6,5 × 6,6 / 12 = 3,5.
  1. Bridge Girişimi Ekibi, "İslamofobi Şiddete Döndüğünde: 2016 ABD Başkanlık Seçimi", 2 Mayıs 2016, http://bridge adresinden ulaşılabilir . georgetown.edu/When-islamophobia-turns-violent-the-2016-us-cumhurbaşkanlığı-seçimleri/.

Çözüm. Bir kitabı kaç kişi sonuna kadar okur?

  1. Karl Popper, Varsayımlar ve Çürütmeler, Londra: Routledge & Keagan Paul, 1963.
  1. Şehirdeki bu hastalığın tüm vakalarını karşılaştırın ; Simon Rogers, "John Snows Veri Gazeteciliği: Dünyayı Değiştiren Kolera Haritası", Guardian, 15 Mart 2013.
  1. Benjamin Jones ile 1 Haziran 2015'te telefonla görüştüm. Bu çalışma aynı zamanda Aaron Chatterjee ve Benjamin Jones, Harnessing Technology to Enhance K-12 Education, Hamilton Project Tartışma Belgesi, 2012'de tartışılmaktadır .
  1. Jordan Ellenberg, «Yazın En Çok Okunmayan Kitabı...», Wall Street Journal, 3 Temmuz 2014.

ÇOK SATANLAR

Seth Otivens-Davidowitz

HERKES YALAN SÖYLER

ARAMA MOTORLARI, BÜYÜK VERİ VE İNTERNET SİZİN HAKKINDA HER ŞEYİ BİLİYOR


[1]1890 ile 1964 yılları arasında Amerika Birleşik Devletleri'ndeki ırk ayrımcılığı yasalarının resmi olmayan adı. — Yaklaşık. ed.

[2]Google Trends uygulaması, çalışmamdaki verilerin çoğunun kaynağıdır. Bununla birlikte, yalnızca farklı isteklerin göreli sıklığını karşılaştırmanıza izin verdiği, ancak belirli herhangi bir arama türü için isteklerin tam sayısını bildirmediği için , sonuçlarını genellikle ne sıklıkta olduğunu gösteren bir hizmet olan Google Adwords'ten elde edilen verilerle tamamlarım. her arama yapıldı. Çoğu durumda, Google Verileri ile Deneyim adlı tezimde ve Journal of Public Economics makalem, Irksal Dislike for Blacks'de anlattığım Google Trends'in üzerine yazılmış kendi algoritmamla görüntü netliğini iyileştirmeyi başardım. . aday: Google tarafından elde edilen verilere dayalıdır. Tez, makale, verilerin tam açıklaması ve bu kitapta sunulan tüm orijinal araştırmalarda kullanılan kod web sitemde mevcuttur: sethsd.com. — Yaklaşık. ed.

[3]Kısaltma New York basketbol takımı (NBA) Knickerbockers'tan . — Yaklaşık. ed.

[4]Ku Klux Klan (İngilizce) - Ku Klux Klan. — Yaklaşık. ed.

[5]Orijinal olarak. - Büyük Veri - Yaklaşık. ed.

[6]verilere ne kadar yakın uyduğunu belirlemenin bir yoludur . — Yaklaşık. ed.

[7]Dürüst olmak gerekirse, bu çalışmayı tamamladıktan kısa bir süre sonra California'dan New York'a taşındım. Ne yapılması gerektiğini anlamak için gerçekleri kullanmak kolaydır. Aslında bunu yapmak oldukça zor. — Yaklaşık. ed.

[8]Bir NBA oyuncusunun ortalama boyu 201 cm, Amerikalı bir erkeğin ortalama boyu 179 cm 14 . — Yaklaşık. ed.

[9]Google Flu'nun orijinal sürümünün önemli kusurları vardı , bu nedenle araştırmacılar yakın zamanda çok daha başarılı bir model oluşturdular. — Yaklaşık. ed.

[10]1998'de, popüler Google öncesi arama motorunda "araba" kelimesini arasaydınız, porno sitelerinin adresleriyle bombardımana tutulurdunuz . Arama motorunu yanıltmak için oraya "araba" kelimesi - genellikle beyaz zemin üzerine beyaz harflerle - yazılmıştı . Sonuç olarak, bu siteler araba satın almak isteyen ancak pornoyla dikkati dağılan insanlardan fazladan birkaç tıklama aldı . — Yaklaşık. ed.

[11]Amerika Birleşik Devletleri'ndeki en eski ve en onurlu öğrenci birliği. — Yaklaşık. ed.

[12]İşte üzerinde çalıştığım teorilerden biri: büyük veri, rahmetli Leonard Cohen'in söylediği her şeyi doğruluyor. Örneğin , bir keresinde yeğenine kadınlara kur yapma konusunda şu tavsiyeyi vermişti 20 : “Dikkatlice dinle. O zaman biraz daha dinle. Ve yeterince duyduğuna karar verdiğinde tekrar dinle." Görünüşe göre bilim adamlarının araştırmalarıyla doğruladıkları tam olarak bu . — Yaklaşık. ed.

[13]6 yalan söylemenin bir başka nedeni de araştırmacılara basitçe saldırma arzusudur . Bu, günlük yaşamda o kadar büyük bir sorun olmasa da, ergenlerle ilgili herhangi bir araştırma için çok büyük - ve bu yaş grubunun davranışlarını anlamamızı temelde zorlaştırıyor . Başlangıçta bilim adamları bir ilişki buldular: evlat edinilen çocuklar (gençler) genellikle antisosyal davranırlar - özellikle uyuşturucu kullanırlar, içerler, okulu asarlar. Ancak daha sonra yapılan araştırmalar, bu ilişkinin tamamen kendilerini evlat edinilmiş olarak nitelendiren ergenlerin % 19'undan oluştuğunu , evlat edinilmediğini göstermiştir . Anketlerin daha ayrıntılı analizi, çalışma sırasında gençlerin önemli bir yüzdesinin boylarının 213,5 cm'den ve 400 pound'dan (181,5 kg) fazla olduklarını bildirdiğini ortaya çıkardı. Başka bir ankette, takma dişleri olduğunu bildiren öğrencilerin %99'unun araştırmacı bilim insanlarına şaka yaptığı ortaya çıktı . — Yaklaşık. ed.

[14], Judy Garland'ın tutkusunu erkeklerle seks yapma tercihiyle ilişkilendirmemi saldırgan bulabilir - şaka olarak bile. Ve kesinlikle tüm geylerin - hatta çoğunun - divalardan hoşlandığını kastetmiyorum. Ancak arama verileri, bu klişede bir şeyler olduğunu gösteriyor. Judy Garland hakkında bilgi arayan bir kişinin gey pornosu arama olasılığının normal pornoya göre üç kat daha fazla olduğunu tahmin ediyorum . Büyük veriler bize bazı klişelerin her şeye rağmen doğru olduğunu söylüyor. — Yaklaşık. ed.

[15]Bu verinin optimal flört stratejisi üzerinde de etkisi olduğunu düşünüyorum. Çok fazla endişelenmemeniz ve reddi ciddiye almanız gerektiği açıktır. Yavaş yavaş, sizin gibi insanlara ilgi duyan benzer düşünen insanlar bulacaksınız. Nasıl görünürsen görün, bu tipten hoşlanan erkekler ve kadınlar var. Güven bana. — Yaklaşık. ed.

[16]Bu kitaba Penisim Ne Kadar Büyük? adını vermek istedim. Google aramaları insan doğası hakkında ne diyor ", ancak editör, kitabın bu adla pek satmayacağı konusunda uyardı - insanlar, bir havaalanı kitapçısından bu adla bir kitap satın almayı düşünmekten çok utanabilirler . Ne düşünüyorsun? — Yaklaşık. ed.

[17]Ebeveynlerin çocuklarına farklı cinsiyetlerden farklı davrandıkları hipotezini daha fazla test etmek için şu anda anne ve baba web sitelerinden veri almaya çalışıyorum. Bu istatistik , şu anda arama sorgularıyla yürüttüğüm örnekten çok daha fazla sayıda ebeveyn hakkında bilgi içerecek . — Yaklaşık. ed.

[18]New York Times web sitesi. — Yaklaşık. ed.

İnternet -neredeyse herkes hemfikirdir- Amerikalıları birbirinden uzaklaştırıyor ve çoğu insanın kendileri gibi insanları hedef alan sitelerde saklanmasına neden oluyor. Harvard Hukuk Fakültesi'nden Cass Sunstein durumu şu şekilde tanımladı : “İletişim pazarımız hızla insanların kendilerini kendi bakış açılarıyla sınırladıkları bir duruma doğru ilerliyor . Liberaller çoğunlukla sadece liberal basını izliyor ve okuyor , ılımlı basını ılımlı, muhafazakarlar muhafazakar basını , neo-Naziler neo-Nazi basını izliyor ve okuyor.”

Bu görüş mantıklı. Ne de olsa, İnternet bize haber tüketebileceğimiz neredeyse sınırsız sayıda kaynak sunuyor. Ne istersem okuyabilirim. Ne istersen okuyabilirsin. VikingMaiden88 ne isterse okuyabilir. Ve insanlar, kendi başlarına hareket etmelerine izin verilirse, inandıklarını doğrulayan görüşler aramaya yönelirler. Bu nedenle, elbette, İnternet son derece belirgin siyasi ayrımcılığın31 yaratılmasına katkıda bulunur .

Bu bariz kavramla ilgili bir sorun var : veriler bize bunun doğru olmadığını söylüyor.

[19]Yüz yüze. Mash - flört, aşk ilişkisi, konuşmacı. — Yaklaşık. çeviri

[20]Joe Biden, Obama başkanlığı sırasında Amerika Birleşik Devletleri Başkan Yardımcısı olarak görev yapan Demokrat Parti üyesi Amerikalı bir politikacıdır. — Yaklaşık. ed.

[21]John Beiner, Cumhuriyetçi Parti'nin bir üyesi olan Amerikalı bir politikacı , Obama yönetimindeki ABD Temsilciler Meclisi'nin sözcüsüydü. — Yaklaşık. ed.

[22]Twitter verilerini analiz ettim (almama yardım ettiği için Emma Pearson'a teşekkürler). Sonuçlar , kocanın şu anda sosyal ağlarda yaygın olan ancak gerçekle örtüşmeyen eylemlerinin bir açıklamasını içermiyor . Ne de olsa, bu açıklamalar bile istenen eylemlere - "çalışmak" veya "yemek yapmak" - yöneliktir . — Yaklaşık. ed.

[23]Size bir sır verelim: Bu kitap için materyalleri araştırırken, Noah bu tipik Amerikan eğlencesine duyduğu nefreti inkar ediyordu. Beyzboldan nefret ettiğini kabul ediyor, ancak nezaket, çocuk sevgisi ve zekayı kişiliğinin temel unsurları olarak görüyor. Ve beysbola karşı olumsuz bir tutumun, ana özelliklerinin ilk onunda bile yer almaması. Ancak bazen kendimizi anlamamızın zor olduğu sonucuna vardım. Ve nesnel olarak, dışarıdan biri olarak , beyzbol nefretinin, kabul etse de etmese de Noah'ın karakterinin temel bir parçası olduğunu görüyorum. Ben de onu yalnız bıraktım. — Yaklaşık. ed.

[24]Philadelphia şehri ve yerel beyzbol takımı için eğlenceli bir isim. — Yaklaşık. ed.

[25]ABD'de Beyzbol Ligi. — Yaklaşık. ed.

[26]Bu hikaye, kötü görünen bir şeyin, daha da kötü bir şeyin önüne geçtiğinde nasıl iyi olabileceğini gösteriyor. Stanford eğitimli eski bir karşılama oyuncusu olan Ed McCaffrey , dört oğlunu da futbol oynamaya gönderme kararını haklı çıkarmak için bu argümanı kullanıyor 14 : "Bu adamların çok fazla enerjisi var, bu yüzden futbol oynamazlarsa bazen kaykay sürün, ağaçlara tırmanın, bahçede kovalamaca oynayın veya paintball oynayın. Yani, oturup hiçbir şey yapmayacaklar. Ben de bu şekilde bakıyorum . En azından futbolda belli kurallar var... Çocuklarım daha önce de acil servise gittiler - çatıdan, bisikletten, kaykaydan, ağaçtan düştükten sonra. Anladığını düşünüyorum. Evet, spor oldukça ağır bir meslektir. Ama ayrıca, adamlarımla bir koç olacak ve en azından sincaplar gibi dağdan aşağı atlayıp her türlü çılgınlığı yapmayacaklar. Bence bu, saldırganlığı organize bir kanala yönlendirmekten başka bir şey değil.” The Herd'de Colin Cowherd ile yapılan bir röportajda McCaffrey'nin argümanlarına benzer bir şey hiç duymadım . Dahl ve della Vigna'nın makalesini okuduktan sonra bu düşünceleri daha ciddiye almaya başladım. Laboratuvar verileri yerine büyük gerçek veri setlerinin avantajı, bu tür etkileri ortaya çıkarabilmeleridir. — Yaklaşık. ed.

[27]David Ortiz, Boston Red Sox için oynayan Dominik kökenli Amerikalı bir beyzbol oyuncusu. — Yaklaşık. ed.

[28]Bir Major League Baseball All-Star Maçında en seçkin oyuncuya verilen yıllık bir ödül .
Yaklaşık. ed.

[29]Kitabın bu bölümünü okurken, mutlu sonla biten hikayeler konusunda alaycı olma eğiliminde olduğumu muhtemelen anlayabilirsiniz. Aslında, bu hikayenin son derece iyi görünmesini istedim, bu yüzden kinizmimi bir dipnotta kaldırdım. PECOTA'nın Ortiz'in steroid kullandığını yeni keşfettiğinden şüpheleniyorum, sonra bir noktada bunu yapmayı bıraktı ve sonra yeniden başladı. Öngörü açısından bakıldığında, PECOTA'nın bunu daha önce inceleyebilmesi gerçekten harika . Doğru, o zaman hikaye çok daha az dokunaklı hale gelir. — Yaklaşık. ed.

[30], Demokrat Parti'ye bağlı Amerikalı
politikacılardır . — Yaklaşık. ed.

[31]Sarah Silverman ve Amy Schumer Amerikalı stand-up oyuncularıdır. — Yaklaşık. ed.

[32]ABD'deki en eski iki edebiyat dergisi. — Yaklaşık. ed.

[33]www.vox.com , Amerikan haber sitesi. — Yaklaşık. ed.

[34]Amerikan Futbolu Ligi. — Yaklaşık. ed.

[35]1978 tarihli ünlü bir makale, piyangoyu kazanmanın sizi mutlu edeceğini iddia ediyordu. Daha sonra, bu efsane büyük ölçüde çürütüldü. — Yaklaşık. ed.

[36]Ivy League, Amerika Birleşik Devletleri'nin kuzeydoğusundaki sekiz özel Amerikan üniversitesinden oluşan bir dernektir. Adını bu üniversitelerdeki eski binaların etrafında yetişen sarmaşıklardan alıyor. Lig üyeleri yüksek kaliteli eğitim olarak kabul edilir . Ligde Brown (Providence), Harvard (Cambridge), Yale (New Haven), Columbia (New York), Cornell (Ithaca), Pensilvanya (Philadelphia) ve Princeton (Princeton) üniversiteleri ile Dartmouth College (Hannover) yer alıyor . . — Yaklaşık. ed.

[37]Adını ve bazı detayları değiştirdim. — Yaklaşık. ed.

[38]meslektaşlarını ararken , 20'li ve 50'li yaşlarındaki insanların sayısı beni çok etkiledi . Bunların arasında, sadece bir puan eksik olduğu için Flock'u kaçırdığını hatırlatan eski kongre üyesi ve New York belediye başkanı adayı Anthony Weiner de var. Weiner bir telefon görüşmesinde "Beni istemediler" dedi. — Yaklaşık. ed.

[39]Gelişmiş Yerleştirme sınavlarından - Amerika Birleşik Devletleri'ndeki tüm öğrenciler için yıllık yıllık testler. — Yaklaşık. ed.

[40]Skolastik Değerlendirme testinden - Amerika Birleşik Devletleri'ndeki kolejlere kaydolmadan önceki son test (USE'ye benzer). — Yaklaşık. ed.

[41]Amerikan sitesi yelp.com, Rus otzovik.com'un bir benzeri - Yaklaşık. ed.

[42]orijinal adı Freaconomics. Steven Levitt ve Steven Dubner'ın kitabı, 2009. — Yaklaşık. ed.

[43]Herkes yalan söylediğine göre, söylediklerimin ne kadarının doğru olduğunu merak etmelisiniz. Belki de o kadar işkolik değilimdir. Belki de bu kitap için çok çalışmadım. Belki de birçok insan gibi ne kadar çalıştığımdan bahsederken abartıyorum . Belki de 13 aylık "sıkı çalışma" arasında hiç çalışmadığım zamanlar da oldu . Belki bir münzevi gibi yaşamadım. Belki Facebook profilime bakarsanız , bu sözde inziva döneminde arkadaşlarımla tam iletişim halinde olduğum ortaya çıkar . Ya da belki, eğer bir münzeviysem, bu hiçbir şekilde gönüllü değildi. Belki de birçok geceyi yalnız geçirdim , çalışamadım ve boşuna birinin benimle iletişime geçmek isteyeceğini umdum. Galiba bana kimse yazmadı. Herkes yalan söyler. Her anlatıcı güvenilmezdir. — Yaklaşık. ed.

Not: Bazen Büyük Dosyaları tarayıcı açmayabilir...İndirerek okumaya Çalışınız.

Benzer Yazılar

Yorumlar