모두 거짓말을 한다
저자 : 세스 스티븐스 다비도위츠
빅 데이터, 빅 데이터 많이 들어 봤지만 뭔지 사실 알기 힘들었다.
이 책을 통해 구체적인 감을 얻게 되었다.
기존의 편견을 깨거나 알 수 없었던 내용을 알게 하는 연구 결과 소개가 흥미롭다.
문제는 이게 반복되면서 흥미가 반감해 글 읽는 속도가 떨어졌다.
p.49
우리에게는 자신의 경험이 가진 타당성을 과장하는 경향이 있기 때문이다. 데이터 과학자들이 쓰는 말로 하자면, 우리는 자신의 데이터에 비중을 둔다.
p.68
실수가 무의식적인 바람을 드러낸다는 프로이트 이론을 실제로 반증이 가능하다. 그리고 나의 데이터 분석에 따르면 그 이론은 틀렸다.
; 정신과 의사 입장에서 매우 흥미로운 내용이었다. penistrian은 성적인 욕구의 발현이 아닌 pedistrian의 오타일 뿐이다. 한글 연구도 있으면 재미있겠다.
p.89
(제프) 세이더는 말 내부 장기의 크기를 측정하기로 했다... 심장의 크기, 특히 좌심실의 크기가 말의 성공에 주요한 예측자이자, 가장 중요한 변수였다.
; 기존의 직관적인 자료 대신 자신만의 객관적 자료로 명마를 찾아냈다. 뒷부분 스몰 데이터를 언급할 때 나오는 패티 머레이도 같이 기억하자. 전통적인 방법도 여전히 병행할 필요가 있다. 그 대표적인 예로 ‘머니볼 + 스카우터'가 있다.
p.171
... 인터넷은 다른 정치적 견해를 가진 사람들을 화합하게 한다. 내가 브룩클린의 단골 커피숍에서 백인 민족주의자를 만날 가능성은 거의 없다. 하지만 나와 바이킹메이든 88은 둘 다 뉴욕타임스닷컴에 자주 들른다.
; 캐스 선스타인의 cascade theory와는 정반대되는 주장인데, 잘 모르겠다. 마주칠 가능성, 의견이 부딪힐 가능성이 바로 화합으로 연결되는 것 같지는 않다. 특히 우리나라 주요 커뮤니티를 보면 선스타인 교수의 말이 더 그럴 듯하다.
p. 194
발달심리학에서는 성인의 거대한 데이터베이스를 파헤쳐서 이를 어린 시절의 핵심 사건과 연관 짓는 분야가 떠오르고 있다.
; 예. 메츠를 좋아하는 뉴욕 남성 팬의 비율
박찬호 키즈, 박지성 키즈, 박세리 키즈, 김연아 키즈 이런 말이 자주 등장하는 우리 나라에서는어떨까?
p.230
도플갱어 검색, 야구선수의 성적을 예측하는 데 사용했던 그 어떤 방법론보다 훌륭한 이 모델은 보스턴이 오티즈를 더 지켜봐야 한다고 말했다.
; 각주에 써 있듯이 정말? 오티스 경기력 향상 약물 복용 여부를 고려하면 못 미더운 내용이다.
p.270
연구자들은 스타이 학생들이 다른 학생들보다 인생에서 더 많은 성과를 올리는 이유는 좋은 학생이 스타이버선트에 입학하기 때문이라는 결론을 내렸다. 스타이는 당신이 더 높은 AP 점수를 받고, 더 높은 SAT 점수를 받고, 더 좋은 대학에 입학하게 만들어주는 원인이 아니다.
; 서울대생과 연고대 생의 실력 차이는 얼마나 될까? 흔히 말하는 연고대와 서성한과의 차이는 얼마나 될까? 성적으로 줄 세우고, 20대 초반에 일생의 방향을 결정하는 우리 나라에 시사하는 바가 크다.
p.300
데이터 혁명의 위험은 우리 삶의 점점 많은 부분이 정량화되면서 이러한 대리 판단이 우리 생활에 더 깊숙이 파고 들어 권리를 침해할 수 있다는 데 있다.
; 정신과와 빅 데이터 공부를 시작해볼까 하는데 꼭 기억해야할 문구로 생각된다.
뱀발. 번역 관련
독자의 수준을 너무 높게 잡고 있는 것은 아닐까?
단어들에 대한 설명이 너무 없는 것 같다.
예. 도플 갱어의 뜻 설명 없음
(p.321)차세대 킨제이는 분명 데이터 과학자일 것이다. 차세대 푸코는 데이터 과학자일 것이다. 차세대 마르크스는 데이터 과학자일 것이다. 차세대 소크는 데이터 과학자일 것이다.
; 네 명을 다 아는 사람은 몇이나 될까? 주변 사람들에게 물어보면서 나만의 빅데이터를 모아 볼까나?