Inuit Blogged
다크 데이터 본문
1️⃣ 한줄 평
한우 한점 넣고, 집에 남는 온갖 채소로 들통 가득 채워 국을 끓이면 이런 느낌이겠지
♓ Inuit Points ★★☆☆☆
인공지능과 전산 자원이 발달할수록 데이터의 중요성은 커집니다. 이때 데이터로 표현되지 않는 부분에 중요한 의미나 신호가 있는 경우도 있습니다. 이러한 다크 데이터에 대해 꼼꼼히 살펴보는 책입니다. 지나치게 꼼꼼히 망라하는데 진력을 쏟아 어떤 지향점이 있진 않습니다. 저술이 그런지 번역과 편집에서 놓친 '다크 컨텍스트'가 많은지 충분히 재미날 내용인데도 시종 밋밋해서 아쉽습니다. 정말 필요한 사람만 읽기를 권합니다. 저는 추천하진 않는다는 별 둘입니다.
🧑❤️👩 To whom it matters
- 독서의 목적이 또렷해서 목적 위주로 읽을 수 있는 분
- 과학, 임상 실험을 하는 분 중 데이터 다루기에 대해 포괄적 지식을 얻고 싶은 분
- 통계 관련한 전공이라, 좀 더 유식해보이는 썰을 풀고자 하는 분
🎢 Stories Related
- 한줄 평의 한우 한점은, 다크데이터라는 개념입니다. 그거 하나라도 머리에 남겼다면 서로 쿨거래.
- 정보사기, 돈세탁도 다크 데이터의 일종으로 보고 설명을 합니다. 재미는 있지만 확장이 지나치다고 느껴지고, 누군가에겐 무용하게 포괄적으로 느껴질 수도 있습니다. (바로 접니다)
Dark Data: Why what you don't know matters
David Hand, 2020
🗨️ 좀 더 자세한 이야기
'보이지 않는 데이터가 세상을 지배한다'는 카피와 함께 데이터 이면의 함정을 다룬다니.
데이터 기반으로 판단하고 결정하고 모험해야하는 제가, 이 책의 시놉시스를 처음 봤을때 얼마나 환호했는지 짐작 가시려나요. 독서 대기열에 올려놓고, 이 책을 빨리 읽으려고 그 앞의 서너권을 분발해서 읽었을 정도였습니다.
결론적으로 책은 그 약속을 지키긴 했습니다만, 읽는 시간이 아까울 정도로 실망도 컸습니다.
여러가지로 이유를 생각해볼 수 있겠지만, 청자 중심이 아니라 화자 중심의 글이라 그런 것 같습니다.
결국 이런 책을 읽는 사람은, 예컨대 저라면 다크 데이터의 존재는 어렴풋이 알고 있어 그 식별과 함정에서 벗어나는 법 같은게 관심일겁니다. 꼭 제 경우와 들어맞지 않아도, 현역(practitioner) 입장에서 글을 썼다면 훨씬 가치가 높을겁니다.
하지만 책은 '다크 데이터'라는 자신의 조어를 프로모션하는 의도, 그리고 그걸로 하나의 장르를 셋업하려는 창조주의 마음이 지나치게 강합니다. 중언부언 다크데이터의 의미, 암흑물질(dark matter)과의 유비 및 자부심 넘치는 라임으로 길게길게 시작할 때부터 쫌 갸우뚱합니다.
이어서 다크데이터가 생기는 원천 쯤 가면 세계관을 창조하는데 흠뻑 공들입니다. 통계, 과학, 사회심리학적으로 의도와 실수의 유형을 사전식으로 정리합니다. 그러다보니 자연히 청자라는 페르소나는 증발해 버립니다. 청자 세그먼트의 외연을 확장하는게 아니라, 밋밋하게 뭉개버리죠. 이젠 지혜를 구하러 온 독자는 사전적 지식에 빠져 허우적 댑니다.
마지막 덩어리라도 좋았으면 비추천 등급까진 주진 않았을것 같습니다. 그래도 목차상 희망이 보이던 '다크데이터를 활용하는 법'마저 시원찮습니다. 데이터 입력 시 잘 해라, 프라이버시 유지하는 몇가지 통계(적으로 잘 알려진) 기법과 동형암호 뭐 이게 다 입니다.
책을 다 읽고 나면 다크 데이터란게 있고, 안보여도 중요하다는 점 말고는 책 읽기 전보다 더 현명해진지는 모르겠습니다.
그나마 건질건 공들여 갈래지은 다크데이터 패턴들입니다.
Dark Data Types
DD-Type 1: Data We Know Are Missing
DD-Type 2: Data We Don't Know Are Missing
DD-Type 3: Choosing Just Some Cases
DD-Type 4: Self-Selection
BB-Type &, Dara which might have been
DD-Type 7: Changes with Time
DD-Type 8: Definitions of Data
DD-Type 9: Summaries of Data
DD-TVe 10: Measurement Error and Uncertainty
DD-Type 11: Feedback and Gaming
DD-Type 12: Information Asymmetry
DD-Type 13: Intentionally Darkened Data
DD-Type 14: Fabricated and Synthetic Data
DD-Type 15: Extrapolating beyond Your Data
'Review' 카테고리의 다른 글
김범준의 과학상자 (0) | 2023.09.16 |
---|---|
인구 미래 공존 (0) | 2023.09.09 |
얼굴 없는 중개자들 (0) | 2023.08.26 |
스토리가 있는 통계학 (0) | 2023.08.19 |
대한민국 인구트렌드 (0) | 2023.08.15 |