어떤 데이터 포인트도 그 자체로 온전한 섬이 아니다.
모든 데이터 포인트는 대륙의 한 조각, 패턴의 한 부분일 뿐이다.
위대한 시인 존 돈(John Donne)이 그의 아름다운 시 "아무도 혼자인 사람은 없다(No man is an island)"가 새겨진 자신의 무덤 속에서도 탄식하겠지만, 나는 컨텍스트와 웹 관계를 갖고 있는 데이터의 특성을 이 시 구절처럼 더 잘 표현할 방법을 찾지 못하겠다. 지식으로 향하는 길은 이러한 관계를 발견하고 시각화되도록 만드는 데 있다.
사회의 변화와 기술의 진보로 세상은 더 불확실한 곳이 되었다. 또 다른 시인인 루이스 드 카몽이스(Luis de Camoes)는 "변화는 이전처럼 변하지 않는다"라고 말했다. 불확실성에 대처하기 위해 우리는 대량으로 데이터를 생산하고 검색서비스에 기술을 적용한다. 이것은 수년에 걸쳐 많은 이름으로 불려왔으며, 오늘날은 이것을 '빅데이터(Big Data)'라고 부른다.
데이터 수집과 저장이 목표라면, 데이터가 많을수록 더 좋다. 하지만 우리가 놓치고 있는 것은 무엇일까? 만약 더 많은 데이터를 정말 더 좋은 데이터로 바꾸는 올바른 기술이 함께 동반되지 않는다면 우리는 더 이상 많은 데이터가 필요하지 않다. 우리는 데이터를 필요로 하는 사람들이 데이터를 어떻게 사용할지, 어떤 목적을 갖고 있는지를 고려할 필요가 있다. 그렇지 않다면 쓸모 없는 데이터를 하드디스크의 잊혀진 폴더 안에 디지털 먼지가 되도록 계속해서 쌓아둘 필요가 없다. 잠깐만! 파이차트를 만드는 것 역시 그다지 좋은 생각이 아니다.