데이터 분석은 자연과학, 생명공학, 사회과학 분야에서 풍부하게 사용되고 있다. 대부분의 산업 영역에서 데이터 분석은 '데이터 과학(Data Science)'이라고 불리며 그 영향을 넓혀가고 있다. 데이터 분석과 데이터 과학은 데이터로부터 정보를 추출해내는 작업으로 통계학, 머신 러닝, 신호 처리, 자연어 분석, 컴퓨터공학 등의 기술에 사용된다.
데이터 분석에 사용되는 파이썬 소프트웨어를 나타내는 마인드 맵을 1장에서 먼저 살펴본다. 첫 번째로 다룰 부분은 넓고 다양한 파이썬 생태계다. 여기에는 NumPy, SciPy, matplotlib와 같은 잘 알려진 패키지도 있다. 1989년부터 파이썬이 개발됐기 때문에 아마 많은 사람들이 알고 있을 것이다. 파이썬은 배우기 쉽고 사용하기도 쉬우며, 다른 언어에 비해 복잡하지 않고 간결하다. 파이썬에 대해 모르더라도 다른 언어를 배워봤다면, 며칠 안에 기본적인 부분은 익힐 수 있을 것이다. 이 책을 제대로 이해하려면, 기초보다 좀 더 나아간 수준의 지식이 필요하다. 파이썬에 관련된 도서, 강의, 온라인 교습들이 많으니 그것들을 활용하자.