지난 10년간 머신러닝 연구와 애플리케이션은 폭발적으로 증가했다. 특히 딥러닝은 컴퓨터 비전, 음성 처리, 게임 플레이와 같은 많은 응용 분야 영역에서 주요 발전을 가능하게 했다. 그러나 많은 머신러닝 방법은 설계 결정에 매우 민감하며, 이는 입문자가 상당한 어려워할 줄 수 있다. 신경망이 해야 할 일을 하면서 충분한 성과를 내기 위해 모든 구성 요소의 올바른 신경망 구조, 훈련 절차, 규제화 방법, 하이퍼파라미터를 선택해야 하는 딥러닝 분야가 특히 그렇다.
전문가들도 특정 데이터셋에 대한 적절한 선택 항목을 파악할 때까지 많은 시행착오를 겪게 된다. 자동머신러닝(AutoML) 분야는 사용자가 데이터를 제공하기만 하면 AutoML 시스템이 이 특정 애플리케이션에 가장 적합한 접근법을 자동으로 결정한다. 따라서 AutoML은 머신러닝을 적용하는 데는 관심이 있지만 기술에 대해 자세히 배울 만한 리소스가 없는 도메인 과학자들이 최첨단 머신러닝 접근법을 이용할 수 있도록 한다. 이는 머신러닝을 민주화한 것으로 볼 수 있으며 AutoML을 사용하면 사용자 정의된 최첨단 머신러닝에 누구나 쉽게 접근할 수 있다.
책에서 보듯이 AutoML 접근법은 이미 충분히 성숙돼 있어 인간 머신러닝 전문가에 필적할 수 있고 때로는 더 우수한 성능을 발휘할 수도 있다. 간단히 말해 머신러닝 전문가는 찾기도 어렵고 비용도 많이 들지만, AutoML은 상당한 시간과 비용을 절약하면서 성과 향상으로 이어질 수 있다. 그 결과 최근 몇 년간 AutoML에 대한 상업적인 관심이 급격히 높아졌으며 현재 몇몇 주요 테크 회사들이 자체 AutoML 시스템을 개발하고 있다. 그러나 머신러닝을 민주화하는 목적은 전용 유료 블랙박스 서비스보다 오픈 소스 AutoML 시스템을 통해 훨씬 더 잘 이룰 수 있다.
이 책은 빠르게 변화하는 AutoML 분야의 개요를 제공한다. 현재 커뮤니티가 딥러닝에 초점을 맞추고 있기 때문에 일부 연구자들은 AutoML을 신경망 구조 검색(NAS) 주제와 잘못 동일시하고 있다. 이 책을 읽고나면 NAS가 AutoML의 훌륭한 예지만, NAS보다 AutoML에 많은 것이 있다는 것을 알게 될 것이다.
이 책은 자신의 AutoML 접근법을 개발하려는 연구자들에게 몇 가지 배경과 출발점을 제공하고, 자신의 문제에 AutoML을 적용하고자 하는 실무자들에게는 사용할 수 있는 시스템을 강조하며, AutoML에서 이미 작업 중인 연구자들에게는 최신 기술의 개요를 제공하기 위한 것이다.