비숍책 ‘패턴 인식과 머신 러닝’

- 컴퓨터 비전과 머신 러닝 분야의 고적인자 필독서

‘뉴럴 네트워크(neural network)’라는 용어는 생물학 시스템상에서의 정보 처리 과정을 수학적으로 표현하고자 하는 노력으로부터 기인하였으며(McCulloch and Pitts, 1943; Widrow and Hoff, 1960; Rosenblatt, 1962; Rumelhart et al., 1986), 또한, 다양한 모델들을 표현하는 용어로서 매우 포괄적으로서 사용되어 왔다. 이 모델들 중 일부는 그 생물학적 타당성이 과장되었다는 의심을 받기도 했다. 하지만 패턴 인식의 응용 측면에서 보자면 생물학적으로 실제 현실에 가까운지 아닌지는 불필요한 추가적 제약 조건일 뿐이다. 따라서 이 장에서는 효과적인 통계적 패턴 인식 모델로써의 뉴럴 네트워크에 대한 논의에 초점을 맞출 것이다. 특히, 뉴럴 네트워크들 중에서 실제적인 가치를 가장 많이 주는 것으로 증명된 다층 퍼셉트론 모델에 대해 집중적으로 살펴볼 것이다. – 책 <패턴 인식과 머신 러닝> 중에서

머신 러닝은 컴퓨터 과학의 일부로서 발전해 온 반면, 패턴 인식은 공학에 그 기원을 두고 있다. 이 둘은 한 분야의 두 가지 다른 측면이라고 볼 수 있다. 머신 러닝과 패턴 인식은 지난 십여 년간 상당한 발전을 이루어 냈다.

예를 들면 베이시안 방법론은 전문가들만이 사용하던 특별한 도구였으나 이제는 주류의 방법론이 되었으며, 그래프 모델들은 확률적 모델을 묘사하고 적용하는 일반적 방법론으로 부상하였다. 이 책에서는 패턴 인식과 머신 러닝 분야에 대한 기본적인 내용을 포괄적으로 소개하고 위에서 언급된 최근의 발전 양상에 대해서도 다룬다.

책의 내용을 공부하는 데 있어서 패턴 인식이나 머신 러닝 개념에 대한 사전 지식은 필요하지 않지만, 다변량 미적분과 기본적인 선형 대수학에 대한 사전 이해는 필요하다. 이 책의 내용은 고급 학부과정, 1년 차 박사과정 학생, 연구원, 관련 업계 종사자들을 고려하여 집필됐다.

지난 수년간 머신 러닝은 그 어느 때보다도 뜨거운 관심을 받았다. 특히, 2016년 알파고와 이세돌 9단의 대국은 더 많은 사람이 인공지능 분야에 관심을 가지게 하는 촉매제가 되었다. 이는 딥 러닝을 비롯한 여러 머신 러닝 알고리즘의 성능이 최근 매우 향상되었기 때문이다. 

머신 러닝은 최근에 새롭게 생겨난 기술이 아니다. 데이터를 기반으로 해서 최적화 문제를 풀거나 예측해야 하는 다양한 분야에서 이미 오랜 시간 동안 머신 러닝 기술이 활용되었다. 

최근에 가장 주목을 받고 있는 딥 러닝은 수십 년 전에 처음 제안된 뉴럴 네트워크 알고리즘이 기반이다. 오랜 시간 동안 학계로부터 외면받고 있었던 뉴럴 네트워크 기술이 GPU 등 하드웨어의 발전과 구글/페이스북 등의 회사에서 발생하는 엄청난 양의 데이터, 여러 알고리즘 개선법 등을 만나면서 새로운 모습을 보이게 된 것이다. 

이 책은 지난 수십 년간 발전되어 온 확률/통계 기반의 패턴 인식과 머신 러닝 분야의 전반적인 내용을 다루고 있다. 내용을 이해하는 데 있어서 패턴 인식이나 머신 러닝 분야에 대한 사전 지식은 필요하지 않지만, 다변량 미적분과 기초 선형 대수학을 다뤄본 경험은 필요하다. 

또한 기초적인 확률 이론에 대한 소개가 포함되어 있으므로 확률론에 대한 기초 지식이 반드시 필요하지는 않다. 기본적으로 학부 고학년생들이나 박사과정 1년 차 학생들을 대상으로 하고 있으나, 해당 분야의 연구자들이나 업계에서 머신 러닝을 활용하는 사람들이 읽기에도 적합하다. 

특히 머신 러닝, 통계, 컴퓨터 공학, 신호 처리, 컴퓨터 비전, 데이터 마이닝, 바이오 인포매틱스와 같은 분야의 강의 과정에서 사용하기도 적합하다.

<패턴 인식과 머신 러닝>= 크리스토퍼 비숍 지음 | 김형진 번역 | 제이펍 | 852쪽 | 46,000원


IT뉴스 / 임정호 기자  art@