[뉴스프리존=심종대 기자]전 세계를 강타한 알파고 쇼크와 제4차 산업혁명의 이슈로 인해 인공지능과 머신러닝(기계학습)에 대한 관심의 규모는 날로 폭발하고 있다. 구글, 마이크로소프트, 페이스북, 아마존 등 거대 기업들은 앞 다투어 머신러닝에 많은 돈을 투자하고 있고, 최고의 머신러닝 전문가들을 중심으로 인하우스팀을 꾸리고 연구 개발에 전폭적인 지원을 아끼지 않는 등 분야 선점에 사활을 걸고 있다.
국내에서도 이런 정세에 맞춰 머신러닝은 무엇이며 왜 모든 글로벌 기업들이 그토록 ‘머신러닝’에 기대를 하고 있는지, 떠오르는 이 기술을 향후 어떻게 그리고 어떤 분야에 도입하고 활용해나가야 하는지에 대한 논의가 활발해지고 있다.
최고의 머신러닝 입문서로 평가받는 <마스터 알고리즘>은 데이터 과학 분야의 최고 영예인 SIGKDD 혁신상을 2년 연속 수상한 세계 최고의 머신러닝 분야 전문가 페드로 도밍고스가 쓴 책으로, 인공지능과 머신러닝의 탄생부터 어떻게 기계들이 스스로 학습할 수 있게 됐는지를 밝히고 나아가 이 기술이 우리의 미래를 얼마나 경이롭게 바꿔놓을지 생생하게 보여주고 있다.
머신러닝은 인공지능의 한 분야로 기계에 일일이 명령을 내리거나 프로그래밍하지 않아도, 기계 스스로 학습할 수 있는 능력을 부여토록 연구하는 분야로, 불과 얼마 전까지만 해도 ‘기계가 스스로 학습한다’는 설정은 SF 영화 속에서나 가능한 일이라면서 먼 미래에 접하게 될 기술이라 여겨왔으나, 이미 머신러닝은 우리 삶에 깊숙이 자리하고 있다.
우리가 한 기업에 입사 지원서를 제출하면, 그 이력서를 맨 처음 보는 것은 사람이 아니라 기계다. 머신러닝을 통해 괜찮은 이력서가 선별되는 것이다. 우리가 이사 갈 집을 구하고 있을 때, 함께 여가를 즐길만한 사람을 찾을 때, 맘에 드는 영화와 책을 고를 때도 머신러닝은 우리가 저울질했던 모든 정보를 학습해 맘에 들어 할 만한 후보를 추천해준다.
나아가 우리의 신용카드 내역을 추적해 관찰하고 이메일과 메시지를 샅샅이 어 우리가 혹할 만한 광고를 보여준다. 이처럼 우리는 삶의 모든 단계에서 이미 머신러닝의 관여를 경험할 뿐만 아니라, 머신러닝은 국가의 향방, 인간의 생존, 전쟁의 판도를 바꿀 만한 영향력도 가지고 있다.
머신러닝을 통해 유권자 성향을 상세하게 파악한 오바마가 롭니를 이기고 대통령이 된 것은 너무도 유명한 일이다. 지금 고속도로에서는 불의의 사고로 누군가 목숨을 잃는 일이 없도록 머신러닝 기술을 장착한 구글의 무인자동차가 주행 실험 중이며, 미국 국방부는 머신러닝 기능을 탑재한 로봇으로 조직된 군대까지 계획하고 있다.
구글, 페이스북, 아마존, 마이크로소프트, 바이두 등 세계 경제계를 주도하는 이러한 기업들이 인공지능과 머신러닝에 대규모 투자를 하면서 미래를 준비하는 것은 앞으로 머신러닝이 산업과 사회, 인간의 모든 삶을 송두리째 바꿔놓을 것이라는 확신을 가졌기 때문이다.
<마스터 알고리즘>의 저자 페드로 도밍고스는 머신러닝과 인공지능 그리고 철학계의 오랜 과제였던 ‘어떻게 논리와 확률을 종합할 것인가’에 관한 문제를 풀어낸 선구적 과학자로, 뛰어난 명성을 지니고 있다. 120개가 넘는 세계 유수의 대학과 연구소, 컨퍼런스에 초대될 만큼 30년간의 그의 연구는 창조성과 기술적 깊이 면에서 인정받고 있는데, 그것이 이 책에서도 빛을 발한다. 특히 과학과 기술, 사업, 정치, 전쟁 등 세상을 격변시킬 기술로 주목받는 머신러닝에 대해 그는 수학, 컴퓨터공학, 신경과학, 비즈니스 등을 아우르면서 독자들이 쉽게 이해할 수 있도록 상세히 전달하고 있다.
저자는 여기에서 한 발 더 나아간다. 그는 단순히 머신러닝이 무엇인지 그 정체를 밝히는 데에 그치지 않고 인류를 다음 단계의 진화로 이끌어낼 만큼 파급력 있는 ‘새로운 머신러닝’의 탄생을 제시한다. 스팸메일의 분류, 아마존과 넷플릭스의 추천 콘텐츠, 투표자와 고객의 성향 분석 등 이미 사용되고 있는 다양한 머신러닝 기술에는 사실 그 쓰임과 분야에 따라 각기 다른 알고리즘이 사용되고 있다. 같은 추천시스템을 구축했지만 아마존과 넷플레스의 머신러닝 알고리즘이 다른 것처럼 말이다.
이에 반해 도밍고스는 모든 분야와 지식을 아우르는, 범용적으로 사용할 수 있는 단 하나의 ‘마스터 알고리즘’을 만들어 낼 수 있다는 대담한 주장을 한다. 그리고 마침내 ‘마스타 알고리즘’이 탄생됐을 때 ‘데이터’에서 세상의 모든 지식을 이끌어내는 유례없는 과학적 진보가 일어날 것이라 예견한다. 이렇듯 도밍고는 ‘마스터 알고리즘’을 탄생시키는 과정에 독자들을 초대함으로써 새로운 머신러닝의 세계를 안내한다.
‘여전히 우리는 결국 인간을 위항 작업은 없어질 것 아니냐고 의문을 제기할 수 있다. 내 생각은 아니다. 컴퓨터와 로봇이 모든 일을 인간보다 잘하는 날이 온다 하더라도 (가까운 장래는 아니다) 적어도 우리 중 일부는 일자리를 보전할 것이다. 가벼운 대화까지 하며 완벽하게 인간을 흉내 내는 로봇 바텐더가 생길 테지만 고객들은 사람인 바텐더를 거 선호할 것이다. 내가 의미하는 것은 인간이 되는 경험을 하지 않고서는 이해할 수 없는 모든 것에 해당하는 인간성이다. 우리는 인간성이 점차 사라진다고 걱정하지만 다른 직업들이 자동화되면 잿더미에서 다시 일어날 것이다. 더 많은 일이 기계로 저렴하게 수행될수록 인가미 넘치는 사람이 기여하는 부분은 더 가치 있을 것이다.’-제10장 ‘이것이 머신러닝이 펼치는 세상이다’ 중에서
이 책은 머신러닝에 대해 크게 열 개의 장으로 나눠 소개한다. 제1장 머신러닝의 혁명이 시작됐다에서는 우리가 미처 인식하지 못하지만 생활 곳곳에 쓰이는 머신러닝의 현재를 조명한다. 선거와 전쟁의 판도를 바꾸고 전에 없던 속도로 과학을 진보시키는 일, 나아가 사람의 목숨을 구하기도 하는, 이제는 떼려야 뗄 수 없는 머신러닝의 중요성을 이야기 한다.
제2장 마스터 알고리즘은 어떻게 탄생하는가에서는 머신러닝의 설계, 그 바탕에 있는 머신러닝 알고리즘을 다섯 가지로 나눠 살펴보고, 그리고 다양한 머신러닝 알고리즘을 통합한, 단 하나의 ‘마스터 알고리즘’이 왜 필요한가를 설명하고 있다.
제3장부터 제7장까지는 다섯 가지로 나눴던 머신러닝을 하나하나 상세하게 들여다본다. 머신러닝에는 여러 가지 접근 방법이 있다. 이 책에는 기호주의자, 연결주의자, 진화주의자, 베이즈주의자, 유추주의자. 이렇게 다섯 가지 종족으로 나눠 설명하고 있다.
기호주의자는 철학과 심리학에서 아이디어를 얻어 머신러닝을 ‘연혁법의 역’으로 실현하려 하고, 연결주의자는 두뇌를 분석하고 모방, 신경과학과 물리학에서 영감을 얻어 신경회로망이라는 접근방법을 갖는다. 연결주의자의 방법은 최근 이슈가 되고 있는 딥 러닝의 근간이 되는 기술이다.
진화주의자는 유전학과 진화생물학에서 아이디어를 얻어 컴퓨터에서 진화를 모의시험하는 유전자 프로그래밍이라는 방법을 취하고, 베이즈주의자는 ‘학습’이 확률적 추론의 한 형태라고 믿고 통계학에 그 뿌리를 두고 있고, 유추주의자는 유사성 판단을 근거로 심리학과 수학적 최적화의 영향을 받는다.
머신러닝의 다섯 종족을 다 살펴보고 나면 제8장 선생님 없이 배우기와 제9장 마스터 알고리즘을 위한 마지막 퍼즐 조각에서 스스로 학습하는 기계를 어떻게 실현할 수 있는지 앞서 살펴봤던 다섯 가지 머신러닝 알고리즘을 바탕으로 그 아이디어를 찾아본다.
끝으로 제10장 이것이 머신러닝이 펼치는 세상이다에서는 모든 것을 아우르는 ‘마스터 알고리즘’이 탄생하면 어떤 미래가 도래하는지 이야기 한다. 디지털 자아가 생기면 어떤 일이 벌어지는지, 마스터 알고리즘의 발견으로 전에 없던 과학적 진보가 이뤄지면 영화 <터미네이터>에 등장하는 악당 스카이넷이 탄생하는 것은 아닌지 머신러닝을 둘러싼 흥미진진한 미래 이야기가 전개된다.
세바스찬 스런과 주데아 펄, 피터 노빅 등 컴퓨터공학 전문가들이 최고의 머신러닝 입문서라 극찬을 아끼지 않는 <마스터 알고리즘>은 오늘날과 같은 디지털 시대에 비즈니스를 하는 사람들에게 데이터 활용과 리스크 관리, 업무 자동화 등 다양한 측면에서 활용 가능한 아이디어를, 과학자나 기술자에게는 미래에 강력한 무기가 될 ‘머신러닝’이라는 새로운 과학관 세계를, 머신러닝 전문가에게는 신선한 아이디어와 역사적으로 유용한 정보를, 빅 데이터와 머신러닝으로 인한 미래 사회의 변화를 궁금해하는 사람에게는 이 기술의 정체가 무엇이고 우리를 어디로 데려가는지에 대한 가장 분명한 청사진을 제시해 줄 것으로 기대된다.
심종대 기자, simjd11@naver.com