‘외계항성’ 찾는 구글 머신러닝

- 지구에서 외계행성까지: 머신러닝으로 행성을 찾아 나선다

▲ 공전하는 행성이 빛의 일부를 차단할 때 측정된 항성의 밝기는 약간 감소한다. 케플러 우주 망원경은 4년 동안 20만 개의 별의 밝기를 관찰하여 행성 통과로 인한 이러한 특직정인 신호를 찾아냈다.(자료: Google)

지난달 31일 구글코리아(Google Korea)에서 구글AI포럼이 열렸다. 구글AI포럼은 현재까지 총9회에 걸쳐 진행되고 있으며 이번주제는 <제9강:AI의 혁신과 천체의 발견>으로 진행되었다. 강의에는 구글코리아 엔지니어링 총괄 디렉터인 홍준성 디렉터와 시니어 리서치 소프트웨어 엔지니어인 크리스 샬루(Chris Shallue)가 참여하였다. 

홍준성 디렉터는 현재 AI에 적용되고 있는 머신러닝의 기초이론에 대해 설명하였다. 머신러닝이라는 프로그램 작동과정과 활용방안을 설명하며 기계가 스스로 학습하게 하여 AI기계를 더욱 스마트하게 발전시키겠다는 포부를 밝혔다. 또한, 크리스 샬루는 머신러닝이 천문학 영역까지 확장되고 있다고 밝혔다. 그는 최근 미국항공우주국(NASA)의 케플러 우주 망원경이 수집한 데이터 속 행성을 식별하는 머신러닝 모델 개발에 집중하고 있으며, 머신러닝을 이용해 케플러 80g와 케플러 90i라는 새로운 행성을 발견하였다.

21세기는 인터넷의 광범위와 모바일 디바이스의 보급으로 인한 ‘빅 데이터(Big Data)’가 생겨나기 시작했다. 필자는 하드웨어 기술의 발달과 분산 및 병렬처리 기술의 발달로 인한 데이터 처리 능력이 향상됨에 따라 머신러닝이 미래산업에 중심이 될 것 이라 예상하는 바이다.

▲ 홍준성 구글코리아 엔지니어링 총괄 디렉터 


■ 머신러닝(Machine Learning)이란?

머신러닝을 단어로만 해석을 해본다면 기계학습이다. 이는 기계에 입력된 수많은 정보를 이용하여 예상치 못한 상황에 대응할 수 있도록 하는 일종의 인공지능의 한 분야를 말한다. 기존의 인공지능이 미리 입력된 조건으로 상황을 판단하고 결과를 출력한다면, 머신러닝은 바로바로 입력된 정보를 분석해 내용을 파악하고 미래를 예측해나가는 방식을 의미한다.

컴퓨터 과학자인 아서 사무엘(Arthur Samuel)은 머신러닝의 개념을 “우리가 명시적으로 프로그래밍 할 때 사용하는 if-then-else, for-loop등을 사용하지 않고도 컴퓨터가 스스로 어떤 지식을 축적하고 행동할 수 있는 능력을 부여하기 위한 연구분야다.”라고 말하였다. 

머신러닝이 이루어지기 위해서는 한 단계 아래에 있는 딥러닝(Deep Learning)을 이용해야한다. 딥러닝은 컴퓨터의 지능을 한 차원 올려놓는 역할을 하며, 대량의 데이터와 컴퓨팅 기술을 활용해 신경망(Neural Network)을 구현한다. 이 신경망은 기본적으로 우리의 두뇌를 모방한 것으로 우리가 여러 물체를 구분하는 것처럼 컴퓨터가 데이터를 나누는 것이다.

홍준성 디렉터는 현재 구글포토, 구글번역, 워드렌즈(Word lens) 기능 등에 머신러닝을 이용하고 있다고 밝혔다. 덧붙여 핸드폰 카메라는 듀얼카메라를 이용해 인물사진을 촬영할 때 생동감을 주고 있지만 머신러닝을 이용한다면 하나의 카메라만으로도 똑같은 기능을 발휘할 수 있다고 말하였다.  

▲ 크리스 살루(Chris Shallue) 시니어 리서치 소프트웨어 엔지니어

■ 머신러닝, 우주로의 발전

2009년 태양 주위를 돌고 있는 외계항성들을 찾기 위해 NASA에서는 케플러미션이라는 명목으로 케플러 우주망원경을 쏘아 올렸다. 케플러 우주망원경은 약 20만 개의 항성을 찾아내고 관찰하면서 약 140 억 개의 데이터 포인트를 만들어냈다. 즉, 약 2000 조 개의 행성 궤도가 존재한다는 것이다. 크리스 살루는 다량의 데이터를 검토하기에는 많은 시간이 걸리기 때문에 구글은 머신러닝을 천체발견에 이용했다고 밝혔다.

케플러 우주망원경은 오랜 기간 동안 별의 밝기를 관찰했다. 공전으로 인한 별의 별기에 변화가 있다는 것이다. 이를 통해 얻은 데이터에는 움푹 들어간 빛의 곡선이 생성되었다. 행성이 아닌 별 공전할 때, 밝기가 줄어드는 순간 부드러운 곡선이 아닌 뾰족한 곡선으로 데이터가 생성됨이 밝혀졌다. 

2단계의 케플러 우주망원경을 기반으로 하여 먼저 컴퓨터 알고리즘을 사용하여 천문학자들이 신호 하나하나를 식별하여 분류했다. 분류된 15,000개 이상의 케플러 신호로 이뤄진 데이터세트를 이용하여 행성과 행성이 아닌 것을 판별하는 텐서플로(Tensorflow) 모델을 개발했다. 이는 빛의 곡선으로 이뤄진 데이터 세트를 입력하고 행성인지 아닌지를 구별하도록 학습시켰다. 항성 주위의 행성을 구분하는 방법을 학습시킨 이 모델은 별 표면의 흑점, 케플러 우주 망원경의 태양열 패널, 쌍성과 같은 다른 물체로 생성된 패턴과 실제 행성으로 인해 생성된 패턴을 구별했다. 

구글은 텐서플로 모델을 이용해 새로운 행성을 찾을 거라는 목표를 세웠다. 광범위한 정보를 줄이기 위해 검색범위를 좁혀 지금까지 2개 이상의 외계행성을 보유하고 있는 항성 670개를 살펴보기로 했다. 결과적으로 96%라는 정확도를 가진 텐서플로 모델을 이용해 케플러 90i와 케플러 80g를 발견해냈다. 

발견된 케플러 90i는 항성 케플러 90을 공전하는 8번째 행성으로, 지구보다 30% 더 크기가 크고 공전주기는 14일로 표면 온도는 약 426℃로 생명체가 살기에는 적합하지 않았다. 태양과 지구 사이에 존재하는 케플러 90은 우리 태양계 외부에 존재하는 태양계 중 최초로 8개의 행성을 보유한 항성이 되었다.

미래의 도전과제로 뽑힌 아직 해결되지 않은 문제는 관측하는 별을 측정하는데 뒤의 별의 밝기와 그를 공전하는 행성이 같이 측정된다는 문제이다. 모항성의 밝기를 낮추는 간섭이 발생되어 뒤 항성의 공전을 모항성을 공전하는 것처럼 보이게 된다는 것이다. 이를 해결하기 위해 위치정보를 적용하고 검색범위를 항성 670개에서 20만개로 확대할 예정이다. 이 과정에서 적당한 온도를 가진 행성이 발견된다면 생명체의 존재 여부도 확인할 계획이라고 밝혔다.

■ AI는 구글의 최종도착지

홍준성 디렉터는 1998년 세르게이 브린(Sergey Brin)과 함께 구글을 창업한 공동창업자인 래리 페이지(Larry Page)가 “AI는 구글의 최종도착지가 될 것이다.” 라고 언급했다고 밝혔다. 그만큼 AI는 인류에게 큰 변화를 줄 것으로 예상된다. 지금도 AI는 인류의 생활 속에 점점 자리 잡아가고 있다. 

지난 2017년 이세돌 9단에게 패배를 안겨준 알파고가 AI의 대표적인 예이다. 머신러닝을 기초로 개발된 AI인 알파고는 이세돌 9단의 바둑 패턴과 전략을 스스로 배운 알고리즘을 통해 분석한다. 이를 통해 세계 최고의 바둑기사인 이세돌 9단의 수에 모두 맞설 수 있는 것이다.

또한 2017년 10월 국립파리은행인 BNP의 BNP파리바그룹은 거래 매칭 지연완화를 위해 AI를 적용하고 있다고 하였다. 파리바 보안 기관은 인공지능을 사용해 브로커 및 고객에게 수동개입이 필요할 수도 있는 실시간 거래를 경고하는 거래 매칭 도구인 스마트 체이서를 시행한다.

BNP 파리바 보안기관의 중앙사무소 제품부문 글로벌 책임자인 토마스 듀리프(Tomas Durif)는 “예측 분석을 이용한 스마트 체이서는 과거 데이터를 분석하여 과거 수동개입이 필요한 거래 패턴을 파악하고, 고객 및 브로커에게 실시간 거래활동에 대해 미리 경고하여 즉시 조치를 취할 수 있다.”고 밝혔다.

스마트 체이서를 이용했을 시 은행은 지연된 거래 일치 가능성을 예측할 수 있고, 지연 기고자를 확인하며 중앙 사무소 운영 팀이 관련 고객에게 보낼 미리 디자인된 이메일 템플릿을 제시할 수 있게 된다.

하지만 AI의 확산이 좋다고만은 할 수 없다. AI를 통해 인류의 편의가 보장되고, 기술이 발전해 나갈 수는 있지만 AI의 확산으로 인한 무인(無人)시대가 초래될 것으로 예상된다. AI기술의 확장에 따라 인공지능 로봇을 비롯한 AI 계산시스템, AI 주유 및 판매 시스템이 점진적으로 도입된다면 인간이 설 수 있는 자리가 과연 몇 개나 남아있을 지에 대해 생각해 봐야할 것이다. 


[서정욱, 유건원 기자  itnews@itnews.or.kr]