사진 1장으로 딥페이크 기술 구현

단 1장의 인물 사진과 음성 데이터로 표정이 살아 있고 말하는 것처럼 구현하는 동영상을 만들 수 있는  딥페이크(Deepfake) 기술을 영국 소재 삼성전자 AI연구소와 임페리얼 칼리지 런던 대학의 AI 연구자들이 개발했다. ​

기존의 딥페이크 기술은 사진 여러장과 음성 데이터를 이용해 AI의 딥러닝 알고리즘을 이용해 학습해 동영상을 만들어냈다. 이번에 공개한 기술은 단 1장의 이미지만 사용했다는 특징이 있다.

연구 결과는 지난 14일(현지시간) 공개형 논문 초고 저장소인 '아카이브(arXiv.org)'에 'GANs를 이용한 실제 말하는 얼굴 움직임(Realistic Speech-Driven Facial Animation with GANs)'라는 논문 제목으로 게재돼 공개됐다.

▲ 아인슈타인의 사진 한 장과 음성 데이터를 이용해 딥페이크 기술을 적용해 만든 동영상 

​삼성 러시아 AI연구소는 지난 5월에도 이 기술로 마릴린 먼로와 레오나르도 다빈치의 그림 '모나리자'가 살아있는 듯 움직이게 했다. 그런데 이번에는 보다 정교한 움직임을 보이고 있어 그 완성도가 한층 높아졌다.

이번에 공개한 동영상은 알베르트 아인슈타인의 강의 영상과 러시아의 요승 '라스푸틴'이 비욘세의 'Halo'를 노래하는 영상 등을 공개했다.

▲ 러시아 혁명의 도화선이 됐던 수도사 라스푸틴의 사진을 이용해 만든 동영상

한편, 딥페이크 기술은 날로 발전하고 있다. 앞으로 누구나 쉽게 만들 수 있는 소프트웨어도 등장할 것이다. 따라서 이 기술을 악용한 유명 여배우 포르노 등 사회적 문제에 대한 논의가 필요한 시점이다.

김한비 기자 itnews@