SK텔레콤·서울대, 컴퓨터비전 국제학회 AI 경연 준우승

- ‘VizWiz Grand Challenge 2018’서 시각장애인이 촬영한 사물 인식 질의응답 기술

SK텔레콤이 AI 기술인 컴퓨터 비전 관련 국제학회가 주최한 경연에서 준우승을 수상했다. 

SK텔레콤 AI센터 T-Brain은 14일(현지시간) 독일 뮌헨에서 열린 컴퓨터 비전 국제학회인 ECCV(European Conference on Computer Vision)가 개최한 ‘VizWiz Grand Challenge 2018’에서 준우승을 수상했다. 

‘VizWiz Grand Challenge 2018’은 미국 텍사스 대학교 오스틴(University of Texas at Austin)이 구축한 데이터셋을 활용해, 시작장애인들이 직접 촬영한 이미지에 대하여 다양한 질문에 적절한 응답을 평가하는 대회다. 

▲컴퓨터 비전 국제학회인 ECCV가 개최한 VizWiz Grand Challenge 2018에서 설명하는 모습(SK텔레콤)

이번 대회의 가장 큰 특징은 통상 정제된 이미지와 질문에 답하는 기존 Visual Question Answering(VQA) 방식이 아닌, 1만 명 이상의 시각장애인들이 직접 스마트폰으로 촬영한 사진과 이에 대한 질문에 대해 답하는 것이다. 

시각장애인들이 직접 촬영한 이미지는 그들의 신체적 제약으로 인해 사진이 빛 번짐은 물론 비뚤어지거나 때로는 질문과 관련 없는 이미지 등이 다수 섞여있어 정제된 이미지를 인식하는 것보다 더 높은 수준의 인식능력이 필요하다. 

이 대회에는 SK텔레콤 T-Brain외에 서울대학교 장병탁 교수 연구팀이 공동으로 참가했으며, 주최 측이 미리 공개한 8천 개의 이미지에 대해 지난 6월 20일부터 8월 17일까지 Bilinear Attention Networks(BAN) 알고리즘을 사용해 주최 측에 제출한 바 있다. 

이번 ‘VizWiz Grand Challenge 2018’에서 T-Brain 최용석, 홍성은 박사와 함께 연구팀을 이끈 김진화 박사는 “이번 대회는 통상 주최측이 제시하는 정형화된 이미지 데이터를 인식하는 방식이 아닌, 실제 시각장애인들이 궁금해하는 사진 등 현실 데이터에 대한 인식률을 높였다는 데 큰 의미가 있다”고 말했다. 

이번 VizWiz 대회에서 준우승한 알고리즘 관련 연구 논문은 오늘 12월 캐나다 몬트리올에서 열리는 인공지능(기계학습) 분야 세계 최고 권위 국제학술대회인 신경정보처리시스템 국제학회(NIPS)에서 발표될 예정이다.

IT뉴스 / 민두기 기자  ebiz@