![]() |
| KAIST 유창동 교수와 루 민 퉁(Luu Minh Tung) 박사과정(제1저자) 그리고 김환희 석사과정(제2저자)이 피지컬 AI 핵심 원천기술 VOTP를 개발했다. (사진=KAIST 제공) |
KAIST는 전기및전자공학부 유창동 교수 연구팀이 수천~수만 건의 인간 평가 데이터 대신 소수의 선호 영상만으로 AI가 인간의 의도와 판단 기준을 학습할 수 있는 'VOTP(Video-based Optimal TransPort Preference)' 기술을 개발했다고 10일 밝혔다.
이번 연구의 핵심 아이디어는 로봇이나 자율주행차와 같은 지능형 기계가 인간 선호(preference)를 담은 비디오만으로도 사람의 의도(intent)를 빠르게 파악할 수 있는 AI 프레임워크를 세계 최초로 제안했다는 점이다. 기존의 방식은 로봇을 학습시키기 위해 사람이 최소 수천 번 이상 로봇의 움직임을 지켜보고 일일이 평가해야만 했다. 이번 기술은 최신 비디오 AI의 시각적 이해 능력과 최적 전송이라는 수학적 기법을 결합해 AI가 막대한 양의 로봇의 행동을 스스로 평가하고 학습한다.
해당 기술은 로봇 팔 제어, 휴머노이드 로봇, 자율주행차, 스마트팩토리, 드론, 수술 로봇뿐 아니라 컴퓨터를 직접 조작하는 AI 에이전트까지 폭넓게 적용 가능하다. 특히 인간의 의도와 만족도를 학습해야 하는 모든 피지컬 AI 시스템의 핵심 기반 기술로 활용될 수 있을 것으로 전망된다.
유창동 교수는 "피지컬 AI 시대로 넘어가기 위한 난제였던 데이터 수집의 한계를 극복한 핵심 원천 기술을 확보했다"며 "현장 영상을 보고 스스로 분석해 바람직한 행동과 그렇지 않은 행동을 구분하고 최적의 동작을 학습한 로봇은 바로 실무에 투입될 수 있을 것"이라고 말했다.
임병안 기자
중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지






