• 경제/과학
  • 보도자료

KAIST, GPU 절약하고도 시각성능 향상 AI 업샘플링 기술 개발

전기및전자공학부 김창익 교수 연구팀

임병안 기자

임병안 기자

  • 승인 2026-06-17 15:20

KAIST 연구팀이 대규모 AI 모델의 해상도 저하 문제를 해결하기 위해 추가 학습 없이도 초고해상도 시각 정보를 실시간 복원하는 '업샘플 애니띵' 기술을 개발했습니다.

이 기술은 이미지의 경계와 구조 정보를 활용해 손실된 세부 정보를 정밀하게 복원하면서도, GPU 메모리 효율을 최대 16배 향상시켜 연산 비용을 획기적으로 절감한 것이 특징입니다.

별도의 재학습 없이 다양한 환경에 즉시 적용이 가능하여 향후 반도체 제조, 자율주행, 의료 등 정밀한 시각 인식이 필요한 산업 전반에 큰 변화를 가져올 것으로 기대됩니다.

첨부 1. 연구개요도
AI의 시각 성능을 높일 수 있는 범용 기술 '업샘플 애니띵(Upsample Anything)' 연구 개요도.  (그래픽=KAIST 제공)
국내 연구진이 대규모 인공지능(AI) 모델의 고질적인 한계였던 '해상도 저하 및 정보 손실' 문제를 획기적으로 해결할 수 있는 업샘플링 기술을 개발했다. 메모리 사용량과 연산 비용을 대폭 줄이면서도 4K 수준의 초고해상도 시각 정보를 실시간으로 복원할 수 있어, 자율주행·제조·의료 등 정밀 AI가 필요한 산업 전반에 일대 변혁을 가져올 것으로 기대된다.

KAIST(총장 이광형)는 전기및전자공학부 김창익 교수 연구팀이 미국 MIT 및 마이크로소프트 연구진과의 공동 연구를 통해, 제한된 GPU 메모리만으로도 AI의 시각 성능을 높일 수 있는 범용 기술 '업샘플 애니띵(Upsample Anything)'을 개발했다고 17일 밝혔다.

시각 분야의 거대 비전 파운데이션 모델(VFM)은 인간 수준의 뛰어난 이미지 이해 성능을 보여주고 있다. 그러나 이들 모델은 방대한 연산량을 감당하기 위해 입력 이미지를 내부적으로 약 14~16배 낮은 해상도로 압축하여 처리한다. 이러한 압축 과정은 계산 효율을 높여주지만, 물체의 정밀한 경계선, 아주 작은 객체, 미세한 균열이나 얇은 구조물 등 '픽셀 단위'의 핵심 정보들이 대거 손실되는 한계가 있다.

김창익 교수 연구팀 이러한 한계를 극복하기 위해 입력 이미지의 경계와 구조 정보를 활용해 저해상도 특징 정보를 고해상도로 복원하는 학습 없는(Training-free·추가 데이터 학습이 필요 없는) 업샘플링 기술을 개발했다.



기존 기술은 새로운 환경이나 데이터에 적용하기 위해 별도의 재학습이나 복잡한 최적화 과정을 거쳐야 했다. 반면 연구팀이 개발한 '업샘플 애니띵'은 입력 이미지 한 장만으로 최적의 복원 방식을 찾아낼 수 있어 다양한 환경에 즉시 적용할 수 있다.

모든 시각 정보를 고해상도로 저장·처리하지 않고 핵심 정보만 압축해 활용함으로써 GPU 메모리 사용량을 크게 줄였다. 연구팀은 AI 연구에서 널리 활용되는 224×224 크기 이미지(약 5만 개 픽셀) 기준 약 0.4초의 짧은 계산만으로 원본에 가까운 시각 정보를 복원했으며, GPU메모리 효율을 최대 16배까지 향상시키는 성과를 거뒀다.

김창익 교수는 "고해상도 특징맵을 효율적으로 복원해 작은 결함, 미세한 경계, 정밀한 위치 차이처럼 세부 정보가 중요한 현장에서 강점을 보이는데, 향후 반도체 제조 공정, 품질 검사, 정밀 로봇 제어 등 고해상도 시각 인식이 필요한 산업 현장에 활용될 가능성이 기대된다"라며 "성능뿐 아니라 계산 효율성과 연구 투명성까지 인정받았다는 점에서 더욱 의미가 크다"고 말했다.



이번 연구는 KAIST 서민석 박사과정 학생이 제1 저자로 참여했으며, 이번 성과는 인공지능 및 컴퓨터 비전 분야 세계 최고 권위 학회인 'CVPR 2026'에서 6월 7일 발표됐다.
임병안 기자

중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지

기자의 다른 기사 모음 ▶