
< (왼쪽부터) 노준혁 교수 (이화여대 인공지능학과 조교수), 서진환, 조윤기 박사과정, 윤성의 교수 (KAIST 전산학부 교수) >
‘카메라가 다른 곳을 비추는 사이 사라진 물체는 무엇 인가요?’라는 복잡한 질문이 나오면 AI는 많은 경우 영상 속 실제 상황을 보고 판단하는 것이 아니라, 언어 패턴에 의존해 ‘그럴듯한 답’을 추측하는 문제가 있다. 우리 대학 연구진은 이 한계를 해결하기 위해 영상 속 ‘딱 중요한 순간(Trigger moment)’을 AI가 스스로 찾아내도록 하는 기술을 개발했고, 이 기술로 국제 AI 대회에서 우수성을 입증했다.
우리 대학은 전산학부 윤성의 교수 연구팀이 이화여대 노준혁 교수 연구팀과 공동 연구를 통해, 세계적 권위의 컴퓨터 비전 학회 ICCV 2025에서 열린 Perception Test Challenge의 영상 근거 기반 질의응답(Grounded Video Question Answering) 트랙에서 1위를 차지했다고 28일 밝혔다.
이번 ICCV 2025에서 열린 인지 테스트 대회(Perception Test Challenge)는 구글 딥마인드(Google DeepMind)가 주관하여 총 상금 50,000 유로(한화 약 8,300만원)가 걸린 대회로, 영상·음성·텍스트 등 다양한 데이터를 종합적으로 이해하는 멀티모달 AI의 인지 및 추론 능력을 평가한다. 특히 언어 중심 편향을 벗어나 실제 영상 근거를 바탕으로 판단하는 능력이 핵심 평가 요소다.
우리 대학 연구팀은 영상 전체를 무작정 분석하는 기존 방식과 달리, AI가 정답을 위해 꼭 필요한 핵심 장면(Trigger moment)을 먼저 찾아내도록 만드는 새로운 기술을 개발했다. 쉽게 말하면, “이 질문에 답하려면 이 장면이 결정적이야!”를 AI가 스스로 찾아내도록 설계한 기술이다.
이 프레임워크를 연구팀은 CORTEX(Chain-of-Reasoning for Trigger Moment Extraction)라고 부른다.
연구팀의 시스템은 서로 다른 기능을 수행하는 세 모델이 순차적으로 작동하는 3단계 구조로 구성된다. 먼저 추론 AI(Gemini 2.5 Pro)가 질문에 답하기 위해 어느 순간을 봐야 하는지 사고하고 딱 그 순간(Trigger moment) 후보를 찾는다. 다음으로 객체 위치 찾기 모델(Grounding 모델, Molmo-7B)이 해당 순간 화면 속 사람·차·사물의 정확한 위치(좌표)를 파악한다. 마지막으로 추적 모델(Tracking 모델, SAM2)이 선택된 한 장면을 기준으로 앞뒤 시간대의 객체 움직임을 정밀하게 추적해 오류를 줄인다.
즉, ‘핵심 장면 한 컷을 정확히 찍고, 그 장면을 중심으로 정답 근거를 추적하는 방식’덕분에 영상 초반 오판이나 가려짐 같은 문제도 크게 줄었다.
총 23개 팀이 참여한 영상 근거 기반 질의응답(Grounded VideoQA) 트랙에서 KAIST팀 SGVR Lab(Scalable Graphics, Vision & Robotics Lab)은 ‘고차 추적 정확도(HOTA, Higher Order Tracking Accuracy)’지표에서 0.4968점을 기록하며 2등 미국 콜럼비아대의 0.4304점을 압도적인 점수 차로 상회하며 1위를 차지했다. 이는 전년도 우승 기록 0.2704점보다도 약 두 배에 가까운 성과다.
이 기술은 실생활에서도 넓게 쓰일 수 있다. 자율주행차는 사고 위험이 있는 순간을 정확히 보고, 로봇은 주변 상황을 더 똑똑하게 이해한다. 또 보안·감시 시스템은 중요한 장면을 빠르게 찾아내고, 미디어 분석에서는 사람이나 사물의 행동을 시간 순서대로 정확히 추적할 수 있다.
즉, AI가 “영상 속 실제 근거”를 보고 판단할 수 있도록 만드는 핵심 기술이다. 특히 영상 속 객체가 시간에 따라 어떻게 행동하는지 정확히 짚어내는 능력은 향후 AI의 실제 현장 적용을 크게 확장할 것으로 기대된다.

< 연구팀이 제안한 비디오 질의 응답을 위한 그라운딩 프레임워크의 파이프라인 이미지 >
이번 연구는 ICCV 2025, the 3rd Perception Test Challenge 학회에서 10월 19일자 발표하였다.
이 성과는 과학기술정보통신부 기초연구사업 중견연구와 SW스타랩 사업 ‘오픈 월드 로봇 서비스를 위한 불특정 환경 인지·행동·상호작용 알고리즘 개발’ 및 AGI 사업 ‘체화형 AGI를 위한 현실 세계 구축과 인지 에이전트 기반 이원 역량 접근법’ 과제의 지원을 받아 수행되었다.
우리 대학은 융합인재학부 재활인공지능연구실(Assistive AI Lab) 가현욱 교수 연구팀이 일반 글자(묵자)를 시각장애인이 읽을 수 있는 점자로 변환하는 ‘점역(點譯, Braille translation)’기술을 고도화한 차세대 점자 번역 엔진 ‘K-Braille(케이-브레일)’을 개발하고 대규모 성능 검증을 완료했다고 13일 밝혔다. 점역은 책, 문서, 웹페이지 등 일반 문자로 작성된 정보를 점자 체계에 맞게 변환하는 과정으로 시각장애인의 정보 접근을 위해 필수적인 기술이다. 그러나 한국어 점자 규정은 띄어쓰기, 기호, 외국어 표기 등 다양한 예외 규칙이 존재해 정확한 자동 점역이 쉽지 않다. 현재 시각장애인들이 사용하는 기존 점역 프로그램들은 문자나 기호를 단순 규칙에 따라 변환하는 방식이어서, 다국어(영문 등)·한글 혼용 표현이나 복합 단위 기호, 괄호 띄어쓰기 등 복잡한 규정 처리에서 오류가 발생하는 경우가
2026-03-13우리 대학은 융합인재학부 재학생(학사과정)이자 글로벌 뮤직테크 스타트업 ㈜엠피에이지(MPAG)의 대표인 정인서(28) 학생이‘포용적 AI’인재 양성을 위해 10일 발전기금 10억 원을 기탁했다고 11일 밝혔다. 포용적 AI 인재는 장애인과 기술 취약계층 등 사회적 약자까지 AI 기술의 혜택을 누릴 수 있도록 연구·개발하는 전문가를 의미한다. 정인서 학생은 재학 중 창업과 연구 활동을 병행하며 ‘기술을 통한 사회 문제 해결’에 매진해 온 학생 창업가다. 그는 융합인재학부 가현욱 지도교수와 함께 기술이 소외된 이들을 어떻게 보듬을 수 있을지에 대해 꾸준히 연구해 왔다. 청각장애인을 위한 소프트웨어 연구, 미디어에서 언어적 지원이 필요한 사용자를 위한 연구, 시청각 장애인을 위한 양방향 소통 보조공학 기기 연구 등은 국내외 학회에서 주목을 받았으며, KAIST 명의로 여러건의 특허 출원이라는 값진 결실로 이어졌다. 그는 글로
2026-03-11“슬럼(Slum, 빈곤지역)이 어디에 있는지조차 모르는 도시들” 한국 연구진이 위성사진만으로 슬럼 지역을 스스로 찾아내는 인공지능(AI)을 개발했다. 사람이 미리 위치를 표시해 주지 않아도 새로운 도시에서 자동으로 적응해 정확도를 높이는 기술로, 데이터가 부족한 개발도상국의 도시정책 수립과 공공 자원 배분 방식을 근본적으로 바꿀 수 있을 것으로 기대된다. 우리 대학은 전산학부 차미영 교수와 기술경영학부 김지희 교수 공동 연구팀이 전남대학교(총장 이근배) 지리학과 양재석 교수와 함께한 학제 간 융합 연구를 통해 위성사진 기반 범용 슬럼 탐지 AI 기술을 개발했다고 6일 밝혔다. 이번 연구는 세계 최고 권위의 인공지능 학술대회 ‘국제인공지능학회(AAAI) 2026’에서 ‘사회적 임팩트 AI(AI for Social Impact)’ 부문 최우수논문상(Best Paper Award)을 수상했다. 해당 부문에 제출된 6
2026-03-06혈액의 흐름은 생명의 신호다. 이 흐름이 느려지거나 불안정해지면 심혈관 질환과 쇼크로 이어질 수 있다. 그러나 혈류를 정확히 측정하려면 병원 장비에 의존해야 했다. 우리 대학 연구진이 피부에 붙이기만 하면 혈류를 실시간으로 측정할 수 있는 무선 전자패치를 개발했다. 우리 대학은 전기및전자공학부 권경하 교수 연구팀이 딥러닝(AI)과 다층 열 센싱 기술을 결합한 무선 웨어러블 혈류 측정 시스템을 개발했다고 5일 밝혔다. 이 장치는 혈관을 직접 건드리지 않고도(비침습 방식) 혈류 속도와 혈관 깊이를 동시에 측정할 수 있다. 혈관이 피부 속 얼마나 깊이 위치하느냐에 따라 센서 신호가 달라지기 때문에, 깊이 정보는 혈류를 정확히 계산하는 핵심 변수다. 기존에는 초음파나 광학 방식이 주로 사용됐지만, 장비가 크거나 혈관 깊이에 따라 정확도가 떨어지는 한계가 있었다. 연구팀은 이를 해결하기 위해 ‘혈액이 흐르면 주변에 미세한 열 이동이 발생한다’는 점에 주목했다.
2026-03-05우리 대학이 단순히 작품을 ‘보는’ 전시를 넘어, 관람객이 직접 공간을 거닐며 ‘느슨한 시간’을 경험하는 자리로 초대한다. ‘느슨한 시간’은 직선적으로 흘러가는 일상의 시간에서 벗어나, 공간을 거닐며 감각과 사유가 천천히 교차하는 또 다른 시간의 결을 의미한다. 우리 대학은 그래픽 디자이너 김영나 작가의 설치 미술 작품 기획전 ‘느슨한 시간(Oblique Time)’을 대전 본원 KAIST 미술관에서 3일 개최한다고 밝혔다. 이번 전시는 새롭게 공개되는 미술관 옥상 공간에서 펼쳐진다. 옥상에 설치된 세 점의 작품은 바람과 빛, 시선과 움직임을 매개로 공간의 감각을 새롭게 일깨운다. 옥상에 들어서면 높이 솟은 기둥들이 관람객을 맞이하고, 기둥 사이를 천천히 걸을수록 바람이 스치고 지나간 흔적이 몸으로 읽힌다. 계단을 오르내리면 같은 공간도 전혀 다른 장면으로 펼쳐지고, 바닥에 놓인 원형 거울
2026-03-03