
< (왼쪽부터) KAIST 김현우 교수, 이상혁 박사후연구원, 송태훈 석사과정, 고려대학교 박지환 박사과정 >
새 스마트폰을 바꿀 때마다 연락처와 사진을 처음부터 다시 옮겨야 한다면 얼마나 불편할까. 지금의 인공지능(AI) 모델들도 이와 비슷한 상황에 놓여 있다. 성능이 더 좋은 새로운 ChatGPT 같은 AI 모델이 등장할 때마다, 특정 분야의 지식을 갖추기 위해 막대한 데이터와 비용을 들여 다시 학습해야 했기 때문이다. 한국 연구진이 이러한 비효율을 해결할 수 있는 AI 모델 간 ‘지식 이식’ 기술을 개발했다.
우리 대학은 전산학부 김현우 교수 연구팀이 고려대학교(총장 김동원) 연구팀과 공동연구를 통해, 서로 다른 인공지능 모델 사이에서 학습된 지식을 효과적으로 ‘이식’할 수 있는 새로운 기술을 개발했다고 27일 밝혔다.
최근 인공지능 분야에서는 사진과 글을 함께 이해하는 시각–언어 모델(Vision-Language Model, VLM)이 빠르게 발전하고 있다. 이는 사용자가 사진을 보여주며 질문하면 설명을 해주는 ChatGPT와 같은 멀티모달 AI를 떠올리면 이해하기 쉽다. 이러한 모델들은 대규모 이미지와 언어 데이터를 사전 학습해, 적은 양의 데이터만으로도 새로운 분야에 비교적 빠르게 적응할 수 있다는 장점을 지닌다.
그러나 새로운 AI 모델이 나올 때마다 이러한 ‘적응 과정’을 처음부터 다시 수행해야 한다는 점이 큰 비효율로 지적돼 왔다. 기존의 적응 기법들 역시 모델 구조가 조금만 달라져도 그대로 활용하기 어렵거나, 여러 모델을 동시에 사용해야 해 메모리와 연산 비용이 크게 증가하는 한계를 안고 있었다.
연구팀은 이러한 문제를 해결하기 위해 모델의 구조나 크기에 상관없이 학습된 지식을 재사용할 수 있는 전이 가능한 적응 기법(Transferable adaptation)인 ‘TransMiter’를 제안했다. 이 기술의 핵심은 한 AI가 학습하며 쌓은 ‘적응 경험’을 다른 AI 모델로 직접 옮기는 것이다.

< TransMiter: 모델 구조, 크기 등에 관계 없이 재사용 가능한 적응지식 전이 기법 >
연구진 기술은 AI의 복잡한 내부 구조를 뜯어고치지 않고, 예측 결과(output)만 보고 배운 요령을 다른 AI에게 전해주는 방식이다. 서로 생김새가 다른 AI 모델이라도 같은 질문에 내놓은 답변을 기준으로 정리해 주면, 한 AI가 익힌 노하우를 다른 AI도 바로 활용할 수 있다. 그래서 복잡하고 시간이 많이 드는 학습 과정을 다시 거칠 필요가 없고, 속도도 거의 느려지지 않는다.
이번 연구는 그동안 모델 구조나 크기가 다르면 재사용이 거의 불가능하다고 여겨졌던 AI의 적응 지식을 모델 종류에 상관없이 정밀하게 이식할 수 있음을 처음으로 입증했다는 점에서 의미가 크다. 이를 통해 반복적인 학습 비용을 줄일 수 있을 뿐 아니라, 필요한 분야에 맞춰 거대언어모델을 실시간으로 업데이트하는 이른바 ‘지식 패치(patch)’ 기술로의 활용도 기대된다.
김현우 교수는 “이번 연구를 확장하면, 빠르게 발전하는 초거대언어모델이 등장할 때마다 반복적으로 수행해야 했던 후학습(post-training)의 비용을 크게 줄일 수 있다”며, “특정 분야의 전문 지식을 손쉽게 추가하는 ‘모델 패치’가 가능해질 것”이라고 설명했다.
이번 연구에는 KAIST 전산학부 송태훈 석사과정 학생, 이상혁 박사후연구원, 고려대학교 박지환 박사과정 학생이 공동 저자로 참여했으며, 김현우 교수가 교신저자를 맡았다. 연구 결과는 인공지능 분야 최고 권위의 국제 학술대회인 AAAI 2026(Association for the Advancement of Artificial Intelligence)에 구두 발표(25년 기준 채택률 4.6%)로 채택돼, 1월 25일 발표됐다.
※ 논문명: Transferable Model-agnostic Vision-Language Model Adaptation for Efficient Weak-to-Strong Generalization. DOI : https://doi.org/10.48550/arXiv.2508.08604
한편, 김현우 교수 연구실은 이번 논문을 포함해 구글 클라우드 AI와 공동 진행한 문서내의 테이블 이해를 고도화한 기술인 TabFlash 포함하여 해당 학회에 총 3편의 논문을 발표했다.
우리 대학은 메타버스대학원이 오는 6월 10일부터 12일까지 서울 코엑스에서 열리는 ‘가상융합산업대전(KMF: Korea Metaverse Festival) 2026’에 참가해 현실 공간을 인식·이해하고 사람과 사물의 위치·움직임·상황을 분석해 상호작용할 수 있도록 하는 ‘차세대 공간 AI(Spatial AI)’와 XR(확장현실) 분야 핵심 연구 성과를 공개한다고 5일 밝혔다. 이번 성과는 과학기술정보통신부와 정보통신기획평가원(IITP)이 미래 핵심 산업 대응을 위해 추진해 온 정보통신방송혁신인재양성사업‘가상융합대학원 사업’의 대표적 성과로 평가된다. KAIST 메타버스대학원은 올해 열린 세계 최고 권위의 가상현실(VR) 학술대회인 ‘IEEE VR 2026’에서 세계 대학·연구기관 가운데 두 번째로 많은 12편의 구두 논문을 발표하며 글로벌
2026-06-04우리 대학은 1일 오전 10시 KAIST 학술문화관(E9) 5층 정근모컨퍼런스홀에서 ‘KAIST AI대학 비전선포식’을 개최했다. 이번 행사는 AI 시대를 선도할 핵심 인재 양성과 교육·연구 혁신, 산업 협력, 책임 있는 AI 생태계 구축을 위한 비전과 추진 방향을 대내외에 공유하기 위해 마련됐다. KAIST AI대학은 인공지능을 단순한 활용 도구가 아닌 과학기술, 산업, 교육, 사회 전반의 변화를 이끄는 새로운 지식 생산의 기반으로 보고 있다. 이에 따라 AI 핵심 기술을 선도할 연구 인재와 다양한 분야에서 AI를 창의적으로 활용할 융합 인재를 함께 양성하고, 모델·알고리즘·시스템·인프라·도메인 융합은 물론 미래 사회 설계와 책임 있는 AI까지 포괄하는 교육·연구 체계를 구축해 나갈 계획이다. 비전선포식은 이광형 KAIST 총장의 환영사로 시작됐다. 이어 배경훈 부총리 겸 과학
2026-06-01챗GPT와 같은 거대언어모델(LLM·Large Language Model) 서비스를 운영하려면 수만 대 규모의 서버 인프라가 필요하다. 하지만 새로운 AI 반도체나 시스템 구조를 검증할 때마다 실제 장비를 구축하는 데에는 막대한 비용과 시간이 소요된다. 우리 대학 연구진은 실제 대규모 AI 서버를 구축하기 전에 컴퓨터 안에서 성능과 효율을 미리 검증할 수 있는 ‘가상 실험장’을 개발했다. 우리 대학은 전산학부 박종세 교수 연구팀이 개발한 거대언어모델(LLM) 서비스 인프라 시뮬레이터(simulator·가상 실험 소프트웨어) 연구가 컴퓨터 시스템 성능 분석 분야의 세계적 권위 학회인 ‘ISPASS 2026(IEEE International Symposium on Performance Analysis of Systems and Software)’에서 최우수 논문상을 수상했다고 29일 밝혔다. 연구팀이 개발한 &l
2026-05-29영화 ‘쥬라기 공원’에서 거대한 공룡이 걸어오는 장면을 보면 사람들은 자연스럽게 땅이 울리는 듯한 묵직한 저주파음을 떠올린다. 이는 인간이 단순히 사물의 형태뿐 아니라 크기와 무게, 움직임의 속도 같은 물리적 특성까지 함께 고려해 소리를 예측하기 때문이다. 하지만 기존 영상-음향 생성 AI는 화면 속 사물의 형태나 장면 정보에 주로 의존해 소리를 생성해, 무게나 속도에 따라 달라지는 물리적 특성까지는 충분히 반영하지 못했다. 우리 대학은 전산학부 오태현 교수 연구팀이 POSTECH(총장 김성근), 소니 AI(Sony AI) 공동 연구진과 함께 영상 속 물리적 상황을 이해해 보다 현실감 있는 소리를 생성하는 인공지능(AI) 기술 ‘파바스(PAVAS·Physics-Aware Video-to-Audio Synthesis)’를 개발했다고 26일 밝혔다. 이번 기술의 핵심은 영상 속 물체의 질량과 속도 등 눈에 보이지 않는 물
2026-05-27흔히 ‘정신과 문턱이 높다’고 말한다. 환자는 자신의 아픈 마음을 처음 꺼내놓는 과정에 부담을 느끼고, 의료진은 제한된 진료 시간 안에 환자의 방대한 과거력과 증상을 정확히 파악해야 한다. 국내 연구진이 정신과 진료의 첫 단계인 초진 면담 과정을 지원하는 인공지능(AI) 기술을 개발했다. 우리 대학은 전산학부 이의진 교수, 산업디자인학과 이탁연 교수 연구팀과 강남세브란스병원(원장 김용욱) 정신건강의학과 김은주 교수 연구팀이 공동으로 거대언어모델(Large Language Model, LLM) 기반의 정신과 초진 면담 지원 기술을 개발했다고 24일 밝혔다. 이번 연구는 환자가 의사를 만나기 전 AI와 먼저 대화하며 자신의 증상과 상태를 구조화하는 방식으로 진행됐다. 연구팀은 AI가 환자 응답에 따라 대화의 흐름을 조정할 수 있도록 시스템을 설계했다. AI는 환자의 답변을 정신건강의학 분야의 전문 의료 지식과 대조해 실시간으로 분석하고, 다음에 물어봐야
2026-05-27