KAIST–한국폴리텍대학, AI 시대 인재양성 위한 교육혁신 협력 체결
우리 대학은 한국폴리텍대학과 AI 기반 제조혁신 시대를 대비한 새로운 인재양성 모델을 구축하기 위해 전략적 협력을 체결했다. 이번 협력은 국내 최고의 AI 연구기관과 전국 40개 캠퍼스를 기반으로 현장 실무 중심 교육을 담당해 온 기술대학 간의 첫 공식 협력 사례로, 대한민국 공학 및 직업교육 체계에 중요한 전환점이 될 것으로 기대된다.
양 기관은 기존의 ‘연구 중심 대학’과 ‘현장 중심 기술대학’이라는 이원적 구조만으로는 AI 기반 제조현장의 급격한 변화에 대응하기 어렵다는 문제의식을 공유했다. 이에 따라 제조 분야의 피지컬 AI(Physical AI) 연구·교육을 중심으로 한 공동 프로그램 개발, 현장 실증 기반 교육 연계, 산학협력 강화 등 다양한 협력 과제를 추진할 계획이다.
우리 대학은 최근 <제조 피지컬 AI 연구소> 를 신설하여 글로벌 제조혁신을 위한 차세대 AI·로보틱스 연구를 본격화하고 있으며, 한국폴리텍대학은 전국적 실습 인프라와 산업 현장 중심 교육 경험을 바탕으로 실무형 기술인력 양성에 기여해 왔다. 이번 협력을 통해 양 기관은 연구개발(AI·로봇·디지털트윈)과 현장기술교육(제조·정비·자동화)을 결합한 새로운 융합형 인재양성 체계를 구축한다.
이번 협력을 주도한 KAIST 제조 피지컬 AI 연구소 장영재 소장은 “대한민국 제조 현장의 강점과 KAIST의 AI 연구 역량을 결합해 글로벌 제조 AI 기술을 선도하는 국가적 기반을 만들겠다”고 밝혔다.
이철수 한국폴리텍대학 이사장은 “이번 협약은 디지털을 넘어 물리적 세계로 확장되는 AI 시대에 맞는 새로운 인재 양성 모델을 제시하는 의미 있는 발걸음”이라며 “현장형 피지컬AI 전문가를 체계적으로 육성해, 산업계가 필요로 하는 핵심 기술 인재를 지속적으로 배출하겠다”고 밝혔다.
이광형 총장은 “AI는 이제 가상의 영역을 넘어 현실의 물리적 세계와 결합하며 산업 전반의 패러다임을 바꾸고 있다”며 “KAIST는 이번 협력을 통해 연구 중심의 첨단 기술을 실제 산업 현장으로 확산시키고, 폴리텍대학과 함께 피지컬AI 시대를 선도할 융합형 인재 양성에 앞장서겠다”고 말했다.
MOU 체결식은 2025년 11월 20일, 코엑스에서 개최되는 ‘글로벌 피지컬 AI 포럼’ 인재양성 전략 세션에서 오후 14:30에 진행됐다.
개인정보 공유 없이 병원·은행에서도 통하는 연합학습 AI 개발
환자 진료기록이나 금융 데이터처럼 개인정보를 한곳에 모으기 어려운 문제를 해결하기 위해 ‘연합학습(Federated Learning)’이 고안됐다. 하지만 공동으로 학습한 AI를 각 기관이 자신의 환경에 맞게 최적화하는 과정에서, AI가 특정 기관 데이터에만 과도하게 적응해 새로운 데이터에는 취약해지는 한계가 있었다. 우리 대학 연구진은 이를 해결할 방법을 제시했으며, 병원·은행 같은 보안 분야는 물론, 소셜미디어·온라인 쇼핑처럼 변화가 잦은 환경에서도 안정적인 성능을 확인했다.
우리 대학은 산업및시스템공학과 박찬영 교수 연구팀이 연합학습의 고질적인 성능 저하 문제를 해결하고, AI 모델의 일반화(Generalization) 성능을 크게 향상시키는 새로운 학습 방법을 개발했다고 15일 밝혔다.
연합학습은 여러 기관이 데이터를 직접 주고받지 않고도 공동으로 AI를 학습할 수 있는 방식이다. 그러나 이렇게 완성된 공동 AI 모델을 각 기관이 현장에 맞춰 최적화(파인 튜닝)하는 과정에서 문제가 발생한다. 기존의 폭넓은 지식이 희석되며, AI가 특정 기관의 데이터 특성에만 과도하게 적응하는‘지역 과적합(Local Overfitting)’문제가 생기기 때문이다.
예를 들어 여러 은행이 함께 ‘공동 대출 심사 AI’를 구축한 뒤, 특정 은행이 대기업 고객 데이터를 중심으로 파인튜닝을 진행하면 해당 은행의 AI는 대기업 심사에는 강점을 보이지만 개인이나 스타트업 고객 심사에서는 성능이 떨어지는 지역 과적합 문제가 생긴다.
박 교수 연구팀은 이를 해결하기 위해 ‘합성 데이터(Synthetic Data)’ 방식을 도입했다. 각 기관의 데이터에서 핵심적이고 대표적인 특징만을 추출해 개인정보를 포함하지 않는 가상 데이터를 생성하고, 이를 파인튜닝 과정에 적용한 것이다. 이로써 각 기관의 AI는 개인정보 공유없이 자신의 데이터에 맞춰 전문성을 강화하면서도, 공동학습으로 얻은 폭넓은 시야(일반화 성능)를 잃기 않게 되었다.
연구 결과, 해당 방법은 의료·금융 등 데이터 보안이 중요한 분야에서 특히 효과적일 뿐 아니라, 소셜미디어나 전자상거래처럼 새로운 사용자와 상품이 지속적으로 추가되는 환경에서도 안정적인 성능을 발휘했다. 새로운 기관이 협력에 참여하거나 데이터 특성이 급격히 변하더라도 AI가 혼란스러워하지 않고 안정적으로 성능을 유지할 수 있음을 보여줬다.
박찬영 산업및시스템공학과 교수는 “이번 연구는 데이터 프라이버시를 지키면서도, 각 기관의 AI가 전문성과 범용성을 동시에 보장하는 새로운 길을 열었다”라며, “의료 AI, 금융 사기 탐지 AI처럼 데이터 협업이 필수적이지만 보안이 중요한 분야에서 큰 도움이 될 것”이라고 말했다.
이번 연구는 데이터사이언스대학원 김성원 학생이 제1 저자, 박찬영 교수가 교신저자로 참여했으며, 지난 4월 싱가포르에서 열린 인공지능 분야 최고 권위 학술대회인 ‘국제표현학습학회(International Conference on Learning Representations, ICLR) 2025’에서 상위 1.8%의 우수 논문에만 선정되는 구두 발표(Oral Presentation) 대상으로 채택되어 그 우수성을 입증받았다.
※ 논문명: Subgraph Federated Learning for Local Generalization, https://doi.org/10.48550/arXiv.2503.03995
한편, 이번 연구는 정보통신기획평가원의 지원을 받은 ‘강건하고 공정하며 확장 가능한 데이터 중심의 연속 학습’과제와 한국연구재단의 지원을 받은 ‘그래프 파운데이션 모델: 다양한 모달리티 및 도메인에 적용 가능한 그래프 기반 기계 학습’과제와 ‘데이터사이언스융합인재양성 사업’의 성과다.
'피지컬 AI 핵심기술 실증' 시범사업 수주
우리 대학은 전라북도, 전북대, 성균관대와 함께 과학기술정보통신부가 공모한‘피지컬 AI 핵심기술 실증 (PoC, Proof of Concept)’시범사업을 공동 수주했으며, 이번 사업에서 연구 총괄을 맡았다고 28일 밝혔다.
이번 사업에서 KAIST는 ‘협업지능 피지컬 AI’를 주제로 연구 기획을 주도했으며, 전북대학교와 전라북도는 이를 기반으로 공동 연구를 수행하고, 전라북도 내에 협업지능 피지컬 AI 산업 생태계를 조성할 계획이다. 올해 시범 사업은 9월 1일부터 시작하여 올해 말까지 진행될 계획이다.
우리 대학은 연구 원천기술 개발과 테스트베드 구축을 통한 연구 환경 조성, 나아가 산업 확산을 담당한다. 본 사업의 KAIST 총괄 책임자인 장영재 산업및시스템공학과 교수는 2016년부터 협업지능 피지컬 AI 관련 연구를 선도적으로 추진해 왔다. 특히 ‘협업지능 기반 스마트 제조 혁신 기술’은 그의 대표 성과로, 2019년 KAIST ‘10대 대표 연구 성과’에 선정된 바 있다.
‘피지컬 AI’란 인공지능이 시공간 개념을 이해하고 이를 토대로 로봇, 자율주행차, 공장 자동화 기기 등 물리적 장치들이 사람의 지시 없이도 작업을 수행할 수 있도록 하는 최신 인공지능 기술을 말한다.
특히 협업지능 피지컬 AI는 수많은 로봇과 자동화 장비가 투입되는 공장 환경에서 이들이 서로 협력해 목표를 달성하는 기술로, 반도체·2차전지·자동차 제조 분야에서 ‘다크 팩토리(무인 공장)’구현을 위한 핵심 기반으로 주목받고 있다.
또한 이는 기존 제조 AI와 달리 방대한 과거 데이터를 반드시 필요로 하지 않는다. 실시간 시뮬레이션 기반 학습을 통해 변화가 잦은 제조 환경에서도 신속하게 적응할 수 있으며, 과거 데이터 의존성 한계를 극복한 차세대 기술로 평가된다.
현재 글로벌 AI 산업은 언어지능을 모사하는 대규모 언어모델(LLM)이 주도하고 있다. 그러나 피지컬 AI는 언어지능을 넘어 공간지능과 가상환경 학습을 포함해야 하며, 로봇·센서·모터 등 하드웨어와 소프트웨어의 유기적 결합이 요구된다. 제조 강국인 대한민국은 이러한 생태계 구축에 유리해 글로벌 경쟁을 선도할 기회를 갖고 있다.
실제로 KAIST는 2025년 4월 세계 최대 산업공학 학회인 INFORMS(Institute for Operations Research and the Management Sciences)에서 협업지능 피지컬 AI 사례연구로 MIT와 아마존을 제치고 우승을 차지한 바 있다. 이는 피지컬 AI 기술의 글로벌 경쟁력을 입증한 사례로 평가된다.
KAIST 총괄책임자인 장영재 교수는 “이번 대형 국책사업 수주는 지난 10여 년간 축적해 온 KAIST의 협업지능 피지컬 AI 연구 역량이 국내·외에서 인정받은 결과”라며 “대한민국 제조 산업이 글로벌 선도형 ‘피지컬 AI 제조혁신 모델’을 구축하는 전환점이 될 것”이라고 밝혔다.
이광형 KAIST 총장은 “KAIST는 학문적 연구를 넘어 국가 전략기술의 실질적 산업화를 선도하는 역할을 수행하고 있다”며 “이번 성과를 계기로 전북대학교, 전라북도와 협력하여 대한민국을 세계적인 피지컬 AI 혁신 거점으로 발전시켜 나가겠다”고 강조했다.
KAIST, 전북대학교, 전라북도는 이번 사업을 통해 대한민국을 글로벌 피지컬 AI 거점 산업 지역으로 발전시켜 나갈 계획이다.
주상현 학생, 2025 IEEE CASE 최고 학생 논문상 수상
산업및시스템공학과 주상현 박사과정(지도교수: 김현정)이 2025년 8월 17일부터 21일까지 열린 제 21회 IEEE CASE (International Conference on Automation Science and Engineering)에서 Best Student Paper Award를 수상했다. IEEE CASE는 자동화 분야 최대 규모의 국제학회로, 해당 학회에서 한국 기관 소속 연구자가 수상한 첫 사례로 의미가 크다.
수상 논문 제목은 “K-Wafer Cyclic Sequence for Scheduling of Dual-Armed Cluster Tool with Purge Operation”으로, 반도체 및 디스플레이 제조 공정에서 핵심적으로 사용되는 Cluster Tool 장비의 로봇 시퀀스 최적화를 다루고 있다.
특히, 품질에 직접적인 영향을 주는 챔버 클리닝 작업을 포함한 공정에서 기존 방법론들이 최적해를 보장하지 못하는 한계를 극복하고, 생산성을 최대화할 수 있는 새로운 로봇 동작 순서와 수리적 분석 방법을 제시했다. 이번 연구는 반도체·디스플레이 제조 현장의 효율성 향상에 실질적 기여를 할 수 있는 학문적 성과로 평가받으며, IEEE CASE 국제 학회에서도 높은 주목을 받았다.
국내 첫 피지컬 AI 기반 제조 혁신 포럼 개최
우리 대학과 다임리서치는 2025년 6월 25일 KAIST 본원 기계공학동(N7, 1601호)에서 “피지컬 AI와 SDx가 창조하는 제조와 자동화산업의 미래”라는 주제로 국내 최초 피지컬 AI 기반 제조 혁신 포럼을 개최하였다.
최근 인공지능(AI)은 단순한 언어 처리나 데이터 분석을 넘어 현실 공간에서 직접 작동하는 ‘피지컬 AI (Physical AI)’ 시대로 진입하고 있다. 챗GPT와 같은 언어 모델이 인간의 사고를 모사하는 ‘언어형 AI’였다면, 피지컬 AI는 공간과 시간의 맥락을 인식하고 물리적 행동을 수행하는 “움직이는 지능”으로서 제조, 물류, 건설, 농업 등 산업 전반을 혁신하는 새로운 산업의 기회로 떠오르고 있다.
포럼은 크게 두 개 세션으로 구성되며, 첫 번째 세션에서는 현대자동차의 민정국 상무가 세계 최초로 현대차가 도입한 Software-Defined Factory (SDF) 개념을 발표하였으며, KAIST 장영재 교수는 피지컬 AI 기술이 적용된 SDx 구현 사례를 공유하였다. 이어 네이버 김필수 본부장이 AI 에이전트가 미래 제조 현장에서 맡을 역할과 국내 제조산업 확산 전략을 소개하였다.
두 번째 세션은 산업계, 정부, 연구기관이 참여하는 기술 세션으로, 유니티코리아, KEIT, NIPA, 다임리서치 관계자들이 각각 디지털 트윈, 정부 정책, 기술 트렌드, 자율 제조 기획에 대한 최신 인사이트를 공유하였다.
특히 이번 포럼은 단순한 기술 공유를 넘어, 국내 중소기업의 자동화 도입에 실질적인 도움을 주기 위한 전략이 발표되었다는 점에서 주목된다.
장영재 교수와 다임리서치는 중소기업이 무료로 사용할 수 있는 피지컬 AI 기반 자동 설계 및 분석 솔루션을 개발 중이며, 이를 통해 고가 외산 소프트웨어와 전문가 없이도 로봇 및 자동화 설계 시뮬레이션이 가능해져 중소기업의 자동화 실패를 줄이고 생산성 향상에 기여할 것으로 기대된다.
피지컬 AI는 로봇, 제어, 반도체, 센서, 통신 등 복합 기술이 통합된 영역으로, 대한민국이 강점을 가진 기반 기술과 높은 시너지를 낼 수 있다. 이번 포럼은 대한민국이 AI 패권 경쟁에서 주도권을 회복할 새로운 전략 방향을 제시하였으며, 특히 제조·물류 등 핵심 산업 분야에서 글로벌 AI 산업을 선도할 기회를 마련하는 출발점이 될 것으로 기대한다.
KAIST, INFORMS 세계대회서 AI 자율제조로 혁신상- 포드에 이어 2위
우리 대학 산업및시스템공학과 장영재 교수 연구팀이 KAIST 창업기업 ‘다임리서치’와 공동연구를 통해, 세계 최대 규모의 산업공학 및 경영과학 학회(INFORMS)*가 주최한 인폼스 애널리틱스 컨퍼런스(INFORMS Analytics Conference)에서 우수 혁신사례상(Innovative Applications in Analytics Award, IAAA)을 수상하고, 2위를 차지했다.
* 산업공학 및 경영과학 학회(INFORMS): The Institute for Operations Research and the Management Sciences
장영재 교수-다임리서치 공동연구팀은 아마존, 카이저 퍼머넌트, 스코티아 은행 등 세계 유수의 기업들과 경합을 벌였다. 그 결과, 포드 자동차그룹이 1위를 차지했으며 KAIST-다임리서치팀이 2위의 성과를 거두었고 MIT-암스텔담 대학 연합팀이 3위를 차지했다.
공동연구팀이 발표한 수상작은 ‘디지털 트윈과 강화학습을 활용한 자율제조(The Autonomous Factory with Digital Twin and Reinforcement Learning for Intelligent Operations and Efficiency)’로, 디지털 트윈 및 AI 기반 자율 운영 기술의 산업적 실현 가능성과 우수성을 높이 평가받았다.
인폼스(INFORMS)는 산업공학 및 경영과학 분야에서 세계 최대 규모의 학술 조직으로, 매년 실제 산업 현장에서 성공적으로 적용된 분석 및 혁신 기술을 조명하는 인폼스 애널리틱스 컨퍼런스를 개최하고 있다. 이번 컨퍼런스는 4월 6일부터 9일까지 미국 인디애나폴리스에서 열렸으며, 올해는 전 세계에서 약 40개 팀이 참여해 경합을 벌였으며, 그 중 최종 6개 팀만이 본선 발표에 초청되었다.
장영재 대표는“이번 수상은 KAIST가 주도하는 AI 자율제조 기술이 세계 무대에서도 그 기술력과 혁신성을 인정받았다는 점에서 의미를 크다. 특히, 디지털 트윈과 시뮬레이션 기반의 공장 설계 및 자율운영 기술이 큰 관심을 끌었다”고 말했다.
이어“글로벌 공급망이 재편되는 현시점에서 제조의 중요성이 다시금 부각되고 있다. AI를 제조 산업에 융합해 새로운 패러다임을 제시하는‘AI 자율제조’ 기술이 국제적으로 인정받게 되어 기쁘다”라고 수상 소감을 전했다.
한편, (주)다임리서치는 2020년 장영재 교수가 그의 박사과정 졸업생들과 공동 창업한 딥테크 스타트업으로, AI 자율 제조 기술을 전문적으로 개발하고 있다. 최근 첨단 제조 현장에서는 수십 대에서 수천 대에 이르는 로봇을 효율적으로 운영하기 위해 AI 기반 통합 운영 시스템의 수요가 증가하고 있으며, 다임리서치는 이를 선도적으로 지원하고 있다.
주요 기술로는, 자체 개발한 강화학습 기반 시뮬레이션 엔진과 로봇 통합 운영 플랫폼인 xMS 솔루션을 통해 대규모 공장 및 물류창고의 로봇을 최적화된 방식으로 제어하고 있다. 또한, 로봇 오케스트레이션 플랫폼을 통해 공장 자동화 설계부터 시뮬레이션, 구축까지의 전 엔지니어링 과정을 지원하며, 기존에 수주일에서 수개월이 소요되던 자동화 설계 작업을 수 시간 내에 완료할 수 있는 기술력을 보유하고 있다.
문일철 교수팀, 북경대와 영국 ICL 제치고 ICML 2024 챌린지 우승
우리 대학 산업및시스템공학과 문일철 교수 연구팀이 세계 최고 수준의 기계학습 학회인 ‘국제머신러닝학회(ICML, International Conference on Machine Learning) 2024’에서 개최된 ‘멀티모달 작업계획 생성 경진대회(EgoPlan)’에서 다수의 세계 연구팀을 모두 제치고 1위로 우승을 했다고 30일 밝혔다.
본 대회는 7월 21일부터 27일까지 오스트리아 비엔나에서 개최됐으며, 참가자는 북경대(中), 북경 AGI연구소(中) 및 임페리얼칼리지 런던(Imperial College London, 英) 등의 6개국 13개 기관이 참여해 경쟁했다. 우리 연구팀은 국내 유일의 참가 기관으로 7월 26일 우승상 및 혁신상을 수상했다.
이번 대회는 인공지능이 주방에서 요리하는 과정을 비디오 및 지문으로 학습한 이후, 경험하지 못한 요리 과정에서 상식적으로 합당한 의사결정을 내려 조리할 수 있는지를 경쟁하는 시합이었다. 이는 시각 정보와 지문 정보 등의 멀티모달 정보를 조합하며, 학습에 반영되지 않은 상식까지 반영해 의사결정을 내리는 시험이다. 이 기술은 최소한의 학습만으로도 로봇이 다양한 멀티모달 정보 및 기초 상식을 활용해 자율 제조 및 서비스를 수행할 수 있도록 개발하는 것이 핵심이다.
산업및시스템공학과 이광현(석사과정), 강미나(석사과정) 등 총 11명의 팀으로 참가한 응용인공지능 연구실(이하 AAILab) 팀은 상식 기반 추론을 통한 작업계획 생성의 정확도 1위 성능으로 우승상(Outstanding Champion Award) 및 기술의 우수성을 인정받아 혁신상(Innovation Award)을 수상해, 2개 상을 동시에 수상했다. 이번 대회를 위해 AAILab 팀은 멀티모달 대규모 모델의 파인튜닝 학습에 대한 연구 개발 결과를 적용해 우승을 차지했다.
문일철 교수는 “중국팀들이 대회를 위해 위챗(WeChat) 대화방까지 마련해 서로 협력한다는 얘기를 전해 듣고는 경쟁이 치열하다고 느꼈다. 하지만 KAIST 팀도 각고의 노력으로 우승할 수 있었다. 학생들이 두 달 동안 거의 잠을 자지 못했다”고 우승 소회를 밝혔다. 그리고 문 교수는 “이번 대회의 출제 문제는 요리하는 인공지능이지만, 사실 테슬라에서 시험하고 있는 휴머노이드 제조 로봇에 활용될 수 있는 상식을 가진 인공지능을 만드는 기술이 본질이다. 많은 중국 참가자가 보여주듯이 중국의 로봇 및 인공지능 기술 선점 노력을 엿볼 수 있다”라고 분석했다.
이번 연구는 정보통신기획평가원(IITP)에서 지원한 사람중심인공지능 핵심원천기술개발사업 중 ‘이종데이터기반 상식 추출, 이해, 추론을 위한 인공지능 기술개발(연구책임자 문일철)’을 통해 이뤄졌다.
대형언어모델로 42% 향상된 추천 기술 연구 개발
최근 소셜 미디어, 전자 상거래 플랫폼 등에서 소비자의 만족도를 높이는 다양한 추천서비스를 제공하고 있다. 그 중에서도 상품의 제목 및 설명과 같은 텍스트를 주입하여 상품 추천을 제공하는 대형언어모델(Large Language Model, LLM) 기반 기술이 각광을 받고 있다. 한국 연구진이 이런 대형언어모델 기반 추천 기술의 기존 한계를 극복하고 빠르고 최상의 추천을 해주는 시스템을 개발하여 화제다.
우리 대학 산업및시스템공학과 박찬영 교수 연구팀이 네이버와 공동연구를 통해 협업 필터링(Collaborative filtering) 기반 추천 모델이 학습한 사용자의 선호에 대한 정보를 추출하고 이를 상품의 텍스트와 함께 대형언어모델에 주입해 상품 추천의 높은 정확도를 달성할 수 있는 새로운 대형언어모델 기반 추천시스템 기술을 개발했다고 17일 밝혔다.
이번 연구는 기존 연구에 비해 학습 속도에서 253% 향상, 추론 속도에서 171% 향상, 상품 추천에서 평균 12%의 성능 향상을 이뤄냈다. 특히, 사용자의 소비 이력이 제한된 퓨샷(Few-shot) 상품* 추천에서 평균 20%의 성능 향상, 다중-도메인(Cross-domain) 상품 추천**에서 42%의 성능 향상을 이뤄냈다.
*퓨샷 상품: 사용자의 소비 이력이 풍부하지 않은 상품.
**다중-도메인 상품 추천: 타 도메인에서 학습된 모델을 활용하여 추가학습없이 현재 도메인에서 추천을 수행. 예를 들어, 의류 도메인에 추천 모델을 학습한 뒤, 도서 도메인에서 추천을 수행하는 상황을 일컫는다.
기존 대형언어모델을 활용한 추천 기술들은 사용자가 소비한 상품 이름들을 단순히 텍스트 형태로 나열해 대형언어모델에 주입하는 방식으로 추천을 진행했다. 예를 들어 ‘사용자가 영화 극한직업, 범죄도시1, 범죄도시2를 보았을 때 다음으로 시청할 영화는 무엇인가?’라고 대형언어모델에 질문하는 방식이었다.
이에 반해, 연구팀이 착안한 점은 상품 제목 및 설명과 같은 텍스트뿐 아니라 협업 필터링 지식, 즉, 사용자와 비슷한 상품을 소비한 다른 사용자들에 대한 정보가 정확한 상품 추천에 중요한 역할을 한다는 점이었다. 하지만, 이러한 정보를 단순히 텍스트화하기에는 한계가 존재한다. 이에 따라, 연구팀은 미리 학습된 협업 필터링 기반 추천 모델로부터 사용자의 선호에 대한 정보를 추출하고 이를 대형언어모델이 이해할 수 있도록 변환하는 경량화된 신경망을 도입했다.
연구팀이 개발한 기술의 특징으로는 대형언어모델의 추가적인 학습이 필요하지 않다는 점이다. 기존 연구들은 상품 추천을 목적으로 학습되지 않은 대형언어모델이 상품 추천이 가능하게 하도록 대형언어모델을 파인튜닝(Fine-tuning)* 하는 방법을 사용했다. 하지만, 이는 학습과 추론에 드는 시간을 급격히 증가시키므로 실제 서비스에서 대형언어모델을 추천에 활용하는 것에 큰 걸림돌이 된다. 이에 반해, 연구팀은 대형언어모델의 직접적인 학습 대신 경량화된 신경망의 학습을 통해 대형언어모델이 사용자의 선호를 이해할 수 있도록 했고, 이에 따라 기존 연구보다 빠른 학습 및 추론 속도를 달성했다.
*파인튜닝: 사전 학습된 대규모 언어모델을 특정 작업이나 데이터셋에 맞게 최적화하는 과정.
연구팀을 지도한 박찬영 교수는 “제안한 기술은 대형언어모델을 추천 문제에 해결하려는 기존 연구들이 간과한 사용자-상품 상호작용 정보를 전통적인 협업 필터링 모델에서 추출해 대형언어모델에 전달하는 새로운 방법으로 이는 대화형 추천 시스템이나 개인화 상품 정보 생성 등 다양한 고도화된 추천 서비스를 등장시킬 수 있을 것이며, 추천 도메인에 국한되지 않고 이미지, 텍스트, 사용자-상품 상호작용 정보를 모두 사용하는 진정한 멀티모달 추천 방법론으로 나아갈 수 있을 것”이라고 말했다.
우리 대학 산업및시스템공학과 김세인 박사과정 학생과 전산학부 강홍석 학사과정(졸) 학생이 공동 제1 저자, 네이버의 김동현 박사, 양민철 박사가 공동 저자, KAIST 산업및시스템공학과의 박찬영 교수가 교신저자로 참여한 이번 연구는 데이터마이닝 최고권위 국제학술대회인 ‘국제 데이터 마이닝 학회 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2024)’에서 올 8월 발표할 예정이다. (논문명: Large Language Models meet Collaborative Filtering: An Efficient All-round LLM-based Recommender System).
한편 이번 연구는 네이버 및 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행됐다. (NRF-2022M3J6A1063021, RS-2024-00335098)
산업및시스템공학과 김현정 교수 연구팀, 2023 Winter Simulation Conference, Simulation Challenge 대회 우승
세계 최대 시뮬레이션 학회인 Winter Simulation Conference(2023년 12월 10일 – 13일, San Antonio, USA)에서 주최한 Simulation Challenge 대회에서 우리 대학 산업및시스템공학과 김현정 교수 연구팀이 우승을 차지하였다. 올해 대회는 반도체 생산 기업인 Micron Technology의 후원으로 개최되었으며 시뮬레이션 모델링 및 분석 도구를 사용하여 반도체 제조의 병목 문제를 해결하고 생산성을 향상시키기 위한 스케줄링 알고리즘을 개발하는 것이 목표로 세워졌다.
대회는 2023년 8월부터 11월까지 총 4라운드에 걸쳐 진행되었으며 각 라운드에서는 시나리오에 기반한 반도체 생산 재고(WIP) 최소화와 공정 간 시간 제약 충족을 목표로 하는 시뮬레이션 기반의 스케줄링을 수행하였다. 특히, 마지막 4라운드에서는 시나리오를 사전에 알지 못하는 조건에서도 우수한 스케줄을 도출하는 방법론을 개발하는 것이 도전 과제였다. 대회에는 전 세계 21개 팀이 참가하였고, 김현정 교수 연구팀은 1, 3, 4라운드에서 1등을 차지하여 최종적으로 대회에서 우승을 차지하였다.
김현정 교수 연구팀은 변화하는 제조 상황에 맞게 반도체 웨이퍼의 공정 흐름을 적절히 제어할 수 있는 시뮬레이션을 활용한 Ensemble-based Adaptive Search 방법을 개발하였다. 이를 통해 김현정 교수 연구팀은 다른 팀에 비해 압도적으로 재고를 감소시키면서 동시에 시간 제약을 효과적으로 충족시키는 결과를 도출할 수 있었다. 김현정 교수 연구팀은 반도체 및 다양한 제조 시스템의 스케줄링 연구를 수행하고 있으며 기존의 연구 결과를 바탕으로 새로운 방법을 탐구하여 우수한 성과를 이뤄냈다. 김현정 교수 연구팀은 이제훈 박사과정, 김두연 박사과정, 안정선 박사과정, 신우진 박사과정으로 구성되었다.
약물 부작용 및 용해도 예측 그래프 신경망 기술 개발
최근 화학, 생명과학 등 다양한 기초과학 분야의 문제를 해결하기 위해 그래프 신경망 (Graph Neural Network) 기술이 널리 활용되고 있다. 그 중에서도 특히 두 물질의 상호작용에 의해 발생하는 물리적 성질을 예측하는 것은 다양한 화학, 소재 및 의학 분야에서 각광을 받고 있다. 예를 들어, 어떠한 약물 (Drug)이 용매 (Solvent)에 얼마나 잘 용해되는지 정확히 예측하고, 동시에 여러 가지 약물을 투여하는 다중약물요법 (Polypharmacy)의 부작용을 예측하는 것이 신약 개발 등에 매우 중요하다.
우리 대학 산업및시스템공학과 박찬영 교수 연구팀이 한국화학연구원(원장 이영국)과 공동연구를 통해 물질 내의 중요한 하부 구조(Substructure)를 탐지하여 두 물질의 상호작용에 의해 발생하는 물리적 성질 예측의 높은 정확도를 달성할 수 있는 새로운 그래프 신경망 기법을 개발했다고 18일 밝혔다.
기존 연구에서는 두 분자 쌍이 있을 때, 각 분자내에 존재하는 원자들 사이의 상호 작용만을 고려해 그래프 신경망 모델을 학습하였다. 예를 들어 특정 발색체의 물(H2O)에 대한 용해도를 예측하고자 할 때, 발색체 내의 각 원자들에 대해 물 분자의 원자들 (즉, H, O)이 갖는 영향력을 고려하는 것이다. 연구팀이 이에 반해, 연구팀이 착안한 점은 분자 구조의 화학적 특성을 결정하는 데 있어서 원자뿐만 아니라 작용기(Functional group)와 같은 분자내 하부 구조들이 중요한 역할을 한다는 점이었다. 예를 들어, 알코올이나 예를 들어, 알코올이나 포도당과 같이 하이드록실기 (Hydroxyl group)를 포함하는 분자들은 일반적으로 물에 대한 용해도가 높은 것으로 알려져 있다. 즉, 하이드록실기라는 작용기가 물에 대한 용해도를 결정하는데 중요한 역할을 한다는 것이다.
연구팀은 분자의 특성을 결정하는데 큰 영향을 끼치는 하부 구조를 추론하는 기술을 분자내의 중요한 정보를 최대한 압축하여 보존하는 ‘정보 병목 이론’과, 분자 내의 어떤 하부 구조가 분자의 고유한 특성을 결정 짓는데 큰 역할을 했는지 대한 인과 관계를 추론하는 ‘인과 추론 모형’을 활용하여 개발했다. 이를 통해 분자의 고유한 특성에 가장 큰 영향을 미치는 하부 구조를 찾아내었다. 또한 분자 간 관계를 추론하는 문제에서는 상대방 분자에 따라 대상 분자의 중요한 하부 구조가 달라질 수 있다는 점을 착안하여 물질 간 관계를 예측하는 모델을 제안했다.
이번 새로운 그래프 신경망 기법을 의학에 적용하여 정보 병목 현상을 기반으로 한 연구는 기존 연구에 비해 약물 용해도 예측에서 11%의 성능 향상, 다중약물요법 부작용 예측에서 4%의 정확도 향상을 이뤄냈다. 또한, 인과 추론 모형을 기반으로 한 연구는 약물 용해도 예측에서 17%의 성능 향상, 약물 부작용 예측에서 2%의 정확도 향상을 이뤄냈다.
박찬영 교수팀은 정보 병목 이론을 기반으로 중요한 하부 구조를 탐지해 분자 구조 관계의 높은 예측 정확도를 달성할 수 있는 그래프 신경망 모델을 개발해 기계학습 분야 최고권위 국제학술대회 ‘국제 기계 학습 학회 International Conference on Machine Learning (ICML 2023)’에서 올 7월 발표할 예정이다. (논문명: Conditional Graph Information Bottleneck for Molecular Relational Learning). 또한 인과 추론 모형을 기반으로 중요한 하부 구조를 탐지해 분포 변화에도 모델의 성능이 강건하게 유지되는 그래프 신경망 모델을 개발해 데이터마이닝 최고권위 국제학술 대회 ‘국제 데이터 마이닝 학회 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2023)’에서 올 8월에 발표할 예정이다. (논문명: Shift-Robust Molecular Relational Learning with Causal Substructure). 두 연구 모두 KAIST 산업및시스템공학과 대학원에 재학 중인 이남경 박사과정 학생이 제1 저자, 화학연구원의 나경석 연구원이 공동 저자, 우리 대학 산업및시스템공학과의 박찬영 교수가 교신저자로 참여했다.
두 연구의 제1 저자인 이남경 박사과정은 “제안한 기술은 분자의 성질을 결정하는 데 있어 큰 영향을 미치는 하부 구조가 존재한다는 화학적 지식에 기반해 그래프 신경망을 학습할 수 있는 새로운 방법”이라면서 “상대편 분자를 고려해 대상 분자의 중요한 구조를 찾는 방법론은 이미지-텍스트 멀티 모달 학습 방법에서도 적용될 수 있어, 심층 학습 전반적인 성능 개선에 기여할 수 있다”고 밝혔다.
연구팀을 지도한 박찬영 교수도 “제안한 기술은 화학과 생명과학을 포함한 다양한 분야에서 새로운 물질을 발견하는데 널리 사용될 것으로 기대하며, 특히 환경 친화적인 소재 개발, 질병 치료를 위한 신약 발굴 등에 있어서 본 기술의 가치가 더욱 부각될 것으로 보인다”라고 밝혔다.
한편 이번 연구는 정보통신기획평가원의 지원을 받은 사람중심 인공지능 핵심원천기술개발 사업과 한국화학연구원 기본사업 (KK2351-10)의 지원을 받아 수행됐다.
(주)제이오텍, 실험실 안전 장비 1억 2000만 원 상당 기부
우리 대학 동문 기업인 ㈜제이오텍(대표 신현주, 김기성)이 안전한 연구 환경 조성을 위해 연구실 안전 물품 장비를 기부했다.
제이오텍은 이화학 실험 기기 및 연구실 안전물품 제조 회사로 인화성 위험물 보관함 18대와 생물안전작업대 8대 등 총 1억 2000만 원 상당의 물품을 우리 대학에 전달했다.
인화성 위험물 보관함은 인화성 및 가연성 위험 물질의 안전한 보관과 화재 발생 시 위험을 최소화할 수 있는 안전 시약장이다. 국내에서 유일하게 유럽규격 EN 14470-1 승인을 취득했다.
생물안전작업대는 병원체 등 감염성 물질을 다루는 실험실에서 생물학적으로 오염돼 위험 가능성이 있는 공기가 캐비닛 밖으로 누출되는 것을 차단해 사용자와 시료, 환경을 동시에 보호하는 장비다. 이 장비 역시 엄격한 유럽기준인 EN12469인증을 획득했다.
KAIST는 기증받은 장비를 화학과, 신소재공학과, 바이오및뇌공학과, 생명과학과 등 유해 화학물질을 취급하거나 생물체를 취급하는 연구실에 설치해 연구 환경 개선에 활용할 예정이다.
김기성(산업및시스템공학과 석사08, 박사12 졸업) 대표이사는 “국가의 소중한 인재인 KAIST 학생들이 좀 더 안전하고 쾌적한 환경에서 연구와 실험을 하기를 바라며 기부하게 되었다”라며 “KAIST 재학 당시에 받았던 혜택에 감사하는 마음을 이번 기부로 돌려줄 수 있게 되어 기쁘다”라고 소감을 전했다.
제이오텍의 안전물품 기부 약정식 행사는 2023년 4월 11일 KAIST 본관 제2회의실에서 제이오텍 김기성 대표이사, 유제빈 이사, 김삼일 팀장 등 기부 기업 관계자를 비롯해 이광형 총장, 한재흥 발전재단 상임이사, 서용석 시설부장, 윤여갑 안전팀장 등 KAIST 보직자들이 참석한 가운데 개최됐다.
레이블 없이 훈련 가능한 그래프 신경망 모델 기술 개발
최근 다양한 분야 (소셜 네트워크 분석, 추천시스템 등)에서 그래프 데이터 (그림 1) 의 중요성이 대두되고 있으며, 이에 따라 그래프 신경망(Graph Neural Network) 기술을 활용한 서비스가 급속히 증가하고 있다. 서비스 구축을 위해서는 심층 학습 모델을 훈련해야 하며, 이를 위해서는 충분한 훈련 데이터를 준비해야 한다. 특히 훈련 데이터에 정답지를 만드는 레이블링(labeling) 과정이 필요한데 (예를 들어, 소셜 네트워크의 특정 사용자에 `20대'라는 레이블을 부여하는 행위), 이 과정은 일반적으로 수작업으로 진행되므로 노동력과 시간이 소요된다. 따라서 그래프 신경망 모델 훈련 시 데이터가 충분하지 않은 상황을 효과적으로 타개하는 방법의 필요성이 대두되고 있다.
우리 대학 산업및시스템공학과 박찬영 교수 연구팀이 데이터의 레이블이 없는 상황에서도 높은 예측 정확도를 달성할 수 있는 새로운 그래프 신경망 모델 훈련 기술을 개발했다고 25일 밝혔다.
정점의 레이블이 없는 상황에서 그래프 신경망 모델의 훈련은 데이터 증강을 통해 생성된 정점들의 공통된 특성을 학습하는 과정으로 볼 수 있다. 하지만 이러한 정점의 공통된 특성을 학습하는 과정에서, 기존 훈련 방법은 표상 공간에서 자신을 제외한 다른 정점들과의 유사도가 작아지도록 훈련을 한다. 하지만 그래프 데이터가 정점들 사이의 관계를 나타내는 데이터 구조라는 점을 고려했을 때, 이런 일차원적인 방법론은 정점 간의 관계를 정확히 반영하지 못하게 된다.
박 교수팀이 개발한 기술은 그래프 신경망 모델에서 정점들 사이의 관계를 보존해 정점의 레이블이 없는 상황에서 모델을 훈련시켜 높은 예측 정확도를 달성할 수 있게 해준다.
KAIST 산업및시스템공학과 이남경 석사과정이 제1 저자, 현동민 박사, 이준석 석사과정 학생이 제2, 제3 저자로 참여한 이번 연구는 최고권위 국제학술대회 `정보지식관리 콘퍼런스(CIKM) 2022'에서 올 10월 발표될 예정이다. (논문명: Relational Self-Supervised Learning on Graphs)
기존 연구에서는 정점의 레이블이 없는 상황에서 정점에 대한 표상을 훈련하기 위해 표상 공간 내에서 자기 자신을 제외한 다른 정점들과의 유사도가 작아지도록 훈련을 한다. 예를 들어서, 소셜 네트워크에 A, B, C 라는 사용자가 존재할 때, A, B와 C가 표상 공간에서 서로 간의 유사도가 모두 작아지도록 모델을 훈련하는 것이다. 이때 박 교수팀이 착안한 점은 그래프 데이터가 정점 간의 관계를 나타내는 데이터이므로 정점 간의 관계를 포착하도록 정점의 표상을 훈련할 필요가 있다는 점이었다.
즉, A, B와 C 서로 간의 유사도가 모두 작아지게 하는 훈련 메커니즘과는 달리, 실제 그래프상에서는 이들이 연관이 있을 수 있다는 점이다. 따라서 A, B와 C 사이의 관계를 긍정/부정의 이진 분류를 통해 표상 공간에서 유사도가 작아지도록 훈련을 하는 것이 아닌, 이들의 관계를 정의해 그 관계를 보존하도록 학습하는 모델을 연구팀은 개발했다(그림 2). 연구팀은 정점 간의 관계를 기반으로 정점의 표상을 훈련함으로써, 기존 연구가 갖는 엄격한 규제들을 완화해 그래프 데이터를 더 유연하게 모델링했다.
연구팀은 이 학습 방법론을 `관계 보존 학습'이라고 명명했으며, 그래프 데이터 분석의 주요 문제(정점 분류, 간선 예측)에 적용했다(그림 3). 그 결과 최신 연구 방법론과 비교했을 때, 정점 분류 문제에서 최대 3% 예측 정확도를 향상했고, 간선 예측 문제에서 6%의 성능 향상, 다중 연결 네트워크 (Multiplex network)의 정점 분류 문제에서 3%의 성능 향상을 보였다.
제1 저자인 이남경 석사과정은 "이번 기술은 데이터의 레이블이 부재한 상황에서도 그래프 신경망을 학습할 수 있는 새로운 방법ˮ 이라면서 "그래프 기반의 데이터뿐만이 아닌 이미지 텍스트 음성 데이터 등에 폭넓게 적용될 수 있어, 심층 학습 전반적인 성능 개선에 기여할 수 있다ˮ고 밝혔다.
연구팀을 지도한 박찬영 교수도 "이번 기술은 그래프 데이터상에 레이블이 부재한 상황에서 표상 학습 모델을 훈련하는 기존 모델들의 단점들을 `관계 보존`이라는 개념을 통해 보완해 새로운 학습 패러다임을 제시하여 학계에 큰 파급효과를 낼 수 있다ˮ라고 말했다.
한편, 이번 연구는 과학기술정보통신부 재원으로 정보통신기획평가원의 지원을 받아 사람중심인공지능핵심원천기술개발 과제로 개발한 연구성과 결과물(No. 2022-0-00157, 강건하고 공정하며 확장 가능한 데이터 중심의 연속 학습)이다.