본문 바로가기 대메뉴 바로가기

KAIST

뉴스

홈페이지 통합검색

-
ENGLISH

%EA%B3%B5%EA%B3%BC

산업디자인학과 '루시' 팀, 'AI 크리에이티브 챌린지' 대상 수상 우리 대학 산업디자인학과 여남규, 오세준, 주하진, 한승희 학생으로 구성된 '루시' 팀이 지난 7월 11일~12일 대전 디자인진흥원 'AI 크리에이티브 챌린지'에서 대상을 수상했다. 산업통상자원부의 지역디자인산업진흥사업 일환으로 진행된 이번 행사에는 대전 지역 6개 대학(목원대·배재대·충남대·한남대·한밭대·KAIST)에서 총 17개 팀 60여 명이 참가하여, ‘바이오헬스’, '첨단반도체', ‘지능형 모빌리티’ 등 지역 특화 기술을 접목한 디자인 솔루션을 완성했다. 참가자들은 아이디어 구상에서 프로토타입 제작, 최종 발표까지 전 과정을 직접 수행하며 실전 경험을 쌓았으며, 삼성전자 고성찬 디자이너· 우리 대학 산업디자인학과 박현준 교수·김은영 홍익대학교 교수가 실무 관점의 조언과 피드백을, 송봉규 BKID 대표·김기현 한국예술종합학교 교수 등 학계·산업계 전문가들이 심사위원으로 참여해 디자인 완성도와 사업화 가능성을 심층 평가했다. '루시' 팀은 AI 융합 바이오헬스 및 모빌리티 기술을 적용해 화재 시 유독성 연기로 인한 질식 방지를 위해 유리를 흡착 ·절단하는 '인명 구조 드론' 콘셉트를 제안해 심사위원들로부터 기술 이해도 및 사용자 경험 설계 역량을 높이 평가받았다. 이번 챌린지에서 수상한 팀에게는 상장과 함께 국제 디자인 어워드 출품 지원, 지식재산권 출원 및 사업화 연계 등의 후속 지원이 제공될 예정이다.
2025.07.16 조회수 235
6배 정밀한 3D 뇌 모사 플랫폼 구현 성공 기존의 3차원(3D) 신경세포 배양 기술은 뇌의 복잡한 다층 구조를 정밀하게 구현하기 어렵고, 구조와 기능을 동시에 분석할 수 있는 플랫폼이 부족해 뇌 연구에 제약이 있었다. 우리 연구진이 뇌처럼 층을 이루는 신경세포 구조를 3D 프린팅 기술로 구현하고, 그 안에서 신경세포의 활동까지 정밀하게 측정할 수 있는 통합 플랫폼 개발에 성공했다. 우리 대학 바이오및뇌공학과 박제균·남윤기 교수 공동연구팀이 뇌 조직과 유사한 기계적 특성을 가진 저점도 천연 하이드로겔을 이용해 고해상도 3D 다층 신경세포 네트워크를 제작하고, 구조적·기능적 연결성을 동시에 분석할 수 있는 통합 플랫폼을 개발했다고 16일 밝혔다. 기존 바이오프린팅 기술은 구조적 안정성을 위해 고점도 바이오잉크를 사용하지만, 이는 신경세포의 증식과 신경돌기 성장을 제한하고, 반대로 신경세포 친화적인 저점도 하이드로겔은 정밀한 패턴 형성이 어려워 구조적 안정성과 생물학적 기능 사이의 근본적인 상충 관계가 있었다. 연구팀은 묽은 젤로도 정밀한 뇌 구조를 만들고, 층마다 정확히 정렬하며, 신경세포의 활동까지 동시에 관찰할 수 있는 3대 핵심기술을 결합해 정교하고 안정적인 뇌 모사 플랫폼을 완성했다. 3대 핵심기술은 ▲ 묽은 젤(하이드로겔)이 흐르지 않도록 스테인리스 철망(마이크로메시) 위에 딱 붙게 만들어 주는‘모세관 고정 효과’ 기술로 기존보다 6배 더 정밀하게 (해상도 500μm 이하) 뇌 구조를 재현했고 ▲ 프린팅된 층들이 삐뚤어지지 않고 정확히 쌓이도록 맞춰주는 원통형 설계인 ‘3D 프린팅 정렬기’로 다층 구조체의 정밀한 조립과 미세 전극 칩과의 안정적 결합을 보장하였고 ▲ 아래쪽은 전기신호를 측정하고, 위쪽은 빛(칼슘 이미징)으로 동시에 세포 활동을 관찰하는 ‘이중 모드 분석 시스템’기술로 층간 연결이 실제로 작동하는지를 여러 방식으로 동시에 확인할 수 있다. 연구팀은 뇌와 유사한 탄성 특성을 지닌 피브린 하이드로겔을 이용해 3층으로 구성된 미니 뇌 구조를 3D 프린팅으로 구현하고, 그 안에서 실제 신경세포들이 신호를 주고받는 과정을 실험을 통해 입증했다. 위층과 아래층에는 대뇌 신경세포를 배치하고, 가운데층은 비어 있지만, 신경세포들이 가운데를 뚫고 지나가며 연결되도록 설계했다. 아래층에는 미세 센서(전극칩)를 달아 전기신호를 측정하고, 위층은 빛(칼슘 이미징)으로 세포 활동을 관찰한 결과, 전기 자극을 줬을 때 위아래층 신경세포가 동시에 반응했고, 신경 연결을 차단하는 약물(시냅스 차단제)을 넣었더니 반응이 줄어들어 신경세포들이 진짜로 연결돼서 신호를 주고받고 있다는 것을 입증했다. 바이오및뇌공학과 박제균 교수는 “이번 연구는 뇌 조직의 복잡한 다층 구조와 기능을 동시에 재현할 수 있는 통합 플랫폼의 공동개발 성과”임을 강조하며, “기존 기술로 14일 이상은 신호 측정이 불가했던 것에 비해 27일 이상 안정적인 미세 전극 칩 인터페이스를 유지하면서 구조-기능 관계를 실시간으로 분석할 수 있어, 향후 신경질환 모델링, 뇌 기능 연구, 신경독성 평가 및 신경 보호 약물 스크리닝 등 다양한 뇌 연구 분야에 활용할 수 있을 것”이라고 말했다. 바이오및뇌공학과 김수지 박사와 윤동조 박사가 공동 제1 저자로 참여한 이번 연구 결과는 국제 학술지 ‘바이오센서스 앤 바이오일렉트로닉스(Biosensors and Bioelectronics)’에 2025년 6월 11일 자로 온라인판에 게재됐다. ※논문명: Hybrid biofabrication of multilayered 3D neuronal networks with structural and functional interlayer connectivity ※DOI: https://doi.org/10.1016/j.bios.2025.117688 한편, 이번 연구는 한국연구재단 글로벌 기초연구실지원사업, 중견연구 및 바이오·의료기술개발사업의 지원을 받아 수행됐다.
2025.07.16 조회수 310
로봇도 사람처럼 위험할때만 즉각 반응한다 인공지능과 로봇 기술의 동반 발전 속에서, 로봇이 사람처럼 효율적으로 환경을 인식하고 반응하는 기술 확보가 중요한 과제로 떠오르고 있다. 이에 한국 연구진이 별도의 복잡한 소프트웨어나 회로 없이도 생명체의 감각 신경계를 모사한 인공 감각 신경계를 새롭게 구현해 주목받고 있다. 이 기술은 에너지 소모를 최소화하면서 외부 자극에 지능적으로 반응할 수 있어, 초소형 로봇이나 로봇 의수 등 의료 및 특수 환경에서의 활용이 기대된다. 우리 대학 전기및전자공학부 최신현 석좌교수, 충남대학교 반도체융합학과 이종원 교수 공동연구팀이 생명체의 감각 신경계 기능을 모사하는 차세대 뉴로모픽 반도체 기반 인공 감각 신경계를 개발하고, 이를 통해 외부 자극에 효율적으로 대응하는 신개념 로봇 시스템을 증명했다고 15일 밝혔다. 사람을 포함한 동물은 안전하거나 익숙한 자극은 무시하고, 중요한 자극에는 선별적으로 민감하게 반응함으로써, 에너지 낭비를 방지하면서도 중요한 자극에 집중해 민첩하게 외부 변화에 대응할 수 있다. 예를 들면, 여름철 에어컨 소리나 옷이 피부에 닿는 감촉은 곧 익숙해져 신경 쓰지 않게 되지만, 누군가 이름을 부르거나 날카로운 물체가 피부에 닿으면 재빠르게 집중하고 대응한다. 이는 감각 신경계에서의 ‘습관화’ 그리고 ‘민감화’기능에 의해서 조절됨을 보여주며, 사람처럼 효율적으로 외부 환경에 대응하는 로봇 구현을 위해, 이러한 생명체의 감각 신경계 기능을 로봇에 적용하려는 시도가 꾸준히 진행돼왔다. 그러나, 습관화나 민감화와 같은 복잡한 신경 특성을 로봇에 구현하기 위해선 별도 소프트웨어가 필요하거나, 복잡한 회로가 필요해 소형화와 에너지 효율 측면에서의 어려움이 있었다. 특히 뉴로모픽 반도체인 멤리스터(memristor)1 소자를 활용하는 시도도 있었지만, 기존 멤리스터는 단순한 전도도 변화만 가능해 신경계의 복잡한 특성을 모사하는 데 한계가 있었다. 1멤리스터: 메모리(memory)와 저항(resistor)의 합성어로 두 단자 사이로 과거에 흐른 전하량과 방향에 따라 저항값이 결정되는 차세대 전기소자 이러한 한계를 극복하기 위해 연구팀은 하나의 멤리스터 소자 안에 서로 반대 방향으로 전도도를 변화시키는 층을 형성해, 실제 감각 신경계에서처럼 습관화와 민감화 등의 기능을 모사할 수 있는 새로운 멤리스터를 개발했다. 이 소자는 자극이 반복되면 점차 반응이 줄어들다가, 위험 신호가 감지되면 다시 민감하게 반응하는 등, 실제 신경계의 복잡한 시냅스 반응 패턴을 사실적으로 재현할 수 있다. 연구팀은 이 멤리스터를 이용해 촉각과 고통을 인식하는 멤리스터 기반 인공 감각 신경계를 제작하고, 이를 실제 로봇 손에 적용해 그 효율성을 실험했다. 반복적으로 안전한 촉각 자극을 가하자, 처음에는 낯선 촉각 자극에 민감하게 반응하던 로봇 손이 점차 자극을 무시하는 습관화 특성을 보였고, 이후 전기 충격과 함께 자극을 가했을 때는 이를 위험 신호로 인식해 다시 민감하게 반응하는 민감화 특성도 확인됐다. 이를 통해, 별도의 복잡한 소프트웨어나 프로세서 없이도 로봇이 사람처럼 효율적으로 자극에 대응할 수 있음을 실험적으로 입증하며, 에너지 측면에서 효율적인 신경계 모사 로봇(neuro-inspired robot)의 개발 가능성을 검증했다. 박시온 연구원은 “사람의 감각 신경계를 차세대 반도체로 모사해, 더 똑똑하고 에너지 측면에서 효율적으로 외부 환경에 대응하는 신개념 로봇 구현의 가능성을 열었다”라며, “앞으로 초소형 로봇, 군용 로봇, 로봇 의수 같은 의료용 로봇 등 차세대 반도체와 로보틱스의 여러 융합 분야에서 활용될 것으로 기대된다”고 밝혔다. 이번 연구는 박시온 석박통합과정 연구원이 제 1저자로 국제 학술지 `네이처 커뮤니케이션즈 (Nature Communications)'에 지난 7월 1일 자로 온라인 게재됐다. ※ 논문 제목: Experimental demonstration of third-order memristor-based artificial sensory nervous system for neuro-inspired robotics ※ DOI: https://doi.org/10.1038/s41467-025-60818-x 이번 연구는 한국연구재단의 차세대지능형반도체기술개발사업, 중견연구사업, PIM인공지능반도체핵심기술개발사업, 우수신진연구사업, 그리고 나노종합기술원의 나노메디컬 디바이스 사업의 지원을 받아 수행됐다.
2025.07.15 조회수 400
고온 실험 없이 AI로 '최적 합금' 예측 시대 연다 자동차와 기계 부품 등에 사용되는 강철 합금은 일반적으로 고온에서 녹이는(융해) 공정을 거쳐 제조된다. 이때 성분이 변하지 않고 그대로 녹는 현상을 ‘합치 융해(congruent melting)’라고 한다. 우리 연구진은 이처럼 고온 실험을 통해서만 가능했던 합금의 융해 특성을 인공지능(AI)으로 해결했다. 이번 연구는 고질적인 난제였던 합금이 녹을 때 서로 얼마나 잘 섞이는지를 미리 예측함으로써, 미래 합금 개발의 방향성을 제시한다는 점에서 주목받고 있다. 우리 대학 신소재공학과 홍승범 교수 연구팀이 미국 노스웨스턴대 크리스 울버튼(Chris Wolverton) 교수팀과 국제 공동연구를 통해, 밀도범함수이론(DFT)* 기반의 형성에너지(합금이 얼마나 안정적인지를 나타내는 값) 데이터를 활용해 합금이 녹을 때 성분이 유지되는지를 예측하는 고정확도 머신러닝 모델을 개발했다고 14일 밝혔다. *밀도범함수이론(Density Functional Theory, DFT): 전자 밀도(electron density)를 기반으로 시스템의 전체 에너지를 계산하는 방법 연구팀은 밀도범함수이론을 통해 계산한 형성에너지와, 기존의 실험적 융해 반응 데이터를 머신러닝에 결합해 4,536개의 이원계 화합물에 대한 융해 반응 유형을 학습한 후, 그 예측 모델을 구성했다. 다양한 머신러닝 알고리즘 중 특히 ‘XGBoost’ 기반 분류 모델이 합금이 잘 섞이는지 여부에 대해 가장 높은 정확도를 보였으며, 약 82.5%의 예측 정확도를 달성했다. 연구팀은 또한 샤플리(Shapley) 기법*을 활용해 모델의 주요 특징(feature)들을 분석했으며, 이 중에서도 기울기 변화가 크다는 것은 그 조성에서 에너지적으로 매우 유리한(=안정한) 상태가 형성된다는 뜻으로 ‘형성에너지 곡선의 기울기 변화(convex hull sharpness)’가 가장 중요한 인자로 도출됐다. *샤플리기법: AI가 어떤 이유로 그렇게 판단했는지를 알려주는 설명 도구 이번 연구의 가장 큰 의의는 고온 실험 없이도 소재의 융해 반응 경향성을 예측할 수 있다는 점이다. 이는 특히 고엔트로피 합금이나 초내열 합금 등 실험이 어려운 소재 군에서 매우 유용하며, 향후 복잡한 다성분계 합금 설계에도 확장될 수 있다. 또한, AI 모델이 도출한 주요 물리량은 합금이 잘 변하고, 안정적인지 등에 대한 실제 실험 결과와 높은 일치도를 보였고, 향후 다양한 금속재료 개발 및 구조 안정성 예측 등 널리 활용될 수 있을 것으로 기대된다. 홍승범 교수는 “이번 연구는 계산과 실험 데이터, 그리고 머신러닝의 융합을 통해 기존의 경험적 합금 설계 방식에서 벗어나 데이터 기반의 예측적 소재 개발이 가능하다는 가능성을 보여준 사례”라며 “향후 생성형 모델, 강화학습 등의 최신 AI 기술을 접목하면 완전히 새로운 합금을 자동으로 설계하는 시대가 열릴 것”이라고 말했다. 신소재공학과 최영우 박사과정 연구원이 제1 저자로 참여한 이번 연구는 미국물리협회(American Institute of Physics, AIP)에서 발간하는 머신러닝 분야의 권위 있는 학술지인 ‘APL 머신러닝(Machine Learning)’ 5월호에 게재 및 ‘특집 논문(Featured article)’로 선정됐다. ※ 논문 제목: Machine learning-based melting congruency prediction of binary compounds using density functional theory-calculated formation energy ※ DOI: https://doi.org/10.1063/5.0247514 한편, 이번 연구는 과학기술정보통신부와 한국연구재단의 지원으로 수행됐다.
2025.07.14 조회수 444
미생물 안전균주로 고효율 루테인 대량 생산 가능 노안 및 백내장 예방에 효과가 있는 대표적인 눈 건강 기능성 성분 ‘루테인’을 우리 연구진이 2022년 전자 채널링 기술을 적용한 대장균을 통해 세계 최초로 생산하는 데 성공한 바 있다. 이후 연구진은 기존 기술이 가진 대장균의 내독소(endotoxin) 문제를 해결하고, 동시에 대량 생산이 가능한 미생물 대사공학 기반의 친환경적이고 고효율적인 루테인 생산 플랫폼을 새롭게 개발하여 실용성과 안전성 모두를 획기적으로 향상시키는데 성공했다. 향후, (주)실리코바이오(이상엽 특훈교수 교원창업기업)을 통해 기술사업화를 추진할 예정이다. 우리 대학 생명화학공학과 이상엽 특훈교수 연구팀이 `루테인을 대량 생산하는 미생물 균주 개발'에 성공했다고 13일 밝혔다. 기존의 미생물 대사공학을 이용한 루테인 생산 연구에서는 부산물 생성이 많고 루테인 축적량이 제한되는 한계가 있었다. 이는 루테인 합성 대사경로에서 특정 병목 단계가 존재하여 대사 흐름이 원활하게 진행되지 못했기 때문으로 분석되었다. 이번 연구에서는 루테인 생산 경로에서 주요 병목으로 작용하는 대사반응을 개선하기 위해 전자 채널링(electron channeling) 전략*을 도입하였다. *전자 채널링: 생체 내 또는 인공 생합성 시스템에서 특정 효소 반응을 보다 빠르고 효율적으로 일어나게 하기 위해, 전자가 효율적으로 이동하도록 경로를 제어하는 기술 루테인을 만드는데 필요한 효소들을 최적화된 단백질 구조(스캐폴드) 시스템에 가깝게 배열함으로써 효소 주변 재료(기질)과 전자의 농도를 높여 루테인 합성 대사 흐름을 효과적으로 증대시켰다. 또한 연구팀은 설탕처럼 흔한 포도당을 활용하여 고효율로 루테인을 생산할 수 있는 미생물 플랫폼을 구축하였으며, 이는 바이오매스의 주 원료인 포도당으로부터 친환경적인 바이오 기반 루테인 생산 가능성을 제시하는 중요한 성과로 평가된다. 결론적으로 연구팀은 시스템 대사공학 기술과 단백질 간 입체적 거리 제어를 포함한 효소 재배열 전략을 병행하여 해당 균주를 이용해 54시간 만에 1.78 g/L의 루테인을 생산하는 데 성공했다. 이는 시간당 32.88 mg/L의 생산성에 해당하며, 기존 식물이나 미세조류에서 루테인을 추출하는 기존 방식보다 훨씬 빠르고 효율적인 생산방법으로 산업적으로 큰 의미를 가진다. 이번 연구에서 산업적 활용도가 높고 안전균주 (Generally Recognized As Safe; GRAS)로 분류되는 ‘코리네박테리움 글루타미쿰(Corynebacterium glutamicum)’을 새로운 생산 호스트로 활용했다. 이 균주를 기반으로 루테인 생합성 경로를 최적화하고, 전자전달 병목을 해결하기 위해 막결합형 P450 효소의 개량, 그리고 전자 채널링 스캐폴드 시스템을 도입하여 생산성을 획기적으로 향상시켰다. 연구를 주도한 은현민 박사과정생은 “이번 연구는 미생물 기반 루테인 생산의 병목을 해소하고 산업적으로 경쟁력 있는 친환경 공정을 확립한 사례”라며, “향후 루테인을 포함한 다양한 천연물 생산 기술의 실용화를 앞당길 수 있을 것으로 기대된다”고 말했다. 이상엽 특훈교수는 “미생물을 활용한 대사공학 기술은 기존의 식물 기반 및 화학합성 방식을 뛰어넘는 차세대 전략으로 부상하고 있다”며, “앞으로도 고부가가치 천연물의 효율적 생산을 위한 연구를 지속하겠다”고 밝혔다. 이번 연구 결과는 생명화학공학과 은현민 박사과정생과 신디 박사가 공동 제 1저자로 국제 학술지 `네이처 신시시스(Nature Synthesis)'에 7월 4일자로 게재되었다. ※ 논문명: Gram-per-litre scale production of lutein by engineered Corynebacterium ※ 저자: 이상엽(KAIST 교신저자), 은현민 (KAIST 제1저자), Cindy Pricilia Surya Prabowo (KAIST 공동 제1저자) 포함 총 3명 ※ DOI: https://doi.org/10.1038/s44160-025-00826-3 이번 연구는 이상엽 특훈교수 연구팀에 의해 과학기술정보통신부가 지원하는 기후환경연구개발사업의 ‘바이오화학산업 선도를 위한 차세대 바이오리파이너리 원천기술 개발 과제’의 지원을 받아 수행됐다.
2025.07.14 조회수 345
최정우 교수팀, 세계 최고 음향 AI 챌린지 세계 1위 쾌거 ‘음향 분리 및 분류 기술’은 드론, 공장 배관, 국경 감시 시스템 등에서 이상 음향을 조기에 탐지하거나, AR/VR 콘텐츠 제작 시 공간 음향(Spatial Audio)을 음원별로 분리해 편집할 수 있도록 하는 차세대 인공지능(AI) 핵심 기술이다. 우리 대학 전기및전자공학부 최정우 교수 연구팀이 세계 최고 권위의 음향 탐지 및 분석 대회인 ‘IEEE DCASE 챌린지 2025’에서 ‘공간 의미 기반 음향 장면 분할(Spatial Semantic Segmentation of Sound Scenes)’ 분야에서 우승을 차지했다고 11일 밝혔다. 이번 대회에서 연구팀은 전 세계 86개 참가팀과 총 6개 분야에서 경쟁 끝에 최초 참가임에도 세계 1위 성과를 거두었다. KAIST 최정우 교수 연구팀은 이동헌 박사, 권영후 석박통합과정생, 김도환 석사과정생으로 구성되었다. 연구팀이 참가한 ‘공간 의미 기반 음향 장면 분할’의 ‘태스크(Task) 4’분야는 여러 음원이 혼합된 다채널 신호의 공간 정보를 분석해 개별 소리를 분리하고 18종으로의 분류를 수행해야 하는 기술 난이도가 매우 높은 분야이다. 연구팀은 오는 10월, 바르셀로나에서 열리는 DCASE 워크숍에서 기술을 발표할 예정이다. 연구팀의 이동헌 박사는 올해 초 트랜스포머(Transformer)와 맘바(Mamba) 아키텍처를 결합한 세계 최고 성능의 음원 분리 인공지능을 개발했으며, 챌린지 기간 동안 권영후 연구원을 중심으로 1차로 분리된 음원의 파형과 종류를 단서로 해 다시 음원 분리와 분류를 수행하는‘단계적 추론 방식’의 AI 모델을 완성했다. 이는 사람이 복잡한 소리를 들을 때 소리의 종류나 리듬, 방향 등 특정 단서에 기반해 개별 소리를 분리해 듣는 방식을 AI가 모방한 모델이다. 이를 통해, 순위를 결정하는 척도인 AI가 소리를 얼마나 잘 분리하고 분류했는지 평가하는‘음원의 신호대 왜곡비 향상도(CA-SDRi)*’에서 참가팀 중 유일하게 두 자릿수 대의 성능(11 dB)을 보여, 기술적인 우수성을 입증하였다. *음원의 신호대 왜곡비 향상도(CA-SDRi): 기존의 오디오와 비교해 얼마나 더 선명하게(덜 왜곡되게) 원하는 소리를 분리했는지를 dB(데시벨) 단위로 측정하고 숫자가 클수록 더 정확하고 깔끔하게 소리를 분리했다는 뜻임 최정우 교수는 "연구팀은 최근 3년간 세계 최고의 음향 분리 AI 모델을 선보여 왔으며, 그 결과를 공식적으로 인정받는 계기가 되어 기쁘다”면서 “난이도가 대폭 향상되고, 타 학회 일정과 기말고사로 불과 몇 주간만 개발이 가능했음에도 집중력 있는 연구를 통해 1위를 차지한 연구팀 개개인이 자랑스럽다”고 소감을 밝혔다. ‘IEEE DCASE 챌린지 2025’는 온라인으로 진행됐으며, 4월 1일부터 시작해 6월 15일 인공지능 모델 투고를 마감했고 지난 6월 30일 결과가 발표됐다. 각종 음향 관련 탐지 및 분류 기술을 평가하는 IEEE 신호처리학회(Signal Processing Society) 산하 국제대회인 본 챌린지는 2013년 개최된 이래 음향 분야 인공지능 모델의 세계적인 경연의 장으로 자리매김해 왔다. https://dcase.community/challenge2025/task-spatial-semantic-segmentation-of-sound-scenes 한편, 해당 연구는 교육과학기술부의 재원으로 한국연구재단 중견연구자지원사업, STEAM 연구사업 지원 및 방위사업청 및 국방과학연구소 재원으로 미래국방연구센터 지원을 받아 수행됐다.
2025.07.11 조회수 645
강이연 교수, 대형 미디어아트 전시《ENTANGLEMENT》개최 우리 산업디자인학과 강이연 교수가 7월 10일부터 9월 5일까지 서울 신세계백화점 본점 4층에 위치한 더 헤리티지 뮤지엄에서 대형 미디어 아트 설치 작품 을 선보인다. 이번 전시는 현실과 가상, 자연과 인공 등 이분법적 사고를 해체하고 재구성해 온 강이연 교수의 연구를 바탕으로, AI와 디지털 기술의 발전 속에서 인간 존재가 경험하는 진화와 퇴보의 유기적 관계를 몰입형 설치로 구현한 실험적 프로젝트다. 전시의 중심에는 각각 인간과 기계를 상징하는 두 개의 대형 스크린이 배치된다. 관람객은 이 스크린 사이를 이동하며, 이질적으로 보이는 요소들이 생성되고 서로 얽혀 하나의 공동체를 형성하는 과정을 약 6분 분량의 영상을 통해 체험하게 된다. 특히, 영상의 흐름에 따라 실제로 움직이고 멈추는 키네틱 스크린 구조는 이번 전시의 핵심 요소로, 관람객의 시청각적 몰입감을 극대화하고 작품을 다각도로 감상할 수 있는 입체적 경험을 제공한다. 전시 공간은 암실 형태로 구성되어, 상반된 이미지와 개념이 공존하는 환경 속에서 ‘분리될 수 없는 얽힘’이라는 주제를 감각적으로 사유할 수 있는 장을 마련한다. 이번 전시는 실내 공간을 넘어 도심 속 공공 공간으로 확장된다. 전시와 연계하여 신세계백화점 본점 외벽에 위치한 초대형 미디어 월‘신세계스퀘어’에서는 강 교수의 작품 중 일부가 9월 5일까지 상영된다. 이 공간에서 예술가의 작품이 상영되는 것은 처음으로, 공공성과 예술성을 겸비한 도시형 미디어 아트 프로젝트로 주목받고 있다. 신세계스퀘어에 상영되는 영상은 명동이라는 도시적 맥락에 맞춰 확장·재구성된 형태로, 서로 다른 유기체들이 공동체를 형성해 나가는 ‘얽힘’의 과정을 시각적으로 풀어낸다. 강이연 교수는 “는 인간과 비인간, 생명과 비생명, 아날로그와 디지털이라는 대립적 개념이 현실 세계에서 어떻게 얽히고 연결되는지를 탐구하는 시도”라고 밝히며, “기술은 인간과의 관계 속에서 끊임없이 재해석되고 재구성되어야 한다”고 강조했다. 이번 전시는 예술과 과학의 융합을 통한 지식 확장의 장이자, 공공 예술의 새로운 가능성을 제시하는 기획으로 기대를 모은다. *전시 안내 사이트: http://shinsegaetheheritage.co.kr/4fheritage/?lang=ko&gp=&gbn=list&ix=
2025.07.09 조회수 865
항암제 내성 없앤다! 당뇨병 등 난치성 질환 치료도 기대 암 치료의 큰 걸림돌 중 하나는 항암제에 대한 암세포의 내성이다. 기존에는 내성 암세포를 제거할 수 있는 새로운 표적을 찾는 방식이 주를 이뤘지만, 오히려 더 강한 내성을 유도할 수 있다는 한계가 있었다. 이에 우리 연구진이 내성 암세포를 다시 약물에 반응하게 만들 수 있는 핵심 유전자를 자동으로 예측하는 컴퓨터 기반 방법론을 개발했다. 이 기술은 다양한 암 치료뿐 아니라 당뇨병 등 난치성 대사 질환에도 활용될 수 있어 주목된다. 우리 대학 생명화학공학과 김현욱 교수와 김유식 교수 연구팀이 인체 대사를 시뮬레이션할 수 있는 컴퓨터 모델인 대사 네트워크 모델을 활용해, 항암제에 내성을 가진 유방암 세포를 약물에 민감화시킬 수 있는 새로운 약물 표적을 예측하는 컴퓨터 기반 방법론을 개발했다고 7일 밝혔다. 연구진은 암세포의 대사 변형이 약물 내성 형성에 관여하는 주요한 특징으로 주목하고, 항암제 내성 유방암 세포의 대사를 조절해 약물 반응성을 높일 유전자 표적을 예측하는 대사 네트워크 모델 기반 방법론을 개발했다. 연구진은 먼저 독소루비신(doxorubicin)과 파클리탁셀(paclitaxel)에 각각 내성을 지닌 MCF7 유방암 세포주에서 얻은 단백체 데이터를 통합해 세포별 대사 네트워크 모델을 구축했다. 이어 모든 대사 유전자에 대해서 유전자 낙아웃(결실) 시뮬레이션*을 수행하고, 그 결과를 분석했다. *유전자 낙아웃 시뮬레이션: 특정 유전자를 가상으로 제거한 상태에서 생물학적 네트워크의 변화를 계산적으로 예측하는 방법 그 결과, 특정 유전자의 단백질을 억제하면, 항암제에 잘 듣지 않던 내성 암세포가 다시 항암제에 반응하도록 만들 수 있다는 것을 알아냈다. 독소루비신 내성 세포에서는 GOT1 유전자를, 파클리탁셀 내성 세포에서는 GPI 유전자를 선별했으며, 두 약물 공통으로는 SLC1A5 유전자를 표적으로 선별했다. 예측하여 선별한 유전자를 실제로 억제해 본 결과, 내성 암세포가 항암제에 다시 반응하게 됨을 실험적으로 검증했다. 나아가 같은 항암제에 내성을 갖는 다른 종류의 유방암 세포에서도 같은 유전자를 억제했을 때 항암제에 다시 민감해지는 효과가 일관되게 나타나는 것을 확인할 수 있었다. 김유식 교수는 “세포 대사는 감염병, 퇴행성 질환 등 다양한 난치성 질환에서 중요한 역할을 한다”며, “이번에 개발된 대사 조절 스위치 예측 기술은 약물 내성 유방암 치료를 넘어, 치료제가 없는 다양한 대사 질환에도 적용될 수 있는 기반 기술이 될 것”이라고 말했다. 연구를 총괄한 김현욱 교수는 “이번 연구의 가장 큰 의의는 컴퓨터 시뮬레이션만과 최소한의 실험 데이터만으로 내성 암세포를 다시 약물에 반응하게 만들 수 있는 핵심 유전자를 정밀하게 예측할 수 있다는 점”이라며, “이 방법론은 다양한 암종과 대사 관련 난치성 질환의 새로운 치료 표적 발굴에도 폭넓게 활용될 수 있을 것”이라고 강조했다. 우리 대학 생명화학공학과 임진아 박사과정생과 정해덕 박사과정생이 공동 제1 저자로 참여한 이번 연구는 생명과학·물리·공학·사회과학 등 다양한 분야의 최고 수준 연구를 다루는 다학제 국제 학술지인 미국국립과학원회보(PNAS) 6월 25일 자 온라인에 게재됐다. ※ 논문명 : Genome-scale knockout simulation and clustering analysis of drug-resistant breast cancer cells reveal drug sensitization targets ※ 저자 정보 : 임진아(한국과학기술원, 공동 제1 저자), 정해덕(한국과학기술원, 공동 제1 저자), 유한석(서울대학교병원, 교신저자), 김유식(한국과학기술원, 교신저자), 김현욱(한국과학기술원, 교신저자) 포함 총 10명 ※ DOI: https://doi.org/10.1073/pnas.2425384122 이번 연구는 과학기술정보통신부 한국전자통신연구원 및 한국연구재단의 지원을 받아 수행됐다.
2025.07.07 조회수 819
마이크로 OLED로 난치성 뇌질환 치료 '게임 체인저' 기술 제시 광유전학 기술은 빛에 반응하는 광 단백질이 발현된 뉴런에 특정 파장의 빛 자극을 통해 뉴런의 활성을 조절하는 기술로 다양한 뇌질환의 원인을 규명하며 난치성 뇌질환의 새로운 치료 방법을 개발할 가능성을 열고 있다. 이 기술은 인체의 뇌에 삽입하여 자극을 주는 의료 기기인 ‘뉴럴 프로브’를 통해 정확하게 자극하고 무른 뇌 조직의 손상을 최소화해야 한다. 이에 우리 연구진이 마이크로 OLED를 활용해 얇고 유연한 인체 삽입형 의료기기로 구현함으로써 뉴럴 프로브의 새로운 패러다임을 제시했다. 우리 대학 전기및전자공학부 최경철 교수와 이현주 연구팀이 공동 연구를 통해, 유연한 마이크로 OLED가 집적된 광유전학용 뉴럴 프로브 개발에 성공했다고 6일 밝혔다. 광유전학 연구에서 주요 기술은 광원의 빛을 뇌로 전달하는 방식으로 외부 광원으로부터의 깊은 뇌 영역까지 빛을 전달하기 위해 수십 년간 광섬유를 사용해 왔다. 하지만 단일 뉴런을 자극하기 위한 유연 광섬유, 초미세 광원 집적 뉴럴 프로브 등 관련 연구가 이뤄지고 있다. 연구팀은 마이크로 OLED는 높은 공간적 해상도와 유연성을 가져, 매우 작은 영역의 뉴런에서도 정확하게 빛을 조사할 수 있어 세밀한 뇌 회로 분석이 가능하고 동물의 움직임에 불편함을 주지 않으면서 부작용을 최소화하는 장점에 주목했다. 그뿐만 아니라, 미세한 파장 조절을 통해 정밀한 빛 조절이 가능하며 다중 자극을 통한 복잡한 뇌 기능 연구가 가능하다. 하지만, 체내 수분이나 물에 의해 전기적 특성이 쉽게 열화되기 때문에 생체 삽입형 전자장치로 활용되는데 한계가 있었고, 얇고 유연한 탐침 위 고해상도 집적 공정에 대한 세부적인 최적화도 필요했다. 공동연구팀은 수분과 산소가 많은 생체 내 환경에서 OLED의 구동 신뢰성을 높이며 생체 삽입 시 조직 손상을 최소화하고자, 산화알루미늄/파릴렌-C(Al2O3/parylene-C)로 구성된 초박막 유연 봉지막*을 얇은 탐침 형태인 260~600마이크로미터(μm) 너비로 패터닝해 생체친화성을 유지했다. * 봉지막: 소자를 외부 환경요인인 산소와 물 분자로부터 완전히 차단하는 막 기술로 소자의 수명을 유지시키고 신뢰성을 줌 또한, 고해상도 마이크로 OLED를 집적함에 있어 전체 소자의 유연성과 생체친화성을 유지하기 위해, 봉지막과 동일한 생체친화 재료인 파릴렌-C(parylene-C)를 활용하였다. 아울러, 인접한 OLED 픽셀 간 전기적 간섭 현상을 제거하고 각 픽셀을 공간적으로 분리하기 위해 구조적 레이어인 ‘화소 정의막(pixel define layer)’을 도입함으로써, 8개의 마이크로 OLED를 독립적으로 개별 구동할 수 있도록 구현했다. 마지막으로, 소자 내 다중 박막층의 잔류 응력과 두께를 정밀하게 조절함으로써, 생체 내 환경에서도 소자의 유연성을 유지할 수 있도록 하였다. 이를 통해 외부 셔틀이나 바늘과 같은 보조 장치 없이도 단일 탐침만으로 휘어짐 없이 삽입이 가능하도록, 소자의 기계적 스트레스를 최적화해 설계했다. 결론적으로 연구팀은 채널로돕신2의 활성화에 적합한 470나노미터(nm) 파장에서 1밀리와트/제곱밀리미터(mW/mm2)이상의 광 파워 밀도를 가지는 즉, 광유전학 및 생체조직 자극 응용에서 상당히 높은 수준의 광출력을 가진 마이크로 OLED 집적 유연 뉴럴 프로브를 개발했다. 또한, 초박막 유연 봉지막은 2.66×10⁻⁵ g/m²/day의 낮은 수분 투습률을 보이며 소자 수명은 10년 이상 유지할 수 있고, 패릴렌-C(parylene-C)를 기반으로 생체 내 높은 봉지막 성능을 발휘하며, 전기적 간섭과 휨 이슈 없이 집적된 OLED의 개별 구동을 성공적으로 시연했다. 이번 연구를 주도한 최경철 교수 연구팀의 이소민 박사는 “고유연·고해상도의 마이크로 OLED를 얇은 유연 탐침 위에 집적하는 세부 공정 및 생체 적용성, 친화성 향상에 집중했다”며 “이번 연구는 기존 연구를 넘어 유연 프로브 형태에 최초로 개발해 보고된 사례로, 유연 OLED가 인체 삽입형 측정 및 치료 의료기기로서의 새로운 패러다임을 제시할 것으로 기대된다”고 말했다. 이번 연구는 전기및전자공학부 이소민 박사가 제1 저자로 나노 분야의 권위 있는 국제 학술지 `어드밴스드 펑셔널 머터리얼즈(Advanced Functional Materials, IF 18.5)'에 지난 3월 26일 字로 온라인 게재됐으며, 전면 표지 논문으로 이번 7월에 선정됐다. ※ 논문명: Advanced Micro-OLED Integration on Thin and Flexible Polymer Neural Probes for Targeted Optogenetic Stimulation ※ DOI: https://doi.org/10.1002/adfm.202420758 한편, 이번 연구는 과학기술정보통신부 한국연구재단의 전자약 기술개발사업(연구 과제명: 뇌인지-정서 향상 빛 자극 전자약의 핵심원천기술 개발 및 생체 적용가능성 검증)의 지원을 받아 수행됐다.
2025.07.07 조회수 709
KAIST 방산특화 개발연구소, '2025 민군드론봇 발전 세미나' 성료, 국방혁신의 미래를 제시하다 KAIST 방산특화 개발연구소는 지난 27일(금) 오전 9시부터 오후 1시 30분까지 KAIST 문지캠퍼스에서 “2025 민군드론봇 발전 세미나”를 성공적으로 개최했다. 본 세미나는 대전광역시, 방위사업청, 국방기술진흥연구소와 함께 공동 주관·주최 하였으며, 육군교육사령부, 해병대사령부, 방위사업청 드론사업팀, 대전시 국방팀, 관련 중소기업, 연구자 및 정책연수생 등 총 약 80여명이 참석해 드론과 복합체계 기술의 발전 방향, 방산특화 개발연구소 연구성과를 공유하고 교류하는 뜻깊은 자리가 됐다. 세미나는 KAIST 을지연구소 황승현 교수의 사회로 진행되었으며, 1부에서는 정영진 국방기술진흥연구소 방산혁신클러스터사업부장, 노민균 KAIST기계공학과 교수(代 윤용진 KAIST 방산특화 개발연구소장)의 환영사와 함께 김민석 박사의 방산특화 개발연구소 진행상황 발표로 시작되었다. 이어 육군 교육사령부 드론봇전력소요과장이 “대대급 이하 제대 정찰용 드론 플랫폼 선정 연구”를 주제로 발표하였으며, 육군미래혁신연구센터 자율시스템과장은 유무인복합체계의 운용 및 획득을 위한 발전 방향에 대한 군의 전략적 비전도 제시하였다. 특히, KAIST 방산특화 개발연구소의 6개 핵심 연구 랩(LAB)에서 진행중인 선행과제에 대한 발표는 참석자들의 큰 관심을 끌었다. 발표 내용에는 ▲적층제조 부품·소재 연구개발 LAB (KAIST 윤용진 교수) ▲전기추진 시스템 연구개발 LAB (KAIST 노민균 교수) ▲복합소재 연구개발 LAB (KAIST 김성수 교수) ▲험지 착륙 드론 연구개발 LAB (KAIST 김 정 학과장/교수) ▲모델링·제어 연구개발 LAB (충남대학교 김승균 교수) ▲로터 공기역학 연구개발 LAB (충남대학교 박재상 교수)의 주요 성과 및 향후 추진 계획이 포함되어 첨단 방산 드론 기술의 실질적인 진전을 보여주었다. 특히, 방산특화 개발연구소의 선행과제 연구실과 중소기업이 함께하는 협업 연구를 포함하여 발표하였다. 이는 방산특화개발연구소와 중소기업 협업이 방산혁신클러스터의 모범적인 모델로써 방산혁신클러스터의 본래의 목적에 부합하고 향후 타 지역 방산혁신클러스터의 방향타로써 역할을 보여준 것으로 평가된다. 이어진 중소기업 협업 발표에서는 ㈜디브레인의 초소형 드론 개발 진행 현황과 ㈜네스앤텍의 험지 착륙 드론 개발 계획이 소개되었다. 특히 초소형 드론은 군 소요와 연계 가능성이 높아 방위사업청 및 국방기술진흥연구소 등 관련 기관들의 많은 관심을 이끌어냈다. 세미나 후반에는 참석자 간의 자유로운 교류와 협업 논의가 이어진 네트워킹 시간도 마련돼, 산·학·연·군·관이 함께 방산혁신 생태계 조성을 위한 긴밀한 협력 관계를 다졌다. 이번 세미나는 KAIST 방산특화 개발연구소의 연구성과와 중소기업 협업 사례를 대내외에 알리고, 민군 기술융합 기반의 방산혁신클러스터 모델을 소개하는 뜻깊은 계기가 됐다. 향후에도 KAIST 방산특화 개발연구소는 첨단 드론기술과 복합 무인체계 개발을 통해 미래 전장환경에 대응하는 국방기술 혁신의 중심으로 자리매김할 예정이다.
2025.07.04 조회수 789
60% 이상 챗GPT 추론 성능 향상할 NPU 핵심기술 개발 오픈AI 챗GPT4, 구글 Gemnini 2.5 등 최신 생성형AI 모델들은 높은 메모리 대역폭(Bandwidth) 뿐만 아니라 많은 메모리 용량(Capacity)를 필요로 한다. 마이크로소프트, 구글 등 생성형AI 클라우드 운영 기업들이 엔비디아 GPU를 수십만 장씩 구매하는 이유다. 이런 고성능 AI 인프라 구축의 핵심 난제를 해소할 방안으로, 한국 연구진이 최신 GPU 대비 약 44% 낮은 전력 소모에도 평균 60% 이상 생성형 AI 모델의 추론 성능을 향상할 NPU(신경망처리장치)* 핵심 기술을 개발하는데 성공했다. *NPU(Neural Processing Unit): 인공신경망(Neural Network)을 빠르게 처리하기 위해 만든 AI 전용 반도체 칩 우리 대학 전산학부 박종세 교수 연구팀과 (주)하이퍼엑셀(전기및전자공학부 김주영 교수 창업기업)이 연구 협력을 통해, 챗GPT와 같은 생성형AI 클라우드에 특화된 고성능·저전력의 NPU(신경망처리장치) 핵심기술을 개발했다고 4일 밝혔다. 연구팀이 제안한 기술은 컴퓨터 아키텍처 분야에서 최고 권위를 자랑하는 국제 학회인 ‘2025 국제 컴퓨터구조 심포지엄(International Symposium on Computer Architecture, ISCA 2025)’에 채택됐다. 이번 연구의 핵심은 추론 과정에서 경량화를 통해 정확도 손실을 최소화하면서도 메모리 병목 문제를 해결해 대규모 생성형AI 서비스의 성능을 개선하는 것이다. 이번 연구는 AI인프라의 핵심 구성요소인 AI반도체와 AI시스템SW를 통합 설계했다는 점에서 그 가치를 높게 인정받았다. 기존 GPU 기반 AI 인프라는 높은 메모리 대역폭과 메모리 용량 요구를 충족하기 위해 다수의 GPU 디바이스가 필요한 반면, 이번 기술은 메모리 사용의 대부분을 차지하는 KV 캐시의 양자화*를 통해 적은 수의 NPU 디바이스만으로 동일 수준의 AI 인프라를 구성할 수 있어, 생성형 AI 클라우드 구축 비용을 크게 절감할 수 있다. *KV 캐시(Key-Value Cache)의 양자화: 생성형 AI 모델을 작동할 때 성능을 높이기 위해 사용하는 일종의 임시 저장 공간에 데이터 크기를 줄이는 것을 의미(32비트로 저장된 수를 4비트로 바꾸면, 데이터 크기는 1/8로 줄어듬) 연구팀은 기존 NPU 아키텍처의 연산 로직을 변경하지 않으면서 메모리 인터페이스와 통합될 수 있도록 설계했다. 이번 하드웨어 아키텍처 기술은 제안된 양자화 알고리즘을 구현할 뿐만 아니라, 제한된 메모리 대역폭 및 용량을 효율적으로 활용하기 위한 페이지 단위 메모리 관리 기법*과 양자화된 KV 캐시에 최적화된 새로운 인코딩 기법 등을 개발했다. *페이지 단위 메모리 관리 기법: CPU처럼 메모리 주소를 가상화하여 NPU 내부에서 일관된 방식으로 접근할 수 있게 함 또한, 최신 GPU 대비 비용·전력 효율성이 우수한 NPU 기반 AI 클라우드를 구성할 경우, NPU의 고성능, 저전력 특성을 활용해 운영 비용 역시 크게 절감할 수 있을 것으로 기대된다. 박종세 교수는 “이 연구는 (주)하이퍼엑셀과의 공동연구를 통해 생성형AI 추론 경량화 알고리즘에서 그 해법을 찾았고 ‘메모리 문제’를 해결할 수 있는 NPU 핵심기술 개발에 성공했다. 이 기술을 통해 추론의 정확도를 유지하면서 메모리 요구량을 줄이는 경량화 기법과, 이에 최적화된 하드웨어 설계를 결합해 최신 GPU 대비 평균 60% 이상 성능이 향상된 NPU를 구현했다” 고 말했다. 이어 “이 기술은 생성형AI에 특화된 고성능·저전력 인프라 구현 가능성을 입증했으며, AI클라우드 데이터센터뿐 아니라 능동적인 실행형 AI인 ‘에이전틱 AI ’등으로 대표되는 AI 대전환(AX) 환경에서도 핵심 역할이 기대된다”고 강조했다. 이 연구는 김민수 박사과정 학생과 ㈜하이퍼엑셀 홍성민 박사가 공동 제1 저자로 지난 6월 21일부터 6월 25일까지 일본 도쿄에서 열린 ‘2025 국제 컴퓨터구조 심포지엄(ISCA)’에 발표됐다. 국제적 저명학회인 ISCA는 올해는 570편의 논문이 제출됐으며 그중 127편 만이 채택됐다. (채택률 22.7%). ※논문 제목: Oaken: Fast and Efficient LLM Serving with Online-Offline Hybrid KV Cache Quantization ※DOI: https://doi.org/10.1145/3695053.3731019 한편 이번 연구는 한국연구재단 우수신진연구자지원사업, 정보통신기획평가원(IITP), 인공지능반도체대학원지원사업의 지원을 받아 수행됐다.
2025.07.04 조회수 1048
24시간 말하는 AI비서 가능성 여는 '스피치SSM' 개발 최근 음성 언어 모델(Spoken Language Model, SLM)은 텍스트 없이 인간의 음성을 학습해 음성의 언어적, 비언어적 정보를 이해 및 생성하는 기술로 텍스트 기반 언어 모델의 한계를 넘어서는 차세대 기술로 각광받고 있다. 하지만 기존 모델은 장시간 콘텐츠 생성이 요구되는 팟캐스트, 오디오북, 음성비서 등에서 한계가 두드러졌는데, 우리 연구진이 이런 한계를 뛰어넘어, 시간 제약 없이 일관되고 자연스러운 음성 생성을 실현한 ‘스피치SSM’을 개발하는데 성공했다. 우리 대학 전기및전자공학부 노용만 교수 연구팀의 박세진 연구원(박사과정)이 장시간 음성 생성이 가능한 음성 언어 모델 ‘스피치SSM(SpeechSSM)’을 개발했다고 3일 밝혔다. 이번 연구는 국제 최고 권위 머신러닝 학회인 ICML(International Conference on Machine Learning) 2025에 전체 제출된 논문 중 약 1%만이 선정되는 구두 논문 발표에 확정돼 뛰어난 연구 역량을 입증할 뿐만 아니라 우리 대학의 인공지능 연구 능력이 세계 최고 수준임을 다시 한번 보여주는 계기가 될 전망이다. 음성 언어 모델(SLM)은 중간에 텍스트로 변환하지 않고 음성을 직접 처리함으로써, 인간 화자 고유의 음향적 특성을 활용할 수 있어 대규모 모델에서도 고품질의 음성을 빠르게 생성할 수 있다는 점이 큰 강점이다. 그러나 기존 모델은 음성을 아주 세밀하게 잘게 쪼개서 아주 자세한 정보까지 담는 경우, ‘음성 토큰 해상도’가 높아지고 사용하는 메모리 소비도 증가하는 문제로 인해 장시간 음성의 의미적, 화자적 일관성을 유지하기 어려웠다. 연구팀은 이러한 문제를 해결하기 위해 하이브리드 상태공간 모델(Hybrid State-Space Model)을 사용한 음성 언어 모델인‘스피치SSM’를 개발해 긴 음성 시퀀스를 효율적으로 처리하고 생성할 수 있게 설계했다. 이 모델은 최근 정보에 집중하는 ‘어텐션 레이어(attention layer)’와 전체 이야기 흐름(장기적인 맥락)을 오래 기억하는 ‘순환 레이어(recurrent layer)’를 교차 배치한 ‘하이브리드 구조’를 통해 긴 시간 동안 음성을 생성해도 흐름을 잃지 않고 이야기를 잘 이어간다. 또한, 메모리 사용량과 연산량이 입력 길이에 따라 급격히 증가하지 않아, 장시간의 음성을 안정적이고 효율적으로 학습하고 생성할 수 있다. 스피치SSM은 음성 데이터를 짧은 고정된 단위(윈도우)로 나눠 각 단위별로 독립적으로 처리하고, 전체 긴 음성을 만들 경우에는 다시 붙이는 방식을 활용해 쉽게 긴 음성을 만들 수 있어 무한한 길이의 음성 시퀀스(unbounded speech sequence)를 효과적으로 처리할 수 있게 했다. 또한 음성 생성 단계에서는 한 글자, 한 단어 차례대로 천천히 만들어내지 않고, 여러 부분을 한꺼번에 빠르게 만들어내는 ‘비자기회귀(Non-Autoregressive)’방식의 오디오 합성 모델(SoundStorm)을 사용해, 고품질의 음성을 빠르게 생성할 수 있게 했다. 기존은 10초 정도 짧은 음성 모델을 평가했지만, 연구팀은 16분까지 생성할 수 있도록 자체 구축한 새로운 벤치마크 데이터셋인 ‘LibriSpeech-Long'을 기반으로 음성을 생성하는 평가 태스크를 새롭게 만들었다. 기존 음성 모델 평가 지표인 말이 문법적으로 맞는지 정도만 알려주는 PPL(Perplexity)에 비해, 연구팀은 시간이 지나면서도 내용이 잘 이어지는지 보는 'SC-L(semantic coherence over time)', 자연스럽게 들리는 정도를 시간 따라 보는 'N-MOS-T(naturalness mean opinion score over time)' 등 새로운 평가 지표들을 제안해 보다 효과적이고 정밀하게 평가했다. 새로운 평가를 통해 스피치SSM 음성 언어 모델로 생성된 음성은 긴 시간 생성에도 불구하고 초기 프롬프트에서 언급된 특정 인물이 지속적으로 등장하며, 맥락적으로 일관된 새로운 인물과 사건들이 자연스럽게 전개되는 모습을 확인했다. 이는 기존 모델들이 장시간 생성 시 쉽게 주제를 잃고 반복되는 현상을 보였던 것과 크게 대조적이다. 박세진 박사과정생은 “기존 음성 언어 모델은 장시간 생성에 한계가 있어, 실제 인간이 사용하도록 장시간 음성 생성이 가능한 음성 언어 모델을 개발하는 것이 목표였다”며 “이번 연구 성과를 통해 긴 문맥에서도 일관된 내용을 유지하면서, 기존 방식보다 더 효율적이고 빠르게 실시간으로 응답할 수 있어, 다양한 음성 콘텐츠 제작과 음성비서 등 음성 AI 분야에 크게 기여할 것으로 기대한다”라고 밝혔다. 이 연구는 제1 저자인 우리 대학 박세진 박사과정 학생이 구글 딥마인드(Google DeepMind)와 협력해, ICML(국제 머신러닝 학회) 2025에서 7월 16일 구두 발표로 소개될 예정이다. ※ 논문제목: Long-Form Speech Generation with Spoken Language Models ※ DOI: 10.48550/arXiv.2412.18603 한편, 박세진 박사과정생은 비전, 음성, 언어를 통합하는 연구를 수행하며 CVPR(컴퓨터 비전 분야 최고 학회) 2024 하이라이트 논문 발표, 2024년 ACL(자연어 처리 분야 최고 학회)에서 우수논문상(Outstanding Paper Award) 수상 등을 통해 우수한 연구 역량을 입증한 바 있다. [데모 페이지 링크] https://google.github.io/tacotron/publications/speechssm/
2025.07.03 조회수 1119

34141 대전광역시 유성구 대학로 291 한국과학기술원(KAIST) T.042-350-2114 F.042-350-2210(2220)

Copyright (C) 2020, Korea Advanced Institute of Science and Technology, All Rights Reserved.