-
6배 정밀한 3D 뇌 모사 플랫폼 구현 성공
기존의 3차원(3D) 신경세포 배양 기술은 뇌의 복잡한 다층 구조를 정밀하게 구현하기 어렵고, 구조와 기능을 동시에 분석할 수 있는 플랫폼이 부족해 뇌 연구에 제약이 있었다. 우리 연구진이 뇌처럼 층을 이루는 신경세포 구조를 3D 프린팅 기술로 구현하고, 그 안에서 신경세포의 활동까지 정밀하게 측정할 수 있는 통합 플랫폼 개발에 성공했다.
우리 대학 바이오및뇌공학과 박제균·남윤기 교수 공동연구팀이 뇌 조직과 유사한 기계적 특성을 가진 저점도 천연 하이드로겔을 이용해 고해상도 3D 다층 신경세포 네트워크를 제작하고, 구조적·기능적 연결성을 동시에 분석할 수 있는 통합 플랫폼을 개발했다고 16일 밝혔다.
기존 바이오프린팅 기술은 구조적 안정성을 위해 고점도 바이오잉크를 사용하지만, 이는 신경세포의 증식과 신경돌기 성장을 제한하고, 반대로 신경세포 친화적인 저점도 하이드로겔은 정밀한 패턴 형성이 어려워 구조적 안정성과 생물학적 기능 사이의 근본적인 상충 관계가 있었다.
연구팀은 묽은 젤로도 정밀한 뇌 구조를 만들고, 층마다 정확히 정렬하며, 신경세포의 활동까지 동시에 관찰할 수 있는 3대 핵심기술을 결합해 정교하고 안정적인 뇌 모사 플랫폼을 완성했다.
3대 핵심기술은 ▲ 묽은 젤(하이드로겔)이 흐르지 않도록 스테인리스 철망(마이크로메시) 위에 딱 붙게 만들어 주는‘모세관 고정 효과’ 기술로 기존보다 6배 더 정밀하게 (해상도 500μm 이하) 뇌 구조를 재현했고 ▲ 프린팅된 층들이 삐뚤어지지 않고 정확히 쌓이도록 맞춰주는 원통형 설계인 ‘3D 프린팅 정렬기’로 다층 구조체의 정밀한 조립과 미세 전극 칩과의 안정적 결합을 보장하였고 ▲ 아래쪽은 전기신호를 측정하고, 위쪽은 빛(칼슘 이미징)으로 동시에 세포 활동을 관찰하는 ‘이중 모드 분석 시스템’기술로 층간 연결이 실제로 작동하는지를 여러 방식으로 동시에 확인할 수 있다.
연구팀은 뇌와 유사한 탄성 특성을 지닌 피브린 하이드로겔을 이용해 3층으로 구성된 미니 뇌 구조를 3D 프린팅으로 구현하고, 그 안에서 실제 신경세포들이 신호를 주고받는 과정을 실험을 통해 입증했다.
위층과 아래층에는 대뇌 신경세포를 배치하고, 가운데층은 비어 있지만, 신경세포들이 가운데를 뚫고 지나가며 연결되도록 설계했다. 아래층에는 미세 센서(전극칩)를 달아 전기신호를 측정하고, 위층은 빛(칼슘 이미징)으로 세포 활동을 관찰한 결과, 전기 자극을 줬을 때 위아래층 신경세포가 동시에 반응했고, 신경 연결을 차단하는 약물(시냅스 차단제)을 넣었더니 반응이 줄어들어 신경세포들이 진짜로 연결돼서 신호를 주고받고 있다는 것을 입증했다.
바이오및뇌공학과 박제균 교수는 “이번 연구는 뇌 조직의 복잡한 다층 구조와 기능을 동시에 재현할 수 있는 통합 플랫폼의 공동개발 성과”임을 강조하며, “기존 기술로 14일 이상은 신호 측정이 불가했던 것에 비해 27일 이상 안정적인 미세 전극 칩 인터페이스를 유지하면서 구조-기능 관계를 실시간으로 분석할 수 있어, 향후 신경질환 모델링, 뇌 기능 연구, 신경독성 평가 및 신경 보호 약물 스크리닝 등 다양한 뇌 연구 분야에 활용할 수 있을 것”이라고 말했다.
바이오및뇌공학과 김수지 박사와 윤동조 박사가 공동 제1 저자로 참여한 이번 연구 결과는 국제 학술지 ‘바이오센서스 앤 바이오일렉트로닉스(Biosensors and Bioelectronics)’에 2025년 6월 11일 자로 온라인판에 게재됐다.
※논문명: Hybrid biofabrication of multilayered 3D neuronal networks with structural and functional interlayer connectivity
※DOI: https://doi.org/10.1016/j.bios.2025.117688
한편, 이번 연구는 한국연구재단 글로벌 기초연구실지원사업, 중견연구 및 바이오·의료기술개발사업의 지원을 받아 수행됐다.
2025.07.16
조회수 326
-
항암제 내성 없앤다! 당뇨병 등 난치성 질환 치료도 기대
암 치료의 큰 걸림돌 중 하나는 항암제에 대한 암세포의 내성이다. 기존에는 내성 암세포를 제거할 수 있는 새로운 표적을 찾는 방식이 주를 이뤘지만, 오히려 더 강한 내성을 유도할 수 있다는 한계가 있었다. 이에 우리 연구진이 내성 암세포를 다시 약물에 반응하게 만들 수 있는 핵심 유전자를 자동으로 예측하는 컴퓨터 기반 방법론을 개발했다. 이 기술은 다양한 암 치료뿐 아니라 당뇨병 등 난치성 대사 질환에도 활용될 수 있어 주목된다.
우리 대학 생명화학공학과 김현욱 교수와 김유식 교수 연구팀이 인체 대사를 시뮬레이션할 수 있는 컴퓨터 모델인 대사 네트워크 모델을 활용해, 항암제에 내성을 가진 유방암 세포를 약물에 민감화시킬 수 있는 새로운 약물 표적을 예측하는 컴퓨터 기반 방법론을 개발했다고 7일 밝혔다.
연구진은 암세포의 대사 변형이 약물 내성 형성에 관여하는 주요한 특징으로 주목하고, 항암제 내성 유방암 세포의 대사를 조절해 약물 반응성을 높일 유전자 표적을 예측하는 대사 네트워크 모델 기반 방법론을 개발했다.
연구진은 먼저 독소루비신(doxorubicin)과 파클리탁셀(paclitaxel)에 각각 내성을 지닌 MCF7 유방암 세포주에서 얻은 단백체 데이터를 통합해 세포별 대사 네트워크 모델을 구축했다. 이어 모든 대사 유전자에 대해서 유전자 낙아웃(결실) 시뮬레이션*을 수행하고, 그 결과를 분석했다.
*유전자 낙아웃 시뮬레이션: 특정 유전자를 가상으로 제거한 상태에서 생물학적 네트워크의 변화를 계산적으로 예측하는 방법
그 결과, 특정 유전자의 단백질을 억제하면, 항암제에 잘 듣지 않던 내성 암세포가 다시 항암제에 반응하도록 만들 수 있다는 것을 알아냈다. 독소루비신 내성 세포에서는 GOT1 유전자를, 파클리탁셀 내성 세포에서는 GPI 유전자를 선별했으며, 두 약물 공통으로는 SLC1A5 유전자를 표적으로 선별했다.
예측하여 선별한 유전자를 실제로 억제해 본 결과, 내성 암세포가 항암제에 다시 반응하게 됨을 실험적으로 검증했다.
나아가 같은 항암제에 내성을 갖는 다른 종류의 유방암 세포에서도 같은 유전자를 억제했을 때 항암제에 다시 민감해지는 효과가 일관되게 나타나는 것을 확인할 수 있었다.
김유식 교수는 “세포 대사는 감염병, 퇴행성 질환 등 다양한 난치성 질환에서 중요한 역할을 한다”며, “이번에 개발된 대사 조절 스위치 예측 기술은 약물 내성 유방암 치료를 넘어, 치료제가 없는 다양한 대사 질환에도 적용될 수 있는 기반 기술이 될 것”이라고 말했다.
연구를 총괄한 김현욱 교수는 “이번 연구의 가장 큰 의의는 컴퓨터 시뮬레이션만과 최소한의 실험 데이터만으로 내성 암세포를 다시 약물에 반응하게 만들 수 있는 핵심 유전자를 정밀하게 예측할 수 있다는 점”이라며, “이 방법론은 다양한 암종과 대사 관련 난치성 질환의 새로운 치료 표적 발굴에도 폭넓게 활용될 수 있을 것”이라고 강조했다.
우리 대학 생명화학공학과 임진아 박사과정생과 정해덕 박사과정생이 공동 제1 저자로 참여한 이번 연구는 생명과학·물리·공학·사회과학 등 다양한 분야의 최고 수준 연구를 다루는 다학제 국제 학술지인 미국국립과학원회보(PNAS) 6월 25일 자 온라인에 게재됐다.
※ 논문명 : Genome-scale knockout simulation and clustering analysis of drug-resistant breast cancer cells reveal drug sensitization targets
※ 저자 정보 : 임진아(한국과학기술원, 공동 제1 저자), 정해덕(한국과학기술원, 공동 제1 저자), 유한석(서울대학교병원, 교신저자), 김유식(한국과학기술원, 교신저자), 김현욱(한국과학기술원, 교신저자) 포함 총 10명
※ DOI: https://doi.org/10.1073/pnas.2425384122
이번 연구는 과학기술정보통신부 한국전자통신연구원 및 한국연구재단의 지원을 받아 수행됐다.
2025.07.07
조회수 822
-
24시간 말하는 AI비서 가능성 여는 '스피치SSM' 개발
최근 음성 언어 모델(Spoken Language Model, SLM)은 텍스트 없이 인간의 음성을 학습해 음성의 언어적, 비언어적 정보를 이해 및 생성하는 기술로 텍스트 기반 언어 모델의 한계를 넘어서는 차세대 기술로 각광받고 있다. 하지만 기존 모델은 장시간 콘텐츠 생성이 요구되는 팟캐스트, 오디오북, 음성비서 등에서 한계가 두드러졌는데, 우리 연구진이 이런 한계를 뛰어넘어, 시간 제약 없이 일관되고 자연스러운 음성 생성을 실현한 ‘스피치SSM’을 개발하는데 성공했다.
우리 대학 전기및전자공학부 노용만 교수 연구팀의 박세진 연구원(박사과정)이 장시간 음성 생성이 가능한 음성 언어 모델 ‘스피치SSM(SpeechSSM)’을 개발했다고 3일 밝혔다.
이번 연구는 국제 최고 권위 머신러닝 학회인 ICML(International Conference on Machine Learning) 2025에 전체 제출된 논문 중 약 1%만이 선정되는 구두 논문 발표에 확정돼 뛰어난 연구 역량을 입증할 뿐만 아니라 우리 대학의 인공지능 연구 능력이 세계 최고 수준임을 다시 한번 보여주는 계기가 될 전망이다.
음성 언어 모델(SLM)은 중간에 텍스트로 변환하지 않고 음성을 직접 처리함으로써, 인간 화자 고유의 음향적 특성을 활용할 수 있어 대규모 모델에서도 고품질의 음성을 빠르게 생성할 수 있다는 점이 큰 강점이다.
그러나 기존 모델은 음성을 아주 세밀하게 잘게 쪼개서 아주 자세한 정보까지 담는 경우, ‘음성 토큰 해상도’가 높아지고 사용하는 메모리 소비도 증가하는 문제로 인해 장시간 음성의 의미적, 화자적 일관성을 유지하기 어려웠다.
연구팀은 이러한 문제를 해결하기 위해 하이브리드 상태공간 모델(Hybrid State-Space Model)을 사용한 음성 언어 모델인‘스피치SSM’를 개발해 긴 음성 시퀀스를 효율적으로 처리하고 생성할 수 있게 설계했다.
이 모델은 최근 정보에 집중하는 ‘어텐션 레이어(attention layer)’와 전체 이야기 흐름(장기적인 맥락)을 오래 기억하는 ‘순환 레이어(recurrent layer)’를 교차 배치한 ‘하이브리드 구조’를 통해 긴 시간 동안 음성을 생성해도 흐름을 잃지 않고 이야기를 잘 이어간다. 또한, 메모리 사용량과 연산량이 입력 길이에 따라 급격히 증가하지 않아, 장시간의 음성을 안정적이고 효율적으로 학습하고 생성할 수 있다.
스피치SSM은 음성 데이터를 짧은 고정된 단위(윈도우)로 나눠 각 단위별로 독립적으로 처리하고, 전체 긴 음성을 만들 경우에는 다시 붙이는 방식을 활용해 쉽게 긴 음성을 만들 수 있어 무한한 길이의 음성 시퀀스(unbounded speech sequence)를 효과적으로 처리할 수 있게 했다.
또한 음성 생성 단계에서는 한 글자, 한 단어 차례대로 천천히 만들어내지 않고, 여러 부분을 한꺼번에 빠르게 만들어내는 ‘비자기회귀(Non-Autoregressive)’방식의 오디오 합성 모델(SoundStorm)을 사용해, 고품질의 음성을 빠르게 생성할 수 있게 했다.
기존은 10초 정도 짧은 음성 모델을 평가했지만, 연구팀은 16분까지 생성할 수 있도록 자체 구축한 새로운 벤치마크 데이터셋인 ‘LibriSpeech-Long'을 기반으로 음성을 생성하는 평가 태스크를 새롭게 만들었다.
기존 음성 모델 평가 지표인 말이 문법적으로 맞는지 정도만 알려주는 PPL(Perplexity)에 비해, 연구팀은 시간이 지나면서도 내용이 잘 이어지는지 보는 'SC-L(semantic coherence over time)', 자연스럽게 들리는 정도를 시간 따라 보는 'N-MOS-T(naturalness mean opinion score over time)' 등 새로운 평가 지표들을 제안해 보다 효과적이고 정밀하게 평가했다.
새로운 평가를 통해 스피치SSM 음성 언어 모델로 생성된 음성은 긴 시간 생성에도 불구하고 초기 프롬프트에서 언급된 특정 인물이 지속적으로 등장하며, 맥락적으로 일관된 새로운 인물과 사건들이 자연스럽게 전개되는 모습을 확인했다. 이는 기존 모델들이 장시간 생성 시 쉽게 주제를 잃고 반복되는 현상을 보였던 것과 크게 대조적이다.
박세진 박사과정생은 “기존 음성 언어 모델은 장시간 생성에 한계가 있어, 실제 인간이 사용하도록 장시간 음성 생성이 가능한 음성 언어 모델을 개발하는 것이 목표였다”며 “이번 연구 성과를 통해 긴 문맥에서도 일관된 내용을 유지하면서, 기존 방식보다 더 효율적이고 빠르게 실시간으로 응답할 수 있어, 다양한 음성 콘텐츠 제작과 음성비서 등 음성 AI 분야에 크게 기여할 것으로 기대한다”라고 밝혔다.
이 연구는 제1 저자인 우리 대학 박세진 박사과정 학생이 구글 딥마인드(Google DeepMind)와 협력해, ICML(국제 머신러닝 학회) 2025에서 7월 16일 구두 발표로 소개될 예정이다.
※ 논문제목: Long-Form Speech Generation with Spoken Language Models
※ DOI: 10.48550/arXiv.2412.18603
한편, 박세진 박사과정생은 비전, 음성, 언어를 통합하는 연구를 수행하며 CVPR(컴퓨터 비전 분야 최고 학회) 2024 하이라이트 논문 발표, 2024년 ACL(자연어 처리 분야 최고 학회)에서 우수논문상(Outstanding Paper Award) 수상 등을 통해 우수한 연구 역량을 입증한 바 있다.
[데모 페이지 링크]
https://google.github.io/tacotron/publications/speechssm/
2025.07.03
조회수 1121
-
AI가 여론 조작? 한국어 'AI 생성 댓글' 탐지 기술 개발
생성형 AI 기술이 발전하면서 이를 악용한 온라인 여론 조작 우려가 커지고 있다. 이에 따른 AI 생성글 탐지 기술도 개발되었는데 대부분 영어로 된 장문의 정형화된 글을 기반으로 개발돼, 짧고(평균 51자), 구어체 표현이 많은 한국어 뉴스 댓글에는 적용이 어려웠다. 우리 연구진이 한국어 AI 생성 댓글을 탐지하는 기술을 개발해서 화제다.
우리 대학 전기및전자공학부 김용대 교수 연구팀이 국가보안기술연구소(국보연)와 협력해, 한국어 AI 생성 댓글을 탐지하는 기술 'XDAC'를 세계 최초로 개발했다고 23일 밝혔다.
최근 생성형 AI는 뉴스 기사 맥락에 맞춰 감정과 논조까지 조절할 수 있으며, 몇 시간 만에 수십만 개의 댓글을 자동 생성할 수 있어 여론 조작에 악용될 수 있다. OpenAI의 GPT-4o API를 기준으로 하면 댓글 1개 생성 비용은 약 1원 수준이며, 국내 주요 뉴스 플랫폼의 하루 평균 댓글 수인 20만 개를 생성하는 데 단 20만 원이면 가능할 정도다. 공개 LLM은 자체 GPU 인프라만 갖추면 사실상 무상으로도 대량의 댓글 생성을 수행할 수 있다.
연구팀은 AI 생성 댓글과 사람 작성 댓글을 사람이 구별할 수 있는지 실험했다. 총 210개의 댓글을 평가한 결과, AI 생성 댓글의 67%를 사람이 작성한 것으로 착각했고, 실제 사람 작성 댓글도 73%만 정확히 구분해냈다. 즉, 사람조차 AI 생성 댓글을 정확히 구별하기 어려운 수준에 이르렀다는 의미다. AI 생성 댓글은 오히려 기사 맥락 관련성(95% vs 87%), 문장 유창성(71% vs 45%), 편향성 인식(33% vs 50%)에서 사람 작성 댓글보다 높은 평가를 받았다.
그동안 AI 생성글 탐지 기술은 대부분 영어로 된 장문의 정형화된 글을 기반으로 개발되어 한국어의 짧은 댓글에는 적용이 어려웠다. 짧은 댓글은 통계적 특징이 불충분하고, 이모지·비속어·반복 문자 등 비정형 구어 표현이 많아 기존 탐지 모델이 효과적으로 작동하지 않는다. 또한, 현실적인 한국어 AI 생성 댓글 데이터셋이 부족하고, 기존의 단순한 프롬프팅 방식으로는 다양하고 실제적인 댓글을 생성하는 데 한계가 있었다.
이에 연구팀은 ▲14종의 다양한 LLM 활용 ▲자연스러움 강화 ▲세밀한 감정 제어 ▲참조자료를 통한 증강 생성의 네 가지 전략을 적용한 AI 댓글 생성 프레임워크를 개발해, 실제 이용자 스타일을 모방한 한국어 AI 생성 댓글 데이터셋을 구축하고 이 중 일부를 벤치마크 데이터셋으로 공개했다. 또 설명 가능한 AI(XAI) 기법을 적용해 언어 표현을 정밀 분석한 결과, AI 생성 댓글에는 사람과 다른 고유한 말투 패턴이 있음을 확인했다.
예를 들어, AI는 "것 같다", "에 대해" 등 형식적 표현과 높은 접속어 사용률을 보였고, 사람은 반복 문자(ㅋㅋㅋㅋ), 감정 표현, 줄바꿈, 특수기호 등 자유로운 구어체 표현을 즐겨 사용했다.
특수문자 사용에서도 AI는 전 세계적으로 통용되는 표준화된 이모지를 주로 사용하는 반면, 사람은 한국어 자음(ㅋ, ㅠ, ㅜ 등)이나 특수 기호(ㆍ, ♡, ★, • 등) 등 문화적 특수성이 담긴 다양한 문자를 활용했다.
특히, 서식 문자(줄바꿈, 여러 칸 띄어쓰기 등) 사용에서 사람 작성 댓글의 26%는 이런 서식 문자를 포함했지만, AI 생성 댓글은 단 1%만 사용했다. 반복 문자(예: ㅋㅋㅋㅋ, ㅎㅎㅎㅎ 등) 사용 비율도 사람 작성 댓글이 52%로, AI 생성 댓글(12%)보다 훨씬 높았다.
XDAC는 이러한 차이를 정교하게 반영해 탐지 성능을 높였다. 줄바꿈, 공백 등 서식 문자를 변환하고, 반복 문자 패턴을 기계가 이해할 수 있도록 변환하는 방식이 적용됐다. 또 각 LLM의 고유 말투 특징을 파악해 어떤 AI 모델이 댓글을 생성했는지도 식별 가능하게 설계됐다.
이러한 최적화로 XDAC는 AI 생성 댓글 탐지에서 98.5% F1 점수로 기존 연구 대비 68% 성능을 향상시켰으며, 댓글 생성 LLM 식별에서도 84.3% F1 성능을 기록했다.
고우영 선임연구원은 "이번 연구는 생성형 AI가 작성한 짧은 댓글을 높은 정확도로 탐지하고, 생성 모델까지 식별할 수 있는 세계 최초 기술"이라며 "AI 기반 여론 조작 대응의 기술적 기반을 마련한 데 큰 의의가 있다"고 강조했다.
연구팀은 XDAC의 탐지 기술이 단순 판별을 넘어 심리적 억제 장치로도 작용할 수 있다고 설명했다. 마치 음주단속, 마약 검사, CCTV 설치 등이 범죄 억제 효과를 가지듯, 정밀 탐지 기술의 존재 자체가 AI 악용 시도를 줄일 수 있다는 것이다.
XDAC는 플랫폼 사업자가 의심스러운 계정이나 조직적 여론 조작 시도를 정밀 감시·대응하는 데 활용될 수 있으며, 향후 실시간 감시 시스템이나 자동 대응 알고리즘으로 확장 가능성이 크다.
이번 연구는 설명가능 인공지능(XAI) 기반 탐지 프레임워크를 제안한 것이 핵심이며, 인공지능 자연어처리 분야 최고 권위 학술대회인 7월 27일부터 개최되는 'ACL 2025' 메인 콘퍼런스에 채택되며 기술력을 인정받았다.
※논문 제목: XDAC: XAI-Driven Detection and Attribution of LLM-Generated News Comments in Korean
※논문원본: https://github.com/airobotlab/XDAC/blob/main/paper/250611_XDAC_ACL2025_camera_ready.pdf
이번 연구는 우리 대학 김용대 교수의 지도 아래 국보연 소속이자 우리 대학 박사과정인 고우영 선임연구원이 제1 저자로 참여했으며, 성균관대학교 김형식 교수와 우리 대학 오혜연 교수가 공동 연구자로 참여했다.
2025.06.24
조회수 2697
-
‘뻔하지 않은 창의적인 의자’그리는 AI 기술 개발
최근 텍스트 기반 이미지 생성 모델은 자연어로 제공된 설명만으로도 고해상도·고품질 이미지를 자동 생성할 수 있다. 하지만, 대표적인 예인 스테이블 디퓨전(Stable Diffusion) 모델에서 ‘창의적인’이라는 텍스트를 입력했을 경우, 창의적인 이미지 생성은 아직은 제한적인 수준이다. KAIST 연구진이 스테이블 디퓨전(Stable Diffusion) 등 텍스트 기반 이미지 생성 모델에 별도 학습 없이 창의성을 강화할 수 있는 기술을 개발해, 예컨대 뻔하지 않은 창의적인 의자 디자인도 인공지능이 스스로 그려낼 수 있게 됐다.
우리 대학 김재철AI대학원 최재식 교수 연구팀이 네이버(NAVER) AI Lab과 공동 연구를 통해, 추가적 학습 없이 인공지능(AI) 생성 모델의 창의적 생성을 강화하는 기술을 개발했다.
최 교수 연구팀은 텍스트 기반 이미지 생성 모델의 내부 특징 맵을 증폭해 창의적 생성을 강화하는 기술을 개발했다. 또한, 모델 내부의 얕은 블록들이 창의적 생성에 중요한 역할을 한다는 것을 발견하고, 특징 맵을 주파수 영역으로 변환 후, 높은 주파수 영역에 해당하는 부분의 값을 증폭하면 노이즈나 작게 조각난 색깔 패턴의 형태를 유발하는 것을 확인했다. 이에 따라, 연구팀은 얕은 블록의 낮은 주파수 영역을 증폭함으로써 효과적으로 창의적 생성을 강화할 수 있음을 보였다.
연구팀은 창의성을 정의하는 두 가지 핵심 요소인 독창성과 유용성을 모두 고려해, 생성 모델 내부의 각 블록 별로 최적의 증폭 값을 자동으로 선택하는 알고리즘을 제시했다.
개발된 알고리즘을 통해 사전 학습된 스테이블 디퓨전 모델의 내부 특징 맵을 적절히 증폭해 추가적인 분류 데이터나 학습 없이 창의적 생성을 강화할 수 있었다.
연구팀은 개발된 알고리즘을 사용하면 기존 모델 대비 더욱 참신하면서도 유용성이 크게 저하되지 않은 이미지를 생성할 수 있음을 다양한 측정치를 활용해 정량적으로 입증했다.
특히, 스테이블 디퓨전 XL(SDXL) 모델의 이미지 생성 속도를 대폭 향상하기 위해 개발된 SDXL-Turbo 모델에서 발생하는 모드 붕괴 문제를 완화함으로써 이미지 다양성이 증가한 것을 확인했다. 나아가, 사용자 연구를 통해 사람이 직접 평가했을 때도 기존 방법에 비해 유용성 대비 참신성이 크게 향상됨을 입증했다.
공동 제1 저자인 KAIST 한지연, 권다희 박사과정은 "생성 모델을 새로 학습하거나 미세조정 학습하지 않고 생성 모델의 창의적인 생성을 강화하는 최초의 방법론ˮ이라며 "학습된 인공지능 생성 모델 내부에 잠재된 창의성을 특징 맵 조작을 통해 강화할 수 있음을 보였다ˮ 라고 말했다.
이어 “이번 연구는 기존 학습된 모델에서도 텍스트만으로 창의적 이미지를 손쉽게 생성할 수 있게 됐으며, 이를 통해 창의적인 상품 디자인 등 다양한 분야에서 새로운 영감을 제공하고, 인공지능 모델이 창의적 생태계에서 실질적으로 유용하게 활용될 수 있도록 기여할 것으로 기대된다”라고 밝혔다.
KAIST 김재철AI대학원 한지연 박사과정과 권다희 박사과정이 공동 제1 저자로 참여한 이번 연구는 국제 학술지 `국제 컴퓨터 비전 및 패턴인식 학술대회 (IEEE Conference on Computer Vision and Pattern Recognition, CVPR)’에서 6월 15일 발표됐다.
※논문명 : Enhancing Creative Generation on Stable Diffusion-based Models
※DOI: https://doi.org/10.48550/arXiv.2503.23538
한편 이번 연구는 KAIST-네이버 초창의적 AI 연구센터, 과학기술정보통신부의 재원으로 정보통신기획평가원의 지원을 받은 혁신성장동력프로젝트 설명가능인공지능, AI 연구거점 프로젝트, 점차 강화되고 있는 윤리 정책에 발맞춰 유연하게 진화하는 인공지능 기술 개발 연구 및 KAIST 인공지능 대학원 프로그램과제의 지원을 받았고 방위사업청과 국방과학연구소의 지원으로 KAIST 미래 국방 인공지능 특화연구센터에서 수행됐다.
2025.06.19
조회수 1368
-
KAIST 모델 기반, 아프리카 케냐과학기술원 캠퍼스 완공
우리 대학은 케냐 콘자혁신도시에서 개최된 케냐과학기술원 캠퍼스 완공식(4월11일)에 이어, 28일 현장인수증명서를 발급하여 약 10년에 걸쳐 추진해 온 케냐과학기술원 건립 사업의 1단계가 사실상 완료*하였다.
* KAIST가 케냐과학기술원 건립 컨설팅 주관기관으로 케냐 정부 발주처인 정보통신디지털경제부에 캠퍼스 준공을 확인하는 현장인수증명서(Taking-Over Certificate)를 발급함
케냐과학기술원(Kenya-AIST)은 KAIST가 축적한 과학기술 교육의 노하우를 현지의 필요에 맞춰 구현한 아프리카형 고등교육 모델이다. 과학기술 중심 고등교육기관 설립을 목표로 하는 우리 정부의 해외원조 사업으로, 2019년부터 한국수출입은행 대외경제협력기금(유상차관)을 통해 본격 추진됐다.
우리 대학은 2014~2015년 한국수출입은행이 발주한 타당성 조사 기관으로 선정되어 사업 전반의 기획을 담당했고, 이후 2019년 케냐 정부가 발주한 케냐과학기술원 건립을 위한 컨설팅 사업을 수주했다.
컨설팅은 KAIST가 사업총괄 및 교육설계를 담당하는 주관기관으로 참여한 가운데, 삼우종합건축사사무소(대표 손창규)가 건축 설계를, 선진엔지니어링(대표 배성진)이 시공 감리를, 시공은 보미건설(회장 김덕영)이 각각 맡았다. 이번 현장인수증명서 발급은 컨설턴트 주관기관으로 KAIST가 캠퍼스 시공 완료 후 발주처에 캠퍼스 인수를 정식으로 인증하는 절차이다.
사업 초기부터 KAIST 소속 20여 명의 교원들이 자문 교수로 참여했으며, 이수영(전기및전자공학부), 송태호(기계공학과), 김학성(생명과학과), 성풍현(원자력및양자공학과) 교수에 이어 현재 김소영(과학기술정책대학원) 교수가 사업단장을 맡고 있다.
특히, 정근모 前 과학기술부 장관은 사업의 명예고문이자 케냐 대통령 고문으로 활동 중이며, 2008년 케냐 정부가 국가 중장기 발전계획인 ‘케냐 비전 2030’을 수립할 당시 KAIST 모델을 직접 케냐 대통령에게 제안한 것으로 알려져 있다.
이 사업은 KAIST를 벤치마킹하여 케냐 내 고급 이공계 인재를 양성할 수 있는 교육기관을 구축하는 것을 목표로 하여 케냐과학기술원 건립사업은 단계적으로 추진되고 있다.
1단계에서는 교육설계, 시공 입찰, 건설과 감리 등이 이루어져 마무리됐고, 이어지는 2단계에서는 교직원 연수, 행정교육, 실험실습 장비 고도화 등 운영 준비가 본격화된다. 초기에 개설되는 학과는 기계 및 원자력 공학, 전기 및 전자공학, ICT 공학, 화학공학, 토목공학, 농생명공학 등 6개 학과로, 기초과학은 별도 프로그램으로 구성될 예정이다.
캠퍼스는 2021년 착공 이후, 3년 만에 마무리됐으며, 케냐과학기술원 이사회(이사장 임마뉴엘 무티자)가 주관으로 4월 11일 개최된 이번 완공식에는 윌리엄 카보고 케냐 정보통신디지털경제부 장관, 존 타누이 차관, 강형식 주케냐 한국대사를 비롯해 한국수출입은행, KAIST 컨소시엄, 보미건설 등 관계자 100여 명이 참석했다.
캠퍼스는 아프리카 최초로 우리나라 녹색건축 인증제도(G-SEED)가 적용됐으며, 케냐 실정에 맞춰 개발된 케냐판 G-SEED 평가에서도 최고 등급을 획득했다.
케냐과학기술원이 위치한 콘자 혁신도시는 수도 나이로비에서 남동쪽으로 약 60km에 떨어진 지역에 조성되는 ‘실리콘 사바나’로 불리는 혁신클러스터로, 케냐 정부의 국가 중장기 계획인 ‘케냐 비전 2030’의 핵심 프로젝트이다.
캠퍼스 완공에 앞서, 지난 3월 11일 케냐과학기술원 임시 교무처장인 제니퍼 하마시 교수는 내각 회의에서 “케냐과학기술원이 케냐 대학법 24조에 따라 국가 전략적으로 중요한 “특별학위수여기관”(specialized degree-awarding institution)의 지위를 부여받았다“ 고 밝혔다.
케냐과학기술원 건립사업단장 김소영 교수(KAIST 과학기술정책대학원)는 “지난 10여 년간 헌신적인 수고를 아끼지 않은 모든 사업 관계자들에게 감사드리며, 양국 간 긴밀한 협력 끝에 결실을 맺게 되어 매우 뜻깊게 생각한다. KAIST는 향후 2단계 운영 지원을 비롯하여, 케냐과학기술원이 자립적이고 지속 가능한 고등교육기관으로 성장할 수 있도록 중장기 협력도 이어갈 계획이다.”라고 말했다.
이광형 총장은 “케냐과학기술원은 KAIST의 창의적 교육과 도전적연구 모델이 세계로 확산되는 대표 사례가 될 것이다. 이는 단순한 교육 수출을 넘어, 케냐 청년들이 케냐과학기술원을 통해 미래를 준비할 수 있도록 돕는 여정에 KAIST는 든든한 동반자로 함께 하겠다.”라고 말했다.
2025.04.28
조회수 2285
-
논문 경험 없는 학부 1·2학년 4인 팀, ICLR 2025 금융 AI 워크숍에 논문 채택
학부 1, 2학년으로만 구성된 4인 학생 팀의 논문이 인공지능 분야 국제 학술대회인 ‘International Conference on Learning Representations (ICLR) 2025’의 ‘Advances in Financial AI Workshop’에 채택됐다.
이번에 채택된 논문 “Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems”은 김현준, 김세종, 송현서, 서현우 학생(모두 공동 1저자)이 함께 작성했으며, 김현준 학생이 교신저자를 겸했다. 특히 모든 팀원이 논문 작성 경험이 전혀 없는 학부 저학년 학생들로만 구성되어 그 의미가 더욱 크다.
이 연구는 대규모 언어 모델(LLM)이 금융 질의응답 시스템에서 활용될 때 필요한 정보를 더 정확하게 검색하고 활용하는 방법을 개선했다. 연구팀은 기존 검색 증강 생성(Retrieval-Augmented Generation, RAG) 시스템의 한계를 극복하기 위해 ‘사전 검색(pre-retrieval)’, ‘검색(retrieval)’, ‘사후 검색(post-retrieval)’ 3단계 접근법을 도입했다.
사전 검색 단계에서는 질의어와 문서 데이터를 효과적으로 전처리하는 기술을 개발했고, 검색 단계에서는 금융 도메인에 특화된 임베딩 모델을 미세 조정하여 검색 정확도를 높였다. 특히 의미 기반 검색과 키워드 기반 검색을 결합한 하이브리드 접근법을 통해 검색 성능을 크게 향상시켰다. 사후 검색 단계에서는 검색된 문서의 순위를 재조정하고 최적의 문서만을 선별하는 기술을 적용했다.
이 연구 결과는 7개의 금융 질의응답 데이터셋에서 평가되었으며, 기존 방법 대비 눈에 띄는 성능 향상을 보였다.
연구팀은 교내에서 진행된 “KB증권과 함께하는 제4회 UNIST – KAIST - POSTECH AI & 데이터사이언스 경진대회”에서 금상(상금 200만 원)을 수상한 프로젝트를 더욱 발전시켜 논문으로 완성했다.
김현준 학생은 “2024 가을학기 내내 팀원들과 밤부터 새벽까지 대회 작업을 했고, 수상 후에도 겨울 방학 동안 교양 분관 스터디룸에서 밤을 새가며 논문을 작성했다”라며 “전혀 경험이 없는 상태에서 시작했지만, 팀원들과 함께 끊임없이 토론하고 연구한 결과 국제 학술대회 워크숍에 논문이 채택되는 값진 성과를 얻을 수 있었다”라고 소감을 밝혔다.
이번 연구의 의의는 대규모 언어 모델이 금융 정보를 더 정확하게 처리할 수 있게 함으로써, 복잡한 금융 문서에서 필요한 정보를 빠르고 정확하게 찾아내는 데 기여한다는 점이다.
송현서 학생은 “투자자들이 기업 재무제표나 공시 자료를 분석할 때 더 정확한 정보를 얻을 수 있게 돕고, 금융 기관들의 의사결정 과정에서 중요한 도구로 활용될 수 있다.”라며 연구의 활용성을 강조했다.
김세종 학생은 “우리 연구가 실제 금융 환경에서 투자자들과 애널리스트들이 더 정확한 정보에 기반한 의사결정을 내리는 데 도움이 되길 바란다”라며 “학부생으로서 국제 학술대회에 논문을 발표하게 되어 매우 기쁘고, 앞으로도 계속해서 AI와 금융의 융합 연구에 매진하겠다”라고 말했다.
서현우 학생은 “학교의 지원으로 학회 참가비 및 여행 경비 부담을 덜었다”라며 학회 참가비 및 여행 경비를 지원해준 KAIST에 감사한 마음을 전했다.
관계자는 "학부 저학년 학생들이 국제 학술대회급 연구 성과를 낸 것은 매우 의미 있는 일"이라며 "앞으로도 KAIST는 학생들의 창의적인 연구와 도전을 적극 지원할 것"이라고 밝혔다.
<논문 정보>
- 논문 링크: https://arxiv.org/abs/2503.15191
- 프로젝트 웹사이트: https://github.com/seohyunwoo-0407/GAR
2025.04.01
조회수 4108
-
챗GPT 등 대형 AI모델 학습 최적화 시뮬레이션 개발
최근 챗GPT, 딥시크(DeepSeek) 등 초거대 인공지능(AI) 모델이 다양한 분야에서 활용되며 주목받고 있다. 이러한 대형 언어 모델은 수만 개의 데이터센터용 GPU를 갖춘 대규모 분산 시스템에서 학습되는데, GPT-4의 경우 모델을 학습하는 데 소모되는 비용은 약 1,400억 원에 육박하는 것으로 추산된다. 한국 연구진이 GPU 사용률을 높이고 학습 비용을 절감할 수 있는 최적의 병렬화 구성을 도출하도록 돕는 기술을 개발했다.
우리 대학 전기및전자공학부 유민수 교수 연구팀은 삼성전자 삼성종합기술원과 공동연구를 통해, 대규모 분산 시스템에서 대형 언어 모델(LLM)의 학습 시간을 예측하고 최적화할 수 있는 시뮬레이션 프레임워크(이하 vTrain)를 개발했다고 13일 밝혔다.
대형 언어 모델 학습 효율을 높이려면 최적의 분산 학습 전략을 찾는 것이 필수적이다. 그러나 가능한 전략의 경우의 수가 방대할 뿐 아니라 실제 환경에서 각 전략의 성능을 테스트하는 데는 막대한 비용과 시간이 들어간다.
이에 따라 현재 대형 언어 모델을 학습하는 기업들은 일부 경험적으로 검증된 소수의 전략만을 사용하고 있다. 이는 GPU 활용의 비효율성과 불필요한 비용 증가를 초래하지만, 대규모 시스템을 위한 시뮬레이션 기술이 부족해 기업들이 문제를 효과적으로 해결하지 못하고 있는 상황이다.
이에 유민수 교수 연구팀은 vTrain을 개발해 대형 언어 모델의 학습 시간을 정확히 예측하고, 다양한 분산 병렬화 전략을 빠르게 탐색할 수 있도록 했다.
연구팀은 실제 다중 GPU 환경에서 다양한 대형 언어 모델 학습 시간 실측값과 vTrain의 예측값을 비교한 결과, 단일 노드에서 평균 절대 오차(MAPE) 8.37%, 다중 노드에서 14.73%의 정확도로 학습 시간을 예측할 수 있음을 검증했다.
연구팀은 삼성전자 삼성종합기술원와 공동연구를 진행하여 vTrain 프레임워크와 1,500개 이상의 실제 학습 시간 측정 데이터를 오픈소스로 공개(https://github.com/VIA-Research/vTrain)하여 AI 연구자와 기업이 이를 자유롭게 활용할 수 있도록 했다.
유민수 교수는 “vTrain은 프로파일링 기반 시뮬레이션 기법으로 기존 경험적 방식 대비 GPU 사용률을 높이고 학습 비용을 절감할 수 있는 학습 전략을 탐색하였으며 오픈소스를 공개하였다. 이를 통해 기업들은 초거대 인공지능 모델 학습 비용을 효율적으로 절감할 것이다”라고 말했다.
이 연구 결과는 방제현 박사과정이 제1 저자로 참여하였고 컴퓨터 아키텍처 분야의 최우수 학술대회 중 하나인 미국 전기전자공학회(IEEE)·전산공학회(ACM) 공동 마이크로아키텍처 국제 학술대회(MICRO)에서 지난 11월 발표됐다. (논문제목: vTrain: A Simulation Framework for Evaluating Cost-Effective and Compute-Optimal Large Language Model Training, https://doi.org/10.1109/MICRO61859.2024.00021)
이번 연구는 정부(과학기술정보통신부)의 재원으로 한국연구재단, 정보통신기획평가원, 그리고 삼성전자의 지원을 받아 수행되었으며, 과학기술정보통신부 및 정보통신기획평가원의 SW컴퓨팅산업원천기술개발(SW스타랩) 사업으로 연구개발한 결과물이다.
2025.03.13
조회수 3838
-
챗GPT를 이용한 개인정보 악용 가능성 규명
최근 인공지능 기술의 발전으로 챗GPT와 같은 대형 언어 모델(이하 LLM)은 단순한 챗봇을 넘어 자율적인 에이전트로 발전하고 있다. 구글(Google)은 최근 인공지능 기술을 무기나 감시에 활용하지 않겠다는 기존의 약속을 철회해 인공지능 악용 가능성에 대한 논란이 불거진 점을 상기시키며, 연구진이 LLM 에이전트가 개인정보 수집 및 피싱 공격 등에 활용될 수 있음을 입증했다.
우리 대학 전기및전자공학부 신승원 교수, 김재철 AI 대학원 이기민 교수 공동연구팀이 실제 환경에서 LLM이 사이버 공격에 악용될 가능성을 실험적으로 규명했다고 25일 밝혔다.
현재 OpenAI, 구글 AI 등과 같은 상용 LLM 서비스는 LLM이 사이버 공격에 사용되는 것을 막기 위한 방어 기법을 자체적으로 탑재하고 있다. 그러나 연구팀의 실험 결과, 이러한 방어 기법이 존재함에도 불구하고 쉽게 우회해 악의적인 사이버 공격을 수행할 수 있음이 확인됐다.
기존의 공격자들이 시간과 노력이 많이 필요한 공격을 수행했던 것과는 달리, LLM 에이전트는 이를 평균 5~20초 내에 30~60원(2~4센트) 수준의 비용으로 개인정보 탈취 등이 자동으로 가능하다는 점에서 새로운 위협 요소로 부각되고 있다.
연구 결과에 따르면, LLM 에이전트는 목표 대상의 개인정보를 최대 95.9%의 정확도로 수집할 수 있었다. 또한, 저명한 교수를 사칭한 허위 게시글 생성 실험에서는 최대 93.9%의 게시글이 진짜로 인식됐다.
뿐만 아니라, 피해자의 이메일 주소만을 이용해 피해자에게 최적화된 정교한 피싱 이메일을 생성할 수 있었으며, 실험 참가자들이 이러한 피싱 이메일 내의 링크를 클릭할 확률이 46.67%까지 증가하는 것으로 나타났다. 이는 인공지능 기반 자동화 공격의 심각성을 시사한다.
제1 저자인 김한나 연구원은 "LLM에게 주어지는 능력이 많아질수록 사이버 공격의 위협이 기하급수적으로 커진다는 것이 확인됐다”며, "LLM 에이전트의 능력을 고려한 확장 가능한 보안 장치가 필요하다”고 말했다.
신승원 교수는 “이번 연구는 정보 보안 및 AI 정책 개선에 중요한 기초 자료로 활용될 것으로 기대되며, 연구팀은 LLM 서비스 제공업체 및 연구기관과 협력하여 보안 대책을 논의할 계획이다”라고 밝혔다.
전기및전자공학부 김한나 박사과정이 제1 저자로 참여한 이번 연구는 컴퓨터 보안 분야의 최고 학회 중 하나인 국제 학술대회 USENIX Security Symposium 2025에 게재될 예정이다. (논문명: "When LLMs Go Online: The Emerging Threat of Web-Enabled LLMs") DOI: 10.48550/arXiv.2410.14569
한편 이번 연구는 정보통신기획평가원, 과학기술정보통신부 및 광주광역시의 지원을 받아 수행됐다.
2025.02.24
조회수 4326
-
기후 변화가 뎅기열 확산 가속한다
뎅기열이 전 세계적으로 역대 최고 확산세를 기록하고 있는 가운데, 기후 변화가 뎅기열 확산을 가속한다는 분석이 나왔다. 우리 대학 수리과학과 김재경 교수 연구팀이 자체 개발한 수학 모델로 기후 변화가 뎅기열 발병에 미치는 영향을 분석한 결과, 필리핀의 기온 상승과 강우 패턴 변화가 뎅기열 발생 증가와 밀접한 관련이 있음을 밝혀냈다.
뎅기열은 모기를 통해 전파되는 바이러스성 감염병이다. 세계보건기구(WHO)에 보고된 감염 사례만 2000년 50만 명에서 2019년 520만 명으로 20년 만에 10배가량 가까이 증가했다. 급격한 증가의 주요 원인으로는 기후 변화가 지목된다. 이상 고온 현상과 극단 강우 현상이 모기 번식에 유리한 환경을 조성하기 때문이다.
하지만 기후 요인과 뎅기열 발병 사이의 복잡한 상호작용에 대한 이해는 아직 제한적이다. 특히, 강우량의 영향에 대해서는 학계의 오랜 논쟁이 있어 왔다. 높은 강우량이 뎅기열 발병을 유발한다는 결과와 억제한다는 결과가 비슷한 숫자로 존재하기 때문이다.
제1 저자인 올리비아 카위딩 연구원은 “이런 모순된 결과는 기존 연구가 기후와 뎅기열 간의 상호작용을 단순히 상관관계나 선형 회귀 모델에 기반해 분석했기 때문”이라며 “우리 연구진은 기존 방식을 넘어 비선형적이고 복합적인 기후 요인의 영향이 정확히 예측할 수 있는 도구를 활용해 연구를 진행했다”고 설명했다.
연구진은 자체 개발한 인과관계 추정 방법론인 ‘GOBI(General ODE-Based Inference)’를 활용해 2015~2019년 필리핀 16개 지역의 기후 및 뎅기열 데이터를 분석했다. 분석 결과, 모든 지역에서 기온 상승이 뎅기열 발병을 증가시키는 주요 요인으로 작용했다.
반면, 강우량의 경우 지역에 따라 서로 다른 영향을 미쳤다. 동부 지역에서는 강우량 증가가 뎅기열 발병을 증가시키는 경향을 보였으나, 서부 지역에서는 감소시키는 경향이 나타났다.
이어 연구진은 강우의 효과가 지역별로 달라지는 원인도 찾아냈다. ‘건기의 규칙성’이 강우와 뎅기열 발병 간의 관계를 결정짓는 중요한 요인이었다. 건기가 규칙적으로 유지되는 지역(서부)에서는 강우가 뎅기열 발병을 억제했지만, 규칙성이 약화된 지역(동부)에서는 강우가 뎅기열 발병을 촉진했다.
건기가 규칙적인 지역에서는 건기 동안 물이 고여 있는 모기 서식지가 강우에 의해 쉽게 제거돼 뎅기열 발생을 억제하는 ‘플러싱 효과(Flushing Effect)’가 강하게 나타난다. 이와 달리 건기가 불규칙적인 지역에서는 강우가 산발적으로 발생해 플러싱 효과가 약화되고, 오히려 모기 번식지를 형성해 뎅기열 발생을 촉진한다는 것이다.
이번 연구는 기후 변화가 뎅기열 발병에 미치는 복잡한 영향을 이해하고, 지역별 특성을 고려한 맞춤형 공중보건 전략을 설계하는 데 중요한 과학적 근거를 제공했다는 의미가 있다. 연구진은 필리핀 외의 지역으로 확장해 푸에르토리코 등 다른 지역에서도 유사한 패턴이 나타남을 확인했다. 다양한 기후 환경에 적용 가능한 일반성을 지닌다는 의미다.
연구를 이끈 김재경 교수는 “‘건기의 규칙성’은 기존 연구에서 간과된 부분으로 우리 연구는 뎅기열 발병에 대한 새로운 해석을 제공했다는 의미가 높다”며 “기후 변화가 뎅기열, 말라리아, 독감, 지카 등 기후 민감 질병에 미치는 영향을 이해하는 데 중요한 전환점을 제시한 것으로, 향후 자원 배분 및 예방 전략 수립을 위한 핵심 정보로 사용되길 바란다”고 말했다.
연구결과는 2월 13일(목) 04시(한국시간) 국제학술지 ‘사이언스 어드밴시스(Science Advances)’온라인판에 실렸다.
2025.02.13
조회수 3966
-
논문 마이닝부터 합성 조건 추천까지, MOF 연구를 혁신하는 대규모 언어 모델
우리 연구진이 챗GPT를 활용해 금속 유기 골격체(Metal-Organic Frameworks, MOFs) 연구 논문에서 실험 데이터를 자동으로 추출하는 데이터 마이닝 툴(이하 L2M3)을 개발했다. L2M3는 MOF의 합성 조건 및 물성 정보를 체계적으로 수집하며, 분류, 정보 식별 및 데이터 추출 작업에서 각각 98.3%, 97.3%, 95.3%의 높은 정확도를 기록했다. 또한, 추출한 데이터를 기반으로 MOF의 합성 조건을 추천하는 시스템을 개발하여 연구자들의 실험 과정 최적화를 지원하고 있어 화제가 되고 있다.
우리 대학 생명화학공학과 김지한 교수 연구팀이 대규모 언어 모델(이하 LLMs) 급격한 발전에 주목하며, 이를 활용을 통해 금속 유기 골격체 문헌에서 MOF의 합성 및 물성 정보를 대량으로 추출하는 데이터 마이닝 툴(L2M3)를 개발했다고 7일 발표했다.
최근 MOF에 대한 연구들이 활발히 진행되어 MOF 실험 데이터가 축적되고 있다. 이에 따라 MOF 연구의 발전을 위해서는 신뢰할 수 있는 실험 데이터 확보가 필수적이며, 특히 논문에 산재한 합성 조건과 물성 정보를 효과적으로 정리하는 것이 큰 과제로 남아 있다. 기존에도 MOF 관련 데이터를 활용하려는 시도가 있었으나, 대부분 일부 특정 특성에 국한되어 있어 있다는 한계점이 존재했다.
김지한 교수 연구팀이 개발한 L2M3는 LLM을 활용하여 쉽고 효율적인 데이터 마이닝 환경을 구축함으로써, 데이터 마이닝에 익숙하지 않은 연구자들도 손쉽게 사용할 수 있는 강력한 도구로의 잠재력을 갖추고 있다.
기존 데이터 마이닝 방식으로는 다양한 특성에 대한 정확한 정보 추출이 어려웠으나, L2M3는 LLM의 자연어 처리 능력을 활용하여 더 정밀한 데이터 추출이 가능하다. 특히, 분류(98.3%)와 정보 식별(97.3%)에서 높은 정확도를 기록했으며, 과정이 복잡하여 정확도 확보가 어려운 데이터 추출 단계에서도 95.3%라는 뛰어난 성능을 보였다.
뿐만 아니라, L2M3는 추출된 합성 조건 데이터를 대규모 언어 모델로 미세 조정해 합성 조건 추천 시스템을 개발하였다. 연구자가 전구체 정보를 입력하면 최적의 합성 조건을 제안하여 실험 과정에서 발생하는 시행착오를 줄이고, MOF 합성을 더욱 효율적으로 수행할 수 있도록 지원한다. 이러한 접근 방식은 MOF 연구뿐만 아니라 다양한 재료 과학 분야에서도 데이터 마이닝과 인공지능을 활용한 연구 패러다임을 새롭게 정의할 수 있는 가능성을 제시하고 있다.
김지한 교수는 “이번 연구는 인공지능을 활용한 재료 과학 연구의 새로운 기준을 제시하는 중요한 진전을 의미한다. L2M3는 방대한 과학 문헌에서 실험 데이터를 체계적으로 수집하고 분석함으로써, 기존 데이터 부족 문제를 해결하고 보다 신뢰성 높은 데이터 기반 연구를 가능하게 한다. 향후 L2M3의 데이터 처리 성능과 합성 조건 추천 모델이 더욱 정교화된다면, MOF뿐만 아니라 다양한 재료 연구에서도 혁신적인 발견을 가속화할 것으로 기대된다.” 라고 말했다.
생명화학공학과 강영훈, 이원석 박사, 배태언 박사과정이 공동 제1 저자로 참여한 이번 연구 결과는 국제 학술지 `미국 화학회지(Journal of the American Chemical Society)'에 지난 1월 21일 게재됐다. (논문명: Harnessing Large Language Models to Collect and Analyze Metal–Organic Framework Property Data Set)
한편 이번 연구는 과학기술정보통신부의 탑-티어 연구기관 간 협력 플랫폼 구축 및 공동연구 지원사업, 한국연구재단(NRF)의 나노 및 소재기술개발사업, 그리고 국가슈퍼컴퓨팅센터의 지원을 받아 수행됐다.
2025.02.07
조회수 4187
-
인간의 인지 방식과 유사한 AI 모델 개발
우리 연구진이 인간의 인지 방식을 모방해 이미지 변화를 이해하고, 시각적 일반화와 특정성을 동시에 확보하는 인공지능 기술을 개발했다. 이 기술은 의료 영상 분석, 자율주행, 로보틱스 등 다양한 분야에서 이미지를 이해하여 객체를 분류, 탐지하는 데 활용될 전망이다.
우리 대학 전기및전자공학부 김준모 교수 연구팀이 변환 레이블(transformational labels) 없이도 스스로 변환 민감 특징(transformation-sensitive features)을 학습할 수 있는 새로운 시각 인공지능 모델 STL(Self-supervised Transformation Learning)을 개발했다고 13일 밝혔다.
연구팀이 개발한 시각 인공지능 모델 STL은 스스로 이미지의 변환을 학습하여, 이미지 변환의 종류를 인간이 직접 알려주면서 학습하는 기존 방법들보다 높은 시각 정보 이해 능력을 보였다. 특히, 기존 방법론들을 통해 학습한 모델이 이해할 수 없는 세부적인 특징까지도 학습하여 기존 방법 대비 최대 42% 우수한 성능을 보여줬다.
컴퓨터 비전에서 이미지 변환을 통한 데이터 증강을 활용해 강건한 시각 표현을 학습하는 방식은 일반화 능력을 갖추는 데 효과적이지만, 변환에 따른 시각적 세부 사항을 무시하는 경향이 있어 범용 시각 인공지능 모델로서 한계가 있다.
연구팀이 제안한 STL은 변환 라벨 없이 변환 정보를 학습할 수 있도록 설계된 새로운 학습 기법으로, 라벨 없이 변환 민감 특징을 학습할 수 있다. 또한, 기존 학습 방법 대비 학습 복잡도를 유지한 채로 효율적인 최적화할 수 있는 방법을 제안했다.
실험 결과, STL은 정확하게 객체를 분류하고 탐지 실험에서 가장 낮은 오류율을 기록했다. 또한, STL이 생성한 표현 공간은 변환의 강도와 유형에 따라 명확히 군집화되어 변환 간 관계를 잘 반영하는 것으로 나타났다.
김준모 교수는 "이번에 개발한 STL은 복잡한 변환 패턴을 학습하고 이를 표현 공간에서 효과적으로 반영하는 능력을 통해 변환 민감 특징 학습의 새로운 가능성을 제시했다”며, "라벨 없이도 변환 정보를 학습할 수 있는 기술은 다양한 AI 응용 분야에서 핵심적인 역할을 할 것”이라고 말했다.
우리 대학 전기및전자공학부 유재명 박사과정이 제1 저자로 참여한 이번 연구는 최고 권위 국제 학술지 ‘신경정보처리시스템학회(NeurIPS) 2024’에서 올 12월 발표될 예정이다.(논문명: Self-supervised Transformation Learning for Equivariant Representations)
한편 이번 연구는 이 논문은 2024년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구 성과물(No.RS-2024-00439020, 지속가능한 실시간 멀티모달 인터렉티브 생성 AI 개발, SW스타랩) 이다.
2024.12.15
조회수 4892