-
세계 최고 DB 통합기술로 진짜 똑똑한 AI 에이전트 현실로
기업들은 오랫동안 데이터를 관리하는 데 관계형 데이터베이스(DB)를 써왔다. 하지만 거대 AI 모델 활용이 늘면서, 이제는 그래프 DB와의 통합 운영이 요구된다. 그러나 이 과정에서 비용 부담, 데이터 불일치, 복합 질의 처리의 어려움 같은 한계가 드러난다. 우리 연구진은 이 같은 문제를 단번에 해결할 수 있는 차세대 그래프-관계형 DB 시스템 개발에 성공했으며, 곧바로 산업 현장에 적용될 것으로 기대된다. 이 기술이 적용되면 AI는 단순 검색을 넘어 복잡한 연결 관계까지 실시간으로 추론할 수 있어, 한층 똑똑한 AI 서비스 구현이 가능해질 것이다.
우리 대학 전산학부 김민수 교수 연구팀이 관계형 DB와 그래프 DB를 완전 통합하여 그래프-관계형 질의를 한층 효율적으로 실행할 수 있는 새로운 DB 시스템 ‘키마이라(이하 Chimera)’를 개발했다고 8일 밝혔다. Chimera는 국제 성능 표준 벤치마크에서 기존 시스템 대비 최소 4배에서 최대 280배 빠른 질의 처리 성능을 입증하며 세계 최고 수준을 기록했다.
기존 관계형 DB와 달리, 그래프 DB는 데이터를 정점(노드)과 간선(연결선)으로 표현하는 구조를 가지고 있어 사람·사건·장소·시간처럼 복잡하게 얽힌 정보를 분석하고 추론하는 데 강점을 지닌다. 이러한 특징 덕분에 최근에는 AI 에이전트, SNS, 금융, 전자상거래 등 다양한 분야에서 활용이 빠르게 확산되고 있다.
이와 함께 관계형 DB와 그래프 DB 간의 복합 질의 처리 수요가 커지면서, 관계형 질의 언어(SQL)에 그래프 질의 기능을 확장한 신규 표준 언어 ‘SQL/PGQ’도 제안됐다.
SQL/PGQ는 기존 데이터베이스 언어(SQL)에 그래프 탐색 기능을 추가한 새로운 표준 언어로, 표(테이블) 형태의 데이터와 사람·사건·장소 등 연결 관계 정보를 한 번에 질의(검색)할 수 있도록 설계됐다. 이를 활용하면 ‘이 사람의 친구의 친구가 어느 회사에 다니는가’와 같은 복잡한 관계도 기존보다 훨씬 간단하게 검색할 수 있다.
문제는 지금까지의 접근 방식이 그래프 탐색을 억지로 조인 연산으로 흉내 내거나, 메모리에 그래프 뷰(view)를 미리 구성해 처리하는 방법에 의존했다는 점이다. 전자의 경우 탐색 단계가 깊어질수록 성능이 급격히 떨어지고, 후자의 경우 데이터 규모가 조금만 커져도 메모리 부족으로 실행이 실패한다. 또 원본 데이터 변경이 뷰에 즉시 반영되지 않아 데이터 최신성이 떨어지고, 관계형 결과와 그래프 결과를 따로 결합해야 하는 비효율이 뒤따랐다.
우리 대학 연구팀이 개발한 ‘Chimera(키마이라)’는 이러한 한계를 근본적으로 해결했다. 연구팀은 데이터베이스의 저장 계층과 질의 처리 계층을 모두 새롭게 설계했다.
연구팀은 우선 그래프 전용 저장소와 관계형 데이터 저장소를 함께 운영하는 ‘듀얼 스토어 구조’를 도입했다. 여기에 그래프 탐색과 관계형 연산을 동시에 처리하는 ‘탐색-조인 연산자’를 적용해, 복잡한 연산을 단일 체계에서 효율적으로 실행할 수 있도록 했다. 덕분에 Chimera는 데이터 저장부터 질의 처리까지 전 과정을 하나로 통합한 세계 최초의 그래프-관계형 DB 시스템으로 자리매김했다.
그 결과, 국제 성능 표준 벤치마크인 ‘LDBC Social Network Benchmark(SNB)’에서 기존 시스템 대비 최소 4배에서 최대 280배 빠른 성능을 기록하며 세계 최고 수준을 입증했다.
그래프 데이터의 규모가 아무리 커져도 메모리 부족으로 인한 질의 실패가 발생하지 않으며, 뷰를 사용하지 않기 때문에 데이터 최신성 측면에서도 지연 문제가 없다.
김민수 교수는 “데이터 간 연결 관계가 갈수록 복잡해지는 만큼, 그래프와 관계형 DB를 아우르는 통합 기술의 필요성이 커지고 있다”며 “Chimera는 이 문제를 근본적으로 해결한 기술로, 앞으로 AI 에이전트, 금융, 전자상거래 등 다양한 산업에서 널리 쓰일 것으로 기대한다”고 밝혔다.
이번 연구에는 전산학부 이건호 박사과정이 제1저자로, 김민수 교수의 창업기업 ㈜그래파이의 박정호 엔지니어가 제2저자로 참여했으며, 김 교수가 교신저자를 맡았다.
연구 성과는 지난 9월 1일, 세계적 권위의 데이터베이스 분야 국제학술대회 VLDB에서 발표됐다. 특히 새롭게 개발된 Chimera 기술은 ㈜그래파이가 출시 예정인 벡터-그래프-관계형 DB 시스템 ‘AkasicDB’에 적용돼, ‘RAG 기반 고성능 AI 에이전트(검색 능력을 갖춘 똑똑한 AI 비서)’ 구현을 위한 핵심 기술로 즉각적인 산업적 파급력이 기대된다.
※ 논문제목: Chimera: A System Design of Dual Storage and Traversal-Join Unified Query Processing for SQL/PGQ
※ DOI: https://dl.acm.org/doi/10.14778/3705829.3705845
한편, 이번 연구는 과기정통부 IITP SW스타랩과 한국연구재단 중견과제의 지원을 받아 수행됐다.
2025.09.08
조회수 2069
-
고온 실험 없이 AI로 '최적 합금' 예측 시대 연다
자동차와 기계 부품 등에 사용되는 강철 합금은 일반적으로 고온에서 녹이는(융해) 공정을 거쳐 제조된다. 이때 성분이 변하지 않고 그대로 녹는 현상을 ‘합치 융해(congruent melting)’라고 한다. 우리 연구진은 이처럼 고온 실험을 통해서만 가능했던 합금의 융해 특성을 인공지능(AI)으로 해결했다. 이번 연구는 고질적인 난제였던 합금이 녹을 때 서로 얼마나 잘 섞이는지를 미리 예측함으로써, 미래 합금 개발의 방향성을 제시한다는 점에서 주목받고 있다.
우리 대학 신소재공학과 홍승범 교수 연구팀이 미국 노스웨스턴대 크리스 울버튼(Chris Wolverton) 교수팀과 국제 공동연구를 통해, 밀도범함수이론(DFT)* 기반의 형성에너지(합금이 얼마나 안정적인지를 나타내는 값) 데이터를 활용해 합금이 녹을 때 성분이 유지되는지를 예측하는 고정확도 머신러닝 모델을 개발했다고 14일 밝혔다.
*밀도범함수이론(Density Functional Theory, DFT): 전자 밀도(electron density)를 기반으로 시스템의 전체 에너지를 계산하는 방법
연구팀은 밀도범함수이론을 통해 계산한 형성에너지와, 기존의 실험적 융해 반응 데이터를 머신러닝에 결합해 4,536개의 이원계 화합물에 대한 융해 반응 유형을 학습한 후, 그 예측 모델을 구성했다.
다양한 머신러닝 알고리즘 중 특히 ‘XGBoost’ 기반 분류 모델이 합금이 잘 섞이는지 여부에 대해 가장 높은 정확도를 보였으며, 약 82.5%의 예측 정확도를 달성했다.
연구팀은 또한 샤플리(Shapley) 기법*을 활용해 모델의 주요 특징(feature)들을 분석했으며, 이 중에서도 기울기 변화가 크다는 것은 그 조성에서 에너지적으로 매우 유리한(=안정한) 상태가 형성된다는 뜻으로 ‘형성에너지 곡선의 기울기 변화(convex hull sharpness)’가 가장 중요한 인자로 도출됐다.
*샤플리기법: AI가 어떤 이유로 그렇게 판단했는지를 알려주는 설명 도구
이번 연구의 가장 큰 의의는 고온 실험 없이도 소재의 융해 반응 경향성을 예측할 수 있다는 점이다. 이는 특히 고엔트로피 합금이나 초내열 합금 등 실험이 어려운 소재 군에서 매우 유용하며, 향후 복잡한 다성분계 합금 설계에도 확장될 수 있다.
또한, AI 모델이 도출한 주요 물리량은 합금이 잘 변하고, 안정적인지 등에 대한 실제 실험 결과와 높은 일치도를 보였고, 향후 다양한 금속재료 개발 및 구조 안정성 예측 등 널리 활용될 수 있을 것으로 기대된다.
홍승범 교수는 “이번 연구는 계산과 실험 데이터, 그리고 머신러닝의 융합을 통해 기존의 경험적 합금 설계 방식에서 벗어나 데이터 기반의 예측적 소재 개발이 가능하다는 가능성을 보여준 사례”라며 “향후 생성형 모델, 강화학습 등의 최신 AI 기술을 접목하면 완전히 새로운 합금을 자동으로 설계하는 시대가 열릴 것”이라고 말했다.
신소재공학과 최영우 박사과정 연구원이 제1 저자로 참여한 이번 연구는 미국물리협회(American Institute of Physics, AIP)에서 발간하는 머신러닝 분야의 권위 있는 학술지인 ‘APL 머신러닝(Machine Learning)’ 5월호에 게재 및 ‘특집 논문(Featured article)’로 선정됐다.
※ 논문 제목: Machine learning-based melting congruency prediction of binary compounds using density functional theory-calculated formation energy
※ DOI: https://doi.org/10.1063/5.0247514
한편, 이번 연구는 과학기술정보통신부와 한국연구재단의 지원으로 수행됐다.
2025.07.14
조회수 2849
-
산업디자인학과, 인간-컴퓨터 분야 세계최고 학술대회 최우수·우수논문상 4편 수상
산업디자인학과가 인간-컴퓨터 상호작용(HCI) 분야 최고 권위의 국제학술대회인 ACM CHI 2024에서 최우수 논문상(Best Paper) 1편과 우수 논문상(Honorable Mention) 3편을 수상했다. 최우수 논문상은 전체 게재 논문 중 상위 1%, 우수 논문상은 상위 5%에 해당되는 논문에 수여되는 명예로운 성과로, 기술과 디자인 융합 연구의 우수성을 세계적으로 입증한 결과다.
올해 CHI(ACM Conference on Human Factors in Computing Systems) 2025에는 5,014편의 논문이 접수되어 1,249편이 채택되었다. KAIST 산업디자인학과는 이 중 15편의 논문을 게재하는 성과를 거뒀고 그 중 4편이 수상작으로 선정되었다. 특히 ‘인간과 AI 간 상호작용(Human-AI Interaction)’에 대한 관심이 높아진 가운데, 5,000명 이상의 연구자가 참석해 역대 최대 규모로 대회가 개최되었다.
최우수 논문상- AI기반 자폐 아동 소통 도구 ‘AAcessTalk’
홍화정 교수팀은 네이버, 도닥임 아동발달센터와의 공동 연구를 통해 AI 기반 도구 액세스톡(AACessTalk)을 개발했다. 이 시스템은 발화를 하지 않는 자폐 아동에게는 개인화된 어휘를, 부모에게는 문맥 기반 대화 가이드를 제공한다. 연구 결과, 아동은 자신의 의사를 보다 분명히 표현할 수 있었고, 부모는 기능적 언어 교육보다 본질적인 소통에 집중할 수 있게 되면서 양육 효능감이 높아지는 효과가 관찰되었다. 해당 연구를 주도한 최다솜 박사과정은 신경다양인을 포용하는 AI 기술을 꾸준히 탐구해 왔으며, 이번 논문은 네이버 인턴십에서 수행한 연구 결과를 바탕으로 출판한 것이다.
우수 논문상- 인간과 AI 상호작용 탐색
남택진 교수팀(주저자 조형준 박사)의 ‘ShamAIn’은 한국 무속 신앙에서 영감을 받은 AI 신당으로, 인간보다 더 뛰어난 초지능 존재로 기능하는 AI와 인간의 상호작용을 탐구했다. 다수의 사용자들은 처음엔 호기심에서 시작했지만, 점차 개인적인 고민을 털어놓으며 심리적 위안을 얻는 경험을 보고했다. AI가 단순한 정보 제공자를 넘어 감정적 지지와 권위적 판단까지 수행할 수 있는 존재로 인식될 수 있음을 보여주는 연구다.
임윤경 교수팀(주저자 박수빈 박사과정)은 걸음 수, 감정 기록 등 다양한 개인 데이터를 생성형 AI를 활용해 시각 이미지로 변환하는 프로토타입을 개발하여 21일간 사용자 경험을 탐색했다. 참가자들은 자신의 개인 데이터를 이미지 생성 모델 DALL-E 3로 만든 시각 자료로 다시 돌아보며 새로운 자기 인식을 경험했다. 이는 AI가 자기 성찰의 도구로 활용될 수 있음을 제시하는 연구다.
안드레아 비앙키 교수팀은 시드니대학과 협력하여 가상현실(VR) 환경에서의 '가상 팔' 제어 실험을 진행했다. 사용자들은 반복적이고 중요도가 낮은 작업은 가상의 팔에 맡기고, 중요한 작업은 직접 제어하는 방식을 선호했다. 본 연구는 가상 신체 제어가 필요한 로봇, 게임, 재활, 보조공학 디자인에 실질적 시사점을 제공한다.
이번 수상 논문들은 디자인이 기술을 사람 중심으로 연결하고, AI의 사회적·심리적 영향을 설계하는 역할로 확장될 수 있음을 실증적으로 보여주었다는 점에서 의의가 크다.
석현정 산업디자인학과 학과장은 “이번 수상은 기술 중심의 AI 연구를 인간 중심의 디자인 관점에서 새롭게 해석하고, 이를 실생활 문제 해결로 연결 시킨 우리 학과 연구진들의 역량을 세계적으로 인정받은 결과”라며, “디자인이 기술 혁신의 파트너로서 어떤 역할을 할 수 있는지를 보여준 좋은 사례”라고 전했다.
2025.05.19
조회수 8042
-
VR 정밀포인팅·안무 창작 기술, 세계 최고 CHI 학회 2관왕
가상공간에서는 정확하게 포인팅이 되지 않으면 원하는 대상을 정확히 선택하기 어렵고, 몰입이 깨지는 어색한 경험을 하게 된다. KAIST 연구진이 가상공간에서 생생하게 실제 체험하는 느낌을 주는 기술을 개발했으며 또한 안무가들의 안무 동작을 쉽게 만들고 창작을 돕도록 하는 기술도 개발했다.
우리 대학 문화기술대학원 윤상호 교수 연구팀이 미국 UCLA(University of California, Los Angeles)의 양장(YangZhang) 교수와 공동연구를 진행한 ‘티투아이레이(T2IRay)’ 기술과 가상현실에서 안무가들이 창작 작업을 보다 자유롭고 창의적으로 진행할 수 있도록 돕는 ‘코레오크래프트(ChoreoCraft)’ 기술을 개발했다. 이 기술들은 인간-컴퓨터 상호작용 분야 최우수 국제학술대회인(CHI) 2025*에서 상위 5%에 주어지는 우수 논문상(Honorable Mention)을 동시 2개 수상했다.
*인간-컴퓨터 상호작용 분야 최우수 국제학회(CHI): 4월 25일부터 5월 1일까지 열린 세계 컴퓨터 연합회(ACM) 주최 인간-컴퓨터 상호작용 학술대회(Conference on Human Factors in Computing Systems, CHI 2025)
티투아이레이(T2IRay)는 기존의 단편적인 엄지와 검지(Thumb to Index) 제스처를 확장하여, 가상공간 안의 물체를 자유롭고 정밀하게 조작이 가능하게 하는 새로운 입력 방식을 제안한다.
기존에는 손의 위치나 방향이 달라져도 입력이 끊기거나 정확도가 떨어지는 문제가 있었으나, 티투아이레이에서는 손의 위치나 방향과 관계없이 정밀한 포인팅이 가능하도록 하여 사용자가 훨씬 자연스럽고 끊김없이 조작할 수 있도록 했다.
특히, 손가락 관계성을 바탕으로 로컬 좌표계를 활용하여 손 위치 및 방향에 관계없이 연속적인 입력이 가능하도록 하였다. 엄지의 섬세한 움직임을 좌표계 안에서 매핑하여 정밀하게 인식하고, 고개를 움직이는 자연스러운 동작까지 입력에 반영하여 넓은 범위에서도 자유로운 조작이 가능하다.
윤상호 교수는 “티투아이레이는 손이 고정되지 않은 다양한 상황에서도 부드럽고 안정적인 조작을 가능하게 함으로써 증강·가상현실(AR/VR)에서도 사용자 경험을 획기적으로 향상시킬 수 있다”라고 설명했다.
KAIST 김진아 박사과정이 제 1저자인 이번 연구는 과학기술정보통신부 한국연구재단이 주관하는 우수신진연구지원사업과 정보통신기획평가원(IITP)에서 지원하는 대학ICT연구센터(ITRC) 육성지원사업의 지원을 받았다.
▴ 논문명 : T2IRay: Design of Thumb-to-Index based Indirect Pointing for Continuous and Robust AR/VR Input
▴ 논문 링크: https://doi.org/10.1145/3706598.3713442
▴ T2IRay: https://youtu.be/ElJlcJbkJPY
또한, 윤상호 교수 연구팀은 가상현실에서 안무가들이 창작 작업을 보다 자유롭고 창의적으로 진행할 수 있도록 돕는 ‘코레오크래프트(ChoreoCraft)' 기술을 개발했다.
전문 안무가 대상의 경험 조사를 통해 창작 과정 내 안무가들이 직면하는 동작을 일일이 기억해야 하거나 아이디어가 막히는 경우, 그리고 명확하지 않은 피드백으로 인한 어려움을 개선하고자 했다.
이 기술은 가상현실(VR) 공간에서 춤 동작을 모션 캡쳐 기반의 아바타와 상호작용을 통해 직접 동작을 저장하고 수정할 수 있도록 하여 기억 의존을 줄였으며 음악 및 이전 동작과의 자연스러운 연결을 고려하여 새로운 안무를 추천해 창작을 도왔다. 또한 균형감, 안정성, 활성도 등 운동학적 요소를 분석하여 수치 기반 안무 피드백을 제공함으로써 창작 과정의 객관성도 높였다.
윤상호 교수는 “코레오크래프트는 안무가들이 직면하는 주요 어려움을 해결하고 창의성과 효율성을 향상시킬 수 있는 도구로 실제 안무가를 대상으로 한 사용자 실험에서도 창의적 아이디어 발굴과 정량적 피드백 제공 측면에서 높은 만족도를 얻었다. ”라 설명하며, “앞으로도 공간 컴퓨팅을 넘어 피지컬 인공지능(Physical AI)과 인간-컴퓨터 상호작용(HCI) 기술을 융합해, 실세계와 가상세계에서 인간의 능력을 확장하는 인간 중심 인터랙션 연구를 이어갈 것”이라고 밝혔다.
정경은 박사과정과 한현영 석사과정 연구원이 공동 제1 저자인 해당 연구는 문화체육관광부에서 시행한 문화예술실감서비스개발사업인 실시간 실가상 융합 기반 공연예술 교육 플랫폼 기술개발의 지원 아래 한국전자통신연구원(ETRI) 및 ㈜원밀리언(대표 김혜랑)과 협업을 통해 진행됐다.
▴ 논문명 : ChoreoCraft: In-situ Crafting of Choreography in Virtual Reality through Creativity Support Tool
▴ 논문 링크: https://doi.org/10.1145/3706598.3714220
▴ Choreocraft: https://youtu.be/Ms1fwiSBjjw
2025.05.13
조회수 5462
-
음악 창작 돕는 작곡 AI 동료 ‘어뮤즈’ 공개
음악 창작자가 초기 아이디어를 생각하거나 창작 중간 막힐 때, 이를 같이 해결해 주고 다양한 음악적 방향 탐색에 실질적인 도움을 주는 동료가 있다면 얼마나 좋을까? KAIST 연구진이 이런 음악 창작을 돕는 동료 작가와 같은 AI 기술을 개발했다.
KAIST(총장 이광형)는 전기및전자공학부 이성주 교수 연구팀이 AI 기반 음악 창작 지원 시스템 어뮤즈(Amuse)를 개발하였다. 이 연구 결과는 4월 26일부터 5월 1일까지 일본 요코하마에서 열린 인간-컴퓨터 상호작용 분야 세계 최고 권위의 국제학술대회인 CHI(ACM Conference on Human Factors in Computing Systems)에서 전체 논문 중 상위 1%에게만 수여되는 최우수 논문상(Best Paper Award)을 수상했다고 7일 밝혔다.
이성주 교수 연구팀이 개발한 어뮤즈(Amuse) 시스템은 텍스트, 이미지, 오디오와 같은 다양한 형식의 영감을 입력하면 이를 화성 구조(코드 진행)로 변환해 작곡을 지원해 주는 AI 기반 시스템이다.
예를 들어, 사용자가 ‘따뜻한 여름 해변의 기억’과 같은 문구나 이미지, 사운드 클립을 입력하면, 어뮤즈는 해당 영감에 어울리는 코드 진행을 자동으로 생성해 제안한다.
기존의 생성 AI와 달리, 어뮤즈는 사용자의 창작 흐름을 존중하고, AI의 제안을 유연하게 통합·수정할 수 있는 상호작용 방식을 통해 창의적 탐색을 자연스럽게 유도한다는 점에서 차별성을 갖는다.
어뮤즈 시스템의 핵심 기술은 대형 언어 모델의 이용해 사용자의 영감으로 프롬프트에 입력한 글자 따라 이에 어울리는 음악 코드를 생성하고, 실제 음악 데이터를 학습한 AI 모델이 부자연스럽거나 어색한 결과는 걸러내는(리젝션 샘플링) 과정을 거쳐 결합한 두 가지 방법을 자연스럽게 이어 재현하는 하이브리드 생성 방식이다.
연구팀은 실제 뮤지션들을 대상으로 한 사용자 연구를 수행하여, 어뮤즈가 단순한 음악 생성 AI가 아닌, 사람과 AI가 협업하는 창작 동반자(Co-Creative AI)로서의 가능성이 높다는 평가를 받았다.
KAIST 전기 및 전자공학부 박사과정 김예원, 이성주 교수, 카네기 멜런 대학의 크리스 도너휴(Chris Donahue) 교수가 참여한 해당 논문은 학계 및 산업계 모두의 창의적 AI 시스템 설계의 가능성을 보여주었다.
※ 논문명 : Amuse: Human-AI Collaborative Songwriting with Multimodal Inspirations DOI : https://doi.org/10.1145/3706598.3713818
※ 연구 데모 영상: https://youtu.be/udilkRSnftI?si=FNXccC9EjxHOCrm1
※ 연구 홈페이지: https://nmsl.kaist.ac.kr/projects/amuse/
이성주 교수는 “ 최근 생성형 AI 기술은 저작권이 있는 콘텐츠를 그대로 모방하여 창작자의 저작권을 침해하거나, 창작자의 의도와는 무관하게 일방향으로 결과물을 생성한다는 점에서 우려를 낳고 있다. 이에 연구팀은 이러한 흐름에 문제 의식을 가지고, 창작자가 실제로 필요로 하는 것이 무엇인지에 주목하며 창작자 중심의 AI 시스템 설계에 주안점을 두었다.”라고 말했다.
이어 ”어뮤즈는 창작자의 주도권을 유지한 채, 인공지능과의 협업 가능성을 탐색하는 시도로, 향후 음악 창작 도구와 생성형 AI 시스템의 개발에 있어 보다 창작자 친화적인 방향을 제시하는 출발점이 될 것으로 기대된다.“라고 설명했다.
이 연구는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행되었다.(RS-2024-00337007)
2025.05.07
조회수 8380
-
지금 당신의 마음 건강은 어떠한가요?
최근 빠른 고령화 및 출산율 감소 등으로 1인 가구가 급속하게 증가하면서, 1인 가구의 정신건강 문제에 대한 관심도 함께 높아지고 있다. 서울시가 실시한 1인 가구 실태조사에 따르면, 1인 가구의 60% 이상이 외로움을 느끼고 있으며, 특히 사회적 고립과 함께 외로움을 겪는 비율이 상당히 높은 것으로 나타났다.
우리 대학 전산학부 이의진 교수 연구팀이 1인 가구의 정신건강 관리를 위해, 사용자 스스로가 자신의 심리 상태를 기록할 수 있도록 지원하는 상황 인식 기반 멀티모달 스마트 스피커 시스템을 개발했다고 24일 밝혔다.
연구팀은 사용자의 주변 상황을 실시간으로 파악해 최적의 시점에 정신건강 관련 질문하도록 이 시스템을 설계했고 기존의 무작위 설문보다 높은 응답률을 달성하는 것을 확인했다.
기존 스마트 스피커를 활용한 정신건강 자가 추적 연구에서 무작위 설문을 할 경우 사용자의 스트레스, 짜증 등 부정적인 감정이 유발시켜 설문 응답에 편향이 발생할 수 있어 각별한 주의가 필요했다.
이러한 문제 해결을 위해 이의진 교수 연구팀은 스마트 스피커에 멀티 모달 센서를 장착해, 사용자의 주변 상황의 변화를 감지해 스피커가 말 걸기 좋은 시점이 검출되면 정신건강 자가 추적 설문을 능동적으로 요청하는 상황 인식 기반 자가 추적 기술을 개발했다.
스피커는 실내 움직임, 조명, 소음, 이산화탄소 등 다양한 센서 데이터를 종합적으로 분석해 사용자의 존재 및 활동을 감지한 뒤, 사용자가 응답하기 적합한 시점에 자가 추적 설문을 능동적으로 요청함으로써, 설문 응답의 효율성을 극대화했다.
또한, 설문 입력 방식의 경우 최근 출시된 스마트 스피커는 명령뿐만 아니라 터치스크린도 지원하므로 사용자들이 음성 또는 터치 입력 방식을 자유롭게 선택할 수 있도록 해 상호작용의 폭을 넓혔다. 이를 통해 사용자는 상황에 맞는 최적의 인터페이스를 선택해 자가 추적을 쉽게 수행할 수 있도록 했다.
개발된 스피커의 사용자 경험을 평가하기 위해서 연구팀은 1인 가구 20세대에 자가 추적 스마트 스피커를 설치해, 한 달 동안 실증 연구를 수행해서 총 2,201개의 정신건강 설문 응답 데이터셋을 구축했다.
데이터셋 분석을 통해 설문 응답 시간, 활동 맥락에 따른 설문 응답 패턴 및 어떤 상황에서 음성 입력(VUI) 또는 터치 입력(GUI)이 더 선호되는지 파악했다.
특히, 스마트 스피커가 말로 사용자에게 요청을 하다 보니 스피커 근처에서 사용자의 활동을 감지하는 것이 정신건강 설문 응답률에 큰 영향을 미쳤다. 음성 입력의 편의성에도 불구하고 전반적으로 참가자들은 음성 입력보다는 빠른 응답이 가능한 터치 입력을 선호했다.
데이터 분석 결과, 사용자의 주변 상황을 실시간으로 파악해 최적의 시점에 정신건강 관련 질문을 할 경우 응답률이 더 높으며, 어떤 상황에서 음성 또는 터치 인터페이스를 선호하는지도 파악했다.
연구를 주도한 이의진 교수는 “이번에 개발한 스마트 스피커를 앞으로 수용전념치료 기법을 활용한 인간상담사와 같은 기능의 정신건강 관리 지원 스마트 스피커로 발전시키고자 한다. 나아가 실내에서 수집된 일상생활 데이터를 AI 모델로 학습해 사용자 정신건강 상태에 따라 라이프 스타일 패턴을 예측하는 시스템도 개발하여 향후 정신질환 조기 발견과 효율적인 관리를 가능케 할 인공지능 에이전트의 혁신을 이끌 것으로 기대된다” 라고 말했다.
한편 이 연구는 LG전자-KAIST 디지털 헬스케어 연구센터의 지원을 받아 수행됐고 인간 컴퓨터 상호작용(HCI) 분야 국제 최우수 국제학술대회인 미국컴퓨터협회(ACM) 소속 ‘Conference on Human Factors in Computing Systems (CHI)’에서 지난 2024년 5월에 발표됐다.
논문명: Exploring Context-Aware Mental Health Self-Tracking Using Multimodal Smart Speakers in Home Environments
2024.09.24
조회수 6765
-
산업디자인학과, 프랑스 파리에서 올림픽 기념 특별기획전 참여
우리 대학이 프랑스 현지에서 이달 23일부터 10월까지 열리는 2024 파리올림픽 기념전 <한국의 놀이> 특별기획전에 참여한다. 올림픽의 어원에 있는 '놀이'를 재해석하고 과거·현재·미래를 아울러 다채로운 한국의 놀이문화를 다루는 전시로 주 프랑스한국문화원이 주최한다. 한국과 프랑스의 다양한 문화예술기관과 기업 등이 협력하며, 우리 대학 산업디자인학과(학과장 이우훈) 7개 연구실이 연구·교육기관 소속으로는 유일하게 참여한다.
우리 대학이 전시를 맡은 '미래의 놀이 실험실'에서는 산업디자인 연구의 최전선이라 할 수 있는 디자인·예술·공학이 융합된 전시를 통해 미래의 놀이가 나아갈 방향성을 제시한다.▴창의적인 놀이 활동을 통해 융합 교육을 도와주는 증강현실 시스템을 선보이는 남택진 교수팀의 '오토마타스테이지(Automata Stage)' ▴최신 인공지능 기술로 퍼스널 컬러를 진단하는 석현정 교수팀의 '어센틱 컬러 플레이(Authentic Color Play)' ▴손가락 사이에 있는 가상의 물체를 사용자가 느끼게 하는 햅틱 컨트롤러와 웨어러블 디바이스를 소개하는 안드레아 비앙키 교수팀의 '스피노키오와 스피노키엣또(SpinOcchio & SpinOcchietto)' 등 사용자 체험형 전시가 마련된다. ▴전등 갓의 모양 변화에 따라 램프에서 나오는 빛의 강도와 방향을 바꿀 수 있는 배상민 교수팀의 키네틱 조명 '딜라이트(D'light)' ▴전기차 기술을 활용해 미래 모빌리티 디자인의 비전을 제시하는 박현준 교수팀의 '부가티 '숨'(Bugatti Le Souffle)' 등 제품 및 모빌리티 디자인도 선보인다. ▴지구 온난화로 인해 위협받는 빙하의 메시지를 전하는 인터랙티브 아트 설치 작품을 선보이는 이우훈 교수팀의 '스노우 메시지(Snow Message)' ▴인류세의 모습들을 상징적으로 표현하는 웹 기반 인터랙티브 작품인 강이연 교수팀의 '미지의 영토(Uncharted Territory)' 등 인터랙션 디자인도 함께 관람할 수 있다.
우리 대학 산업디자인학과는 인터랙션 디자인과 인간-컴퓨터 상호작용(HCI) 분야에서 세계적으로 인정받는 우수한 연구성과를 보유하고 있다. 올림픽 개최지에서 5개월간 진행되는 이번 전시를 통해 기술·공학 분야는 물론 문화·인문학적으로도 뛰어난 융복합 연구성과를 전 세계 방문객들에게 소개할 방침이다. 이우훈 산업디자인학과장은 "한국인의 감성으로 기술을 인간화한 7개의 전시 작품은 한국적 디자인의 정체성을 전 세계 관람객들에게 각인하는 계기가 될 것으로 기대하고 있다"라고 전했다. 이어, "학계를 중심으로 성과를 인정받아 온 연구자들에게는 이번 전시가 디자인과 문화예술의 접점을 모색하고 연구의 지평을 넓혀가는 새로운 도전이 될 것"이라고 덧붙였다.
2024.05.23
조회수 10666
-
식이장애 환자의 건강한 다이어트를 유도하다
최근 SNS와 다양한 컴퓨터 플랫폼에 각종 음식 관련 콘텐츠가 제공되며 인기를 얻고 있다. 하지만 누군가에게는 '먹는 행위'가 자연스러움에 반해, 식이장애를 앓는 사람들은 건강하지 않은 식습관의 매혹에 매일 지속해서 고군분투한다. KAIST 연구팀이 식이장애를 앓는 사람들을 위해 모바일과 개인 컴퓨터에서 유해한 디지털 음식 콘텐츠 및 먹방 ASMR 등을 차단하는 시스템(FoodCensor)을 개발해서 화제다.
우리 대학 전기및전자공학부 이성주 교수 연구팀이 지난 5월 11일부터 5월 16일에 미국 하와이에서 열린 세계컴퓨터연합회(ACM) 주최로 진행된 컴퓨터 인간 상호작용 학술대회(International Conference on Human-Computer Interaction, 이하 CHI)에서 식이장애 환자들의 무분별한 디지털 음식 콘텐츠 소비로 인한 악영향을 방지하기 위한 실시간 개입 시스템 논문으로 최우수 논문(Honorable Mention)상을 받았다고 20일 밝혔다.
이 시스템은 인간 심리학의 두 체계 이론(Dual Systems Theory)에서 영감을 받아, 소셜 미디어 사용자가 디지털 음식 콘텐츠를 소비할 때 더 의식적으로 평가한 후에 시청에 관한 결정을 내릴 수 있도록 한다.
디지털 음식 콘텐츠의 시각적 및 청각적 자극은 체계 1*을 자극해 사용자의 자동적인 반응(반사적인 콘텐츠 시청 등)을 유발할 수 있다. 하지만 본 시스템은 실시간으로 음식 콘텐츠를 가리고 음소거 함으로써 이러한 자동적인 반응을 차단하고, 대신 사용자에게 의식적인 콘텐츠 선택 및 소비를 위한 질문을 제공함으로써 체계 2**를 활성화해 사용자가 더 의식적이고 건강한 콘텐츠 소비를 할 수 있도록 돕는다.
*체계 1: 빠르고 자동으로 작용하는 체계로, 우리가 의식적으로 고려하지 않고도 일상적인 상황에 대응하게 한다. 예를 들어, 길을 걷다가 갑자기 차가 다가오면 빠르게 물러나는 것은 체계 1의 반응임
**체계 2: 천천히 심사숙고 후 판단하는 체계다. 예를 들어, 수학 문제를 풀거나 긴급 상황에서 명확한 결정을 내릴 때 체계 2가 사용됨
연구팀은 22명의 식이장애 환자를 대상으로 3주간의 사용자 스터디를 진행해 시스템 평가를 진행했다. 실험 집단에서 유튜브에서 음식 콘텐츠에 대한 노출 및 소비의 유의미한 감소와, 이러한 감소가 유튜브의 콘텐츠 추천 알고리즘에 영향을 미침을 관찰했다. 실험 집단 참가자들은 본 시스템이 음식 관련 콘텐츠를 시청하는 자동 반응을 억제하는 데 중요한 역할을 했다고 평가했으며, 이는 본 시스템이 두 체계 이론의 체계 1을 억제하고 체계 2를 촉진함을 입증한다. 사용자 평가는 제안된 시스템이 일상생활에서 식이장애 환자들의 음식에 대한 강박을 완화하고 더 나은 삶의 질을 제공한다는 점을 시사한다.
연구를 주도한 이성주 교수는 “이 시스템을 활용하여 사용자가 디지털 콘텐츠를 건강하게 소비하는 방법을 지원하는 적응형 개입의 설계 방향과 더불어, 단순히 콘텐츠를 검열하는 것 이상의 사용자의 의도적인 행동 변화를 촉진하는 사용자 중심의 콘텐츠 관리 방법이 될 것이다”라고 설명했다. 또한 “개발된 기술은 음식 콘텐츠뿐 아니라, 폭력물이나 선정적인 콘텐츠, 또는 다양한 주제별로 적용할 수 있어 파급효과를 기대할 수 있다.라고 말했다.
이번 연구에는 전기및전자공학부 최류해랑 박사과정이 제1 저자, 박수빈 석사과정이 제2 저자, 한수진 석박통합과정이 제3 저자, 그리고 이성주 교수가 교신 저자로 참여했다. 이번 연구는 5월 미국 하와이에서 열린 인간-컴퓨터 상호작용 최고 권위 국제학술 대회인 CHI(ACM Conference on Human Factors in Computing Systems)에서 발표됐으며 (논문명: FoodCensor: Promoting Mindful Digital Food Content Consumption for People with Eating Disorders), 최우수논문상(The Best Paper Honorable Mention Award)을 수상했다.
한편 이 연구는 과학기술정보통신부의 재원으로 정보통신기획평가원의 지원을 받아 수행됐다. (No. 2022-0-00064, 감정노동자의 정신건강 위험 예측 및 관리를 위한 휴먼 디지털 트윈 기술 개발)
2024.05.20
조회수 9664
-
인공지능으로 파킨슨병 맞춤형 치료 가능
파킨슨병 같은 만성 퇴행성 뇌 질환의 경우, 생존 환자의 뇌세포에 직접 접근이 제한적이기 때문에, 뇌 질환 환자의 세포 데이터를 토대로 환자 질병의 메커니즘 하위 유형을 인공지능으로 예측하는 것은 시도된 바가 없다.
우리 대학 뇌인지과학과 최민이 교수 연구팀이 영국 프랜시스 크릭 연구소(Francis Crick Institute)와의 공동 연구로 파킨슨병 환자의 개인별 질병 하위 유형을 예측하는 인공지능 기반의 플랫폼을 개발했다고 15일 밝혔다.
최민이 교수 연구팀이 개발한 플랫폼은 파킨슨병 환자의 역분화 만능 줄기세포(hiPSC)에서 분화된 신경 세포의 핵, 미토콘드리아, 리보솜 이미지 정보만 학습해 파킨슨 환자의 병리적 하위 유형을 정확하게 예측한다.
이 기술을 활용하면 환자별로 다르게 나타나는 파킨슨병 양상을 겉으로 보이는 발현형이 아닌 생물학적 메커니즘별로 분류할 수 있다. 이를 통해 원인 미상의 파킨슨병 환자가 속한 분자 세포적 하위 유형별로 진단이 가능해져 환자 맞춤형 치료의 길을 열 수 있다. 또 이 플랫폼은 고속의 대량 스크리닝 시스템을 사용하기 때문에 병리적 하위 유형에 적합한 맞춤형 약물 개발 파이프라인으로도 활용될 수 있다.
지금까지 파킨슨병의 치료는 환자 개별의 병리 상태를 고려하지 않고 확률에 기댄 ‘일률적 접근’ 방식을 사용해 왔다. 이러한 접근 방식은 병리적 원인과 치료 방법 사이의 불일치로 인해 치료 효과를 향상하기 어려웠다.
최민이 교수 연구팀이 개발한 플랫폼을 사용하면 개별 환자 뇌세포의 분자 및 세포 정보를 정밀하게 프로파일링할 수 있다. 이를 토대로 환자들의 질병 하위 유형을 정확히 진단할 수 있어서 궁극적으로 ‘정밀 의학 (Precise medicine)’이 가능해진다. 이는 각 개인에게 맞춤화된 치료 (Personalized medicine)로 이어져 치료 효과를 크게 향상할 수 있을 것으로 기대된다.
이 플랫폼은 2012년 노벨의학상 수상 기술인 유도만능줄기세포(iPSC: 성인 피부세포나 혈액에서 얻은 체세포를 태아기의 미분화 상태로 리프로그래밍한 세포. 어떤 장기 세포로도 분화가 가능)를 분화시켜 얻은 뇌세포를 사용하는 ‘접시 속 질병(disease in a dish)’ 패러다임이다. 이는 퇴행성 뇌 질환처럼 병변을 직접 얻을 수 없거나, 인간의 뇌를 정확하게 모사할 수 없는 동물 모델의 한계점을 극복할 수 있는 기술 중 하나로 주목받고 있다. 특히, 접시 속에 배양한 자신의 표적 질병 세포를 순차적으로 이미징하면 일련의 병리적 사건을 추적할 수 있어 질병 진행에 따른 약물 반응 결과를 예측할 수 있다는 이점이 있다.
교신 저자인 최민이 교수는 "이번 연구는 실험실에서 얻은 생물학적 데이터를 인공지능에 효과적으로 학습시켜, 정확도가 높은 질병 하위 유형 분류 모델을 생성하는 방법을 구체적으로 소개했다”며, "이 플랫폼은 자폐 스펙트럼과 같이 환자 개인별 증상이 뚜렷하게 다른 뇌 질환의 하위 유형을 분류하는 데에도 유용할 것이며, 이를 통해 효과적인 치료법 개발도 가능해질 것이다”라고 연구의 의의를 설명했다.
이번 논문은 영국 Medical Research Council (MRC)와 대교-KAIST 인지 향상 연구센터의 지원으로 수행됐으며, 국제 학술지 ‘네이처 머신 인텔리젼스 (Nature Machine Intelligence, IF = 25.8) 8월호에 출판됐다 (논문명: Prediction of mechanistic subtypes of Parkinson’s using patient-derived stem cell model)
2023.08.16
조회수 12570
-
이의진 교수, 미 컴퓨터협회 인간-컴퓨터 상호작용 학회 아카데미 회원 선임
우리 대학 전산학부 이의진 교수가 인간-중심의 컴퓨팅 기술을 연구하는 긍정 컴퓨팅 분야에 대한 기술적 사회적 공로를 인정받아 지난 4월 23일부터 4월 28일까지 독일 함부르크에서 열린 ACM SIGCHI 학술대회에서 아카데미 회원으로 선임됐다고 28일 밝혔다.
미국컴퓨터협회(ACM) 소속 SIGCHI (Special Interest Group on Computer-Human Interaction)는 인간과 컴퓨터가 상호작용하는 방식을 연구하고 이를 개선하는 기술과 방법을 발전시키기 위한 국제 최고권위의 학술단체다. SIGCHI 소속의 대표적인 최우수 학술대회로는 인간-컴퓨터 상호작용 학회(CHI, Conference on Human Factors in Computing Systems)가 있으며 KAIST의 실적은 글로벌 상위 10위안에 포함된다.
ACM SIGCHI 아카데미는 인간-컴퓨터 상호작용 분야에 괄목할 만한 기여를 한 명예로운 연구자 그룹으로 전 세계적으로 매년 8명 내외의 인사들이 선임된다. ACM SIGCHI 아카데미 회원 선임은 인간-컴퓨터 상호작용 분야의 선두 주자로, 학문과 산업을 혁신하고, 인간-컴퓨터 상호작용 분야의 연구를 국제적으로 주도하는 것을 인정받은 것이다. 아시아에서는 일본을 이어 대한민국 최초로 선정된 것이어서 더욱 의미가 크다. 아카데미 회원 선정은 장기간 연구 분야에 대한 누적 기여도, 새로운 연구 방향 또는 혁신을 통한 분야의 파급력, 다른 연구자의 연구에 미친 영향력과 ACM SIGCHI 연구 커뮤니티 참여도를 종합 평가한다.
수상 위원회는 긍정적 컴퓨팅 분야에서 파급력을 보인 이의진 교수의 연구를 높이 평가했다. 이 교수는 전산학, 인지심리학, 디자인 분야를 아우르는 진정한 학제 간 연구를 수행한 인간-컴퓨터 상호작용연구자로서 디지털 헬스와 웰빙 주제로 시스템 설계와 인간 행동 이해에서 모두 크게 기여했다. KAIST 부임 후 다 학제 공동연구 수행을 통해 160편 이상의 논문을 출판했고 국내외 특허도 다수 취득했다. 구글 스칼라의 피인용 지수도 1만 회를 상회한다.
이 교수는 디지털 웰빙 연구에서 문제 행동 중재에 대한 새로운 디자인 지침을 제시했고, 창의적인 응용 서비스 개발을 통해 스마트폰 사용에 관한 기술 기반 자기절제 지원방식을 실증했다. 무엇보다 대규모 필드 실험을 통해서 많은 사람들이 이 교수 연구팀이 개발한 긍정 컴퓨팅 앱을 통해 도움을 받았다. CHI 학술대회에서 최우수 논문상을 받은 연구인 Lock n’ LoL (스마트폰 잠그고 큰소리로 웃기) 시스템은 스마트폰으로 인한 사회적 배제를 완화하기 위한 이 교수의 혁신적인 실증연구의 좋은 사례다. 또한 수백 명의 학생을 대상으로 수행된 Let's FOCUS 시스템에 관한 장기 연구에서는 교실 학습 맥락에서 기술적 개입을 설계하는 중요한 기반을 제공했다. 그 외에 신체적, 정신적 웰빙을 증진하기 위한 디지털 헬스 중재 기술에 대한 응용 연구를 다수 수행했다. 건강과 웰빙 증진을 위한 적시 개입 기술을 설계하고 평가하는 선구자 중 한 명이다.
이 교수는 인간-컴퓨터 상호작용 최고권위의 학회인 ACM Ubicomp, CHI, CSCW의 편집위원으로 꾸준히 봉사를 해왔다. 국내 ACM SIGCHI 한국지부 위원장으로 다년간 봉사했고 2021년에는 한국HCI 학술대회 조직위원장을 선임했다. 연구재단 인정의 우수 학회에서 최우수 논문상(ACM CHI’16, AAAI ICWSM’13, IEEE CCGrid’11, IEEE PerCom’07)을 다수 수상했고, IEEE IoT Forum으로부터 최다피인용 논문상(2019)을 받은 바 있다.
현재 이 교수는 감정노동자를 위한 디지털 헬스케어 기술 개발과 스마트 홈 환경을 위한 정신건강 관리 시스템에 관한 연구를 활발히 수행하고 있다. 이 교수는 “모바일, 웨어러블, 사물인터넷(IoT) 등 디지털 기술을 활용하여 인간의 건강과 웰빙을 지원하는 현재 서비스를 데이터와 인공지능을 융합하는 개인화 서비스로 확장해 접근성과 효율성을 100배 이상 높이는 도전적인 미래 기술 연구를 수행해나갈 계획”이라고 말했다.
2023.05.02
조회수 8241
-
챗GPT에 사용된 트랜스포머로 다공성 소재 예측
다공성 소재는 넓은 공극과 표면 면적을 지니고 있어, 가스 흡착, 분리, 촉매 등 다양한 에너지 및 환경 분야에서 적용된다. 다공성 소재 중 한 종류인 금속 유기 골격체(MOF)는 무한대에 가까운 경우의 수를 갖는 넓은 물질 공간(materials space) 안에 존재하기에, 인공지능을 사용해 최적의 물질을 추출하고 특성을 예측하려는 연구가 활발히 진행되고 있다. 하지만 이러한 모델들은 대부분 특정한 물성 한 종류만 학습할 수 있으며, 모든 재료 특성에 보편적으로 적용할 수 없다는 단점이 존재한다.
우리 대학 생명화학공학과 김지한 교수 연구팀이 세계 최초로 멀티모달 트랜스포머를 적용한 인공지능(AI)을 통해 다공성 소재의 다양한 물성을 예측하는 기술을 개발했다고 5일 밝혔다. 멀티모달 트랜스포머는 비디오 프레임과 오디오 트랙, 웹 이미지와 캡션, 교육용 비디오와 음성 대본과 같이 서로 다른 형태의 정보를 효과적이고 효율적으로 결합하도록 설계된 신경망 모델의 일종이다.
김지한 교수 연구팀은 챗GPT(ChatGPT)에서 사용된 모델인 트랜스포머를 다공성 소재에 도입해 모든 성능을 예측할 수 있는 멀티모달 인공 신경망을 개발했다. 멀티모달은 사진(이미지)과 설명(자연어)같이 서로 다른 형태의 데이터를 함께 학습하며, 이는 인간과 비슷하게 입체적이고 종합적인 사고를 할 수 있도록 도와준다. 연구팀이 개발한 멀티모달 트랜스포머 (MOFTransformer)는 원자 단위의 정보를 그래프로 표현하고, 결정성 단위의 정보를 3차원 그림으로 전환 후 함께 학습하는 방식으로 개발했다. 이는 다공성 소재의 물성 예측의 한계점이었던 다양한 물성에 대한 전이 학습을 극복하고 모든 물성에서 높은 성능으로 물성을 예측할 수 있게 했다.
김지한 교수 연구팀은 다공성 소재를 위한 트랜스포머를 개발해 1백만 개의 다공성 소재로 사전학습을 진행했으며, 다공성 소재의 가스 흡착, 기체 확산, 전기적 특성 등의 다양한 소재의 물성을 기존의 발표된 머신러닝 모델들보다 모두 더 높은 성능으로 (최대 28% 상승) 예측하는 데 성공했고, 또한 논문으로부터 추출된 텍스트 데이터에서도 역시 높은 성능으로 예측하는 데 성공했다.
연구팀이 개발한 기술은 물질의 특성을 계산 및 예측하는 새로운 방법론을 제시했으며, 이를 통해 소재 분야에서 새로운 소재의 설계와 개발에 도움이 될 뿐만 아니라, 기존의 소재에 대한 깊은 이해를 얻을 수 있을 것으로 기대된다. 더불어, 멀티모달 트랜스포머는 다공성 소재뿐만 아니라 다른 종류의 소재에도 확장 가능한 범용적인 모델이므로, 인공지능을 통한 소재 과학의 발전에 크게 이바지할 수 있을 것이다.
생명화학공학과 강영훈, 박현수 박사과정이 공동 제1 저자로 참여한 이번 연구 결과는 국제 학술지 `네이처 머신 인텔리전스(Nature Machine Intelligence)'에 지난 3월 13일에 게재됐다. (논문명: A multi-modal pre-training transformer for universal transfer learning in metal–organic frameworks)
한편 이번 연구는 과학기술정보통신부의 지원으로 국가 소재 연구 데이터 사업단, 그리고 한국연구재단 (NRF) 중견 연구자 지원 사업의 지원을 받아 수행됐다.
2023.04.05
조회수 14986
-
똑똑한 영상 복원 인공지능 기술 개발
딥러닝 기술은 영상 복원 속도가 기존 알고리즘 대비 수백 배 이상 빠를 뿐만 아니라 복원 정확도 역시 높다. 하지만, 주어진 학습 데이터에만 의존하는 딥러닝 기술은 영상 취득 환경상에 변화가 생기면 성능이 급격히 저하되는 치명적인 약점이 있다. 이는 알파고와 이세돌 九단과의 대국 시 `신의 한 수'에 의해 알파고의 성능이 급격하게 저하되었던 사례를 떠올리면 쉽게 이해할 수 있다. 즉, 인공지능이 학습하지 못했던 변수(학습 데이터상에 존재하지 않는 수)가 발생할 때 신뢰도가 급격히 낮아지는 인공지능 기술의 근본적인 문제이기도 하다.
우리 대학 바이오및뇌공학과 장무석 교수 연구팀과 김재철AI 대학원 예종철 교수 연구팀이 공동 연구를 통해 인공 지능의 신뢰도 문제를 해결할 수 있는 물리적 학습 기반의 영상 복원 딥러닝 기술을 개발했다고 6일 밝혔다.
연구팀은 영상 취득 환경에서 발생할 수 있는 변수 대부분이 물리적 법칙을 통해 수학적으로 기술 가능하다는 점에 착안해 물리적 법칙과 심층 신경망이 통합된 학습 기법을 제시했다.
모든 영상 기술은 물리적인 영상 기기를 통해 영상 정보를 취득한다. 연구팀은 이 정보 취득 과정에 대한 물리적인 통찰력을 인공지능에 학습시키는 방법을 개발했다. 예를 들면, `네가 도출한 복원 결과가 물리적으로 합당할까?' 혹은 `이 영상 기기는 물리적으로 이런 변수가 생길 수 있을 것 같은데?'라는 식의 질문을 통해 물리적 통찰력을 인공지능에 이식하는 방법을 제시한 것이다.
연구팀은 변화하는 영상 취득 환경에서도 신뢰도 높은 홀로그래피 영상* 을 복원하는데 성공했다. 홀로그래피 영상 기술은 의료 영상, 군용 감시, 자율 주행용 영상 등 다양한 정밀 영상 기술에 다양하게 활용될 수 있는데, 이번 연구는 의료 진단 분야의 활용성을 집중적으로 검증하였다.
*홀로그래피 영상: 물체의 그림자 패턴(회절 패턴)으로부터 물체의 형태를 복원하는 영상 기법, 일반적인 영상 기술과 달리 위상 변화에 의한 물체의 미세 구조를 감지할 수 있는 영상 기술
연구팀은 먼저 3차원 공간상에서 매우 빠르게 움직이는 적혈구의 회절 영상(확산된 그림자형상)으로부터 적혈구의 형태를 실시간으로 복원하는데 성공했다. 이러한 동적인 영상 환경에서 예상치 못한 변수로는 여러 개의 적혈구 덩어리가 복잡하게 겹쳐진다거나 적혈구가 예상하지 못했던 위치로 흘러가는 경우를 생각해 볼 수 있다. 여기서, 연구팀은 인공 지능이 생성한 영상이 합당한 결과인지 빛 전파 이론을 통해 검산하는 방식으로 물리적으로 유효한 복원 신뢰도를 구현하는데 성공하였다.
연구팀은 암 진단의 표준기술로 자리잡고 있는 생검 조직(생체에서 조직 일부를 메스나 바늘로 채취하는 것)의 영상 복원에도 성공했다. 주목할 점은 특정한 카메라 위치에서 측정된 회절 영상만을 학습했음에도 인공지능의 인지능력이 부가되어 다양한 카메라 위치에서도 물체를 인식하는데 성공했다는 점이다. 이번에 구현된 기술은 세포 염색 과정이나 수 천 만원에 달하는 현미경이 필요하지 않아 생검 조직 검사의 속도와 비용을 크게 개선할 수 있을 것으로 기대된다.
물리적 통찰력을 인공 지능에 이식하는 영상 복원 기술은 의료 진단 분야 뿐만 아니라 광범위한 영상 기술에 활용될 것으로 기대된다. 최근 영상 기술 산업계 (모바일 기기 카메라, 의료 진단용 MRI, CT, 광 기반 반도체 공정 불량 검출 등) 에선 인공지능 솔루션 탑재가 활발히 이루어지고 있다. 영상 취득에 사용되는 센서, 물체의 밝기, 물체까지의 거리와 같은 영상 취득 환경은 사용자마다 다를 수밖에 없어 적응 능력을 갖춘 인공 지능 솔루션에 대한 수요가 큰 상황이다. 현재 대부분의 인공 지능 기술은 적응 능력 부재로 신뢰도가 낮은 문제 때문에 실제 현장에서 활용성이 제한적인 상황이다.
바이오및뇌공학과 이찬석 연구원은 "데이터와 물리 법칙을 동시에 학습하는 적응형 인공지능 기술은 홀로그래피 영상뿐만 아니라 초고해상도 영상, 3차원 영상, 비시선 영상(장애물 뒷면을 보는 영상) 등 다양한 계산 영상 기술에 적용될 수 있을 것으로 기대된다ˮ고 밝혔다.
연구진은 "이번 연구를 통해 인공지능 학습에 있어서 학습 데이터에 대한 강한 의존성(신뢰도 문제)을 물리적 법칙을 결합해 해소했을 뿐만 아니라, 이미지 복원에 있어 매게 변수화된 전방 모델을 기반으로 했기 때문에 신뢰도와 적응성이 크게 향상됐다ˮ며, 이어 "이번 연구에서는 데이터의 다양한 특성 중에서 수학적 혹은 물리적으로 정확히 다룰 수 있는 측면에 집중했고, 향후 무작위적인 잡음이나 데이터의 형태에 대해서도 제약받지 않는 범용 복원 알고리즘을 개발하는 데 주력할 것이다ˮ라고 밝혔다.
바이오및뇌공학과 이찬석 박사과정이 제1 저자로 참여한 이번 연구는 국제 학술지 `네이처 머신 인텔리전스(Nature Machine Intelligence)'에 지난 1월 17일 字 출판됐다. (논문명: Deep learning based on parameterized physical forward model for adaptive holographic imaging with unpaired data)
한편 이번 연구는 삼성미래기술육성사업과 선도연구센터사업의 지원을 받아 수행됐다.
2023.02.06
조회수 11534