< AI대학원 최재식 교수 >
< (왼쪽부터) 한지연 박사과정, 최환일 박사과정, 정해동 박사과정, 알리 투씨(Ali Tousi) 박사과정 >
우리 대학 AI대학원 최재식 교수(설명가능 인공지능연구센터장) 연구팀이 심층 학습(이하 딥러닝) 생성모델의 오류 수정 기술을 개발했다고 25일 밝혔다.
최근 딥러닝 생성모델(Deep Generative Models)은 이미지, 음성뿐만 아니라 문장 등 새로운 콘텐츠를 생성하는 데 널리 활용되고 있다. 이런 생성모델의 발전에도 불구하고 최근 개발된 생성모델도 여전히 결함이 있는 결과를 만드는 경우가 많아, 국방, 의료, 제조 등 중요한 작업 및 학습에 생성모델을 활용하기는 어려운 점이 있었다.
최 교수 연구팀은 딥러닝 내부를 해석하는 설명가능 인공지능 기법을 활용해, 생성모델 내부에서 이미지 생성과정에서 문제를 일으키는 유닛(뉴런)을 찾아 제거하는 알고리즘을 고안해 생성모델의 오류를 수리했다. 이러한 생성 오류 수리 기술은 신경망 모델의 재학습을 요구하지 않으며 모델 구조에 대한 의존성이 적어, 다양한 적대적 생성 신경망에 폭넓게 응용 및 적용될 수 있을 것으로 기대된다. 또한, 고안된 기술은 딥러닝 생성모델의 신뢰도를 향상해 생성모델이 중요 작업에도 적용될 수 있을 것으로 기대된다.
AI대학원의 알리 투씨(Ali Tousi), 정해동 연구원이 공동 제1 저자로 참여한 이번 연구는 `국제 컴퓨터 비전 및 패턴인식 학술대회 (IEEE Conference on Computer Vision and Pattern Recognition, CVPR)'에서 6월 23일 발표됐다. (논문명: Automatic Correction of Internal Units in Generative Neural Networks, CVPR 2021).
적대적 생성 신경망은 생성기와 구분기의 적대적 관계를 이용한 모델로서, 생성 이미지의 품질이 높고 다양성이 높아, 이미지 생성뿐만 아니라 다양한 분야(예, 시계열 데이터 생성)에서 주목받고 있다.
딥러닝 생성모델의 성능을 향상하기 위해서 적대적 생성기법 및 생성기의 새로운 구조 설계 혹은 학습 전략의 세분화와 같은 연구가 활발히 진행되고 있다. 그러나 최신 적대적 생성 신경망 모델은 여전히 시각적 결함이 포함된 이미지를 생성하고 있으며, 재학습을 통해서 이를 해결하기에는 오류 수리를 보장할 수 없으며, 많은 학습 시간과 비용을 요구하게 된다. 이렇게 규모가 큰 최신 적대적 생성 신경망 모델의 일부 오류를 해결하기 위해 모델 전체를 재학습하는 것은 적합하지 않다.
연구팀은 문제 해결을 위해 생성 오류를 유도하는 딥러닝 내부의 유닛(뉴런)을 찾아 제거하는 알고리즘을 개발했다. 알고리즘은 딥러닝 모델의 시각적 결함의 위치를 파악하고, 딥러닝 모델 내 여러 계층에 존재하는 오류를 유발한 유닛을 찾아서 활성화하지 못하도록 하여 결함이 발생하지 않도록 했다.
연구팀은 설명가능 인공지능 기술을 활용해 시각적 결함이 생성된 이미지의 어느 부분에 분포하는지, 또 딥러닝 내부의 어떤 유닛이 결함의 생성에 관여하는지 찾을 수 있었다. 개발된 기술은 딥러닝 생성모델의 오류를 수리할 수 있고, 생성모델의 구조에 상관없이 적용할 수 있다.
< 그림 1. 오류를 유발하는 내부 유닛과 계층별 유닛 제거에 대한 모식도 >
< 그림 2. 시각적 결함이 포함된 생성 이미지에 대한 수리 결과 >
연구팀은 전통적인 구조를 가지는 `진행형 생성모델(Progressive GAN, PGGAN)'에서 개발 기술이 효과적으로 생성 오류를 수리할 수 있음을 확인했다. 수리 성능은 매사추세츠 공과대학(MIT)이 보유한 수리 기술 대비 FID 점수가 10점 정도 감소했으며, 사용자 평가에서 시험 이미지 그룹의 약 50%가 결함이 제거됐고, 약 90%에서 품질이 개선됐다는 결과를 얻었다. 나아가 특이 구조를 가지는 `StyleGAN2'와 `U-net GAN'에서도 생성 오류 수리가 가능함을 보임으로써 개발 기술의 일반성과 확장 가능성을 보였다.
연구팀이 개발한 생성모델의 오류 제거 기술은 다양한 이미지 외에도 다양한 생성모델에 적용돼 모델의 결과물에 대한 신뢰성을 높일 것으로 기대된다.
공동 제1 저자인 알리 투씨와 정해동 연구원은 "딥러닝 생성모델이 생성한 결과물에 있는 시각적 오류를 찾고, 이에 상응하는 활성화를 보이는 생성모델 내부의 유닛을 순차적으로 제거함으로써 생성 오류를 수리할 수 있음을 보였다ˮ라며 이는 "충분히 학습된 모델 내부에 미학습 혹은 잘못 학습된 내부요소가 있음을 보여주는 결과다ˮ라고 말했다.
한편 이번 연구는 2021년도 과학기술정보통신부의 재원으로 정보통신기획평가원의 지원을 받은 혁신성장동력프로젝트 설명가능인공지능 및 한국과학기술원 인공지능 대학원 프로그램과제를 통해서 수행됐다.
우리 대학 김재철AI대학원(원장 정송)은 지난 5월 2일(목) 서울 COEX에서 ‘KAIST 김재철AI대학원 AI기술설명회 2024’(공동주최: 성남산업진흥원, 서울특별시)를 열었다. 본 행사는 KAIST 김재철AI대학원에서 연구개발 중인 최신 AI기술을 일반 참관객 및 산업계 종사자에게 홍보하여 AI기술 확산에 기여하기 위해 마련됐다. 이번 설명회에는 약 650여명이 참석하여 KAIST에서 연구 중인 AI기술에 대한 큰 관심을 확인할 수 있었다. 오전 프로그램으로는 최근 관심이 높은 AI기술 분야에 대한 초청 강연을 진행했다. 최근 산업계의 주요 관심사인 ‘기업용 대형언어모델(LLM) 도입과 활용 전략’을 주제로 장동인 교수(KAIST 김재철AI대학원)가 강연했고, ‘AI와 로봇의 만남: 로봇러닝의 현재와 미래’라는 제목으로 임재환 교수(KAIST 김재철AI대학원)가 로봇러닝 분야의 연구동향과 성과를 설명했다.
2024-05-10우리 대학 김재철 AI대학원 김기응 교수가 자율 에이전트 및 다중 에이전트 시스템 국제재단(이하 IFAAMAS)으로부터 영향력 있는 논문상(Influential Paper Award)를 수상했다고 10일 밝혔다. 수상 논문은 공동 저자로 참여해 2000년도에 발표한 논문 `정책 탐색을 통한 협동 학습(Learning to Cooperate via Policy Search)'이다. 수상 발표는 인공지능 에이전트 분야의 국제 학술대회인 ‘자율 에이전트 및 다중 에이전트 시스템 학술대회 (AAMAS)’에서 이루어졌다. 본 논문에서는 다수의 인공지능 에이전트*가 분산화된 환경에서 협동 학습하는 상황에서, 개별 에이전트의 학습 시그널이 다른 에이전트의 정보에 의존하지 않음을 밝힘으로써, 저자는 이를 기반으로 분산 학습 알고리즘을 제안했다. *에이전트: 복잡한 동적인 환경에서 목표를 달성하려고 시도하는 시스템 이 학습 알고리즘은 간단하면서도 지역 최적점으
2024-05-10챗GPT가 촉발한 생성형 인공지능(AI)*이 세계적으로 열풍을 일으키는 가운데 새로운 인공지능 반도체의 생태계 구축을 위해 KAIST(총장 이광형)가 네이버(NAVER) 및 인텔(intel)과 손잡고 상호 보유 중인 역량과 강점을 한 곳에 집중한 ‘NAVER · intel · KAIST AI 공동연구센터(NIK AI Research Center)’를 설립한다. 업계에서는 이들 세 기관의 전략적인 제휴가 인공지능 반도체·인공지능 서버와 데이터센터의 운영에 필요한 오픈소스용 소프트웨어 개발 등 인공지능 분야에서 각자 보유하고 있는 하드웨어 및 소프트웨어 기술과 역량을 융합해서 새로운 인공지능 반도체 생태계를 구축하는 한편 시장과 기술 주도권 확보를 위해 선제적인 도전에 나선 것으로 보고 있다. 특히 첨단 반도체 CPU 설계부터 파운드리까지 하는 세계적인 반도체 기업 인텔이 기존의 중앙처리장치(CPU)를 넘어 인공지능 반
2024-04-30최근 자연어나 이미지, 동영상, 음악 등 다양한 분야에서 주목받는 생성형 AI가 신약 설계 분야에서도 기존 신규성 문제를 극복하고 새로운 혁신을 일으키고 있다고 하는데 어떤 기술일까? 우리 대학 화학과 김우연 교수 연구팀이 단백질-분자 사이의 상호작용을 고려해 활성 데이터 없이도 타겟 단백질에 적합한 약물 설계 생성형 AI를 개발했다고 18일 밝혔다. 신규 약물을 발굴하기 위해서는 질병의 원인이 되는 타겟 단백질에 특이적으로 결합하는 분자를 찾는 것이 중요하다. 기존의 약물 설계 생성형 AI는 특정 단백질의 이미 알려진 활성 데이터를 학습에 활용하기 때문에 기존 약물과 유사한 약물을 설계하려는 경향이 있다. 이는 신규성이 중요한 신약 개발 분야에서 치명적인 약점으로 지적되어 왔다. 또한 사업성이 높은 계열 내 최초(First-in-class) 타겟 단백질에 대해서는 실험 데이터가 매우 적거나 전무한데, 이 경우 기존 방식의 생성형 AI를 활용하는 것이 불가능하다. 연구팀
2024-04-18우리 대학이 서울시 · 서울시복지재단과 'AI안부확인서비스 데이터 활용연구를 위한 업무협약'을 29일 서면 교환 방식으로 체결한다. 이번 업무협약은 서울시가 2022년 10월부터 제공해 온 인공지능을 활용한 안부 확인 서비스를 고도화하기 위해 추진된다. 안부 대상자의 심리상태와 고립 위험 신호를 탐지할 수 있는 대화형 'AI안부확인서비스'를 개발해 고립가구 돌봄서비스에 활용하는 것이 목표다. 우리 대학은 이번 연구를 위해 인공지능-사회복지-HCI(인간컴퓨터상호작용)를 아우르는 융합연구팀을 구성했다. 차미영 전산학부 교수와 최문정 과학기술정책대학원 교수 및 IBS 수리 및 계산과학 연구단 데이터사이언스 그룹 진효진 박사가 참여한다. 연구팀은 서울시가 'AI안부확인서비스'를 운영하며 축적해 온 대화 데이터를 제공받아 ▴고립 위험 대상자를 찾아낼 수 있는 지표 개발 ▴고립감 해소 및 심리적 안정을 위한 시나리오 개발과 이를 반영한 대화형 인공지능 개발 ▴고령자 및
2024-03-29