본문 바로가기
대메뉴 바로가기
KAIST
뉴스
유틸열기
홈페이지 통합검색
-
검색
ENGLISH
메뉴 열기
%EB%8D%B0%EC%9D%B4%ED%84%B0
최신순
조회순
‘생성 AI와 헬스케어의 미래’ 워크숍 개최
우리 대학이 5일 오후 '생성AI와 헬스케어의 미래' 워크숍을 대전 본원에서 개최한다. KAIST 디지털 바이오헬스 AI연구센터(센터장 예종철)의 개소를 기념하기 위해 마련된 이번 워크숍에서는 디지털 헬스케어 분야에서 활용되는 인공지능의 최신 연구 동향과 응용 사례가 공유된다. '의료 데이터의 인공지능 활용' 세션에서는 콴젱 리(Quanzheng Li) 하버드의대 교수가 '의학 분야의 기초모델 : 대형 언어 모델과 대형 비전 모델'을 주제로 기조강연한다. 리 교수는 하버드 대학교 의과대학에서 진행되고 있는 대형 언어 모델* 및 대형 멀티모달리티 모델** 연구를 소개한다. 또한, 이러한 최첨단 기술들이 의료 데이터 해석과 활용 현장에 가져다준 혁신적인 변화를 임상 사례를 들어 설명한다. * 대형 언어 모델(Large Language Model, LLM): 방대한 텍스트 데이터로 훈련된 인공지능 모델 ** 대형 멀티모달 모델(Large Multi-modal Model, LMM): 텍스트와 함께 이미지, 소리, 비디오 등 다양한 유형의 데이터를 처리할 수 있는 인공지능 모델 김선 서울대학교 컴퓨터공학부 교수는 '바이오인포매틱스의 혁신' 세션에서 'AI 기술을 이용한 약물 반응 예측'을 주제로 기조강연한다. 인공지능 기반 약물 반응 예측 모델의 개발, 임상 데이터를 활용한 인공지능 알고리즘의 적용 사례, 환자 개인별 치료 계획 수립을 위한 인공지능의 역할 등을 조명하고 인공지능 기술이 약물 반응 예측에 미치는 영향과 잠재적 한계점을 토론한다. 산업계에는 나군호 네이버 헬스케어 연구소장이 참석해 '디지털 헬스케어 2024: 인공지능 시대'를 주제로 기조강연한다. 나 소장은 챗GPT로 대표되는 생성적 인공지능 기술이 의료 데이터 분석, 신약 개발, 맞춤형 치료 계획 수립 등 다방면의 디지털 헬스케어에 적용되고 있는 연구 동향을 소개한다. 네이버에서 진행되는 의료 생성 인공지능 기반연구와 이 기술이 헬스케어 산업에 미치는 긍정적인 영향 및 잠재적 도전 과제들에 대해서도 논의한다. 또한, 기술 교류와 네트워킹의 장도 함께 마련돼 참가자들이 디지털 바이오 헬스 분야에 적용되는 인공지능의 미래에 대해 논의하고 아이디어를 교환하는 기회를 제공한다. 예종철 KAIST 디지털 바이오헬스 AI 연구센터장은 "이번 워크숍은 KAIST가 추진하는 생성 인공지능 기반 의료 인공지능 연구를 산·학·연에 알리고 국내·외 연구진들과 협력해 센터를 이끌어갈 혁신적인 발전 방향을 모색하는 자리가 될 것"이라고 말했다.한편, KAIST 디지털 바이오헬스 AI 연구센터는 바이오의료 분야의 생성형 인공지능 원천모델 구축을 위해 2023년 12월 개소했다. 바이오의료 영상 및 신호, 임상기록, 유전체 및 오믹스, 약물 상호작용, 웨어러블 기반 라이프 로그 등이 중점 연구 분야다. 전문가 연합(mixture-of-expert:MOE) 형태로 최적의 추론을 할 수 있는 일반화된 인공지능(General AI) 플랫폼에 관한 원천 기술을 개발 및 바이오 의료 생성 AI 분야의 세계적인 선두그룹을 양성을 목표로 국내·외 기관과 네트워크를 구축해 협력하고 있다.
2024.02.05
조회수 1119
차미영 교수, 한국인 첫 獨 막스플랑크 연구소 단장 선임
세계적 기초과학 연구기관인 독일 막스플랑크 연구소(Max Planck Institute, MPI)에 첫 한국인 단장이 선임됐다. 우리 대학 전산학부 차미영 교수(기초과학연구원 수리 및 계산 과학 연구단 데이터 사이언스 그룹 CI(Chief Investigator))가 그 주인공이다. 차 교수는 독일 보흠 지역에 있는 막스플랑크 보안 및 정보보호 연구소(MPI for Security and Privacy)에서 6월부터 단장(Scientific Director)직 수행을 시작해 ‘인류를 위한 데이터 과학(Data Science for Humanity)’ 연구그룹을 이끌 예정이다. 현재 본격적인 연구그룹 출범을 준비하고 있다. 막스플랑크 연구소는 기초과학 분야를 아우르며 독일 전역과 해외에 85개 산하 연구소를 운영하고 있다. 연구소를 이끄는 300여 명의 단장 중 한국 국적 과학자가 발탁된 것은 이번이 처음이다. 한국계로는 지난해 8월 울산과학기술원(UNIST) 강사라 교수가 기후과학연구소 단장으로 선임된 바 있다. 차 교수는 구글 스칼라(Google Scholar) 기준 피인용 수 2만 회가 넘는 데이터 과학 분야 전문가로, 우리 대학 전산학부를 졸업하고 동 대학원에서 석·박사 학위를 받은 ‘토종박사’다. 박사 취득 이후 독일 자부르켄에 있는 막스플랑크 연구소에서 박사후연구원으로 근무했으며, 2010년부터 우리 대학 교수로 재직하고 있다. 2019년에는 IBS의 CI로 선정돼 데이터 사이언스 그룹을 이끌며 인공지능(AI) 분야에서 우수 논문을 다수 발표하는 등 국제적 인지도를 높였다. 차 교수가 이끄는 데이터 사이언스 그룹은 2019년 출범해 초대형 데이터를 계산하고 분석하는 방법론을 연구하고 있다. 특히 AI를 이용해 가짜뉴스와 혐오 표현을 탐지하는 등 우리 삶과 밀접한 사회 현상을 분석해 괄목할 만한 연구성과를 창출했다. 코로나19 팬데믹 시절 ‘루머를 앞선 팩트’ 캠페인을 기획해 감염병 관련 잘못된 정보에 대한 팩트체크 결과를 151개국에 전파했다. 최근에는 위성영상을 AI로 분석해 북한을 비롯한 저개발국가의 경제지도를 만들어 무료로 공개했다. 최근 실시한 5년 차 평가에서 AI 기술을 기초과학에 창의적으로 활용해 차별성 있는 연구를 수행했으며, 데이터 과학 연구의 사회적 가치를 제고할 수 있는 핵심 기술을 개발하는 등 국제적 파급력 있는 연구성과를 창출했다는 평가를 받았다. IBS 노도영 원장은 “IBS는 미래 연구단장을 발굴·육성하기 위해 젊은 연구자를 선정해 독립 연구를 지원하고 있다”라며, “이 제도로 발굴한 연구자가 막스플랑크 연구소 단장으로 초청받은 것에 대해 매우 기쁘게 생각하며 한국과 독일의 국제 연구 교류에도 크게 기여할 것으로 기대한다”라고 전했다. 우리 대학 이광형 총장은 “KAIST가 키워낸 차 교수의 행보는 국제화에 좋은 롤모델이 될 것”이라며, “계속해서 KAIST 학생 및 동료와 협업할 수 있도록 겸직을 비롯한 지원을 아끼지 않겠다”라고 축하의 메시지를 전했다. 차미영 CI는 “KAIST 교수로 쌓아온 경험에 더하여 IBS에서 긴 호흡으로 창의적인 연구를 지속한 덕분에 좋은 결과를 얻은 것 같다”라며, “앞으로 큰 책임감을 가지고 데이터 과학을 통한 사회 공헌을 위해 최선을 다하겠다”라고 포부를 밝혔다.
2024.01.09
조회수 2495
제3회 K-인공지능 제조데이터 분석 경진대회 성료
우리 대학 제조AI빅데이터센터가 중소 제조기업의 애로사항을 창의적인 인공지능(AI) 아이디어로 해결하는 '제3회 K-인공지능 제조데이터 분석 경진대회' 시상식을 지난달 28일 서울 양재동 aT센터에서 개최했다. 중소벤처기업부(장관 이영, 이하 중기부), 스마트제조혁신추진단(단장 안광현, 이하 추진단)과 공동 주최한 이번 경진대회는 우수한 제조 인공지능 분석 인재를 발굴 및 육성하기 위해 올해 세 번째로 개최됐다.제조데이터 인공지능 분석에 관심 있는 19세 이상의 국민을 대상으로 지난 9월 말부터 참가자를 모집한 결과 3인 이내로 자유롭게 구성된 184개 팀, 389명이 신청을 완료했다. 각 팀은 10월 23일 KAMP*의 열처리 품질보증 제조AI데이터셋**을 활용해 뿌리기업 현장 개선 아이디어를 제시하고 알고리즘으로 구현하는 과제를 부여받아 본격적인 대회 일정에 돌입했다. ☞ KAMP: 인공지능(AI) 중소벤처 제조 플랫폼(Korea AI Manufacturing Platform) ☞ 열처리 품질보증 제조AI데이터셋: 열처리 공정에서 수집한 제조데이터를 인공지능 학습용으로 가공한 6천1백만 개의 제조데이터주최측은 11월 6일부터 10일까지 서면 평가를 통해 8개의 발표평가 최종 진출팀을 선발했다. 11월 21일 열린 발표평가는 메타버스 플랫폼에서 진행됐으며, 인공지능 모델의 창의성, 제조 현장 적용 가능성, 파급효과 등의 심사 항목에서 가장 높은 점수를 받은 '왕십리분석혁명가들'팀(정지인, 문정언, 신아리/한양대학교)이 대상(중기부 장관상)을 차지했다. '왕십리분석혁명가들' 팀은 설명가능 인공지능(eXplainable AI, XAI)을 기반으로 열처리 공정과 같은 다양한 제조업의 연속공정에서 적용할 수 있는 실시간 설비 이상탐지 방안을 제시하여 문제해결 독창성, 제조현장 적용가능성, 분석모델 확장성 측면에서 높은 평가를 받았다. 이 외에도 '크로와상(김재연, 이예진, 최영주/성균관대학교)', 'TAVANNA(강병관, 박민제, 최무선/(주)타키온테크+고려대학교)' 2개 팀은 최우수상(KAIST 총장상)을 수상했으며, 우수상에 'IoT(에스케이플래닛(주))', '불량하냥(한양대학교 에리카)', 장려상에 'Absolute A(서울과기대)', 'Meta3DP((주)메타3디피)', 'NABIS(한양대학교)'가 수상의 영예를 안았다. 김일중 KAIST 제조AI빅데이터센터장은 "대회가 3회로 거듭되면서 제조AI 관심이 높아지고 있다는 것을 실감했으며, KAIST 제조AI빅데이터센터도 중소 제조기업의 제조AI 기술 적용과 인력 양성에 최선의 노력을 기울이겠다"라고 수상자들을 격려했다. 김흥남 KAIST 제조AI빅데이터센터 본부장은 "제조AI 시장이 성장함에 따라 KAIST는 중소벤처기업부와 협력하여 지속적으로 중소 제조기업의 AI 기반 경쟁력 강화를 위한 지원을 아끼지 않을 것"이라고 밝혔다.한편, '제3회 K-인공지능 제조데이터 분석 경진대회' 대상팀에는 상장 및 상금 1,000만 원이 수여됐다. 최우수상 2개 팀과 우수상 2개 팀에게 각각 300만 원과 200만 원의 상금이, 장려상 3개 팀에게는 각각 100만 원의 상금이 지급됐다.
2023.12.04
조회수 1199
제조AI 빅데이터센터, 제조데이터 촉진자 동문 네트워킹 데이 및 표준화 포럼 개최
우리 대학 제조AI빅데이터센터(센터장 김일중)가 ʻ제조데이터 촉진자 동문 네트워킹 데이 및 표준화 포럼(이하, 네트워킹 데이)ʼ를 29일 개최했다. 네트워킹 데이는 제조AI빅데이터센터가 작년부터 운영하고 있는 ‘제조데이터 촉진자 양성사업’의 교육 수료생 170명을 대상으로 진행되었다. 제조데이터 촉진자 양성사업은 제조AI 빅데이터교육에 제조 도메인 지식과 창의적 문제해결 능력을 접목하여 미래 제조혁신을 이끌어갈 인재인 제조데이터 촉진자를 양성하기 위한 교육사업이다. 교육은 중소·중견 제조기업 및 솔루션 공급기업의 재직자를 교육대상으로 한다. 교육과정은 제조AI 이론 교육 및 현장실습으로 구성되어 있으며, 제조AI가 적용된 우수현장을 견학할 수 있는 기회도 제공하고 있다. 제조AI빅데이터센터는 해당 사업으로 220여명의 제조데이터 촉진자를 양성할 예정이다. 이미 2022년 한 해 동안 101명, 2023년 상반기동안 70명의 교육 수료생을 배출하였으며, 현재 50명의 교육생을 대상으로 교육이 진행 중이다. 29일 개최한 네트워킹 데이는 총 2부로 구성되었으며, 1부는 제조데이터 촉진자 우수교육생 사례발표, 2부는 중소·중견 제조기업을 위한 제조데이터 표준화 패널 디스커션으로 진행하였다. 제조데이터 촉진자 우수교육생 사례발표는 각 기수별로 우수한 사례를 창출한 교육생이 자사의 기업 소개와 제조데이터 촉진자 양성과정 중 현장실습을 통해 얻은 결과, 자사의 제조AI 적용 현황 등을 발표하는 자리로 구성하였다. 중소·중견 제조기업을 위한 제조데이터 표준화 패널 디스커션은 KAIST 제조AI빅데이터센터장인 김일중 교수가 표준 제조데이터 프레임워크 활용방안을 주제로 발제하였다. 이후 KAIST 제조DX추진본부장인 김흥남 교수가 제조데이터 표준화 필요성 및 추진방안에 대해 패널 토론의 좌장을 맡아 진행하였다. 토론에는 이용관 한국공과대학교 교수, 권종원 KTL 센터장, 전현준 KEMP 대표, 김지현 동일프라텍 대표, 한아람 ABH 대표, 김민규 엣지크로스 이사가 참여하였다. 김흥남 교수는 “교육 수료생들 간 우수사례 공유와 소통의 장을 마련함으로써 각 분야의 제조데이터 촉진자들이 제조AI 적용 사례 및 제조데이터 표준화에 대하여 심도 있는 토론을 나누게 된 것이 국내 제조업 발전에 큰 의미가 있었다”라고 전했다. KAIST 제조AI빅데이터센터는 금번 동문 네트워킹 데이를 필두로 하여 제조데이터 촉진자가 서로 교류할 수 있는 기회를 지속적으로 가질 계획이다.
2023.11.30
조회수 1049
인과관계 추정 정확도 높인 새로운 방법론 개발
우리 대학 수리과학과 김재경 교수 연구팀이 수학 모델을 기반으로 시계열 데이터의 인과관계를 추정하는 새로운 방법론을 개발했다. 복잡한 계산 과정을 없애 기존보다 빠른 속도로 추론이 가능하면서도, 정확도는 획기적으로 높였다. 매 순간 다양한 데이터가 기록되고 있다. 그중 시간의 흐름을 기준으로 기록된 ‘시계열 데이터’는 일기 예보와 경제 분야뿐만 아니라 의학 분야에서도 가치 있게 쓰인다. 입원 환자의 심전도 측정을 통해 심장 발작의 직접적인 요인을 찾는 것과 같이 인과관계를 추정하는 것이 대표적이다. 최근에는 스마트 워치 등 웨어러블 기기를 통해 일상에서 건강 데이터를 쉽게 수집할 수 있게 되면서, 의학 분야에서 시계열 데이터 분석의 중요성이 더 커지고 있다. 시계열 데이터에서 인과관계를 추정하는 대표적인 방법으로는 2003년 노벨 경제학상을 수상한 클라이브 그레인저 미국 샌디에이고캘리포니아대(UC샌디에이고) 교수가 제시한 ‘그레인저 인과관계 검정(Granger causality test)’이 있다. 이는 미래 경제지표 예측, 질병 요인분석, 지구온난화의 원인 등 수많은 분야에 걸쳐 응용됐다. 그레인저 인과관계 검정을 개선한 정보 이론 기반의 다양한 인과관계 추정 방법이 개발됐지만, 일련의 방법들은 시계열 데이터가 비슷한 주기로 변화하는 동시성을 가지기만 하면, 인과관계가 있다고 잘못 예측하는 경우가 많았다. 또한, 직접적인 인과관계와 간접적인 인과관계를 구별하지 못한다는 한계도 있었다. 이러한 한계를 극복하기 위해 최근 수리 모델을 기반으로 하는 방법론들이 등장했다. 수리 모델로 주어진 시계열 데이터를 잘 맞출 수 있는지 확인하는 방법을 통해 인과관계를 예측한다. 수리 모델이 정확하기만 하면 기존 그레인저 인과관계 검정의 한계인 동시성과 간접적인 영향을 인과관계와 혼동하지 않는다는 장점이 있다. 그러나 정확한 수리 모델을 알기 힘들고, 현재까지 제시된 수리 모델 기반 방법론들은 복잡한 계산이 필요해 추정 시간이 많이 걸린다는 단점이 있다. 이러한 상황에서 연구팀은 기존 방법론들의 한계를 모두 해결한 새로운 방법론 ‘GOBI(General ODE-Based Inference)’를 개발했다. 우선, 연구팀은 시계열 데이터가 일반적인 수학 모델로 표현될 수 있는지 확인하는 수학 이론을 만들었다. 그리고 이 이론을 바탕으로 정확한 수리 모델이나 복잡한 계산 없이도 시계열 데이터로부터 인과관계를 추정하는 방법론을 개발했다. 개발한 방법론을 인과관계 분석에 적용해 본 결과 세포 내 분자들의 상호작용, 생태계 네트워크, 기상 시스템 등 다양한 분야의 데이터에서 기존 방법론에 비해 월등한 성능을 보여줬다. 특히, 동시성 및 간접적인 영향을 가지는 시계열 데이터에서도 인과관계를 성공적으로 추론했다. 연구진은 GOBI를 통해서 여러 오염 물질 중 이산화질소와 호흡기로 유입되는 부유 미립자(직경 10㎛ 이하의 입자)가 심혈관계 질환에 영향을 미친다는 것을 확인할 수 있었다. 김재경 교수는 “수학과 통계를 결합하여 정확하면서도 다양한 시스템에 유연하게 적용할 수 있는 새로운 인과관계 추정 방법론을 개발했다”며 “사회 및 자연과학 분야에 걸쳐 두루 사용되는 인과관계 추정 연구에 새로운 패러다임을 제시할 것으로 예상된다”고 말했다. 연구결과는 7월 24일 국제학술지 ‘네이처 커뮤니케이션즈(Nature Communications, IF 17.694)’ 온라인판에 실렸으며, 우리 대학 박세호 학사과정(제1저자)과 하석민 학사과정(제2저자)이 참여했다.
2023.07.26
조회수 3040
취침시간 지리/문화적 영향에 따라 더 늦어져
수면은 건강과 웰빙, 생산성에 큰 영향을 미치지만, 현대인이 얼마나 오래 그리고 잘 수면을 취하는지에 대해 정확히 보고되지 않았다. 수면의 양과 질은 개인의 선택일까, 아니면 문화와 지리와 같은 사회적 요인에 얼마나 영향을 받을까? 우리 대학 전산학부 차미영 교수가 이끄는 IBS(원장 노도영) 연구팀과 영국의 노키아 벨 연구소(Nokia Bell Labs)는 공동 연구를 통해 현대인의 ‘수면’이 어떤 사회적 및 개인적 요인에 영향을 받는다고 6일 밝혔다. 연구팀은 스마트 워치가 상용화되며 데이터의 대량 수집이 가능해진 기회에 주목했다. 노키아에서 개발한 스마트 워치를 착용한 미국, 캐나다, 스페인, 영국, 핀란드, 한국, 일본을 포함 11개국의 30,082명으로부터 4년간 수집한 5,200만 건의 데이터를 분석해 나라별 디지털 로그 기반 수면 패턴을 분석했다. 먼저 연구팀은 나라별 취침 시간, 기상 시간, 총 수면시간이 어떤지를 살폈다. 스마트워치 데이터에 기록된 취침 시간은 기존 설문지 기반 조사에 보고된 결과 대비 나라마다 수십 분에서 한 시간까지도 늦었다. 전 세계 평균 취침 시간은 자정(00:01)이고 기상 시간은 오전 7시 42분이었다. 이러한 차이는 설문조사가 가지는 편향과 함께 스마트 워치의 모션 센서가 뒤척임 없이 수면을 시작하는 순간을 정밀히 기록하는 데서 기인한다. 기상 시간은 나라별 비슷하지만 취침 시간은 지리적 문화적 영향을 상당히 받았다. 특히 국민 소득(GDP)이 높을수록 취침 시간이 늦어졌으며, 문화적으로 개인주의보다는 집단주의 지수가 높을수록 취침 시간이 늦었다. 조사된 나라 중 일본은 총 수면시간이 평균 7시간 미만으로 가장 적었으며 핀란드는 평균 수면시간이 8시간으로 가장 길었다. (그림 1) 연구팀은 이와 더불어 그동안 임상 연구에서 사용된 다양한 수면의 요소들을 정량화하여 수면 효율성(설명: 취침 중 깨지 않고 연속으로 자는 시간의 비율)과 같은 질적 요인을 분석했다. 빅데이터를 사용해 성향 점수 매칭 기법(propensity score matching methods, PSM)으로, 개인마다 문화적 요인을 고정한 상태에서 운동량을 늘어나면 수면이 어떻게 변하는지에 대한 가상 테스트를 진행했다. 그 결과 걸음 수가 늘수록 취침 시 더 빨리 잠들고 밤에 덜 깨는 긍정적 효과를 확인했다. 운동량은 수면의 질을 개선하지만, 총 수면시간을 늘리지는 않았다. 흥미롭게도 이러한 운동의 긍정적 효과는 국가별로 다르며, 특히 미국과 핀란드에서 효과가 강하게 나타난 반면 일본에서는 운동의 효과가 미미했다. 강원대학교 박성규 교수, 우리 대학 차미영 교수, 노키아 연구소의 퀘르시아 박사가 주저자로 참여한 이번 연구 결과는 국제 학술지 네이처 출판 그룹의 ‘사이언티픽 리포트(Scientific Reports)’에 게재됐다. (논문명: Social dimensions impact individual sleep quantity and quality, 사회적 차원이 개인의 수면 양과 질에 미치는 영향) 퀘르시아 박사는 “수면의 양과 질에 사회적 영향이 절반이나 차지했다. 고소득 국가에서 업무 스케줄이 과도하고 근무시간이 길어지며 취침 시간이 늦어지고, 집단주의가 강한 스페인과 일본은 사회적 요구에 부응하기 위해 취침 시간이 지연될 수 있다”고 연구 결과를 해석했다. 차미영 교수는 “수면은 웰빙, 비만, 치매 등과도 연관이 있다고 알려져 중요하다. 고령화 사회에서 국민의 건강 증진을 위해 적절한 수면의 양을 보장하고 수면의 질을 높이기 위해 개인의 노력은 물론 사회적 지원이 함께해야 한다”고 말했다. 연구팀은 이번 연구에서 개발한 수면의 지표를 쉽게 계산하는 코드를 무료로 공개해 첨단 수면 산업 발달에 기여하며, 다양한 생체 신호를 포함하는 수면에 대한 벤치마크 데이터도 추후 공개할 예정이다.
2023.07.06
조회수 1914
고성능 조립형 SSD 시스템반도체 최초 개발
최근 인공지능을 훈련하기 위해 더 많은 데이터가 필요해지면서 그 중요성은 더욱 증가하고 있으며, 이에 데이터 센터 및 클라우드 서비스를 위한 주요 저장장치인 고성능 SSD(Solid State Drive, 반도체 기억소자를 사용하는 저장장치) 제품의 필요성이 높아지고 있다. 하지만, 고성능 SSD 제품일수록 SSD 내부의 구성요소들이 서로의 성능에 크게 영향을 미치는 상호-결합형(tightly-coupled) 구조의 한계에 부딪혀 성능을 극대화하기 어려웠다. 우리 대학 전기및전자공학부 김동준 교수 연구팀이 고성능 조립형 SSD 시스템 개발을 통해 차세대 SSD의 읽기/쓰기 성능을 비약적으로 높일 뿐 아니라 SSD 수명연장에도 적용 가능한 SSD 시스템 반도체 구조를 세계 최초로 개발했다고 15일 밝혔다. 김동준 교수 연구팀은 기존 SSD 설계가 갖는 상호-결합형 구조의 한계를 밝히고, CPU, GPU 등의 비메모리 시스템 반도체 설계에서 주로 활용되는 칩 내부에서 패킷-기반 데이터를 자유롭게 전송하는 온-칩 네트워크 기술을 바탕으로 SSD 내부에 플래시 메모리 전용 온-칩 네트워크를 구성함으로써 성능을 극대화하는 상호-분리형(de-coupled) 구조를 제안했으며, 이를 통해 SSD의 프론트-엔드 설계와 백-엔드 설계의 상호 의존도를 줄여 독립적으로 설계하고 조립 가능한 ‘조립형 SSD’를 개발했다. ※온-칩 네트워크(on-chip network): CPU/GPU등의 시스템 반도체 설계에 쓰이는 칩 내부의 요소에 대한 패킷-기반 연결구조를 말한다. 온-칩 네트워크는 고성능 시스템 반도체를 위한 필수적인 설계 요소중 하나로서 반도체칩의 규모가 증가할수록 더욱 중요해지는 특징이 있다. 김동준 교수팀이 개발한 조립형 SSD 시스템 구조는 내부 구성요소 중 SSD 컨트롤러 내부, 플래시 메모리 인터페이스를 기점으로 CPU에 가까운 부분을 프론트-엔드(front-end), 플래시 메모리에 가까운 부분을 백-엔드(back-end)로 구분하고, 백-엔드의 플래시 컨트롤러 사이 간 데이터 이동이 가능한 플래시 메모리 전용 온-칩 네트워크를 새롭게 구성해, 성능 감소를 최소화하는 상호-분리형 구조를 제안했다. SSD를 구동하는 핵심 요소인 플래시 변환 계층의 일부 기능을 하드웨어로 가속하여 플래시 메모리가 갖는 한계를 능동적으로 극복할 수 있는 계기를 마련하였고 상호-분리형 구조는 플래시 변환 계층이 특정 플래시 메모리의 특성에 국한되지 않고, 프론트-엔드 설계와 백-엔드 설계를 독립적으로 수행하는 설계의 용이성을 가지는 점이 ‘조립형’ SSD 구조의 장점이라고 밝혔다. 이를 통해, 기존 시스템 대비 응답시간을 31배 줄일 수 있었고 SSD 불량 블록 관리기법에도 적용해 약 23%의 SSD 수명을 연장할 수 있다고 연구팀 관계자는 설명했다. 전기및전자공학부 김지호 박사과정이 제1 저자, 전기및전자공학부 정명수 교수가 공동 저자로 참여한 이번 연구는 미국 플로리다주 올랜도에서 열리는 컴퓨터 구조 분야 최우수 국제 학술대회인 `제50회 국제 컴퓨터 구조 심포지엄(50th IEEE/ACM International Symposium on Computer Architecture, ISCA 2023)'에서 6월 19일 발표될 예정이다. (논문명: Decoupled SSD: Rethinking SSD Architecture through Network-based Flash Controllers). 연구를 주도한 김동준 교수는 “이번 연구는 기존의 SSD가 가지는 구조적 한계를 규명했다는 점과 CPU와 같은 시스템 메모리 반도체 중심의 온-칩 네트워크 기술을 적용해 하드웨어가 능동적으로 필요한 일을 수행할 수 있다는 점에서 의의가 있으며 차세대 고성능 SSD 시장에 기여할 것으로 보인다”며, “상호-분리형 구조는 수명연장을 위해서도 능동적으로 동작하는 SSD 구조로써 그 가치가 성능에만 국한되지 않아 다양한 쓰임새를 가진다며”연구의 의의를 설명했다. 이번 연구는 컴퓨터 시스템 저장장치 분야의 저명한 연구자인 KAIST 정명수 교수와 컴퓨터 구조 및 인터커넥션 네트워크(Interconnection Network) 분야의 권위자인 김동준 교수, 두 세계적인 연구자의 융합연구를 통해 이루어낸 연구라는 의미가 있다고 관계자는 설명했다. 한편 이번 연구는 한국연구재단, 삼성전자, 반도체설계교육센터(IDEC), 정보통신기획평가원 차세대지능형반도체기술개발사업의 지원을 받아 수행됐다.
2023.06.15
조회수 2454
황규영 명예특훈교수, IEEE 데이터공학 기술위원회 공로상 수상
우리 대학 전산학부 황규영 명예특훈교수가 'IEEE 데이터공학 기술위원회(Technical Committee on Data Engineering, 이하 TCDE)' 에서 수여하는 공로상(IEEE TCDE Service Award)을 한국인 최초로 수상했다. IEEE TCDE는 VLDB 국제학술재단(VLDB Endowment), ACM SIGMOD와 더불어 세계 데이터베이스 분야를 이끌어가는 3대 학회 조직 중 하나로 데이터베이스(DB) 분야에서 세계 최고 권위의 학술대회인 IEEE ICDE(International Conference on Data Engineering)를 비롯한 각종 학술대회를 주관하고 있으며 이 분야에서 권위를 인정받고 있는 학술지인 IEEE 데이터공학 회보(Data Engineering Bulletin)를 발간하고 있다. 수상 위원회는 황 교수가 2007년 IEEE 펠로우로(국내 전산학 분야 최초) 2009년 ACM 펠로우로(국내 최초) 선임됐으며, 데이터베이스 분야 세계 톱 저널인 The VLDB 저널의 수석 편집장(Coordinating Editor-in-Chief)(아시아 지역 최초), 세계 톱 국제학술대회인 VLDB(2006)의 대회장(General Chair)(국내 최초 유치), 최고권위 VLDB 국제학술재단(Endowment)의 이사(Trustee, 임기 6년, 재선, 국내 최초), 세계 톱 수준의 권위 학회인 IEEE TCDE의 회장(Chair) 및 고문(Advisor)(아시아 태평양 지역 최초, 10년), 아시아 태평양 지역 권위 학술대회인 DASFAA 운영위원회(Steering Committee)의 위원, 회장, 고문, 포상위원장(Awards Chair) (15년) 등 수 많은 리더십 직책(leadership position)을 역임해 수십 년에 걸쳐 (decades-long) 세계 데이터공학 학계의 발전에 헌신적으로(dedicated) 공헌했으며 아시아-태평양 지역 데이터베이스 분야의 세계화에 공헌했음을 높이 평가했다. 특히, 황 교수는 The VLDB 저널의 창간 편집위원(founding editorial board member)으로 19년간 이 저널을 데이터베이스 분야의 톱 저널로 육성하는 데 지대한 공헌을 하였다. 황 교수가 수석 편집장으로 재임하는 동안 The VLDB 저널은 피인용지수(impact factor) 7.067 (2008년)로 정보시스템 분야 최고 저널로 등극했다. IEEE ICDE 2023 캘리포니아 아나하임에서 진행된 시상식에는 건강상의 이유로 황규영 교수의 제자인 신은정 박사(Google)가 대신 수령했다. 황 교수는 "이번 수상은 상 자체보다도 연구자로서 살아온 40년의 기간 동안 여러분들과 함께 노력한 공적이 영구히 기록되어 기쁘며 이번 수상이 국내 많은 후배 연구자들이 컴퓨터 분야에서 세계 학계를 이끌어 가는 리더가 되는 계기가 될 것으로 기대한다”고 소감을 말했다. 황 교수는 2014년에도 ACM SIGMOD로부터 세계 데이터베이스 학계의 발전을 위한 지속적이고(sustained) 헌신적인 리더십과 공로로 권위 있는 ACM SIGMOD Contributions Award(공로상)를 수상해 세계 학계의 리더로서 대한민국의 위상을 선양한 바 있다. 황 교수는 대한민국학술원 회원이며 2012년 한국공학상(대통령상), 2017년 대한민국최고과학기술자상(대통령상)을 수상했다.
2023.06.13
조회수 2019
111배 빠른 검색엔진용 CXL 3.0 기반 AI반도체 세계 최초 개발
최근 각광받고 있는 이미지 검색, 데이터베이스, 추천 시스템, 광고 등의 서비스들은 마이크로소프트, 메타, 알리바바 등의 글로벌 IT 기업들에서 활발히 제공되고 있다. 하지만 실제 서비스에서 사용되는 데이터 셋은 크기가 매우 커, 많은 양의 메모리를 요구하여 기존 시스템에서는 추가할 수 있는 메모리 용량에 제한이 있어 이러한 요구사항을 만족할 수 없었다. 우리 대학 전기및전자공학부 정명수 교수 연구팀(컴퓨터 아키텍처 및 메모리 시스템 연구실)에서 대용량으로 메모리 확장이 가능한 컴퓨트 익스프레스 링크 3.0 기술(Compute eXpress Link, 이하 CXL)을 활용해 검색 엔진을 위한 AI 반도체를 세계 최초로 개발했다고 25일 밝혔다. 최근 검색 서비스에서 사용되는 알고리즘은 근사 근접 이웃 탐색(Approximate Nearest Neighbor Search, ANNS)으로 어떤 데이터든지 특징 벡터로 표현할 수 있다. 특징 벡터란 데이터가 가지는 특징들 각각을 숫자로 표현해 나열한 것으로, 이들 사이의 거리를 통해 우리는 데이터 간의 유사도를 구할 수 있다. 하지만 벡터 데이터 용량이 매우 커서 이를 압축해 메모리에 적재하는 압축 방식과 메모리보다 큰 용량과 느린 속도를 가지는 저장 장치를 사용하는 스토리지 방식(마이크로소프트에서 사용 중)이 사용되어 왔다. 하지만 이들 각각은 낮은 정확도와 성능을 가지는 문제가 있었다. 이에 정명수 교수 연구팀은 메모리 확장의 제한이라는 근본적인 문제를 해결하기 위해 CXL이라는 기술에 주목했다. CXL은 CPU-장치 간 연결을 위한 프로토콜로, 가속기 및 메모리 확장기의 고속 연결을 제공한다. 또한 CXL 스위치를 통해 여러 대의 메모리 확장기를 하나의 포트에 연결할 수 있는 확장성을 제공한다. 하지만 CXL을 통한 메모리 확장은 로컬 메모리와 비교해 메모리 접근 시간이 증가하는 단점을 가지고 있다. 데이터를 책으로 비유하자면 기존 시스템은 집에 해당하는 CPU 크기의 제한으로 서재(메모리 용량)를 무한정 늘릴 수 없어, 보관할 수 있는 책 개수에 제한이 있는 것이다. 이에 압축 방식은 책의 내용을 압축하여 더 많은 책을 보관하는 방법이고, 스토리지 방식은 필요한 책들을 거리가 먼 도서관에서 구해오는 것과 비슷하다. CXL을 통한 메모리 확장은 집 옆에 창고를 지어 책을 보관하는 것으로 이해될 수 있다. 연구진이 개발한 AI 반도체(CXL-ANNS)는 CXL 스위치와 CXL 메모리 확장기를 사용해 근사 근접 이웃 탐색에서 필요한 모든 데이터를 메모리에 적재할 수 있어 정확도를 높이고 성능 감소를 없앴다. 또한 근사 근접 이웃 탐색의 특징을 활용해 데이터 근처 처리 기법과 지역성을 활용한 데이터 배치 기법으로 CXL-ANNS의 성능을 한 단계 향상했다. 이는 마치 창고 스스로가 필요한 책들의 내용을 요약하고 정리해 전달하고, 자주 보는 책들은 서재에 배치해 집과 창고를 오가는 시간을 줄이는 것과 유사하다. 연구진은 CXL-ANNS의 프로토타입을 자체 제작해 실효성을 확인하고, CXL-ANNS 성능을 기존 연구들과 비교했다. 마이크로소프트, 메타, 얀덱스 등의 글로벌 IT 기업에서 공개한 검색 데이터 셋을 사용한 근사 근접 이웃 탐색의 성능 비교에서 CXL-ANNS는 기존 연구들 대비 평균 111배 성능 향상이 있었다. 특히, 마이크로소프트의 상용화된 서비스에서 사용되는 방식과 비교하였을 때 92배의 성능 향상을 보여줬다. 정명수 교수는 "이번에 개발한 CXL-ANNS는 기존 검색 엔진의 문제였던 메모리 용량 제한 문제를 해결하고, CXL 기반의 메모리 확장이 실제 적용될 때 발생하는 메모리 접근 시간 지연 문제를 해결했다ˮ며, “제안하는 CXL 기반 메모리 확장과 데이터 근처 처리 가속의 패러다임은 검색 엔진뿐만 아니라 빅 데이터가 필요한 고성능 컴퓨팅, 유전자 탐색, 영상 처리 등의 다양한 분야에도 적용할 수 있다ˮ라고 말했다. 이번 연구는 미국 보스턴에서 오는 7월에 열릴 시스템 분야 최우수 학술대회인 유즈닉스 연례 회의 `USENIX Annual Technical Conference, 2023'에 ‘CXL-ANNS’이라는 이름으로 발표된 예정이다. (논문명: CXL-ANNS: Software-Hardware Collaborative Memory Disaggregation and Computation for Billion-Scale Approximate Nearest Neighbor Search) 한편 해당 연구는 파네시아(http://panmnesia.com)의 지원을 받아 진행됐다.
2023.05.25
조회수 2764
암세포만 공략하는 스마트 면역세포 시스템 개발
우리 대학 바이오및뇌공학과 최정균 교수와 의과학대학원 박종은 교수 공동연구팀이 인공지능과 빅데이터 분석을 기반으로 스마트 면역세포를 통한 암 치료의 핵심 기술을 개발했다고 밝혔다. 이 기술은 키메라 항원 수용체(Chimeric antigen receptor, CAR)가 논리회로를 통해 작동하게 함으로써 정확하게 암세포만 공략할 수 있도록 하는 차세대 면역항암 치료법으로 기대가 모아진다. 이번 연구는 분당차병원 안희정 교수와 가톨릭의대 이혜옥 교수가 공동연구로 참여했다. 최정균 교수 연구팀은 수백만개의 세포에 대한 유전자 발현 데이터베이스를 구축하고 이를 이용해 종양세포와 정상세포 간의 유전자 발현 양상 차이를 논리회로 기반으로 찾아낼 수 있는 딥러닝 알고리즘을 개발하고 검증하는 데 성공했다. 이 방법론으로 찾아진 논리회로를 장착한 CAR 면역세포는 마치 컴퓨터처럼 암과 정상 세포를 구별하여 작동함으로써 부작용없이 암세포만 정확하게 공략하는 것이 가능하다. 바이오및뇌공학과 권준하 박사, 의과학대학원 강준호 박사과정 학생이 공동 제1 저자로 참여한 이번 연구는 국제 학술지 '네이처 바이오테크놀로지(Nature Biotechnology)'에 지난 2월 16일 출판됐다. (논문명: Single-cell mapping of combinatorial target antigens for CAR switches using logic gates) 최근의 암 연구에서 가장 많은 시도와 진전이 있었던 분야는 바로 면역항암치료이다. 암환자가 갖고 있는 면역체계를 활용하여 암을 극복하는 이 치료 분야에는 몇 가지 방법이 있는데, 면역관문억제제 및 암백신과 더불어 세포치료 또한 해당된다. 특히, 키메라 항원 수용체를 장착한 CAR-T 혹은 CAR-NK라고 하는 면역세포들은 암항원을 인식하여 암세포를 직접 파괴할 수 있다. CAR 세포치료는 현재 혈액암에서의 성공을 시작으로 고형암으로 그 적용 범위를 넓히고자 하는 중인데, 혈액암과 달리 고형암에서는 부작용을 최소화하면서 효과적인 암 살상 능력을 보유하는 CAR 세포 개발에 어려움이 있었다. 이에 따라 최근에는 한 단계 진보된 CAR 엔지니어링 기술, 즉 AND, OR, NOT 과 같은 컴퓨터 연산 논리회로를 활용해 효과적으로 암세포를 공략할 수 있는 스마트 면역세포 개발이 활발히 진행되고 있다. 이러한 시점에서, 연구진은 세포 단위에서 정확히 암세포들에서만 발현하는 유전자들을 발굴하기 위해 대규모 암 및 정상 단일세포 데이터베이스를 구축했다. 이어서 연구진은 암세포들과 정상세포들을 가장 잘 구별할 수 있는 유전자 조합을 검색하는 인공지능 알고리즘을 개발했다. 특히 이 알고리즘은, 모든 유전자 조합에 대한 세포 단위 시뮬레이션을 통해 암세포만을 특이적으로 공략할 수 있는 논리회로를 찾아내는데 사용되었다. 이 방법론으로 찾아진 논리회로를 장착한 CAR 면역세포는 마치 컴퓨터처럼 암과 정상 세포를 구별하여 작동함으로써 부작용은 최소화하면서도 항암치료의 효과는 극대화시킬 수 있을 것으로 기대된다. 제1 저자인 권준하 박사는 "이번 연구는 이전에 시도된 적이 없는 방법론을 제시했는데, 특히 주목할 점은 수백만개의 개별 암세포 및 정상세포들에 대한 시뮬레이션을 통해 최적의 CAR 세포용 회로들을 찾아낸 과정이다ˮ라며 "인공지능과 컴퓨터 논리회로를 면역세포 엔지니어링에 적용하는 획기적인 기술로서 혈액암에서 성공적으로 사용되고 있는 CAR 세포치료가 고형암으로 확대되는데 중요한 역할을 할 것으로 기대된다"고 설명했다.ᅠ 이번 연구는 한국연구재단 원천기술개발사업-차세대응용오믹스사업의 지원을 받아 수행됐다.
2023.03.02
조회수 3935
레이블 없이 훈련 가능한 그래프 신경망 모델 기술 개발
최근 다양한 분야 (소셜 네트워크 분석, 추천시스템 등)에서 그래프 데이터 (그림 1) 의 중요성이 대두되고 있으며, 이에 따라 그래프 신경망(Graph Neural Network) 기술을 활용한 서비스가 급속히 증가하고 있다. 서비스 구축을 위해서는 심층 학습 모델을 훈련해야 하며, 이를 위해서는 충분한 훈련 데이터를 준비해야 한다. 특히 훈련 데이터에 정답지를 만드는 레이블링(labeling) 과정이 필요한데 (예를 들어, 소셜 네트워크의 특정 사용자에 `20대'라는 레이블을 부여하는 행위), 이 과정은 일반적으로 수작업으로 진행되므로 노동력과 시간이 소요된다. 따라서 그래프 신경망 모델 훈련 시 데이터가 충분하지 않은 상황을 효과적으로 타개하는 방법의 필요성이 대두되고 있다. 우리 대학 산업및시스템공학과 박찬영 교수 연구팀이 데이터의 레이블이 없는 상황에서도 높은 예측 정확도를 달성할 수 있는 새로운 그래프 신경망 모델 훈련 기술을 개발했다고 25일 밝혔다. 정점의 레이블이 없는 상황에서 그래프 신경망 모델의 훈련은 데이터 증강을 통해 생성된 정점들의 공통된 특성을 학습하는 과정으로 볼 수 있다. 하지만 이러한 정점의 공통된 특성을 학습하는 과정에서, 기존 훈련 방법은 표상 공간에서 자신을 제외한 다른 정점들과의 유사도가 작아지도록 훈련을 한다. 하지만 그래프 데이터가 정점들 사이의 관계를 나타내는 데이터 구조라는 점을 고려했을 때, 이런 일차원적인 방법론은 정점 간의 관계를 정확히 반영하지 못하게 된다. 박 교수팀이 개발한 기술은 그래프 신경망 모델에서 정점들 사이의 관계를 보존해 정점의 레이블이 없는 상황에서 모델을 훈련시켜 높은 예측 정확도를 달성할 수 있게 해준다. KAIST 산업및시스템공학과 이남경 석사과정이 제1 저자, 현동민 박사, 이준석 석사과정 학생이 제2, 제3 저자로 참여한 이번 연구는 최고권위 국제학술대회 `정보지식관리 콘퍼런스(CIKM) 2022'에서 올 10월 발표될 예정이다. (논문명: Relational Self-Supervised Learning on Graphs) 기존 연구에서는 정점의 레이블이 없는 상황에서 정점에 대한 표상을 훈련하기 위해 표상 공간 내에서 자기 자신을 제외한 다른 정점들과의 유사도가 작아지도록 훈련을 한다. 예를 들어서, 소셜 네트워크에 A, B, C 라는 사용자가 존재할 때, A, B와 C가 표상 공간에서 서로 간의 유사도가 모두 작아지도록 모델을 훈련하는 것이다. 이때 박 교수팀이 착안한 점은 그래프 데이터가 정점 간의 관계를 나타내는 데이터이므로 정점 간의 관계를 포착하도록 정점의 표상을 훈련할 필요가 있다는 점이었다. 즉, A, B와 C 서로 간의 유사도가 모두 작아지게 하는 훈련 메커니즘과는 달리, 실제 그래프상에서는 이들이 연관이 있을 수 있다는 점이다. 따라서 A, B와 C 사이의 관계를 긍정/부정의 이진 분류를 통해 표상 공간에서 유사도가 작아지도록 훈련을 하는 것이 아닌, 이들의 관계를 정의해 그 관계를 보존하도록 학습하는 모델을 연구팀은 개발했다(그림 2). 연구팀은 정점 간의 관계를 기반으로 정점의 표상을 훈련함으로써, 기존 연구가 갖는 엄격한 규제들을 완화해 그래프 데이터를 더 유연하게 모델링했다. 연구팀은 이 학습 방법론을 `관계 보존 학습'이라고 명명했으며, 그래프 데이터 분석의 주요 문제(정점 분류, 간선 예측)에 적용했다(그림 3). 그 결과 최신 연구 방법론과 비교했을 때, 정점 분류 문제에서 최대 3% 예측 정확도를 향상했고, 간선 예측 문제에서 6%의 성능 향상, 다중 연결 네트워크 (Multiplex network)의 정점 분류 문제에서 3%의 성능 향상을 보였다. 제1 저자인 이남경 석사과정은 "이번 기술은 데이터의 레이블이 부재한 상황에서도 그래프 신경망을 학습할 수 있는 새로운 방법ˮ 이라면서 "그래프 기반의 데이터뿐만이 아닌 이미지 텍스트 음성 데이터 등에 폭넓게 적용될 수 있어, 심층 학습 전반적인 성능 개선에 기여할 수 있다ˮ고 밝혔다. 연구팀을 지도한 박찬영 교수도 "이번 기술은 그래프 데이터상에 레이블이 부재한 상황에서 표상 학습 모델을 훈련하는 기존 모델들의 단점들을 `관계 보존`이라는 개념을 통해 보완해 새로운 학습 패러다임을 제시하여 학계에 큰 파급효과를 낼 수 있다ˮ라고 말했다. 한편, 이번 연구는 과학기술정보통신부 재원으로 정보통신기획평가원의 지원을 받아 사람중심인공지능핵심원천기술개발 과제로 개발한 연구성과 결과물(No. 2022-0-00157, 강건하고 공정하며 확장 가능한 데이터 중심의 연속 학습)이다.
2022.10.25
조회수 3859
인공지능 심층 학습(딥러닝) 서비스 구축 비용 최소화 가능한 데이터 정제 기술 개발
최근 다양한 분야에서 인공지능 심층 학습(딥러닝) 기술을 활용한 서비스가 급속히 증가하고 있다. 서비스 구축을 위해서 인공지능은 심층신경망을 훈련해야 하며, 이를 위해서는 충분한 훈련 데이터를 준비해야 한다. 특히 훈련 데이터에 정답지를 만드는 레이블링(labeling) 과정이 필요한데 (예를 들어, 고양이 사진에 `고양이'라고 정답을 적어줌), 이 과정은 일반적으로 수작업으로 진행되므로 엄청난 노동력과 시간적 비용이 소요된다. 따라서 훈련 데이터 구축 비용을 최소화하는 방법 개발이 요구되고 있다. 우리 대학 전산학부 이재길 교수 연구팀이 심층 학습 훈련 데이터 구축 비용을 최소화할 수 있는 새로운 데이터 동시 정제 및 선택 기술을 개발했다고 12일 밝혔다. 일반적으로 심층 학습용 훈련 데이터 구축 과정은 수집, 정제, 선택 및 레이블링 단계로 이뤄진다. 수집 단계에서는 웹, 카메라, 센서 등으로부터 대용량의 데이터가 정제되지 않은 채로 수집된다. 따라서 수집된 데이터에는 목표 서비스와 관련이 없어서 주어진 레이블에 해당하지 않는 분포 외(out-of-distribution) 데이터가 포함된다 (예를 들어, 동물 사진을 수집할 때 재규어 `자동차'가 포함됨). 이러한 분포 외 데이터는 데이터 정제 단계에서 정제돼야 한다. 모든 정제된 데이터에 정답지를 만들기 위해서는 막대한 비용이 소모되는데, 이를 최소화하기 위해 심층 학습 성능 향상에 가장 도움이 되는 훈련 데이터를 먼저 선택해 레이블링하는 능동 학습(active learning)이 큰 주목을 받고 있다. 그러나 정제와 레이블링을 별도로 진행하는 것은 데이터 검사 측면에서 중복적인 비용을 초래한다. 또한 아직 정제되지 않고 남아 있는 분포 외 데이터가 레이블링 단계에서 선택된다면 레이블링 노력을 낭비할 수 있다. 이재길 교수팀이 개발한 기술은 훈련 데이터 구축 단계에서 데이터의 정제 및 선택을 동시에 수행해 심층 학습용 훈련 데이터 구축 비용을 최소화할 수 있도록 해준다. 우리 대학 데이터사이언스대학원에 재학 중인 박동민 박사과정 학생이 제1 저자, 신유주 박사과정, 이영준 박사과정 학생이 제2, 제4 저자로 각각 참여한 이번 연구는 최고권위 국제학술대회 `신경정보처리시스템학회(NeurIPS) 2022'에서 올 12월 발표될 예정이다. (논문명 : Meta-Query-Net: Resolving Purity-Informativeness Dilemma in Open-set Active Learning) 데이터의 정제 및 선택을 동시에 고려하기 위해서 구체적으로 가장 분포 외 데이터가 아닐 것 같은 데이터 중에서 가장 심층 학습 성능 향상에 도움이 될 데이터를 선택한다. 즉, 주어진 훈련 데이터 구축 비용 내에서 최고의 효과를 내도록 데이터의 순도(purity) 지표와 정보도(informativeness) 지표의 최적 균형(trade-off)을 찾는다. 순도와 정보도는 일반적으로 서로 상충하므로 최적 균형을 찾는 것이 간단하지 않다. 이 교수팀은 이러한 최적 균형이 정제 전 데이터의 분포 외 데이터 비율과 현재 심층신경망 훈련 정도에 따라 달라진다는 점을 발견했다. 이 교수팀은 이러한 최적 균형을 찾아내기 위해 추가적인 작은 신경망 모델을 도입했다. 연구팀은 추가된 모델을 훈련하기 위해 능동 학습에서 여러 단계에 걸쳐 데이터를 선별하는 과정을 활용했다. 즉, 새롭게 선택돼 레이블링 된 데이터를 순도-정보도 최적 균형을 찾기 위한 훈련 데이터로 활용했고, 레이블이 추가될 때마다 최적 균형을 갱신했다. 이러한 방법은 목표 심층신경망의 성능 향상을 위해 추가적인 상위 레벨의 신경망을 사용하였다는 점에서 메타학습(meta-learning)의 일종이라 볼 수 있다. 연구팀은 이 메타학습 방법론을 `메타 질의 네트워크'라고 이름 붙이고 이미지 분류 문제에 대해 다양한 데이터와 광범위한 분포 외 데이터 비율에 걸쳐 방법론을 검증했다. 그 결과, 기존 최신 방법론과 비교했을 때 최대 20% 향상된 최종 예측 정확도를 향상했고, 모든 범위의 분포 외 데이터 비율에서 일관되게 최고 성능을 보였다. 또한, `메타 질의 네트워크'의 최적 균형 분석을 통해, 분포 외 데이터의 비율이 낮고 현재 심층신경망의 성능이 높을수록 정보도에 높은 가중치를 둬야 함을 연구팀은 밝혀냈다. 제1 저자인 박동민 박사과정 학생은 "이번 기술은 실세계 능동 학습에서의 순도-정보도 딜레마를 발견하고 해결한 획기적인 방법ˮ 이라면서 "다양한 데이터 분포 상황에서의 강건성이 검증됐기 때문에, 실생활의 기계 학습 문제에 폭넓게 적용될 수 있어 전반적인 심층 학습의 훈련 데이터 준비 비용 절감에 기여할 것ˮ 이라고 밝혔다. 연구팀을 지도한 이재길 교수도 "이 기술이 텐서플로우(TensorFlow) 혹은 파이토치(PyTorch)와 같은 기존의 심층 학습 라이브러리에 추가되면 기계 학습 및 심층 학습 학계에 큰 파급효과를 낼 수 있을 것이다ˮ고 말했다. 한편, 이 기술은 과학기술정보통신부 재원으로 정보통신기획평가원의 지원을 받아 SW컴퓨팅산업원천기술개발사업 SW스타랩 과제로 개발한 연구성과 결과물(2020-0-00862, DB4DL: 딥러닝 지원 고사용성 및 고성능 분산 인메모리 DBMS 개발)이다.
2022.10.12
조회수 4225
<<
첫번째페이지
<
이전 페이지
1
2
3
4
5
6
7
8
9
>
다음 페이지
>>
마지막 페이지 9