< (왼쪽부터) 전기및전자공학부 황의종 교수, 노유지 박사과정 >
인공지능 기술이 사회 전반에 걸쳐 광범위하게 활용되며 인간의 삶에 많은 영향을 미치고 있다. 최근 인공지능의 긍정적인 효과 이면에 범죄자의 재범 예측을 위해 머신러닝 학습에 사용되는 콤파스(COMPAS) 시스템을 기반으로 학습된 모델이 인종 별로 서로 다른 재범 확률을 부여할 수 있다는 심각한 편향성이 관찰되었다. 이 밖에도 채용, 대출 시스템 등 사회의 중요 영역에서 인공지능의 다양한 편향성 문제가 밝혀지며, 공정성(fairness)을 고려한 머신러닝 학습의 필요성이 커지고 있다.
우리 대학 전기및전자공학부 황의종 교수 연구팀이 학습 상황과 달라진 새로운 분포의 테스트 데이터에 대해서도 편향되지 않은 판단을 내리도록 돕는 새로운 모델 훈련 기술을 개발했다고 30일 밝혔다.
최근 전 세계의 연구자들이 인공지능의 공정성을 높이기 위한 다양한 학습 방법론을 제안하고 있지만, 대부분의 연구는 인공지능 모델을 훈련시킬 때 사용되는 데이터와 실제 테스트 상황에서 사용될 데이터가 같은 분포를 갖는다고 가정한다. 하지만 실제 상황에서는 이러한 가정이 대체로 성립하지 않으며, 최근 다양한 어플리케이션에서 학습 데이터와 테스트 데이터 내의 편향 패턴이 크게 변화할 수 있음이 관측되고 있다.
이때, 테스트 환경에서 데이터의 정답 레이블과 특정 그룹 정보 간의 편향 패턴이 변경되면, 사전에 공정하게 학습되었던 인공지능 모델의 공정성이 직접적인 영향을 받고 다시금 악화된 편향성을 가질 수 있다. 일례로 과거에 특정 인종 위주로 채용하던 기관이 이제는 인종에 관계없이 채용한다면, 과거의 데이터를 기반으로 공정하게 학습된 인공지능 채용 모델이 현대의 데이터에는 오히려 불공정한 판단을 내릴 수 있다.
연구팀은 이러한 문제를 해결하기 위해, 먼저 `상관관계 변화(correlation shifts)' 개념을 도입해 기존의 공정성을 위한 학습 알고리즘들이 가지는 정확성과 공정성 성능에 대한 근본적인 한계를 이론적으로 분석했다. 예를 들어 특정 인종만 주로 채용한 과거 데이터의 경우 인종과 채용의 상관관계가 강해서 아무리 공정한 모델을 학습을 시켜도 현재의 약한 상관관계를 반영하는 정확하면서도 공정한 채용 예측을 하기가 근본적으로 어려운 것이다. 이러한 이론적인 분석을 바탕으로, 새로운 학습 데이터 샘플링 기법을 제안해 테스트 시에 데이터의 편향 패턴이 변화해도 모델을 공정하게 학습할 수 있도록 하는 새로운 학습 프레임워크를 제안했다. 이는 과거 데이터에서 우세하였던 특정 인종 데이터를 상대적으로 줄임으로써 채용과의 상관관계를 낮출 수 있다.
< 그림 1. 채용과 인종의 상관관계가 변할 때 훈련 데이터를 개선하는 예시 >
제안된 기법의 주요 이점은 데이터 전처리만 하기 때문에 기존에 제안된 알고리즘 기반 공정한 학습 기법을 그대로 활용하면서 개선할 수 있다는 것이다. 즉 이미 사용되고 있는 공정한 학습 알고리즘이 위에서 설명한 상관관계 변화에 취약하다면 제안된 기법을 함께 사용해서 해결할 수 있다.
제1 저자인 전기및전자공학부 노유지 박사과정 학생은 "이번 연구를 통해 인공지능 기술의 실제 적용 환경에서, 모델이 더욱 신뢰 가능하고 공정한 판단을 하도록 도울 것으로 기대한다ˮ고 밝혔다.
연구팀을 지도한 황의종 교수는 "기존 인공지능이 변화하는 데이터에 대해서도 공정성이 저하되지 않도록 하는 데 도움이 되기를 기대한다ˮ고 말했다.
이번 연구에는 노유지 박사과정이 제1 저자, 황의종 교수(KAIST)가 교신 저자, 서창호 교수(KAIST)와 이강욱 교수(위스콘신-매디슨 대학)가 공동 저자로 참여했다. 이번 연구는 지난 7월 미국 하와이에서 열린 머신러닝 최고권위 국제학술 대회인 `국제 머신러닝 학회 International Conference on Machine Learning (ICML)'에서 발표됐다. (논문명 : Improving Fair Training under Correlation Shifts)
한편, 이 기술은 정보통신기획평가원의 지원을 받은 `강건하고 공정하며 확장가능한 데이터 중심의 연속 학습' 과제 (2022-0-00157)와 한국연구재단 지원을 받은 `데이터 중심의 신뢰 가능한 인공지능' 과제의 성과다.
챗GPT가 촉발한 생성형 인공지능(AI)*이 세계적으로 열풍을 일으키는 가운데 새로운 인공지능 반도체의 생태계 구축을 위해 KAIST(총장 이광형)가 네이버(NAVER) 및 인텔(intel)과 손잡고 상호 보유 중인 역량과 강점을 한 곳에 집중한 ‘NAVER · intel · KAIST AI 공동연구센터(NIK AI Research Center)’를 설립한다. 업계에서는 이들 세 기관의 전략적인 제휴가 인공지능 반도체·인공지능 서버와 데이터센터의 운영에 필요한 오픈소스용 소프트웨어 개발 등 인공지능 분야에서 각자 보유하고 있는 하드웨어 및 소프트웨어 기술과 역량을 융합해서 새로운 인공지능 반도체 생태계를 구축하는 한편 시장과 기술 주도권 확보를 위해 선제적인 도전에 나선 것으로 보고 있다. 특히 첨단 반도체 CPU 설계부터 파운드리까지 하는 세계적인 반도체 기업 인텔이 기존의 중앙처리장치(CPU)를 넘어 인공지능 반
2024-04-30최근 자연어나 이미지, 동영상, 음악 등 다양한 분야에서 주목받는 생성형 AI가 신약 설계 분야에서도 기존 신규성 문제를 극복하고 새로운 혁신을 일으키고 있다고 하는데 어떤 기술일까? 우리 대학 화학과 김우연 교수 연구팀이 단백질-분자 사이의 상호작용을 고려해 활성 데이터 없이도 타겟 단백질에 적합한 약물 설계 생성형 AI를 개발했다고 18일 밝혔다. 신규 약물을 발굴하기 위해서는 질병의 원인이 되는 타겟 단백질에 특이적으로 결합하는 분자를 찾는 것이 중요하다. 기존의 약물 설계 생성형 AI는 특정 단백질의 이미 알려진 활성 데이터를 학습에 활용하기 때문에 기존 약물과 유사한 약물을 설계하려는 경향이 있다. 이는 신규성이 중요한 신약 개발 분야에서 치명적인 약점으로 지적되어 왔다. 또한 사업성이 높은 계열 내 최초(First-in-class) 타겟 단백질에 대해서는 실험 데이터가 매우 적거나 전무한데, 이 경우 기존 방식의 생성형 AI를 활용하는 것이 불가능하다. 연구팀
2024-04-18우리 대학이 서울시 · 서울시복지재단과 'AI안부확인서비스 데이터 활용연구를 위한 업무협약'을 29일 서면 교환 방식으로 체결한다. 이번 업무협약은 서울시가 2022년 10월부터 제공해 온 인공지능을 활용한 안부 확인 서비스를 고도화하기 위해 추진된다. 안부 대상자의 심리상태와 고립 위험 신호를 탐지할 수 있는 대화형 'AI안부확인서비스'를 개발해 고립가구 돌봄서비스에 활용하는 것이 목표다. 우리 대학은 이번 연구를 위해 인공지능-사회복지-HCI(인간컴퓨터상호작용)를 아우르는 융합연구팀을 구성했다. 차미영 전산학부 교수와 최문정 과학기술정책대학원 교수 및 IBS 수리 및 계산과학 연구단 데이터사이언스 그룹 진효진 박사가 참여한다. 연구팀은 서울시가 'AI안부확인서비스'를 운영하며 축적해 온 대화 데이터를 제공받아 ▴고립 위험 대상자를 찾아낼 수 있는 지표 개발 ▴고립감 해소 및 심리적 안정을 위한 시나리오 개발과 이를 반영한 대화형 인공지능 개발 ▴고령자 및
2024-03-29우리 대학 신소재공학과 김경민 교수 연구팀이 다양한 멤리스터* 소자를 이용한 설명 가능한 인공지능 (XAI) 시스템을 구현하는데 성공했다고 25일 밝혔다. *멤리스터 (Memristor): 메모리 (Memory)와 저항 (Resistor)의 합성어로, 입력 신호에 따라 소자의 저항 상태가 변하는 소자 최근 인공지능 (AI) 기술의 급속한 발전이 다양한 분야에서 성과를 이루고 있다. 이미지 인식, 음성 인식, 자연어 처리 등에서 AI의 적용 범위가 확대되며 우리의 일상생활에 깊숙이 자리 잡고 있다. AI는 인간의 뉴런 구조를 모방해 만든 ‘인공신경망’을 기반으로, 적게는 수백만 개에서 많게는 수조 개에 달하는 매개변수를 통해 데이터를 분석하고 의사 결정을 내린다. 그러나 이 많은 매개변수로 인해 AI 모델의 동작 원리를 정확하게 이해하기 어렵고, 이는 통상적으로 블랙박스에 비유되곤 한다. AI가 어떤 기준으로 결정을 내는지 알 수 없다면, AI에 결함이나
2024-03-25최근 실생활에 활용되는 인공지능 모델이 시간이 지남에 따라 성능이 점차 떨어지는 현상이 다수 발견되었고, 이에 따라 지속가능한 인공지능 학습 기술에 대한 필요성이 커지고 있다. AI 모델이 꾸준히 정확한 판단을 내리는 것은 더욱 안전하고 신뢰할 수 있는 인공지능을 만들기 위한 중요한 요소이다. 우리 대학 전기및전자공학부 황의종 교수 연구팀이 시간에 따라 데이터의 분포가 변화하는 드리프트 환경에서도 인공지능이 정확한 판단을 내리도록 돕는 새로운 학습 데이터 선택 기술을 개발했다고 14일 밝혔다. 최근 인공지능이 다양한 분야에서 인간의 능력을 뛰어넘을 정도의 높은 성능을 보여주고 있지만, 대부분의 좋은 결과는 AI 모델을 훈련시키고 성능을 테스트할 때 데이터의 분포가 변하지 않는 정적인 환경을 가정함으로써 얻어진다. 하지만 이러한 가정과는 다르게 SK 하이닉스의 반도체 공정 과정에서 시간에 따른 장비의 노화와 주기적인 점검으로 인해 센서 데이터의 관측값이 지속적으로 변화하는
2024-03-14