-
인공지능이 상황에 따라 알아서 업데이트되다
최근 실생활에 활용되는 인공지능 모델이 시간이 지남에 따라 성능이 점차 떨어지는 현상이 다수 발견되었고, 이에 따라 지속가능한 인공지능 학습 기술에 대한 필요성이 커지고 있다. AI 모델이 꾸준히 정확한 판단을 내리는 것은 더욱 안전하고 신뢰할 수 있는 인공지능을 만들기 위한 중요한 요소이다.
우리 대학 전기및전자공학부 황의종 교수 연구팀이 시간에 따라 데이터의 분포가 변화하는 드리프트 환경에서도 인공지능이 정확한 판단을 내리도록 돕는 새로운 학습 데이터 선택 기술을 개발했다고 14일 밝혔다.
최근 인공지능이 다양한 분야에서 인간의 능력을 뛰어넘을 정도의 높은 성능을 보여주고 있지만, 대부분의 좋은 결과는 AI 모델을 훈련시키고 성능을 테스트할 때 데이터의 분포가 변하지 않는 정적인 환경을 가정함으로써 얻어진다. 하지만 이러한 가정과는 다르게 SK 하이닉스의 반도체 공정 과정에서 시간에 따른 장비의 노화와 주기적인 점검으로 인해 센서 데이터의 관측값이 지속적으로 변화하는 드리프트 현상이 관측되고 있다.
시간이 지나면서 데이터와 정답 레이블 간의 결정 경계 패턴이 변경되면, 과거에 학습되었던 AI 모델이 내린 판단이 현재 시점에서는 부정확하게 되면서 모델의 성능이 점차 악화될 수 있다.
본 연구팀은 이러한 문제를 해결하기 위해, 데이터를 학습했을 때 AI 모델의 업데이트 정도와 방향을 나타내는 그래디언트(gradient)를 활용한 개념을 도입하여 제시한 개념이 드리프트 상황에서 학습에 효과적인 데이터를 선택하는 데에 도움을 줄 수 있음을 이론적으로 실험적으로 분석했다. 그리고 이러한 분석을 바탕으로 효과적인 학습 데이터 선택 기법을 제안하여, 데이터의 분포와 결정 경계가 변화해도 모델을 강건하게 학습할 수 있는 지속 가능한 데이터 중심의 AI 학습 프레임워크를 제안했다.
본 학습 프레임워크의 주요 이점은, 기존의 변화하는 데이터에 맞춰서 모델을 적응시키는 모델 중심의 AI 기법과 달리, 드리프트의 주요 원인이라고 볼 수 있는 데이터 자체를 직접 전처리를 통해 현재 학습에 최적화된 데이터로 바꿔줌으로써, 기존의 AI 모델 종류에 상관없이 쉽게 확장될 수 있다는 점에 있다. 실제로 본 기법을 통해 시간에 따라 데이터의 분포가 변화되었을 때에도 AI 모델의 성능, 즉 정확도를 안정적으로 유지할 수 있었다.
제1 저자인 김민수 박사과정 학생은 "이번 연구를 통해 인공지능을 한번 잘 학습하는 것도 중요하지만, 그것을 변화하는 환경에 따라 계속해서 관리하고 성능을 유지하는 것도 중요하다는 사실을 알릴 수 있으면 좋겠다ˮ고 밝혔다.
연구팀을 지도한 황의종 교수는 “인공지능이 변화하는 데이터에 대해서도 성능이 저하되지 않고 유지하는 데에 도움이 되기를 기대한다”고 말했다.
본 연구에는 KAIST 전기및전자공학부의 김민수 박사과정이 제1 저자, 황성현 박사과정이 제2 저자, 그리고 황의종 교수(KAIST)가 교신 저자로 참여했다. 이번 연구는 지난 2월 캐나다 밴쿠버에서 열린 인공지능 최고 권위 국제학술 대회인 ‘국제 인공지능 학회(Association for the Advancement of Artificial Intelligence, AAAI)’에서 발표되었다. (논문명: Quilt: Robust Data Segment Selection against Concept Drifts)
한편, 이 기술은 SK 하이닉스 인공지능협력센터(AI Collaboration Center; AICC)의 지원을 받은 ‘노이즈 및 변동성이 있는 FDC 데이터에 대한 강건한 학습’ 과제 (K20.05) 와 정보통신기획평가원의 지원을 받은 ‘강건하고 공정하며 확장가능한 데이터 중심의 연속 학습’ 과제 (2022-0-00157) 와 한국연구재단의 지원을 받은 ‘데이터 중심의 신뢰 가능한 인공지능’ 과제 성과다.
2024.03.14
조회수 2602
-
전산학부 차미영 교수, AAAI ICWSM Test of Time Award 수상
우리 대학 전산학부 차미영 교수(기초과학연구원 데이터 사이언스 그룹 CI 겸직)는 2010년 게재한 ‘백만 팔로워의 오류(Measuring User Influence in Twitter: The Million Follower Fallacy)’ 논문으로 AAAI ICWSM Test of Time Award를 수상하게 된 소식이 현재 온라인으로 개최되고 있는 제14회 웹 소셜미디어학회(ICWSM, International Conference on Web and Social Media)를 통해 전해졌다. Test of Time Award는 오랫동안 지속적인 영향력을 가지는 과거의 연구에 주어지는 특별한 상으로, 차 교수의 논문은 올해로 게재된 지 10년이 되고 그간 3,669회 피인용됐다.
이 연구는 소셜네트워크 플랫폼에서 사용자의 영향력을 계산하는 다양한 측정법의 비교와 한계를 보여주며, 특히 트위터상에서 단순히 팔로워가 많다고 메시지의 전파 영향력이 크지 않다는 '백만 팔로워의 오류'를 데이터로 보여주었다. 이 연구의 분석에 서버 50대로 수집한 54,981,152 사용자계정, 1,963,263,821 소셜링크, 그리고 1,755,925,520 트윗이 사용되어 당시 이례적으로 방대한 네트워크 분석에 기인하였으며, 추후 연구와 함께 이 데이터가 공유되어 수천 건의 후속 연구를 가능하게 했다.
연구 내용 중에는 얼마나 오랜 기간 영향력자가 활동하는지, 또한 분야를 넘나들며 다양한 토픽에 영향력을 가질 수 있는지도 다룬다. 새로운 사건이 발생했을 때 누가 영향력자가 되는지의 사례 분석을 통해, 영향력자는 기존 accidental influentials 이론에서 주장된 것처럼 우연히 발생하지 않고 몇 가지 전략을 통해 빠르게 영향력자로 떠오를 수 있음을 보였다. 이러한 발견은 자산규모가 크게 성장한 소셜네트워크 플랫폼에서 광고 효과를 극대화하기 위한 영향력자의 선정 알고리즘에 새로운 통찰력과 해석을 제공했다. 이 연구는 2010년 당시 뉴욕타임스지 온라인에 소개되기도 했다.
차 교수는 카이스트 학부와 대학원을 졸업하고, 독일 막스 플랑크 연구소에서 박사후연구과정에 있는 동안 이 연구를 진행했다. 그는 이번 수상 소식을 통해 "당시는 소셜네트워크 플랫폼의 데이터가 전산학에서 큰 주목을 받지 못했지만, 어려운 사회과학 문제에 인터넷 데이터가 활용될 수 있다는 점이 너무 재미있어서 밤새 연구한 기억이 난다. 오랜 시간 동안 사랑받는 연구가 되어서 감사하다"라고 전했다.
논문 링크: https://www.aaai.org/ocs/index.php/ICWSM/ICWSM10/paper/viewPaper/1538
2020.06.12
조회수 20055
-
차미영 교수, 국제학회 최우수 논문상 수상
우리 대학 문화기술대학원 차미영(33) 교수가 지난 6월 4일부터 나흘 동안 아일랜드 더블린市 소재 트리니티 칼리지(Trinity College)에서 열린 제 6회 AAAI 웝로그 및 소셜미디어 국제학회 ICWSM(International AAAI Conference on Weblogs and Social Media)에서 최우수 논문상을 수상했다
차 교수가 이번 학회에서 발표한 논문 제목은 ‘온라인 소셜 네트워크 내 관습의 발생(The Emergence of Conventions in Online Social Network)‘인데 사회적 관습의 형성과 채택과정을 온라인 소셜 네트워크 사례를 통해 증명했다는 점을 인정받아 최우수 논문으로 선정되는 영예를 안았다.
사회적 관습의 형성은 사회학에서 전통적인 문제였으나 실제 사회에서 이 과정을 보는 것은 거의 불가능에 가깝기 때문에 그 동안 간단한 실험 혹은 수학적 모델을 통해 다뤄져 왔다.
차미영 교수와 독일의 막스 플랑트 연구소(MPI-SWS) 연구팀이 공동으로 추진한 이 연구는 2006년부터 2009년까지의 트위터 데이터를 이용해 리트윗(Retweet)이 다양한 방식으로 사용자들에게 채택돼 사용되는 과정을 분석했다.
리트윗은 다른 사용자가 쓴 트윗을 나의 팔로워(Follower)에게 보여주고 싶은 경우, 혹은 해당 트윗에 자신의 의견을 담아 자신의 팔로워들에게 전달하고 싶을 경우 사용하는 트위터 방법이다.
리트윗은 트위터가 처음 만들어졌을 때는 제공되지 않은 기능이었지만 한 사용자가 ‘Via’라는 단어와 그 트윗을 남긴 사용자를 언급하는 방식으로 처음 사용하기 시작한 이후, 급속도로 이용자가 증가했다. 이후에 같은 용도로 ‘HT’, ‘Retweet’, ‘RT’ 등의 키워드를 이용하는 방식이 생겨났고, 현재 가장 많이 사용되는 ‘RT’, ‘Via’ 등이 사용되면서 트워터의 관습(Convention)으로 자리를 잡았다.
이에 따라 트위터는 결국 리트윗을 트위터 자체 시스템을 통해 제공하기 시작했는데 이는 최초에 리트윗이 사용자들에 의해 만들어지고 사용돼 자리를 잡았다는 점에서 ‘사회적 관습’이 만들어진 과정으로 연구팀은 해석했다.
연구팀은 또 사회적 관습이 만들어지는 과정에서 얼리어답터들의 특성을 분석한 결과 개인정보 • URL • 프로필 사진 • 위치정보 • 리스트 등 트위터의 다양한 기능을 적극적으로 활용하는 사용자들임을 밝혀냈다.
얼리어답터들은 팔로잉(Following)하는 유저들도 평균적으로 10-100배 이상 많았고 그들끼리 사회관계망이 밀접하게 형성될 뿐만 아니라 얼리어답터에 의해 새로운 관습이 채택되는 과정에서, 리트윗의 사용이 그들의 친구들을 중심으로 급속히 사용되며 확산되고 있음을 증명했다.
차미영 교수는 “이번 연구는 트위터가 만들어진 때부터 거의 모든 데이터를 가지고 트위터에서의 관습변화를 분석한 것으로 SNS를 통해 실제 사회적 관습의 형성과정을 증명했다는 점에서 의미가 있다”고 말했다. 끝.
2012.07.04
조회수 14706