본문 바로가기
대메뉴 바로가기
KAIST
뉴스
유틸열기
홈페이지 통합검색
-
검색
ENGLISH
메뉴 열기
%EA%B9%80%ED%98%84%EC%9A%B1
최신순
조회순
바이오 경로 이미지 분석하는 AI 최초 개발
유전자, 단백질, 대사물질 등 복잡한 정보를 표현하는 바이오 경로 이미지는 중요한 연구 결과를 내포하고 있지만, 이미지 기반 정보 추출에 대해 그동안 충분한 연구가 이뤄지지 않았다. 이에 우리 연구진은 바이오 경로 정보를 자동으로 추출할 수 있는 인공지능 프레임워크를 개발했다. 우리 대학 생명화학공학과 김현욱 교수 연구팀이 바이오 경로 이미지에서 유전자와 대사물질 정보를 자동으로 추출하는 기계학습 기반의 ‘바이오 경로 정보 추출 프레임워크(이하 EBPI, Extraction of Biological Pathway Information)’를 개발했다고 28일 밝혔다. 연구팀이 개발한 EBPI는 문헌에서 추출한 이미지 속의 화살표와 텍스트를 인식하고, 이를 기반으로 바이오 경로를 편집 가능한 표의 형태로 재구성한다. 객체 감지 모델 등의 기계학습을 사용해 경로 이미지 내 화살표의 위치와 방향을 감지하고, 이미지 속 텍스트를 유전자, 단백질, 대사물질로 분류한다. 그 후 추출된 정보를 통합해 경로 정보를 표 형식으로 제공한다. 연구팀은 74,853편의 논문에서 추출한 바이오 경로 이미지와 기존 수작업으로 작성된 경로 지도를 비교하며 EBPI의 성능을 검증했다. 그 결과, 높은 정확도로 바이오 경로 정보가 자동으로 추출됐음을 확인했다. EBPI를 사용해 대표적인 바이오 경로 데이터베이스에 포함되지 않은 생화학 반응 정보를 대량의 문헌 내 바이오 경로 이미지로부터 추출하는 데에도 성공했다. 다양한 산업적 가치를 지닌 대사물질들의 생합성 관련 문헌을 EBPI로 분석한 결과, 문헌에서는 보고가 됐지만, 기존 데이터베이스에서는 누락된 생화학 반응들이 확인된 것이다. 화학산업에서 다양한 응용분야를 갖는 1,4-부탄디올, 2-메틸부티르산, 하이드록시티로솔, 레불린산 및 발레로락탐의 생합성 경로를 예시로 이러한 발견을 제시했다. 연구를 총괄한 김현욱 교수는 “이번 연구에서 개발된 EBPI는 대규모 문헌 데이터 분석에 있어 중요한 도구가 될 것이며 생명공학, 대사공학 및 합성생물학 분야에서 바이오 경로 이미지를 AI로 분석하는 최초의 사례로, 관련 연구의 실험 디자인 및 분석 시 유용하게 활용될 수 있을 것”이라고 밝혔다. 생명화학공학과 권문수 박사과정생과 이준규 박사과정생이 공동 제1 저자인 이번 연구는 대사공학 및 합성생물학 분야의 대표적 국제학술지인 대사공학(Metabolic Engineering, JCR 분야 상위 10% 이내)에 11월호에 게재됐다. ※ 논문명 : A machine learning framework for extracting information from biological pathway images in the literature ※ 저자 정보 : 권문수(한국과학기술원, 공동 제1 저자), 이준규(한국과학기술원, 공동 제1 저자), 김현욱(한국과학기술원, 교신저자) 포함 총 3명 한편 이번 연구는 과학기술정보통신부 한국연구재단 및 농촌진흥청의 농업미생물사업단의 지원을 받아 수행됐다.
2024.11.28
조회수 1087
암 유발 물질 컴퓨터로 예측하다
암은 정상세포와 다르게 세포 내 비정상적인 축적을 통해 유발되는 대사 반응을 하며, 암의 치료 및 진단을 목적으로 이런 암 대사반응에 대해 다방면으로 연구되고 있다. 이에 우리 대학 연구진이 컴퓨터를 통해 24개 암종에 해당하는 1,043명의 암 환자에 대한 대사 모델 구축에 성공했다. 우리 대학 생명화학공학과 김현욱 교수, 이상엽 특훈교수 연구팀이 서울대학교병원 고영일 교수, 윤홍석 교수 및 정창욱 교수 연구팀과의 공동연구를 통해, 암 체세포 유전자 돌연변이와 연관된 새로운 대사물질 및 대사경로를 예측하는 컴퓨터 방법론을 개발했다고 18일 밝혔다. 최근 암 유발 대사물질(oncometabolite)*의 발견과 이를 표적으로 하는 신약들이 미국식품의약국(FDA)의 승인을 받으며 주목받고 있는데, 이에는 급성 골수성 백혈병의 치료제로 사용되고 있는 ‘팁소보(성분명: 아이보시데닙)’ 및 약물 ‘아이드하이파(성분명: 에나시데닙)’가 포함된다. *암 유발 대사물질 (oncometabolite): 세포 내 비정상적인 축적을 통해 암을 유발하는 대사물질. 이러한 대사물질들은 특정 유전자 돌연변이의 영향으로 대사 과정 중에 비정상적으로 높은 농도로 축적되며, 이러한 축적은 암세포의 성장과 생존을 촉진함. 기존 연구에서 확인된 주요 암 유발 대사물질로는 2-하이드록시글루타레이트(2-hydroxyglutarate), 숙시네이트(succinate), 푸마레이트(fumarate) 등이 보고됨. 하지만, 암 대사 연구와 새로운 암 유발 대사물질 발굴에는 대사체학 등의 방법론이 필요하며, 이를 대규모 환자 샘플에 적용하기 위해서는 상당한 시간과 비용이 소요된다. 이러한 이유로, 암과 관련된 많은 유전자 돌연변이들이 밝혀졌음에도, 그에 상응하는 암 유발 대사물질은 극소수만 알려져 있다. 김현욱 교수 공동연구팀은 세포 대사 정보를 예측할 수 있는 게놈 수준의 대사 모델*에 국제 암 연구 컨소시엄에서 공개하고 있는 암 환자들의 전사체 데이터를 통합해, 24개 암종에 해당하는 1,043명의 암 환자에 대한 대사 모델을 성공적으로 구축했다. *게놈 수준의 대사모델: 세포의 전체 대사 네트워크를 다루는 컴퓨터 모델로서, 세포 내 모든 대사반응에 대한 정보가 담겨 있으며, 다양한 조건에서 세포의 대사 활성을 예측하는 것이 가능 공동연구팀은 1,043명의 암 환자 특이 대사 모델과 동일 환자들의 암 체세포 돌연변이 데이터를 활용해, 다음의 4단계로 구성된 컴퓨터 방법론을 개발했다 (그림 1). 첫 단계에서는 암 환자 특이 대사 모델을 시뮬레이션해, 환자 별로 모든 대사물질들의 활성을 예측한다. 두 번째 단계로는 특정 유전자 돌연변이가 앞서 예측된 대사물질의 활성에 유의한 차이를 일으키는 짝을 선별한다. 세 번째 단계로, 특정 유전자 돌연변이와 연결된 대사물질들을 대상으로, 이들과 유의하게 연관된 대사경로를 추가로 선별한다. 마지막 단계로서, ‘유전자-대사물질-대사경로’ 조합을 완성해, 컴퓨터 방법론 결과로써 도출하게 된다. 이번 논문의 공동 제1 저자인 이가령 박사(現 다나파버 암센터 및 하버드 의과대학 박사후연구원)와 이상미 박사(現 하버드 의과대학 박사후연구원)는 “이번 연구에서 개발된 방법론은 암 환자 코호트의 돌연변이 및 전사체 데이터를 토대로 다른 암종에 대해서도 쉽게 적용될 수 있으며, 유전자 돌연변이가 대사경로를 통해 어떻게 세포대사에 변화를 일으키는지 체계적으로 예측할 수 있는 최초의 컴퓨터 방법론이라는 데 큰 의의가 있다” 한다고 말했다. 또한 김현욱 교수는 “이번 공동연구의 결과는 향후 암 대사 및 암 유발 대사물질 연구에서 중요한 참고 자료로 활용될 수 있을 것”이라고 강조했다. 한편 이번 논문은 바이오메드 센트럴(BioMed Central) 社가 발행하며, 생명공학 및 유전학 분야의 대표적 국제학술지인 게놈 바이올로지(Genome Biology, JCR 분야 상위 5% 이내)에 게재됐다. ※ 논문명 : Prediction of metabolites associated with somatic mutations in cancers by using genome-scale metabolic models and mutation data ※ 저자 정보 : 이가령(한국과학기술원, 공동 제1 저자), 이상미(한국과학기술원, 공동 제1 저자), 이성영(서울대학교병원, 공동저자), 정창욱(서울대학교병원, 공동저자), 송효진(서울대학교병원, 공동저자), 이상엽(한국과학기술원, 공동저자), 윤홍석(서울대학교병원, 교신저자), 고영일(서울대학교병원, 교신저자), 김현욱(한국과학기술원, 교신저자) 포함 총 9명 이번 연구는 과학기술정보통신부 한국연구재단의 지원을 받아 수행됐다.
2024.03.18
조회수 3787
이상엽 특훈교수, 김현욱 교수, 인공지능 이용한 효소기능 예측 기술 개발
우리 대학 생명화학공학과 이상엽 특훈교수와 김현욱 교수의 초세대 협업연구실 공동연구팀이 딥러닝(deep learning) 기술을 이용해 효소의 기능을 신속하고 정확하게 예측할 수 있는 컴퓨터 방법론 DeepEC를 개발했다. 공동연구팀의 류재용 박사가 1 저자로 참여한 이번 연구결과는 국제학술지 ‘미국 국립과학원 회보(PNAS)’ 6월 20일 자 온라인판에 게재됐다. (논문명 : Deep learning enables high-quality and high-throughput prediction of enzyme commission numbers) 효소는 세포 내의 생화학반응들을 촉진하는 단백질 촉매로 이들의 기능을 정확히 이해하는 것은 세포의 대사(metabolism) 과정을 이해하는 데에 매우 중요하다. 특히 효소들은 다양한 질병 발생 원리 및 산업 생명공학과 밀접한 연관이 있어 방대한 게놈 정보에서 효소들의 기능을 빠르고 정확하게 예측하는 기술은 응용기술 측면에서도 중요하다. 효소의 기능을 표기하는 시스템 중 대표적인 것이 EC 번호(enzyme commission number)이다. EC 번호는 ‘EC 3.4.11.4’처럼 효소가 매개하는 생화학반응들의 종류에 따라 총 4개의 숫자로 구성돼 있다. 중요한 것은 특정 효소에 주어진 EC 번호를 통해서 해당 효소가 어떠한 종류의 생화학반응을 매개하는지 알 수 있다는 것이다. 따라서 게놈으로부터 얻을 수 있는 효소 단백질 서열의 EC 번호를 빠르고 정확하게 예측할 수 있는 기술은 효소 및 대사 관련 문제를 해결하는 데 중요한 역할을 한다. 작년까지 여러 해에 걸쳐 EC 번호를 예측해주는 컴퓨터 방법론들이 최소 10개 이상 개발됐다. 그러나 이들 모두 예측 속도, 예측 정확성 및 예측 가능 범위 측면에서 발전 필요성이 있었다. 특히 현대 생명과학 및 생명공학에서 이뤄지는 연구의 속도와 규모를 고려했을 때 이러한 방법론의 성능은 충분하지 않았다. 공동연구팀은 1,388,606개의 단백질 서열과 이들에게 신뢰성 있게 부여된 EC 번호를 담고 있는 바이오 빅데이터에 딥러닝 기술을 적용해 EC 번호를 빠르고 정확하게 예측할 수 있는 DeepEC를 개발했다. DeepEC는 주어진 단백질 서열의 EC 번호를 예측하기 위해서 3개의 합성곱 신경망(Convolutional neural network)을 주요 예측기술로 사용하며, 합성곱 신경망으로 EC 번호를 예측하지 못했을 경우 서열정렬(sequence alignment)을 통해서 EC 번호를 예측한다. 연구팀은 더 나아가 단백질 서열의 도메인(domain)과 기질 결합 부위 잔기(binding site residue)에 변이를 인위적으로 주었을 때, DeepEC가 가장 민감하게 해당 변이의 영향을 감지하는 것을 확인했다. 김현욱 교수는 “DeepEC의 성능을 평가하기 위해서 이전에 발표된 5개의 대표적인 EC 번호 예측 방법론과 비교해보니 DeepEC가 가장 빠르고 정확하게 주어진 단백질의 EC 번호를 예측하는 것으로 나타났다”라며 “효소 기능 연구에 크게 이바지할 것으로 기대한다”라고 말했다. 이상엽 특훈교수는 “이번에 개발한 DeepEC를 통해서 지속해서 재생되는 게놈 및 메타 게놈에 존재하는 방대한 효소 단백질 서열의 기능을 보다 효율적이고 정확하게 알아내는 것이 가능해졌다”라고 말했다. 이번 연구는 과학기술정보통신부가 지원하는 기후변화대응기술개발사업의 바이오리파이너리를 위한 시스템대사공학 원천기술개발 과제 및 바이오·의료기술 개발 Korea Bio Grand Challenge 사업의 지원을 받아 수행됐다. □ 그림 설명 그림1. 인공지능 기반의 DeepEC를 이용한 효소 기능 EC 번호 예측
2019.07.03
조회수 19370
이상엽, 김현욱 교수, 약물 상호작용 예측기술 DeepDDI 개발
우리 대학 생명화학공학과 이상엽 특훈교수와 김현욱 교수 공동 연구팀이 약물-약물 및 약물-음식 간 상호작용을 정확하게 예측하기 위해 딥 러닝(deep learning)을 이용해 약물 상호작용 예측 방법론인 딥디디아이 (DeepDDI)를 개발했다. 김현욱 교수, 류재용 연구원이 공동 1저자로 참여한 이번 연구는 국제학술지 ‘미국 국립과학원 회보(PNAS)’ 4월 16일자 온라인판에 게재됐다. 기존의 약물 상호작용 예측 방법론은 약물-약물 간의 상호작용 가능성만을 예측할 뿐, 두 약물 간의 구체적인 약리작용에 대한 정보는 제공하지 못했다. 이러한 이유로 맞춤형 약물 처방, 식이요법 등 응용 연구에서 체계적인 근거를 제시하거나 가설을 세우는 데에 한계가 있었다. 연구팀은 딥 러닝(deep learning) 기술을 적용해 19만 2천 284개의 약물-약물 상호작용을 아우르는 86가지의 약물 상호작용을 92.4%의 정확도로 예측하는 시스템 딥디디아이 (DeepDDI)를 개발했다. 딥디디아이는 두 약물 A, B 간의 상호작용에 대한 예측 결과를 다음과 같이 사람이 읽을 수 있는 영문 문장으로 출력한다 : “The metabolism of Drug B can be decreased when combined with Drug A (약물 A를 약물 B와 함께 복용 시 약물 B의 약물 대사가 감소 될 수 있다)” 연구팀은 딥디디아이를 이용해 두 약물 복용 시 일어날 수 있는 유해반응의 원인, 보고된 인체 부작용을 최소화시킬 수 있는 대체 약물, 특정 약물의 약효를 떨어뜨릴 수 있는 음식 및 음식 성분, 지금껏 알려지지 않은 음식 성분의 활성 등을 예측했다. 이번 연구성과로 약물-약물 및 약물-음식 상호작용을 정확하게 예측할 수 있는 시스템을 활용하는 것이 가능해졌으며 이는 신약개발, 복합적 약의 처방, 투약시의 음식조절 등을 포함해 헬스케어, 정밀의료 산업 및 제약 산업에 중요한 역할을 할 것으로 기대된다. 이상엽 특훈교수는 “이번 연구결과는 4차 산업혁명 시대의 정밀의료를 선도할 수 있는 기반 기술을 개발한 것이다”며, “복합 투여되는 약물들의 부작용을 낮추고 환자 맞춤형 약물 처방과 식이요법 제안을 통한 효과적인 약물치료 전략을 수립할 수 있다. 특히 고령화 사회에서 건강한 삶을 유지하는데 필요한 약-음식 궁합에 대한 제안을 해 줄 수 있는 시스템으로 발전해 나갈 것이다”고 말했다. 이 연구성과는 과학기술정보통신부의 바이오리파이너리를 위한 시스템대사공학 연구사업, KAIST의 4차 산업혁명 인공지능 플래그십 이니셔티브 연구사업의 지원을 받아 수행됐다. □ 그림 설명 그림1. 딥디디아이 (DeepDDI)의 모식도 및 예측된다양한 약물-음식성분의 상호작용들의 시각화
2018.04.18
조회수 16510
<<
첫번째페이지
<
이전 페이지
1
>
다음 페이지
>>
마지막 페이지 1