< (왼쪽부터) 화학과 김우연 교수, 문석현 박사과정, 정원호 박사과정, 양수정 박사과정 >
우리 대학 연구진이 물리화학적 아이디어를 인공지능 딥러닝에 접목해 기존의 방법보다 일반화 성능이 높은 단백질-리간드 상호작용 예측 모델을 개발했다. 리간드란 수용체와 같은 큰 생체 분자에 특이적으로 결합하는 물질을 말하며, 생체 내의 중요한 요소이자 의약품의 개발 등에 큰 역할을 한다.
화학과 김우연 교수 연구팀이 교원창업 인공지능 신약 개발 스타트업 HITS 연구진과 함께 물리 기반 삼차원 그래프 심층 신경망을 이용해 일반화 성능을 높인 단백질-리간드 상호작용 예측 모델을 개발했다고 17일 밝혔다.
약물 후보 분자를 발굴하기 위해서 타깃 단백질과 강하게 결합하는 리간드를 찾는 것이 중요하다. 하지만 유효 물질을 찾기 위해 수백만에서 수천만 개의 무작위 리간드 라이브러리를 대상으로 실험 전수 조사를 수행하는 것은 천문학적인 시간과 비용이 필요하다. 이러한 시간과 비용을 절감하기 위해 최근 단백질-리간드 상호작용 예측에 기반한 가상탐색(virtual screening) 기술이 주목받고 있다.
기존의 상호작용 예측 인공지능 모델들은 학습에 사용한 구조에 대해서는 높은 예측 성능을 보여주지만, 새로운 단백질 구조에 대해서는 낮은 성능을 보이는 과적합(over-fitting)이 문제가 됐다. 과적합 문제는 일반적으로 모델의 복잡도에 비해 데이터가 적을 때 발생한다. 이번 연구는 이러한 과적합 문제를 해결함으로써 다양한 단백질에 대해 고른 성능을 보여주는 예측 모델을 개발하는데 주안점을 뒀다.
연구진은 물리화학적 아이디어들을 딥러닝 모델에 적용해 모델의 복잡도를 줄임과 동시에 물리 시뮬레이션을 통해 부족한 데이터를 보강함으로써 과적합 문제를 해결하고자 하였다. 단백질 원자와 리간드 원자 사이의 거리에 따른 반데르발스 힘, 수소 결합력 등을 물리화학적 방정식으로 모델링하고, 매개변수를 딥러닝으로 예측함으로써 물리 법칙을 만족하는 예측을 가능하게 했다.
< 그림 1. 단백질-리간드 간 상호작용 예측 모델의 개요도 >
또한, 학습에 사용한 단백질-리간드 결정 구조가 실험적으로 판명된 가장 안정한 구조임에 착안했다. 부족한 실험 데이터를 보강하기 위해 불안정한 단백질-리간드 구조로 이루어진 수십만 개의 인공 데이터를 생성해 학습에 활용했고, 그 결과 생성된 구조에 비해 실제 구조를 안정하게 예측하도록 모델을 학습할 수 있었다.
연구진은 개발된 모델의 성능을 검증하기 위해 대조군으로 `CASF-2016 벤치마크'를 활용했다. 이 벤치마크는 다양한 단백질-리간드 구조들 사이에서 실험적으로 판명된 결정 구조에 근접한 구조를 찾는 도킹과 상대적으로 결합력이 큰 단백질-리간드 쌍을 찾는 스크리닝 등 실제 약물을 개발하는 과정에 필수적인 과제를 포함하고 있다. 검증 테스트 결과 기존에 보고된 기술에 비해 높은 도킹 및 스크리닝 성공률을 보여줬으며, 특히 스크리닝 성능은 기존에 보고된 최고 성능 대비 약 두 배 높은 수치를 보였다.
연구진이 개발한 물리 기반 딥러닝 방법론의 또 다른 장점은 예측의 결과를 물리적으로 해석 가능하다는 것이다. 이는 딥러닝으로 최적화된 물리화학 식을 통해 최종 상호작용 값을 예측하기 때문이다. 리간드 분자 내 원자별 상호작용 에너지의 기여도를 분석함으로써 어떤 작용기가 단백질-리간드 결합에 있어서 중요한 역할을 했는지 파악할 수 있으며, 이와 같은 정보는 추후 약물 설계를 통해 성능을 높이는 데 직접 활용할 수 있다.
공동 제1 저자로 참여한 화학과 문석현, 정원호, 양수정(현재 MIT 박사과정) 박사과정 학생들은 "데이터가 적은 화학 및 바이오 분야에서 일반화 문제는 항상 중요한 문제로 강조돼왔다ˮ며 "이번 연구에서 사용한 물리 기반 딥러닝 방법론은 단백질-리간드 간 상호작용 예측 뿐 아니라 다양한 물리 문제에 적용될 수 있을 것ˮ이라고 말했다.
한국연구재단의 지원을 받아 수행된 이번 연구는 국제 학술지 `Chemical Science(IF=9.825)' 2022년 4월 13호에 표지 논문 및 `금주의 논문(Pick of the Week)'으로 선정됐다. (논문명 : PIGNet: a physics-informed deep learning model toward generalized drug–target interaction predictions, 논문 링크 : https://doi.org/10.1039/D1SC06946B)
< 그림 2. 케미컬 사이언스 2022년 4월 13호의 표지 그림 >
생물학적 구조는 인공적으로 복제하기 어려운 정도의 복잡한 특징을 가지고 있지만 이러한 생체 구조체를 직접적으로 활용여 제작하는 생체형틀법*은 다양한 분야의 응용으로 사용됐다. KAIST 연구진이 이전에 활용할 수 없었던 생체 구조체를 활용하고, 생체형틀법을 통해 적용될 수 있는 영역을 넓히는데 성공했다. *생체형틀법: 바이러스부터 우리의 몸을 구성하는 조직과 장기에 이르기까지 이러한 생체 구조의 기능을 활용하고자, 생체 구조를 형틀로 사용하여 기능성 구조재료를 만들어내는 방식 우리 대학 신소재공학과 장재범, 정연식 교수 공동연구팀이 생체 시료 안의 특정 내부 단백질을 활용하고 높은 조정성을 지닌 생체형틀법을 개발했다고 10일 밝혔다. 기존의 생체형틀법 방법은 주로 생체시료의 외부 표면만을 활용하거나, 한정된 치수와 샘플 크기로 인해 다양한 생체 구조체들의 구조-기능 상관성을 활용하여 기능성 나노구조체를 제작하기 어렵다는 한계를 가지고 있다. 이런 문제를 해결하고자 연
2025-01-10생동감 있는 색상, 높은 효율과 긴 수명을 자랑하는 양자점(Quantum Dot) 기반 디스플레이가 주목받고 있다. 특히, 친환경 인듐 포스파이드(InP) 양자점은 현재 TV와 스마트폰을 비롯한 다양한 디스플레이에 폭넓게 활용되고 있다. 그러나 다가오는 메타버스 시대를 현실감 있게 구현하기 위한 디스플레이 구현을 위해서는 초고해상도 양자점 패턴 제작 기술의 개발이 필수적이다. 우리 대학 신소재공학과 조힘찬 교수 연구팀이 신규 양자점 리간드*를 개발하여 InP 양자점의 초고해상도 패턴을 형성하는 동시에 소자 효율을 향상시키는 신기술을 개발했다고 13일 밝혔다. *리간드: 양자점 표면에 결합하여 양자점을 보호하고 계면활성제 역할을 하는 물질. InP 양자점은 외부 환경에 민감하여 패턴 형성 공정 중 광학적 특성이 크게 저하되는 한계가 있었다. 또한, 디스플레이 효율에 직결되는 리간드를 조절하는 과정에서도 광학적 특성이 손상되는 문제가 있었다. 따라서, 소재 고유의 특성을 유
2024-12-18지질 뗏목은 세포막 간 융합, 신호 전달, 바이러스 침투 등 세포 기능과 질병 발병의 핵심 과정에 중요한 역할을 한다. 한국 연구진이 지금까지 알려지지 않았던 지질 뗏목의 정렬 원인과 그 조절 메커니즘을 밝혀내어 세포막 간 상호작용을 조절하여 질병 치료에 새로운 접근법을 제공할 수 있을 것으로 기대된다. 우리 대학 바이오및뇌공학과 최명철 교수팀이 고등과학원(원장 최재경) 현창봉 교수팀, 포항가속기연구소(소장 강흥식) 이현휘 박사와 공동으로 세포막 간의 상호작용을 매개하는 지질 뗏목(Lipid Raft)의 정렬 현상의 원리를 최초로 규명했다고 5일 밝혔다. 세포 융합, 바이러스 침투, 세포 간 신호 전달 등 다양한 세포막 간의 상호작용을 조절할 수 있는 핵심 기전을 밝힌 것이다. 세포막(Cell membrane)은 세포의 내부와 외부를 구분하는 얇고 유연한 막으로, 지질 이중층(lipid bilayer)으로 구성돼 있다. 세포막에는 수많은 막단백질(membrane prote
2024-06-05최근 자연어나 이미지, 동영상, 음악 등 다양한 분야에서 주목받는 생성형 AI가 신약 설계 분야에서도 기존 신규성 문제를 극복하고 새로운 혁신을 일으키고 있다고 하는데 어떤 기술일까? 우리 대학 화학과 김우연 교수 연구팀이 단백질-분자 사이의 상호작용을 고려해 활성 데이터 없이도 타겟 단백질에 적합한 약물 설계 생성형 AI를 개발했다고 18일 밝혔다. 신규 약물을 발굴하기 위해서는 질병의 원인이 되는 타겟 단백질에 특이적으로 결합하는 분자를 찾는 것이 중요하다. 기존의 약물 설계 생성형 AI는 특정 단백질의 이미 알려진 활성 데이터를 학습에 활용하기 때문에 기존 약물과 유사한 약물을 설계하려는 경향이 있다. 이는 신규성이 중요한 신약 개발 분야에서 치명적인 약점으로 지적되어 왔다. 또한 사업성이 높은 계열 내 최초(First-in-class) 타겟 단백질에 대해서는 실험 데이터가 매우 적거나 전무한데, 이 경우 기존 방식의 생성형 AI를 활용하는 것이 불가능하다. 연구팀
2024-04-18신약 개발이나 재료과학과 같은 분야에서는 원하는 화학 특성 조건을 갖춘 물질을 발굴하는 것이 중요한 도전으로 부상하고 있다. 우리 대학 연구팀은 화학반응 예측이나 독성 예측, 그리고 화합물 구조 설계 등 다양한 문제를 동시에 풀면서 기존의 인공지능 기술을 뛰어넘는 성능을 보이는 기술을 개발했다. 김재철AI대학원 예종철 교수 연구팀이 분자 데이터에 다중 모달리티 학습(multi-modal learning) 기술을 도입해, 분자 구조와 그 생화학적 특성을 동시에 생성하고 예측이 가능해 다양한 화학적 과제에 광범위하게 활용가능한 인공지능 기술을 개발했다고 25일 밝혔다. 심층신경망 기술을 통한 인공지능의 발달 이래 이러한 분자와 그 특성값 사이의 관계를 파악하려는 시도는 꾸준히 이루어져 왔다. 최근 비 지도 학습(unsupervised training)을 통한 사전학습 기법이 떠오르면서 분자 구조 자체로부터 화합물의 성질을 예측하는 인공지능 연구들이 제시되었으나 새로운 화합물의
2024-03-25