< (왼쪽부터) 화학과 김우연 교수, 문석현 박사과정, 정원호 박사과정, 양수정 박사과정 >
우리 대학 연구진이 물리화학적 아이디어를 인공지능 딥러닝에 접목해 기존의 방법보다 일반화 성능이 높은 단백질-리간드 상호작용 예측 모델을 개발했다. 리간드란 수용체와 같은 큰 생체 분자에 특이적으로 결합하는 물질을 말하며, 생체 내의 중요한 요소이자 의약품의 개발 등에 큰 역할을 한다.
화학과 김우연 교수 연구팀이 교원창업 인공지능 신약 개발 스타트업 HITS 연구진과 함께 물리 기반 삼차원 그래프 심층 신경망을 이용해 일반화 성능을 높인 단백질-리간드 상호작용 예측 모델을 개발했다고 17일 밝혔다.
약물 후보 분자를 발굴하기 위해서 타깃 단백질과 강하게 결합하는 리간드를 찾는 것이 중요하다. 하지만 유효 물질을 찾기 위해 수백만에서 수천만 개의 무작위 리간드 라이브러리를 대상으로 실험 전수 조사를 수행하는 것은 천문학적인 시간과 비용이 필요하다. 이러한 시간과 비용을 절감하기 위해 최근 단백질-리간드 상호작용 예측에 기반한 가상탐색(virtual screening) 기술이 주목받고 있다.
기존의 상호작용 예측 인공지능 모델들은 학습에 사용한 구조에 대해서는 높은 예측 성능을 보여주지만, 새로운 단백질 구조에 대해서는 낮은 성능을 보이는 과적합(over-fitting)이 문제가 됐다. 과적합 문제는 일반적으로 모델의 복잡도에 비해 데이터가 적을 때 발생한다. 이번 연구는 이러한 과적합 문제를 해결함으로써 다양한 단백질에 대해 고른 성능을 보여주는 예측 모델을 개발하는데 주안점을 뒀다.
연구진은 물리화학적 아이디어들을 딥러닝 모델에 적용해 모델의 복잡도를 줄임과 동시에 물리 시뮬레이션을 통해 부족한 데이터를 보강함으로써 과적합 문제를 해결하고자 하였다. 단백질 원자와 리간드 원자 사이의 거리에 따른 반데르발스 힘, 수소 결합력 등을 물리화학적 방정식으로 모델링하고, 매개변수를 딥러닝으로 예측함으로써 물리 법칙을 만족하는 예측을 가능하게 했다.
< 그림 1. 단백질-리간드 간 상호작용 예측 모델의 개요도 >
또한, 학습에 사용한 단백질-리간드 결정 구조가 실험적으로 판명된 가장 안정한 구조임에 착안했다. 부족한 실험 데이터를 보강하기 위해 불안정한 단백질-리간드 구조로 이루어진 수십만 개의 인공 데이터를 생성해 학습에 활용했고, 그 결과 생성된 구조에 비해 실제 구조를 안정하게 예측하도록 모델을 학습할 수 있었다.
연구진은 개발된 모델의 성능을 검증하기 위해 대조군으로 `CASF-2016 벤치마크'를 활용했다. 이 벤치마크는 다양한 단백질-리간드 구조들 사이에서 실험적으로 판명된 결정 구조에 근접한 구조를 찾는 도킹과 상대적으로 결합력이 큰 단백질-리간드 쌍을 찾는 스크리닝 등 실제 약물을 개발하는 과정에 필수적인 과제를 포함하고 있다. 검증 테스트 결과 기존에 보고된 기술에 비해 높은 도킹 및 스크리닝 성공률을 보여줬으며, 특히 스크리닝 성능은 기존에 보고된 최고 성능 대비 약 두 배 높은 수치를 보였다.
연구진이 개발한 물리 기반 딥러닝 방법론의 또 다른 장점은 예측의 결과를 물리적으로 해석 가능하다는 것이다. 이는 딥러닝으로 최적화된 물리화학 식을 통해 최종 상호작용 값을 예측하기 때문이다. 리간드 분자 내 원자별 상호작용 에너지의 기여도를 분석함으로써 어떤 작용기가 단백질-리간드 결합에 있어서 중요한 역할을 했는지 파악할 수 있으며, 이와 같은 정보는 추후 약물 설계를 통해 성능을 높이는 데 직접 활용할 수 있다.
공동 제1 저자로 참여한 화학과 문석현, 정원호, 양수정(현재 MIT 박사과정) 박사과정 학생들은 "데이터가 적은 화학 및 바이오 분야에서 일반화 문제는 항상 중요한 문제로 강조돼왔다ˮ며 "이번 연구에서 사용한 물리 기반 딥러닝 방법론은 단백질-리간드 간 상호작용 예측 뿐 아니라 다양한 물리 문제에 적용될 수 있을 것ˮ이라고 말했다.
한국연구재단의 지원을 받아 수행된 이번 연구는 국제 학술지 `Chemical Science(IF=9.825)' 2022년 4월 13호에 표지 논문 및 `금주의 논문(Pick of the Week)'으로 선정됐다. (논문명 : PIGNet: a physics-informed deep learning model toward generalized drug–target interaction predictions, 논문 링크 : https://doi.org/10.1039/D1SC06946B)
< 그림 2. 케미컬 사이언스 2022년 4월 13호의 표지 그림 >
우리 몸에 침입한 병원균이나 암세포를 치료할 수 있는 면역세포인 T세포 중 CD4+ T세포는 적응면역계의 지휘관과 같은 역할을 하며, 이러한 CD4+ T세포의 활성 정도에 따라서 천식과 같은 만성질환의 진행 양상과 예후가 달라지게 된다. T세포의 활성화 증폭을 위해서는 마치 과녁 모양처럼 면역학적 시냅스 형성이 필요하다는 보고들이 있으나 어떠한 메커니즘으로 면역학적 시냅스가 형성이 되는지는 잘 알려져 있지 않았다. 우리 대학 의과학대학원 이흥규 교수 연구팀이 면역학적 시냅스 형성에 섬모 형성 단백질(IFT20)과 엔도솜 형성 단백질(TSG101)의 결합이 중요한 역할을 한다고 26일 밝혔다. 의과학대학원 정지웅 박사(현, 서울대병원 알레르기내과 임상강사), 강인 박사과정, 생명과학과 김유민 박사과정 등이 주도한 이번 연구에서 연구팀은 단일세포 전사체 분석법을 활용해 활성화된 CD4+ T세포에서 섬모 형성 단백질(IFT20)의 발현이 증가해 있음을 확인했다. 연구팀은 T
2023-04-263차원 게놈 구조 연구를 통해, 세포핵 내 게놈이 계층적인 구조로 이루어져 있으며 각 구조가 다양한 유전자 발현 조절에 관여한다는 것이 알려져 있다. 또한 이러한 게놈 3차 구조는 암, 노화 등 다양한 복합질환에서 질환 특이적 유전자 발현과 밀접한 연관이 있음이 최근 밝혀지고 있다. 하지만 기존 게놈 3차 구조는 비교적 관찰이 쉬운 염색체 내 상호작용에 대부분 국한되어 있었고, 더 큰 범위에서의 염색체 간 상호작용에 대해서는 관찰 실험 기법의 한계로 인해 연구가 거의 진행되지 않았다. 우리 대학은 생명과학과 정인경 교수 연구팀이 서울대학교 기계공학부 신용대 교수 연구팀, 부산대학교 최정모 교수 연구팀과의 공동연구를 통해 세포핵 내 3차원 게놈 구조 신규 생성 원리와 이를 조절하는 매개 인자를 발견했다고 10일(월) 밝혔다. 생명과학과 주재건 석박사통합과정과 서울대학교 조성현 연구원이 주도한 이번 연구에서 연구팀은 행렬 분해 기법이란 분석 기법을 활용하여 게놈 3차 구조 데이터
2023-04-10암을 부작용 없이 효과적으로 치료하기 위해서는 약물을 암세포에 특이적으로 전달할 수 있는 기술이 필요하다. 단백질로 구성되어 있는 단백질 조립체는 암 치료를 위한 약물 전달에 널리 활용되고 있다. 단백질 조립체를 약물 전달에 이용하기 위해서는 암세포를 인식하는 단백질과 암세포를 사멸시키는 약물을 단백질 조립체에 효과적으로 접합시키는 기술, 즉 기능화(functionalization) 기술이 필수적이다. 그러나, 단백질 조립체의 경우 기능화 과정이 매우 복잡하고, 효율이 낮으며, 대부분 작은 크기의 화학 약물(chemical drug)의 적용에만 한정되어 실제 사용에 많은 제약이 있었다. 우리 대학 생명과학과 김학성 교수 연구팀이 암세포에 특이적으로 약물을 전달할 수 있는 클라트린 조립체를 개발했다고 14일 밝혔다. 생체 내 클라트린이라는 단백질 조립체는 세포 안에서 자가조립(self-assembly)되어 물질을 효율적으로 수송(endocytosis)한다. 클라트린 조립체는
2023-03-14인간의 생명 정보를 담고 있는 DNA는 세포핵(nucleus) 내에 존재하며 이 정보는 전령 RNA(messenger RNA, mRNA)에 담겨 세포질로 이동 후 단백질 생성의 기초가 된다는 것이 소위 유전자 발현의 센트럴 도그마(central dogma of eukaryotic gene expression)다. 이 과정이 온전히 이루어지기 위해서는 유전자 발현의 최종 산물인 단백질 중 DNA 정보를 유지 및 활용하는 단백질들이 다시 세포핵으로 이동하여 작용하는 순환의 과정이 필요하다. 세포핵은 단백질의 투과가 불가능한 이중의 지질막(double-layered lipid membrane)으로 둘러싸인 구조이기 때문에 세포질에서 생성된 단백질이 핵으로 이동하기 위해서는 핵공(nuclear pore)라는 작은 구멍을 통과해야만 가능한 것으로 알려져 있다. 그리고, 핵공을 통해 세포핵으로 이동이 가능한 단백질들은 핵 이동 신호(nuclear localization signal, N
2023-02-28우리 대학 의과학대학원 이지민 교수 연구팀이 유럽분자생물학연구소(EMBL) 미하일 사비스키(Mikhail Savitski) 교수, 서울대학교 백성희 교수와 공동 연구를 통해 질환의 억제와 촉진의 실마리가 되는 단백질 수명을 결정하는 단백질 *번역 후 조절(post-translational modification, 이하 PTM) 코드를 규명했다고 1일 밝혔다. * 번역 후 조절(PTM): DNA가 mRNA가는 전사 과정을 거쳐 최종 단백질로 번역까지 일어난 이후에 추가적으로 생기는 현상으로, 단백질의 구조나 효능에 영향을 미치는 것으로 주로 알려져 있음 연구팀은 기존에 단백질의 운명 조절과 연관이 없을 것으로 생각됐던 PTM 신호를 `PTM-활성화(PTM-activated) 데그론'과 `PTM-불활성화(PTM-inactivated) 데그론'으로 구분해 단백질 수명 조절과의 관련성을 규명했다. *PTM 활성화 데그론과 PTM 볼활성화 데그론: PTM에 의해 데그론이 활성화
2023-02-01