KAIST 이상엽 교수팀, 단백질 서열 전사인자 예측
모든 생물군의 단백질 서열 분석에 우수한 성능 발휘

KAIST는 이상엽 특훈교수와 버나드 팔슨 미국 캘리포니아 샌디에이고캠퍼스(UCSD) 교수 연구팀이 공동으로 AI(인공지능)을 활용해 단백질 서열로부터 전사인자를 예측하는 시스템 '딥티팩터(DeepTFactor)'를 개발했다고 29일 밝혔다.

전사인자는 특정한 DNA 서열에 특이적으로 결합해 유전자의 전사(유전정보를 복사하는 과정)를 조절하는 단백질이다. 전사인자를 분석하면 유기체가 유전적, 환경적 변화에 어떻게 반응해 유전자 발현을 제어하는지 이해할 수 있다.

지금까지 새로운 전사인자를 찾으려면 이미 알려진 전사인자와 유사한 성질을 분석하거나, 기계학습(머신러닝), 심화학습(딥러닝) 같은 데이터 기반의 분석과정이 필요했다.

하지만, 심층학습을 이용한 예측 시스템의 경우, 내부의 복잡한 연산 때문에 추론 과정을 직접 확인할 수 없는 한계가 있다.

연구팀은 단백질 서열로부터 전사인자를 예측하기 위해 3개의 병렬적인 합성곱 신경망(CNN)을 이용해 주어진 단백질 서열의 전사인자 여부를 예측하는 '딥티팩터'를 개발했다. 연구팀을 이를 이용해 대장균의 전사인자 332개를 예측했고, 그 중 3개 전사인자의 게놈 전체 결합 위치를 실험으로 확인해 성능을 입증했다.

딥티팩터는 기존 특정 생물군의 단백질 서열만을 위해 개발된 이전 예측 방법과 달리 모든 생물군의 단백질 서열에서 우수한 성능을 보여 다양한 유기체의 전사 시스템 분석에 활용할 수 있다고 연구팀은 설명했다.

이상엽 KAIST 특훈교수는 "딥티팩터를 이용하면 새롭게 발견되는 단백질 서열과 아직 특성화되지 않은 수많은 단백질 서열을 높은 처리 성능으로 분석할 수 있어 유기체의 전사조절 네트워크 분석을 위한 기초기술로 널리 쓸 수 있다"고 말했다.

이 연구결과는 국제학술지 '미국 국립과학원회보(PNAS)' 28일잘 게재한는 이준기기자 bongchu@dt.co.kr
이상엽 KAIST 특훈교수
이상엽 KAIST 특훈교수


[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]
이준기

기사 추천

  • 추천해요 0
  • 좋아요 0
  • 감동이에요 0
  • 화나요 0
  • 슬퍼요 0