디지털타임스

 


바이오도 DX시대...유전체-단백질-화합물 빅데이터에서 미래 먹거리 캔다

프린트 페이스북 트위터 카카오스토리
타이틀 : 바이오 연구데이터, 이제 활용이다

바이오도 DX시대...유전체-단백질-화합물 빅데이터에서 미래 먹거리 캔다
12일 서울 카톡릭 대학교 의생명산업연구원에서 열린 바이오 연구데이터 활용기반조성사업 성과교류회에서 참가자들이 기념사진을 찍고 있다.

정교하게 축적된 바이오 빅데이터가 K-바이오헬스 산업의 성장 씨앗 역할을 하고 있다. 기업들은 유전체, 단백체, 화합물 등 축적된 데이터를 활용해 신약 개발부터 AI(인공지능)를 활용한 질병 진단까지 미래 먹거리를 캐고 있다.

김판규 한국생명공학연구원 국가생명연구자원정보센터(KOBIC·코빅) 전산개발실장은 12일 "범부처 바이오 연구 데이터 공유 허브 플랫폼인 '국가 바이오 데이터 스테이션(K-BDS)'이 다양한 연구 분야에서 활용되면서 성공사례를 이어가고 있다"고 말했다.

코빅은 이날 '바이오 연구데이터 활용 기반 조성사업 성과 교류회'를 갖고 K-BDS 구축·운영 현황과 성과를 공유했다. 코빅은 국내 바이오 연구 데이터를 수집해 서비스하는 '국가 바이오 데이터 스테이션' 플랫폼을 운영하고 있다. 수집하는 데이터에는 유전체, 단백체, 대사체, 화합물, 바이오이미징 등이 포함된다. 현재까지 757TB(테라바이트) 용량에 유전체 310세트를 포함해 5만5000여 건의 샘플건수가 포함돼 있다.

김 실장은 "바이오 연구 데이터를 수집한 데 이어 품질관리와 고도화에 공을 들이고 있다"면서 "연구자들이 편리하게 필요한 정보를 찾아볼 수 있도록 하고 다양한 연구 분야에 활용되도록 하는 것이 목표"라고 밝혔다. 이어 "클라우드 분석 환경과 히스토리를 통해 연구자들은 데이터를 바탕으로 AI(인공지능) 기반 분석도 할 수 있다"고 말했다.

코빅은 올해 K-BDS 고도화를 통해 161개 프로젝트에 걸쳐 43만여 건의 데이터를 새로 등록했다. 용량은 218TB에 달한다. 바이오 데이터를 수집·저장하고 품질관리를 할 뿐 아니라 국제협력 활동도 수행한다. KISTI(한국과학기술정보연구원)는 바이오 데이터를 위한 전산 네트워크 구축과 바이오 데이터 연구환경 구축을 맡는다.


이준학 KISTI 바이오의료팀장 "글로벌 바이오 산업에서 AI 관련 기업이 계속 증가하고 있고 바이오제약 R&D 예산 중 2~4%가 AI에 사용되고 있다"면서 데이터의 중요성을 강조했다. 이 연구원은 "바이오 데이터의 중요성이 점점 부각되면서 연구에 활용할 데이터를 어떻게든 확보하는 것이 중요해졌다"고 짚었다. 이어 "코빅에서 모든 데이터를 활용할 수 있는 환경을 만들기 위해 힘쓰고 있다"고 했다.
KISTI는 클라우드 기반의 GPU(그래픽처리장치)를 탑재한 대규모 IT 인프라를 구축했다. 코빅과 KISTI는 해양수산부, 질병청 등 다양한 정부부처의 데이터센터 간에 데이터를 주고받으면서 연계하기 위한 네트워크도 제공한다.

이날 행사에는 한국화학연구원, 서울대, 이화여대, 중앙대, 숭실대 등에서 수행한 연구과제가 소개됐다. 연구자들은 각 연구과제를 통해 확보한 데이터를 K-BDS에 업로드하고 있다. 김준일 숭실대 의생명시스템학부 교수는 단일세포 전사체, 후성 유전체, 공간 전사체 데이터 통합분석에 기반한 세포유형간 유전자 조절 네트워크 재구성을 위한 데이터 스테이션 플랫폼을 구축해 K-BDS에 등록했다. 이윤지 중앙대 약학대학 교수는 인간 단백질 아미노산 서열, 3차원 구조, 발현패턴 정보의 통합적 분석 알고리즘을 개발하고 데이터도 구축했다.

김영혜 과학기술정보통신부 첨단바이오기술과장은 이날 "주요 선진국이 데이터 동맹을 강화하는 가운데 우리 정부도 바이오 분야에서 디지털 대전환을 실행에 옮기고 있다"면서 "12대 국가 전략기술에도 첨단바이오를 포함시켜 디지털 바이오 육성에 힘쓰고 있다. K-BDS를 통해 바이오 연구 경쟁력을 높이고 관련 생태계가 진화해 나갈 수 있도록 정책적 지원을 이어가겠다"고 말했다.

과기정통부는 이날 유럽, 일본, 중국의 주요 바이오 데이터센터 관계자들과 글로벌 수준의 디지털 바이오 생태계 조성을 위한 간담회도 가졌다. 노경원 과기정통부 연구개발정책실장은 "코로나19 팬데믹을 겪으며 바이오 데이터의 공유와 활용이 감염병 등 바이오 재난 대응을 위해 중요하다는 것을 확인했다"면서 "해외 데이터센터들과의 공조와 협력을 통해 우리나라가 글로벌 수준의 바이오 데이터 공유 생태계를 확보할 수 있도록 노력하겠다"고 말했다. 글·사진=강민성기자 kms@dt.co.kr


[ 저작권자 ⓒ디지털타임스, 무단 전재 및 재배포 금지 ]