디지털 전환 물결 속 방패 만드는 K-BDS "10PB 수집 목표"

코로나 시국에 국가재난대비 필수
범부처 차원의 K-BDS 시범 운영
R&D로 세계 두번째 코로나 백신
AI 기반 융복합 신약개발 가속도
5년 1300억 투입…51개 유형 등록

  • 프린트
  • 페이스북
  • 트위터
  • 카카오스토리


디지털 전환 물결 속 방패 만드는 K-BDS "10PB 수집 목표"


총성없는 ‘바이오 데이터’ 확보 전쟁

<1> `한국판 바이오 데이터 댐` 구축 시동


코로나19 이후 디지털 전환의 거센 물결 속에서 바이오 데이터가 바이오 R&D(연구개발) 혁신을 견인할 주역으로 자리매김하고 있다. 이에 따라 유전체 해독과 AI(인공지능) 등의 IT 기술 발달과 방대한 양의 바이오 연구 데이터가 축적되면서 빅데이터를 활용한 혁신적 연구방식이 각광받고 있다. 특히 감염병 등 바이오 국가 재난 발생 시 축적해 놓은 바이오 연구 데이터는 신속한 치료제와 백신 개발에 나설 수 있는 근간이 되고 있다.

우리나라도 디지털 바이오 경제 시대를 맞아 국가 차원의 범부처 바이오 R&D 데이터의 체계적인 수집·관리·공유 및 활용·확산을 위한 '국가 바이오 데이터 스테이션(Korea BioData Station, K-BDS)'을 구축, 시범 운영에 들어갔다. 데이터 기반 바이오 R&D 생태계 조성에 기여할 'K-BDS 사업'의 역할과 기대효과 등을 기획시리즈를 통해 살펴본다.

◇바이오 R&D 혁신의 주역은 'AI-데이터'=미국 글로벌 제약사 모더나가 mRNA(메신저 리보핵산) 기반의 코로나19 백신 개발에 성공할 수 있었던 것은 AI와 데이터 기반의 디지털화 역량을 접목했기 때문이라는 사실은 널리 알려져 있다. 이 회사는 mRNA 백신 설계와 합성에 디지털화 기술을 적용해 세계에서 두 번째로 코로나19 백신을 탄생시킬 수 있었다.

모더나 뿐만 아니라 코로나19 항체 치료제를 개발한 리제네론(Regeneron)는 미국의 의료 서비스 기업인 가이징거(Geisinger), 영국의 바이오뱅크 등과 사람의 유전정보를 담은 유전체를 기반으로 신약 타깃을 발굴했고, 영국의 AI 스타트업인 베네볼렌트AI(BenevolentAI)와 세계적 제약사 길리어드 등은 AI를 신약개발에 활용하는 등 AI 기반 융복합 데이터(화합물, 유전체, 약물 등)를 통해 신약개발 기간을 단축 시키는 성과를 거뒀다.

이처럼 바이오 빅데이터가 바이오 R&D 혁신을 견인하는 핵심으로 부각되면서 바이오 연구자들의 연구 수요도 급증하고 있다. 우리나라의 경우 바이오 R&D를 통해 다양한 데이터를 생산하고 있지만, 통합·관리되는 데이터가 한정돼 있고 해외 플랫폼에 의존하고 있어 활용 및 확산에 한계가 있었다.

특히 국내 바이오 연구 데이터는 대부분 사업단, 개인 연구자 등이 개별적으로 보관하고 있어 범용적으로 활용하기에 양적·질적으로 부족한 상황이었다.

정부는 이 같은 환경에서 지난해 5월 '생명연구자원 빅데이터 구축 전략'을 수립하고, 범부처 바이오 데이터통합 수집과 관리, 활용을 위한 '국가 바이오 데이터 스테이션(K-BDS)' 사업을 올해부터 2026년까지 5년 동안 1300억원을 투입해 과기정통부 주관으로 추진하고 있다.

디지털 전환 물결 속 방패 만드는 K-BDS "10PB 수집 목표"
국가 바이오 데이터 스테이션 사업으로 구축되는 'K-BDS' 플랫폼



◇K-BDS, "10PB 규모 바이오 데이터 등록 목표"=K-BDS는 바이오 연구 데이터 공유를 위한 일종의 '데이터 댐'으로 한국생명공학연구원 국가생명연구자원정보센터(KOBIC)와 한국과학기술정보연구원(KISTI)이 참여해 올 초부터 구축하고 있다. 바이오 연구 과정에서 생산·활용되는 모든 데이터가 수집 대상으로, 유전체와 단백체, 임상·전임상 데이터, 화합물 분석 데이터 등이 이에 속한다.

현재 정보센터가 보유하고 있는 데이터를 포함해 대형사업단, 다른 부처 데이터 센터 등을 통해 10PB(페타바이트, 1PB=1024TB)를 목표로 수집할 계획이다. 그동안 부처, 사업, 연구자별로 흩어져 관리되던 바이오 연구 데이터를 수집하면 51개 데이터 유형별로 분류·등록된 후 K-BDS 플랫폼을 통해 국내 연구자들에게 내년부터 서비스가 제공될 예정이다.

생명연은 오믹스 등 15개 바이오 분야별 데이터 분석기술을 개발해 K-BDS에 탑재하고, 질병관리청과 농촌진흥청, 해양수산부, 산업부, 환경부 등이 운영하고 있는 데이터 센터를 고성능 전용 네트워크 망으로 연계해 연구자들이 혁신적 연구성과를 창출할 수 있도록 지원할 계획이다. 김장성 한국생명공학연구원장은 "생명연은 K-BDS 구축에 아낌없는 지원을 통해 바이오 디지털 전환 시대의 선두주자로 발돋움하겠다"며 "K-BDS가 바이오 데이터 공유·확산의 선진 인프라로 거듭 날 수 있도록 생명연이 보유한 우수한 성과를 토대로 테스트 베드 역할을 수행함으로써 국가 바이오 연구 혁신의 우수 사례를 창출하고, 바이오 데이터의 새로운 가치를 넓혀가는 지평이 되도록 구축에 최선을 다하겠다"고 말했다.


이준기기자 bongchu@dt.co.kr

<이 기사는 한국생명공학연구원의 지원에 의해 작성되었습니다>




[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]


가장 많이 본 기사