흩어진 바이오연구 데이터 모아 표준화 박차

[총성 없는 ‘바이오 데이터’ 확보 전쟁‘
<2> K-BDS, 고품질 데이터 '개봉박두'
분자구조 등 15대 분야 데이터
'국가 바이오 데이터 스테이션'
범부처 공유·활용 고품질 변모

  • 프린트
  • 페이스북
  • 트위터
  • 카카오스토리


흩어진 바이오연구 데이터 모아 표준화 박차
한국생명공학연구원 국가생명연구자원정보센터(KOBIC)가 구축한 '국가 바이오 데이터 스테이션(K-BDS)' 통합 플랫폼 모습. 생명연 제공

한국생명공학연구원 국가생명연구자원정보센터(KOBIC)는 올해부터 부처, 사업, 연구자별로 흩어져 있는 바이오 연구 데이터를 모아 51종의 데이터 등록 양식에 맞게 표준화하는 데 박차를 가하고 있다.

분자구조, 생화학분석, 화합물 등 바이오 15대 연구 분야에서 생산된 모든 데이터를 '국가 바이오 데이터 스테이션(K-BDS)'에 등록해 범부처가 공유·활용할 수 있는 고품질 데이터로 변모시키는 데 역량을 모으고 있다.

◇흩어진 데이터 수집·등록 위한 표준화=이를 위해 KOBIC 자체적으로 수집·관리하고 있는 데이터를 표준화해 K-BDS로 이관했고, 유전자동의보감 사업단, 정밀의료기술개발사업단, 국가 통합 바이오 빅데이터 구축사업 등 대형 국가 사업단에서 생산하는 데이터도 확보할 계획이다. 또한 질병관리청과 농촌진흥청, 해수부, 산업부 등 각 부처가 보유한 데이터 센터를 K-BDS와 연계해 활용하는 방안도 추진하고 있다.

생명연은 기관 협의와 연구자 등록 유도 등을 통해 총 10PB 규모의 데이터를 확보할 계획이다.

데이터 등록 및 활용에 따른 연구자 편의성을 높이는 데도 힘을 모으고 있다. 이를 위해 국가 연구개발에 참여하고 있는 연구자는 반드시 등록해야 하는 '범부처 통합연구지원시스템(IRIS)'과 연계해 자신의 연구 데이터를 보다 간편하게 등록하면서 표준화된 다른 연구자의 데이터를 손쉽게 검색·활용할 수 있도록 지원할 방침이다.

여기에 그치지 않고, '데이터 품질선도센터(가칭)' 운영을 통해 유전체 데이터를 제외한 단백체, 대사체, 이미지 영상 등은 별도 전문 기관에 맡겨 데이터 생산 단계부터 분석, 해석까지 연구현장의 문제 해결을 위한 상담 지원과 등록 데이터 품질 관리를 강화해 나간다.

◇하드웨어·SW 플랫폼 구축…데이터 등록·검색 완성=K-BDS 통합 플랫폼은 크게 △데이터 운영·저장 인프라(하드웨어 플랫폼) △데이터 등록·수집·연계 및 관리 프레임워크(소프트웨어 플랫폼) △데이터 분석·활용 프레임워크(소프트웨어 플랫폼) 등으로 나눠 구축되고 있다.

우선, KOBIC은 K-BDS 플랫폼 운영과 저장을 위한 서버, 인프라, 기반 시설 등 총 10PB 규모의 데이터를 저장할 수 있는 전산 인프라와 2.1PB 수준의 공유형 데이터 센터 인프라 구축을 모두 완료했다. 1PB(페타바이트)는 DVD를 55층 높이 건물로 쌓아 올릴 수 있으며, 영화로 767년 간 볼 수 있는 어마어마한 용량이다.

또한 국가 바이오 연구 데이터의 효율적인 등록·수집·연계와 안정적 관리를 위한 K-BDS 플랫폼 구축을 마치고, 지난 10월부터 시범 운영하고 있다. 이 플랫폼은 국가 R&D 과제에서 생산된 데이터의 등록·수집을 위한 플랫폼과 부처 데이터 센터 연계를 위한 10G급 고성능 전용 네트워크망으로 구축된다.

이와 함께 K-BDS에 수집된 데이터를 활용하기 위한 데이터 분석·활용 플랫폼은 한국과학기술정보연구원(KISTI) 주도적으로 개발해 제공될 예정이다. 이 플랫폼은 연구자들이 바이오 데이터를 R&D 효율성과 생산성을 높일 수 있는 시각화 도구, 고급 분석 툴 등 다양한 기능을 제공함으로써 실제 연구 현장에서 널리 쓰일 것으로 기대된다.

코빅은 이밖에 과기정통부 산하 4개 소재 클러스터 중앙은행의 소재 정보와 화합물 데이터를 활용하기 위한 데모 시스템도 구축하고 있다. KOBIC 관계자는 "올해부터 내년까지 K-BDS의 본격적인 서비스 개시를 앞두고 하드웨어와 소프트웨어 플랫폼 구축에 주력하고 있다"며 "K-BDS를 통한 데이터 등록과 검색 기능을 완성하고, 이를 토대로 연구자들이 연구 혁신에 활용할 수 있도록 수요자 의견을 바탕으로 기능 고도화에 나설 계획"이라고 말했다.이준기기자 bongchu@dt.co.kr

흩어진 바이오연구 데이터 모아 표준화 박차
<국가 바이오 데이터 스테이션(K-BDS)의 통합 플랫폼 개념도>






[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]


가장 많이 본 기사