출처=이미지투데이

[이코노믹리뷰=황진중 기자] 바이오 제약업계는 다크 데이터 활용이 활발한 분야로 꼽힌다. 제약업계에서 다크 데이터를 활용한 사례는 오리지널 제제에 활용되지 않은 데이터를 이용해 개선한 개량‧복합신약 산업이 있다. 한미약품이 개량‧복합신약 부문의 강자라는 사실에 업계에서는 이견이 없다.

다크 데이터 활용은 개량‧복합신약 개발뿐만 아니라 최근 마이크로바이옴(Microbiome), 생약 등으로 그동안 잠들어 있던 미생물과 천연물 유래 의약품에 관련한 신약개발에도 쓰인다. 일동제약은 연구‧유통 등 유산균 미생물의 강자로 마이크로바이옴 연구개발(R&D), 동화약품은 천연물 유래 약물 R&D의 선두주자로 나섰다. 종근당바이오는 장내미생물은행을 설립해 잠자고 있는 데이터를 깨울 준비를 하고 있다.

의료계는 사정이 다르다. 건강보험심사평가원(심평원)의 데이터를 활용하거나 병원들의 데이터 등을 모아서 빅데이터 연구를 하기 위해 분투 중이지만, 관련 규제와 의료정보 표준화 문제 등으로 갈 길이 멀다. 병원마다 다른 표준으로 보건의료정보는 비정형 데이터가 계속 남아 있다. 

▲ 일동제약이 분당서울대병원 헬스케어이노베이션파크에 설립한 종균은행. 출처=일동제약

“제약업계에는 다크 데이터가 너무 많습니다만”

제약업계 전문가들은 “제약산업의 꽃은 신약개발”이라고 입을 모은다. 그러나 신약개발은 전임상시험에서 임상 3상시험까지 허가받아야 할 단계가 많고 성공률은 9.6%에 불과할 정도로 극악한 기술개발의 연속이다. 신약후보물질은 대개 5000여개에서 1만여개 이상이 선정된다. 이 중에서 평균 10개 이내가 임상에 진입한다. 임상시험이 완료돼 시판되는 신약은 그중 하나이거나 없을 수도 있다.

제약업계는 그동안 축적됐지만, 활용하지 못하고 있는 신약 R&D 실패 데이터 등을 이용해 이런 어려움을 극복하고 개량‧복합신약을 만들고 있다. 개량신약은 기존에 시판되고 있는 의약품이 지니고 있던 여러 가지 문제점인 잦은 복용 횟수, 부작용, 낮은 수용성 등을 개량해 효능을 개선하고, 부작용을 낮춰 더 안전하고 편리하게 복용할 수 있는 의약품이다. 복합신약은 두 가지 이상의 제제를 알약 한 개로 결합해 환자들의 의약품에 사용하는 비용을 줄이면서도 복용 편리성을 증진한 약이다.

제약사가 축적한 신약 R&D 정보를 다시 발굴해 만든 개량‧복합신약은 오리지널 신약보다 개발 기간이 짧고 투자비용이 적다는 게 장점이다. 대개 신약 하나를 개발하기 위해서는 7~15년 동안 최소 300억~500억원의 R&D 비용이 필요하고, 임상에 진입하면 투자비는 급격히 늘어난다. 글로벌 임상은 한 번에 5000억원 이상이 필요하다고 한다. 반면 개량신약은 3~5년 동안 20억~30억원의 개발비를 투자해도 성공 가능성이 높다. 또 잠재 정보를 토대로 연구하는 개량‧복합신약 R&D는 신약을 개발하는 역량도 키울 수 있다. 이는 다크 데이터의 활용 덕분임은 굳이 말할 필요가 없다.

우리나라의 개량‧복합신약 1호는 한미약품이 2009년에 한국화이자제약의 ‘노바스크’와 한국MSD의 ‘코자’를 결합해 만든 고혈압약 ‘아모잘탄’이다. 이는 한미약품의 매출 1위 품목이 됐고, 성분을 더한 ‘아모잘탄플러스’와 ‘아모잘탄큐’와 함께 고혈압치료제 시장에서 지난해 700억원대 매출을 달성하며 돌풍을 이어가고 있다.

한미약품의 데이터를 관리하는 임상데이터 전문관리기업 메디데이터의 정다정 이사는 “제약회사는 그동안 임상시험을 대개 위탁연구기관에 맡겼다. 이런 사정으로 데이터와 관련한 연속성이 없었다. 하지만 물질에 적응증을 추가하는 등 신약 관련 R&D를 다시 진행할 때 기존 데이터가 반드시 필요하다”면서 “제약회사들은 데이터의 중요성을 알고 내부에 전담팀을 만들거나 데이터 전문관리기업에 위탁을 하고 있다”고 설명했다.

정다정 이사는 “데이터는 종류를 아주 세분화할 수 있고, 양도 많다”면서 “임상에 알맞은 데이터로 디자인하고, 연속성을 유지하면서 표준화를 하는 것이 중요하다”고 덧붙였다.

일동제약은 1959년 아기용 유산균제를 첫 출시하고, 2016년에는 종균은행을 만들어 6000여 균주를 보유하는 등 미생물 관련 분야의 1인자다. 이를 기반으로 일동제약은 장내 미생물을 연구하는 ‘마이크로바이옴’ 분야로 R&D를 확장하고, 관련 연구에 매진하고 있다.

천종식 서울대학교 생명과학부 교수가 해설한 최근 논문에 따르면 인체를 구성하는 세포 숫자는 약 30조개다. 이에 비해 미생물은 몸무게 70㎏ 성인을 기준으로 약 38조개가 인체 안팎에 살고 있다. 세균(박테리아), 고세균(아케아), 균류(곰팡이류) 등 미생물은 면역력 등에 영향을 미치면서 인간과 공생한다는 점에서 마이크로바이옴은 제2의 지놈(Genome)이라고 불린다.

일동제약은 2016년 5월 분당서울대병원 헬스케어이노베이션파크에 3000여종에 이르는 장내 미생물 프로바이오틱스 균주와 관련 데이터를 모아 종균은행을 구축했다. 올해는 인체 내 미생물과 질병의 상호관계를 분석하는 정밀의학 연구 분야의 마이크로바이옴 치료제를 만들기 위해 미생물 정보 분석 벤처회사인 천랩과 마이크로바이옴신약연구소(ICM)를 설립하고, R&D를 진행하는 중이다. 비교적 비정형화된 데이터 상태에 머물던 미생물에 집중하면서 혁신 방향을 찾은 것이다.

일동제약 관계자는 “종균은행 자체에서 종균과 관련 데이터를 보관하고 있다”면서 “아직 활용하지 않는 종균과 데이터도 연속성을 위해 보관하고 있다. 신약과 관련, R&D 진도와 기술 개발 등에 따라 꾸준히 활용할 수 있을 것”이라고 내다봤다.

종근당바이오도 기능성 프로바이오틱스를 개발하기 위해 서울대학교 그린바이오과학기술연구원, 한국식품연구원 등 다수의 기관들과 산‧학‧연 공동 연구를 하고 있다. 종근당바이오는 서울대 평창캠퍼스에 장내미생물은행(IMB)을 설립하고 맞춤형 프로바이오틱스 개발에 나섰다. 종근당바이오 관계자는 “최근 장내미생물이 면역력뿐만 아니라 다양한 질병에도 관여한다는 연구결과들이 발표되며 마이크로바이옴 연구의 필요성도 점차 커지고 있다”면서 “서울대학교 연구원과 국내 최대 규모의 장내미생물은행을 설립해 다양한 장내미생물의 라이브러리를 만들고 마이크로바이옴 연구를 선진화할 계획”이라고 말했다.

▲ 동화약품이 식물 등의 생약성분 비정형 데이터를 발굴해 전문의약품 신약개발 R&D에 나서고 있다. 동화약품 연구소 전경. 출처=동화약품

궁중의 비방에 서양약학의 기술을 접목해 탄생한 활명수를 만든 동화약품은 천연물의 비정형 데이터를 발굴하고 있다. 국립산림과학원에 따르면 천연물 의약품은 오랜 임상경험으로 유효성과 안전성이 입증되어 신약개발에 대한 실패율을 줄일 수 있으며, 합성의약품에 비해 적은 개발 비용과 짧은 개발 기간이라는 장점이 있다. 또 합성물질에 비해 안정성을 갖추고 있어 만성‧난치성 장기복용 약물을 개발할 때 유리하다. 세계보건기구(WHO)는 글로벌 천연물의약품 시장이 2011년 187조원 규모에서 2023년 423조원 규모로 성장할 것으로 전망했다.

동화약품이 주력하고 있는 ‘생약’은 자연에서 얻는 식물, 동물, 광물, 미생물 등에서 추출한 원료를 간단한 가공으로 성격을 변질시키지 않고, 약효 성분을 추출해 정제로 만드는 것들을 통칭한다. 우리나라, 중국, 일본 등에서 질병치료에 사용되는 천연물을 통상 생약이라고 한다. 미국은 이를 식물의약품(Botanical Drugs)로, 유럽은 천연물 제제(Herbal Medicinal Product, HMP)로 표현하고 있다.

천연물 사용에 대한 지식과 질병치료 경험을 담은 ‘동의보감’, ‘향약집성방’ 등은 일종의 비정형 데이터다. 제약업계는 “축적한 생약성분과 관련, 서양 약학에 있어 아직 사용하지 않고 있는 생약 비정형 데이터를 다크 데이터라고 이해한다면, 천연유래 신약개발에서 후보물질군으로 선정됐다가 탈락한 생약성분 데이터는 모두 다크 데이터나 마찬가지인 것”으로 평가한다.

동화약품은 천연생약성분 카모밀레, 라타니아, 몰약 3가지를 이용한 잇몸치료제 ‘잇치’를 비롯해 식물 등의 비정형 데이터를 발굴해 전문의약품 신약개발 R&D에 나서고 있다. 동화약품이 ‘갈근’과 ‘상백피’ 혼합 추출물로 개발 중인 염증성장질환치료제 ‘DW2007’은 국내 임상 2a상시험을 하고 있다. 이는 명확한 원인이 규명되지 않은 염증성장질환을 치료하는 약물로 항염작용과 면역균형, 장내세균 정상화 등 다양한 약리기전을 나타낼 것으로 예상된다.

동화약품은 또 ‘작상’이라는 국내 자생 식물을 원료로 한 단일 성분의 생약으로 알레르기 천식치료제 ‘DW2008S’를 개발 중이다. 동화약품은 올해 4월 식품의약품안전처로부터 후추과 열매 성분을 활용한 비뇨기계 약물 ‘DW2005’의 임상 1상시험을 허가받았다.

제약업계 관계자들은 “시판된 약물에서 일부 대상에게 부작용이 발견돼, 이를 회수한 후 관련 데이터 등을 보관하고 있다가 R&D를 통해 해당 부작용을 개선해 개량신약을 출시하는 등 다크 데이터라고 불리는 잠자는 데이터, 비정형 데이터를 활용하는 것은 제약업계의 일상”이라면서 “상호 결합할 수 있는 제제, 미생물‧마이크로바이옴, 국내에 자생하는 식물 등은 기술 진보와 R&D 역량에 따라 언제든지 데이터화한 뒤 산업에 이용할 수 있다”고 입을 모았다. 관계자들은 다만 “신약 개발에 있어서 화두는 데이터보다 시간과 비용이다”라면서 “빅데이터를 연구에 이용할 수 있게 되면 이를 줄일 가능성이 있겠다”고 덧붙였다.

▲ 건강보험심사평가원 원주 사옥 전경. 출처=건강보험심사평가원

건강보험심사평가원에 잠든 의료 데이터, 활용 가치 있을까?

의료계에 ‘빅데이터’라는 말이 유행하기 시작하자 건강보험심사평가원의 보험료 청구 자료가 돌연 관심을 받기 시작했다. 심평원이 수집한 모든 국민의 의료기관 이용 정보에는 급여 대상이 되는 약물과 의료기술, 검사정보는 물론 자세한 의료 이용내역이 포함됐기 때문이다. 이는 공공의료, 근거중심의학, 비교효과연구 등의 의학 연구에서 활용될 수 있다고 평가된다.

심평원의 건강보험 청구 자료 등 보건의료 빅데이터는 특정 질환 입원정보를 이용해 시간의 흐름이나 계절에 따라 어떤 질환이 발생하는지 패턴 분석을 할 수 있고, 역학조사에도 활용될 수 있을 것으로 보인다. 게다가 질환별 환자 수의 연도별 증감, 환자 수 증가에 영향을 미치는 요인을 분석할 수도 있다. 맥킨지는 2013년 발표한 보고서에서 글로벌 보건의료 분석시장이 2014년부터 2019년까지 연평균 25% 성장할 것으로 전망했고, 미래 경제 성장을 견인하는 유망 분야가 될 것으로 예측했다.

우리나라는 IT 강국으로 손꼽히고 있지만 보건의료 데이터 활용에는 취약하다. 건강보험공단, 심평원, 국립암센터, 질병관리본부는 물론 병원마다 전자의무기록(EMR), 처방전달시스템, 디지털영상정보전달시스템(PACS) 등 다른 정보기록체계를 운영하기 때문에 ‘빅데이터’라고 불릴 만큼 방대한 데이터가 모이지 않는다. 의료법과 개인정보보호법 규제로 환자 데이터를 병원 밖으로 유출할 수 없다는 한계점까지 있다. 보건의료 빅데이터를 활용하기 위해서는 앞서 제시한 두 가지 문제를 해결하는 것이 시급하다.

전문가들은 의료계가 심평원의 데이터에 집착할 필요가 없다면서 글로벌 표준에 맞춰 데이터를 생산하는 게 우선이라고 지적한다. 익명을 요구한 국립대 교수는 “현재 많은 의료 데이터들이 심평원이 정의한 보험료 청구를 위한 코드로 이루어져 있다”면서 “이것은 보험급여를 주기 위한 데이터이기 때문에 아무리 많이 모아도 저장성의 가치가 떨어진다”고 말했다. 그는 “어떤 데이터가 필요한 것인지에 대해 생각하는 게 우선시돼야 한다”면서 “정부와 의료기관, 연구소 등 수요자 중심으로 한국형 표준 데이터를 만드는 것이 아닌 글로벌 표준에 맞추는 것이 중요하다”고 설명했다.

다른 의과대학 전문의는 “연구기관 등이 쌓아둔 데이터를 활용하면 새로운 연구가 가능하다”면서 “해외 연구자들이 우리나라 심평원의 데이터에 관심이 많은데, 연구용으로 활용할 수 있는 심평원의 데이터를 실제로 보고 난 뒤 도움이 안 될 것으로 판단하고 실망을 많이 한다”고 말했다. 의약업계 전문가는 “국내 민간 의료기관은 스스로 빅데이터를 만들 수 있을 정도로 훌륭한 기관”이라면서 “심평원 등의 데이터를 원할 것이 아니라 본인들이 쌓은 데이터를 활용하는 방안을 생각하는 게 낫다”고 꼬집었다.

▲ 다크 데이터 활용 연구개발 사업. 출처=각 제약사, 의료업계, 이코노믹리뷰

박순영 융합연구정책센터 연구원은 “높은 수준의 IT 기술 활용으로 공공과 민간 모두 상당한 수준의 데이터가 구축돼 있으나, 기관별 분산된 보건의료 데이터의 연계‧통합 가능한 법‧제도의 기반이 부족하다”면서 “기관과 장소의 구분 없이 분산된 데이터를 연계하고 통합된 데이터를 수요자에게 제공하는 서비스를 위한 국가 보건의료 데이터 공유 플랫폼 구축이 필요하다”고 밝혔다.