▲ 출처=픽셀

오늘날 인공지능(AI)이 끼지 않는 분야가 없다. 특히 의료 분야는 인공지능이 접목됐을 때 의료비 절감 효과와 정밀 의료가 가능하다는 점에서 기대가 크다. 디지털 시대를 이끈 구글이 생명 연장 프로젝트에도 가속화 페달을 밟고 있다.

그간 구글은 의료 전문가들과 협력해 의료 서비스의 가용성과 정확성을 향상할 도구들을 개발해왔다. 구글은 최근 인공지능 딥러닝 기술을 활용해 당뇨성 암과 안구질환을 진단하는 데 성공했다.

딥러닝(Deep learning) 분석 모델 개발을 마쳤으며 조만간 임상실험을 끝내고 의료 서비스에 본격적으로 투입할 계획이다. 딥러닝은 컴퓨터가 인공 신경망(ANN: artificial neural network)을 통해 사람처럼 스스로 빅데이터를 학습할 수 있는 기계 학습 기술이다.

▲ 릴리 펭 매니저. 출처=구글 

릴리 펭(Lily Peng) 구글 리서치 의학 영상팀 프로덕트 매니저는 지난 27일 서울 역삼동 강남 파이낸스타워 21층 구글 회의실에서 진행한 'AI 혁신과 의학: 딥러닝 기술을 활용한 질병 조기 발견' 이란 주제의 영상 포럼에서 딥러닝을 활용한 영상과학이 어떻게 임상에 활용될 수 있는지에 대해 논했다.

펭 박사는 딥러닝을 비롯한 구글의 기술과 전문 지식을 적용해 망막 영상을 포함한 의료 영상의 접근성, 정확성 및 임상 유용성을 높이는 데 초점을 두고 있는 구글 리서치 의학 영상팀의 프로덕트 매니저를 맡고 있다.

그는 "지난 2015년 11월부터 오픈소스로 제공된 구글의 인공지능 제작 도구 '텐서플로우'가 의료 인공지능 개발에 큰 도움이 되고 있다"며 "환자 안구 속 뒷부분인 안저 사진을 보고 당뇨병성 망막증을 진단하는 인공지능을 개발해 정확도를 시험했더니 안과 의사와 거의 비슷한 수준의 성과를 거뒀다"고 밝혔다.

◇의료 전문가 부족한 '당뇨병성 망막증', 인공지능 의사가 책임진다 

'의료영상'은 구글 헬스케어 분야 프로젝트 중 하나다. 현재까지 구글이 의료영상 연구에서 가장 많은 진보를 이루어 낸 두 분야는 안과학과 디지털 병리학이다.

당뇨병성 망막증(DR)은 실명 원인 중 하나다. 환자 수가 빠르게 증가해 현재 전 세계 약 4억1500만명의 당뇨병 환자들이 위험군에 속해있다. 조기에 발견하면 치료가 가능하지만 그렇지 못할 경우 실명으로 이어질 수 있다.

당뇨병은 흔한 질병이지만 당뇨병성 망막증을 진단할 수 있는 의료 전문가는 부족한 실정이다. 구글은 의료 취약 지역에서 의료진이 딥러닝을 통해 환자를 진단할 수 있도록 지원한다. 당뇨병성 안구 질환을 진단하는 방법은 안구 뒤쪽을 촬영한 안저 사진을 전문의가 검사한 후 질병 여부와 중증도를 진단하는 방식이다.

중증도는 눈의 출혈과 삼출물에 따른 안구 손상 정도(미세동맥류, 출혈, 경성백반 등)에 따라 결정된다. 촬영한 사진을 판독하려면 전문적인 교육을 받아야 한다. 

구글은 인도 및 미국 지역의 안과 의사 54명이 3~7회에 걸쳐 판독한 12만8000개 영상으로 개발 데이터 세트를 만들었다. 이 데이터 세트는 당뇨병성 망막증 증상을 포착할 수 있도록 심층 신경망(deep neural network) 학습을 진행하는 데 사용됐다.

이후에는 두 개의 개별 임상 검증 세트를 대상으로 알고리즘 성능을 테스트했다. 총 1만2000개의 영상으로 테스트를 진행했다. 그 후 미국 의사 면허가 있는 안과 의사 7명~8명으로 구성된 패널이 다수결로 결정한 내용을 참조 표준으로 정했다.

펭 매니저는 "당뇨병성 망막증은 환자들 중 45%가 전문가 부족으로 진단받기 전에 실명한다"며 "딥러닝 알고리즘을 통해 환자의 실명을 막고 조기 진단할 수 있다"고 강조했다.

▲ 출처=구글코리아

◇구글 인공지능, 암 조직 검사도?

암 조직검사에서도 인공지능이 유용하게 쓰일 것으로 보인다. 펭 박사는 "유방암이 림프샘으로 전이됐는지 진단하는 인공지능을 개발했더니 암을 잡아내는 민감도가 92%로 73%인 인간 의사를 추월했다"고 설명했다.

그는 이어 "물론 인공지능은 허위 양성 진단을 하는 경우도 있어 허위 진단율 0%인 인간 의사와 차이가 있다"고 설명했다. 대다수 질병의 진단은 환자의 조직 샘플을 검사한 뒤 작성된 병리 보고서를 바탕으로 이루어진다.

인공지능은 병리학자들의 어려움을 덜어줄 것으로 보인다. 암을 진단할 때는 병리학자의 진단은 향후 환자의 치료 방향을 결정하는 중요한 요소다. 조직 병리 슬라이드 검사는 고도로 복잡한 직업이라 적정 수준의 숙련도와 경험을 갖추려면 수년간의 수련과정을 거쳐야 한다.

오진도 많아 유방암의 경우 진단 일치율은 48%로 저조한 편이다. 전립선암도 마찬가지다. 수많은 양의 정보를 제한된 시간에 다뤄야 하는 병리학자들의 입장에서 본다면 무리도 아니다.

구글은 병리학자의 작업 흐름을 자연스럽게 보완해 줄 수 있는 자동 감지 알고리즘을 개발해 딥러닝을 디지털 병리학에 응용할 수 있는 방법을 조사 중이다. 구글 인공지능은 종양 사진을 여러 각도에서 검사할 수 있도록 인공신경망을 훈련해 자동으로 종양을 진단한다.

유방암이 림프절로 전이된 경우 종양의 위치를 알 수 있는 알고리즘도 개발했다. 실험 결과 양성세포를 진단하는 위치 추정 점수(FROC)는 89%로 병리학자가 기록한 점수인 73%보다 높게 나타났다.

펭 매니저는 "알고리즘 모델 훈련은 딥러닝 의료기기 상용화 위한 첫걸음"이라며 "아직 임상검증, 규제 승인 등 다양한 부분이 남아 있지만 시작은 매우 낙관적"이라고 설명했다.

▲ 출처=구글코리아

◇인공지능 의사, 어디까지 왔나?

펭 매니저는 "병리학자가 허위 진단을 내리는 경우는 매우 드물다. 예를 들어 상기 언급된 병리학자의 73%라는 점수는 민감도 73%, 허위 양성 0을 의미한다. 반면 구글 알고리즘의 민감도는 허위 양성이 추가돼도 증가한다"며 "슬라이드당 허위 양성 8개 수준에서 구글 알고리즘은 92%의 민감도를 기록했다"고 설명했다.

오차 확률이 있기 때문에 전문의의 점검이 꼭 필요한 수준이다. 병리학자가 정상 세포를 종양으로 오판하는) 진단을 내리는 경우는 극히 드물기 때문이다.

인간 병리학자 수준과 지식의 경험이 부족한 알고리즘의 한계도 있다. 알고리즘은 훈련받은 작업에 대해서는 잘 작동하나 염증 반응, 자가 면역 질환 및 다른 암 종류 등 명시적으로 분류 훈련을 받지 않은 다른 이상은 감지할 수 없다. 환자에게 최적의 임상 시험 결과를 보장하기 위해서는 이 알고리즘이 병리학자의 작업 흐름을 보완하는 방식으로 활용돼야 할 것으로 보인다.

현재 IBM의 왓슨이 이미 의료 현장에 도입돼 활용되고 있다. 왓슨은 클라우드 기반의 코그너티브 컴퓨팅(Cognitive computing) 플랫폼이다. 인공지능이 접목된 인지 시스템이다. 왓슨은 자연어를 이해하고 학습이 가능하며 가설을 제안할 수 있다. 왓슨을 인공지능이라고 보는 시각도 있지만, 정확하게는 인공지능이 가미된 슈퍼컴퓨터다.

왓슨은 지난 2012년부터 미국 메모리얼슬로언케터링암센터(MSKCC)에서 290여종의 의학저널, 200종의 교과서, 1200만쪽의 전문자료를 딥러닝을 통해 익혀왔다. 현재도 매일 새롭게 출판되는 의료 전문 서적들을 비롯해 1500만쪽에 달하는 의료정보, 치료 가이드라인을 분석해 환자들에게 최적의 치료법을 제안하고 있다.

IBM은 올해 전체 암의 약 85%를 분석할 수 있을 것으로 내다봤다. 지난해 국내 길병원은 국내 최초로 왓슨을 도입해 첫 환자를 진료했다. 최근 계명대학교 동산병원도 왓슨을 활용한 진료를 시작했다.