▲ 출처=이미지투데이

[이코노믹리뷰=김윤선 기자]최근 국내 연구진이 세계 최초로 인공지능(AI) 기술 중 하나인 딥러닝(Deep Learning)을 활용해 유전자가위의 효율을 예측했다는 기사가 주목을 끌었다. 서울대 공대 전기정보공학부 윤성로 교수와 연세대 의과대학 김형범 교수 공동연구팀의 이 같은 연구결과는 세계적 학술지 네이처(Nature)의 자매지인 네이처 바이오테크놀로지(Nature Biotechnololgy) 온라인판에 지난달  29일(현지시각) 게재됐다.

앞서 10일에는 마이크로소프트(Microsoft)와 메사추세츠 공대(MIT), 하버드 대학교 등의 미국 연구팀이 네이처의 자매지인 네이처 바이오메디컬 엔지니어링(Biomedical Engineering)에 인공지능을 활용한 크리스퍼(CRISPR-Cas9) 유전자가위의 활동을 예측하는 연구결과를 발표했다. 이는 마이크로소프트의 새로운 인공지능 프로젝트인 ‘Elevation’에 따른 연구다.

언뜻 보기에 두 연구는 비슷하다. 그러나 둘 사이에는 분명히 차이가 있다는 것이 국내 연구팀의 설명이다. 이코노믹리뷰가 지난달 31일 연구를 주도한 서울대 공대 전기정보공학부 윤성로 교수와 서울대 공대 민선우 연구원에게서 두 연구의 차이와 국내 연구팀 연구결과의 우수성에 대해 들어봤다.

먼저 윤성로 교수가 인공지능을 활용해 유전자가위의 효율을 예측하는 도구를 개발하게 된 계기를 설명한다. 아래는 윤성로 교수와의 일문일답이다.

▲ 윤성로 교수.

Q. 유전자란 무엇인가?

A. 우리는 부모님으로부터 마치 컴퓨터의 파일처럼 디지털 정보를 받는다. 유전 정보를 저장하는 DNA는 ATGC(아데닌, 티민, 구아닌, 시토신)의 네 가지 염기로 구성된다. 이 네 가지 단위의 배열 방식이 유전자의 특징을 결정한다. 만약 사람을 책으로 비유하자면 우리를 완성하려면 약 30억개의 글자가 필요하다. 이 중 의미있는 부분이 유전자고 책은 유전체다.

Q. 유전자가위가 필요한 이유는?

A. 우리도 글을 쓰다보면 오류가 생긴다. 유전자도 마찬가지다. 사람이 탄생하는 과정에서 어떤 이유로 오류가 생긴 유전자가 발생할 수 있다. 이것이 운이 나쁘면 유전병을 일으킨다. 이 때 문제가 생긴 유전자를 잘라내 유전자를 교정하는 것이 유전자가위다. 가위를 이용해 무엇을 도려내 듯 잘못된 유전자를 잘라낸다는 뜻이다.

Q. 인공지능을 활용해 유전자가위의 효율을 예측하는 도구를 개발한 이유는?

A. 잘못된 유전자를 찾는 게 굉장히 힘들기 때문이다. 이를 찾으려면 높은 비용과 긴 기간이 소요된다. 앞서 ATGC라는 염기서열 네 글자로 30억개의 글자를 조합한다고 하면 엄청난 숫자다. 이 중에 틀린 것을 찾는 것은 결코 쉽지 않다. 이렇게 엄청나게 방대한 데이터가 있을 때 사용할 수 있는 것이 인공지능이다. 우리는 여기서 아이디어를 얻었다. 인공지능 기술 중 딥러닝을 활용해 유전체를 분석해서 유전자가위를 효과적으로 사용해보자는 것이었다.

▲ 민선우 연구원.

민선우 연구원은 마이크로소프트의 연구와 국내 연구팀 연구의 차이점을 설명한다. 국내 연구팀의 연구가 훨씬 앞서있다는 것이 그의 설명이다. 아래는 민 연구원과의 일문일답이다.

Q. 마이크로소프트의 연구와는 어떤 차이가 있나?

A. 유전자가위 기술의 성능 예측은 두 가지 측면에서 볼 수 있다. 가장 큰 차이는 우리 연구는 'On-target activity'고 마이크로소프트의 연구는 ‘Off-target activity’다. 쉽게 말하면 우리의 연구는 유전자가위가 잘라야 하는 부위를 얼마나 잘 자를 것인지를 예측하고 마이크로소프트의 연구는 자르지 말아야 하는 부위를 예측한다.

우리는 On-target activity 연구를 했다. 이는 유전자가위가 목표로 하는 부위를 얼마나 잘 자를 것인지를 나타낸다. 유전자가위는 아직 목표로 하는 부위마다 얼마나 잘 자를 수 있는지의 정도가 다르기 때문에 이를 예측할 수 있는 기술이 중요하다. 예를 들어 유전자 A가 암을 유발한다고 할 때, 유전자가위가 유전자 A에서 잘 절단할 수 있는 부위를 알아야 더 효율적으로 유전자 A를 제거할 수 있다.

반면 마이크로소프트의 Off-target activity는 유전자가위가 목표로 하지 않았던 부위는 얼마나 자르지 않을 것인지를 나타낸다. 유전자가위 기술의 현재 한계점은 표적으로 하는 부위가 아닌, 의도하지 않았던 부위까지 절단할 수도 있다는 것이다. 예를 들어 암을 유발하는 유전자 A를 자르려고 했지만 엉뚱하게 유전자 B를 절단할 수도 있다. 이 같은 악영향을 잘 예측하는 것도 유전자가위 기술에서는 중요한 연구 분야다.

Q. 두 연구 모두 인공지능을 활용했다는 것에서 다르지 않은 것 같다. 그런데도 국내 연구팀의 연구가 세계 최초라고 한 이유는?

A. '인공지능'이란 단어가 최근 모호하게 사용되고 있지만, 과학계에서 가장 널리 사용되는 의미에서는 해당 기술이 스스로 데이터에서 유의미한 특징(Feature)들까지 찾아낼 수 있어야 한다.

개와 고양이 사진을 구분하는 예시로 설명을 하겠다. 기존의 기술들은 먼저 사람들이 직접 개와 고양이의 유의미한 특징들을 찾는 것을 필요로 합니다. 사람이 먼저 개와 고양이의 수염, 귀 모양 등이 다르다는 것을 알면 기존의 기술은 이러한 특징들을 이리저리 조합해 개와 고양이를 어떻게 구분할지 학습한다.

그러나 최근에 인공지능 기술이라고 하면 사람이 했어야 할 인지과정까지 인공지능이 모두 데이터를 통해 스스로 학습할 수 있어야 한다. 즉, 대량의 데이터와 이를 학습할 수 있는 기술을 통해서, 사람들이 기존에 알지 못했던 중요한 특징들까지 찾아내는 것이다. 최근 알파고(AlphaGo)의 성능이 굉장히 향상된 것도 이 덕분이라고 볼 수 있다.

마이크로소프트의 논문이 훌륭하다는 것은 인정한다. 그러나 이들이 사용한 기술은 기존의 기술로 스스로 의미 있는 특징을 찾아내지 못했다. 때문에 인공지능을 활용했다고 보기 어렵다.