일명 ‘AI 한의사’ 개발 나선 한의학연 미래의학부 이상훈 박사
한의 'RWD', 표준화된 형식으로 모으는 생태계 구축이 목표
안면신경마비와 중풍 후유증 각각 200건씩 400건 환자 데이터 수집
2024년까지 '한의생체지표' 관련 정상인 2만명 데이터 구축 계획

전통의학인 한의학에도 ‘AI(인공지능) 한의사’가 개발될 수 있을까.

과학화와는 거리가 멀게만 느껴지던 한의학이 변화를 모색하고 있다. 정밀의료 같은 미래 의학 패러다임 전환에 발맞춰 미래 한의학으로 나아가기 위한 움직임이 일고 있다.

한의계가 가장 먼저 주목한 것은 ‘빅데이터’였다. 한의사의 정성적 평가로만 치료결과를 제시하던 과거와 달리 앞으로는 정량적 평가도 필요하다는 판단에서다.

그렇게 시작된 게 바로 과학기술정보통신부 산하 한국한의학연구원이 지난 2019년 첫 발을 뗀 ‘AI 한의사 개발을 위한 임상 빅데이터 수집 및 서비스 플랫폼 구축 연구’다.

이 연구는 한의 의료기관에서 한의사의 진단을 도와주는 일명 ‘한의사 비서’ 개발에 필요한 인프라를 구축하기 위한 기초 작업이다. 한의 임상과정에서 발생한 리얼월드데이터(RWD)를 표준화된 형식으로 모으기 위한 생태계를 구축하는 게 연구의 목적이다.

오는 2024년까지 단계적으로 ▲한의 임상 데이터 표준화 및 정량화 ▲한의 임상 및 문헌 빅데이터 구축 ▲한의 인공지능 알고리즘 개발 및 서비스 등을 완료할 예정이다. 첫 해인 지난 2019년 27억원이 연구비로 배정됐으며, 지난해와 올해 각각 40억원씩 투입돼 지난 3년간 사용된 예산만 107억원에 이른다. 2024년까지 연평균 35억원의 예산이 더 투입될 것으로 보인다.

주관적인 한의 임상 지표를 객관적으로 측정 가능한 물리지표로 치환하고 측정 프로토콜을 표준화하는 데까지 마쳤다. 현재는 AI 개발을 위한 정량적 임상 DATA를 수집해 인프라를 구축하는 단계다.

안면신경마비와 중풍 후유증의 경우 표준화된 프로토콜 개발을 마치고 한방병원과 협업을 통해 임상 데이터를 구축하고 있으며, 아토피 피부염과 비염은 프로토콜을 개발 중이다.

임상과정에서 수집된 리얼월드데이터에 중국의 가장 오래된 중의학 서적인 ‘황제내경’부터 최근의 한의 논문까지 포함해 빅데이터를 기반으로 한 ‘한방 의료 시스템’을 서비스하겠다는 계획이다.

‘AI 한의사’ 개발을 이끌고 있는 한의학연 미래의학부 이상훈 박사(책임연구원)를 만나 한의 빅데이터 플랫폼 구축 과정 등에 대해 들었다.

- AI 한의사는 무엇인지, 개발하게 된 배경이 궁금하다.

AI 한의사라는 이름 자체가 관심 끌기 좋으니 그렇게 부르기는 하지만 'AI 한의사 개발을 위한 한의 임상 빅데이터 수집 및 서비스 플랫폼 구축 연구'가 풀 네임이다. AI 한의사를 지금 당장 만들겠다는 게 아니라 이를 만들기 위해서는 서비스 플랫폼이 있어야 하는데 어떤 데이터를 모아야 하는지 정의하고 데이터를 수집하고자 하는 것이다. 

의학은 거대한 과학 인프라가 정보들을 만들어 주고 있는 반면 한의학은 고유한 한의 시술들에 대한 매커니즘 연구 등이 의료계에 비해 적다. 그렇다 보니 데이터를 만들어내는 속도가 너무 느리다. 규모의 경제에서 너무 차이가 나니 리얼월드데이터 기반의 데이터마이닝이 살 길이라고 생각했다. 마침 AI, 빅데이터, 데이터댐 등 수많은 키워드가 부상하며 연구과제로 이어졌다.

또 한의학은 A라는 원인이 있어서 ‘안티 A’라는 치료법을 넣으면 A가 없어진다는 현대 의학적인 개념이 아닌 원인의 집단이 있고 이를 해소할 수 있는 치료법의 집단을 투입하는 개념이다. 때문에 한약 처방도 여러 개 약제를 동시 투입하고, 침 치료도 하나의 혈 자리를 쓰는 게 아니라 여러 개 혈 자리를 조합해서 (환자를) 원래대로 돌려놓는다. 그 자체가 무작위 이중맹검 위약대조 임상연구(randomized, double-blind, placebo-controlled trial, RCT) 연구에 잘 맞지 않는 거다. 오히려 빅데이터 기반의 연구가 한의계 임상 현실을 반영하는 용법에는 잘 맞는다고 생각했다.

- 지난 2019년부터 연구가 시작됐다. 2024년까지 진행되는데, 현재 어느 단계인가.

최종 목표는 표준화된 포맷을 만들어 임상에서 진료하는 데이터가 자연스럽게 쌓일 수 있는 생태계를 구축하는 것이다. 하지만 누가 그냥 (진료 데이터를 저장) 해주겠나. 당근책이 필요한데, 그 당근책 중 하나가 '진료지원시스템'이다. 고전으로 치면 황제내경부터 올해 7월 출판된 논문까지 모두 탑재해 어떤 환자가 왔을 때 그와 관련된 고전 문헌부터 최신 연구결과를 찾아주는 디지털 비서인 셈이다. 이를 위해 한의계에 존재하는 모든 논문들을 다 모아 전문가들에게 맡겨 논문을 요약하고 있다. 만약 이 진료지원시스템을 사용하고 싶다면 표준화된 양식으로 환자 데이터를 업로드 하도록 하겠다는 거다. 

예를 들어 ‘추위 많이 타세요, 더위 많이 타세요’라는 질문조차 물어보는 사람과 대답하는 사람에 따라 많은 차이가 생긴다. 가능한 언어에 의한 차이가 발생하지 않게 픽토그램 기반으로 설문 시트를 만들고 있다.

- 진료지원시스템에 탑재된 논문 가운데 중국에서 출판된 논문도 포함되나. 중국 중의학 논문에 대한 신뢰도 문제도 많이 제기된다.

중국 논문들도 탑재됐다. 사실은 (신뢰도가 낮은 논문들을) 걸러낼 수 있는 뚜렷한 방법은 없다. 지금 AI 관련해 중국이 세계 1위지만 어떤 게 거짓이고, 사실인지 구분하는 방법은 없다. 다만 구분하지 않는 대신 저자 정보와 국가 정보를 보여주고 한의사에게 판단권을 주는 거다. 어떤 AI를 만들더라도 최종 판단은 사용하는 의료인에게 달려 있다.

- 한의학에는 수많은 비방이 존재한다. 각기 다른 치료 방법을 표준화된 데이터라고 부를 수 있을지도 의문이다.

엄밀히 얘기하면 비방은 처방 자체가 비방인 경우도 있지만 그 비방이 잘 듣는 사람을 집어내는 능력이기도 하다. B라는 양상을 보이는 환자에게 C처방이 잘 맞는다는 것이 경험적으로 누적되면 유사한 환자가 계속 오고 그 중 잘 안 듣는 환자가 떨어져 나가고 남은 형태가 비방으로 불리기도 한다. 정말 대단한 한의사인줄 알고 갔더니 쓰는 처방이 흔한 처방인 경우도 있다. 처방이 특이한 게 아니라 처방이 잘 맞는 적응증을 보는 눈이 뛰어난 거다.

표준화된 데이터를 만드는 이유가 여기에 있다. 과거에는 비(非)반응군을 경험을 통해 찾아냈다면 이제는 데이터를 기반으로 찾아낼 수 있다. 데이터를 기반으로 특정 처방에 잘 낫는 환자군을 찾아내는 알고리즘을 만들어 주는 것이다. 

질환자 400명·정상인 2만명 데이터가 빅데이터?

- 리얼월드데이터 구축은 임상 데이터가 상당수 축적돼야 의미가 있지 않나. 데이터 수집은 어느 정도까지 완료된 건가.

현재 예비 데이터를 모으는 수준이다. 하루아침에 될 일은 아니고 지속적으로 이어져야 한다. 주로 한방병원과 연계해 모으고 있다. 현재 안면신경마비와 중풍 후유증 등 2개 질환에 대해 데이터 수집이 시작됐다. 올해까지 안면신경마비와 중풍 후유증 각각 200건씩 400건의 환자 데이터를 수집하는 게 목표다. 비염과 아토피 피부염은 데이터 수집을 위한 프로토콜을 개발하고 있다. 질환마다 특징이 다르기 때문에 프로토콜도 모두 다를 수밖에 없다. 사실 데이터 수집 양을 공개하면서 걱정도 된다. 삼성서울병원은 한 질환 환자만 하루에 수천명일 텐데. 역시 규모의 싸움에서 어려움이 따른다.

5,000명의 정상인 데이터도 구축했다. 오는 2024년까지 2만명의 한의생체지표들에 대한 정상인 데이터가 구축되는데 이걸 만드는 이유는 명확하다. 그간 한의사들이 환자 맥이 약하다고 주관적으로 표현하던 것은 이 데이터가 구축되면 ‘한국인 40대 여성 표준의 맥 세기에 비해 하위 20%에 해당된다’고 객관적인 지표를 제시해 설명할 수 있는 환경이 마련될 수 있다.

- IBM의 ‘왓슨 포 온콜로지’가 처음 도입됐을 때 굉장히 호평을 많이 받았지만, 결국 사업을 접게 됐다. 빅데이터를 많이 모으더라도 진단에 좋은 결과를 도출 해내야 하는데 융합 능력이 떨어져 임상에서 크게 활용되지 못했다고 들었다. 데이터를 구축하는 것뿐만 아니라 좋은 결과로 도출할 수 있는 능력도 중요하다는 의미 같다.

왓슨은 자연어 처리 전문 엔진이다. 온콜로지와 관련된 모든 서류를 자연어로 처리해 읽어낸 다음 사용자 쿼리를 냈을 때 최적의 정보를 찾아 주겠다는 게 왓슨의 목표다. 사실 왓슨은 벨리데이션(validation) 하는 게 굉장히 힘들다. 왓슨의 결과를 의사가 선호하느냐, 아니냐만 묻지 의사가 치료한 것과 왓슨이 시키는 대로 치료한 걸 비교해야 하는데, 이를 비교한 곳이 없다. 왓슨의 문제인 건지, 의사의 선호도 문제인 건지가 사실 남게 되는 거다. 그런 문제들 때문에 왓슨 포 온콜로지가 좌초됐지만 시도가 나빴다고 생각하지 않는다. AI에 대한 기대가 현실적으로 바뀌어 나가야 한다고 생각한다. AI에 대해 너무 기대할 게 아니라 굉장히 기억력 좋은 비서라고 생각하면 좋을 것 같다. AI를 어떻게 활용할지에 대한 의사 결정의 문제도 섞여 있다고 생각한다. 진료를 지원하는 시스템이라면 충분히 좋은 시스템이다. 최선의 진단방법이나 치료방법을 골라주는 게 아니라 한의사가 모두 기억할 수 없는 정보들을 빠르게 찾아 진료에 도움을 주는 정보를 제공해 주는 게 1차 목표고, 2차 목표는 환자 치료 결과들을 모두 학습한 다음 그걸 기반으로 가능성 높은 치료 솔루션을 제공해 주는 것이다.

- 디지털 한의학에 대한 기대가 큰 것 같다. 이 같은 기반이 다져지고 추후 AI 한의사가 개발된다 하더라도 제도적으로 뒷받침 돼야 하는 부분도 필요할 것 같다.

프로토콜이 아무리 좋아도 임상의가 쓰기 불편하면 현실적으로 상용화되기 어렵다. 프로토콜에는 허점이 없는지 사용성 평가를 진행 중이다. 하지만 디지털화된 데이터로 저장하는 과정이 너무 힘들다. 의료계든, 한의계든 결국 디지털라이제이션이 되려면 이 과정에 대한 수가를 책정하는 수밖에 없다.

하지만 수가를 만들기 위해서는 근거가 필요하지 않나. 근거를 만들려면 데이터가 필요하다. 결국 돌고 돈다. 데이터를 모으는 것에 기댈 수밖에 없는 환경이다. 디지털 트랜스포메이션으로 전환하기 위해 정상인 빅데이터를 만들어야 하고, 래퍼런스 대비 현재 환자 상태를 비교할 수 있기 때문에 정상인 빅데이터로 유도하려고 한다. 정상군은 상대적으로 빠르게 모을 수 있다. 그래서 정상군 래퍼런스를 최우선적으로 구축하고, 질환별 환자 데이터는 여유 있게 모으려고 한다. 

- 마지막으로 AI 알고리즘까지 개발돼 임상 현장에서 사용될 때 기대하는 게 있다면.

지금도 의료인들 대상 보수교육 제도가 있지만 사실 잘 돌아가지는 않는다. 정말 소수만 듣지 나머지는 그냥 시간 떼우고 가는 게 현실 아닌가. 모든 사람이 서울대병원 의사와 같은 레벨이 되게 하려는 것은 아니라고 생각한다. 한의사도 마찬가지다. AI 한의사의 중요한 역할은 AI를 통해 낮은 수준의 레벨을 높은 수준으로 올려주는 기술이라고 생각한다. 네비게이션은 택시기사를 따라갈 수 없다. 낮은 수준의 사람을 중간 이상으로 끌어 올리면 갭을 줄여줄 수 있다는 의미다.

저작권자 © 청년의사 무단전재 및 재배포 금지