암 생존자와 치료를 위한 인공지능 학습 언어 모델의 가능성과 위험성

특집기사

홈 -> 특집기사

암 생존자와 치료를 위한 인공지능 학습 언어 모델의 가능성과 위험성

고동탄(bourree@kakao.com)기자2024년 05월 31일 16:22 분입력 총 2217명 방문: AD

자연어 처리(NLP)는 컴퓨터가 인간의 언어를 이해할 수 있도록 하는 인공지능(AI) 분야이다. NLP 방법은 간단한 규칙 기반 시스템부터 통계 모델, 심층 신경망을 기반으로 하는 최신 세대의 기계 학습 모델까지 다양하다. 언어 모델은 인간 언어를 처리하기 위해 방대한 양의 문서에 대해 훈련된 심층 신경망이다. 2018년부터 변환기로 알려진 일종의 신경 아키텍처가 최첨단 NLP 성능을 달성했다. 이전에는 사용할 수 없었던 계산 능력을 사용하여 변환기 기반 언어 모델은 인터넷에 큐레이팅된 증가하는 텍스트 데이터로 훈련되어 ChatGPT와 같이 이전 모델보다 훨씬 더 큰 현재 LLM으로 이어졌다.

이러한 최신 LLM은 생성 AI의 한 유형으로, 새로운 콘텐츠를 생성하는 AI 방법을 의미한다. LLM은 질문 답변(예: 챗봇 유형 애플리케이션), 요약 및 번역과 같은 생성 작업을 수행하는 능력으로 가장 많은 주목을 받았다. LLM은 미국 의료 면허 시험을 통과하고 Reddit에 게시된 의료 질문에 대해 공감적인 답변을 제공 하고 생물 의학 및 임상 전문 용어를 보다 접근하기 쉬운 요약으로 번역할 수 있다. LLM은 결과 예측 및 자동화된 실제 데이터 수집을 위해 텍스트에서 정보 추출과 같은 비생성 작업에도 사용할 수 있다.

전자 건강 기록에서 증상과 부작용을 자동으로 추출하는 방법을 개발하는 데 관한 중요한 NLP 문헌이 있다. 암 생존과 관련된 이전 연구에서는 더 작은 언어 모델을 사용하여 제공자가 보고한 부작용 증상 및 환자가 보고한 결과 특성화를 자동으로 감지했다. 이러한 모델을 개발하려면 역사적으로 특정 부작용이나 증상에 대한 모델을 미세 조정하기 위해 수동으로 레이블이 지정된 대량의 데이터가 필요했다. 이는 비용이 많이 들고 전문 지식이 필요한 작업이었다. 더 나은 성능의 LLM은 이러한 유형의 정보 추출을 위해 훨씬 적은 레이블의 미세 조정 데이터가 필요할 수 있었다. 따라서 우리는 전자 건강 기록 기반 증상 감시를 자동화하는 능력에서 LLM 중심의 발전을 기대해 왔다. 이를 통해 환자의 증상을 더 철저하게 추적할 수 있어 시의적절하고 정확한 관리가 가능해지기 때문에 환자 개인 수준에서 도움이 될 수 있다.

증상 및 부작용의 자동 수집을 통해 더 크고 포괄적인 시판 후 감시 연구가 가능하고, 시험에서 증상 독성을 추적하는 데 필요한 자원이 줄어들며, 위험, 증상 간의 연관성 및 관리 전략을 더 잘 이해할 수 있는 실제 증거를 제공할 수 있다. 그러나 전자 건강 기록에는 증상이 과소 보고되므로 이러한 약속을 실현하려면 환자가 보고한 증상을 더 잘 수집해야 한다. LLM은 이러한 데이터 수집을 향상시킬 수도 있다. 암 증상 관리를 위한 LLM의 새로운 응용 분야는 결과를 예측하는 모델을 개발하는 것이다. 최근 연구에 따르면 임상 문서에 대해 교육 받은 LLM은 병원 내 사망률, 동반 질환 지수, 30일 재입원 및 보험 거부 등을 예측할 수 있는 것으로 나타났다. 증상 위험 예측은 치료의 위험 및 이점에 대한 보다 개별화된 추정치를 제공함으로써 치료 의사결정 및 개인화된 모니터링 일정을 지원할 수 있다. 임상 텍스트 정보를 영상, 구조화된 데이터, 환자가 보고한 결과, 환자가 생성한 건강 데이터 등 다른 유형의 건강 데이터와 결합하는 다중 모드 모델은 유망한 활성 연구 분야가 되었다.

LLM은 암 결과를 개선하는 데 필수적인 환자 중심의 원격 지원 치료, 증상 관리 및 데이터 수집을 가능하게 하는 데 가장 혁신적일 수 있다. 일부 연구는 증상 모니터링 및 관리를 위한 디지털 건강 솔루션에서 삶의 질과 생존 혜택이 입증되었지만, 결과는 연구 및 특정 결과에 따라 다르다는 점이다. 디지털 건강 솔루션과 AI를 통합한 연구는 교육, 행동 변화, 증상 관리, 특히 통증, 불안 및 우울증에 광범위하게 초점을 맞춰 왔다. 환자들은 이러한 기술을 사용할 때 의료 서비스 제공자와의 향상된 권한 부여 및 의사소통과 실시간 증상 모니터링을 보고한다. LLM은 최신 지침과 환자가 보고한 결과의 사전 수집을 기반으로 개인화된 상호 작용을 촉진할 수 있다. 증상 수집을 위한 챗봇과 비교하여, 환자의 자가 관리 및 분류를 돕는 챗봇은 관리에 직접적인 영향을 미치기 때문에 위해 위험이 크지만, 잠재적으로 의료 이용률을 감소시키고 환자가 긴급 치료를 피하도록 도울 수 있다. 개선을 위한 주요 기회에는 환자 관련 결과를 측정하기 위한 통일된 표준, 연구 전반에 걸친 일관된 연구 방법, 통합된 환자 및 임상의 참여가 포함된다. 증상 관리 및 유용성 측면에서 LLM의 효과를 보여주기 위해서는 잘 설계된 연구가 여전히 필요한 실정이다.

요약 및 번역을 위해 언어를 변환하는 LLM의 고유한 강점은 환자 중심의 디지털 건강을 자동화, 확장 및 개인화하기 위한 기반을 만든다. 전문가조차 관리하기 어려운 길고 전문 용어가 가득한 지침을 요약하고 단순화하는 방법은 환자 교육을 위한 중요한 진전이 될 수 있으며 환자 선호도와 배경에 맞게 맞춤화할 수 있다. 임상 방문의 자동화된 LLM 요약은 잠재적으로 다양한 임상 전문 분야, 환자와 가족 간의 의사소통에 대한 오랜 문제를 개선할 수 있다. 하지만 이 분야의 비약적인 발전을 위해서는 데이터 사일로(정보 격리)를 극복해야 한다. LLM은 기계 번역에 탁월하며 이는 접근성 향상에 대한 명확한 의미를 갖는다. LLM 및 유사한 모델은 다양한 데이터 유형을 처리하기 위해 발전하고 있으며, 각 환자가 선호하는 콘텐츠 소비 방식(예: 서면, 비디오, 오디오, 인포그래픽)에 따라 콘텐츠를 더욱 개인화할 수 있는 방법을 제공한다. 마찬가지로, 환자 및 임상의를 대면하는 LLM은 각 환자의 병력 맥락에서 새로운 증거, 지침 및 관리 전략을 탐색함으로써 교육을 개선할 수 있다. 이러한 모든 것은 끊임없이 진화하는 복잡한 암 치료 환경에서 점점 더 중요해지고 있다.

그러나 암 분야에 있어서 LLM의 발전은 피해가 효과적으로 연구되고 완화되는 경우에만 실현될 것이다. 암 증상 관리를 위한 효과적인 배치를 위해서는 몇 가지 기술적, 임상적, 구조적, 윤리적 문제를 해결해야 한다. 가장 중요한 것은 환자와 간병인이 LLM 거버넌스에 기여하여 윤리적이고 지속 가능한 개발 및 구현을 우선시해야 한다는 점이다. 특히 AI 대화에서는 환자의 목소리가 상당 부분 제외됐다. 환자는 신체적, 정서적, 재정적 피해를 포함하여 실제 안전 위험을 경험할 수 있다. 모델을 개발하고 개선하는 데 필요한 것은 환자의 데이터이고 이러한 애플리케이션으로 인해 환자의 건강 관리 및 개인 정보 보호가 가장 위험하므로 이는 특히 우려되는 점이다. The Light Collective과 같은 환자 주도 옹호 단체는 환자 중심의 기술 거버넌스가 운영될 수 있는 방법을 모색하고 있다. 이해관계자와의 협력을 통해 이행을 안내하고 보호하기 위해서는 국가 및 정부 기관의 더 많은 규제 감독이 필요하다.

환자는 자신의 치료에 LLM을 통합하는 방법과 그에 대한 여부, 모델 개발에 자신의 건강 데이터와 공공 데이터를 사용하는 방법에 대한 기본적인 의견을 제공해야 한다. 이 때 투명성이 가장 중요하다. 환자와 일반 대중은 디지털 데이터가 어떻게 사용되는지 알아야 한다. 특히 인간 상호 작용을 모방하는 LLM의 고유한 능력을 고려할 때 AI와 상호 작용할 때 사용자에게 이를 명확하게 설명하고 적절한 사전 동의를 얻어야 한다. 환자와 간병인은 이 기술을 배우고 사용하는 데 있어 다양한 수준의 관심과 적성을 갖게 된다. 새로운 발전은 LLM 지원 디지털 건강을 거부할 수 있는 옵션을 포함하여 환자가 치료에 참여하는 방법을 대체하는 것이 아니라 확장하고 통합해야 한다. 환자는 이미 치료 중에 다양한 애플리케이션과 환자 포털 시스템을 관리하고 접근해야 한다. 새로운 디지털 건강 기술은 시스템을 단순화해야 하며 이미 부담스러운 디지털 환경에 또 다른 복잡성을 추가해서는 안된다. 몇몇 연구에서는 조난을 모니터링하기 위한 AI 플랫폼 사용을 포함하여 이러한 발전의 전반적인 수용 가능성에 대한 중요한 질문을 던지기 시작했다.

또한 환자 참여를 위해서는 환자가 계속해서 증가하는 암 비용에 직면하는 동안 개발자와 기관의 재정적 이익을 위해 건강 데이터가 악용되지 않도록 목표를 조정해야 한다. 악의적인 사용과 환자의 요구 및 복지에 부합하지 않는 사용을 예상해야 한다. 예를 들어, 적절한 보호가 이루어지지 않는 경우 비용을 지불하는 사람 및 기타 당사자가 예측 모델을 사용하여 특정 집단에 대한 치료 접근을 제한할 수 있다. 효과적인 임상 번역을 위해서는 기술적 문제도 해결해야 한다. 한 가지 문제는 많은 LLM이 실제로 정확한 답변이 아닌 인간이 듣고 싶어하는 답변을 제공하도록 훈련되었다는 사실에서 발생한다. 이는 일상적인 상호 작용에는 괜찮을 수 있지만 의료 서비스에는 위험할 수 있다. 특히 LLM이 매우 설득력 있게 들릴 수 있기 때문입니다. 새로운 증거에 따르면 AI 챗봇은 표면적으로는 합리적으로 보이는 암 치료 정보를 제공하지만, 임상 표준과 비교할 때 결과는 수준 이하이다. 지침이 발전함에 따라 LLM을 업데이트하는 방법은 공개된 질문이며 전문 학회, 연구원 및 AI 개발자 간의 긴밀한 협력이 필요하다. LLM은 응답하라는 메시지가 표시되는 방식에 민감할 수 있으며, 질문 문구의 작은 변화로 인해 크게 다른 응답이 나올 수 있다. 생성 LLM에서 일관되고 사실적으로 정확한 정보를 얻는 방법은 연구 공백이다. 추가적인 감독 없이 기술이 안전하고 효과적이라는 임상적 증거가 나올 때까지 인간 참여형(Human-In-The-Loop)을 유지하는 것은 중요한 안전 점검이 될 것이다.

임상 번역이 진행됨에 따라 모든 이해관계자는 평가를 설계하기 위해 협력해야 한다. 중요한 것은 출력을 평가하기 위한 새로운 표준이 필요하다는 점이다. 생성 텍스트에 대해 계산된 지표는 임상적 수용 가능성 기준을 충족하지 않으며 환자 중심 결과 및 사용자 선호도는 우리가 평가하는 표준으로 유지되어야 한다. 암 생존율에 대한 벤치마크 임상 데이터 세트는 없으며 번역 시 최선의 방법이 우선시되도록 긴급히 확보해야 한다. 또한 시간이 지남에 따라 성능 드리프트가 불가피하다는 점을 고려하여 이러한 모델에 대해 종단적 성능 및 유용성 모니터링을 위한 국가 및 기관 규제 지침을 수행해야 한다. LLM은 자기 관리 및 환자 교육 자원을 널리 제공하여 암 치료를 민주화할 수 있지만 암 불평등과 편견을 증폭시킬 수도 있다. 모든 AI와 마찬가지로 LLM은 교육받은 데이터에 존재하는 편견, 인종차별 등을 학습한다. 예를 들어, LLM은 환자 모집단 전반에 걸쳐 이전에 학습된 치료 분포, 모니터링 및 관리 관행을 기반으로 차별적인 권장 사항을 제공함으로써 지속적인 불평등을 공고화할 수 있다. 또한 기술은 동등하게 접근할 수 있지 않으며 컴퓨터, 광대역 인터넷 또는 셀룰러 서비스를 사용할 수 있는 접근 및 능력이 필요한 경우가 많다. LLM 기술에 대한 투자는 이를 가장 필요로 하는 사람들을 위한 접근성에 대한 투자와 균형이 이루어져야 한다.

암 생존 및 지원 치료는 환자 중심의 의사소통 및 교육을 기반으로 하며, LLM이 해당 분야를 발전시키는 데 도움이 되도록 자리 잡고 있다. 환자, 임상의, 개발자는 개발부터 배포까지의 전체 과정에서 각각 역할을 수행해야 한다. 시스템은 가장 쉽게 이용할 수 있는 데이터가 아닌 암 환자의 요구 사항을 중심으로 설계되어야 하며 임상의와 개발자는 이러한 요구 사항에 맞는 노력을 정의하고 우선순위를 지정하기 위해 광범위하고 다양한 목소리를 포함하여 환자와 협력하고 지속적으로 접촉해야 한다. 개발자는 다운스트림 성능과 위험에 영향을 미치는 데이터 및 모델 설계 결정을 안내하는 데 도움을 줄 수 있으며, 임상의와 환자는 데이터 가용성, 허용 가능한 성능 임계값 및 절충, 적절한 평가에 대한 통찰력을 제공해야 한다. 모든 이해관계자는 LLM을 관리하는 구조를 공동으로 만드는 데 기여할 수 있는 중요한 경험과 전문 지식을 갖추어야 한다.

평가, 안전 및 윤리에 대한 높은 기준을 준수하면 의료 오류로 이어지는 초기 실수와 LLM에 대한 환자 및 임상의의 신뢰 상실을 방지하는 데 도움이 된다. 이제는 전체적이고 공평한 치료를 제공하기 위해 AI 접근 방식의 증거 기반 통합을 통해 강화된 맞춤형 지지 치료 및 증상 관리의 미래를 구상하면서 모든 이해관계자를 하나로 모을 때이다.

참조:
journal of clinical onclolgy

뒤로월간암 2024년 4월호