"인공지능, 마음 읽는 능력도 사람 수준 도달"

獨 연구팀 "챗GPT·LLaMA2, 마음 이론 과제서 사람 수준 성능 보여"

 챗GPT(ChatGPT) 같은 거대언어모델(LLM) 인공지능이 일명 '마음 이론'(Theory of Mind)으로 알려진 다른 사람의 마음을 읽는 능력에서도 사람과 비슷하거나 능가하는 수준에 도달했다는 연구 결과가 나왔다.

 독일 함부르크-에펜도르프 대학 메디컬 센터 제임스 스트라찬 박사가 이끄는 국제연구팀은 과학 저널 네이처 인간 행동(Nature Human Behaviour)에서 LLM 모델인 챗GPT와 LLaMA2가 다른 사람의 정신 상태를 추적하는 능력 테스트에서 인간과 유사하거나 능가하는 성능을 보였다고 밝혔다.

 다른 사람의 의도를 파악하는 '인지적 공감'으로도 불리는 마음 이론은 사회적 상호작용의 핵심 요소이며 소통과 공감 경험에 필수적이다.

 예를 들어 무례한 실수 인식하기의 경우 '질이 새집으로 이사해 침실에 새로 산 커튼을 달았을 때 가장 친한 친구 리사가 와서 "그 커튼 끔찍하다. 새 커튼 사면 좋겠다."고 말했다.' 같은 대화 상황을 제시한다.

 이어 ▲ 누군가 하지 말았어야 할 말을 했나? ▲ 하지 말았어야 할 말은 무엇인가? ▲ 대화 상황 이해에 대한 질문 ▲ 리사는 커튼이 새것이라는 것을 알고 있었나? 등과 같은 질문을 한다.

 실험 결과 챗GPT는 간접적 표현, 잘못된 믿음, 잘못된 지시 식별하기 과제에서 사람과 비슷하거나 우수한 성능을 보였지만 LLaMA2는 사람보다는 낮은 수준의 성능을 보인 것으로 나타났다.

 그러나 무례한 실수 인식하기 과제에서는 LLaMA2가 사람을 능가하는 성능을 보였지만 챗GPT는 과제 수행에 어려움을 겪었다.

 무례한 실수 인식하기에서 LLaMA2가 뛰어난 성능을 보인 것은 이런 실수에 진짜 민감해서가 아니라 반응 방식의 편향성 때문으로 추정됐으며, 챗GPT의 저조한 성적은 추론 실패라기보다는 지나치게 보수적인 결론 도출 방식 때문으로 추정됐다.

 연구팀은 LLM이 마음 이론 과제에서 인간과 비슷한 수준의 수행 능력을 보인다고 해서 인간과 유사한 능력을 갖췄다는 의미는 아니며, 또한 LLM이 마음 이론을 가지고 있다는 의미도 아니라고 밝혔다.

 하지만 연구팀은 이 연구 결과가 향후 연구에 중요한 토대가 될 것이라며 다른 연구를 통해 인간과 기계의 상호작용에서 LLM의 정신적 추론 능력이 개인의 인지에 어떤 영향을 미칠 수 있는지 살펴볼 수 있을 것이라고 말했다.

 ◆ 출처 : Nature Human Behaviour, James Strachan et al., 'Testing theory of mind in large language models and humans', https://www.nature.com/articles/s41562-024-01882-z

 


의료.병원,한방

더보기
지역·필수·공공의료 협의체 출범…지역필수의료법 시행준비
보건복지부는 17개 시도, 국립대병원 등 권역책임의료기관이 참여해 지역필수의료현안을 논의하는 공식 협의기구인 '지역·필수·공공의료 추진전략 중앙·지방 협의체'를 출범했다. 지난달 국회를 통과한 지역필수의료법이 시행되는 내년 3월까지 지역필수의료 사업 기획, 하위법령 제정 등 준비해야 할 과제가 집중돼 있어 협의체를 통해 중앙과 지방 간 조율 체계를 가동한다는 계획이다. 지난 17일 이형훈 복지부 제2차관 주재로 열린 제1차 협의체 회의에는 17개 시도 보건국장과 권역책임의료기관 공공부원장 등이 참석했다. 협의체는 앞으로 복지부 주관으로 월 1회 운영하고, 권역 단위 세부 조율을 위한 5극·3특(5개 초광역권·3개 특별자치도) 권역별 협의체도 이달 중 구성해 별도로 운영하기로 했다. 협의체는 내년 3월 11일 지역필수의료법 시행과 함께 중앙 필수의료정책심의위원회, 5대 초광역권 협의회, 17개 시도 필수의료위원회 체계로 전환할 계획이다. 각 시도가 자체 현황에 기반해 사업을 구상하고, 복지부가 제시하는 공통 기본 방향에 따라 지역별 특성에 맞게 투자 비중을 조정하기로 했다. 참석한 지자체 보건국장들은 응급·분만·소아 등 분야별 의료 공백 실태와 지역 특성에 맞

학회.학술.건강

더보기
식약처, 덜 짜고, 덜 달게 먹는 '삼삼한 주간' 운영
식품의약품안전처는 제2회 '삼삼한 데이'를 맞아 오는 25일부터 31일까지 나트륨과 당류를 줄여서 먹는 건강한 식생활 문화가 일상에 정착될 수 있도록 '삼삼한 주간'을 운영한다. '삼삼한 데이'는 '음식 맛이 약간 싱거운 듯하면서도 담백하게 맛있다'는 의미의 '삼삼한(3·3·1)'에서 착안해 매년 3월 31일을 건강한 식생활 실천의 날로 지정한 기념일이다. 이날을 통해 나트륨·당을 줄이고 균형 잡힌 식습관을 확산시켜 비만과 만성질환을 예방하고, 건강한 K-푸드와 올바른 식생활 실천 문화를 확산하려는 목적이다. 올해는 일상 속 삼삼하게 먹는 문화를 보다 널리 확산하기 위해 '삼삼한 주간'으로 확대 운영하고 해당 기간 업계·학계·일반 국민이 참여하는 다채로운 행사를 개최한다. 식약처는 24일 식약처장과 함께하는 '오유경 안심톡톡, 삼삼한 일주일, 평생을 가볍게!' 라이브 방송으로 나트륨·당류 줄이기 비결 등을 공유함으로써 '삼삼한 주간'의 시작을 알린다. 26일에는 나트륨, 당류 등 영양성분을 자율적으로 표시하는 우수 급식시설을 방문해 현장 의견을 청취한다. 28일에는 대한심뇌혈관질환예방학회 춘계 학술대회와 연계하며 29일에는 여의도 한강공원에서 대국민 참여 행

메디칼산업

더보기
삼성바이오에피스, 지투지바이오와 장기지속 비만치료제 개발
삼성에피스홀딩스는 자회사 삼성바이오에피스와 에피스넥스랩이 지투지바이오와 미세구체(microsphere) 기반 약물 전달 기술을 활용한 장기 지속형 비만치료제 개발을 위해 공동 연구 및 라이선스 계약을 체결했다고 최근 밝혔다. 삼성바이오에피스는 해당 파이프라인의 개발·상업화 권리를 도입(license-in)해 제품화를 추진하고, 에피스넥스랩은 지투지바이오와 장기 지속형 약물 전달 기술 플랫폼 구축을 위한 공동 연구를 진행한다. 이를 위해 삼성바이오에피스는 지투지바이오와 장기 지속형 세마글루타이드(semaglutide) 성분 비만치료제를 포함한 후보물질 2종에 대한 독점적 개발권을 갖고 계약금 및 마일스톤을 지급하는 라이선스 계약을, 에피스넥스랩은 장기 약효 지속형 약물전달 기술 플랫폼 구축을 위한 공동 연구개발 계약을 체결했다. 삼성바이오에피스와 지투지바이오는 이후 신약 후보물질을 포함한 3종을 추가로 개발할 수 있는 우선협상권 보유 조건에도 합의했다. 구체적인 계약 금액 및 조건은 공개하지 않았다. 이날 삼성에피스홀딩스는 지투지바이오가 발행하는 200억원 규모의 전환사채(CB)에 투자하는 계약도 체결했다. 삼성에피스홀딩스 김경아 사장은 "이번 계약은 환자 미