ChatGPT能代替医生看病吗
ChatGPT
能代替医生看病吗
我们给它做了套中国执业医师考试真题
猜猜它考了多少分
最近,ChatGPT的横空出世,也引发医疗界人士广泛思考——人工智能将对医疗领域带来多大的冲击,未来医生会失业吗?
浙大儿院NICU副主任马晓路发朋友圈称:以前吧,觉得会被人工智能取代的,都是那些单调机械重复的体力活。但看到人工智能写的小作文比你好,画的画比你好,回答问题比砖家靠谱得多,确实会令人恐慌。
医生们的危机感不无道理。有消息称,OpenAI公司的程序员已经开始利用高版本ChatGPT对日常疾病进行问诊,并根据ChatGPT给出的处方进行康复治疗,并取得了良好的反馈。还有一篇预印本的论文表示,ChatGPT在美国医师执照考试(USMLE)中达到了平均水平以上,准确率达到了60%左右。
记者不禁好奇,如果让ChatGPT参加中国的执业医师考试,它能考多少分呢?
浙大一院精神卫生科主任胡少华教授团队正在参与一项人工智能相关的医学研究,团队希望未来借助AI监测眼球活动、皮肤电势反应等客观数据,辅助临床医生诊断。
于是我们和团队成员吕海龙一起,设计了一套百分制的执业医师考试卷子,ChatGPT的最终成绩是57分,其中基础得分56分,临床得分58分。
考卷设置
十大科目
涵盖基础题和专业实践题
由于ChatGPT是依据2021年以前的数据训练的,所以题目选自2020年临床执业医师资格考试真题库,全部为单选题。
吕海龙介绍,临床执业医师考试内容笔试考试主要包含基础综合、专业综合和实践综合,我们的题目简化为两类,一类是基础题,大都是可背诵的医学知识;另一类是专业实践题,需要进行逻辑推理。
考卷涵盖了十大科目,包括生理学、医学微生物学、病理学、药理学、卫生法规、内科、外科、妇产科、儿科和心理学-精神科,每个单元10题,合计100题,选择方法尽可能随机。
成绩分析
掌握基本诊断推理
但不擅长修正和推测
在我们的猜想中,ChatGPT应该更擅长可背诵的医学知识,逻辑推理能力则较弱,但实践结果并非如此。
吕海龙发现,对于那种一看就是考题的题干,ChatGPT有时候会直接给出一个没有解释的错误选项,不排除它从中文网站复制了错误的答案;而那种条件充足、逻辑清晰的推理题,它通常情况都能答对。
不过,当信息不全或者症状不典型时,它的诊断会出现错误,不善于根据实际情况修正诊断,“比如内科病例题,它不善于在信息不全的情况下做推理,例如由几个模糊的主诉/症状来寻找乏力的可能原因,所以推测ChatGPT在面对患者时如果得不到足够多的信息它可能会不知所措,完全无法给出下一步的诊疗建议,它不会‘猜’。”
ChatGPT对精神病学的知识也比较了解,能根据症状诊断抑郁症、焦虑症等,但是对于精神药物知识掌握不佳,例如会推荐精神分裂症的患者服用抗抑郁药,来治疗主要症状。
“如果有两种同类型的药可以选择时(例如该用利培酮还是氯丙嗪来治疗精神分裂症),它不会帮你做选择,而是严谨地提议根据医生的建议选择,可能自愧不如人类。而关于这两个药的选择,现在已有超多的研究证据证明利培酮的安全性优于氯丙嗪。ChatGPT给其他疾病选择药物时也常常选错,它的药理学考试也没有及格。”
ChatGPT喜欢做妇产科医生,它会给出很多理由来支持它的选择,虽然有时候选择是错的。
另外,ChatGPT对于中国的医疗相关法律法规不够了解,这可能会给它在实践中招来一些麻烦。
考试结果
差点及格
儿科和心理科最好,内科最差
钱报记者在提问过程中发现,针对不同题目,ChatGPT的回答速度不同。有些题是秒回,有些题需要更长时间“思考”,平均每题要花半分钟左右。
ChatGPT对中文的理解完全没问题,有时会直接给出答案,有时给出一串相关知识,或者推理分析的过程。
提问进行到1小时时,系统提示“1小时内的问题太多了,请稍后再试”。看来,人工智能也是会累的嘛!(当然,也可能是这段时间访问量实在太大,系统无法承载。)
最后经过统计,ChatGPT的正确率分别为:生理学40%、医学微生物学70%、病理学70%、药理学50%、卫生法规50%、内科30%、外科60%、妇产科60%、儿科70%,心理学-精神科70%,总分57分,差3分达到及格。
未来期待
辅助医生工作
引导前沿医学研究
对ChatGPT交出的答卷,吕海龙表示既有惊喜,也有很大不足。就现阶段技术水平来说,他希望医疗方向的AI产品能变成医学知识库,起码在识记类的题目上不能出错,必须100%正确,给出答案时最好标记出处,是引自某个教科书,还是引自网络信息。
而对于医疗方向AI产品的未来,胡少华教授则有着更为积极的展望:“医生把自己的知识经验传给它,医生不在病房时,病人可以直接去问这个机器,输出声音变成人的声音,并且最好它还能向患者提问。同时,AI在医学研究领域也可以大有作为,做研究的前沿导向者,随时给出新的医学诊断技术、治疗方法的发现。”
胡少华说,有关人工智能的对话,还在不断地完善当中。如今 AI 在识别、记忆、计算、逻辑思维、推理判断等方面已经可以达到甚至超越人脑,但还没有触及到智力的起点,即认知。只要AI还无法模拟人类的认知,它就不会全面超越人类,也就无法取代包括医生在内的诸多岗位,但在针对患者提供个性化的诊疗上,它却能够扮演重要角色——成为医生们最得力的智能助手。
本报记者 张冰清 通讯员 王蕊 江晨
-
上一篇
-
下一篇
相关推荐
中新健康周报|医疗领域全国共立案5.2万人;海尔生物并购上海莱士
中新健康 | 首儿所通州院区主体结构封顶 预计2027年投入使用
中新健康|北大医疗今年前三季度收入约39.3亿元 预计年内实现盈亏平衡
医保统筹支付、个人自付、个人自费分不清?看完你就明白了!
东北铁栏杆是甜的?打出溜滑也能受重伤?这些操作轻易别尝试
专访哈佛大学刘军:AI医疗是人类医生的助手而非对手
在冬季如何防滑?不慎跌倒,如何正确处理?
好医生集团董事长耿福能:守正创新,促进中医药产业高质量发展
为什么有些食物让我们心情愉悦
“碎片化睡眠法”危害大不宜效仿
木薯糖水爆火,有人为啥喝“中毒”了
厚底雪地靴易摔伤或致筋膜炎 提醒:80%的人鞋都选错了
- 最近发表
-
- 随机阅读
-
- 拓宽普惠金融服务边界 招行力量撬动“小企业”实现“大发展”
- “1米好物”激发中国年轻消费者分享欲
- 文明之美看东方|从古城到最早水利,走近五千年良渚
- 台湾苗栗县青工总会一行参访武汉交流青年工作
- 上海专家成功为男子摘除直径35厘米、重达11斤的肝脏特大血管瘤
- “碳”路先行|中国工业大市山西临汾:推动传统产业向“绿”而行
- 2023当代青绿山水画学术邀请展亮相苏州
- 山西安泽县永鑫通海铁路物流公司施工事故导致7人遇难
- 中央音乐学院探索人工智能技术与脑科学在音乐领域的应用
- 宁夏银川出台新规:若放弃民办初中“摇号”录取 中考不享受“指标到校”政策
- 2024澜湄国际影像周中外嘉宾初体验:博物致知 感受江源玉树
- 新疆葫芦画艺人:手绘新生活为家乡添“彩”
- 中国动画电影“组团”亮相2024年多伦多国际电影节
- 10月北京楼市量价齐增 二手房网签创19个月新高
- 你听说过“伏羲农场”吗?这种小农场里可藏着大智慧
- 工业题材作品火热“出圈”
- 福建省森林消防总队2024年“火焰蓝”灭火专业实战技能比武在榕开幕
- 行进中的经典 北京人艺《雷雨》再上演
- 李白诗中的皖南桃花潭:上演龙舟水上竞逐盛宴
- 推动高质量发展·权威发布|甘肃:全省脱贫地区农村居民人均可支配收入年均增长8.9%
- 热门推荐
-
- 童年游戏“躲猫猫”成中国年轻人“社交新宠”
- “Z世代”女教师驻守乡村:为了11个孩子
- 厦门佛事用品春季展荟萃佛事用品全产业精品
- 2023年西藏各机场旅客吞吐量689.7万人次 突破历史最高纪录
- 中国石油广东石化实现油品直接在产品码头装船出口
- 聚焦基础教育变革之道 清华附中举办建校109周年学术年会
- 昔日“步行街之王”又双叒“卖房”了
- 长江保护修复各项工作取得积极成效 下一步将开展长江流域水生态考核试点
- 山西电力全力应对雨雪冰冻天气
- 2024“熊猫杯”韩国青年感知中国征文大赛启动仪式在首尔举行
- 美国19名共和党议员联合致信拜登:停止对乌援助!
- 暴雨黄色预警继续发布:河北山东等地部分地区有大暴雨
- 报告:2026年中国临期食品市场规模或达471亿元
- 脱下工装换上红妆 288对新人在合肥骆岗公园举行集体婚礼
- 西安海关出台优化营商环境28条措施
- 玉屏箫笛:本是寻常竹一根 巧雕百调走世界
- 沿黄流域千余名戏曲人才将齐聚山东 展示戏曲剧种特色风采
- 中国古茶树超5624万株 97%分布于云南
- 今年中国民航暑运延续旺季趋势 日均运输旅客228.6万人次
- 东北近现代建筑遗产保护修缮研究联盟在长春成立