大数据疫情峰值预测靠谱吗
“互联网+医疗”大数据可以为防疫提供参考吗?近日,随着疫情防控措施持续优化,关于各地疫情峰值的大V模型、小程序预测等也引发了网友的讨论。如在微信小程序中,可查看各大城市疫情高峰时间进度条,直接具体到高峰期的开始和结束日。
专家分析认为这种从统计学角度做流行病的预测和观察所得出的宏观趋势,有一定的参考价值,但精准到某天开始、某天结束的数据准确性有待商榷且价值不大。同时,这两种模型都将百度这一搜索引擎的搜索数据用作数据源,存在一定缺陷。
预测精准到“天数”
北京商报记者检索发现,互联网上的疫情峰值预测来源主要有2个:其一是一位大V建模,其二是微信小程序数据团+。
大V建模方面,经济学家、某平台百万粉丝大V陈沁用公开的百度指数和一套成熟的数学模型做了疫情峰值预测。他预测北京本轮疫情感染已经到达峰值,一直到1月上旬,会不断趋好。
公开资料显示,陈沁毕业于复旦大学经济系,曾任教于复旦大学经济学院,现任BBD Index首席经济学家。曾在China Economic Review、《经济研究》《经济学季刊》《金融研究》等权威期刊发表过诸多论文。
微信小程序数据团+,则由一家致力于大数据和人工智能领域的科技公司——上海脉策数据科技有限公司提供技术支持,在小程序上选择想要查询的城市,便可以显示所预测的该城市“疫达峰”可视化进度图表,如小程序显示北京第一波高峰到达日为12月16日,第一波高峰结束日为1月13日。
这两种疫情峰值测算都有其背后的原理。
根据陈沁公开的信息,他是借鉴了已经比较成熟的数学模型,用百度指数去测算疫情情况,“总体来说就是看超额搜索指数的覆盖面积,当覆盖面积达到一定阈值后就代表人口感染达到一定阈值,感染自然达峰、结束”。
微信小程序数据团+的原理类似,使用的是百度搜索指数和巨量算数数据进行计算。
北京商报记者注意到,这两种预测模式都将百度搜索指数纳入了数据源之中,但这种依赖搜索引擎数据的模型科学吗?
数据源存问题
北京商报记者将各地官方已经公布的疫情高峰预估时间和微信小程序预测的时间进行了对比。
如江西省政府新闻办在12月15日召开的江西省新冠肺炎疫情防控工作新闻发布会指出,据专家分析研判,江西省下一波疫情高峰将在今年12月底、明年1月初到来,2023年春节前后达到峰值。仅可选择城市的小程序中查询的结果则显示,南昌市第一波高峰峰值在12月21日,在2023年1月8日结束高峰期。
对此,一位统计学领域的专业人士周鸿(化名)向北京商报记者分析表示,一方面,从统计学角度做流行病的预测和观察,所得出的宏观趋势有一定的参考价值,但精准到某天开始、某天结束的数据准确性有待商榷且价值不大;另一方面,这两种模型都将百度这一搜索引擎的搜索数据用作数据源,在数据源上便存在一定问题。
“百度引擎的搜索频次总体上有一定价值,但跟实际结合后可能存在一些差异。”周鸿解释道,首先在移动互联网时代,大众的搜索渠道众多,百度搜索只是其中之一,甚至还有很大数量的人群并不会使用智能手机进行检索;其次,公共卫生事件所受到的影响因素非常多,比如某个地区突然出台了防疫相关的政策变动,会导致短期内该地区对相关话题的搜索量大幅上升。综合来看,将百度引擎作为数据源之一,并不能完全反映现实情况。
如何才能使模型更科学?周鸿建议,将国家卫健委公布的每日阳性人数和进行一定规模问卷调查得出的感染情况作为数据源之一,反而更能准确地反映出某个城市疫情发展趋势的变化。
回归到本次模型预测的价值本身,北京社科院研究员、中国人民大学智能社会治理研究中心研究员王鹏认为,就模型所测的月份上的峰值,在宏观角度上可以为线下防疫提供参考。“一方面各地通过感染情况,提前做好医疗资源、物资储备、人员调度等,也为市民日常生活防护进行一定的提醒;另一方面,这种模型对全国各地‘疫情峰值’进度都有一定预测,为全国一盘棋、疫情发展阶段不同的地区合作调配资源等提供了参考。”
“医疗大数据”尚有局限性
事实上,运用统计学的专业知识进行大数据分析、预测的案例并不少见。国家统计局每个月发布的宏观经济数据如全国CPI(居民消费价格指数)和PPI(工业生产者出厂价格指数)等,便是在对相关主体进行抽样调查的基础上进行的。另外,相关机构通过对人口基数和增速进行统计后,对人口规模的预测也属于统计学的应用。
而此次“疫达峰”所属的医疗卫生领域,则是统计学大数据适用的一个相对特殊的领域。
周鸿介绍了国外“医疗大数据”的一个典型案例——谷歌流感趋势(GFT)。谷歌公司发现,每年大约有9000万美国居民使用互联网来查询与自身相关的疾病、药物或者医院信息,而关于流行性感冒的搜索量可以及时地反映当时流感的现状;因此,他们使用互联网搜索记录来即时预测美国疾控中心延迟发布的疑似流感病例占比。该研究利用2003-2007年这五年的流感数据做模型,其推论在2008年的测试数据中得到很好验证,之后很长一段时间的流感预测结果也与实际情况非常一致。
但四年以后,《自然杂志消息》报道,在最近的一次流行感冒爆发中谷歌利用大数据流感趋势预测失效了,这一次谷歌的大数据预测模型显示流感爆发非常严重,然而疾控中心在慢慢汇总各地统计的流感数据以后,发现谷歌的预测结果远远超过了实际情况。
对于这种统计学大数据在医疗领域的适用性,中南大学硕士研究生刘琛发表在《临床医学研究与实践》期刊上的《从谷歌流感趋势(GFT)案例分析“医疗大数据”的局限性》一文中得出结论指出,医学本质是一门经验科学,大数据是人类迈向数据时代的工具,大数据分析为许多医学难题的解决提供了新途径,改变了一些疾病诊断方式,另一方面也为科研教学提供了有力的数据支撑。
“但就现状而言,大部分大数据分析技术(如nosql)还难以在医疗领域被重用,只有通过大数据方面的技术研究,不断地改进大数据在临床医学应用中的缺陷,才能更好、更准确地为患者服务。”刘琛说。
北京商报记者 方彬楠 陆珊珊
-
上一篇
-
下一篇
相关推荐
中新健康周报|医疗领域全国共立案5.2万人;海尔生物并购上海莱士
中新健康 | 首儿所通州院区主体结构封顶 预计2027年投入使用
中新健康|北大医疗今年前三季度收入约39.3亿元 预计年内实现盈亏平衡
医保统筹支付、个人自付、个人自费分不清?看完你就明白了!
东北铁栏杆是甜的?打出溜滑也能受重伤?这些操作轻易别尝试
专访哈佛大学刘军:AI医疗是人类医生的助手而非对手
在冬季如何防滑?不慎跌倒,如何正确处理?
好医生集团董事长耿福能:守正创新,促进中医药产业高质量发展
为什么有些食物让我们心情愉悦
“碎片化睡眠法”危害大不宜效仿
木薯糖水爆火,有人为啥喝“中毒”了
厚底雪地靴易摔伤或致筋膜炎 提醒:80%的人鞋都选错了
- 最近发表
-
- 随机阅读
-
- 新化山歌:梅山文化的百科全书
- 关机不断电,电表也会走!须防待机能耗浪费
- 江南华南将有较强降雨过程 北方地区将有大风降温和沙尘天气
- 焦点访谈:火热的暑期 新玩法激发新活力
- 世界艾滋病日主题宣传活动暨第三届校园情景剧推优揭晓仪式在京举办
- 山西晋城:逐梦田园织锦绣 广袤沃野谱新篇
- 平遥国际电影展“山西元素”愈加醒目 助推山西影视蓬勃发展
- 蒂森克虏伯首席执行官米格尔·洛佩兹:绿色转型不是一种选择而是必然的、必须的决定
- 颜宁邀约全球专家:打造生物医药的东方大湾区
- 和解以来首次!沙特王储与伊朗总统举行会谈
- 规范研学市场 给孩子们一个“边游边学”的研学之旅
- 促旅游业发展 新疆推出近千项文旅活动
- 5月CPI总体平稳 物价保持基本稳定有坚实基础
- 强降雨致英国多地交通中断
- 两大千亿船企拟合并 A股船舶股周二走强
- 原创音乐剧《四两青春》全国巡演启动
- 首列甘肃酒泉(敦煌)铁海国际联运班列成功开行
- 80多部影片陆续定档,暑期档推动电影市场回暖
- 西湖踏青时,你可曾留意过它们
- 以岭药业4款创新专利中药在尼日利亚获批注册
- 热门推荐
-
- 调查:2023年我国成年国民人均纸质图书阅读量4.75本
- 山东提升民众看病就医体验 打通基层医疗服务“最后一公里”
- 持续企稳回升!上半年我国冷链物流总额3.1万亿元 同比增长3.7%
- 俄批美所谓“民主峰会”是推行“新殖民主义”
- 报告显示:2023年暑期年轻群体回归演出市场占比持平2019年
- 又一国与乌克兰达成安全协议 泽连斯基:最紧迫的问题是……
- 食品中随意添加金箔存在安全隐患 向“镀金”食品亮剑
- 黄山武夷山摄影联展:用镜头书写双世遗名山的秀美传奇
- 美国一非洲裔空军士兵遭警察枪杀 家人寻求正义
- 外媒:阿根廷和厄瓜多尔就恢复大使级外交关系达共识
- 国际食品价格指数大幅下降
- 韩国多名专家发声:国际原子能机构评估报告缺乏科学性 反对核污水排海
- (新春走基层)红色旅游春节长假升温 历史记忆焕新吸引“Z世代”
- 新冠病毒不断变异 现有的核酸检测手段是否依然有效?专家解答
- 香港大学教授李成:人工智能深刻地改变了一切,除了人们的思考方式
- 百事公司与中石化新星北京公司签下进博会首张“绿色订单” 引领行业新能源转型
- 浙江将部署实施新能源汽车三电回收利用重大攻关任务
- 以岭药业2023半年报:上半年营收67.91亿元 同比增长22%
- 湖南桃江“粮二代”结成种田“搭子”备春耕
- 走进中国计量院:计量给我们的生活带来了什么?