谷歌发布最新人工智能模型Gemini 声称性能超越GPT-4和人类专家
科技日报北京12月7日电 (记者张梦然)谷歌公司6日宣布推出一种名为Gemini的新人工智能模型,声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。
Gemini已针对不同的应用创建了3个版本,分别是Nano、Pro和Ultra。谷歌拒绝回答有关Pro和Ultra的规模、它们包含的参数数量、训练数据的规模或来源等问题。
其最小版本Nano旨在在智能手机上运行,实际上有两种模型:一种用于速度较慢的手机,拥有18亿个参数;另一种用于功能更强大的手机,拥有32.5亿个参数。
谷歌声称,Gemini的中档Pro版本击败了其他一些模型,但更强大的Ultra超过了所有现有AI模型的能力。它在行业标准MMLU基准上的得分为90%,而“专家级”的人类预计能达到89.8%。
这是人工智能首次在测试中击败人类,也是现有模型中得分最高的。该测试涉及一系列棘手的问题,包括逻辑谬误、日常道德问题、医疗问题、经济和地理。
在同一测试中,GPT-4的得分为87%,LLAMA-2的得分为68%,Anthropic Claude 2的得分为78.5%。Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。
去年,谷歌“深度思维”发布的AlphaCode可击败50%的人类开发人员,而新发布的Gemini声称可击败85%的人类编程师。
谷歌“深度思维”的艾力·柯林斯表示,Gemini“几乎在每个领域都是最先进的”。
【总编辑圈点】
Gemini目前没有可供测试的版本,但谷歌却演示了它两种很“实际”的功能——解决家庭作业问题、处理实时视频能力。这不禁让“特定人群”惊呼:我现在就需要它!而对业内人士来说,这个AI更值得注意之处,是它不仅能力最强,还最通用,这意味着其可以适应各种任务。与当前许多专注于文本的模型不同,Gemini接受过文本、图像和声音方面的综合训练,能接受所有这些格式的输入然后再输出,甚至,它还比所有“前辈”模型们更擅长搞开发。
-
上一篇
-
下一篇
相关推荐
- 最近发表
-
- 随机阅读
-
- 海南推出住房公积金贷款购房“一件事”模式 提升贷款办理效率
- 云南德宏:警民联手救助野生豹猫幼崽
- 2023年“潇湘杯”工业设计大赛在长沙颁奖
- 安理会未能通过叙利亚跨境人道救援授权延期决议草案
- 阿富汗临时政府外交部附近发生爆炸
- 安徽合肥:逾百所全球知名高校青年才俊开启云端之约
- 蓝天救援队土耳其前方队员:连夜转战万人失联重灾区,争取营救更多人
- 保健品“坑老”现象调查:“一眼假”为何老年人深信
- 广西桂林多措并举 助力加快打造世界级旅游城市
- 广州国际汽车零部件展面积增长逾四成 吸引众多境外买家
- 拜登政府将把古巴从“支恐”名单中移除
- 青年与乡村双向奔赴:“90后”回乡当起“运营商”
- 庆祝中华人民共和国成立75周年音乐会今晚播出
- 老香户传承“密布跳”技艺 蒙古香香飘四海
- 强化分红回报股东 持续提升市场吸引力
- 摆拍“保安徒手接坠楼婴儿”:借善的名义走向善的反面
- 美媒:推动美国与以色列关系“正常化”的时候到了
- 1至7月全国铁路完成固定资产投资4102亿元 同比增长10.5%
- 商务部:将推动汽车、家电等以旧换新
- (乡村行·看振兴)山东盐碱地破“碱”重生 “开花结果”助农增收
- 热门推荐
-
- (铸牢共同体 中华一家亲)新疆这个百年巴扎,为何成了“超级牛市”?
- 杭州发现真菌新物种半圆形胶孔菌
- 中科院院士、固体火箭技术领域杰出专家邢球痕逝世,享年95岁
- 最热黄金周折射旅行观念变化
- 黄金市场迎来节前销售旺季 小克重新款式受追捧
- 希腊两列火车相撞已致32死85伤 伤亡或进一步上升
- 杭州:龙凤造型航模生意火 订单排至春节后
- 广州化妆品产业产值突破千亿元
- 西藏“让文物活起来”系列活动丰富群众“五一”假期生活
- 悲剧!美国得州3岁女孩家中意外开枪打死4岁姐姐
- (第七届进博会)上海交易团大型零售采购商联盟集中采购签约
- 巴布亚新几内亚山体滑坡遇难者已超2000人
- 两元就能P不雅照 警惕AI黑色产业链批量“造黄谣”
- 日本新生儿首次跌破80万,岸田急了!
- “羊了个羊”刷屏 被指“欺诈时间”?
- 先诊治后缴费,广东多地试行“信用就医”
- 探访江苏丰县高质量发展:全力打造新能源电动车全国产业集聚高地
- 欧洲动力电池为何难产
- 卡塔尔央行宣布加息 上调存款利率25个基点
- 国家发改委:推动大规模设备更新和消费品以旧换新形成闭环