谷歌发布最新人工智能模型Gemini 声称性能超越GPT-4和人类专家
科技日报北京12月7日电 (记者张梦然)谷歌公司6日宣布推出一种名为Gemini的新人工智能模型,声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。
Gemini已针对不同的应用创建了3个版本,分别是Nano、Pro和Ultra。谷歌拒绝回答有关Pro和Ultra的规模、它们包含的参数数量、训练数据的规模或来源等问题。
其最小版本Nano旨在在智能手机上运行,实际上有两种模型:一种用于速度较慢的手机,拥有18亿个参数;另一种用于功能更强大的手机,拥有32.5亿个参数。
谷歌声称,Gemini的中档Pro版本击败了其他一些模型,但更强大的Ultra超过了所有现有AI模型的能力。它在行业标准MMLU基准上的得分为90%,而“专家级”的人类预计能达到89.8%。
这是人工智能首次在测试中击败人类,也是现有模型中得分最高的。该测试涉及一系列棘手的问题,包括逻辑谬误、日常道德问题、医疗问题、经济和地理。
在同一测试中,GPT-4的得分为87%,LLAMA-2的得分为68%,Anthropic Claude 2的得分为78.5%。Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。
去年,谷歌“深度思维”发布的AlphaCode可击败50%的人类开发人员,而新发布的Gemini声称可击败85%的人类编程师。
谷歌“深度思维”的艾力·柯林斯表示,Gemini“几乎在每个领域都是最先进的”。
【总编辑圈点】
Gemini目前没有可供测试的版本,但谷歌却演示了它两种很“实际”的功能——解决家庭作业问题、处理实时视频能力。这不禁让“特定人群”惊呼:我现在就需要它!而对业内人士来说,这个AI更值得注意之处,是它不仅能力最强,还最通用,这意味着其可以适应各种任务。与当前许多专注于文本的模型不同,Gemini接受过文本、图像和声音方面的综合训练,能接受所有这些格式的输入然后再输出,甚至,它还比所有“前辈”模型们更擅长搞开发。
-
上一篇
-
下一篇
相关推荐
- 最近发表
-
- 随机阅读
-
- 西藏自治区普兰县3条传统边贸通道恢复通行
- 中国年轻人流行城市漫步 偶遇中寻找“远方”与“宝藏”
- 第二届全国人力资源服务业发展大会将举办 设“会”“展”“赛”“聘”4个板块
- 古特雷斯:加沙地带发生的事情是“一场人性的危机”
- 对话群众文学创作 “一封家书”第八届全民创意写作活动颁奖会举行
- 青海省出台新办法提高救灾物资回收利用率
- 两大原创艺术展亮相广西南宁 中德艺术家共叙文化交融
- 北京鼓励发展24小时药店 全市已有1244家
- 如何上好劳动课?
- 新疆库车友谊路墓群考古发掘出土983组文物完成移交
- 国家发改委:鼓励推动节水、水处理领域设备更新
- 国内首条沙漠砂转化为光伏砂生产线启动试生产
- 四川:佳节临近 博物馆“中秋味”渐浓
- 云南旅游强势复苏 7月实现历史最高最快增长
- 7月中国仓储指数为52.2% 行业持续良好运行态势
- 山林→海洋→舌尖 解锁我国粮食安全的“隐藏菜单”
- 土耳其议会批准芬兰加入北约
- 俄外长:俄仍对乌克兰问题谈判持开放态度
- 中国钢铁业加快超低排放改造 力争2025年80%以上钢铁产能完成改造
- 福建启动防台风Ⅳ级应急响应
- 热门推荐
-
- 出发前必看!暑期出游,应做好哪些准备?如何预防和处理蜱虫叮咬?| 时令节气与健康
- 听中餐主厨讲述:传承创新,让菜品更营养美味
- 匈外长:西方战略对于解决俄乌冲突无效
- 美国非裔记者刊文披露百余封种族仇恨信件 职业生涯“很受伤”
- 宁夏各机场10月27日启动冬航季航班计划
- 沙尘致青海前往新疆方向的道路交通管制 万人滞留
- 美官员:乌军使用美秘密提供的远程导弹袭击俄军目标
- 通讯:中国救援队在土耳其地震灾区守护生的希望
- 聚焦金融助力企业全球化 2023金融街论坛年会首设企业家圆桌会议
- 青海玉树曲麻莱:扩大合作 牦牛产业再上台阶
- 青海农村生活垃圾收集转运处置体系覆盖率达94.8%
- 穆迪调降主权信用评级展望 中国财政部回应:我们感到失望
- 北京将加强古树名木保护 建设一批古树名木公园
- 韩国一地铁站轨道发现昏迷中国籍男子 送医后不治身亡
- 重庆两江新区以“智”提“质”建设“智慧之城”
- 欧洲议会欲借立法“一箭双雕”
- 中部崛起建新局丨为三湘大地注入澎湃金融动能
- 叙利亚危机12周年之际,美众议院否决从叙撤军决议
- “轨道上的长三角”建设跑出加速度
- 珠海斗门供澳活猪过驳站3年“过猪”超19万头