谷歌发布最新人工智能模型Gemini 声称性能超越GPT-4和人类专家
科技日报北京12月7日电 (记者张梦然)谷歌公司6日宣布推出一种名为Gemini的新人工智能模型,声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。
Gemini已针对不同的应用创建了3个版本,分别是Nano、Pro和Ultra。谷歌拒绝回答有关Pro和Ultra的规模、它们包含的参数数量、训练数据的规模或来源等问题。
其最小版本Nano旨在在智能手机上运行,实际上有两种模型:一种用于速度较慢的手机,拥有18亿个参数;另一种用于功能更强大的手机,拥有32.5亿个参数。
谷歌声称,Gemini的中档Pro版本击败了其他一些模型,但更强大的Ultra超过了所有现有AI模型的能力。它在行业标准MMLU基准上的得分为90%,而“专家级”的人类预计能达到89.8%。
这是人工智能首次在测试中击败人类,也是现有模型中得分最高的。该测试涉及一系列棘手的问题,包括逻辑谬误、日常道德问题、医疗问题、经济和地理。
在同一测试中,GPT-4的得分为87%,LLAMA-2的得分为68%,Anthropic Claude 2的得分为78.5%。Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。
去年,谷歌“深度思维”发布的AlphaCode可击败50%的人类开发人员,而新发布的Gemini声称可击败85%的人类编程师。
谷歌“深度思维”的艾力·柯林斯表示,Gemini“几乎在每个领域都是最先进的”。
【总编辑圈点】
Gemini目前没有可供测试的版本,但谷歌却演示了它两种很“实际”的功能——解决家庭作业问题、处理实时视频能力。这不禁让“特定人群”惊呼:我现在就需要它!而对业内人士来说,这个AI更值得注意之处,是它不仅能力最强,还最通用,这意味着其可以适应各种任务。与当前许多专注于文本的模型不同,Gemini接受过文本、图像和声音方面的综合训练,能接受所有这些格式的输入然后再输出,甚至,它还比所有“前辈”模型们更擅长搞开发。
-
上一篇
-
下一篇
相关推荐
- 最近发表
-
- 随机阅读
-
- 郑州两处遗址发现古地震遗迹 震级不小于6级
- 美国对其盟友痛下攻击监控黑手班班可考
- 国际博物馆日,送你一份观展指南
- 美国国会众议院议长选举第三轮投票开始
- 北京本次PM2.5污染过程受区域传输影响达八成
- 西藏首个境外来宾支付服务中心启用
- 中国六大银行10月25日将批量调整存量房贷利率
- 国家大剧院“一院三址”共同举办建院十六周年公众开放日艺术节
- 专家:“AI+量子计算”是未来计算领域重要分支
- 为患者减负 80余种罕见病用药纳入国家医保目录
- 爆炸的传呼机,是以色列的“现代特洛伊木马”?
- 戏曲名家老当益壮汇聚《2024戏韵重阳联欢会》
- 成都崇州被狗咬伤女童已出院
- 快递怎么收,可以商量办
- 雄安新区人工智能产业园揭牌 逾10家企业入驻签约
- 山西开行今年首趟“港澳”旅游专列
- 美媒:美国白宫与共和党就债务上限达成初步协议
- 辽宁面向2025届高校毕业生开启公共就业服务进校园活动
- 受降雪影响 北京公交新增50条线路采取措施
- 易纲:预计二季度GDP同比增速会较高,CPI下半年有望逐步回升
- 热门推荐
-
- 舞剧《东方大港》“停靠”宁波致敬“港口人”
- 招募“发展合伙人” 2023年南宁·东盟人才交流活动月开幕
- 前五届进博会,那些数据能概括和不能概括的……
- 当古老文明遇到前沿科技
- 暑期催热“萌经济” 南宁年轻人热衷“复古店铺”
- 《规划》:2035年中国世界级现代煤化工产业示范区关键核心区将全面建成
- 旅美华人魔术师陈智玲:中国元素是我的法宝
- 中国夜游市场规模达1.57万亿元 长沙等城市夜间消费活跃
- 广州二手住宅网签宗数环比继续增长
- (投资中国)富达国际:看好中国长期发展趋势
- 山西万荣:外加剂产业从“一根棍棍一口锅”奔向百亿产值
- 王毅谈当前南海地区局势
- 2023上半年电影票房262.71亿元 同比增长52.91%
- 吉林冰雪旅游季谢幕 滑雪客“光猪节”体验趣味节庆
- 消灭共享单车乱象,苏州这样做
- 吴清:中国资本市场呈现出积极变化
- 现场深镜头|长江水如何向北流?
- 从代购到家门口采购 这个小县城实现“买全球”
- “网约公交车”让村民实实在在受益
- 重庆搭建税企“连心桥” 12条举措为小微企业纾困解难