视频生成器Sora让人喜忧交加
【科技创新世界潮】(314)
◎本报记者 刘 霞
继推出ChatGPT后,龙年伊始,OpenAI公司又推出了最新人工智能(AI)模型——文本-视频程序Sora。这款工具可根据简单的文本描述,生成类似好莱坞电影般的逼真而又充满想象力的视频。
英国《新科学家》杂志网站在2月17日的文章中指出,对Sora的到来,人们可能“既爱又怕”。不少科学家欢呼其到来,认为它将进一步推动技术进步。但也有人担心,Sora会被别有用心之人用来制造深度伪造视频,加剧错误和虚假信息的泛滥。
两大技术孵化强大功能
Sora日语意为“天空”,其背后的团队之所以选择这个名字,是因为它“让人联想到无限的创造潜力”。该系统是生成式AI的一个最新实例。生成式AI可即时创建文本、图像和声音。
Sora目前可单独使用文本指令,或将文本与图像相结合,来创建长达60秒的视频,而且是一镜到底。比如一段演示视频依据如下文字描述生成:一位时尚女性漫步于充满城市标牌的东京街道上,道路两边霓虹灯闪烁,透出阵阵暖意。Sora不仅准确呈现了细节,还生成了具有丰富情感的角色。
目前OpenAI官网上已更新了48个视频,包括一只狗在雪地里嬉戏,车辆在路上行驶,以及更奇幻的场景,如鲨鱼在城市摩天大楼之间游泳等。有专家认为,Sora的表现优于其他类似模型,标志着文本-视频技术的巨大飞跃。
为实现更高水平的真实感,Sora结合了两种不同的AI技术。一是类似于DALL-E等AI图像生成器中使用的扩散模型,这些模型学习将随机图像像素转换为相干图像;二是“转换器架构”技术,其被用于将序列数据依据上下文内容拼接在一起。例如,大型语言模型使用转换器架构将零散的单词组装成人们可理解的句子。OpenAI将视频片段分解为视觉“时空补丁”,Sora的转换器架构可处理这些补丁。
英伟达公司高级研究科学家范麟熙在社交媒体平台X上称,Sora是一个可模拟现实世界的“数据驱动的物理引擎”。
仍有诸多完善空间
尽管Sora生成的视频令人印象深刻,但并非完美无缺。
OpenAI公司坦承,目前Sora模型也有弱点。它可能难以准确模拟复杂场景的物理特性,且可能无法理解因果关系。例如,该系统最近生成了一个人吃饼干的视频,但饼干怎么吃也没变小,被咬的饼干也神奇地没有咬痕。此外,该模型还可能混淆文字提示的空间细节,也可能难以精确描述随时间推移发生的事件。
美国普林斯顿大学的阿凡德·纳拉亚南指出,Sora生成的视频在描绘有大量动作的复杂场景时仍然会出现一些奇怪的小问题。
或使人真伪难辨
除了加快经验丰富的电影制作人的工作速度外,Sora还可能快速廉价的制造网络虚假信息,使人们在互联网上更难分辨真伪。
OpenAI公司仍在试图了解Sora的危险性,因此尚未向公众发布该系统。相反,他们正在与为数不多的学者和其他外部研究人员分享这项技术,希望借助这些专家的智慧,找到该系统可能被滥用的方式。
OpenAI针对Sora开展的“红队”演习中,专家们试图破坏AI模型的保护措施,以评估其被滥用的可能性。OpenAI发言人表示,目前参与测试Sora的都是“在错误信息、仇恨内容和偏见等领域的专家”。
这项测试至关重要,因为Sora可能会被别有用心者用来生成虚假视频,以骚扰他人,甚至影响政治选举。学术界、商界、政府以及AI专家都很担心,AI生成的“深度伪造”内容可能会造成虚假和错误信息的广泛传播。
美国加州大学伯克利分校的哈尼·法里德认为,与生成式AI领域的其他技术一样,人们有理由相信,文本-视频技术会持续改进。因为一旦Sora与由AI驱动的语音克隆技术相结合,将为不怀好意者提供全新工具,并创建出逼真的深度伪造内容,这将让人们越来越难以区分真伪。
OpenAI已经在该系统生成的视频中加上了水印,表明这些视频是由AI生成的。但该公司也承认,这些水印可被移除,水印可能难以被发现。
OpenAI发言人强调称,在将Sora用于OpenAI的产品之前,该公司正在采取几项重要的安全措施。例如,该公司已使用了自动化流程,旨在防止其商业AI模型生成针对政客和名人的虚假内容。(科技日报)
相关推荐
黑龙江饶河再现野生东北虎足迹
四川内江市市中区发生3.2级地震 震源深度10千米
海南将迎来春节前出岛车客高峰 各港口出岛秩序总体平稳
(新春走基层)“喜迎全运会 瑞蛇贺新春”新春庙会在广州举行
羊角把、牛角、十字扣,春运涨知识→小设计大用途
岁暮冰嬉 寒尽春生 这些“速度与激情”谁看了不想玩一把?
“家门口能挣钱,好日子有盼头”(新春走基层)
国家中医药局:九成以上三级妇幼保健院设置中医类临床科室
湖南零陵腊肉飘香年味浓 供销两旺助增收
春节临近 你的家乡举办哪些活动?一起来寻找年味儿→
新春走基层丨让每一盏车灯都安然明亮 他们是“魔鬼风口”的风雪护路人
中国将386.7万家固定污染源纳入排污许可管理
- 最近发表
-
- 随机阅读
-
- 美国资产管理巨头员工:俄乌冲突对公司生意大有好处
- 多大的雨是暴雨?为何大暴雨经常下在“局地”?
- 天津实现跨境税费电子缴退库业务全覆盖
- 久坐是健康大忌五个动作改善你的肩颈腰
- 湖南一根根小竹子 如何“撑”起富民大产业
- 假期前4天广东重点景区接待游客超千万人次
- 以色列军方:打死一名黎巴嫩真主党指挥官
- 美研究:受通胀等因素影响 八成美国老人负担不起养老成本
- 中国13城缴存住房公积金的灵活就业人员同比增长124.1%
- 广西南宁深化与东盟国家跨境金融合作
- 广西发布4大类40个重点产业链场景机会招商清单
- 焦点访谈:三尺讲台 银龄生辉
- 美国将再向乌克兰提供12亿美元军援
- 老父亲当“榜一大哥”刷光50万养老金
- 多重因素叠加 央行重启黄金增持
- 海南航空开通北京—东京(羽田)国际航线
- G3铜陵长江公铁大桥先导索成功过江
- 以雕塑创作,展现家国情怀和文化底蕴
- 福暖中国丨孕妇旅途劳累在列车上早产 众人合力接生“春运宝宝”
- 太原“男子持刀对峙交警”当事人系精神疾患人员 当晚已送医
- 热门推荐
-
- 印尼学者:稳定增长的中国经济,将为东盟崛起带来机遇
- 短剧必火已成过去式 周星驰入场将引爆“精品化”?
- “糖心肾”三大慢病“相伴相依” 多位专家呼吁多学科协作
- 黑龙江省林业碳汇交易体系建成 首批签约428.5万元
- 中共第一个农村支部纪念馆改造提升完成 正式对外开放
- 柬埔寨西部一座弹药库发生爆炸 20名士兵死亡
- 粤港澳数字人的生产与驱动技术论坛举行
- “令人遗憾的决定”!阿根廷正式拒绝加入金砖国家
- 一天被15条短信“轰炸”真搓火
- 陕西汉阴:凤堰梯田水稻迎丰收季
- 端午假期福建口岸出入境客流量预计超4.8万人次
- 印度阿萨姆邦洪水加剧 近50万人受灾
- 一个玩笑释放“英雄”
- 湖南岳阳重点产业链抛出266个高薪优岗 最高年薪80万元
- 解燃眉之急,农夫山泉为门头沟送来大批饮用水
- 浙江衢州水亭门城墙局部坍塌:初判系持续强降雨所致
- 青海加强知识产权保护 专利侵权纠纷行政裁决实现“零”突破
- 波兰媒体:波兰确定2022年坠入境内的导弹来自乌克兰
- 广西柳州打造婚姻登记列车 民众可在火车上领证
- 感冒、流感和新冠肺炎咋区分?要把握住这几点