视频生成器Sora让人喜忧交加
【科技创新世界潮】(314)
◎本报记者 刘 霞
继推出ChatGPT后,龙年伊始,OpenAI公司又推出了最新人工智能(AI)模型——文本-视频程序Sora。这款工具可根据简单的文本描述,生成类似好莱坞电影般的逼真而又充满想象力的视频。
英国《新科学家》杂志网站在2月17日的文章中指出,对Sora的到来,人们可能“既爱又怕”。不少科学家欢呼其到来,认为它将进一步推动技术进步。但也有人担心,Sora会被别有用心之人用来制造深度伪造视频,加剧错误和虚假信息的泛滥。
两大技术孵化强大功能
Sora日语意为“天空”,其背后的团队之所以选择这个名字,是因为它“让人联想到无限的创造潜力”。该系统是生成式AI的一个最新实例。生成式AI可即时创建文本、图像和声音。
Sora目前可单独使用文本指令,或将文本与图像相结合,来创建长达60秒的视频,而且是一镜到底。比如一段演示视频依据如下文字描述生成:一位时尚女性漫步于充满城市标牌的东京街道上,道路两边霓虹灯闪烁,透出阵阵暖意。Sora不仅准确呈现了细节,还生成了具有丰富情感的角色。
目前OpenAI官网上已更新了48个视频,包括一只狗在雪地里嬉戏,车辆在路上行驶,以及更奇幻的场景,如鲨鱼在城市摩天大楼之间游泳等。有专家认为,Sora的表现优于其他类似模型,标志着文本-视频技术的巨大飞跃。
为实现更高水平的真实感,Sora结合了两种不同的AI技术。一是类似于DALL-E等AI图像生成器中使用的扩散模型,这些模型学习将随机图像像素转换为相干图像;二是“转换器架构”技术,其被用于将序列数据依据上下文内容拼接在一起。例如,大型语言模型使用转换器架构将零散的单词组装成人们可理解的句子。OpenAI将视频片段分解为视觉“时空补丁”,Sora的转换器架构可处理这些补丁。
英伟达公司高级研究科学家范麟熙在社交媒体平台X上称,Sora是一个可模拟现实世界的“数据驱动的物理引擎”。
仍有诸多完善空间
尽管Sora生成的视频令人印象深刻,但并非完美无缺。
OpenAI公司坦承,目前Sora模型也有弱点。它可能难以准确模拟复杂场景的物理特性,且可能无法理解因果关系。例如,该系统最近生成了一个人吃饼干的视频,但饼干怎么吃也没变小,被咬的饼干也神奇地没有咬痕。此外,该模型还可能混淆文字提示的空间细节,也可能难以精确描述随时间推移发生的事件。
美国普林斯顿大学的阿凡德·纳拉亚南指出,Sora生成的视频在描绘有大量动作的复杂场景时仍然会出现一些奇怪的小问题。
或使人真伪难辨
除了加快经验丰富的电影制作人的工作速度外,Sora还可能快速廉价的制造网络虚假信息,使人们在互联网上更难分辨真伪。
OpenAI公司仍在试图了解Sora的危险性,因此尚未向公众发布该系统。相反,他们正在与为数不多的学者和其他外部研究人员分享这项技术,希望借助这些专家的智慧,找到该系统可能被滥用的方式。
OpenAI针对Sora开展的“红队”演习中,专家们试图破坏AI模型的保护措施,以评估其被滥用的可能性。OpenAI发言人表示,目前参与测试Sora的都是“在错误信息、仇恨内容和偏见等领域的专家”。
这项测试至关重要,因为Sora可能会被别有用心者用来生成虚假视频,以骚扰他人,甚至影响政治选举。学术界、商界、政府以及AI专家都很担心,AI生成的“深度伪造”内容可能会造成虚假和错误信息的广泛传播。
美国加州大学伯克利分校的哈尼·法里德认为,与生成式AI领域的其他技术一样,人们有理由相信,文本-视频技术会持续改进。因为一旦Sora与由AI驱动的语音克隆技术相结合,将为不怀好意者提供全新工具,并创建出逼真的深度伪造内容,这将让人们越来越难以区分真伪。
OpenAI已经在该系统生成的视频中加上了水印,表明这些视频是由AI生成的。但该公司也承认,这些水印可被移除,水印可能难以被发现。
OpenAI发言人强调称,在将Sora用于OpenAI的产品之前,该公司正在采取几项重要的安全措施。例如,该公司已使用了自动化流程,旨在防止其商业AI模型生成针对政客和名人的虚假内容。(科技日报)
相关推荐
黑龙江饶河再现野生东北虎足迹
四川内江市市中区发生3.2级地震 震源深度10千米
海南将迎来春节前出岛车客高峰 各港口出岛秩序总体平稳
(新春走基层)“喜迎全运会 瑞蛇贺新春”新春庙会在广州举行
羊角把、牛角、十字扣,春运涨知识→小设计大用途
岁暮冰嬉 寒尽春生 这些“速度与激情”谁看了不想玩一把?
“家门口能挣钱,好日子有盼头”(新春走基层)
国家中医药局:九成以上三级妇幼保健院设置中医类临床科室
湖南零陵腊肉飘香年味浓 供销两旺助增收
春节临近 你的家乡举办哪些活动?一起来寻找年味儿→
新春走基层丨让每一盏车灯都安然明亮 他们是“魔鬼风口”的风雪护路人
中国将386.7万家固定污染源纳入排污许可管理
- 最近发表
-
- 随机阅读
-
- 一季度中国家电出口报告:亚洲仍为中国出口规模最大市场
- 内蒙古锡林郭勒盟苏尼特左旗发生3.2级地震 震源深度15千米
- 如花绽放!“中塞相亲 万里如邻”人文交流活动在贝尔格莱德举行
- 美国堪萨斯州同一地区3处住宅发生枪击案 致死5人
- 河南一货车两年收58张罚单?当地已成立专项调查工作组
- 深圳研究团队成功建立阿尔兹海默病新型猴模型
- 83岁著名京剧表演艺术家、荀慧生大师亲传弟子孙毓敏因病去世
- 这个学校新生入学“拎包入住” 线上缴费、在线选宿舍和床位
- 墨西哥当局在一卡车内发现超过250名非法移民
- 纪录片“央宗的家”国内首播 展现香格里拉的“平民史诗”
- 来自海拔4000多米农畜产品及民族手工艺品亮相拉萨
- 韩国国会未通过“内乱特检法”和“金建希特检法”
- 三月天宇迎春来:星河灿烂,天上“龙抬头”
- 北京朝阳区一村民自建房起火 已致4人无生命体征
- 高水平开放迈出坚实步伐
- 交通保障的“大运标准”
- 点校本“二十四史”修订进度如何?出版方回应
- 珠峰地区地气观测试验:青藏科考队员们全力以赴
- 人民网评:千方百计保障好人民健康
- 《家有儿女》后多年难出精品 儿童剧市场亟待重振
- 热门推荐
-
- 长江中下游最大“桥群”实现主动防撞预警全覆盖
- 广东龙门南昆山极危物种长梗木莲迎来开花季
- 韩媒:韩最大在野党党首李在明涉嫌挪用公款遭起诉
- “龙凤呈祥”与中华文化
- 深圳再添一座大型康复花园式医院
- 推动高质量发展·权威发布|海南:到目前为止共有380万家民营经济主体
- 衣服去毛去球器 真神器还是鸡肋?
- 天津口岸率先应用国际贸易“单一窗口”邮轮旅客信息申报系统
- 聚焦全球生态语境下的诗歌 中外诗人齐聚2023年青海湖诗歌节
- 浙江:财政金融协同服务科技创新企业
- 黑龙江黑河:2米长毒蛇闯入居民楼被民警用铁锹制伏
- 规范旅游市场 文旅部向私设景点说“不”
- 广东画院副院长冯少协推出油画新作《潮汕英歌舞》
- 法国政府公布2025年预算草案 计划减支和增税600亿欧元
- 大寒至,年味儿渐浓
- 韩国国会全体会议通过“紧急戒严真相查明国政调查计划书”
- 巴西圣保罗学子赴华解锁荆楚“文化密码”
- 通讯:高温下的坚守与关怀
- 大力弘扬教育家精神|陆繁伟:山区教育的“领跑人”
- 运动后半小时内吃东西会变胖……是真是假?