第04版:国内国际 上一版 下一版  
上一篇 下一篇

直接生成16秒高清视频

我国自研视频大模型在京发布

据新华社北京4月27日电(记者 魏梦佳) 只需一段文字指令就能生成一段逼真视频,今年初,文生视频大模型Sora在全球人工智能业内外引发广泛关注。27日,2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。

记者从会上获悉,这一视频大模型由清华大学联合北京生数科技有限公司共同研发,可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容,不仅能模拟真实物理世界,还拥有丰富想象力。

清华大学人工智能研究院副院长、生数科技首席科学家朱军说,当前国内视频大模型的生成视频时长大多为4秒左右,Vidu则可实现一次性生成16秒的视频时长。同时,视频画面能保持连贯流畅,随着镜头移动,人物和场景在时间、空间中能保持高一致性。

在动态性方面,Vidu能生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换,包括能直接生成长镜头、追焦、转场等效果。

“Vidu能模拟真实物理世界,生成细节复杂且符合物理规律的场景,例如合理的光影效果、细腻的人物表情等,还能创造出具有深度和复杂性的超现实主义内容。”朱军介绍,由于采用“一步到位”的生成方式,视频片段从头到尾连续生成,没有明显的插帧现象。

此外,Vidu还可生成如熊猫、龙等形象。

  • 嫦娥六号任务器箭组合体完成垂直转运

  • 贵州龙里河大桥建成通车

  • 这份旅游指南请查收

  • 报头

  • 1088人将获2024年全国五一劳动奖章

  • 工业和信息化部拟加强 电动自行车用充电器安全技术管理

  • 中美将开启新一轮大熊猫保护合作

  • 国台办表示大陆方面愿向花莲地震灾区捐赠活动板房

  • 我国仪器仪表产业进入万亿元时代

  • 乌克兰多地遭导弹袭击

  • 我国自研视频大模型在京发布

  • 柬埔寨一弹药库爆炸

  • 巴黎奥运会火种正式启航前往法国

  • 国内首个泉域岩溶区地铁区间双线贯通

  • 滇ICP备08000875号 互联网新闻信息服务许可证编号:53120170002 信息网络传播视听节目许可证号:2511600
    互联网出版许可证:新出网证(滇)字 04号
    广播电视节目制作经营许可证号:(云)字第00093号
    电信增值业务经营许可证编号:滇B2-20090008 ® yunnan.cn All Rights Reserved since 2003.08
    未经云南网书面特别授权,请勿转载或建立镜像,违者依法必究