8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。
百度蒸汽机通过五大技术突破实现“需求即成片”,在生成电影级高清视频画面的同时,实现逼真环境音效、自然人物语音的同步输出。即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
据介绍,百度蒸汽机是全球首个中文音视频一体化生成的I2V模型,不仅支持环境音效,更支持多角色语音的一体化生成。百度蒸汽机2.0有声版模型让AIGC视频创作彻底告别了配音,创作者对完美视听语言的一切想象,只需要一张图和提示词。
百度蒸汽机2.0技术突破带来的不仅是质量提升,更是成本结构的根本性变革。传统影视制作中昂贵的演员、场地、设备租赁费用,以及繁琐的后期配音、特效追加等环节,现在均可通过AI生成实现。国际知名视效指导姚骐现场分享了他用百度蒸汽机模型制作的科幻短片《归途》。“它让好莱坞级大片镜头不再需要百万预算”姚骐表示。该作品共有40多个镜头,每个镜头生成3次,共用AI生成超120个片段素材,成本低至百元。
随着百度蒸汽机全系版本开放,百度同步公布了极具竞争力的价格体系。针对不同需求用户,平台提供了梯度会员服务,价格低至行业同类产品的70%。除此之外,新用户注册即可免费获得部分想象力值,平台还将在每周四创新推出"狂欢星期四"抽奖活动,用户最高可获18888点想象力值,实现"视频生成自由"。同时,基于持续丰富的特效能力,平台月月有生动有趣的特效赛事发布,参加即有机会赢得数万元大奖。
不同于业界的模型发展多由技术催生,百度蒸汽机的研发是由应用驱动模型研发的新范式。来自百度各业务场景的、旺盛的应用需求,推动着百度蒸汽机模型快速发展,而模型技术的迭代,也在反哺着应用生态的创新,包括搜索生态、内容生态、商业生态以及云生态等。
AIGC的涌现,大大打开了多模态内容创作的自由度,提高了视频生成质量和效率,并大幅降低了视频制作成本。目前,百度蒸汽机已在百度生态广泛使用。例如,在百度搜索中,用户只需点击视频创作即可轻松完成从脚本到视频免费生成,普通用户也可获得简单而惊喜的AI创作体验。
目前,百度智能云千帆大模型平台已全面接入百度蒸汽机模型服务,为企业提供高性能、低成本、安全可控的视频生成解决方案。通过按量后付、预付费资源量包、批量计算等极致的资源利用和灵活的计费模式,助力企业及开发者低成本用好视频生成模型。支持企业在商业营销、影视创作、创意特效等五大场景快速落地,实现企业级AI视频即开即用。