【48812】2024国际人工智能大会｜首个面向C端用户的可控人物视频生成大模型Vimi当选“镇馆之宝”_卡通人物草雕

　　图说：Vimi当选大会展览展现最高荣誉“镇馆之宝” 商汤科技供图（下同）

　　7月4日，2024国际人工智能大会在上海开幕。由商汤科技打造的首个面向C端用户的可控人物视频生成大模型——Vimi当选大会展览展现最高荣誉“镇馆之宝”。

　　据介绍，Vimi依托商汤日日新大模型，仅经过一张恣意风格的相片就能生成和方针动作共同的人物类视频，并支撑多种驱动方法，可经过已有人物视频、动画、声响、文字等多种元素进行驱动。

　　跟着大模型和生成式AI技能的加快速度进行开展，让相片中的人物动起来现已不是新鲜事，但现在市面上的相关这类的产品在实践运用中存在许多痛点，有的人物动作、表情无法精准操控，有的作用安稳性不高，有的时长有限只要三四秒钟，不足以满意广阔视频创造者的运用需求。未处理这些运用中的实践问题，商汤可控人物视频生成大模型Vimi应运而生。

　　与图片表情操控类技能只能操控头部表情动作不同，Vimi不仅能完成精准的人物表情操控，还可完成在半身区域内操控相片中人物的天然肢体改变，并主动生成与人物相符的头发、服饰及布景改变。一起，光影改变也能做到合理生成，让人物动作和视觉作用流通天然。Vimi可安稳生成长达1分钟的单镜头人物类视频，画面作用不会跟着时刻的改变而劣化或失真，可满意文娱互动等需求长时刻安稳视频生成的需求。

　　据悉，Vimi将面向C端用户敞开运用。用户只需上传不同视点的高清人物图片，即可主动生成数字兼顾和不一样的风格的写真视频。由Vimi生成的视频人物不再仅仅板滞的五官运动，而是调配手势、肢体、头发等，构成更完好、一致的人物动作，让创造者可根据生成的视频资料进行编排和再创造。

　　针对喜欢的用户，Vimi可支撑谈天、歌唱、摇动等多种文娱互动场景；而关于热心表情包的用户来说，Vimi经过单张图片即可驱动生成各种兴趣的人物表情包，玩法多样，完成创造自由。此外，Vimi还供给唯美写真风、奇幻风等多种生成风格，让用户似乎穿越不同次元，享用大片质感的沉溺式视觉作用。

　　现在，Vimi已在商汤科技官网敞开预定体会。在明日（5日）商汤科技举行的“大爱无疆·向新力”人工智能论坛上，还将揭开Vimi的更多细节。

上一篇:【48812】百度推出仿真人AI交际APP 组织主张重视多模态技能开展

下一篇:【48812】商汤发布可控人物视频生成大模型Vimi完结分钟级视频

卡通人物草雕

【48812】2024国际人工智能大会｜首个面向C端用户的可控人物视频生成大模型Vimi当选“镇馆之宝”

绿雕产品

乐鱼网站下载

联系乐鱼网站赞助了大巴黎

绿雕产品

乐鱼网站下载

乐鱼官方

关于我们