图说:Vimi当选大会展览展现最高荣誉“镇馆之宝” 商汤科技供图(下同)
7月4日,2024国际人工智能大会在上海开幕。由商汤科技打造的首个面向C端用户的可控人物视频生成大模型——Vimi当选大会展览展现最高荣誉“镇馆之宝”。
据介绍,Vimi依托商汤日日新大模型,仅经过一张恣意风格的相片就能生成和方针动作共同的人物类视频,并支撑多种驱动方法,可经过已有人物视频、动画、声响、文字等多种元素进行驱动。
跟着大模型和生成式AI技能的加快速度进行开展,让相片中的人物动起来现已不是新鲜事,但现在市面上的相关这类的产品在实践运用中存在许多痛点,有的人物动作、表情无法精准操控,有的作用安稳性不高,有的时长有限只要三四秒钟,不足以满意广阔视频创造者的运用需求。未处理这些运用中的实践问题,商汤可控人物视频生成大模型Vimi应运而生。
与图片表情操控类技能只能操控头部表情动作不同,Vimi不仅能完成精准的人物表情操控,还可完成在半身区域内操控相片中人物的天然肢体改变,并主动生成与人物相符的头发、服饰及布景改变。一起,光影改变也能做到合理生成,让人物动作和视觉作用流通天然。Vimi可安稳生成长达1分钟的单镜头人物类视频,画面作用不会跟着时刻的改变而劣化或失真,可满意文娱互动等需求长时刻安稳视频生成的需求。
据悉,Vimi将面向C端用户敞开运用。用户只需上传不同视点的高清人物图片,即可主动生成数字兼顾和不一样的风格的写真视频。由Vimi生成的视频人物不再仅仅板滞的五官运动,而是调配手势、肢体、头发等,构成更完好、一致的人物动作,让创造者可根据生成的视频资料进行编排和再创造。
针对喜欢的用户,Vimi可支撑谈天、歌唱、摇动等多种文娱互动场景;而关于热心表情包的用户来说,Vimi经过单张图片即可驱动生成各种兴趣的人物表情包,玩法多样,完成创造自由。此外,Vimi还供给唯美写真风、奇幻风等多种生成风格,让用户似乎穿越不同次元,享用大片质感的沉溺式视觉作用。
现在,Vimi已在商汤科技官网敞开预定体会。在明日(5日)商汤科技举行的“大爱无疆·向新力”人工智能论坛上,还将揭开Vimi的更多细节。