2026年5月21日,WIRED记者里斯·罗杰斯使用谷歌Gemini应用的AI头像工具生成了以自身为原型的数字克隆视频,效果高度逼真却令其感到不安。
该功能基于谷歌新的Omni视频模型,仅对Gemini AI Pro订阅用户开放,订阅费用为每月20美元,且设有使用限制,额度每五小时重置一次。罗杰斯很快用尽额度,成功生成两段10秒视频。
生成头像的过程耗时约5分钟:需在光线充足的房间内,用手机摄像头对准面部,朗读一串两位数数字,随后缓慢左右转动头部即可完成。需注意着装,因为所穿衣物会出现在AI生成的内容中。
罗杰斯生成的两段视频分别为在旧金山多洛雷斯公园给恐龙唱生日歌、在金门大桥下冲浪。视频背景还原度较高,但存在细节瑕疵,比如牙齿形态不自然、冲浪时穿着全身牛仔等不合场景的服装,还出现动作逻辑混乱的情况,但克隆形象的外貌和声音与本人高度相似。
与OpenAI曾允许用户生成他人肖像视频不同,谷歌仅允许成年用户生成自身的AI视频;谷歌表示推出该功能时将安全放在首位,以防止造成伤害。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END