分类
anuttaconLPM 1.0安卓版不是一个普通的视频生成工具,而是一个能让静态角色图开口说话、侧耳倾听、做出微表情,并且能跟你实时聊天的“角色表演引擎”。你给它一张角色图,它就能根据语音或文字,实时生成这个角色在说话或倾听的视频,而且身份不会崩,时长可以无限续。这意味着,游戏里的NPC终于不用再念那些重复的固定台词了,它们能看着你的眼睛,像真人一样跟你即时对话。
1、全双工实时交互,告别“你一句我一句”的尴尬。
用过AI语音助手的朋友都知道,那种“说完等反应、再听再说”的节奏很机械。但LPM 1.0支持全双工对话,就像咱们打电话或面对面聊天一样,双方可以同时说话、倾听,甚至随时打断对方。在官网的演示视频里,角色会在你说话时同步做出思考、惊讶、专注倾听的表情,等你停下来它再无缝接话,这种一来一回的节奏感非常自然。
2、无限时长与身份一致性,角色永不“穿模”。
这是最让我惊喜的一点。目前市面上绝大多数视频生成模型最多只能产出30秒左右的短片,时间一长角色就容易“变脸”或出现肢体扭曲。但LPM 1.0通过在线流式生成器,能支持无限长度的视频生成。官方甚至放出了一段45分钟的演示对话,角色从第一秒到最后一秒,发型、脸型、服装甚至微表情风格都保持得死死的,再也不用担心角色“精分”了。
3、细腻的倾听与情绪演绎能力。
以前的模型只学“说话”,因为说话的视频在网上好找,但一个人认真听别人说话时的细微反应——点头、眼神微移、嘴角轻动——这类数据极其稀缺。LPM 1.0专门构建了一套“倾听”数据系统,让角色在听你说话时也能给出当下的情绪反馈。比如演示中那个接电话的女人,听到电话那头的声音时,眼神瞬间变化,眉头微蹙,那种“边听边消化信息”的状态几乎和真人无异。

1、多模态控制,一张图就能驱动。
你不需要复杂的3D建模软件,也不需要动作捕捉设备。LPM 1.0支持文本、音频和图像三种输入方式。你可以上传一张正面照,再配合一段录音或几行文字,它就能生成角色说话的视频。更厉害的是它的“多粒度身份参考”系统:不仅看正脸,还能通过多角度身体图像和面部表情范例,规避模型对牙齿、侧脸轮廓、未显露身体等细节的“胡乱猜测”,保证角色无论转头还是做夸张表情,都不会崩坏。
2、风格泛化能力强,写实动漫通吃。
不管你想要写实风格的人类、二次元动漫角色、3D游戏模型,还是非类人的生物,LPM 1.0都能直接支持,不需要针对特定风格进行微调或额外训练。这意味着无论是做写实的虚拟主播,还是做卡通风格的游戏NPC,这一个模型就能全部搞定。
3、解决“表演三难困境”的技术底气。
行业内一直存在“高表现力、实时推理、长时稳定”三者无法兼得的难题。LPM 1.0的底气来自于其170亿参数的扩散Transformer架构。团队先训练了Base大模型保证画质,再通过蒸馏技术提炼出低延迟的Online模型用于实时交互。简单说,就是既要高清画质,又要反应快,还要能持久战,这次它全都要了。
1、作为游戏NPC的视觉引擎。
这是最直接的用法。以往游戏里的NPC对话只有文字或语音,脸上永远是同一副表情。接入LPM 1.0后,当玩家通过麦克风与NPC交流时,NPC会根据你说的话实时生成对应的表情、口型和肢体动作。比如你跟它说“你好”,它会微笑回应;你说“我很难过”,它会露出担忧的神情。这完全改变了游戏叙事的沉浸感。
2、虚拟直播与实时互动。
对于虚拟主播来说,LPM 1.0能根据直播时的语音输入,实时驱动角色面部表情和口型,反应延迟极低。而且由于支持无限时长,无论直播多久,角色状态都能保持稳定,不会出现直播到一半角色表情僵硬的尴尬。
3、AI陪伴与教育辅导。
你可以把它理解为“有画面的ChatGPT”。给AI角色设定一个形象,无论是历史人物、动漫角色还是虚拟朋友,它都能在对话时呈现出相应的视觉反应。比如让孩子跟一个会动的虚拟老师学英语,老师会张大嘴示范发音,会点头鼓励,教学体验比单纯的语音聊天要生动得多。

1、开创性的倾听反馈机制。
这是LPM 1.0区别于其他视频模型的最大亮点。多数模型只关注“说话”时的口型准确度,而忽略了“倾听”时的状态反馈。LPM 1.0通过在Transformer架构中交错注入“说话音频”和“倾听音频”,让模型学会了人在不发言时的微表情管理。这种“活人感”是目前的同类产品难以企及的。
2、LPM-Bench基准测试的权威性。
团队不仅发布了模型,还配套推出了LPM-Bench,这是首个面向交互式角色表演设计的基准测试。在与可灵、OmniHuman等顶尖模型的对比中,LPM 1.0在用户偏好上取得了显著的优势,特别是在长时稳定性和交互自然度方面,数据非常能打。
3、背靠anuttacon的硬核团队。
这款产品的背后是米哈游创始人蔡浩宇组建的团队,项目负责人包括图形学领域的顶尖专家童欣。这意味着LPM 1.0不仅仅是一个学术研究项目,它有着明确的应用场景导向——即服务于未来米哈游那款“十亿人愿意生活其中”的虚拟世界。这种“技术宅拯救世界”的硬核背景,让人对它的后续进化充满期待。
说实话,在体验LPM 1.0的演示素材之前,我对所谓的“AI视频模型”已经有点审美疲劳了。大家都在卷画质、卷时长,但角色表演总是缺那么点“灵魂”。这次LPM 1.0真正打动我的地方,是它对“倾听”的刻画。一个虚拟角色在你说话时微微点头、眼神闪烁,这种被认真对待的感觉,才是交互的核心。虽然目前这个模型还不开源,也没有公开的API,暂时仅供学术交流,但从官方展示的成果来看,游戏行业的地基已经开始松动了。未来的游戏世界里,路边卖面包的NPC可能都有自己的人生和情绪,再也不是那个只会说“欢迎光临”的工具人了。强烈推荐所有游戏开发者和虚拟内容创作者去官网看看那段48分钟的演示视频,你会回来感谢我的。
用户评论
具体评论内容
请输入手机号码
视频监控查看软件
免费学习编程软件
专业做婚礼策划的软件
同类热门

烧杯化学反应 教育学习93.1MB免费软件
查看
及象教育 教育学习77.3MB免费软件
查看
青椒课堂 教育学习72.3MB免费软件
查看
八桂高考志愿填报 教育学习29.1MB免费软件
查看
笔尖教育 教育学习9.1MB免费软件
查看热门软件显示全部
