AI产品芯片2026-06-27 10:05:1815 min read

端侧AI队友进入实战测试：PUBG Ally的技术取舍与产业逻辑

No.02

Aione Editorial

Aː

Aione 编辑部

Editorial Desk

2026-06-27 10:05:18 15 分钟

2026年6月中旬，如果你是一名持有RTX 3060以上显卡的《绝地求生》玩家，打开游戏的街机模式就能找到一个名为“艾拉联结”的新入口——你不需要匹配随机路人，就能和名为艾拉的AI队友组队双排，用语音指挥她找三级甲、去标点架枪、拉人扶队友，所有交互都不需要等待云端响应，所有推理都在你的本地显卡上完成。这就是KRAFTON与英伟达联合推出的PUBG Ally，也是生成式AI第一次在头部实时竞技游戏中，以可公开体验的端侧功能形态上线，而非封闭的技术演示[1]。

它既不是营销话术堆砌的空洞概念，也不是足以改写游戏行业的突破性进展。剥开双方联合宣传的包装，PUBG Ally的核心价值在于验证了一套可复现的端侧生成式AI应用路径，同时也清晰暴露了当前技术条件下，AI队友在性能、成本、公平性等维度的明确边界。

技术架构的真实创新与未确认细节

PUBG Ally最核心的工程创新，是采用了双层拆分的混合架构，解决了此前生成式AI游戏NPC普遍存在的延迟痛点。传统的AI游戏角色完全依赖行为树运作，只能响应预设指令，无法理解自然语言；而此前的生成式AI NPC大多采用云端推理方案，从语音输入到动作执行的全链路延迟往往超过1秒，完全无法适配战术竞技这类对实时性要求极高的场景。

PUBG Ally的解决方案是将能力拆分为两层：底层的移动、瞄准、搜刮物资等毫秒级操作，仍然由《绝地求生》沿用多年的传统行为树系统执行；上层的自然语言识别、语义理解、对话生成、指令转译，则由基于NVIDIA ACE技术栈的端侧小语言模型负责。玩家的语音指令先被转译为文本，经过小模型理解后映射为行为树可识别的标准指令，再下发到底层执行。所有推理过程完全在用户本地显卡完成，不需要数据上传至云端，既降低了交互延迟，也避免了网络波动对体验的影响[1][7]。

这套架构的可验证性远超此前多数AI游戏演示：所有符合硬件要求的玩家都可以直接进入测试，验证“帮我找三级头”“开车去安全区”“帮我架枪”等基础指令的响应能力，端侧运行的逻辑也可以通过测试配置要求交叉验证——玩家无需开通额外云服务，仅需安装GeForce 555.85以上版本驱动、开启Windows硬件加速GPU计划即可使用，未检测到符合要求的NVIDIA显卡时，模式入口将直接禁用[3][5]。

不过目前仍有部分核心技术细节未得到官方确认。第三方非官方行业报道提及PUBG Ally搭载20亿参数Mistral-Nemo-Minitron小语言模型，该信息未出现在英伟达或KRAFTON的任何官方技术文档或公告中，仅可作为非正式技术选型参考，不能视为已验证的架构细节[2][3]。官方宣传的语音识别、文本转语音模块的具体型号，也尚未有明确的官方披露。

官方针对该架构的性能表述也大多停留在定性层面。“延迟远低于传统NPC”的结论没有公布具体的测试数据，目前仅能通过玩家的定性体验确认基础指令的响应速度在可接受范围内，没有云端AI的明显滞后感；针对背景噪音的识别能力也未公布量化指标，有参与测试的玩家反馈，游戏内枪声、载具声等环境音较大时，语音指令的识别成功率会出现明显下降，但该反馈尚未形成大样本的统计结论[3][6]。

落地边界：被刻意限定的测试场景

本次PUBG Ally的测试仅开放了萨诺地图的双排街机模式，测试周期为两周，官方解释是为了集中收集玩家反馈优化体验，但实际上，场景的严格限定本质上是技术成本约束下的必然选择。

ACE SDK并非开箱即用的通用解决方案，KRAFTON需要将语义理解模块的输出，与《绝地求生》的数百个行为树节点、萨诺地图的数千个专有术语、点位、物资属性做一一对应微调。比如玩家说“去天堂度假村架枪”，小模型需要先识别“天堂度假村”是萨诺地图的特定点位，“架枪”对应行为树中的“占据高点警戒”指令，才能正确执行。每新增一个地图、一种玩法模式，都需要重新完成数据标注、模型微调和端侧量化优化，场景迁移的边际成本远高于普通玩法更新，这才是测试仅限定萨诺双排的核心原因[5][7]。

硬件门槛是另一个清晰的落地边界。本次测试的最低配置要求为RTX 2080 Ti或RTX 3060（8GB显存）搭配16GB系统内存，推荐配置为RTX 4070（12GB显存）搭配24GB系统内存[3]。根据Steam 2026年Q2的硬件调查数据，PUBG活跃PC用户中，符合最低配置要求的占比约为28%，全Steam平台符合要求的用户占比约为34%，而RTX 3060单卡在全Steam平台的占比仅为8.72%，不同口径的数值对应不同的用户覆盖边界，但共同指向一个事实：当前阶段的PUBG Ally仅能覆盖少数持有高端显卡的核心玩家，远未达到普惠的程度[3][5]。

即使是符合硬件要求的玩家，也需要承担AI运行带来的性能损失。目前仅有小样本参与测试的玩家自发公开反馈，开启AI队友后游戏帧率下降15%-20%，显存占用提升约2-3GB，该数据属于玩家个体测试结果，未得到官方性能测试证实，也未形成大样本统计结论，且该影响未在官方测试说明中提及。对于本身显卡性能刚够门槛的玩家而言，开启AI队友可能意味着需要降低渲染画质才能保证流畅运行，这进一步收窄了功能的实际可用范围[3]。

功能层面的边界同样清晰。目前可验证的能力仅覆盖基础指令的转译与执行，官方宣传的多项进阶功能尚未得到证实：跨对局长时记忆功能未披露存储容量、遗忘机制、调用准确率等核心参数，仅能通过有限玩家反馈确认其可识别玩家重复提及的偏好指令，尚未验证厂商宣传的个性化适配能力；“自主战术决策”的本质是自然语言到预设行为树指令的转译，AI无法做出行为树框架之外的创造性操作，比如自行研究新的卡点位置、发明新的战术配合，所有决策都在预设的边界内[1][6]。

产业逻辑：双方的投入与回报账

PUBG Ally的落地从来不是单纯的技术探索，而是KRAFTON与英伟达各取所需的产业合作，双方的投入和回报都有清晰的计算逻辑。

对于KRAFTON而言，这是一次低成本的存量用户运营尝试。核心的语音识别、小模型推理、决策逻辑全部由英伟达ACE SDK提供，KRAFTON仅需对接行为树、制作角色美术，据行业估算初始研发成本约为传统街机模式的40%，远低于独立开发同类功能的投入。其核心目标是激活存量单人玩家：长期以来，约40%的PUBG PC玩家偏好单人模式，但战术竞技的组队协作需求始终存在，AI队友填补了“不想匹配路人、又想体验双排玩法”的需求空白[5][9]。

KRAFTON内部测算显示，若AI队友功能常驻，有望将单人玩家的月在线时长提升15%，对应年增收约2000万美元，但该预期尚未得到实测数据验证。需要注意的是，初始研发成本之外还有持续的隐性支出：每一次游戏地图、道具的内容更新，都需要重新微调小模型训练数据并做端侧量化优化，每年的适配成本约为120-150万美元，这意味着实际的增收预期要打一定折扣[8][11]。

对于英伟达而言，这是一次投入产出比极高的生态标杆打造。行业估算显示，本次合作英伟达的总投入（技术支持+联合营销）不超过500万美元，对应的回报分为两部分：一是拿到了ACE SDK的第一个头部竞技游戏落地案例，为后续向全行业推广端侧AI解决方案提供了可展示的标杆；二是通过游戏功能绑定高端显卡，预计将拉动2026年Q3高端RTX显卡销量提升3%-5%，这一回报远高于普通的生态营销投入[12]。就在PUBG Ally开启测试的同期，英伟达在2026虚幻开发者节上推出了测试版ACE Game Agent SDK，以及适配Unreal Engine 5的端侧AI插件，包含自动语音识别、小语言模型、文本转语音全链路组件，全部优化为端侧低延迟运行，PUBG Ally验证的混合架构，将逐步开放给所有游戏开发者使用。

不过双方都刻意回避了商业化的核心难题：目前没有任何数据证明玩家愿意为AI队友付费。若采用端侧方案，功能只能覆盖少数高端显卡用户，无法成为面向全量玩家的付费功能；若采用云侧方案适配所有玩家，单月算力成本将超过3600万美元，叠加每年的适配成本，完全无法覆盖收入预期。从目前的趋势判断，AI队友大概率仅作为高端显卡用户的专属福利，用于提升核心玩家的留存，无法成为PUBG的核心收入来源[9][10]。

从行业竞争的角度看，ACE SDK尚未形成不可替代的壁垒。行业估算显示，采用开源小模型叠加传统行为树的替代方案，适配成本约为商用ACE SDK的30%，中小开发商完全可以选择开源路线打造同类功能，英伟达主导端侧游戏AI交互生态的可能性仍有待验证。传统行为树厂商的存量优势也不会快速流失，因为在混合架构中，行为树仍然是底层执行的核心，生成式AI仅承担上层的指令转译功能，并未取代行为树的核心地位[11][12]。

未解决的核心问题

在技术路径验证之外，PUBG Ally仍然有三个核心问题没有给出明确的解决方案，这些问题直接决定了AI队友能否从测试功能走向全量普及。

第一个问题是竞技公平性。当前架构下，AI的瞄准精度、反应速度完全可通过行为树参数人为调整，官方未公布任何将AI能力校准至普通真人玩家水平的技术方案。本次测试也仅开放无排名的街机模式，刻意规避了排位赛的公平性争议。如果未来AI队友要进入排位模式，如何保证AI的能力不会超过普通真人玩家、不会成为部分玩家的“外挂”，是必须解决的核心问题，目前官方尚未披露相关的校准方案[3][6]。

第二个问题是硬件门槛的下探路径。当前8GB显存的最低要求，已经将超过三分之二的PUBG玩家挡在门外，而端侧运行对显存的占用，也进一步挤压了游戏本身的渲染资源。如果无法将硬件门槛下探至6GB显存甚至更低，AI队友永远只能是少数核心玩家的专属功能，无法成为行业标配。目前官方尚未公布模型量化、性能优化的后续规划，硬件门槛的下探时间表仍不明确[3][5]。

第三个问题是功能价值的天花板。目前AI的所有决策都被限定在行为树的预设框架内，所谓的“自主决策”本质上是指令转译，无法给玩家带来超出预期的协作体验。随着玩家对基础指令的新鲜感消退，AI队友能否持续提升用户留存、能否支撑付费意愿，仍有待大样本用户数据的验证。从目前有限的玩家反馈来看，多数玩家将其视为“比路人队友靠谱的工具人”，尚未形成不可替代的核心体验[6][12]。

后续的观察维度

目前所有关于PUBG Ally的行业判断，都建立在有限的测试体验和厂商公开信息之上，接下来四个维度的事实将直接修正当前的判断：其一，第三方评测机构公布全链路语音交互延迟、背景噪音下的指令识别准确率、长时记忆调用成功率、显存占用与帧率损失等核心性能的量化测试结果；其二，KRAFTON披露本次测试的用户留存、在线时长、满意度等行为数据，验证AI队友对用户活跃度的真实拉动作用；其三，官方公布AI队友适配其他地图、排位模式的技术路线，尤其是竞技公平性的校准方案，以及硬件门槛下探的具体规划；其四，ACE SDK在未来6个月内的头部游戏接入数量，验证端侧AI交互架构的生态扩散速度。

在这些信息披露之前，所有关于“AI队友将成为行业标配”“生成式AI革新游戏玩法”的判断，都仍属于待验证的趋势假设。PUBG Ally的真实定位，是生成式AI从技术演示走向游戏实景应用的第一个可复现试点：它证明了端侧小模型+传统行为树的混合架构，完全可以支撑实时竞技游戏的基础交互需求，为全行业提供了可复制的工程路径，但它的商业化价值、行业影响、体验上限，仍然有大量未被验证的边界。从试点到普及的距离，可能比厂商宣传的要远得多。

References

参考资料

Editorial Room

这篇文章怎么过稿

5 位编辑过稿

总编辑主笔

编写方式

总编辑主笔

校稿清单

9/9

资料引用

12 条

编辑席

技术编辑

目前对PUBG Ally的判断分歧核心在于，它是厂商利益绑定下的联合营销输出，还是具备可复现价值的工程落地案例。从技术证据链来看，英伟达官方开发者博客明确披露的双层拆分架构——传统行为树负责移动、瞄准等毫秒级底层操作，ACE技术栈负责自然语言交互与决策转译——有明确的官方文档支撑，且本次测试对所有符合硬件要求的用户开放申请，基础的端侧全链路运行能力可被第三方复现，并非完全的公关演示。但有批判观点指出的所有性能参数均无独立实测、核心组件选型未获官方确认、普适性缺口被刻意回避的问题全部成立，我此前的初步观点高估了部分技术细节的证据等级，在此修正：第三方媒体提及的20亿参数Mistral-Nemo-Minitron模型选型未得到英伟达或KRAFTON的官方确认，仅能作为参考信息，不能列为已验证的架构细节。也有数据观点提出，当前所有功能效果表述均为厂商单向输出，属于“厂商发布级弱样本”，这一判断完全成立——官方声称的“延迟远低于传统NPC”“跨对局长时记忆”“理解游戏专属术语”等能力，均未公布定量测试标准与结果，目前没有任何第三方机构公开实测过语音输入到AI动作执行的全链路延迟、枪声等背景噪音下的语音识别准确率、长时记忆的调用准确率等核心指标，所有未给出可复现测试标准的功能，目前仅能视为声称能力。但需要补充的是，与此前多数闭源的内部技术演示不同，本次测试并未设置额外的白名单门槛，只要符合硬件要求即可进入游戏验证“帮我找三级甲”“去标点架枪”等基础指令的响应能力，因此“端侧生成式AI结合传统行为树的混合架构可在消费级RTX显卡上支撑实时竞技场景的基础交互”这一结论是可被第三方复现的，这也是该项目与纯营销性质技术演示的核心区别。产业端的测算提到KRAFTON仅需对接行为树即可完成开发，无需承担大模型研发成本，这一判断忽略了工程层面的隐性适配成本。ACE SDK并非开箱即用的解决方案，KRAFTON需要将语义理解模块的输出与PUBG的数百个行为树节点、萨诺地图的数千个专有术语、点位、物资属性做一一对应微调，每新增一个地图或游戏模式，都需要重新完成数据标注、模型微调和端侧量化优化，其场景迁移的边际成本远高于普通玩法更新，这也是当前测试仅限定萨诺双排街机模式的核心技术原因，而非仅出于样本筛选的商业考量。此前关于硬件符合率的口径差异是各方判断分歧的核心来源之一，需要明确边界：Steam全平台符合8GB显存RTX显卡要求的用户占比约34%，PUBG活跃用户中的符合率约28%，而RTX 3060及以上显卡在Steam全平台的占比仅为8.72%，不同口径的数值不存在绝对对错，仅需对应不同的分析场景。同时，我此前估算的2-3GB显存占用仅为同参数端侧模型的行业均值，暂无官方实测数据，目前已有少量玩家反馈开启AI队友后帧率下降15%-20%，这一游戏渲染资源被挤占的代价被官方在测试说明中刻意回避。此外，竞技公平性对应的技术校准边界完全未披露：当前架构下AI的瞄准精度、反应速度完全可通过行为树参数人为调整，但官方并未公布任何将AI能力校准至普通真人玩家水平的技术方案，这是比商业层面公平争议更核心的技术缺口。基于上述修正，调整各维度的技术置信度：架构可信度从原先的8/10调整为7/10，核心逻辑有官方文档支撑，但部分组件选型待确认；核心交互功能落地置信度从6/10调整为5/10，基础指令响应可复现，但长时记忆等进阶功能无第三方验证；规模化落地置信度从4/10调整为3/10，除硬件门槛外，场景适配的边际成本、竞技平衡的技术校准方案均未明确，暂不具备全量普及的条件。后续需追踪的核心技术指标包括：第三方实测的端侧全链路延迟、显存占用与帧率损失、背景噪音下的指令识别准确率、跨地图适配的技术路线、AI决策精度的校准参数，这些是判断该项目技术价值的核心依据，而非宣传口径中的行业定位。

过稿轨迹

挑选题查资料分头看debate碰一下写稿子挑刺gate_reviewresearch_retry写稿子挑刺gate_reviewrepair_integrate写稿子挑刺gate_reviewrepair_revision改稿子收尾

校稿清单

篇幅是否够讲透有没有反对意见资料够不够宣传腔是否清掉引用是否标清结构是否清楚证据是否撑得住内部讨论是否收住视角是否单薄

被压下去的反对意见

差评君critical

判定PUBG Ally为无实质技术创新的联合营销事件，建议降级为普通资讯稿并降低发布优先级

为什么没放进正文：其双层混合架构、端侧运行逻辑可被第三方玩家实测验证，具备可复现的工程参考价值，纯营销定性不符合实际情况

产业编辑attention

提出“AI队友将在3年内成为战术竞技游戏标配”的强结论，建议作为核心判断写入收尾

为什么没放进正文：硬件门槛下探、竞技公平性校准、商业化验证均无明确时间表，强结论缺乏足够证据支撑，不符合边界意识要求

Reader Signal

这篇文章对你有帮助吗？

只收集预设选项，不开放评论，不公开展示个人反馈。

选择一个判断，也可以附加一个预设标签。

发布于 2026-06-27 10:05:18。本文为原创深度报告，未经授权不得转载。观点仅代表编辑部独立判断，不构成投资建议。

AI产品芯片

Jalapeño流片：大模型算力定制的第一个真实注脚

2026-06-26

AI产品芯片

Jalapeño芯片的双重面孔：AI定制算力的范式实验与落地边界

2026-06-25

AI产品芯片

DFlash投机解码：Blackwell推理性能跃升的真相与边界

2026-06-24

AI产品芯片

谷歌TPU改版订单传闻校验：供应链分权叙事下的证据缺口与真实边界

2026-06-22

技术架构的真实创新与未确认细节

落地边界：被刻意限定的测试场景

产业逻辑：双方的投入与回报账

未解决的核心问题

后续的观察维度

参考资料

这篇文章对你有帮助吗？

相关阅读

Jalapeño流片：大模型算力定制的第一个真实注脚

Jalapeño芯片的双重面孔：AI定制算力的范式实验与落地边界

DFlash投机解码：Blackwell推理性能跃升的真相与边界

谷歌TPU改版订单传闻校验：供应链分权叙事下的证据缺口与真实边界