鹤壁橡塑胶蚂蚁集团出Query-as-Anchor用户画像革命

195 2026-03-02 00:30

这项由蚂蚁集团和浙江大学联完成的研究发表于2025年，论文编号为arXiv:2602.14492v1，有兴趣入了解的读者可以通过该编号查询完整论文。

当你开支付宝时，系统是如何瞬间知道该向你荐什么服务的？当银行需要评估你的信用风险时，它又是如何从海量数据中准确判断你的还款能力的？这些看似奇的能力背后，都依赖于项关键技术——用户画像。

传统的用户画像就像是给每个人制作张固定的身份证，论在什么场景下都是同个样子。但现实生活中，你在购物时关心的是价格和品质，在理财时关注的是收益和风险，在社交时重视的是兴趣和话题。同个人在不同场景下会展现出不同的特征和需求。

蚂蚁集团的研究团队注意到了这个问题。他们发现，现有的用户画像系统就像是用把钥匙去开所有的锁——虽然能用，但果并不理想。在支付宝这样的应用中，用户的行为数据其丰富多样，包括支付记录、小程序使用、搜索历史、应用列表等等，但这些数据在不同业务场景下的重要截然不同。

棘手的是，这些数据往往是稀疏的、符号化的，与大语言模型习惯处理的连续文本数据存在巨大差异。就像让个只会读书的人突然去解读密码本样困难。同时，工业的用户画像系统还面临着实时要求、计成本限制严格等现实挑战。

为了解决这些问题，研究团队提出了个创新的解决案——Query-as-Anchor（查询作为锚点）框架。这个名字听起来很技术化，但其核心思想其实很简单：与其为每个用户制作张固定的身份证，不如根据具体的使用场景，为同个用户生成不同版本的画像。

这就像是个智能化的变龙系统。当系统需要进行风险评估时，它会关注用户的支付行为、信用记录等相关信息，而淡化购物偏好等关数据。当进行商品荐时，它又会突出用户的消费习惯、兴趣好，而减少对金融数据的依赖。

、构建工业用户理解数据集

要让AI真正理解用户，先需要教会它什么是"理解"。研究团队面临的个挑战是，市面上缺乏门针对用户画像训练的大规模数据集。现有的大语言模型虽然在文本理解面表现优异，但对于用户行为数据的理解能力相对薄弱。

为了填补这个空白，团队构建了个名为UserU的工业预训练数据集。这个数据集的构建过程可以比作教孩子学习的过程——既要教给他事实知识，也要培养他的理能力。

具体来说，UserU数据集包含两个核心组成部分。部分是基于行为的交互数据集，它通过分析用户的历史行为来预测未来行为。这就像是通过观察个人过去三个月的消费记录，来猜测他下个月可能购买什么。系统会将用户的多模态行为记录整理成时间序列，然后通过特定的模板问题，如"这个用户在下个时期可能的行为是什么？"，来训练模型理解行为模式和时间规律。

二部分加有趣，它是个成的问答数据集。由于现实中很难获得大量质量的用户理解问答对，研究团队采用了种自我反思的成数据生成法。他们先让大语言模型分析72个与生活相关的用户理解主题，比如财务规划、健康管理、购物偏好等。然后，对于每个具体用户，系统会从这些主题中选择相关的10个，并基于用户的实际行为数据生成相应的问题和答案。

重要的是，为了确保答案的准确和致，系统还加入了个"自我反思"机制。生成答案后，模型会重新检查这个答案是否与用户的实际行为数据致，如果发现不匹配或不理的地，就会进行修正。这个过程就像是让AI当自己的老师，不断检查和改进自己的理解能力。

通过这种式，UserU数据集成功地将用户行为数据与语义理解能力结起来，为后续的模型训练提供了坚实的基础。

二、分层次的用户行为编码系统

面对支付宝用户产生的海量多模态行为数据，如何让大语言模型有理解和处理这些信息是个巨大挑战。传统的法要么过于粗糙，丢失了重要的细节信息，要么过于复杂鹤壁橡塑胶，致计率低下。

研究团队设计了个巧妙的分层编码架构，这个系统的工作原理就像是个智能的信息筛选器。它分为三个层次，每个层次都注于不同粒度的信息提取和整。

底层是事件编码，它处理的是原始、细粒度的用户行为数据。每笔支付记录、每次小程序使用、每个搜索查询都被单编码成向量表示。这就像是为每个具体行为贴上个属标签，保留了行为的完整细节信息。

中间层是模态编码，它的作用是对同类型的行为进行汇总和抽象。比如，将个月内所有的支付行为整成个支付模态的总体特征，将所有的搜索记录整成搜索偏好的概括描述。这个过程通过平均池化等技术实现，既保留了关键信息，又显著降低了数据复杂度。

顶层是用户编码，它将所有模态的信息进步整，形成用户的全局行为特征。这就像是从各个角度观察个人后，形成对这个人的整体印象。

这种分层设计的巧妙之处在于，它允许大语言模型根据具体的查询需求，选择地关注不同层次的信息。当需要进行精细分析时，模型可以入到事件别；当需要快速判断时，模型可以依赖用户的抽象特征。这种灵活大大提了系统的率和准确。

重要的是，这个分层架构还通过门的适配器网络，将稀疏的行为数据转换成与大语言模型兼容的密集向量表示，有解决了模态差异问题。

三、查询锚定的双塔训练架构

Query-as-Anchor的核心创新在于它的双塔训练架构。这个设计可以比作个智能的翻译系统，边处理用户的行为"语言"，另边处理业务场景的需求"语言"，然后在中间建立起准确的对应关系。

锚点塔负责处理用户数据和查询指令。它接收前面提到的分层用户行为编码，然后在序列末尾添加个自然语言查询作为"锚点"。这个查询可能是"这个用户的风险如何？"或者"这个用户对外服务的兴趣程度是多少？"等具体的业务问题。通过将查询放在序列末尾，大语言模型就像个业顾问样，会根据具体问题来重新审视和整用户信息，终输出个针对的用户表示。

语义塔则门处理答案信息。它将标准答案或目标结果编码成向量表示，为锚点塔提供学习目标。这两个塔虽然立工作，但共享相同的大语言模型参数，确保它们在同个语义空间内理解和表示信息。

训练过程采用了个精心设计的联优化策略。面，系统使用对比学习来确保相关的用户-查询-答案三元组在向量空间中距离近，而不相关的组距离远。这就像是训练系统识别"物以类聚"的规律。

另面，系统还使用了下词预测任务来增强语义理解能力。锚点塔不仅要生成用户表示，还要能够逐词生成目标答案，这大大提了模型对用户行为层含义的理解能力。

特别值得注意的是，训练过程还加入了个智能的负样本过滤机制。在对比学习中，选择适的负样本至关重要。系统会自动识别和排除那些可能造成误的"假负样本"——即看似不匹配但实际上理的用户-答案组。这种机制显著提了训练果的稳定和准确。

四、场景适应的软提示调优

虽然Query-as-Anchor框架已经具备了很强的场景适应能力，但研究团队发现，在面对具体业务场景时，仍然存在通用预训练与门业务逻辑之间的语义鸿沟。为了解决这个问题，他们引入了个巧妙的软提示调优机制。

这个机制的工作原理就像是给通用模型配备了"智能眼镜"。不同的业务场景对应不同的"镜片"，当模型需要处理特定任务时，就戴上相应的"眼镜"鹤壁橡塑胶，从而能够清楚地看到该场景下的关键信息。

具体来说，软提示调优通过引入少量可学习的提示词向量来实现场景定制化。这些提示词就像是给模型提供的"小抄"，告诉它在当前场景下应该关注哪些信息。重要的是，这个过程只需要训练这些新增的提示词参数，而不需要修改庞大的基础模型参数，因此既又经济。

训练过程采用了基于聚类的原型对比损失函数。系统为每个业务类别维护个可学习的原型中心，训练过程中会将同类用户的表示向对应的原型中心拉近，pvc管道管件胶同时开不同类别的表示。这种设计确保了模型在不同场景下能够形成清晰的决策边界。

令人惊喜的是，通过对比分析软提示调优前后的注意力权重变化，研究团队发现模型确实学会了场景化的信息筛选。比如，在外兴趣预测场景下，模型对支付行为数据的关注度提了26，因为支付数据能反映用户的购买力。而在蚂蚁森林参与度预测中，模型对航路径数据的关注度提升了6.4，因为这类数据能体现用户的应用内活跃度。

五、部署的缓存优化策略

工业应用的个关键要求是能够同时支持多个业务场景的实时理，而且要在严格的延迟限制下完成。Query-as-Anchor框架通过个巧妙的键值缓存优化策略解决了这个挑战。

这个优化策略的核心思想是"次编码，多次使用"。系统将用户行为编码过程分为两个阶段：重计量的用户前缀编码和轻量的查询后缀处理。

在用户前缀编码阶段，系统会将用户的完整行为数据进行次的度编码，生成对应的键值缓存。这个过程虽然计量大，但只需要执行次，生成的缓存可以在多个查询中重复使用。

当需要针对不同场景生成用户表示时，系统只需要处理相应的查询指令，并将其与已缓存的用户前缀进行拼接。由于查询指令通常很短，这个过程的计开销微乎其微。

这种设计带来了显著的率提升。假设需要为同用户生成N个不同场景的表示，传统法需要进行N次完整的编码过程，而Query-as-Anchor只需要次用户编码加上N次轻量的查询处理。当N较大时，率提升非常明显。

在支付宝的实际部署中，这种优化策略使得系统能够用单个额外的L20 GPU就支持个新的业务场景，而传统法可能需要重新部署整个100 GPU的集群。这大大降低了多场景服务的成本和复杂度。

六、的实验验证与果分析

为了验证Query-as-Anchor框架的有，研究团队进行了全位的实验评估，包括离线实验和大规模在线A/B测试。

离线实验覆盖了支付宝生产系统中的10个真实业务场景，分为用户参与度、风险控制和营销敏感度三大类。每个场景都包含约50万个测试样本，确保了评估结果的可靠。

在用户参与度场景中，Query-as-Anchor在所有4个子任务上都取得了佳能。特别是在蚂蚁森林参与度预测中，AUC指标达到了0.9716，相比强基线模型提升了约13。这表明模型能够准确识别哪些用户可能参与环保活动。

风险控制场景的结果加令人印象刻。在反检测中，系统的KS值（用于衡量模型区分能力的关键指标）达到了0.7086，大幅越了传统法。在反洗钱场景中，AUC指标达0.9439，这意味着系统能够以很的准确率识别可疑的资金流动模式。

营销敏感度场景的表现同样出。在敏感度预测中鹤壁橡塑胶，Query-as-Anchor的AUC从基础版本的0.7979提升到软提示调优版本的0.8535，提升幅度接近7。这种改进对于营销具有重大意义，能够显著提营销活动的转化率。

重要的是，消融实验清楚地展示了框架各个组件的贡献。移除对比学习组件后，平均AUC从0.8104下降到0.7667，证明了对比学习在建立用户-场景对应关系中的关键作用。移除分层编码结构后，能也有明显下降，验证了这种设计的有。

大规模在线A/B测试进步证实了系统的实用价值。在智能语音外呼的现金储备广场景中，使用Query-as-Anchor的策略使提取率提了12.5，人均未偿余额增加了5.3。在信贷风险识别场景中，关键的KS指标提升了1.96，这在风控域是个相当显著的改进。

七、技术创新的度剖析

奥力斯保温护角专用胶批发联系人：王经理手机：13903175735（微信同号）地址：河北省任丘市北辛庄乡南代河工业区

Query-as-Anchor框架的技术创新体现在多个层面，每个创新点都针对工业用户表示学习的特定挑战。

先是数据层面的创新。UserU数据集的构建解决了用户理解训练数据稀缺的根本问题。通过结规则基础的未来行为预测和大语言模型生成的问答理解任务，系统获得了丰富的监督信号。特别是自反思数据生成机制，确保了成数据与真实用户行为的致，这对于提模型的实用至关重要。

架构层面的创新主要体现在分层编码和双塔设计上。分层编码有解决了多模态异构数据的整问题，而双塔架构则实现了行为理解和场景适配的解耦。这种设计不仅提了模型的灵活，还为后续的优化和扩展提供了便利。

训练策略的创新体现在联对比-生成优化目标上。对比学习确保了表示的判别，而生成任务增强了语义理解能力。这种结避了单目标可能致的表示坍缩或语义贫乏问题。

部署优化的创新则解决了工业应用的率需求。键值缓存策略实现了计复用，软提示调优提供了轻量的场景定制化能力。这些创新使得系统能够在保持能的同时，满足大规模部署的成本和延迟要求。

八、实际应用果与业务价值

Query-as-Anchor框架在支付宝的实际部署展现了显著的业务价值。系统目前每日为数亿用户生成个化表示，支撑着风险控制、营销、用户运营等多个核心业务场景。

在风险控制域，系统的部署大大提了检测和反洗钱的准确。传统的规则基础系统往往存在较的误报率，而Query-as-Anchor通过度理解用户行为模式，能够准确地区分正常用户和风险用户。这不仅降低了业务风险，还了正常用户的使用体验。

营销面的改进同样令人印象刻。通过准确地识别用户对不同产品和服务的兴趣程度，系统能够实现的内容荐和营销投放。这不仅提了营销活动的转化率，还减少了对用户的骚扰，提升了整体用户满意度。

用户运营场景中，系统能够帮助业务团队好地理解用户需求和行为模式，从而制定有的用户增长和留存策略。比如，通过分析用户对不同的使用模式，可以优化产品设计和布局。

从技术角度来看，Query-as-Anchor的部署也带来了显著的运维益。传统的多场景用户表示系统需要为每个场景维护立的模型，致系统复杂度、维护成本大。而Query-as-Anchor通过统的框架支持多个场景，大大简化了系统架构和运维流程。

九、局限分析与未来展望

尽管Query-as-Anchor框架取得了显著成功，但研究团队也诚实地分析了其局限和改进空间。

先是模型规模的悖论问题。实验发现，在固定的训练数据和计预下，大的模型（1.5B和3B参数）并不定带来好的能，有时甚至出现能下降。这种现象被称为"嵌入缩放悖论"，表明嵌入质量的提升多依赖于训练数据的质量和多样，而非简单的参数增加。

其次是跨域泛化能力的限制。虽然系统在支付宝生态内表现优异，但在迁移到其他平台或域时可能面临适应挑战。这主要是因为不同平台的用户行为模式和业务逻辑存在差异。

另外，软提示调优虽然提供了场景定制化能力，但对于快速变化的业务需求，仍然需要定的重训练时间。如何实现加灵活和快速的场景适配仍是个待解决的问题。

针对这些局限，研究团队提出了几个重要的未来研究向。先是探索梯度恢复和自适应参数调优技术，以克服大模型训练中的优化平台期，从而充分发挥大模型的潜力。其次是研究加通用的跨域迁移法，使系统能够容易地适应不同的应用场景。

此外，团队还计划探索加动态的场景适配机制，比如基于元学习的快速适应法，以及实时的用户行为模式检测和适配技术。这些创新有望进步提升系统的灵活和实用。

说到底，Query-as-Anchor框架代表了用户表示学习域的个重要进展。它不仅解决了工业应用中的多个技术挑战，还为这域的未来发展指明了向。随着技术的不断成熟和完善，我们可以期待看到多基于这框架的创新应用，进步我们的数字生活体验。

这项研究的成功也展示了产学作的力量。通过结蚂蚁集团的丰富应用场景和数据资源，以及学术机构的理论创新能力，研究团队能够开发出既具有理论度又有实用价值的技术案。这种作模式值得在多域广和借鉴。

Q&A

Q1：Query-as-Anchor框架解决了什么核心问题？

A：Query-as-Anchor解决了传统用户画像"刀切"的问题。传统法为每个用户生成固定的表示，法根据不同业务场景调整。而这个框架能根据具体查询（如风险评估或商品荐）动态生成针对的用户表示，就像个智能变龙，在不同场景下展现不同特征。

Q2：这个技术在支付宝的实际应用果如何？

A：在支付宝的大规模A/B测试中，Query-as-Anchor在多个场景都取得显著提升。智能语音外呼场景中提取率提12.5，信贷风险识别的KS指标提升1.96。同时大大降低了系统复杂度，新增业务场景只需个额外GPU，而传统法需要整个100-GPU集群。

Q3：软提示调优技术是如何工作的？

A：软提示调优就像给通用模型配备智能眼镜。不同业务场景对应不同镜片鹤壁橡塑胶，当模型处理特定任务时戴上相应眼镜，就能清楚看到关键信息。它只训练少量提示词参数，不修改基础模型，既又经济。实验显示，外场景下模型对支付数据关注度提26。

相关词条:储罐保温异型材设备钢绞线厂家玻璃丝棉厂家万能胶厂家

集团用户鹤壁橡塑胶马伊 Query-as-Anchor

推荐资讯

鹤壁橡塑胶蚂蚁集团出Query-as-Anchor用户画像革命

沈阳橡塑胶闺女哭着说“我妈妈吃人了”, 盆盆吃, 明天幼儿

宣城泡沫板橡塑板专用胶巴基斯坦给提了醒，旦印度染指瓦罕走廊

连云港橡塑专用胶广森普法丨借出40万朋友赖账，没有转账记录

鹤壁橡塑胶 蚂蚁集团出Query-as-Anchor用户画像革命

沈阳橡塑胶 闺女哭着说“我妈妈吃人了”, 盆盆吃, 明天幼儿

宣城泡沫板橡塑板专用胶 巴基斯坦给提了醒，旦印度染指瓦罕走廊

连云港橡塑专用胶 广森普法丨借出40万朋友赖账，没有转账记录

鹤壁橡塑胶蚂蚁集团出Query-as-Anchor用户画像革命

沈阳橡塑胶闺女哭着说“我妈妈吃人了”, 盆盆吃, 明天幼儿

宣城泡沫板橡塑板专用胶巴基斯坦给提了醒，旦印度染指瓦罕走廊

连云港橡塑专用胶广森普法丨借出40万朋友赖账，没有转账记录