当前位置: 首页 > news >正文

男人是用什么做的视频网站php网站漂浮广告代码

男人是用什么做的视频网站,php网站漂浮广告代码,wap 网站 源码,ps做网站的常用素材本文介绍了美团到家/站外投放团队在多场景建模技术方向上的探索与实践。基于外部投放的业务背景#xff0c;本文提出了一种自适应的场景知识迁移和场景聚合技术#xff0c;解决了在投放中面临外部海量流量带来的场景数量丰富、场景间差异大的问题#xff0c;取得了明显的效果… 本文介绍了美团到家/站外投放团队在多场景建模技术方向上的探索与实践。基于外部投放的业务背景本文提出了一种自适应的场景知识迁移和场景聚合技术解决了在投放中面临外部海量流量带来的场景数量丰富、场景间差异大的问题取得了明显的效果提升。希望能给大家带来一些启发或帮助。 1 引言 2 自适应场景建模 2.1 自适应场景知识迁移 2.2 自适应场景聚合 3 总结与展望 1 引言 美团到家Demand-Side Platform下文简称DSP平台主要负责在美团外部媒体上进行商品或者物料的推荐和投放并不断优化转化效果。随着业务的不断发展与扩大DSP对接的外部渠道越来越丰富、展示形式越来越多样物料展示场景的差异性愈发明显如开屏、插屏、信息流、弹窗等。 例如用户在午餐时间更容易点击【某推荐渠道下】【某App】【开屏展示位】的快餐类商家的物料而不是【信息流展示位】的啤酒烧烤类商家物料。场景间差异的背后本质上是用户意图和需求的差异因此模型需要对越来越多的场景进行定制化建设以适配不同场景下用户的个性化需求。 业界经典的Mixture-of-Experts架构MoE如MMoE、PLE、STAR[1]等能一定程度上适配不同场景下用户的个性化需求。这种架构将多个Experts的输出结果通过一个门控网络进行权重分配和组合以得到最终的预测结果。早期我们基于MoE架构提出了使用物料推荐渠道进行场景划分的多场景建模方案。然而随着业务的不断壮大场景间的差异越来越大、场景数量也越来越丰富这版模型难以适应业务发展不能很好地解决DSP背景下存在的以下两个问题 负迁移现象以推荐渠道为例由于不同推荐渠道的流量在用户分布、行为习惯、物料展示形式等方面存在差异其曝光数、点击率也不在同一个数量级如下图1所示不同渠道间点击率相差十分显著数据呈现典型的“长尾”现象。如果使用推荐渠道进行多场景建模的依据一方面模型会更倾向于学习到头部渠道的信息对于尾部渠道会存在学习不充分的问题另一方面尾部渠道的数据也会给头部渠道的学习带来“噪声”导致出现负迁移。 数据稀疏难以收敛DSP会在外部不同媒体上进行物料展示而用户在访问外部媒体时其所处的时空背景、上下文信息、不同App以及物料展示位等信息共同构成了当前的场景这样的场景在十万的量级每个场景的数据又十分稀疏导致模型难以在每个场景上得到充分的训练。 在面对此类建模任务时业界现有的方法是在不同场景间进行知识迁移。例如SAML[2]模型采用辅助网络来学习场景的共享知识并迁移至各场景的独有网络ADIN[3]和SASS[4]模型使用门控单元以一种细粒度的方式来选择和融合全局信息到单场景信息中。然而在DSP背景中复杂多变的流量背景下场景差异性导致了场景数量的急剧增长现有方法无法在巨量稀疏场景下有效。 因此在本文中我们提出了DSP背景下的自适应场景建模方案AdaScene, Adaptive Scenario Model同时从知识迁移和场景聚合两个角度进行建模。AdaScene通过控制知识迁移的程度来最大化不同场景共性信息的利用并使用稀疏专家聚合的方式利用门控网络自动选择专家组成场景表征缓解了负迁移现象同时我们利用损失函数梯度指导场景聚合将巨大的推荐场景空间约束到有限范围内缓解了数据稀疏问题并实现了自适应场景建模方案。 图1 不同渠道规模差异 2 自适应场景建模 在本节开始前我们先介绍多场景模型的建模方式。多场景模型采用输入层 Embedding   混合专家Mixture-of-Experts, MoE的建模范式其中输入信息包括了用户侧、商家侧以及场景上下文特征。多场景模型的损失由各场景的损失聚合而成其损失函数形式如下 其中K为场景数量α为各场景的损失权重值。 我们提出的AdaScene自适应场景模型主要包含以下2个部分场景知识迁移Knowledge Transfer模块以及场景聚合Scene Aggregation模块其模型结构如下图2所示。场景知识迁移模块自适应地控制不同场景间的知识共享程度并通过稀疏专家网络自动选择K个专家构成自适应场景表征。场景聚合模块通过离线预先自动化衡量所有场景间损失函数梯度的相似度继而通过最大化场景相似度来指导场景的聚合。 图2 自适应场景建模AdaScene示意图 下面我们分别介绍自适应场景知识迁移和场景聚合的建模方案。 | 2.1 自适应场景知识迁移 在多场景建模中场景定义方式决定了场景专家的学习样本很大程度上影响着模型对场景的拟合能力但无论采用哪种场景定义方式不同场景间用户分布都存在重叠用户行为模式也会有相似性。 为提升不同场景间共性的捕捉能力我们从场景特征和场景专家两个维度探索场景知识迁移的方法在以物料推荐渠道×App×展示形态作为多场景建模Base模型的基础上构建了如下图3所示的自适应场景知识迁移模型Adaptive Knowledge Transfer Network, AKTN。该模型建立了场景共享参数与私有参数的知识迁移桥梁能够自适应地控制知识迁移的程度、缓解负迁移现象。 图3 AKTNAdaptive Knowledge Transfer Network 场景特征适配在输入层根据场景信息对不同特征进行权重适配筛选出当前场景下模型最关注的特征场景知识迁移在隐层专家网络中进行知识迁移控制共享专家中共性信息向场景独有信息的流动使得场景共性信息得以传递。 这两种知识迁移方式互为补充、相辅相成共同提升多场景模型的预估能力。我们对比了不同模块的实验效果具体结果如下表1所示。可以看出引入场景知识迁移和特征权重优化在头部、尾部渠道都能带来一定提升其中尾部小流量场景上见下表1子场景2、3有更为明显的提升可见场景知识迁移缓解了场景之间的负迁移现象。 表1 AKTN实验效果 相关研究和实践表明[6][7][8]稀疏专家网络对于提高计算效率和增强模型效果非常有用。因此我们在AKTN模型的基础上在专家层进一步优化多场景模型。具体的我们将场景知识迁移层替换为自动化稀疏专家选择方法通过门控网络从大规模专家中选取与当前场景最相关的个构成自适应场景表征其选择过程如下图4所示 图4 稀疏专家网络示意图 在实践中我们通过使用可微门控网络对专家进行有效组合以避免不相关任务之间的负迁移现象。同时大规模专家网络的引入扩大了多场景模型的选择空间更好地支持了门控网络的选择。考虑到多场景下的海量流量和复杂场景特征在业界调研的基础上对稀疏专家门控网络进行了探索。 具体而言我们对以下稀疏门控方法进行了实践 方法一通过KL散度衡量子场景与各专家之间的相似度以此选择与当前场景最匹配的k个专家。在实现方式上使用场景*专家的二维矩阵计算相似性并通过KL散度选择出最适合的k个专家。 方法二每个子场景配备一个专家选择门控网络m个场景则有m个门控网络。对于每个场景的门控网络配备个k个单专家选择器[9]每个单专家选择器负责从n个专家中选择一个作为当前场景的专家n为Experts个数。在实践中为提高训练效率我们对单专家选择器中权重较小的值进行截断保证每个单专家选择器仅选择一个专家。 在离线实验中我们以物料推荐渠道 * 展示形态作为场景定义对上述稀疏门控方法进行了尝试离线效果如下表2所示 表2 稀疏门控方法效果 可以看出基于软共享机制的专家聚合方法能够更好地通过所激活的相同专家网络对各场景之间的知识进行共享。相较于常见的以截断方式为主的门控网络使用二进制编码的方式使得其在不损失其他专家网络信息的同时能够更好地收敛到目标专家数量同时其可微性使得其在以梯度为基础的优化算法中训练更加稳定。 同时为了验证稀疏门控网络能否有效区分不同场景并捕捉到场景间差异性我们使用n16个专家中选择K7个的例子对验证集中不同场景下各专家的利用率、选择专家的平均权重进行了可视化分析如图5-图7所示实验结果表明该方法能够有效地选择出不同的专家对场景进行表达。 例如图6中KP_1更多地选择第5个专家而KP_2更倾向于选择第15个专家。并且不同场景对各专家的使用率以及选择专家的平均权重也有着明显的差异性表明该方法能够捕捉到细分场景下流量的差异性并进行差异化的表达。 图5 同渠道下不同展示形式专家分布 图6 开屏展示不同渠道的专家分布 图7 信息流展示不同渠道的专家分布 实验证明在通过大规模专家网络对每个场景进行建模的同时基于软共享机制的专家聚合方法能够更好地通过所激活的相同专家网络对各场景之间的知识进行共享。同时为了进一步探索Experts个数对模型性能的影响我们在方法二的基础上通过调整专家个数和topK比例设计了多组对比实验实验结果如下表3所示 表3 方法二调参实验 从实验数据可以看出大规模的Experts结构会带来正向的离线收益并且随着选取专家个数比例的增加表3横轴模型整体的表现效果也有上升的趋势。 | 2.2 自适应场景聚合 理想情况下一条请求流量可以看作一个独立的场景。但如引言所述随着DSP业务持续发展不同的物料展示渠道、形式、位置等持续增加每个场景的数据十分稀疏我们无法对每个细分场景进行有效训练。 因此我们需要对各个推荐场景进行聚类、合并。我们使用场景聚合的方法对此问题进行求解通过衡量所有场景间的相似度并最大化该相似度来指导场景的聚合解决了数据稀疏导致难以收敛的问题。具体的我们将该问题表示为 因此我们在2.1节场景知识迁移模型的基础上增加了场景聚合部分提出了基于 Two-Stage 策略进行训练的场景聚合模型 Stage 1基于相似度衡量方法对各场景的相似度进行归纳并以最大化分组场景的相似度为目标找到各场景的最优聚合方式如Scene1与Scene 4可聚合为场景组合Scene Group SGA Stage 2基于Stage 1得到的场景聚合方式以交叉熵损失为目标函数最小化各场景下的交叉熵损失。 其中Stage 2与2.1节中所述一致本节主要针对Stage 1进行阐述。我们认为一个有效的场景聚合方法应该能自适应地应对流量变化的趋势能够发现场景之间的内在联系并依据当前流量特点自动适配聚合方法。我们首先想到的是从规则出发将人工先验知识作为场景聚合的依据按照推荐渠道、展示形式以及两者叉乘的方式进行了相应迭代。然而这类场景聚合方式需要可靠的人工经验来支撑且在应对海量流量时不能迅速捕捉到其中的变化。 因此我们对场景之间关系的建模方法进行了相关的探索。首先我们通过离线训练时场景之间的表征迁移和组合训练来评估场景之间的影响但这种方式存在组合空间巨大、训练耗时较长的问题效率较低。 在多任务的相关研究中[10][11][12][13]使用梯度信息对任务之间的关系进行建模是一种有效的方法。类似的在多场景模型中能够根据各场景损失函数的梯度信息对场景间的相似度进行建模因此我们采用多专家网络并基于梯度信息自动化地对场景之间的相似度进行求解模型示意如下图8所示 图8 场景聚合示意图 基于上述思路我们对场景之间的关系建模方法进行了以下尝试。 1. Gradient Regulation 基于梯度信息能够对场景信息进行潜在表示这一认知我们在损失函数中加入各场景损失函数关于专家层梯度距离的正则项整体的损失函数如下所示该正则项的系数表示场景之间的相似度为常见的评估梯度之间距离的方法比如距离。 2. Lookahead Strategy 3. Meta Weights Lookahead Strategy该方法对场景间的关系进行了显式建模但是这种根据损失函数的变化计算场景相关系数的策略存在着训练不稳定、波动较大的现象无法像Gradient Regulation这一方法对场景相似度进行求解。 我们以推荐渠道和展示形式是否开屏的多场景模型作为Base对上述3种方法做了探索。为了提高训练效率我们在设计 Stage 1 模型时做了以下优化 我们对每个方法的GAUC进行了比较实验效果如下表4所示。相较于人工规则基于梯度的场景聚合方法都能带来效果的明显提升表明损失函数梯度能在一定程度上表示场景之间的相似性并指导多场景进行聚合。 表4 场景聚合实验数据 为了更全面的展现场景聚合对于模型预估效果的影响我们选取Meta Weights进行分组数量的调优实验具体的实验结果如下表5所示。可以发现随着分组数的增大GAUC提升也越大此时各场景间的负迁移效应减弱但分组超过一定数量时场景间总体的相似度减小GAUC呈下降趋势。 表5 不同聚合场景数量实验数据 此外我们对Meta Weigts方法中部分场景间的关系进行了可视化分析分析结果如下图9所示。以场景作为坐标轴图中的每个方格表示各场景间的相似度颜色的深浅表示渠道间的相似程度大小。 图9 部分细分场景下的相似度示例 从图中可以发现以渠道和展示形式为粒度的细分场景下该方法能够学习到不同场景间的相关性例如A渠道下的信息流s16与其他场景的相关性较低会将其作为独立的场景进行预估而B渠道下的开屏展示s9与C渠道开屏展示s8相关性较高会将其聚合为一个场景进行预估同时该相似度矩阵不是对称的这也说明各场景间相互的影响存在着差异。 3 总结与展望 通过多场景学习的探索和实践我们深入挖掘了推荐模型在不同场景下的建模能力并分别从场景知识迁移、场景聚合方向进行了尝试和优化这些尝试提供了更好的理解和解释推荐模型对不同类型流量和场景的应对能力。然而这只是多场景学习研究的开始后续我们会探索并迭代以下方向 更好的场景划分方式当前多场景的划分主要还是依据渠道渠道*展示形态作为流量的划分方式未来会在媒体、展示位、媒体*时间等维度上进行更详细地探索 端到端的流量聚合方式在进行流量聚合时使用了Two-Stage的策略进行聚合。然而这种方式不能充分地利用流量数据中相关的信息。因此需要探索端到端的流量场景聚合方案将更直接和有效地提高推荐模型的能力。 结合多场景学习在未来的研究中将不断探索新的方法和技术以提高推荐模型对不同场景和流量类型的建模能力创造更好的用户体验以及商业价值。 4 作者简介 王驰、森杰、树立、文帅、尹华、肖雄等均来自美团到家事业群/到家研发平台/成都研发中心。 5 参考文献 [1] STARSheng, Xiang-Rong, et al. One model to serve all: Star topology adaptive recommender for multi-domain ctr prediction. Proceedings of the 30th ACM International Conference on Information Knowledge Management. 2021. [2] SAMLChen, Yuting, et al. Scenario-aware and Mutual-based approach for Multi-scenario Recommendation in E-Commerce. 2020 International Conference on Data Mining Workshops (ICDMW). IEEE, 2020. [3] ADINJiang, Yuchen, et al. Adaptive Domain Interest Network for Multi-domain Recommendation. Proceedings of the 31st ACM International Conference on Information Knowledge Management. 2022. [4]SASSZhang, Yuanliang, et al. Scenario-Adaptive and Self-Supervised Model for Multi-Scenario Personalized Recommendation. Proceedings of the 31st ACM International Conference on Information Knowledge Management. 2022. [5] Squeeze-and-ExcitationHu, Jie, Li Shen, and Gang Sun. Squeeze-and-excitation networks. Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. [6] 美团外卖推荐情境化智能流量分发的实践与探索 [7] PaLMhttps://ai.googleblog.com/2022/04/pathways-language-model-palm-scaling-to.html [8] GLaMhttps://proceedings.mlr.press/v162/du22c.html [9] 单专家选择器https://arxiv.org/abs/2106.03760 [10] HOAhttps://proceedings.mlr.press/v119/standley20a.html [11] Gradient Affinityhttps://proceedings.neurips.cc/paper/2021/hash/e77910ebb93b511588557806310f78f1-Abstract.html [12] SRDMLhttps://dl.acm.org/doi/abs/10.1145/3534678.3539442 [13] Auto-Lambdahttps://arxiv.org/abs/2202.03091 [14] MAMLhttps://arxiv.org/abs/1703.03400 ----------  END  ---------- 美团科研合作  美团科研合作致力于搭建美团技术团队与高校、科研机构、智库的合作桥梁和平台依托美团丰富的业务场景、数据资源和真实的产业问题开放创新汇聚向上的力量围绕机器人、人工智能、大数据、物联网、无人驾驶、运筹优化等领域共同探索前沿科技和产业焦点宏观问题促进产学研合作交流和成果转化推动优秀人才培养。面向未来我们期待能与更多高校和科研院所的老师和同学们进行合作。欢迎老师和同学们发送邮件至meituan.oimeituan.com。 推荐阅读  | KDD Cup 2020多模态召回比赛季军方案与广告业务应用 | KDD Cup 2020多模态召回比赛亚军方案与搜索业务应用 | 多业务建模在美团搜索排序中的实践
http://www.tj-hxxt.cn/news/130915.html

相关文章:

  • 网站建设评选打分学做网站论坛vip账号破解
  • 传统企业建设网站的内容门窗网站模板
  • 手机建设银行网站首页怎么下别人wordpress模板
  • 武陟网站建设苏州哪家保洁公司好
  • 济南外贸网站建设宁波建设教育培训网
  • 微信小程序传奇怎么制作seo文章推广
  • 优秀网站例子专业优化网站建设
  • 海外网站建设外贸是做什么的学什么专业
  • 石家庄红酒公司 网站建设广州白云区网站开发
  • 珠海网站seo建设一个机械公司网站多少钱
  • 哈尔滨做网站搭建的wordpress自动缩略图
  • 网站目录怎么做网站建设 镇江万达
  • 手机端开发网站模板下载中企动力科技股份官网
  • 外贸 国外推广网站网站开发设计工程师岗位职责
  • 上传网站教程做app多少钱
  • 自己做网站一定要实名吗开发公司挖出的沙子归谁
  • 金泉网 网站建设站群软件
  • 网站建设与运营的预算方案模板厦门住房和城乡建设局网站
  • 如何用七牛云做视频网站网站建设与运营合同
  • 邢台做网站建设优化制作公司金信wordpress 怎么样
  • 一流的盐城网站开发腾讯云服务器怎么做网站
  • 网站建站网站网站维护网站建设 seo商情网
  • 南安网站定制wordpress社交主题
  • 义乌外贸建网站珠峰网站建设
  • 在网站做推广要钱吗wordpress Nirvana
  • 单位还能建设网站吗哪里做网站域名不用备案
  • 中小网站公司做的推广怎么样祥符网站建设
  • a站怎么进哔哩哔哩网站开发图片
  • 辽宁营销型网站建设如何注册自己的工作室
  • 手机版网站开发框架开题报告旅游网站建设