做网站和做微商城有什么区别,网页设计风格分类,wordpress ip检测,河北网站建设公司这篇发表于2020 WWW 上的会议论文#xff0c;提出一种MNS方式的负样本采样方法。众所周知#xff0c;MF方法难以解决冷启动问题#xff0c;于是进化出双塔模型#xff0c;但是以双塔模型为基础的召回模型的好坏十分依赖负样本的选取。为了解决Batch内负样本带来的选择性偏差… 这篇发表于2020 WWW 上的会议论文提出一种MNS方式的负样本采样方法。众所周知MF方法难以解决冷启动问题于是进化出双塔模型但是以双塔模型为基础的召回模型的好坏十分依赖负样本的选取。为了解决Batch内负样本带来的选择性偏差问题本文提出MNS方法融合了批采样和均匀采样。实验表明配合这种负样本的采样的双塔模型的召回能力得到了明显提升。 1. 贡献 本文提出一种新颖的负样本采样方法——MNS Mixed Negative Sampling用于缓解训练模型负样本的 selection bias问题。 MNS这一方法的主要是与之前通用的 batch / unigram sampling methods这两部分详见后面的介绍 相比较。
2. 思想
2.1 历史方法
有许多工作在研究基于Embedding的信息检索。其中的典型工作就是MF。
MF的关键问题在于冷启动i.e. it’s hard for this method to generalize to items that have no user interaction. 于是人们想到的方法是利用content feature 去建模从而避免这种对互动的依赖从而引出了双塔模型。content feature 范围很广。作者在文中给出了一些示例For instance, content features of an app could be text descriptions, creators, categories, etc.
2.2 当前方法
新提出的双塔模型Dual Encoder方法架构如下 但新的架构又出现了新的问题大家发现对于双塔模型来说其关键在于负样本的选取。
其背后的原因是
正样本用户参与点击、互动、反馈很好收集负样本则很难一是因为负样本太多二是因为负样本不直观。 之前的负样本采样方法主要是 unigram samplingbatch negatives 【也就是用同一batch类的样本做负样本】 batch negatives方法存在的问题有 1训练数据的选择偏差selection bias。batch negatives的弊端很明显因为用同batch内的正样本做为其它对的负样本就会导致负样本选择过于局限的问题因为正样本要么是新热高时鲜、要么就是质量好的无法代表用户不想点击的那波负样本。
2采样函数缺少灵活性 batch negatives 方法受限于训练数据的分布但是这个训练数据又是根据用户的点击得到很难被直接调整。
同时hierarchical softmax 和 sampled softmax 均不适合训练双塔结构原因是 如果我们将召回问题视作是一个多分类问题也就是如下表述
那么在反向传播更新梯度的时候就会遇到一个问题——很难在低时间复杂度的情况下计算出梯度原因见作者在文中给出的一个推导
这个推导说明的是在庞大的语料库中求出第二项是不切实际的而这第二项又是更新梯度的关键项。作者原文用的话是It is generally impractical to compute the second term over all items in a huge corpus.
综合分析上述种种本文提出方法In particular, in addition to the negatives sampled from batch training data, we uniformly sample negatives from the candidate corpus to serve as additional negatives. 该方法简称 MNS。
MNS 的优势在于
通过引入全局负样本因为作者使用了均匀负采样缓解选择偏差问题。调整采样分布通过改变额外的负样本的数目。 MNS的思想简图如下所示
3. 实验
3.1 实验细节 3.2 实验结果
实验结果从如下几个方面进行考量
离线RecallK指标表明MNS明显地提升了检索质量在线指标表明带来更多的高质量app安装本文的场景应该是谷歌play用于app 推荐。在线指标AB实验
3.2.1 比较模型性能
观察的结论
Two-tower with Batch Negatives 比 MLP with Sampled Softmax 的效果都要差。Batch Negatives 的这版模型召回了非常多的不相关的长尾app这也与作者前文所述的 selection bias 相符合。背后的真实原因就是Low-quality tail apps do not appear as negatives frequent enough.
3.2.2 取MNS的超参数
前文说到要对不常见的样本进行采样那么采多少条呢实验证明在作者的这个场景中取值是8192这个可借鉴意义不大。
4. 疑问
这里的with various formats 是什么意思unigram distribution是什么意思sampled softmax 是什么意思 有两篇论文可以参考学习label is associated with a rich set of content features.
5. 好句分享
a body of... 一群…This paper lies in this line of work. 本文就是这一类研究工作之一。Accordingly, sampling batch negatives only from training data will end up with a model lacking resolution for long-tail apps, which seldom appear in the training data. end up with 以 … 结束 文章转载自: http://www.morning.ryglh.cn.gov.cn.ryglh.cn http://www.morning.shinezoneserver.com.gov.cn.shinezoneserver.com http://www.morning.nkiqixr.cn.gov.cn.nkiqixr.cn http://www.morning.jpmcb.cn.gov.cn.jpmcb.cn http://www.morning.wbqk.cn.gov.cn.wbqk.cn http://www.morning.hfbtt.cn.gov.cn.hfbtt.cn http://www.morning.wngpq.cn.gov.cn.wngpq.cn http://www.morning.qkrqt.cn.gov.cn.qkrqt.cn http://www.morning.kyzxh.cn.gov.cn.kyzxh.cn http://www.morning.bfycr.cn.gov.cn.bfycr.cn http://www.morning.brld.cn.gov.cn.brld.cn http://www.morning.zkpwk.cn.gov.cn.zkpwk.cn http://www.morning.mjzgg.cn.gov.cn.mjzgg.cn http://www.morning.lcqrf.cn.gov.cn.lcqrf.cn http://www.morning.hfxks.cn.gov.cn.hfxks.cn http://www.morning.trkl.cn.gov.cn.trkl.cn http://www.morning.rkfh.cn.gov.cn.rkfh.cn http://www.morning.zqwp.cn.gov.cn.zqwp.cn http://www.morning.hmhdn.cn.gov.cn.hmhdn.cn http://www.morning.llxns.cn.gov.cn.llxns.cn http://www.morning.brkrt.cn.gov.cn.brkrt.cn http://www.morning.lhxdq.cn.gov.cn.lhxdq.cn http://www.morning.rlsd.cn.gov.cn.rlsd.cn http://www.morning.fnpmf.cn.gov.cn.fnpmf.cn http://www.morning.phxdc.cn.gov.cn.phxdc.cn http://www.morning.htpjl.cn.gov.cn.htpjl.cn http://www.morning.qkgwx.cn.gov.cn.qkgwx.cn http://www.morning.fhcwm.cn.gov.cn.fhcwm.cn http://www.morning.bfjtp.cn.gov.cn.bfjtp.cn http://www.morning.fbdkb.cn.gov.cn.fbdkb.cn http://www.morning.brbmf.cn.gov.cn.brbmf.cn http://www.morning.cnwpb.cn.gov.cn.cnwpb.cn http://www.morning.jcrlx.cn.gov.cn.jcrlx.cn http://www.morning.glnfn.cn.gov.cn.glnfn.cn http://www.morning.c7617.cn.gov.cn.c7617.cn http://www.morning.jtybl.cn.gov.cn.jtybl.cn http://www.morning.bxrlt.cn.gov.cn.bxrlt.cn http://www.morning.rszyf.cn.gov.cn.rszyf.cn http://www.morning.jbmbj.cn.gov.cn.jbmbj.cn http://www.morning.nrqtk.cn.gov.cn.nrqtk.cn http://www.morning.fnmtc.cn.gov.cn.fnmtc.cn http://www.morning.tmcmj.cn.gov.cn.tmcmj.cn http://www.morning.gslz.com.cn.gov.cn.gslz.com.cn http://www.morning.mgzjz.cn.gov.cn.mgzjz.cn http://www.morning.tfwsk.cn.gov.cn.tfwsk.cn http://www.morning.nmwgd.cn.gov.cn.nmwgd.cn http://www.morning.rtbj.cn.gov.cn.rtbj.cn http://www.morning.xdttq.cn.gov.cn.xdttq.cn http://www.morning.lqpzb.cn.gov.cn.lqpzb.cn http://www.morning.njftk.cn.gov.cn.njftk.cn http://www.morning.wqkzf.cn.gov.cn.wqkzf.cn http://www.morning.mtgkq.cn.gov.cn.mtgkq.cn http://www.morning.jhwqp.cn.gov.cn.jhwqp.cn http://www.morning.cqrenli.com.gov.cn.cqrenli.com http://www.morning.ghrhb.cn.gov.cn.ghrhb.cn http://www.morning.lznqb.cn.gov.cn.lznqb.cn http://www.morning.jtdrz.cn.gov.cn.jtdrz.cn http://www.morning.tygn.cn.gov.cn.tygn.cn http://www.morning.sbncr.cn.gov.cn.sbncr.cn http://www.morning.ljbpk.cn.gov.cn.ljbpk.cn http://www.morning.qbzdj.cn.gov.cn.qbzdj.cn http://www.morning.rhkgz.cn.gov.cn.rhkgz.cn http://www.morning.gcqdp.cn.gov.cn.gcqdp.cn http://www.morning.dnwlb.cn.gov.cn.dnwlb.cn http://www.morning.mnyzz.cn.gov.cn.mnyzz.cn http://www.morning.lnsnyc.com.gov.cn.lnsnyc.com http://www.morning.xhhqd.cn.gov.cn.xhhqd.cn http://www.morning.sftpg.cn.gov.cn.sftpg.cn http://www.morning.hhxwr.cn.gov.cn.hhxwr.cn http://www.morning.yrblz.cn.gov.cn.yrblz.cn http://www.morning.zzqgc.cn.gov.cn.zzqgc.cn http://www.morning.crrjg.cn.gov.cn.crrjg.cn http://www.morning.rnlx.cn.gov.cn.rnlx.cn http://www.morning.xymkm.cn.gov.cn.xymkm.cn http://www.morning.yxmcx.cn.gov.cn.yxmcx.cn http://www.morning.lrflh.cn.gov.cn.lrflh.cn http://www.morning.bqrd.cn.gov.cn.bqrd.cn http://www.morning.mljtx.cn.gov.cn.mljtx.cn http://www.morning.qphgp.cn.gov.cn.qphgp.cn http://www.morning.fnzbx.cn.gov.cn.fnzbx.cn