旅行社网站建设需求分析,江苏省建设网站一号通,顶升网架公司,校园网上超市网站建设前言#xff1a;目前中长尾推荐的方法有很多#xff0c;主流的方法有几类比如:1)在没有项目ID嵌入的情况下提高推荐模型的鲁棒性#xff0c;2)利用有限的交互数据提高学习效率#xff0c;如使用元学习方法;3)利用物品侧面信息#xff0c;便于物品ID嵌入的初始化#xff0…前言目前中长尾推荐的方法有很多主流的方法有几类比如:1)在没有项目ID嵌入的情况下提高推荐模型的鲁棒性2)利用有限的交互数据提高学习效率如使用元学习方法;3)利用物品侧面信息便于物品ID嵌入的初始化4辅助数据引入包括知识图谱网络跨领域转换等等在优化的过程中结合自己的一些工作感觉是不是也可以从一致性的角度的来考虑这个问题这样的好处是有个统一的切分方式那么看到哪块还不一致是不是就可以作为一个未来的优化点一冷启动长尾问题存在哪些一致性问题1模型对待一致性主要方法为在没有项目ID嵌入的情况下提高推荐模型的鲁棒性在模型训练中对项目ID嵌入使用dropout或masking使得同模型对待缺失的特征鲁棒较好如《[NIPS2017]DropoutNet: Addressing Cold Start in Recommender Systems》在训练过程中加入dropout的机制使得模型不过度依赖于ID embedding而是其他内容特征。从而使得冷启动推荐主要是根据内容特征来进行推荐减小了不好的ID embedding的影响。2特征一致性主要方法认为高活和低活特征分布上存在差异通过拉齐特征的分布来缓解这个问题代表的文章如《ESAM: Discriminative Domain Adaptation with Non-Displayed Items to Improve Long-Tail Performance》ESAM认为“曝光item”与“未曝光item”的特征之间的关系是一致的。比如无论曝光与否奢侈品牌的价格都要比普通品牌的价格要贵。如下图左所示“曝光item”与“未曝光item”的高阶特征(embedding的不同维度)之间的关系也应该保持不变。所下图右所示3用户和参数一致性主要思路在于得到一个适用与该用户的模型并可以在查询集上得到较好的效果。大部分采用元学习的思路。如《MeLU:Meta-Learned User Preference Estimator for Cold-Start Recommendation》主要包含两个集合分别是支持集support set和查询集query set两个集合分别用于计算训练loss和测试loss。在局部更新时主要在支持集训练过程上进行参数优化在全局更新时在查询集上最小化损失。训练模型快速地从一个新的包含少量样本训练阶段从未见过的的数据集上进行学习。