当前位置: 首页 > news >正文

扶贫办门户网站建设管理办法有什么网站是专门做电商详情页

扶贫办门户网站建设管理办法,有什么网站是专门做电商详情页,企业培训十大热门课程,什么是理财北京网站建设公司我们在前面介绍的跳字模型与连续词袋模型有个缺陷就是在计算梯度时的开销随着词典增大会变得很大,因为每一步的梯度计算都包含词典大小数目的项的累加。为了降低这种带来的计算复杂度,介绍两种近似的处理方案:负采样和层序softmax负采样(Nega…

我们在前面介绍的跳字模型与连续词袋模型有个缺陷就是在计算梯度时的开销随着词典增大会变得很大,因为每一步的梯度计算都包含词典大小数目的项的累加。为了降低这种带来的计算复杂度,介绍两种近似的处理方案:负采样和层序softmax

负采样(Negative Sampling)

我们回顾下跳字模型给定中心词生成背景词的条件概率:

该条件概率相应的对数损失如下表示:

可以看到softmax运算考虑了背景词可能是词典V中的任一词,以上损失包含了词典大小数目的项的累加,复杂度大,于是出现新的方法来降低复杂度。

负采样修改了原来的目标函数,给定中心词的一个背景窗口,我们把背景词出现在该窗口当作一个事件,该事件的概率计算为:

其中的σ是sigmoid激活函数:

我们先考虑最大化文本序列中所有该事件的联合概率来训练词向量。具体来说,给定一个长度为T的文本序列,时间步t的词为且背景窗口大小为m,最大化联合概率:

然后,这里的模型中包含的事件仅考虑了正样本,这导致当所有词向量相等且值为无穷大时,上述联合概率才被最大化为1,很明显,这样的词向量毫无意义。负采样通过采样并添加负类样本使目标函数更有意义。

设背景词出现在中心词的一个背景窗口为事件P,我们根据分布P(w)采样K个未出现在该背景窗口的词,即噪声词。设噪声词(k=1,...,K)不出现在中心词的该背景窗口为事件。假设同时含有正类样本和负类样本的事件P,,...,相互独立,负采样将以上需要最大化的仅考虑正类样本的联合概率改写为:

其中条件概率被近似表示为:

设文本序列中时间步t的词在词典中的索引为i_t,噪声词w_k在词典中的索引为h_k,有关以上条件概率的对数损失为:

现在的训练中每步的梯度计算开销就不再跟词典大小有关,而跟K线性相关。所以当K较小时,负采样每步的梯度计算开销较小。

最后两步的推导,使用sigmoid激活函数验证下,是等价的

import numpy as np
np.log(sigmoid(-np.array([0.2,0.4,-0.8])))
np.log(1-sigmoid(np.array([0.2,0.4,-0.8])))
#array([-0.79813887, -0.91301525, -0.37110067])

层序softmax

另一种近似训练法,就是层序softmax,使用的是二叉树这样的数据结构,树的每个叶节点代表词典V中的每个词

假设L(w)为从二叉树的根节点到词w的叶节点的路径(包括根节点和叶节点)上的结点数。设n(w,j)为该路径上第j个结点,并设该节点的背景词向量为,画图来看下:

层序softmax将跳字模型中的条件概率近似表示为:

其中leftChild(n)表示结点n是否是左子节点,如果是的话就是1,反之为-1

这里我们来计算下从给定词生成词的条件概率(方向经过左->右->左),我们需要将的词向量和根节点到路径上的非叶节点向量一一求内积。

由于 ,给定中心词生成词典V中任一词的条件概率之和为1这一条件也满足

此外,由于L()-1的数量级为O(),当词典V很大时,层序softmax训练中每一步的梯度计算开销相较未使用近似训练时大幅降低。

http://www.tj-hxxt.cn/news/129795.html

相关文章:

  • 桂林网站建设兼职地产网
  • 东莞市视频直播网站开发建设网站天下
  • wap网站搭建邢台市网站开发公司有哪些
  • 南京定制网站建设公司网站数据查询
  • 30天网站建设 视频教程余姚外贸网站建设
  • 建设工程监理招标网站泸县做网站公司
  • 手机网站引导页js插件搜索竞价
  • 第三方网站备案昆明网站服务器
  • 怎样把自己做的网站放到网上宜宾三江新区核酸检测
  • 网站后台管理生成器做网站的市场风险分析及对策
  • 建设企业网站企业网上银行网站空间申请
  • 网站添加在线qq聊天公司管理培训课程
  • 网站推广与优化哪里好wordpress 取消响应式
  • 网站内容该怎么做php网站建设培训班
  • 电子商务网站建设.pdf怎样建立一个网站步骤
  • 比价网站模板朝阳区规划网站
  • 简洁商城网站模板公司部门网站设计模板
  • 四川省建设厅网站填报获奖杭州微信网站开发
  • 网站开发税收分类东莞网页制作最新招聘信息
  • ASP.NET2.0网站开发全程解析网站建设规划书300字
  • 福建漳州网站建设哪家便宜山东电商网站建设
  • 网站建设开发模式h5合肥城乡建设局官网
  • 八年级信技做网站分成型网站建设
  • 做门户网站开发的技术建设网站策划书
  • 珠海正规网站制作排名费用多少沈阳网站建设联系方式
  • 网站收录没排名网站开发的职业决策
  • 哪里可以在百度做网站公司门户网站首页
  • 库尔勒网站建设哪家好几百的网站
  • 联系我们网站模板html5网站用什么软件
  • 大型网站开发基本流程wordpress+漂亮的博客