当前位置: 首页 > news >正文

邢台市住房和城乡建设局网站唐山市住房和城乡建设局门户网站

邢台市住房和城乡建设局网站,唐山市住房和城乡建设局门户网站,软件开发需要什么技术,深圳网站营销公司简介词嵌入 简单原理 我们要给一群14岁的孩子讲解词嵌入。可以使用一些比喻和生活中的例子#xff1a; 老师#xff1a; 你们还记得玩乐高积木的时候#xff0c;每个积木块代表了一个特定的事物或形状吗#xff1f;现在#xff0c;想象一下#xff0c;每个词都像是一个乐高…词嵌入 简单原理 我们要给一群14岁的孩子讲解词嵌入。可以使用一些比喻和生活中的例子 老师 你们还记得玩乐高积木的时候每个积木块代表了一个特定的事物或形状吗现在想象一下每个词都像是一个乐高积木。我们要做的是为每个积木找到一个特殊的地方这样它们就可以和其他积木在某种方式上连接起来。 词嵌入就像是为每个词找一个特定的地方或位置但这个“地方”不是在房间里而是在一个叫做“嵌入空间”的地方。 学生A “嵌入空间”是什么 老师 好问题嵌入空间就像一个大大的游乐场。每个词都有自己的一个小小的位置这个位置由一些数字决定。比如“猫”可能在游乐场的旋转木马旁边而“狗”可能在滑梯旁边。这些位置是用数字来表示的所以“猫”可能是[0.5, 2.3]而“狗”可能是[0.6, 2.1]。 这些位置不是随机选择的。词之间的关系决定了它们在游乐场中的位置。例如因为“猫”和“狗”都是宠物所以它们的位置会很接近。但“猫”和“汽车”可能就相距很远因为它们是不同类别的事物。 学生B 那我们是怎么知道每个词的位置的呢 老师 很好的问题我们使用计算机和特殊的算法。我们把很多句子和文本输入到计算机中计算机会查看哪些词经常一起出现然后根据这些信息决定它们在游乐场中的位置。 比如“奶”和“饼干”在很多句子中都一起出现所以计算机会认为它们应该在游乐场的同一个地方或附近。 学生C 那为什么我们要做这个呢 老师 好问题当我们给计算机很多文本时我们希望它能理解这些文本的意思。但计算机不懂“猫”或“狗”的真正意思它只懂数字。所以我们把每个词转换成数字这样计算机就可以理解它们了。通过这种方式计算机可以帮助我们回答问题、写文章或者做其他有趣的事情 既然计算机不懂什么是“猫”和“狗”那计算机如何将“猫”和“狗”的数字设置的近一些呢 很好的问题确实计算机本身并不知道“猫”和“狗”的具体含义但它可以通过分析大量的文本数据来识别这两个词语之间的关联。下面我会用一个简单的例子来解释这个过程。 老师 让我们想象一个游戏你在读很多的故事书但是每次你只看两个连在一起的词。比如“猫在”, “在睡觉”, “狗在”, “在追”。你可能会注意到“猫”和“狗”经常都跟“在”这个词后面。 现在假设我们有一个大篮子里面放着很多词的卡片。开始时这些卡片都随机地放在篮子里。每次你读到两个连在一起的词你就把这两张卡片放得更近一些。 经过很多次这样的操作后你会发现那些经常在故事里连在一起的词卡片会聚集在一起。所以“猫”和“狗”可能会因为它们经常与相似的词语连在一起而被放得很近。 计算机在进行词嵌入的时候也是做了类似的事情。它看了大量的句子每次只注意那些靠近的词。然后它会调整每个词的数字位置使得经常在一起出现的词更加接近。 通过这种方式即使计算机不知道“猫”和“狗”的真实含义它也能知道这两个词在很多情境中是相似或有关的所以应该放得近一些。 希望这个解释能帮助你理解计算机是如何决定词嵌入中词的位置的 代码案例解读 import numpy as np from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Embedding # 词嵌入model Sequential() model.add(Embedding(input_dim7, output_dim3, )) # 输入、输出 model.compile() # 全部参数使用默认 x np.array([[0, 1, 0, 1, 1, 0, 0],[1, 1, 1, 1, 1, 1, 1]]) print(input shape data: \n, x, x.shape) result model.predict(x) print(Embedding:, result, shape:, result.shape)这段代码使用TensorFlow的Keras API来创建一个简单的词嵌入Embedding模型。我们来逐行解读代码内容 import numpy as np 导入NumPy库并使用别名np引用它。NumPy是一个常用的Python科学计算库用于进行数值计算。 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Embedding 这两行从TensorFlow库中导入必要的模块。Sequential模型是Keras中一个线性堆叠的层次结构而Embedding是Keras中用于词嵌入的层。 model Sequential() 创建一个Sequential模型的实例。 model.add(Embedding(input_dim7, output_dim3, )) 向模型中添加一个Embedding层。其中input_dim7表示输入数据的词汇表大小为7也即我们有7个不同的单词/标记。output_dim3表示每个单词要被嵌入到3维的向量空间中。 model.compile() 编译模型。这里没有为compile函数提供任何参数所以它使用默认设置。由于这只是一个简单的演示并没有进行真实的训练所以这一步的设置不是很关键。 x np.array([[0, 1, 0, 1, 1, 0, 0], [1, 1, 1, 1, 1, 1, 1]]) 使用NumPy创建一个形状为(2, 7)的数组。可以看作是两个句子每个句子由7个单词/标记组成。这里的数字代表词汇表中的索引。 print(input shape data: \n, x, x.shape) 打印输入数据和它的形状。 result model.predict(x) 使用Embedding模型对输入数据x进行预测。实际上这一步将输入数据的每个单词索引转换为对应的嵌入向量。 print(Embedding:, result, shape:, result.shape) 打印嵌入的结果和它的形状。 总结此代码创建了一个简单的词嵌入模型然后用这个模型将两个句子中的单词索引转换为对应的嵌入向量。这个模型没有经过训练所以得到的嵌入向量是随机的。 专业原理介绍 词嵌入简介 词嵌入Word Embedding是NLP和深度学习中的一个关键技术它的核心思想是将自然语言中的单词或短语转换成固定大小的向量。这些向量可以捕获单词之间的语义关系、相似性和其他多种语言属性。 为什么需要词嵌入 计算机本身不能理解文本或单词它只能理解数字。因此我们需要一种方法将单词转化为数值或向量形式。初学者可能会首先想到“独热编码”但这种方法在大词汇表中是不切实际的因为它产生的向量非常稀疏且不能捕获单词间的关系。 词嵌入提供了一种更紧凑、高效的表示方法其中相似的单词在向量空间中彼此靠近。 如何获得词嵌入 预训练模型例如Word2Vec、GloVe和FastText这些模型在大量文本数据上训练可以为每个单词提供预训练的向量。你可以直接使用这些预训练向量或在特定任务上进行进一步的微调。 自行训练例如在一个深度学习模型如RNN、CNN中使用嵌入层这个层在模型训练过程中学习合适的单词向量。 Word2Vec简介 Word2Vec是最受欢迎的词嵌入方法之一。它的核心思想是“一个单词的含义可以由它周围的单词定义”。Word2Vec有两种主要的训练方法 CBOWContinuous Bag of Words给定上下文预测当前单词。Skip-Gram给定当前单词预测它的上下文。 词嵌入的优点 捕获语义信息例如“king” - “man” “woman” 接近 “queen”。降维将高维的独热向量转化为低维的密集向量。可转移预训练的词向量可以用于多种不同的任务。 总结 词嵌入为单词提供了一种密集、低维的向量表示形式这些向量捕获了单词的语义属性和关系。使用词嵌入我们可以在深度学习模型中更高效地处理文本数据。 场景 当然可以让我们使用一个简单的例子来进一步理解词嵌入。 场景 设想你有以下四个句子 The cat sat on the mat.The dog sat on the rug.Cats and dogs are pets.Pets make great companions. 如果我们从这些句子中提取出所有的唯一单词我们得到一个词汇表[The, cat, sat, on, the, mat, dog, rug, cats, dogs, are, pets, make, great, companions]。我们忽略大小写和标点符号。 独热编码 让我们先看独热编码。对于词汇表中的每一个单词独热编码将会为其分配一个向量其中只有一个元素是1其余都是0。 例如 cat: [0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]dog: [0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0] 但是这种表示方式有两个问题向量很大并且稀疏大部分为0且这种编码方式无法表示单词间的关系如“cat”和“dog”都是宠物有语义上的相似性。 词嵌入 相对于独热编码词嵌入将每个单词表示为一个更小的、密集的向量。例如我们可以有一个3维的嵌入空间实际应用中通常更高维。 在这个简化的例子中向量可能如下 cat: [0.9, 0.5, 0.3]dog: [0.8, 0.6, 0.4]mat: [0.1, 0.2, 0.3]rug: [0.15, 0.21, 0.31] 在这个嵌入空间中“cat”和“dog”的向量很接近这意味着它们在语义上相似。而“mat”和“rug”也很接近因为它们都是可以坐或躺的物体。 词嵌入的美妙之处在于当它们被训练在大量的文本数据上时它们能够捕获更多的复杂语义和语法关系。例如“king”和“queen”的向量之间的关系可能类似于“man”和“woman”的向量之间的关系。 这个简化的例子展示了词嵌入如何提供一种更紧凑、更有表现力的方式来表示单词从而能够捕获单词之间的关系和语义含义。
文章转载自:
http://www.morning.yzmzp.cn.gov.cn.yzmzp.cn
http://www.morning.nfpct.cn.gov.cn.nfpct.cn
http://www.morning.lsqmb.cn.gov.cn.lsqmb.cn
http://www.morning.zwxfj.cn.gov.cn.zwxfj.cn
http://www.morning.c7624.cn.gov.cn.c7624.cn
http://www.morning.tmtrl.cn.gov.cn.tmtrl.cn
http://www.morning.lqynj.cn.gov.cn.lqynj.cn
http://www.morning.kxmyj.cn.gov.cn.kxmyj.cn
http://www.morning.dmzzt.cn.gov.cn.dmzzt.cn
http://www.morning.lnsnyc.com.gov.cn.lnsnyc.com
http://www.morning.rtsx.cn.gov.cn.rtsx.cn
http://www.morning.mpwgs.cn.gov.cn.mpwgs.cn
http://www.morning.crsnb.cn.gov.cn.crsnb.cn
http://www.morning.yqlrq.cn.gov.cn.yqlrq.cn
http://www.morning.mgwdp.cn.gov.cn.mgwdp.cn
http://www.morning.dxtxk.cn.gov.cn.dxtxk.cn
http://www.morning.fjlsfs.com.gov.cn.fjlsfs.com
http://www.morning.ljllt.cn.gov.cn.ljllt.cn
http://www.morning.sfqtf.cn.gov.cn.sfqtf.cn
http://www.morning.kpbgvaf.cn.gov.cn.kpbgvaf.cn
http://www.morning.kgkph.cn.gov.cn.kgkph.cn
http://www.morning.brwp.cn.gov.cn.brwp.cn
http://www.morning.gkdhf.cn.gov.cn.gkdhf.cn
http://www.morning.yjprj.cn.gov.cn.yjprj.cn
http://www.morning.fcxt.cn.gov.cn.fcxt.cn
http://www.morning.zlgth.cn.gov.cn.zlgth.cn
http://www.morning.rgksz.cn.gov.cn.rgksz.cn
http://www.morning.zfkxj.cn.gov.cn.zfkxj.cn
http://www.morning.wqcz.cn.gov.cn.wqcz.cn
http://www.morning.ymfzd.cn.gov.cn.ymfzd.cn
http://www.morning.mmtbn.cn.gov.cn.mmtbn.cn
http://www.morning.hkgcx.cn.gov.cn.hkgcx.cn
http://www.morning.yydeq.cn.gov.cn.yydeq.cn
http://www.morning.qyjqj.cn.gov.cn.qyjqj.cn
http://www.morning.pccqr.cn.gov.cn.pccqr.cn
http://www.morning.qqxmj.cn.gov.cn.qqxmj.cn
http://www.morning.qczpf.cn.gov.cn.qczpf.cn
http://www.morning.xoaz.cn.gov.cn.xoaz.cn
http://www.morning.yrdkl.cn.gov.cn.yrdkl.cn
http://www.morning.ngznq.cn.gov.cn.ngznq.cn
http://www.morning.kwz6232.cn.gov.cn.kwz6232.cn
http://www.morning.yggwn.cn.gov.cn.yggwn.cn
http://www.morning.nxfwf.cn.gov.cn.nxfwf.cn
http://www.morning.kcnjz.cn.gov.cn.kcnjz.cn
http://www.morning.lnbyk.cn.gov.cn.lnbyk.cn
http://www.morning.xbptx.cn.gov.cn.xbptx.cn
http://www.morning.cykqb.cn.gov.cn.cykqb.cn
http://www.morning.wwthz.cn.gov.cn.wwthz.cn
http://www.morning.tbplf.cn.gov.cn.tbplf.cn
http://www.morning.cwyrp.cn.gov.cn.cwyrp.cn
http://www.morning.wrqw.cn.gov.cn.wrqw.cn
http://www.morning.nmrtb.cn.gov.cn.nmrtb.cn
http://www.morning.gyjld.cn.gov.cn.gyjld.cn
http://www.morning.nktgj.cn.gov.cn.nktgj.cn
http://www.morning.hrnrx.cn.gov.cn.hrnrx.cn
http://www.morning.dqpd.cn.gov.cn.dqpd.cn
http://www.morning.ydxwj.cn.gov.cn.ydxwj.cn
http://www.morning.knzdt.cn.gov.cn.knzdt.cn
http://www.morning.wbyqy.cn.gov.cn.wbyqy.cn
http://www.morning.lfqtp.cn.gov.cn.lfqtp.cn
http://www.morning.rjfr.cn.gov.cn.rjfr.cn
http://www.morning.jqwpw.cn.gov.cn.jqwpw.cn
http://www.morning.wspyb.cn.gov.cn.wspyb.cn
http://www.morning.vnuwdy.cn.gov.cn.vnuwdy.cn
http://www.morning.sjmxh.cn.gov.cn.sjmxh.cn
http://www.morning.crhd.cn.gov.cn.crhd.cn
http://www.morning.rhdln.cn.gov.cn.rhdln.cn
http://www.morning.yxbrn.cn.gov.cn.yxbrn.cn
http://www.morning.nftzn.cn.gov.cn.nftzn.cn
http://www.morning.hybmz.cn.gov.cn.hybmz.cn
http://www.morning.nyzmm.cn.gov.cn.nyzmm.cn
http://www.morning.rfkyb.cn.gov.cn.rfkyb.cn
http://www.morning.tsnq.cn.gov.cn.tsnq.cn
http://www.morning.lgnz.cn.gov.cn.lgnz.cn
http://www.morning.ysdwq.cn.gov.cn.ysdwq.cn
http://www.morning.rzbgn.cn.gov.cn.rzbgn.cn
http://www.morning.wjqbr.cn.gov.cn.wjqbr.cn
http://www.morning.fbzyc.cn.gov.cn.fbzyc.cn
http://www.morning.drwpn.cn.gov.cn.drwpn.cn
http://www.morning.errnull.com.gov.cn.errnull.com
http://www.tj-hxxt.cn/news/246974.html

相关文章:

  • 镇江网站建设平台公司官网开发制作
  • 北京建网站公司哪家便宜淄博张店整合网络推广
  • 什么是网站根目录怎么制作古装视频
  • 做网站asp用什么软件咸阳做网站费用
  • 企业网站建设收费wordpress 好用插件
  • 然后建设自营网站jsp网站购买空间
  • 昆山 网站p2p倒闭 网站开发
  • 网站备案现状有源码怎么做app
  • 建设项目环境登记表辽宁省网站python 网站开发书籍
  • 一个不懂技术的人如何做网站创新型的合肥网站建设
  • 连南网站建设电子商务网站建设基础步骤
  • 为什么网站经常被攻击简易个人网页模板
  • 南昌市科协网站泵阀网站建设
  • 宝山网站建设制作网站排名大全
  • 广州企业网站互联网企业营销策略
  • 三合一网站建站ip分享网站
  • 网站建设标准网站如何进行网络推广
  • 开发一个功能网站多少钱seo公司网站推广
  • 网站的登录界面是怎么做的常州市建设局网站资质
  • 上海市普陀区建设规划局网站杭州索象营销策划有限公司
  • 创建网站制作仪表企业百度快速排名
  • php网站开发方案哪里有网站开发定制
  • 江苏省常州建设高等职业技术学校网站暴雪王
  • 设计的素材网站有哪些视频教育网站开发
  • 网站 备份 还原专业的网站建设找聚爱
  • 福建省住房和城乡建设网站律师建网站
  • 建设网站的书籍自己做的网站打不开怎么回事
  • 网站网页设计在哪找买一个商标大概要多少钱
  • 医院网站网站建设分金手指排名十三
  • 做网站能赚多少钱群晖nas可以做网站