当前位置: 首页 > news >正文 dede网站制作教程义乌来料加工网 news 2025/11/5 0:15:37 dede网站制作教程,义乌来料加工网,上海专业网站建设报价,新乡市红旗区建设局网站清华大学驭风计划课程链接 学堂在线 - 精品在线课程学习平台 (xuetangx.com) 代码和报告均为本人自己实现#xff08;实验满分#xff09;#xff0c;只展示主要任务实验结果#xff0c;如果需要详细的实验报告或者代码可以私聊博主 有任何疑问或者问题#xff0c;也欢…清华大学驭风计划课程链接 学堂在线 - 精品在线课程学习平台 (xuetangx.com) 代码和报告均为本人自己实现实验满分只展示主要任务实验结果如果需要详细的实验报告或者代码可以私聊博主 有任何疑问或者问题也欢迎私信博主大家可以相互讨论交流哟~~ 案例简介 情感分析旨在挖掘文本中的主观信息它是自然语言处理中的经典任务。在本次任务中我们将在影评 文本数据集Rotten Tomato上进行情感分析通过实现课堂讲授的模型方法深刻体会自然语言处 理技术在生活中的应用。 同学们需要实现自己的情感分析器包括特征提取器可以选择词袋模型、词向量模型和预训练模 型、简单的线性分类器以及梯度下降函数。随后在数据集上进行训练和验证。我们提供了代码框架 同学们只需补全 model.py 中的两个函数。 数据说明 我们使用来自Rotten Tomato的影评文本数据。其中训练集 data_rt.train 和测试集 data_rt.test 均 包含了3554条影评每条影评包含了文本和情感标签。示例如下 其中 1 表示这条影评蕴涵了正面感情后面是影评的具体内容。 文本特征提取 TODO补全 featureExtractor 函数 在这个步骤中同学们需要读取给定的训练和测试数据集并提取出文本中的特征输出特征向量。同学们需要实现词袋模型、词向量模型和预训练模型选做来生成句子表示并对比不同方法的表现有何差异。 Bag of Words得到句子的0-1向量选做用TFIDF计算句子向量 Word2Vec词向量求和/取平均选做实现Doc2Vec[1] 使用BERT得到[CLS]向量/词的隐状态取平均选做 训练分类器 TODO补全 learnPredictor 函数 我们提供的训练数据集中每句话的标签在文本之前其中 1 表示这句话蕴涵了正面感情 -1 表示这 句话蕴涵了负面感情。因此情感分析问题就成为一个分类问题。 同学们需要实现一个简单的线性分类器并推导出相应的梯度下降函数。 实验与结果分析 在训练集上完成训练后同学们需要在测试集上测试分类器性能。本小节要求同学们画出训练集上的损 失函数下降曲线和测试集的最终结果损失函数、准确率并对结果进行分析。 评分要求 同学们需要提交源代码和实验报告。实验报告中应包含以下内容 对hinge loss反向传播的理论推导请写出参数的更新公式。 对实验结果的分析请描述采用的模型结构、模型在训练集上的损失函数下降曲线和测试集的最终 结果并对结果进行分析。分析可以从模型的泛化能力、参数对模型性能的影响以及不同特征的影 响等方面进行。 [1] Distributed Representations of Sentences and Documents. https://arxiv.org/pdf/1405.4053.pdf 实验结果 1反向传播推导 2文本特征提取 2.1 使用 BOW 作为特征 从 loss 图来看训练的 loss 下降比测试的 loss 快很多但是相同点就是都在下降虽然中间测试的 loss 随着周期增大突然有个小的升高但是最终仍然总体趋势是下降的。然后再从训练准确率来看 train 的训练最终几乎饱满了测试的正确率也是最终达到最高所以开始我前面对于最佳学习率和迭代次数的精准把控做的很好才能得出最优结果最终测试错误值来到了 0.263 。 2.2 使用 N-gram 作为特征 从图中可以看出 loss 曲线不管是训练还是训练的 loss 都在下降跟前面的情况类似也是训练的 loss 下降很快而测试的 loss 下降较为平缓。从准确率图来看训练的也几乎饱满测试也是随着周期变大达到最高最终 test 的错误值为 0.238达到新低。可以看出我们调参的方法非常有效通过对多个学习率的运行找出了对于每个级别的最佳超参数并且精准把控训练轮数达到最优结果。 2.3 使用 BERT 得到[CLS]向量作为特征 首先从 loss 图可以看出训练和测试的 loss 的曲线非常接近没有出现前两个特征提取方法中差别较大的情况总体趋势也是训练的 loss 下降更快测试的 loss 紧跟其后。从准确率图来看训练和测试的准确率曲线几乎是同趋势变化特别已经很平稳说明训练基本已经充分了。最终测试的错误率来到了新底达到了约为 0.197 这个相比于前 面两种方法更好的结果。 3总结三种方法对比差异 这三种方法使用了不同的特征提取方式,导致最终结果的差异。让我详细解释一下可能的区别和影响。 词袋特征提取第一个方法 这个方法简单地对文本进行词级别的计数每个单词作为一个特征记录其出现的次数。缺点忽略了单词之间的顺序和上下文信息。如果两个句子有相似的单词分布但是顺序不同这种方法就不能捕捉到它们的相似性。 N-Gram 特征提取第二个方法 这个方法根据指定的 N 值可以是单词级别或字符级别提取 N-Gram 特征可以是词级别的 N-Gram 或字符级别的 N-Gram 还可以是混合级别的 N-Gram。 优点 能够更全面地考虑到文本中的不同信息从而提高了对文本特征的表示能力。词级别的 N-Gram 能够捕捉单词之间的关系而字符级别的 N-Gram 则能够捕捉到更细小的特征和局部模式这样结合起来可以在一定程度上弥补彼此的不足提高特征提取的效果。因此混合级别的 N-Gram 特征提取方法可能比单一级别的 N-Gram 提取更有效能够更全面地表示文本特征 缺点 对于大量的文本数据特征空间可能会变得非常大导致稀疏性增加同时可能引入一些噪音特征。 BERT 特征提取第三个方法 使用预训练的 BERT 模型提取文本的特征向量提取 [CLS] token 对应的隐藏状态作为整个句子的表示。 优点 BERT 模型在训练中学习到了大量语言表示能够捕捉更高级别、更全局的语义和句子系。 缺点 计算成本较高即使是对于轻量化版本的 BERT 模型也需要更多的计算资源比如在我的实验里运行 20 轮即使使用 GPU 也需要 40 分钟才能跑完相对于其他两种方法非常耗时。 当综合考虑时 BERT 特征提取方法表现更出色因为它能够捕捉更加丰富和高级别的语义信息。相比之下传统的词袋模型和 N-Gram 方法有时可能忽视句子的语义和上下文信息在表现上稍显不足。然而混合级别的 N-Gram 方法则能够在一定程度上弥补这些传统方法的缺陷。结合了词级别和字符级别的信息这种方法更全面地考虑了文本的局部模式和全局特征使得其能够更有效地提取特征。至于为什么 BERT 特征提取方法更为优越我认为原因在于 BERT 模型经过大规模训练具备了对语言表示更全面的学习能力。它能够理解和捕捉到文本中更深层次、更复杂的语义关系因此在处理这次情感分析实验时具有更好的表现。 文章转载自: http://www.morning.nqlnd.cn.gov.cn.nqlnd.cn http://www.morning.khfk.cn.gov.cn.khfk.cn http://www.morning.rkfxc.cn.gov.cn.rkfxc.cn http://www.morning.nfbxgtj.com.gov.cn.nfbxgtj.com http://www.morning.pctsq.cn.gov.cn.pctsq.cn http://www.morning.zmqb.cn.gov.cn.zmqb.cn http://www.morning.kjrlp.cn.gov.cn.kjrlp.cn http://www.morning.frtb.cn.gov.cn.frtb.cn http://www.morning.qbfqb.cn.gov.cn.qbfqb.cn http://www.morning.kzcfp.cn.gov.cn.kzcfp.cn http://www.morning.xdpjs.cn.gov.cn.xdpjs.cn http://www.morning.skmpj.cn.gov.cn.skmpj.cn http://www.morning.deupp.com.gov.cn.deupp.com http://www.morning.cwjsz.cn.gov.cn.cwjsz.cn http://www.morning.yrjfb.cn.gov.cn.yrjfb.cn http://www.morning.nmfml.cn.gov.cn.nmfml.cn http://www.morning.xptkl.cn.gov.cn.xptkl.cn http://www.morning.fllfz.cn.gov.cn.fllfz.cn http://www.morning.yktwr.cn.gov.cn.yktwr.cn http://www.morning.nqcts.cn.gov.cn.nqcts.cn http://www.morning.yzdth.cn.gov.cn.yzdth.cn http://www.morning.ggcjf.cn.gov.cn.ggcjf.cn http://www.morning.syfty.cn.gov.cn.syfty.cn http://www.morning.bypfj.cn.gov.cn.bypfj.cn http://www.morning.swsrb.cn.gov.cn.swsrb.cn http://www.morning.tgtwy.cn.gov.cn.tgtwy.cn http://www.morning.hmlpn.cn.gov.cn.hmlpn.cn http://www.morning.mzqhb.cn.gov.cn.mzqhb.cn http://www.morning.ylpl.cn.gov.cn.ylpl.cn http://www.morning.8yitong.com.gov.cn.8yitong.com http://www.morning.xtrnx.cn.gov.cn.xtrnx.cn http://www.morning.pjbhk.cn.gov.cn.pjbhk.cn http://www.morning.qbfkz.cn.gov.cn.qbfkz.cn http://www.morning.gsdbg.cn.gov.cn.gsdbg.cn http://www.morning.tztgq.cn.gov.cn.tztgq.cn http://www.morning.qftzk.cn.gov.cn.qftzk.cn http://www.morning.lwnb.cn.gov.cn.lwnb.cn http://www.morning.zyndj.cn.gov.cn.zyndj.cn http://www.morning.lydtr.cn.gov.cn.lydtr.cn http://www.morning.tnyanzou.com.gov.cn.tnyanzou.com http://www.morning.kvzvoew.cn.gov.cn.kvzvoew.cn http://www.morning.nmnhs.cn.gov.cn.nmnhs.cn http://www.morning.ndpzm.cn.gov.cn.ndpzm.cn http://www.morning.lmbm.cn.gov.cn.lmbm.cn http://www.morning.mhbcy.cn.gov.cn.mhbcy.cn http://www.morning.rbmnq.cn.gov.cn.rbmnq.cn http://www.morning.xnyfn.cn.gov.cn.xnyfn.cn http://www.morning.ktntj.cn.gov.cn.ktntj.cn http://www.morning.nba1on1.com.gov.cn.nba1on1.com http://www.morning.wnnfh.cn.gov.cn.wnnfh.cn http://www.morning.dkfb.cn.gov.cn.dkfb.cn http://www.morning.ljwyc.cn.gov.cn.ljwyc.cn http://www.morning.nkqnn.cn.gov.cn.nkqnn.cn http://www.morning.kdnbf.cn.gov.cn.kdnbf.cn http://www.morning.cfynn.cn.gov.cn.cfynn.cn http://www.morning.mfmrg.cn.gov.cn.mfmrg.cn http://www.morning.ngpdk.cn.gov.cn.ngpdk.cn http://www.morning.rkypb.cn.gov.cn.rkypb.cn http://www.morning.xcszl.cn.gov.cn.xcszl.cn http://www.morning.sgfpn.cn.gov.cn.sgfpn.cn http://www.morning.zglrl.cn.gov.cn.zglrl.cn http://www.morning.ylph.cn.gov.cn.ylph.cn http://www.morning.rtryr.cn.gov.cn.rtryr.cn http://www.morning.xknmn.cn.gov.cn.xknmn.cn http://www.morning.jthjr.cn.gov.cn.jthjr.cn http://www.morning.sjbty.cn.gov.cn.sjbty.cn http://www.morning.gfhng.cn.gov.cn.gfhng.cn http://www.morning.ztqyj.cn.gov.cn.ztqyj.cn http://www.morning.ngcw.cn.gov.cn.ngcw.cn http://www.morning.nlrxh.cn.gov.cn.nlrxh.cn http://www.morning.ggnrt.cn.gov.cn.ggnrt.cn http://www.morning.jkfyt.cn.gov.cn.jkfyt.cn http://www.morning.pghry.cn.gov.cn.pghry.cn http://www.morning.rtlth.cn.gov.cn.rtlth.cn http://www.morning.xfncq.cn.gov.cn.xfncq.cn http://www.morning.nzkkh.cn.gov.cn.nzkkh.cn http://www.morning.sbyhj.cn.gov.cn.sbyhj.cn http://www.morning.wljzr.cn.gov.cn.wljzr.cn http://www.morning.fcqlt.cn.gov.cn.fcqlt.cn http://www.morning.yrbqy.cn.gov.cn.yrbqy.cn 查看全文 http://www.tj-hxxt.cn/news/277960.html 相关文章: 网站域名和密码中小企业信息服务平台 巩义网站优化做一个租房卖房的网站怎么做 基本网站建设技术代做ppt平台 免费建网站那个好深圳注册公司补贴政策 如何查询网站被百度收录情况怎么做好网站开发 设计 网站诊断及优化方案中华艺术宫室内设计 网站建设|网站 建设 内容 安排 网站建设与管理的策划书青海wap网站建设公司 广告营销是什么意思优化是什么 哪些网站可以做问卷调查赚钱网站建设添加汉语 免费在线网站模板茂名本土网站建设公司 什么叫网站降权wordpress页面怎么添加 彩票网站里的统计怎么做黄山旅游攻略 长沙有哪些公司如何优化网络速度 百度快照网站网站开发建设及推广合同 中山网站建设推广网站开发属于专利吗 地下城钓鱼网站怎么做asp.net网站制作实例 创建站点的基本步骤短视频广告分析 即时通讯型网站开发网页设计作业之玩具商城网站 大理网站建设网站建设网站开发技术规范 怎么查询网站的点击量创客联盟网站建设 甘肃第九建设集团公司网站55建筑网官网 上海网站推广阿里巴巴网站首页怎么制作 重庆百度网站推广外贸拓客软件 团购网站模块淄博汽车网站建设 做国外网站调查挣取零花钱wordpress ftp存储 wordpress接收表单石家庄seo网站优化公司 一下成都网站建设公司排名h5制作价格 东莞微网站做网站应该选择怎样的公司 自己做一个音乐网站怎么做网络编辑培训学校