当前位置: 首页 > news >正文

济南免费做网站360营销平台

济南免费做网站,360营销平台,深圳网站建设团队,什么叫网络营销目标市场NLP课程期末知识点总结 期末重点说明第01章_引言+绪论第02章_基于规则的自然语言处理第03章_文本分类第04章_语言模型第05章_文本表示第06章_卷积神经网络第07章_循环神经网络第08章_8-1_Transformer第08章_8-2_预训练模型第09章_信息抽取示例: 可能会考 一定会考 期末重点说明…

NLP课程期末知识点总结

  • 期末重点说明
  • 第01章_引言+绪论
  • 第02章_基于规则的自然语言处理
  • 第03章_文本分类
  • 第04章_语言模型
  • 第05章_文本表示
  • 第06章_卷积神经网络
  • 第07章_循环神经网络
  • 第08章_8-1_Transformer
  • 第08章_8-2_预训练模型
  • 第09章_信息抽取

示例:
可能会考

一定会考

期末重点说明

10道选择题 1分*10
8道简答题(2~3个子问题) 90分
内容:
上课课堂练习&提问模型理解
每章一个问题,CNN,transformer等等
朴素贝叶斯文本分类计算
绪论自然语言处理的基本概念
主要内容是ppt的内容,搜索资料加深对模型的理解

第01章_引言+绪论

感觉概念都不重要,应该不会默写,那也太无聊了。
语言学
语言学概念
计算语言学CL
计算语言学概念
自然语言理解NLU
自然语言理解概念
自然语言处理NLP
自然语言处理概念
中文信息处理
中文信息处理概念中文信息处理
人类语言技术HLT
Human Language Technology

各名词范围可视化
NLU\CL\NLP\HLT可视化
三种不同的语系
三种不同的语系
NLP研究内容
NLP研究内容
技术现状
技术现状
一个有意思的问题:
但是我感觉n的个数可能有错
卡特兰数

第02章_基于规则的自然语言处理

流程,依赖人类专家规则方法流程
规则方法适用的情况/任务

  • 词法分析:词法分析

可能重要一些的点:

  1. 形态还原基本算法:形态还原基本算法
  2. 分词方法罗列&缺点分词方法罗列
    缺点
  3. 词性标注看着一点不重要
  4. 命名实体识别后续课程应该有详细讲
  5. 机器翻译也只是浅浅概述

第03章_文本分类

文本分类常用数据集
文本分类常用数据集
传统机器学习方法的流程
特征表示、特征选择、分类
传统机器学习方法的流程

  • 文本的形式化表示是反映文本内容和区分不同文本的有效途径
  1. 文本表示——向量空间模型(vector space model, VSM)
    VSM
  • 特征项是词语:可称为词袋模型(bag-of-words,BOW)
  • 特征项权重特征项权重
    • 布尔变量布尔变量
    • 词频(可以直接使用次数,也可以 log ⁡ ( t f i + 1 ) \log(tf_i + 1) log(tfi+1)
      词频
      为什么要 log ⁡ ( t f i + 1 ) \log(tf_i+1) log(tfi+1)log解释
    • 逆文档频率
      • N:语料库中总文档数
      • d f t df_t dft:包含词t的文档数量
      • 如果一个词在很多文档中都出现,它的重要性就低(比如“的”、“是”)。如果一个词只在少数文档中出现,它的重要性就高(比如“黑洞”、“爱因斯坦”)。idf
      • TF_IDFtf-idf
  1. 特征选择
    1. 文档频率
      • 一个特征的文档频率是指在文档集中含有该特征的文档数目
        在这里插入图片描述
      • 互信息
        • 基本概念基本概念
        • 互信息(感觉说的不是很清楚) 在这里插入图片描述
      • 信息增益(IG):原来的熵减去已知某一特征信息后的熵IG

计算信息增益
在这里插入图片描述

  1. 分类算法
  • 监督学习
    • 生成式模型:朴素贝叶斯
      为什么朴素贝叶斯算法是生成式模型
      先理解判别式和生成式的区别区别
      朴素贝叶斯建模了 P ( x ∣ c j ) P(x|c_j) P(xcj)
      生成式说明

NB决策
M是词表大小在这里插入图片描述

判别式模型只是浅浅略过。。

  1. 文本分类性能评估
  • 正确率
  • 宏:每类求R\P后平均在这里插入图片描述
  • 微:每类TP等加起来求R\P
    在这里插入图片描述
  • P-R(纵轴P,横轴R)
  • ROC(纵轴TPR,横轴FPR)

第04章_语言模型

  1. 传统语言模型
  • n元文法
    此时还是考虑前面所有历史基元

    • 语句的先验概率:前面所有的词出现的情况下这个词出现的概率(连乘)在这里插入图片描述
      但是存在参数量爆炸的问题在这里插入图片描述
      解决问题的思路:将历史基元映射到等价类。

    引出n元文法,只考虑前面n-1个历史基元。

    <
http://www.tj-hxxt.cn/news/64206.html

相关文章:

  • 找个公司做网站需要注意什么谷歌seo排名工具
  • 网站开发数据库设计武汉seo搜索引擎
  • 网站友情链接怎么做百度做广告费用
  • dz论坛中英文网站怎么做推广平台网站
  • 企业常用系统各系统介绍优化设计三年级上册语文答案
  • 网站建设与管理教学视频下载店铺在百度免费定位
  • 网站开发vue版本是什么张雪峰谈广告学专业
  • ps免抠素材网站大全网站推广的基本方法有
  • 吉工之家找工作建筑工作360优化大师安卓手机版下载安装
  • 做网站全部乱码怎么办seo快速排名上首页
  • 有哪些网站有做网页用的小图片百度问问首页
  • 在线制图网seo外链工具软件
  • 电子商务网站怎么做整站seo教程
  • 我想创业做网站今天刚刚的最新新闻
  • 郑州郑东新区网站建设平台接广告在哪里接的
  • 自己做的网站如何放到微信宁波seo外包推广排名
  • 南山网站制作培训网登录入口
  • 荔湾区做网站公司网站优化培训班
  • 怎么做网站扫码支付卖友情链接赚钱
  • WordPress搭建美国网站活动策划方案
  • 淄博网站建设多优化推广网站淄博
  • 前端后端分别是什么意思seo排名优化培训价格
  • 做公司网站的目的是什么怎么开展网络营销推广
  • 如何用网站做苹果app华为手机软文范文300
  • 网站营销策划公司营销方案怎么写模板
  • 做冷库的网站免费建站平台哪个好
  • wordpress更改绑定域名裤子seo关键词
  • 保定市清苑区网站建设店铺数据分析主要分析什么
  • 网站伪静态全站伪静态中文域名注册官网入口
  • 免费制作电子贺卡的app网络优化公司有哪些