当前位置: 首页 > news >正文

网站已备案 还不能访问我的网站突然打不开了

网站已备案 还不能访问,我的网站突然打不开了,wordpress国内优化,怎么解决PyTorch 实现 GloVe#xff08;Global Vectors for Word Representation#xff09; 的完整代码#xff0c;使用 中文语料 进行训练#xff0c;包括 共现矩阵构建、模型定义、训练和测试。 1. GloVe 介绍 基于词的共现信息#xff08;不像 Word2Vec 使用滑动窗口预测Global Vectors for Word Representation 的完整代码使用 中文语料 进行训练包括 共现矩阵构建、模型定义、训练和测试。 1. GloVe 介绍 基于词的共现信息不像 Word2Vec 使用滑动窗口预测  适合较大规模的数据比 Word2Vec 更稳定 学习出的词向量能捕捉语义信息如类比关系 import torch import torch.nn as nn import torch.optim as optim import numpy as np import jieba from collections import Counter from scipy.sparse import coo_matrix# 1. 数据预处理 corpus [我们 喜欢 深度 学习,自然 语言 处理 是 有趣 的,人工智能 改变 了 世界,深度 学习 是 人工智能 的 重要 组成部分 ]# 分词 tokenized_corpus [list(jieba.cut(sentence)) for sentence in corpus] vocab set(word for sentence in tokenized_corpus for word in sentence) word2idx {word: idx for idx, word in enumerate(vocab)} idx2word {idx: word for word, idx in word2idx.items()}# 计算共现矩阵 window_size 2 co_occurrence Counter()for sentence in tokenized_corpus:indices [word2idx[word] for word in sentence]for center_idx in range(len(indices)):center_word indices[center_idx]for offset in range(-window_size, window_size 1):context_idx center_idx offsetif 0 context_idx len(indices) and context_idx ! center_idx:context_word indices[context_idx]co_occurrence[(center_word, context_word)] 1# 转换为稀疏矩阵 rows, cols, values zip(*[(c[0], c[1], v) for c, v in co_occurrence.items()]) X coo_matrix((values, (rows, cols)), shape(len(vocab), len(vocab)))# 2. 定义 GloVe 模型 class GloVe(nn.Module):def __init__(self, vocab_size, embedding_dim):super(GloVe, self).__init__()self.w_embeddings nn.Embedding(vocab_size, embedding_dim) # 中心词嵌入self.c_embeddings nn.Embedding(vocab_size, embedding_dim) # 上下文词嵌入self.w_bias nn.Embedding(vocab_size, 1) # 中心词偏置self.c_bias nn.Embedding(vocab_size, 1) # 上下文词偏置nn.init.xavier_uniform_(self.w_embeddings.weight)nn.init.xavier_uniform_(self.c_embeddings.weight)def forward(self, center, context, co_occur):w_emb self.w_embeddings(center)c_emb self.c_embeddings(context)w_bias self.w_bias(center).squeeze()c_bias self.c_bias(context).squeeze()dot_product (w_emb * c_emb).sum(dim1)loss (dot_product w_bias c_bias - torch.log(co_occur 1e-8)) ** 2return loss.mean()# 初始化模型 embedding_dim 10 model GloVe(len(vocab), embedding_dim)# 3. 训练 GloVe criterion nn.MSELoss() optimizer optim.Adam(model.parameters(), lr0.01) num_epochs 100# 转换数据 co_occurrence_tensor torch.tensor(X.data, dtypetorch.float) pairs list(zip(X.row, X.col, co_occurrence_tensor))for epoch in range(num_epochs):total_loss 0np.random.shuffle(pairs)for center, context, co_occur in pairs:optimizer.zero_grad()loss model(torch.tensor([center], dtypetorch.long),torch.tensor([context], dtypetorch.long),torch.tensor([co_occur], dtypetorch.float) # 修正数据类型)loss.backward()optimizer.step()total_loss loss.item()if (epoch 1) % 10 0:print(fEpoch [{epoch 1}/{num_epochs}], Loss: {total_loss:.4f})# 4. 获取词向量 word_vectors model.w_embeddings.weight.data.numpy()# 5. 计算相似度 def most_similar(word, top_n3):if word not in word2idx:return 单词不在词汇表中word_vec word_vectors[word2idx[word]].reshape(1, -1)similarities np.dot(word_vectors, word_vec.T).squeeze()similar_idx similarities.argsort()[::-1][1:top_n 1]return [(idx2word[idx], similarities[idx]) for idx in similar_idx]# 测试 test_words [深度, 学习, 人工智能] for word in test_words:print(f【{word}】的相似单词:, most_similar(word))数据预处理 分词使用 jieba.cut()构建共现矩阵计算窗口内的单词共现频率使用稀疏矩阵存储提高计算效率 GloVe 模型 Embedding 层 训练词向量中心词和上下文词分开Bias 变量 用于调整预测值损失函数 最小化 log(共现次数) 与词向量点积的差值 计算词向量相似度 使用 cosine similarity找出 top_n 最相似的单词
http://www.tj-hxxt.cn/news/135139.html

相关文章:

  • 环保网站案例佛山网络建设推广
  • 阿里云免费网站爱山东app二维码
  • 网站建设需要准备那些内容网页排版设计欣赏
  • 理财网站如何做推广怎么做自己的品牌网站
  • 成品动漫和视频网站入口js做网站需要那些软件
  • 服务器做的网站怎么使用教程定制设计的网站
  • 运营推广计划怎么写seo优化工作内容做什么
  • 网站页面设计方案工作设计室网站
  • 网页设计与网站建设实训报告网站提供商
  • 网站搭建书籍推荐游戏页面
  • 正版网站设计制作2023网站推广入口
  • 长沙网站建设qq交流群wordpress 访问页面空白
  • 做网站的赢利点联图二维码生成器
  • 设计网站的关键点三维家装设计软件
  • 网站被镜像怎么做wordpress footer.php添加qq悬浮
  • 网站如何做seo推广方案浙江省建设局教育网站
  • 企业网站优化17专做衬衫的网站
  • 如何做繁体字网站珠海网站设计多少钱
  • 大淘客网站建设网站制作建设有哪些
  • 网站地图怎样做专业生产车间设计图纸网站
  • 临城网站没有网站也可以做推广吗
  • 门户网站优化方案logo设计公司报价
  • wordpress 防注入关键seo排名点击软件
  • 昆明市西山区建设局网站银川做网站哪家公司好
  • 课程资源网站开发黄山网站设计公司
  • 温州网站建设和推广怎么做死循环网站
  • 手机网站关于我们汕头网页设计公司
  • 组建网站 多少钱怎么用flashfxp上传wordpress
  • 网站建设开发软件教程深圳微商城网站制作公司
  • 海宁最火高端网站设计推荐新媒体营销和传统营销的区别