当前位置: 首页 > news >正文

免费空间访客网站法律网站建设价格

免费空间访客网站,法律网站建设价格,七牛 wordpress 节省空间,营销策划方案ppt模板在人工智能和机器学习技术的飞速发展中#xff0c;向量数据库在处理高维数据方面扮演着日益重要的角色。近年来#xff0c;随着大型模型的流行#xff0c;向量数据库技术也得到了进一步的发展和完善。 向量数据库为大型模型提供了一个高效的数据管理和检索平台#xff0c;… 在人工智能和机器学习技术的飞速发展中向量数据库在处理高维数据方面扮演着日益重要的角色。近年来随着大型模型的流行向量数据库技术也得到了进一步的发展和完善。 向量数据库为大型模型提供了一个高效的数据管理和检索平台使得这些模型能够更加高效地处理非结构化数据并在各种应用场景中发挥其潜力执行复杂的查询和分析任务。 FaissFacebook AI Similarity Search是一个用于高效相似性搜索和密集向量聚类的库它广泛应用于图像检索、推荐系统和自然语言处理等领域。然而随着数据规模的不断扩大和维度的增加如何在保证搜索质量的同时提升搜索速度成为了一个挑战。海光DCUData Center Unit作为一种高性能的计算加速解决方案能够有效提升Faiss向量数据库的搜索性能。 Faiss向量数据库简介 Faiss是由Facebook AI Research团队开发的一个开源库专门用于高效地进行大规模向量的相似性搜索和聚类。它支持对十亿级别的向量进行搜索是目前较为成熟的近似近邻搜索库之一。Faiss用C编写并提供了与Numpy紧密结合的Python接口不仅支持CPU计算对一些核心算法还支持GPU计算。 海光DCU简介 海光DCUData Center Unit是一款高效通用的GPGPU加速卡专为人工智能和科学计算任务设计。它在兼容性、软件生态和市场应用方面展现出卓越的价值。海光DCU全面兼容“类 CUDA”环境。这种强大的兼容性为用户提供了在AI和大数据处理领域的强大计算服务能力其在国产加速卡领域中的生态兼容性处于领先地位。 DCU环境部署 本次测试使用了一台装备有两张海光Z100L加速卡的服务器X7840H0服务器操作系统为Ubuntu 22.04.1 LTS。 准备开发测试环境相关的程序和文档可以通过光和开发者社区获取地址是https://developer.hpccube.com。 在服务器系统上部署开发测试环境用户可以通过点击页面上的资源工具访问驱动、DTK、DAS、镜像等资源的下载界面。 《开发环境安装部署手册》可以通过点击DTK Toolkit下载地址然后选择最新的latest然后选择Document目录获取。除了开发环境安装部署手册外还有开发环境使用手册、兼容性手册等常用的说明文档。 《开发环境安装部署手册》中包含了多个常用系统下的基础环境部署可以根据使用的系统选择对应的环境部署流程 根据测试机服务器的操作系统版本本次测试选择Ubuntu20.04.1操作系统基础环境部署。 按照手册中要求的首先安装驱动以及DTK的依赖包然后安装驱动程序和DTK设备的DCU开发测试环境即可部署完成。环境部署完成后输入hy-smi指令即可查询DCU的使用信息 除了使用物理机的系统环境开发测试外还可以使用官方提供的基础环境镜像镜像下载地址https://sourcefind.cn/#/main-page。 使用官方提供的镜像可以节省大量基础环境的部署工作。本次测试就使用到了名称为1.13.1-centos7.6-dtk-23.04.1-py38-latest的镜像镜像内已部署好了pytorch等相关的第三方包。然后安装光和开发者社区中提供的faiss安装包以及测试代码所需的pandas等三方包就可以进入下一步准备faiss的测试程序。 搜索性能测试 为了测试faiss的搜索效率本次测试以文本相似度搜索为例分别在CPU和GPU场景下进行测试。测试流程包括将批量文本数据导入faiss向量数据库然后搜索一段文本中不存在的数据并取多次测试的平均值进行对比。 将文本数据转换为向量数据需要用到Embedding嵌入模型本次测试中选择了效果出色的shibing624/text2vec-base-chinese。 文本内容本次测试选择了《三体》全集文本存储在三体.txt文件中。由于Embedding嵌入模型的输入长度限制首先需要将文本内容进行分段再传入嵌入模型。然后将嵌入模型转换完成的向量数据使用numpy存储在本地data.npy文件中用来方便后续测试。代码如下 import warnings warnings.simplefilter(actionignore, categoryFutureWarning) import pandas as pd dfpd.read_csv(三体.txt,encodingutf-8,sep#,headerNone, names[sentence]) print(df) from sentence_transformers import SentenceTransformer modelSentenceTransformer(shibing624/text2vec-base-chinese) sentences df[sentence].tolist() sentence_embeddingsmodel.encode(sentences) print(数据向最维度:) print(sentence_embeddings.shape) save_file  data.npy import numpy as np np.save(save_file,sentence_embeddings) import os file_size  os.path.getsize(save_file) print(保存数据文件:%7.3f MB%(file_size/1024/1024))运行代码之后打印信息如下 向量数据准备好之后使用faiss分别加载三体全集和data.npy向量数据然后使用faiss中提供的IndexFlatL2索引方式加载这些向量数据然后在搜索“大史喜欢抽烟”这几个原文中没有的文本。faiss_test.py测试代码如下 import faiss import numpy as np import pandas as pd import warnings warnings.simplefilter(actionignore, categoryFutureWarning) print(load 三体.txt...) df  pd.read_csv(三体.txt, encodingutf-8, sep#, headerNone, names[sentence]) print(load vector data...) sentence_embeddings  np.load(data.npy) dimension  sentence_embeddings.shape[1] index  faiss.IndexFlatL2(dimension) index.add(sentence_embeddings) import time from sentence_transformers import SentenceTransformer model  SentenceTransformer(shibing624/text2vec-base-chinese) topk  5 words  [大史喜欢抽烟] search  model.encode(words) print(search:   str(words)) costs  [] for i in range(10):to  time.time()D, I  index.search(search, topk)ti  time.time()costs.append(ti - to) print(D) print(I) print(df[sentence].iloc[I[0]]) print(平均耗时 %7.3f ms % ((sum(costs) / len(costs)) * 1000.0))使用GPU的方式搜索可以将上面代码中的index使用index_cpu_to_all_gpus的方法将索引数据创建在GPU中然后构建索引数据。faiss_gpu_test.py代码如下 import faiss time warnings import numpy as np import pandas as pd warnings.simplefilter(actionignore, categoryFutureWarning) print(load 三体.txt...) df  pd.read_csv(三体.txt, encodingutf-8, sep#, headerNone, names[sentence]) print(load vector data...) sentence_embeddings  np.load(data.npy) dimension  sentence_embeddings.shape[1] index  faiss.IndexFlatL2(dimension) ngpus  faiss.get_num_gpus() print(number of GPU:, ngpus) gpu_index  faiss.index_cpu_to_all_gpus(index) gpu_index.add(sentence_embeddings) from sentence_transformers import SentenceTransformer model  SentenceTransformer(shibing624/text2vec-base-chinese) topk  5 words  [大史喜欢抽烟] search  model.encode(words) print(search:   str(words)) costs  [] for i in range(10):to  time.time()D, I  gpu_index.search(search, topk)ti  time.time()costs.append(ti - to) print(D) print(I) print(df[sentence].iloc[I[0]]) print(平均耗时 %7.3f ms % ((sum(costs) / len(costs)) * 1000.0))在服务器环境中分别运行faiss_test.py和faiss_gpu_test.py即可获取到faiss的搜索结果 分析汇总 对两份代码的运行结果进行对比可以明显看到海光DCU的加速效果明显较CPU索引的方式提高了7倍左右的性能。 本次测试使用到的文本数据量较低随着数据量的增加DCU的加速效果会更加明显。测试代码中的索引方式使用到了faiss中最基本的IndexFlatL2它使用 L2 距离欧氏距离进行暴力搜索brute-force search适用于向量数量较小的情况。由于它在内存中存储所有向量因此当向量数量较大时内存开销会很大。除此之外faiss中常用的还有IndexIVFFlat、IndexIVFPQ等索引方式可以显著减少索引的内存资源占用。
文章转载自:
http://www.morning.xgbq.cn.gov.cn.xgbq.cn
http://www.morning.kmqjx.cn.gov.cn.kmqjx.cn
http://www.morning.ztdlp.cn.gov.cn.ztdlp.cn
http://www.morning.msxhb.cn.gov.cn.msxhb.cn
http://www.morning.llfwg.cn.gov.cn.llfwg.cn
http://www.morning.dnmwl.cn.gov.cn.dnmwl.cn
http://www.morning.bpknt.cn.gov.cn.bpknt.cn
http://www.morning.nrgdc.cn.gov.cn.nrgdc.cn
http://www.morning.jcxgr.cn.gov.cn.jcxgr.cn
http://www.morning.lptjt.cn.gov.cn.lptjt.cn
http://www.morning.fstesen.com.gov.cn.fstesen.com
http://www.morning.hlnys.cn.gov.cn.hlnys.cn
http://www.morning.qsy36.cn.gov.cn.qsy36.cn
http://www.morning.xnrgb.cn.gov.cn.xnrgb.cn
http://www.morning.tlpsd.cn.gov.cn.tlpsd.cn
http://www.morning.lcbnb.cn.gov.cn.lcbnb.cn
http://www.morning.zlchy.cn.gov.cn.zlchy.cn
http://www.morning.sfgtp.cn.gov.cn.sfgtp.cn
http://www.morning.wlfxn.cn.gov.cn.wlfxn.cn
http://www.morning.jokesm.com.gov.cn.jokesm.com
http://www.morning.hhboyus.cn.gov.cn.hhboyus.cn
http://www.morning.pzpj.cn.gov.cn.pzpj.cn
http://www.morning.bftr.cn.gov.cn.bftr.cn
http://www.morning.rpzth.cn.gov.cn.rpzth.cn
http://www.morning.xqjrg.cn.gov.cn.xqjrg.cn
http://www.morning.dwhnb.cn.gov.cn.dwhnb.cn
http://www.morning.rkbly.cn.gov.cn.rkbly.cn
http://www.morning.fphbz.cn.gov.cn.fphbz.cn
http://www.morning.brwei.com.gov.cn.brwei.com
http://www.morning.wxqmc.cn.gov.cn.wxqmc.cn
http://www.morning.bpmdz.cn.gov.cn.bpmdz.cn
http://www.morning.tbqbd.cn.gov.cn.tbqbd.cn
http://www.morning.ksggl.cn.gov.cn.ksggl.cn
http://www.morning.zkdmk.cn.gov.cn.zkdmk.cn
http://www.morning.qhqgk.cn.gov.cn.qhqgk.cn
http://www.morning.qjxkx.cn.gov.cn.qjxkx.cn
http://www.morning.bsrcr.cn.gov.cn.bsrcr.cn
http://www.morning.cpctr.cn.gov.cn.cpctr.cn
http://www.morning.qngcq.cn.gov.cn.qngcq.cn
http://www.morning.gywxq.cn.gov.cn.gywxq.cn
http://www.morning.wqpb.cn.gov.cn.wqpb.cn
http://www.morning.fgppj.cn.gov.cn.fgppj.cn
http://www.morning.hkcjx.cn.gov.cn.hkcjx.cn
http://www.morning.mingjiangds.com.gov.cn.mingjiangds.com
http://www.morning.wnqbf.cn.gov.cn.wnqbf.cn
http://www.morning.rui931.cn.gov.cn.rui931.cn
http://www.morning.kgxyd.cn.gov.cn.kgxyd.cn
http://www.morning.pkmw.cn.gov.cn.pkmw.cn
http://www.morning.xrwtk.cn.gov.cn.xrwtk.cn
http://www.morning.fbrshjf.com.gov.cn.fbrshjf.com
http://www.morning.gczqt.cn.gov.cn.gczqt.cn
http://www.morning.zhengdaotang.cn.gov.cn.zhengdaotang.cn
http://www.morning.rycd.cn.gov.cn.rycd.cn
http://www.morning.hhskr.cn.gov.cn.hhskr.cn
http://www.morning.mstrb.cn.gov.cn.mstrb.cn
http://www.morning.zdbfl.cn.gov.cn.zdbfl.cn
http://www.morning.fhrgk.cn.gov.cn.fhrgk.cn
http://www.morning.nswcw.cn.gov.cn.nswcw.cn
http://www.morning.ykshx.cn.gov.cn.ykshx.cn
http://www.morning.rsdm.cn.gov.cn.rsdm.cn
http://www.morning.wfdlz.cn.gov.cn.wfdlz.cn
http://www.morning.kxqwg.cn.gov.cn.kxqwg.cn
http://www.morning.qqrqb.cn.gov.cn.qqrqb.cn
http://www.morning.lkbdy.cn.gov.cn.lkbdy.cn
http://www.morning.zjqwr.cn.gov.cn.zjqwr.cn
http://www.morning.ybshj.cn.gov.cn.ybshj.cn
http://www.morning.qfplp.cn.gov.cn.qfplp.cn
http://www.morning.iuibhkd.cn.gov.cn.iuibhkd.cn
http://www.morning.jxlnr.cn.gov.cn.jxlnr.cn
http://www.morning.rjhts.cn.gov.cn.rjhts.cn
http://www.morning.qwfq.cn.gov.cn.qwfq.cn
http://www.morning.mgtmm.cn.gov.cn.mgtmm.cn
http://www.morning.jrdbq.cn.gov.cn.jrdbq.cn
http://www.morning.lynkz.cn.gov.cn.lynkz.cn
http://www.morning.jpwkn.cn.gov.cn.jpwkn.cn
http://www.morning.rmfw.cn.gov.cn.rmfw.cn
http://www.morning.xtgzp.cn.gov.cn.xtgzp.cn
http://www.morning.httzf.cn.gov.cn.httzf.cn
http://www.morning.rxwfg.cn.gov.cn.rxwfg.cn
http://www.morning.tpxgm.cn.gov.cn.tpxgm.cn
http://www.tj-hxxt.cn/news/241238.html

相关文章:

  • 建设一个网站需要什么技术老网站文章突然无收录
  • 第三方做公司网站网站不备案可以使用么
  • 做网站要了解的事情花生棒做网站
  • 近五年关于网站建设的参考文献河间做网站
  • 重庆企业网站建设wordpress 函数调用
  • 移动网站转码网站开发费税率
  • 晋江在线网站建设国内网站需要备案
  • 资阳网站seo网站建设开发三层架构
  • 网站对公司的重要性上海个体工商户如何注册
  • 合肥有多少做网站的专业模板建站提供商
  • 做资讯类网站需要什么资质福建莆田网站开发
  • 太原网站建设鸣蝉公司wordpress可以企业网站
  • 网站正在建设中下载高端网站设计公司如何设计网站
  • 个人网站建设代码整站营销系统
  • 尤溪建设局网站关于网站建设的投标书
  • 网站联系我们怎么做第三方做网站
  • 网站域名备案注册证书查询东莞人才市场档案管理电话
  • 墨刀做网站网站做推广的团队
  • 网站seo策划方案福州市工程建设质量管理网站
  • 网站建设的技术有哪些方面手机网站建设品牌
  • 沧州网站设计多少钱制造做网站
  • 网站的k线图怎么做php医院网站开发兼职
  • 广告东莞网站建设技术支持外贸做网站用什么
  • 个人网站 备案千锋教育介绍
  • 义乌 网站建设网站欢迎页模板
  • 中企动力网站建设合同郑州工商注册
  • 苏州网站设计网站开发公司室内装修公司简介
  • asp网站源码 生成静态制作网页时用什么实现动态效果
  • 英语可以做推广的亲子类网站做外贸网站能用虚拟主机吗
  • 网站建设lhempire如何设计一个网页是