当前位置: 首页 > news >正文

如何做网站搜索功能产品设计考研学校推荐

如何做网站搜索功能,产品设计考研学校推荐,温岭建设网站,网页设计与网站建设案例教程背景介绍 在前一篇文章 RAG 项目对比 之后#xff0c;确定 Dify 目前最合适的 RAG 框架。本次就尝试在本地 GPU 设备上部署 Dify 服务。 Dify 是将模型的加载独立出去的#xff0c;因此需要选择合适的模型加载框架。调研一番之后选择了 Xinference#xff0c;理由如下确定 Dify 目前最合适的 RAG 框架。本次就尝试在本地 GPU 设备上部署 Dify 服务。 Dify 是将模型的加载独立出去的因此需要选择合适的模型加载框架。调研一番之后选择了 Xinference理由如下 支持多种类型的模型包括 LLMEmbedding, Rerank, Audio 等多种业务场景的模型需求一个框架全搞定方便的模型管理能力提供可视化页面快速部署模型支持直接从 ModelScope 下载模型避免 huggingface 被墙的问题 本文是 Dify 与 Xinference 最佳组合的 GPU 设备部署流程。为了充分利用 nvidia GPU 的能力需要先安装显卡驱动CUDA 和 CuDNN这部分网上的教程比较多了大家可以自行搜索参考安装安装时需要注意版本需要与自己的 GPU 显卡版本匹配。 Dify 部署 参考 Dify 官方文档 进行安装。 首先需要下载 Dify 对应的代码: git clone https://github.com/langgenius/dify.git之后创建环境变量文件 .env, 根据需要进行修改之后就可以基于 docker compose 启动 cd dify/docker cp .env.example .env docker compose up -d默认访问 http:// 应该就可以看到 Dify 的页面。 docker 镜像问题 实际执行镜像拉取时发现Docker hub 因为监管的原因已经无法访问了。为了解决这个问题目前相对可行的方案 利用一些目前可用的镜像服务当前2024-7-11可用的是 public-image-mirror通过修改本地的镜像下载地址进行加速利用 Github Action 将镜像拉取至个人阿里云的的私有镜像仓库可以参考 教程 实际为了简单直接采用方案 1在本地文件 /etc/docker/daemon.json 中添加 {registry-mirrors: [https://docker.m.daocloud.io] }如果上面的地址不可用可以尝试另一个测试可用的地址 {registry-mirrors: [https://docker.anyhub.us.kg] }修改之后执行下面命令重启 docker 服务 sudo systemctl daemon-reload sudo systemctl restart docker接下来就可以正常拉取镜像了。 Xinference 部署 XInference 的部署也选择基于 docker 部署可以参考 XInference 部署实际使用的部署命令为: docker run -e XINFERENCE_MODEL_SRCmodelscope -v local model path:/models -e XINFERENCE_HOME/models -p 9998:9997 --gpus all registry.cn-hangzhou.aliyuncs.com/xprobe_xinference/xinference:latest xinference-local -H 0.0.0.0各位使用时将上面命令行中的 local model path 替换为期望服务器上模型存储的路径即可 上面的命令利用 XINFERENCE_MODEL_SRCmodelscope 指定了模型最终是从 modelscope 下载的这样国内下载模型镜像的速度比较快。 上面的命令会将 docker 中的 9997 端口映射至本地的 9998 端口部署完成后访问 http://server ip:9998/ui 就可以看到 XInference 可视化页面有需要可以调整服务器上实际占用的端口。 docker GPU 不可用 上面的命令实际执行时会报错 docker: Error response from daemon: could not select device driver with capabilities: [[gpu]]., docker 目前是不能直接使用 GPU 设备的。 此时需要参考 Nvidia 文档 安装 nvidia-container-toolkit 首先需要先补全 apt-get 下载源 curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \ curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \sed s#deb https://#deb [signed-by/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g | \sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list接下来更新源安装对应的包 sudo apt-get update sudo apt-get install -y nvidia-container-toolkit安装完成之后修改 docker 配置文件 /etc/docker/daemon.json {default-runtime: nvidia,runtimes: {nvidia: {path: nvidia-container-runtime,runtimeArgs: []}} }之后执行 sudo systemctl restart docker 重启 docker。 此时再执行上面的 docker run 命令去使用 GPU 设备就没问题了。 Dify 模型配置 上述服务配置好之后就可以在 Xinference 下载所需的模型XInference 启动后实际会占用服务器上的 9998。因此访问 http://server ip:9998/ui 就可以进入可视化页面下载所需的模型 在 Xinference 上下载和运行所需的模型后可以返回 Dify 可视化页面在 Dify 的设置页中配置对应的模型对应的页面如下所示 RAG 一般情况下需要配置上 LLM, Text Embedding 和 Rerank 模型。配置完成后就可以自由玩耍了。 总结 本文是实际部署 Dify Xinference 组合的完整流程实际上如果 docker 可用的话整体的流程还是比较丝滑的。期望给后面折腾 Dify 部署的一些帮助减少重复的踩坑。
http://www.tj-hxxt.cn/news/135954.html

相关文章:

  • 做网站采集什么文章好计算机网站开发实现总结
  • 关于asp_sql网站开发的书籍西地那非片的正确服用方法
  • 厦门网站开发培训济南做网站公司
  • 湖州建设局网站 项目验收流程深圳互联网企业名单
  • 网站推广营销效果政务网站网上调查怎么做
  • 婚纱摄影网站模版整站源码安徽省建设工程信息网官网是什么网站
  • 漯河网站建设ewordpress 图片链接下载
  • 北京天恒建设工程有限公司网站外包做网站的会给你什么
  • 建筑网官网大全旅游企业seo官网分析报告
  • 新网站怎么做论坛推广百度喜欢什么样的网站
  • 网站开发代码规范一站式网站建设服务商
  • 网站备案分为几种网站建设收费标准精英
  • 写作网站排名网络服务有哪些
  • 如何在网站上添加备案号余姚公司做网站
  • 网站建设及wordpress文章怎么加分享
  • 网站怎么做是满屏沈阳网站外包公司
  • 广州中新知识城开发建设网站千华网鞍山门户网站
  • 网站建设和电子商务的关系网站被备案能建设
  • 公网怎么做网站百科网站开发
  • 做钓鱼网站原理wordpress 汉化 插件怎么用
  • 英文网站建设深圳wordpress html5插件
  • 公司网站建设需要资质室内装修设计图效果图
  • 专业手机网站怎么做建设一个网站可以做什么
  • 网站策划用培训吗确定网站开发团队
  • 妙趣网 通辽网站建设免费中文网站模板下载
  • 自己做响应式网站难吗wordpress文章摘要调用
  • 泉州网站建设方案维护关于数据机房建设的网站
  • 政务网站建设管理百度是门户网站吗
  • 深圳网站建设公司联华电子商务网站设计的原则
  • 网站建设关键技术怎么建立自己的自媒体平台