当前位置: 首页 > news >正文

商洛网站开发云搜索引擎

商洛网站开发,云搜索引擎,四川省乐山市建设银行网站,天津seo实战培训Qdrant 是近年来非常热门的向量数据库,广泛用于文本搜索、推荐系统、图像相似度匹配等场景。本文将带你从最实用的三个层面入手,快速上手并用好 Qdrant 的核心能力: ✅ 远程连接配置详解 🏗️ 集合创建参数全面解释 &#x1f50…

Qdrant 是近年来非常热门的向量数据库,广泛用于文本搜索、推荐系统、图像相似度匹配等场景。本文将带你从最实用的三个层面入手,快速上手并用好 Qdrant 的核心能力:

  1. ✅ 远程连接配置详解

  2. 🏗️ 集合创建参数全面解释

  3. 🔍 查询参数高级用法

  4. 🔥本例为Qdrant 1.14.2(注意!)


✅ 一、远程连接配置详解(QdrantClient)

在本地你可以用 host 和 port 来连接 Qdrant 服务,而在生产中,通常使用 Qdrant Cloud 提供的 HTTPS 接口和 API 密钥:

from qdrant_client import QdrantClientclient = QdrantClient(url="https://your-qdrant-endpoint.qdrant.io",api_key="your-api-key-here"
)

参数

类型

说明

url

str

Qdrant 服务的远程地址,必须是 HTTPS

api_key

str

API 密钥,保护访问权限

timeout

int/float

(可选)请求超时,默认 5 秒

prefer_grpc

bool

(可选)是否优先使用 gRPC,速度更快,但需服务器支持

📌 本地开发:

client = QdrantClient(host="localhost", port=6333)


🏗️ 二、创建集合(Collection)参数详解

向量搜索的前提是集合(Collection),它类似于表结构,用于存储向量及其 metadata。下面是一个完整的创建集合示例:

from qdrant_client.http.models import VectorParams, Distanceclient.create_collection(collection_name="c_names",vectors_config=VectorParams(size=4,distance=Distance.COSINE)
)points = [PointStruct(id=str(uuid.uuid4()), vector=[0.1, 0.2, 0.3, 0.4], payload={"name": "Tokyo"}),PointStruct(id=str(uuid.uuid4()), vector=[0.2, 0.1, 0.4, 0.3], payload={"name": "Kyoto"}),
]client.upsert(collection_name="c_names", points=points)
print("✅ 已插入测试数据")

✳️ 参数解析

参数名

说明

collection_name

集合名称(自定义)

size

向量维度(取决于你的 embedding 模型)

distance

相似度计算方式(推荐使用 COSINE)

📌 常见模型维度对照

模型名称

维度(size)

MiniLM-L12-v2

384

e5-base

768

text-embedding-3-small

1536

🛠️ 可选参数(进阶):

参数名

说明

on_disk_payload

是否将 payload 存储到磁盘(节省内存)

hnsw_config

索引构建参数,可优化召回速度


🔍 三、查询参数详解:

query_points()

 实战

Qdrant 旧接口 search() 已弃用,推荐使用新版 query_points()。这是最常用的检索 API,支持分页、筛选、相似度阈值等强大功能:

from qdrant_client.http.models import QueryVectorresults = client.query_points(collection_name="c_names",query=[0.1, 0.2, 0.3, 0.4],limit=5,with_payload=True,score_threshold=0.9
)print("🔍 查询结果:")
for r in result.points:print(f"- id: {r.id}, score: {r.score}, payload: {r.payload}")

📌 参数详解

参数名

类型

说明

collection_name

str

要查询的集合名

query

QueryVector

查询向量,维度必须匹配

limit

int

返回结果数量上限

with_payload

bool

是否返回 metadata(如地名)

score_threshold

float

仅返回相似度高于该阈值的记录

offset

int

分页偏移量(跳过前N条)

filter

Filter 对象

高级筛选条件(如国家名)


🔥 

score_threshold

 使用技巧

如果你希望结果尽量“接近”原始向量,可以使用 score_threshold,比如:

score_threshold=0.95

这意味着只保留相似度高于 0.95 的结果,常用于高置信度翻译、名称匹配等场景。


🎯 高级筛选:按字段过滤(

filter

from qdrant_client.http.models import Filter, FieldCondition, MatchValuemy_filter = Filter(must=[FieldCondition(key="country",match=MatchValue(value="Japan"))]
)

然后作为参数传入:

results = client.query_points(collection_name="place_names",query=[...],filter=my_filter,limit=10
)


📌 总结速查表

场景

推荐配置

文本相似搜索

distance=COSINE + 384 维

精准匹配

加入 score_threshold=0.9+

分类过滤

使用 filter 结合 payload

排查效果

开启 with_vectors=True 查看返回向量


🎁 附加建议

  • 使用 sentence-transformers 快速生成文本向量;

  • 本地测试建议使用 Docker 启动 Qdrant;

  • 在线部署推荐使用 Qdrant Cloud,支持备份与权限管理;

  • API 更新频繁,记得关注 官方文档。

http://www.tj-hxxt.cn/news/121176.html

相关文章:

  • 网站模块删除百度云盘官网
  • ppt模板免费下载完整版免费简约seo关键词优化方法
  • 做网站先学什么软文营销步骤
  • 问信息奥赛题怎么做 去哪个网站网站排名优化需要多久
  • 五合一网站做优化好用吗域名网站
  • 北京网站设计开发公司全国新冠疫情最新情况
  • 福田产品设计广州优化防控措施
  • notepad做网站技巧怎么建网站平台卖东西
  • 在对方网站做友情链接今日油价92汽油
  • wordpress设置标题颜色小红书seo软件
  • 做传媒网站公司百度收录最新方法
  • 网站建设vip服务java培训班学费一般多少
  • 怎么样做网站才可以加重权重百度答主招募入口官网
  • 部队网站建设招标天眼查询个人信息
  • 网站建设日期查询链交换反应
  • 苏州网站设计公司兴田德润在哪里呢无锡seo
  • 装饰公司做宣传网站企业邮箱查询
  • 网页游戏网站建设百度无锡营销中心
  • 怎样自己做淘宝客网站数字营销工具
  • 营销网站建设技术深圳网络优化seo
  • wordpress 添加字体网站优化排名怎么做
  • dede 添加演示网站app拉新项目一手渠道商
  • 网站开发 音乐插入企业网站推广有哪些方式
  • 玉溪市网站建设推广百度入口
  • 网络建设公司哪家好如何做seo
  • seo优化软件免费版深圳百度推广排名优化
  • django做网站快吗百度客服
  • seo网站建设哪家专业如何制作网站和网页
  • 做网站与不做网站的区别奶茶网络营销策划方案
  • 政府门户网站群建设方案seo优化软件大全