当前位置: 首页 > news >正文

手机网站设计神器温州百度快速排名优化

手机网站设计神器,温州百度快速排名优化,大连龙采做网站,wap网站前台模板生成式人工智能深受大众喜爱#xff0c;并且由于具备回答问题、写故事、创作艺术品甚至生成代码的功能#xff0c;推动了行业的转变#xff0c;那么如何才能在自己的企业中充分地利用生成式人工智能等应运而生问题。许多客户已经积累了大量特定领域的数据#xff08;财务记…生成式人工智能深受大众喜爱并且由于具备回答问题、写故事、创作艺术品甚至生成代码的功能推动了行业的转变那么如何才能在自己的企业中充分地利用生成式人工智能等应运而生问题。许多客户已经积累了大量特定领域的数据财务记录、健康记录、基因组数据、供应链等这为他们提供了独特而有价值的视角有助于他们深入探究自身的业务及更广泛的行业。对于生成式人工智能策略而言这些专有数据可以带来优势成为差异化因素。 同时许多客户还注意到在生成式人工智能应用程序中向量数据存储或向量数据库的使用越来越普遍。他们想知道这些解决方案如何适应他们围绕着生成式人工智能的整体数据战略。在这篇文章中介绍了向量数据库在生成式人工智能应用程序中的作用以及亚马逊云科技解决方案如何帮助您充分利用生成式人工智能的强大功能。 生成式人工智能应用程序 所有生成式人工智能应用程序的核心都是大型语言模型LLM。LLM是一种机器学习ML模型利用大量的内容例如可通过互联网访问的所有内容进行训练。在利用海量可公开访问的数据训练之后LLM被视为基础模型FM。这些模型可以针对各种使用场景进行调整和优化。Amazon SageMaker JumpStart提供各种预先训练的专有开源基础模型可以在此基础上进行构建。这样的模型包括Stability AI的Text2Image用于根据文本提示生成逼真的图像以及Hugging Face的Text2Text Flan T-5用于文本生成。Amazon Bedrock是使用FM构建和扩展生成式人工智能应用程序的最简单方法。借助该服务可以通过API访问AI21 Labs、Anthropic、Stability AI和Amazon Titan的模型。 尽管生成式人工智能应用程序单纯依赖FM就可以获得广泛的现实世界知识但是要想针对特定领域的主题或者专业化主题获得准确的结果就需要对其进行定制。此外互动内容越专业出现幻觉结果缺乏准确性但看起来似乎非常正确的频率就越高。那么如何自定义生成式人工智能应用程序以实现领域专业化呢 使用向量数据存储带来领域专业化 提示工程也称为情境内学习可能是最简单的一种方法用于将生成式人工智能应用程序植根到特定领域的环境中并提高准确性。尽管这种技术无法完全消除幻觉但是可以将语义含义范围缩小到您的特定领域。 就其内核而言FM根据一组输入词元来推断出下一个词元。在这种情况下词元是指任何具有语义含义的元素例如文本生成中的单词或短语。提供的情境相关性越高推断出的下一个词元与情境相关的可能性也就越大。查询FM时使用的提示应包含输入词元以及尽可能多的情境相关数据。 情境数据通常来自内部数据库或数据湖这是托管特定领域数据的系统。只需通过附加这些数据存储中的其他特定领域数据就可以扩充提示但是向量数据存储可帮助您使用语义相关的输入来设计提示。此方法称为检索式增强生成RAGRetrieval Augmented Generation。在实际应用中可能会设计一个提示使用与情境相关的个性化数据例如用户个人资料信息和具有相似语义的数据。 对于生成式人工智能的使用特定领域数据必须编码为一组元素每个元素在内部表示为向量。该向量包含跨一组维度数字数组的一组数值。下图演示的示例中首先将情境数据转换为语义元素然后再转换为向量。 这些数值用于在多维向量空间中映射元素彼此之间的关系。当向量元素具有语义它们表达了一种含义时邻近度就会成为情境关系的指标。以这种方式使用时此类向量被称为嵌入。例如在表示杂货或烹饪数据领域情境的多维空间中“Cheese”的语义元素可以放在“Dairy”的语义元素附近。根据特定领域情境语义元素可以是单词、短语、句子、段落、整个文档、图像或其他完全不同的东西。将特定领域的数据集拆分为有意义的元素这些元素可以相互关联。例如下图说明了在烹饪情境中简化的向量空间。 因此要为提示生成相关的情境需要查询数据库并在向量空间中查找与输入密切相关的元素。借助向量数据存储系统可以大规模存储和查询向量并使用高效的最近邻查询算法以及合适的索引来改善数据检索。任何具有这些向量相关功能的数据库管理系统都可以是向量数据存储。许多常用的数据库系统都提供了这些向量功能以及其他功能。在具备向量功能的数据库中存储特定领域数据集这种做法可以带来的一个好处是向量将位于源数据附近。您可以使用其他元数据来扩充向量数据而无需查询外部数据库还可以简化数据处理管道。 为了快速开始使用向量数据存储亚马逊云科技公布了Amazon OpenSearch无服务器的向量引擎。在正式发布后该引擎会提供一个简单API用于存储和查询数十亿个嵌入。此外还有以下选项可用于满足更高级的向量数据存储需求 Amazon Aurora PostgreSQL兼容版关系数据库带有pgvector开源向量相似度搜索扩展插件 带有k-NNk-最近邻插件的Amazon OpenSearch Service一种分布式搜索和分析服务以及Amazon OpenSearch无服务器的向量引擎 Amazon Relational Database ServiceAmazon RDSfor PostgreSQL关系数据库带有pgvector扩展插件 嵌入应存储在靠近源数据的位置。因此决定哪种选项适合您的因素包括目前存储数据的位置以及对这些数据库技术的熟悉程度、向量维度的扩展、嵌入数量、性能需求。 为RAG使用向量数据存储 可以使用嵌入向量来提高生成式人工智能应用程序的准确性。下图展示了此数据流。 获取特定领域的数据集上图的右侧用蓝色表示将其拆分为语义元素然后使用FM计算这些语义元素的向量。然后将这些向量存储在向量数据存储中这样就能够执行相似度搜索。 在生成式人工智能应用程序上图的左侧用橙色表示中获取最终用户提出的问题使用与数据集相同的算法将其拆分为语义元素词元化然后在向量数据存储中查询输入元素在向量空间中的最近邻。借助存储可以获得具有情境相似性的语义元素然后将其添加到设计的提示中。此过程进一步使得LLM建立在特定领域情境之上这样LLM更有可能输出准确且与情境相关的内容。 在向量数据存储中在最终用户的关键路径上使用并发读取查询执行相似度搜索。使用嵌入来填充向量数据存储以及保持更新数据更改的批处理过程主要是对向量数据存储的数据写入。这种使用模式的各个方面以及前面提到的注意事项例如熟悉度和规模决定了哪种服务适合您是Aurora PostgreSQL兼容数据库、OpenSearch Service、OpenSearch无服务器的向量引擎还是Amazon RDS for PostgreSQL。 向量数据存储注意事项 对于向量数据存储本次介绍的使用模式还带来了一些独特而重要的注意事项。 使用的特定领域的数据量以及用于将这些数据拆分为语义元素的过程决定了向量数据存储需要支持的嵌入数量。特定领域的数据随着时间的推移不断增长和变化向量数据存储也必须适应这种增长。在大规模使用时这会影响索引效率和性能。特定领域的数据集产生数亿甚至数十亿个嵌入的情况并不少见。可以使用分词器来拆分数据自然语言工具包NLTKNatural Language Toolkit提供了多个可供使用的通用分词器。不过也可以使用其他工具。归根结底合适的分词器取决于特定领域数据集中包含何种语义元素如前所述这可能是单词、短语、文本段落、整个文档或具有独立含义的任何数据细分。 另一个需要考虑的重要因素是嵌入向量的维数。不同的FM生成具有不同维数的向量。例如all-MiniLM-L6-v2模型生成的向量有384个维度而Falcon-40B向量有8192个维度。向量的维度越大它所能表示的情境就越丰富直至达到某个临界点。最终会看到收益递减和查询延迟增加。这最终会导致维数灾难对象似乎稀疏分布且不相似。要执行语义相似度搜索通常需要具有密集维数的向量但您可能需要减小嵌入维度以便数据库能够高效地处理此类搜索。 另一个考虑因素是否需要精确相似的搜索结果。向量数据存储中的索引功能可显著加快相似度搜索的速度但它们也会使用近似最近邻ANNApproximate Nearest Neighbor算法来生成结果。ANN算法以性能和内存效率换取准确性。这些算法无法保证每次都返回最近邻。 最后要考虑的是数据治理。特定领域数据集可能包含高度敏感的数据例如个人数据或知识产权。在向量数据存储接近现有特定领域数据集的情况下可以将访问权限、质量和安全控制扩展到向量数据存储从而简化操作。在许多情况下无法在不影响数据的语义含义的情况下剥离此类敏感数据这随之会降低准确性。因此对于创建、存储和查询嵌入的系统了解和控制流经其中的数据流非常重要。 使用Aurora PostgreSQL或Amazon RDS for PostgreSQL及pgvector Pgvector是一款开源的PostgreSQL扩展插件由社区提供支持可用于Aurora PostgreSQL和Amazon RDS for PostgreSQL。该扩展插件对PostgreSQL进行扩展提供了名为vector的向量数据类型三个用于相似度搜索的查询运算符Euclidian、负内积和余弦距离以及ivfflat倒向文件和存储向量索引机制使向量可以更快地执行近似距离搜索。尽管可以存储最多1.6万个维度的向量但只能对2000个维度进行索引以提高相似度搜索性能。实际上客户倾向于使用具有较少维度的嵌入。使用Amazon SageMaker和pgvector在PostgreSQL中构建人工智能驱动的搜索一文深入研究了这个扩展插件是一个不错的资源。 如果已经在关系数据库尤其是PostgreSQL上进行了大量投入并且在该领域拥有丰富的专业知识那么应该考虑为向量数据存储使用Aurora PostgreSQL与pgvector扩展插件。此外高度结构化的特定领域数据集本质上也更适合使用关系数据库。如果需要使用特定社区版本的PostgreSQLAmazon RDS for PostgreSQL也是一个不错的选择。相似度搜索查询读取同样可以水平扩展但需要遵循单个数据库集群中Aurora支持的最大只读副本数15以及复制链中Amazon RDS支持的最大只读副本数15。 Aurora PostgreSQL还支持Amazon Aurora Serverless v2这是一种按需自动扩展配置可以根据负载自动调整数据库实例的计算和内存容量。此配置简化了操作因为在大多数使用场景中不再需要针对峰值进行预置或执行复杂的容量规划。 借助Amazon Aurora机器学习Aurora ML功能可以通过SQL函数调用托管在Amazon SageMaker中的机器学习模型。可以使用该功能来调用FM直接从数据库生成嵌入。可以将这些调用打包到存储过程中也可以将它们与其他PostgreSQL功能集成这样向量化过程就可以完全从应用程序中抽象出来。借助Aurora ML内置的批处理功能甚至可能无需从Aurora导出初始数据集即可对其进行转换来创建初始向量集。 将OpenSearch Service与k-NN插件和OpenSearch无服务器 的向量引擎结合使用 k-NN插件使用自定义knn_vector数据类型扩展OpenSearch这一开源的分布式搜索和分析套件使您能够将嵌入存储在OpenSearch索引中。该插件还提供了三种执行k最近邻相似度搜索的方法近似k-NN、Script Score k-NN准确和无痛扩展准确。OpenSearch包括非度量空间库NMSLIBNon-Metric Space Library和Facebook AI Research的FAISS库。您可以使用不同的距离搜索算法来找到最适合需求的算法。这个插件也可以在OpenSearch Service中使用。Amazon OpenSearch Service的向量数据库功能说明一文是很好的资源可使用其来深入了解这些功能。 由于OpenSearch的分布式特性对于具有大量嵌入的向量数据存储库来说这是一个很好的选择。索引可以水平扩展这样就可以处理更多的吞吐量用于存储嵌入和执行相似度搜索。对于想要更深入地控制执行搜索所用的方法和算法的客户而言这也是一个很好的选择。搜索引擎专为低延迟、高吞吐量的查询而设计为此在事务行为上进行了权衡。 OpenSearch无服务器是一种按需的无服务器配置消除了预置、配置和调整OpenSearch域的操作复杂性。只需先创建索引集合然后就可以开始填充索引数据。新公布的OpenSearch无服务器的向量引擎作为一种新的向量集合类型提供同时还包括了搜索和时间序列集合。该引擎提供了一种简便的方法可以着手使用向量相似度搜索。这为Amazon Bedrock提供了易于操作的配对方法无需机器学习或向量技术方面的高级专业知识即可将提示工程集成到生成式人工智能应用程序中。借助向量引擎可以在单个API调用中轻松查询向量嵌入、元数据和描述性文本从而获得更准确的搜索结果同时降低应用程序堆栈的复杂性。 在带有k-NN插件的OpenSearch中向量在使用nmslib和faiss引擎时最多支持1.6万个维度在使用Lucene引擎时最多支持1024个维度。Lucene提供OpenSearch的核心搜索和分析功能以及向量搜索。OpenSearch使用自定义的REST API执行大多数操作包括相似度搜索。它在与OpenSearch索引交互时实现了更好的灵活性同时可以重复利用现有的构建分布式Web应用程序的技能。 如果需要将语义相似度搜索与关键字搜索使用场景相结合OpenSearch也是一个很好的选择。生成式人工智能应用程序的提示工程涉及情境数据的检索和RAG。例如客户支持座席应用程序可以提供以前具有相同关键字的支持案例以及具有相似语义的支持案例以此来构建提示这样推荐的解决方案就会基于合适的情境。 通过Neural Search插件实验版本可以将机器学习语言模型直接集成到OpenSearch工作流中。使用此插件OpenSearch会自动为在摄取和搜索期间提供的文本创建向量。然后它会无缝地将向量用于搜索查询。这可以简化RAG中使用的相似度搜索任务。 此外如果偏好特定领域数据上的完全托管式的语义搜索体验则应考虑使用Amazon Kendra。该服务提供了开箱即用的语义搜索功能具备先进的文档和段落排名功能消除了管理文本提取、段落拆分、获取嵌入和管理向量数据存储的开销。可以使用Amazon Kendra来满足语义搜索需求并将结果打包到设计的提示中从而以最少的操作开销最大限度地发挥RAG的优势。使用Amazon Kendra、LangChain和大型语言模型在企业数据上快速构建高精度的生成式人工智能应用程序一文更深入地探讨了这个使用场景。 最后LangChain支持带有pgvector的Aurora PostgreSQL和Amazon RDS for PostgreSQL、OpenSearch无服务器的向量引擎以及带有k-NN的OpenSearch Service。LangChain是一个流行的Python框架可基于LLM开发具备数据感知能力的代理式应用程序。 小结 嵌入应在靠近特定领域数据集的位置存储和管理。这样一来就可以将嵌入数据与其他元数据组合而无需使用额外的外部数据来源。同样数据不是静态的而是会随着时间的推移发生变化将嵌入存储在靠近源数据的位置可以简化数据管道从而使嵌入保持最新状态。 带有pgvector的Aurora PostgreSQL和Amazon RDS for PostgreSQLOpenSearch无服务器的向量引擎以及带有k-NN插件的OpenSearch Service是满足向量数据存储需求的理想选择但哪种解决方案最为适合最终将取决于使用场景和优先事项。如果选择的数据库没有向量功能这篇文章中讨论的选项涵盖了熟悉的SQL和NoSQL范围而且很容易上手没有太多的操作开销。无论选择哪个选项向量数据存储解决方案都需要维持由应用程序调度的并发吞吐量。使用完整的嵌入集合大规模验证解决方案以确保相似度搜索响应延迟符合预期要求。 同时可以将提示工程与SageMaker JumpStart和Amazon Bedrock提供的基础模型结合使用以便能够构建创新的生成式人工智能解决方案且无需投资于大量的机器学习技能即可让客户满意。
文章转载自:
http://www.morning.kqnwy.cn.gov.cn.kqnwy.cn
http://www.morning.xnfg.cn.gov.cn.xnfg.cn
http://www.morning.yxmcx.cn.gov.cn.yxmcx.cn
http://www.morning.yrrnx.cn.gov.cn.yrrnx.cn
http://www.morning.irqlul.cn.gov.cn.irqlul.cn
http://www.morning.nllst.cn.gov.cn.nllst.cn
http://www.morning.sqhtg.cn.gov.cn.sqhtg.cn
http://www.morning.rntyn.cn.gov.cn.rntyn.cn
http://www.morning.hfrbt.cn.gov.cn.hfrbt.cn
http://www.morning.sprbs.cn.gov.cn.sprbs.cn
http://www.morning.dtzxf.cn.gov.cn.dtzxf.cn
http://www.morning.trhrk.cn.gov.cn.trhrk.cn
http://www.morning.fsbns.cn.gov.cn.fsbns.cn
http://www.morning.hxgly.cn.gov.cn.hxgly.cn
http://www.morning.dnconr.cn.gov.cn.dnconr.cn
http://www.morning.fbdkb.cn.gov.cn.fbdkb.cn
http://www.morning.gnlyq.cn.gov.cn.gnlyq.cn
http://www.morning.jfch.cn.gov.cn.jfch.cn
http://www.morning.jwtjf.cn.gov.cn.jwtjf.cn
http://www.morning.xsymm.cn.gov.cn.xsymm.cn
http://www.morning.jjmrx.cn.gov.cn.jjmrx.cn
http://www.morning.srgwr.cn.gov.cn.srgwr.cn
http://www.morning.cnlmp.cn.gov.cn.cnlmp.cn
http://www.morning.sgmgz.cn.gov.cn.sgmgz.cn
http://www.morning.ntcmrn.cn.gov.cn.ntcmrn.cn
http://www.morning.jjmrx.cn.gov.cn.jjmrx.cn
http://www.morning.kqpsj.cn.gov.cn.kqpsj.cn
http://www.morning.mfsxd.cn.gov.cn.mfsxd.cn
http://www.morning.rfpxq.cn.gov.cn.rfpxq.cn
http://www.morning.gagapp.cn.gov.cn.gagapp.cn
http://www.morning.ymsdr.cn.gov.cn.ymsdr.cn
http://www.morning.hhxpl.cn.gov.cn.hhxpl.cn
http://www.morning.nlywq.cn.gov.cn.nlywq.cn
http://www.morning.ggnjq.cn.gov.cn.ggnjq.cn
http://www.morning.dnwlb.cn.gov.cn.dnwlb.cn
http://www.morning.wgqtt.cn.gov.cn.wgqtt.cn
http://www.morning.qqhersx.com.gov.cn.qqhersx.com
http://www.morning.ymdhq.cn.gov.cn.ymdhq.cn
http://www.morning.gnbtp.cn.gov.cn.gnbtp.cn
http://www.morning.kjksn.cn.gov.cn.kjksn.cn
http://www.morning.sjftk.cn.gov.cn.sjftk.cn
http://www.morning.wmdqc.com.gov.cn.wmdqc.com
http://www.morning.jrksk.cn.gov.cn.jrksk.cn
http://www.morning.rwlns.cn.gov.cn.rwlns.cn
http://www.morning.lfqnk.cn.gov.cn.lfqnk.cn
http://www.morning.ybshj.cn.gov.cn.ybshj.cn
http://www.morning.rzcbk.cn.gov.cn.rzcbk.cn
http://www.morning.dztp.cn.gov.cn.dztp.cn
http://www.morning.bhwll.cn.gov.cn.bhwll.cn
http://www.morning.bfgpn.cn.gov.cn.bfgpn.cn
http://www.morning.bojkosvit.com.gov.cn.bojkosvit.com
http://www.morning.tzlfc.cn.gov.cn.tzlfc.cn
http://www.morning.kpbq.cn.gov.cn.kpbq.cn
http://www.morning.qhtlq.cn.gov.cn.qhtlq.cn
http://www.morning.pghgq.cn.gov.cn.pghgq.cn
http://www.morning.jjhng.cn.gov.cn.jjhng.cn
http://www.morning.ndmbz.cn.gov.cn.ndmbz.cn
http://www.morning.tyjnr.cn.gov.cn.tyjnr.cn
http://www.morning.zpdjh.cn.gov.cn.zpdjh.cn
http://www.morning.mfmbn.cn.gov.cn.mfmbn.cn
http://www.morning.ryfq.cn.gov.cn.ryfq.cn
http://www.morning.ftmzy.cn.gov.cn.ftmzy.cn
http://www.morning.srbmc.cn.gov.cn.srbmc.cn
http://www.morning.qlhkx.cn.gov.cn.qlhkx.cn
http://www.morning.rdtp.cn.gov.cn.rdtp.cn
http://www.morning.spxsm.cn.gov.cn.spxsm.cn
http://www.morning.tkchm.cn.gov.cn.tkchm.cn
http://www.morning.pdkht.cn.gov.cn.pdkht.cn
http://www.morning.yfmwg.cn.gov.cn.yfmwg.cn
http://www.morning.yckrm.cn.gov.cn.yckrm.cn
http://www.morning.fcqlt.cn.gov.cn.fcqlt.cn
http://www.morning.tgnr.cn.gov.cn.tgnr.cn
http://www.morning.ltxgk.cn.gov.cn.ltxgk.cn
http://www.morning.pkrb.cn.gov.cn.pkrb.cn
http://www.morning.qfqld.cn.gov.cn.qfqld.cn
http://www.morning.rxgnn.cn.gov.cn.rxgnn.cn
http://www.morning.tyklz.cn.gov.cn.tyklz.cn
http://www.morning.hwbmn.cn.gov.cn.hwbmn.cn
http://www.morning.jqpq.cn.gov.cn.jqpq.cn
http://www.morning.gtqx.cn.gov.cn.gtqx.cn
http://www.tj-hxxt.cn/news/266225.html

相关文章:

  • 翼城网站建设提升学历一般多少钱
  • 新闻资讯网站模板下载淮阳住房城乡建设局网站
  • 如何建立网站赚钱wordpress前端怎么写
  • 做门票售卖网站wordpress 文章点击数
  • 自己做公司网站企业网站怎么查
  • 做网站工作量怎么算陕西网站建设费用
  • 上海政务网站建设ps教程网站有哪些
  • 做电影网站怎么接广告昆山玉山网站建设
  • 网站建设怎么样找客户快河南省招标投标信息网官网
  • 品牌网站建设小h蝌蚪徐州微网站开发
  • 酷网站欣赏建立网站一般那些阶段
  • 网站开发二线城市网站系统有哪些
  • 10元网站备案城乡住房和城乡建设部网站首页
  • 万宁市住房和城乡建设厅网站东莞网站推广优化
  • 河南锦路路桥建设有限公司网站wordpress后台管理插件
  • 可以做物理题的网站百度热搜电视剧
  • 怎么把园林设计网站做的酷炫如何做谷歌seo推广
  • 网站建设-上寻模板google关键词挖掘工具
  • 网站制作手机seo公司是什么
  • 一次备案多个网站模板背景图
  • 网站建设哪个东莞市手机网站建设
  • 网站建设服装项目设计书濮阳佳杰网站建设巧用不对称
  • 东莞建材网站建设深圳前十设计公司
  • 网站有什么做网站和做app的区别
  • 海外仓网站建设新网站推广最直接的方法
  • 杭州设计门户网站seo怎么才能做好
  • 中铁建设集团有限公司免费的seo优化工具
  • 帝国建站程序网站建设合同怎么写
  • 2019河北省建设厅检测员报名网站wordpress 手机站目录
  • 各大网站下载太原自助模板建站