当前位置: 首页 > news >正文

大连企业自助建站云南今日头条新闻

大连企业自助建站,云南今日头条新闻,医疗机构网站以患者做宣传,淘宝推广分类目录:《自然语言处理从入门到应用》总目录 合并语言模型和我们自己的文本数据是区分它们的一种强大方式,这样做的第一步是将数据加载到“文档”中,文档加载器的作用就是使这个过程变得简单。 LangChain提供了三种文档加载器:…

分类目录:《自然语言处理从入门到应用》总目录


合并语言模型和我们自己的文本数据是区分它们的一种强大方式,这样做的第一步是将数据加载到“文档”中,文档加载器的作用就是使这个过程变得简单。

LangChain提供了三种文档加载器:

  • 转换加载器
  • 公共数据集或服务加载器
  • 专有数据集或服务加载器

转换加载器

这些转换加载器将数据从特定格式转换为文档格式,例如有用于CSV和SQL的转换器。大多数情况下,这些加载器从文件中输入数据,有时也可以从URL中输入数据。许多这些转换器的主要驱动程序是Unstructured模块。该包可以将许多类型的文件(文本、PowerPoint、图像、HTML、PDF 等)转换为文本数据。

文档加载器提供的文件类型或数据类型包括:

  • Airtable
  • OpenAIWhisperParser
  • CoNLL-U
  • Copy Paste
  • CSV
  • Email
  • EPUB
  • EverNote
  • Microsoft Excel
  • Facebook Chat
  • File Directory
  • HTML
  • Images
  • Jupyter Notebook
  • JSON
  • Markdown
  • Microsoft PowerPoint
  • Microsoft Word
  • Open Document Format (ODT)
  • Pandas DataFrame
  • PDF
  • Sitemap
  • Subtitle
  • Telegram
  • TOML
  • Unstructured File
  • URL
  • Selenium URL Loader
  • Playwright URL Loader
  • WebBaseLoader
  • Weather
  • WhatsApp Chat

公共数据集或服务加载器

这些数据集和来源是为公共领域创建的,我们使用查询来搜索并下载所需的文档。。对于这些数据集和服务,我们不需要任何访问权限。下面是一些公共数据集或服务加载器的示例:

  • Arxiv
  • AZLyrics
  • BiliBili
  • College Confidential
  • Gutenberg
  • Hacker News
  • HuggingFace数据集
  • iFixit
  • IMSDb
  • MediaWikiDump
  • Wikipedia
  • YouTube 转录

专有数据集或服务加载器

这些数据集和服务不属于公共领域。这些加载器主要用于转换特定格式的应用程序或云服务的数据,e。我们需要访问令牌和其他参数才能访问这些数据集和服务。下面是一些专有数据集或服务加载器的示例:

  • Airbyte JSON
  • Apify Dataset
  • AWS S3 Directory
  • AWS S3 File
  • Azure Blob Storage Container
  • Azure Blob Storage File
  • Blackboard
  • Blockchain
  • ChatGPT Data
  • Confluence
  • Diffbot
  • Docugami
  • DuckDB
  • Fauna
  • Figma
  • GitBook
  • Git
  • Google BigQuery
  • Google Cloud Storage Directory
  • Google Cloud Storage File
  • Google Drive
  • Image Captions
  • Iugu
  • Joplin
  • Microsoft OneDrive
  • Modern Treasury
  • Notion DB 2/2
  • Notion DB 1/2
  • Obsidian
  • Psychic
  • PySpark DataFrame Loader
  • ReadTheDocs Documentation
  • Reddit
  • Roam
  • Slack
  • Snowflake
  • Spreedly
  • Stripe
  • Twitter
  • 2Markdown

参考文献:
[1] LangChain官方网站:https://www.langchain.com/
[2] LangChain 🦜️🔗 中文网,跟着LangChain一起学LLM/GPT开发:https://www.langchain.com.cn/
[3] LangChain中文网 - LangChain 是一个用于开发由语言模型驱动的应用程序的框架:http://www.cnlangchain.com/

http://www.tj-hxxt.cn/news/41191.html

相关文章:

  • 30分钟seo网站抖音搜索seo软件
  • 拖式网站建设免费开源代码网站
  • 手机网站制作费用关键词林俊杰百度云
  • 搜一搜站长工具软文网站
  • wordpress表单 post抖音seo关键词优化排名
  • 网站建设被骗维护费万网域名管理入口
  • 深圳网站建设外贸公司排名沈阳头条今日头条新闻最新消息
  • 版面设计排版南宁网站优化公司电话
  • 好的文案网站seo网站制作优化
  • 深圳专门做兼职的网站电商网页
  • 深圳找工作哪个网站好广告营销是做什么的
  • WordPress指定IP访问seo百度排名优化
  • 永清建设局网站2024年疫情还会封控吗
  • 除了wordpress信息流优化师前景
  • 网站备案 主体黑名单网页设计模板
  • 一个网站可以做多个描述吗武汉seo报价
  • 做外贸哪个英文网站好长春百度快速优化
  • 网站开发后端用什么关键词优化排名详细步骤
  • 做一个搜索引擎网站要多少钱seo外链论坛
  • 服装设计公司效果图怎么优化自己公司的网站
  • php网站后台密码忘记了成都百度推广开户公司
  • 建筑给排水代做网站全球网络营销公司排名
  • mac做网站软件佛山网站优化
  • 网站托管平台爱站网工具
  • 有什么网站可以做问卷调查网络营销外包推广定制公司
  • 房产中介做网站seo科技网
  • 济南网站外包小说推广关键词怎么弄
  • 网站开发私活分成潍坊seo招聘
  • 网站超级链接草根站长工具
  • 海口建站模板系统免费引流推广方法