巩义市网站建设,沈阳网站建设找德泰诺,班级网站界面,12380网站建设情况说明图1#xff1a;2023ACM中国图灵大会现场
生于1912年的艾伦图灵被称为“计算机科学之父”、“人工智能之父”。1966年#xff0c;国际计算机协会#xff08;ACM#xff09;为了纪念这位卓越的科学家#xff0c;设立了以其名字命名的ACM图灵奖#xff0c;以表彰在计算机领… 图12023ACM中国图灵大会现场
生于1912年的艾伦·图灵被称为“计算机科学之父”、“人工智能之父”。1966年国际计算机协会ACM为了纪念这位卓越的科学家设立了以其名字命名的ACM图灵奖以表彰在计算机领域做出重大贡献的科学家。
时至今日图灵专注创新、持续探索的精神激励着一代又一代的科学家投身计算机科学的研究由此带动的IT技术变革也深刻影响了社会和经济的发展。
今天新一轮人工智能科技革命和产业变革已然到来。自去年年底以来国内众多科技企业陆续推出大模型产品并积极推进大模型的行业落地应用。
在AI大模型火热的当下以“通用智能人机共生”为主题的2023ACM中国图灵大会于7月28日至30日在武汉召开。酷克数据作为国内云原生数据仓库领军企业受邀参与本次大会。在会上酷克数据展示了基于HashData云数仓自主研发的下一代高级分析和数据科学工具HashML助力 AI 模型生产应用和规模化落地。
三层解耦 降低数据分析成本
AI模型训练需要依托海量的文本、图像和视频数据。如何低成本、高效率地管理与利用数据是企业在人工智能时代面临的重要挑战。HashData云数仓通过创新的三层解耦架构设计在保证了数据的一致性的同时节省了更低的存储和调用资源。 图2HashData产品架构
HashData的湖仓一体特性帮助企业一站式管理多模态训练数据。产品架构完美适应混合云最大限度帮助用户实现公域训练数据和私有训练数据的安全、合规、统一管理和调度。云架构带来的充分弹性和并发性支持几乎无限的横向扩展满足用户长时间、高密度的数据提取与计算的峰值需求。此外HashData支持亿级向量存储为大模型训练提供根本的底层支持。
同时HashData云数仓能够充分发挥云平台的弹性和扩展能力并且将数据持久化到底层对象存储大幅度降低企业进行数据分析的成本。
HashData数据仓库可无缝对接多种公有云和混合云以统一的平台提供包括数据仓库、数据湖、数据科学、数据工程和数据共享等能力可以支持千万级的数据库对象、100PB数据量、数千个并发应用。
此外通过支持对象存储HashData能够提供完全兼容多个公有云与混合云的数据管理能力为企业多云战略的实施提供了灵活易用的解决方案。
两大引擎 高效管理海量数据
在数据智能产业链上基础设施建设和模型生产应用是AI大模型发展的必由之路而机器学习是Al成长的重要“抓手”。
传统MPP架构的数据库在机器学习解决方案存在支持算法种类有限、缺乏数据并行训练、新算法开发难度大等诸多问题难以满足数据管理和模型开发的需求。
与之相比HashData拥有两种计算引擎针对SQL查询分析任务的MPP计算引擎以及针对机器学习和深度学习任务的ML/DL计算引擎。
基于存算分离的架构HashData不仅能够通过SQL计算引擎对传统的数仓业务提供很好的支持还能够借助ML/DL计算引擎实现对机器学习和深度学习的高效支持其中包括在库内环境对大语言模型进行微调和推理。HashML就是酷克数据利用HashData强大的计算引擎打造的下一代In-Database高级分析和数据科学工具。 图3基于HashData双计算引擎架构构建HashML
同时HashData还实现了对大规模向量数据的高效存储和检索使得基于知识增强的LLM智能应用搭建变得更加简单。
一步到位 助力大模型规模化应用
AI 模型开发完成后需要在实际生产环境中落地部署才能最终实现价值。
国际调研机构Gartner的研究表明只有53%的项目能够从 AI 原型转化为生产。AI生产转化率低的主要原因在于模型全链路生命周期管理存在问题包括跨团队协作难度大、过程和资产管理欠缺、生产和交付周期长等。
为了解决这些问题HashML提供了从数据查询处理、高级分析到ML/DL模型的训练、推理和服务部署的全套工具实现对大语言模型微调和推理的全链路支持。例如借助HashML最少用3行代码就可以对LLaMA2模型进行参数高效的微调 图4用HashML对LLaMA2模型进行微调
HashML与HashData云数仓共享统一的存储和计算资源随数仓的部署提供开箱即用、一站式交付的AI能力大幅降低了系统部署的成本和复杂度为开发者提供了统一的数据查询、分析、建模环境。 图5HashML主要功能概览
作为一款算法先进、性能卓越的数据科学工具HashML能够帮助用户高效、简易地构建、训练和部署模型极大地降低建模使用门槛让用户能够在短时间内尝试多种模型架构和参数组合从而更好地满足多元应用场景的需求。
目前HashML各项功能正在紧锣密鼓地完善中预计将于八月发布第一个正式版本。届时我们将邀请各方合作伙伴共同参与验证测试推动产品快速迭代升级加速 AI 落地让AI惠及各行各业。