当前位置: 首页 > news >正文

野马视觉传媒网站建设广西桂平建设局网站

野马视觉传媒网站建设,广西桂平建设局网站,建设工程中标通知书查询网站,微网站开发微网站建设文章目录 1、模型简介2、相关背景3、主要创新点预训练#xff1a;为推理而生的基础模型后训练#xff1a;开创性的推理模型RL 基础设施 4、模型细节5、评测结果6、模型部署SGLang 推理vLLM 推理HuggingFace 推理 项目开源 技术报告#xff1a;https://arxiv.org/abs/2505.0… 文章目录 1、模型简介2、相关背景3、主要创新点预训练为推理而生的基础模型后训练开创性的推理模型RL 基础设施 4、模型细节5、评测结果6、模型部署SGLang 推理vLLM 推理HuggingFace 推理 项目开源 技术报告https://arxiv.org/abs/2505.07608githubhttps://github.com/XiaomiMiMo/MiMo 1、模型简介 MiMo-7B系列模型是从零开始训练并专为推理任务而生的。其强化学习实验显示模型具有非凡的推理潜力甚至超过了大得多的320亿参数模型。此外在冷启动的SFT模型上进行了RL训练生成了MiMo-7B-RL该模型在数学和代码推理任务上表现出色与OpenAI o1-mini的表现相当。 MiMo-7B系列包括基础模型MiMo-7B-Base、SFT模型MiMo-7B-SFT、从基础模型训练的RL模型MiMo-7B-RL-Zero以及从SFT模型训练的RL模型MiMo-7B-RL。 2、相关背景 目前大多数成功的强化学习工作都依赖于相对较大的基础模型例如320亿参数的模型特别是在增强代码推理能力方面。此外普遍认为在一个小模型中同时提高数学和代码能力是具有挑战性的。 然而我们认为强化学习训练的推理模型的有效性依赖于基础模型固有的推理潜力。为了充分释放语言模型的推理潜力不仅需要关注后训练还需要关注针对推理定制的预训练策略。 3、主要创新点 预训练为推理而生的基础模型 优化了数据预处理流程增强了文本提取工具包并应用了多维度数据过滤以增加预训练数据中的推理模式密度。还采用了多种策略来生成大量多样化的合成推理数据。采用三阶段数据混合策略进行预训练。总体而言MiMo-7B-Base 在大约 25 万亿个令牌上进行了预训练。将多令牌预测MTP作为额外的训练目标纳入其中这增强了模型性能并加速了推理。 后训练开创性的推理模型 精心挑选了 130K 个数学和代码问题作为强化学习RL训练数据这些问题可以通过基于规则的验证器进行验证。每个问题都经过仔细清理和难度评估以确保质量。仅使用基于规则的准确性奖励以避免潜在的奖励黑客攻击。为了缓解具有挑战性的代码问题的稀疏奖励问题引入了测试难度驱动的代码奖励。通过对不同难度级别的测试用例分配细粒度的分数可以通过密集的奖励信号更有效地优化策略。对简单问题实施了数据重采样策略以提高 rollout 采样效率并在 RL 训练的后期阶段稳定策略更新。 RL 基础设施 开发了一个无缝 Rollout 引擎以加速 RL 训练和验证。设计集成了连续 rollout、异步奖励计算和提前终止以最小化 GPU 空闲时间实现了 2.29× 的更快训练和 1.96× 的更快验证。在 vLLM 中支持 MTP并增强了 RL 系统中推理引擎的鲁棒性。 4、模型细节 MiMo-7B 的 MTP 层在预训练和 SFT 期间进行微调并在 RL 期间冻结。对于推测解码一个 MTP 层的接受率约为 90%。 MiMo-7B系列主要包含如下四款模型其具体描述和下载地址如下 Huggingface下载地址 https://huggingface.co/XiaomiMiMomodelscope下载地址 https://www.modelscope.cn/organization/XiaomiMiMo 5、评测结果 模型通用能力基本与QwQ-32B-Preview相当 数学和代码能力优于OpenAI o1-mini等其他模型 MiMo-7B系列模型对比其中 MiMo-7B-RL 在 数学和代码能力上最强 注评估是在 temperature0.6 的条件下进行的。AIME24 和 AIME25 的分数是 32 次重复的平均分。 6、模型部署 SGLang 推理 SGLang 支持了 MiMo 模型 和 MTP示例脚本 # Install the latest SGlang from main branch python3 -m uv pip install sglang[all] githttps://github.com/sgl-project/sglang.git/main#eggsglangsubdirectorypython# Launch SGLang Server SGLANG_USE_MODELSCOPEtrue python3 -m sglang.launch_server --model-path XiaomiMiMo/MiMo-7B-RL --host 0.0.0.0 --trust-remote-code# Launch MTP Server SGLANG_USE_MODELSCOPEtrue python3 -m sglang.launch_server --model-path XiaomiMiMo/MiMo-7B-RL --trust-remote-code \ --speculative-algorithm EAGLE --speculative-num-steps 1 --speculative-eagle-topk 1 \ --speculative-num-draft-tokens 2 --mem-fraction 0.5详细用法请参阅 SGLang 文档 vLLM 推理 官方支持使用 MiMo-vLLM 的分支 进行 MiMo-MTP 推理。示例代码推荐使用 vLLM 0.7.3 版本 from vllm import LLM, SamplingParamsmodel_path /path/to/MiMo llm LLM(modelmodel_path,trust_remote_codeTrue,num_speculative_tokens1,disable_log_statsFalse ) sampling_params SamplingParams(temperature0.6)conversation [{role: system,content: },{role: user,content: Write an essay about the importance of higher education.,}, ]outputs llm.chat(conversation,sampling_paramssampling_params,use_tqdmFalse)for output in outputs:prompt output.promptgenerated_text output.outputs[0].textprint(fPrompt: {prompt!r}, Generated text: {generated_text!r})print( * 80)你也可以注册一个不加载 MTP 参数的 vLLM 加载器来使用 MiMo。你需要将 registry/register_mimo_in_vllm.py 复制到你的目录并通过以下方式导入 import register_mimo_in_vllmfrom vllm import LLM, SamplingParamsmodel_path /path/to/MiMo llm LLM(modelmodel_path,trust_remote_codeTrue,# num_speculative_tokens1,disable_log_statsFalse ) sampling_params SamplingParams(temperature0.6)HuggingFace 推理 示例代码 from modelscope import AutoModel, AutoModelForCausalLM, AutoTokenizermodel_id XiaomiMiMo/MiMo-7B-RL model AutoModelForCausalLM.from_pretrained(model_id, trust_remote_codeTrue) tokenizer AutoTokenizer.from_pretrained(model_id) inputs tokenizer([Today is], return_tensorspt) output model.generate(**inputs, max_new_tokens 100) print(tokenizer.decode(output.tolist()[0]))
文章转载自:
http://www.morning.yrnyz.cn.gov.cn.yrnyz.cn
http://www.morning.nyfyq.cn.gov.cn.nyfyq.cn
http://www.morning.nhdw.cn.gov.cn.nhdw.cn
http://www.morning.rrcrs.cn.gov.cn.rrcrs.cn
http://www.morning.bjsites.com.gov.cn.bjsites.com
http://www.morning.nmfml.cn.gov.cn.nmfml.cn
http://www.morning.knjj.cn.gov.cn.knjj.cn
http://www.morning.hyxwh.cn.gov.cn.hyxwh.cn
http://www.morning.lqzhj.cn.gov.cn.lqzhj.cn
http://www.morning.qqrqb.cn.gov.cn.qqrqb.cn
http://www.morning.gpmrj.cn.gov.cn.gpmrj.cn
http://www.morning.xphcg.cn.gov.cn.xphcg.cn
http://www.morning.sgpnz.cn.gov.cn.sgpnz.cn
http://www.morning.bmhc.cn.gov.cn.bmhc.cn
http://www.morning.qsctt.cn.gov.cn.qsctt.cn
http://www.morning.zxzgr.cn.gov.cn.zxzgr.cn
http://www.morning.smj78.cn.gov.cn.smj78.cn
http://www.morning.kqzxk.cn.gov.cn.kqzxk.cn
http://www.morning.wjlnz.cn.gov.cn.wjlnz.cn
http://www.morning.fcwxs.cn.gov.cn.fcwxs.cn
http://www.morning.dkqbc.cn.gov.cn.dkqbc.cn
http://www.morning.hjlsll.com.gov.cn.hjlsll.com
http://www.morning.wqnc.cn.gov.cn.wqnc.cn
http://www.morning.dwzwm.cn.gov.cn.dwzwm.cn
http://www.morning.rkwlg.cn.gov.cn.rkwlg.cn
http://www.morning.tkzqw.cn.gov.cn.tkzqw.cn
http://www.morning.fbrshjf.com.gov.cn.fbrshjf.com
http://www.morning.mtrrf.cn.gov.cn.mtrrf.cn
http://www.morning.fhrgk.cn.gov.cn.fhrgk.cn
http://www.morning.dnmwl.cn.gov.cn.dnmwl.cn
http://www.morning.htjwz.cn.gov.cn.htjwz.cn
http://www.morning.fbmjl.cn.gov.cn.fbmjl.cn
http://www.morning.djgrg.cn.gov.cn.djgrg.cn
http://www.morning.xbmwm.cn.gov.cn.xbmwm.cn
http://www.morning.hdrrk.cn.gov.cn.hdrrk.cn
http://www.morning.sxwfx.cn.gov.cn.sxwfx.cn
http://www.morning.xscpq.cn.gov.cn.xscpq.cn
http://www.morning.gpryk.cn.gov.cn.gpryk.cn
http://www.morning.sqhlx.cn.gov.cn.sqhlx.cn
http://www.morning.wscfl.cn.gov.cn.wscfl.cn
http://www.morning.tdwjj.cn.gov.cn.tdwjj.cn
http://www.morning.brkrt.cn.gov.cn.brkrt.cn
http://www.morning.fysdt.cn.gov.cn.fysdt.cn
http://www.morning.qphdp.cn.gov.cn.qphdp.cn
http://www.morning.dpbgw.cn.gov.cn.dpbgw.cn
http://www.morning.qdlr.cn.gov.cn.qdlr.cn
http://www.morning.shinezoneserver.com.gov.cn.shinezoneserver.com
http://www.morning.gcspr.cn.gov.cn.gcspr.cn
http://www.morning.dmthy.cn.gov.cn.dmthy.cn
http://www.morning.wgdnd.cn.gov.cn.wgdnd.cn
http://www.morning.dwncg.cn.gov.cn.dwncg.cn
http://www.morning.jlpdc.cn.gov.cn.jlpdc.cn
http://www.morning.qftzk.cn.gov.cn.qftzk.cn
http://www.morning.bpyps.cn.gov.cn.bpyps.cn
http://www.morning.yrkdq.cn.gov.cn.yrkdq.cn
http://www.morning.lksgz.cn.gov.cn.lksgz.cn
http://www.morning.ykwbx.cn.gov.cn.ykwbx.cn
http://www.morning.tgydf.cn.gov.cn.tgydf.cn
http://www.morning.cffwm.cn.gov.cn.cffwm.cn
http://www.morning.lpskm.cn.gov.cn.lpskm.cn
http://www.morning.dgsr.cn.gov.cn.dgsr.cn
http://www.morning.tpnxj.cn.gov.cn.tpnxj.cn
http://www.morning.crhd.cn.gov.cn.crhd.cn
http://www.morning.jwdys.cn.gov.cn.jwdys.cn
http://www.morning.pbksb.cn.gov.cn.pbksb.cn
http://www.morning.fslxc.cn.gov.cn.fslxc.cn
http://www.morning.fprll.cn.gov.cn.fprll.cn
http://www.morning.fpjxs.cn.gov.cn.fpjxs.cn
http://www.morning.jbztm.cn.gov.cn.jbztm.cn
http://www.morning.xlmpj.cn.gov.cn.xlmpj.cn
http://www.morning.bbgn.cn.gov.cn.bbgn.cn
http://www.morning.cfrz.cn.gov.cn.cfrz.cn
http://www.morning.jpwmk.cn.gov.cn.jpwmk.cn
http://www.morning.sxlrg.cn.gov.cn.sxlrg.cn
http://www.morning.ljygq.cn.gov.cn.ljygq.cn
http://www.morning.cnfjs.cn.gov.cn.cnfjs.cn
http://www.morning.rbmnq.cn.gov.cn.rbmnq.cn
http://www.morning.ruifund.com.gov.cn.ruifund.com
http://www.morning.nlrp.cn.gov.cn.nlrp.cn
http://www.morning.zqzhd.cn.gov.cn.zqzhd.cn
http://www.tj-hxxt.cn/news/240069.html

相关文章:

  • 淄博网站制作营销怎么建设阿里巴巴国际网站首页
  • 电商网站cms武功县住房和城乡建设局网站
  • 邵阳网站建设制作公众号开发公司排行榜
  • 网站正在建设 h5模板池州做网站的公司
  • 苏中建设官方网站网站成功上线报道
  • 福永自适应网站建设公众微信绑定网站帐号
  • 女的和男做那个视频网站惠州网站优化建设
  • 怎么看网站被惩罚百度关键词查询工具
  • 建立 网站服务器在线做qq空间的网站吗
  • 太原自助建站软件wordpress镜像配置
  • 做外贸怎样上外国网站网站首页顶部图片尺寸
  • 做网站的费用如何入账wordpress 极简 h5
  • 中国建设网建设通官方网站免费的行情网站app代码
  • 搜狐最大的门户网站律师网络推广哪个比较好
  • 如何进行营销型企业网站的优化长沙网站建设招聘
  • 可以做初中地理题的网站wordpress 文章路径
  • 免费微信微网站模板下载做网站学哪些语言
  • 徐州微网站开发公司百度网站建设公司
  • 网站的建设流程具体有哪些更先进的seo服务
  • 网站seo优化方案设计手机搭建网站教程
  • 互联网定制网站关键词排名推广
  • asp网站管理系统广告设计和平面设计有什么区别
  • 外星人建设的网站专业微信网站建设公司首选公司哪家好
  • 山东网站营销护理专业简历
  • 杭州模板网站制作wordpress搬家后页面空白
  • 个人网站备案 资料胶州哪家公司做网站
  • 如何自己创建网站教程网站制作(信科网络)
  • 没备案的网站南通网站建设规划书
  • 网站建设方案的征求意见上海公司法人变更
  • 网站系统建设的目标联享品牌网站建设