ollama v0.12.3 最新版本详解:新模型、功能修复与深度技术更新

举报
福大大架构师每日一题 发表于 2025/09/28 06:39:16 2025/09/28
【摘要】 发布时间:预发布:2025年9月26日正式发布:2025年9月27日 一、版本亮点概述在 ollama v0.12.3 中,官方带来了两款重量级新模型,并针对此前版本的多项功能问题进行了修复与优化,同时还引入了新的模型架构实现及更健壮的解析逻辑。本次更新的核心变化主要包括:新增 DeepSeek-V3.1-Terminus 混合模型新增 Kimi-K2-Instruct-0905 MoE 模...

在这里插入图片描述

发布时间:
预发布:2025年9月26日
正式发布:2025年9月27日


一、版本亮点概述

ollama v0.12.3 中,官方带来了两款重量级新模型,并针对此前版本的多项功能问题进行了修复与优化,同时还引入了新的模型架构实现及更健壮的解析逻辑。

本次更新的核心变化主要包括:

  • 新增 DeepSeek-V3.1-Terminus 混合模型
  • 新增 Kimi-K2-Instruct-0905 MoE 模型
  • 改进工具调用参数解析与 CLI 登录流程
  • 修复 qwen3-coder 的 Unicode 解析问题
  • 优化 /load 模型加载失败的回滚处理
  • 新增 DeepSeek2 模型实现
  • 加强流式解析的多语言与 Emoji 支持

二、新增模型介绍

1. DeepSeek-V3.1-Terminus

  • 混合架构,支持 思考模式非思考模式
  • 比上一版本在各类基准测试中输出更加稳定可靠
  • 两种运行方式:
    • 云端运行:
      ollama run deepseek-v3.1:671b-cloud
      
    • 本地运行(需 500GB+ 显存):
      ollama run deepseek-v3.1
      

2. Kimi-K2-Instruct-0905

  • 最新且最强大的 Kimi K2 系列版本
  • MoE(混合专家模型)架构
  • 启用参数:32B
  • 总参数量:1T
  • 云端运行方式:
    ollama run kimi-k2:1t-cloud
    

三、功能修复与改进

1. 工具调用参数解析

修复了某些情况下工具调用参数以 字符串化 JSON 形式传递时未正确解析的问题,保障了调用数据的可用性。


2. CLI 登录体验优化

ollama push 命令在推送模型时,若需要登录,将直接提供可点击的 URL,方便设备进行登录操作。


3. Unicode 输出问题修复

针对 qwen3-coder 模型,修复了其输出时 Unicode 字符编码错误 的问题,包括 emoji、阿拉伯文等多语言场景。


4. 模型加载回退机制

在交互模式下,当使用 /load 加载模型失败(如模型未找到)时,会自动恢复之前的运行参数 runOptions,避免交互会话状态丢失。


四、技术实现细节

1. DeepSeek2 模型实现

  • 基于 DeepSeek 2 架构,但参考了 DeepSeek 3 的设计理念
  • 支持 稀疏 MoE密集 MLP 混合网络结构
  • 引入 RoPE(旋转位置编码) 多参调整机制
  • 完整实现 注意力机制专家路由与加权BPE 分词器 等模块
  • 支持多语言分词,包括中文、日文、符号等

2. runOptions 拷贝功能增强

新增 Copy() 方法实现深浅拷贝混合逻辑,确保:

  • MessagesImagesOptions 等可变结构深拷贝
  • 指针类型如 KeepAlive 保持浅拷贝(共享引用)
  • Think 对象新建副本,避免思考模式状态污染
    并提供多组单元测试验证:
  • 数据一致性
  • 空值与空集合保持原样
  • 修改原始对象不影响副本

3. qwen3-coder Unicode 解析优化

  • 新增基于 utf8.DecodeLastRuneInString 的末尾空白字符统计逻辑
  • 正确处理多语言字符、emoji、阿拉伯文、非断行空格等场景
  • 流式解析测试案例覆盖:
    • Emoji 原样保留
    • 阿拉伯文本连续性
    • 中文、英文混合段落
    • 非断行空格跨数据块保留

五、测试增强

  • PushHandler 增加多种登录与权限测试场景
  • runOptions 的拷贝方法增加空、非空多组合测试
  • qwen3-coder 流式解析新增 unicode/emoji 的精细化测试用例

六、ROCm 兼容性修复

本次更新修复了 ROCm 6.4 ~ 7.0 Docker 运行失败的问题,新增必要库依赖:

  • libroctx64.so.4
  • librocroller.so.1

七、总结

ollama v0.12.3 不仅带来了两款高性能的新模型,还从 CLI 用户体验、模型解析准确性、容错回退机制等多个方面进行了优化,同时引入了新的 DeepSeek2 架构实现与 Unicode 流式解析支持,使得多语言场景处理更加稳定。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。