ollama v0.12.3 最新版本详解:新模型、功能修复与深度技术更新
【摘要】 发布时间:预发布:2025年9月26日正式发布:2025年9月27日 一、版本亮点概述在 ollama v0.12.3 中,官方带来了两款重量级新模型,并针对此前版本的多项功能问题进行了修复与优化,同时还引入了新的模型架构实现及更健壮的解析逻辑。本次更新的核心变化主要包括:新增 DeepSeek-V3.1-Terminus 混合模型新增 Kimi-K2-Instruct-0905 MoE 模...
发布时间:
预发布:2025年9月26日
正式发布:2025年9月27日
一、版本亮点概述
在 ollama v0.12.3 中,官方带来了两款重量级新模型,并针对此前版本的多项功能问题进行了修复与优化,同时还引入了新的模型架构实现及更健壮的解析逻辑。
本次更新的核心变化主要包括:
- 新增 DeepSeek-V3.1-Terminus 混合模型
- 新增 Kimi-K2-Instruct-0905 MoE 模型
- 改进工具调用参数解析与 CLI 登录流程
- 修复 qwen3-coder 的 Unicode 解析问题
- 优化
/load
模型加载失败的回滚处理 - 新增 DeepSeek2 模型实现
- 加强流式解析的多语言与 Emoji 支持
二、新增模型介绍
1. DeepSeek-V3.1-Terminus
- 混合架构,支持 思考模式 与 非思考模式
- 比上一版本在各类基准测试中输出更加稳定可靠
- 两种运行方式:
- 云端运行:
ollama run deepseek-v3.1:671b-cloud
- 本地运行(需 500GB+ 显存):
ollama run deepseek-v3.1
- 云端运行:
2. Kimi-K2-Instruct-0905
- 最新且最强大的 Kimi K2 系列版本
- MoE(混合专家模型)架构
- 启用参数:32B
- 总参数量:1T
- 云端运行方式:
ollama run kimi-k2:1t-cloud
三、功能修复与改进
1. 工具调用参数解析
修复了某些情况下工具调用参数以 字符串化 JSON 形式传递时未正确解析的问题,保障了调用数据的可用性。
2. CLI 登录体验优化
ollama push
命令在推送模型时,若需要登录,将直接提供可点击的 URL,方便设备进行登录操作。
3. Unicode 输出问题修复
针对 qwen3-coder 模型,修复了其输出时 Unicode 字符编码错误 的问题,包括 emoji、阿拉伯文等多语言场景。
4. 模型加载回退机制
在交互模式下,当使用 /load
加载模型失败(如模型未找到)时,会自动恢复之前的运行参数 runOptions,避免交互会话状态丢失。
四、技术实现细节
1. DeepSeek2 模型实现
- 基于 DeepSeek 2 架构,但参考了 DeepSeek 3 的设计理念
- 支持 稀疏 MoE 与 密集 MLP 混合网络结构
- 引入 RoPE(旋转位置编码) 多参调整机制
- 完整实现 注意力机制、专家路由与加权、BPE 分词器 等模块
- 支持多语言分词,包括中文、日文、符号等
2. runOptions 拷贝功能增强
新增 Copy()
方法实现深浅拷贝混合逻辑,确保:
Messages
、Images
、Options
等可变结构深拷贝- 指针类型如
KeepAlive
保持浅拷贝(共享引用) Think
对象新建副本,避免思考模式状态污染
并提供多组单元测试验证:- 数据一致性
- 空值与空集合保持原样
- 修改原始对象不影响副本
3. qwen3-coder Unicode 解析优化
- 新增基于
utf8.DecodeLastRuneInString
的末尾空白字符统计逻辑 - 正确处理多语言字符、emoji、阿拉伯文、非断行空格等场景
- 流式解析测试案例覆盖:
- Emoji 原样保留
- 阿拉伯文本连续性
- 中文、英文混合段落
- 非断行空格跨数据块保留
五、测试增强
- 为
PushHandler
增加多种登录与权限测试场景 - runOptions 的拷贝方法增加空、非空多组合测试
- qwen3-coder 流式解析新增 unicode/emoji 的精细化测试用例
六、ROCm 兼容性修复
本次更新修复了 ROCm 6.4 ~ 7.0 Docker 运行失败的问题,新增必要库依赖:
libroctx64.so.4
librocroller.so.1
七、总结
ollama v0.12.3 不仅带来了两款高性能的新模型,还从 CLI 用户体验、模型解析准确性、容错回退机制等多个方面进行了优化,同时引入了新的 DeepSeek2 架构实现与 Unicode 流式解析支持,使得多语言场景处理更加稳定。
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)