【云享新鲜】社区周刊·Vol.209-TinyVue v3.22.0 正式发布;DeepSeek模型MOE结构代码详解

举报
华为云社区精选 发表于 2025/04/28 15:44:16 2025/04/28
【摘要】 DeepSeek模型MOE结构代码详解;TinyVue v3.22.0 正式发布;基于昇腾服务器微调glm4-9b-chat案例。

1-每周一刊.png

【云享新鲜】周刊·Vol.209

2025  4 月 28 

   【技术】TinyVue v3.22.0 正式发布:深色模式上线!集成 UnoCSS 图标库!TypeScript 类型支持全面升级!

摘要:本次 3.22.0 版本主要有以下重大变更:支持深色模式,增加基于 UnoCSS 的图标库,更丰富的 TypeScript 类型声明,支持 XSS 配置

    【技术】DeepSeek模型MOE结构代码详解

摘要:MOE是mixture of experts 的缩写,简单来说,就是把传统transformer结构中decoder层里面的单个线性层替换层多个并列的线性层。

    【开发】基于昇腾服务器微调glm4-9b-chat案例

摘要该案例基于昇腾服务器,以广告词生成任务为例,使用 11 万数据对 GLM4-9B-Chat 模型进行微调。

    【开发】零基础学习openGauss入门技术部署篇

摘要openGauss深度融合华为在数据库领域多年的研发经验,结合企业级场景需求,持续构建竞争力特性。

    【技术】柯依力YOLO训练调优

摘要:本文介绍柯依力 YOLO 训练调优,包括 NPU 环境准备与训练,如创建桶、授权、Notebook 等

    【开发】一文比较Redis和Memcached的区别

摘要Redis和Memcached都是基于内存的数据存储系统,常用于缓存数据以提高应用程序的性能。

    【开发】Redis小知识分享

摘要:Redis并非完全是单线程的,其核心业务部分(命令处理)是单线程的,但在其他功能如持久化、异步删除、集群数据同步等方面是多线程的。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。