作者小头像 Lv.2
更多个人资料
140 成长值
0 关注
0 粉丝
+ 关注 私信

个人介绍

资深架构师 | 985硕士,聚焦大模型微调与AI基建,在此记录实战思考,分享LLM落地最后一公里。

感兴趣或擅长的领域

人工智能、大数据
个人勋章
TA还没获得勋章~
成长雷达
140
0
0
0
0

个人资料

个人介绍

资深架构师 | 985硕士,聚焦大模型微调与AI基建,在此记录实战思考,分享LLM落地最后一公里。

感兴趣或擅长的领域

人工智能、大数据

达成规则

以上满足项可达成此勋章

  • 博客
  • 关注
  • 粉丝
  • 论坛
全部时间
全部时间
最近三天
最近一周
最近一月
  • 全部
  • 暂无专栏分类
当 AI 落地到了“深水区”:到底是 Prompt 不行、RAG 不够,还是该考虑微调了?
大模型效果不稳时,问题往往不在“模型不够强”,而在 Prompt、RAG 和微调怎么配合用。本文给出一套系统性判断思路,并介绍如何借助 LLaMA-Factory Online 低门槛完成微调试水。
AIGC 人工智能 数据库 机器学习
作者小头像 架构师李哲 2025-12-08 11:08:28
54
0
0
2025-12-08 11:08:28
54
0
0
开源算法能在 2025 年击败 GPT-5 吗?DeepSeek-V3.2 / Speciale 交出了一份答卷
开源大模型已经不再只是“便宜替代品”——DeepSeek-V3.2在综合推理上对齐GPT-5,高算力版本Speciale则在IMO等竞赛题上达到金牌线,让顶i推理能力首次以开源形态走进大众视野。
AIGC 数据库
作者小头像 架构师李哲 2025-12-05 14:33:23
128
0
0
2025-12-05 14:33:23
128
0
0
16k数据撬动300亿大模型!我用Qwen3-VL打造了一位“顶尖放射科医生”
如何用极低成本落地医疗AI?本文揭秘基于LLaMA-Factory Online的Qwen3-VL实战:16k数据,DeepSpeed 2避坑指南,稀疏激活(A3B)推理实测——让30B大模型在消费级显卡上流畅运行!
机器学习
作者小头像 架构师李哲 2025-12-02 18:54:34
685
0
0
2025-12-02 18:54:34
685
0
0
PPO最强,DPO一般?一文带你了解常见三种强化学习方法,文末有大模型微调神器!
很多人第一次接触各家大模型时,都会觉得它们的回答能带来意想不到的惊喜,但有时,AI回答又怪怪的、啰嗦、甚至有点危险。这背后,其实就是一个核心问题:对齐(Alignment),本篇文章将带您轻松了解当下较为常见的三种训练模式:PPO、DPO、KTO,以及其所需要的配置,并安利一个网页大模型微调工具!
机器学习
作者小头像 架构师李哲 2025-12-01 14:13:20
100
0
0
2025-12-01 14:13:20
100
0
0
别再烧钱做AI!大模型微调GPU终极指南:从入门到放弃?
“为什么我的GPU预算永远不够用?”这可能是所有AI开发者心中的痛。当同行纷纷晒出多卡满载的“显卡墙”,你是否也曾怀疑:不做硬件军备竞赛,就真的玩不转大模型吗?
AIGC 人工智能 机器学习
作者小头像 架构师李哲 2025-11-25 19:14:48
1497
0
0
2025-11-25 19:14:48
999+
0
0
让苏东坡"复活"!我用Qwen3-8B实现了与千古文豪的跨时空对话
在人工智能的赋能下,千年前的文豪苏东坡以“数字分身”的形式“复活”,与今人吟诗作对、畅谈人生,展开一场跨越时空的交流。
AIGC 数据库 机器学习
作者小头像 架构师李哲 2025-11-20 20:06:22
749
0
0
2025-11-20 20:06:22
749
0
0
大模型微调有必要做吗?全参数微调、LoRA还是RAG?看完这篇你就懂了
在人工智能时代,若想以最小成本、最高效率赋能通用大模型专业的行业能力,关键在于找到效果、成本与灵活性的黄金平衡点......
AIGC 人工智能 数据库 机器学习
作者小头像 架构师李哲 2025-11-18 19:31:29
614
0
0
2025-11-18 19:31:29
614
0
0
数据不够怎么办?新加坡国立大学揭秘扩散语言模型的“秘密武器”
新加坡国立大学研究发现,扩散语言模型(DLM)在有限数据下表现卓越,重复训练480次性能仍不饱和,数据潜力超自回归模型3倍,为破解AI“数据饥渴”难题提供新路径。
机器学习
作者小头像 架构师李哲 2025-11-13 19:16:18
131
0
0
2025-11-13 19:16:18
131
0
0
别再“调教”ChatGPT了!用Qwen2.5打造24小时在线数字分身
在AI时代,专属“数字分身”正从科幻走向现实。依托Qwen2.5-14B大模型、LoRA微调技术及LLaMA-Factory Online平台,仅需四步即可打造会说话、懂风格、能办事的个性化AI助手,让每个人拥有自己的“贾维斯”。
AIGC 人工智能 数据库 机器学习
作者小头像 架构师李哲 2025-11-12 11:36:31
1255
0
0
2025-11-12 11:36:31
999+
0
0
大模型微调「数据集构建」保姆级教程(超全)
微调成败首在数据。本文手把手教你从目标对齐、多源收集、工业清洗到版本管理,打造高质量数据集,并分享电商客服实战与工具,助你一次把模型调到位。
AIGC 人工智能 数据库 数据采集 机器学习
作者小头像 架构师李哲 2025-11-06 19:05:51
1005
0
0
2025-11-06 19:05:51
999+
0
0
总条数:14
10
10
20
50
100
  • 1
  • 2

上滑加载中

https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
作者小头像
作者小头像
快速交付
+ 关注