作者小头像 Lv.7
更多个人资料
8042 成长值
24 关注
79 粉丝
+ 关注 私信

个人介绍

菠萝菠萝蜜,急急如律令

感兴趣或擅长的领域

自动化运维、人工智能、测试、网络技术
个人勋章
  • 活跃之星
  • 考证狂人
成长雷达
5460
1587
525
450
20

个人资料

个人介绍

菠萝菠萝蜜,急急如律令

感兴趣或擅长的领域

自动化运维、人工智能、测试、网络技术

达成规则

以上满足项可达成此勋章

  • 博客
  • 关注
  • 粉丝
  • 论坛
全部时间
全部时间
最近三天
最近一周
最近一月
  • 全部
  • MindSpore
  • CUDA
  • DeepSeek
  • 昇腾
  • DPDK
  • 监控观察
  • 网络基础
  • 流媒体
  • Firewall
  • 数据安全
  • IoT
  • 编程语言
  • 鸿蒙
  • 虚拟化
  • 鲲鹏
  • Linux
  • AI
  • 大数据-数仓
  • 网络安全
Transformer 架构的产生和发展
Transformer 架构的产生源于 2017 年 Google 研究团队在序列建模领域对循环神经网络(RNN)和卷积神经网络(CNN)局限性的根本性突破。在 Transformer 出现之前,序列转换任务主要依赖 RNN 及其变体 LSTM 和 GRU,这些模型按时间步顺序处理输入,存在梯度消失和并行化困难的问题。CNN 虽能并行计算但难以捕获长距离依赖关系,注意力机制作为辅助手段仅在编...
神经网络
作者小头像 黄生 2025-10-11 16:38:54
1
0
0
2025-10-11 16:38:54
1
0
0
BERT的产生和发展
BERT(Bidirectional Encoder Representations from Transformers)的产生源于2018年谷歌研究团队对预训练语言模型范式的根本性重构。在BERT出现之前,主流语言模型如GPT采用单向自回归训练,仅能从左到右或从右到左理解文本,这种单向性限制了模型对上下文的全貌把握。ELMo虽然尝试通过双向LSTM结合两个方向的表示,但本质仍是浅层特征拼接...
机器学习
作者小头像 黄生 2025-10-11 16:30:47
1
0
0
2025-10-11 16:30:47
1
0
0
MindNLP框架下IMDB数据集加载的问题与解决
最初,没有人想到会出问题。我按照常规方式调用MindNLP的load_dataset函数加载IMDB数据集:from mindnlp.dataset import load_dataset 然后执行 imdb_ds = load_dataset('imdb', split=['train', 'test'])。这个看似简单的操作却抛出了FileNotFoundError,提示在本地路径/ho...
作者小头像 黄生 2025-10-11 13:57:41
0
0
0
2025-10-11 13:57:41
0
0
0
MindNLP:基于MindSpore的NLP开发与实践
MindNLP作为一个基于MindSpore生态的自然语言处理套件,其核心思路是“站在巨人的肩膀上”进行创新,既充分拥抱现有生态(特别是Hugging Face),又融合MindSpore框架的独特优势。从问题意识来看,MindNLP抓住了当前NLP领域,尤其是大语言模型(LLM)时代的几个核心痛点:一是Transformer架构已成为统一范式,但模型开发与训练对科研人员仍存在高门槛;二是任...
MindSpore 自然语言处理基础
作者小头像 黄生 2025-10-10 16:45:29
7
0
0
2025-10-10 16:45:29
7
0
0
mindnlp中的Qwen2-VL多模态模型导入功能
Qwen2VLForConditionalGeneration是Qwen2-VL(视觉语言)模型的核心生成类,具有以下功能:多模态理解 :能够同时处理文本和图像输入条件生成 :根据输入的图像和文本提示生成相应的文本响应预训练模型加载 :支持从预训练模型路径加载权重使用示例:from mindnlp.transformers import Qwen2VLForConditionalGenera...
作者小头像 黄生 2025-10-10 16:20:23
41
0
0
2025-10-10 16:20:23
41
0
0
MindStudio Insight的墙上时间和system views
“Wall Duration” 中的 “Wall” 指的是 墙上时间(Wall-clock Time),也称为实际流逝时间(Real Elapsed Time)。其具体含义指从任务开始到结束所经过的实际物理时间,就像墙上的挂钟所记录的时间一样。这个时间包含了任务执行过程中所有可能的等待、调度开销等。与之相对的概念通常是 CPU 时间(CPU Time),它只统计任务实际占用CPU进行计算的时...
kernel
作者小头像 黄生 2025-10-08 23:00:38
24
0
0
2025-10-08 23:00:38
24
0
0
Transformer模型评估的序列长度和logits
打印语句在评估方法中具有重要的调试和验证功能,比如第一条语句 print(f"model_output.sequences.shape[1]:{model_output.sequences.shape[1]}") 输出的是模型生成的完整序列长度。在Transformer的自回归生成过程中,sequences 包含了输入提示词和所有新生成token的完整序列。通过监控这个数值,可以确保模型按照...
MindSpore
作者小头像 黄生 2025-10-08 18:30:57
28
0
0
2025-10-08 18:30:57
28
0
0
MindStudio Insight里面的thread和stream
在 MindStudio Insight 的 Timeline 界面中,CANN 层使用 Thread 而 Ascend Hardware 层使用 Stream 来组织任务,这反映了两个层级在昇腾异构计算架构中所处的不同位置和承担的不同职责 。CANN 是 Compute Architecture for Neural Networks 的缩写,它是昇腾AI处理器的计算架构,其软件栈运行在主...
任务调度
作者小头像 黄生 2025-10-07 18:43:43
73
0
0
2025-10-07 18:43:43
73
0
0
主机与设备间的数据搬运开销
AscendCL@aclrtMemcpyAsync 和 MEMCPY_ASYNC 事件在时间线工具中可见但在汇总的算子CSV中缺失,这涉及到AI模型推理性能分析中一个可能被忽略的层面:主机与设备间的数据搬运开销。1. 计算图与运行时环境的边界我们首先需要区分两个概念:计算图算子:这是IR文件和CSV汇总数据主要关注的对象。它们代表了模型本身的数学计算逻辑,例如 MatMul, BiasAdd...
作者小头像 黄生 2025-10-05 22:45:37
35
0
0
2025-10-05 22:45:37
35
0
0
IR和运行时的算子差异
首先是命名差异。命名差异反映了MindSpore从前端算子到后端硬件指令的“翻译”和“封装”过程。IR文件中的 PrimFunc_MatMul 和 PrimFunc_BiasAdd 是计算图层面的高级、通用算子抽象。而在Profiling后mindstudio insight导出的 CSV中,我们看到的是 aclnnMm_MatMulCommon_MatMulV2 和 BiasAdd1。这里...
作者小头像 黄生 2025-10-05 19:25:13
40
0
0
2025-10-05 19:25:13
40
0
0
总条数:321
10
10
20
50
100
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • ...
  • 33

上滑加载中

https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
作者小头像
作者小头像
快速交付
+ 关注