作者小头像 Lv.2
更多个人资料
130 成长值
0 关注
0 粉丝
+ 关注 私信

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

暂无数据
个人勋章
TA还没获得勋章~
成长雷达
130
0
0
0
0

个人资料

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

暂无数据

达成规则

以上满足项可达成此勋章

  • 博客
  • 关注
  • 粉丝
  • 论坛
全部时间
全部时间
最近三天
最近一周
最近一月
  • 全部
  • 基于RecSDK的昇腾推荐系统
  • 昇腾
06_昇腾流水线优化技术详解
本文详解昇腾流水线优化技术,涵盖NPU与GPU侧多级流水实现。通过Stage划分、异步调度与计算通信重叠,提升训练吞吐与硬件利用率。NPU基于Rec SDK实现五阶段流水,支持动态换入换出;GPU则利用CUDA Stream构建StagedTrainPipeline,实现高效prefetch与梯度更新协同。
推荐系统 昇腾 机器学习
作者小头像 yd_284014651 2025-12-29 09:51:52
774
0
0
2025-12-29 09:51:52
774
0
0
05_推荐系统准入与淘汰策略技术详解
本文详解推荐系统多级缓存中的准入淘汰策略,涵盖基于访问频次、概率、ShowClick等准入机制,以及基于时间、L2范数、频次等淘汰机制,结合CPU-PS控制流程与NPU执行优化,实现缓存资源高效利用,提升模型训练效率与推荐精度。
推荐系统 机器学习
作者小头像 yd_284014651 2025-12-29 09:48:25
790
0
0
2025-12-29 09:48:25
790
0
0
04_昇腾推荐系统:单双层架构解析
单双层架构互补共存:单层追求极致性能,适用于小规模特征;双层突破内存瓶颈,支持大规模扩展。结合动态扩容、准入淘汰与高效查表,实现推荐系统大规模稀疏参数的高效训练与管理。
推荐系统 昇腾
作者小头像 yd_284014651 2025-12-29 09:46:15
829
0
0
2025-12-29 09:46:15
829
0
0
03_嵌入表分片与哈希管理:支撑万亿参数的关键技术
嵌入表分片与哈希管理:支撑万亿参数的关键技术 1、 Hash管理及实现如下图所示:在推荐系统中,大部分ID的原始特征都是离散型(global ids),因为其取值空间巨大且稀疏(如用户ID或物品ID可能达到百万甚至亿级别),直接作为输入会导致嵌入表维度爆炸,引发存储和计算瓶颈。常见的做法是需要将离散的ID转为连续的行号(hash indices),从而压缩特征空间,实现高效存储和查询。Ha...
分布式 推荐系统 机器学习
作者小头像 yd_284014651 2025-12-29 09:42:20
644
0
0
2025-12-29 09:42:20
644
0
0
02_昇腾推荐系统架构解析:嵌入表存储到多级缓存的全链路设计
昇腾推荐系统架构解析:嵌入表存储到多级缓存的全链路设计 1. 昇腾 A2 处理器架构与 Embedding 优化策略昇腾 A2 处理器采用独特的达芬奇架构,具备完整的片上多级缓存系统。其缓存体系并非“以 CPU 为中心的多级缓存替代方案”,而是基于自身架构理念设计了高效的多级缓存机制,与 NVIDIA GPU 在缓存策略上存在差异,但具备相当的高效缓存能力。在整体架构上,多个 AI 节点通...
推荐系统 昇腾
作者小头像 yd_284014651 2025-12-29 09:38:20
922
0
0
2025-12-29 09:38:20
922
0
0
昇腾910-PyTorch 实现 ResNet50图像分类
PyTorch 实现 ResNet50 图像分类本实验主要介绍了如何在昇腾上,使用pytorch对经典的resnet50小模型在公开的CIFAR10数据集进行分类训练的实战讲解。内容包括resnet50的网络架构 ,残差模块分析 ,训练代码分析等等本实验的目录结构安排如下所示:Resnet系列网络结构resnet50网络搭建过程及代码详解端到端训练cifar数据集实战 Resnet系列网络...
pytorch 昇腾 网络
作者小头像 yd_284014651 2025-02-09 15:02:28
585
0
0
2025-02-09 15:02:28
585
0
0
昇腾910-PyTorch 实现 Alexnet图像分类
PyTorch 实现 Alexnet图像分类本文主要介绍了如何在昇腾上,使用pytorch对经典的Alexnet小模型在公开的CIFAR10数据集进行分类训练的实战讲解。内容包括Alexnet网络模型创新点介绍 、Alexnet的网络架构剖析 与网络模型代码实战分析等等本实验的目录结构安排如下所示:Alexnet网络模型创新点介绍Alexnet的网络架构剖析网络模型代码实战分析 Alexn...
pytorch 昇腾 机器学习
作者小头像 yd_284014651 2025-02-09 15:05:26
608
0
0
2025-02-09 15:05:26
608
0
0
昇腾910-PyTorch 实现 GoogleNet图像分类
PyTorch 实现GoogleNet用于图像分类本实验主要介绍了如何在昇腾上,使用pytorch对经典的GoogleNet模型在公开的CIFAR10数据集进行分类训练的实战讲解。内容包括GoogleNet模型创新点介绍 、GoogleNet网络架构剖析 与GoogleNet网络模型代码实战分析等等。本实验的目录结构安排如下所示:GoogleNet网络模型创新点介绍GoogleNet的网络...
pytorch 昇腾 网络
作者小头像 yd_284014651 2025-02-09 15:08:37
594
0
0
2025-02-09 15:08:37
594
0
0
01_万亿级推荐系统嵌入表的技术挑战与现状
1、问题与挑战推荐系统中的用户(User)、物品(Item)及上下文(Context)特征具有高度异构性,其物理含义和量纲差异显著。为将这些特征有效引入深度神经网络(DNN),须通过Embedding技术将其映射为统一的低维稠密向量表示,从而解决特征间的语义鸿沟并提升模型泛化能力。为提升推荐系统的整体推荐效果,满足用户个性化推荐的需求,加速互联网电商企业快速变现。如下图所示:近10年来推荐...
推荐系统 机器学习 深度学习
作者小头像 yd_284014651 2025-12-29 09:22:58
670
0
0
2025-12-29 09:22:58
670
0
0
模型并行之Embedding表
模型并行之Embedding表Embedding在推荐模型中承担着将用户、物品及上下文信息映射为低维稠密向量的核心任务,通过捕捉潜在语义关联和协同过滤信号,为推荐系统提供可计算的特征表达基础。其向量化表征能力不仅解决了高维稀疏数据难以直接建模的问题,更能通过隐式关系挖掘支撑用户兴趣建模和相似度计算,这种稠密向量空间的连续性特征为后续针对不同行为序列、场景维度或兴趣簇的Embedding切片...
深度学习
作者小头像 yd_284014651 2025-06-28 11:12:07
1927
0
0
2025-06-28 11:12:07
999+
0
0
总条数:15
10
10
20
50
100
  • 1
  • 2

上滑加载中

https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
作者小头像
作者小头像
快速交付
+ 关注