ShaderJoy的博客_云社区-华为云

Lv.1

ShaderJoy

更多个人资料

13 成长值

0 关注

5 粉丝

+ 关注私信

个人介绍

这个人很懒，什么都没有留下

感兴趣或擅长的领域

暂无数据

个人勋章

TA还没获得勋章~

成长雷达

个人资料

个人介绍

这个人很懒，什么都没有留下

感兴趣或擅长的领域

暂无数据

达成规则

以上满足项可达成此勋章

博客
关注
粉丝
论坛

全部时间

最近一月

全部
暂无专栏分类

NEON 常用函数及其执行结果

 令初始数据为： float d0[4] = {0.f, 1.f, 2.f, 3.f};float d1[4] = {4.f, 5.f, 6.f, 7.f};float d2[4] = {8.f, 9.f, 10.f, 11.f};float d3[4] = {12.f, 13.f, 14.f, 15.f}; 一、基本的加...

ShaderJoy 2022-01-01 01:07:43

2412

2022-01-01 01:07:43

999+

协作组：灵活的 CUDA 线程编程

英文原文 来自 NVIDIA Developer Blog 官方手册在有效的并行算法中，线程通过合作并共享数据来执行集体计算。要共享数据，线程必须同步。共享的粒度因算法而异，因此线程同步应该是灵活的。使同步成为程序的显式部分，来确保安全、可维护和模块化。为了满足这些需求，CUDA 9 引入了协作...

任务调度

ShaderJoy 2022-01-01 01:06:39

991

2022-01-01 01:06:39

991

Android Studio 下通过 CMake 配置编译 libyuv 库

参考链接创建 AS 工程，选择 Native C++，之后默认配置就可以了 （ps: 我工程的名字也取名为 libyuv 了，你们随意） libyuv 的源码下载下来以后，放到 src/main/cpp 目录下  修改 src/main/cpp 目录下的 CMakeList.txt # For mo...

Android Android Studio

ShaderJoy 2022-01-01 01:06:39

1468

2022-01-01 01:06:39

999+

Linux 内存映射 mmap 原理分析

本文转自博客，我修改了一些笔误，并划了一些我自认为的重点。原理首先，“映射”这个词，就和数学课上说的“一一映射”是一个意思，就是建立一种一一对应关系，在这里主要是指 硬盘上文件 的位置与进程逻辑地址空间 中一块大小相同的区域之间的一一对应，如 图1中过程1 所示。这种对应关系纯...

Linux 任务调度

ShaderJoy 2022-01-01 01:06:26

820

2022-01-01 01:06:26

820

Ubuntu 下配置 Qt 的 FFmpeg 的开发环境

FFmpeg 的 configure 脚本 ./configure --prefix="$FFMPEG_PATH/build" \--pkg-config-flags="--static" \--extra-cflags="-I$FFMPEG_PATH/build/include" \--extra-ldflags="-L$FFMPE...

Qt Ubuntu

ShaderJoy 2022-01-01 01:06:21

1209

2022-01-01 01:06:21

999+

CUDA 6/8 中的统一内存

原文通过CUDA 6，英伟达推出了 CUDA 平台历史上最引人注目的编程模型改进之一——统一内存。在当今典型的PC或集群节点中，CPU和GPU的内存在物理上是不同的，并由PCI-Express总线分隔开。在 CUDA 6 之前，这正是程序员看待事物的方式。CPU 和 GPU 之间共享的数据必须分配在两个内存中，并由程序显式地在它们之...

GPU加速云服务器 GACS

ShaderJoy 2022-01-01 01:06:20

2869

2022-01-01 01:06:20

999+

页锁主机内存

原文运行时提供的函数允许使用分页锁定(也称为固定)主机内存(与malloc()分配的常规可分页主机内存相反): cudaHostAlloc() 和 cudaFreeHost() 分配和释放页锁定的主机内存; cudaHostRegister() 将通过 malloc() 分配的内存的一定范围设置为页面锁定内存(限制参见参考手...

ShaderJoy 2022-01-01 01:06:18

552

2022-01-01 01:06:18

552

统一内存的性能调优

原文为了实现统一内存的良好性能，必须达到以下目标: 应该避免错误:虽然可回放的错误对于启用更简单的编程模型是基本的，但它们可能严重损害应用程序的性能。错误处理可能需要几十微秒，因为它可能涉及 TLB 失效、数据迁移和页表的更新。同时，应用程序的某些部分的执行将被停止，从而可能影响整体性能。数据应该是访问处理器的本地数据:如...

应用性能调优

ShaderJoy 2022-01-01 01:06:17

2946

2022-01-01 01:06:17

999+

高性能几何多重网格与 GPU 加速

英文原文线性求解器可能是科学计算应用中最常见的工具。求解  方程有两种基本方法:直接法和迭代法。直接方法通常是健壮的，但是需要额外的计算复杂度和内存容量。与直接求解器不同，迭代求解器需要最小的内存开销，并且具有更好的计算复杂性。然而，这些求解器在变量数量上仍然是超线性的，并且通常具有较慢的低频误差收敛速度。最后，...

GPU加速云服务器 GACS

ShaderJoy 2022-01-01 01:06:17

2941

2022-01-01 01:06:17

999+

GPU 专业小贴士：在 Maxwell 架构上使用共享原子计算快速直方图

英文原文直方图是一种重要的数据表示形式，在计算机视觉、数据分析和医学成像等领域有着广泛的应用。直方图是数据分布在预定义的 bin 上的图形表示。输入数据集和 bin 的数量可能会因领域的不同而有很大的不同，所以让我们关注最常见的用例之一:每个颜色通道使用256个 bin 的图像直方图。即使我们将使用特定的问题设置，同样的算法也可以使...

GPU加速云服务器 GACS

ShaderJoy 2022-01-01 01:06:08

2784

2022-01-01 01:06:08

999+

总条数：565

100

上滑加载中

https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU

快速交付

+ 关注私信