Lv.1
ShaderJoy
更多个人资料
13
成长值
0
关注
5
粉丝
+ 关注
私信
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
个人勋章
TA还没获得勋章~
成长雷达
10
3
0
0
0
个人资料
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
全部时间
全部时间
最近三天
最近一周
最近一月
全部
暂无专栏分类
NEON 常用函数及其执行结果
令初始数据为: float d0[4] = {0.f, 1.f, 2.f, 3.f};float d1[4] = {4.f, 5.f, 6.f, 7.f};float d2[4] = {8.f, 9.f, 10.f, 11.f};float d3[4] = {12.f, 13.f, 14.f, 15.f}; 一、基本的加...
ShaderJoy
2022-01-01 01:07:43
2412
0
0
2022-01-01 01:07:43
999+
0
0
协作组:灵活的 CUDA 线程编程
英文原文 来自 NVIDIA Developer Blog 官方手册 在有效的并行算法中,线程通过合作并共享数据来执行集体计算。要共享数据,线程必须同步。共享的粒度因算法而异,因此线程同步应该是灵活的。使同步成为程序的显式部分,来确保安全、可维护和模块化。为了满足这些需求,CUDA 9 引入了协作...
任务调度
ShaderJoy
2022-01-01 01:06:39
991
0
0
2022-01-01 01:06:39
991
0
0
Android Studio 下通过 CMake 配置编译 libyuv 库
参考链接 创建 AS 工程,选择 Native C++,之后默认配置就可以了 (ps: 我工程的名字也取名为 libyuv 了,你们随意) libyuv 的源码下载下来以后,放到 src/main/cpp 目录下 修改 src/main/cpp 目录下的 CMakeList.txt # For mo...
Android
Android Studio
ShaderJoy
2022-01-01 01:06:39
1468
0
0
2022-01-01 01:06:39
999+
0
0
Linux 内存映射 mmap 原理分析
本文转自博客,我修改了一些笔误,并划了一些我自认为的重点。 原理 首先,“映射”这个词,就和数学课上说的“一一映射”是一个意思,就是建立一种一一对应关系,在这里主要是指 硬盘上文件 的位置与 进程逻辑地址空间 中一块大小相同的区域之间的一一对应,如 图1中过程1 所示。这种对应关系纯...
Linux
任务调度
ShaderJoy
2022-01-01 01:06:26
820
0
0
2022-01-01 01:06:26
820
0
0
Ubuntu 下配置 Qt 的 FFmpeg 的开发环境
FFmpeg 的 configure 脚本 ./configure --prefix="$FFMPEG_PATH/build" \--pkg-config-flags="--static" \--extra-cflags="-I$FFMPEG_PATH/build/include" \--extra-ldflags="-L$FFMPE...
Qt
Ubuntu
ShaderJoy
2022-01-01 01:06:21
1209
0
0
2022-01-01 01:06:21
999+
0
0
CUDA 6/8 中的统一内存
原文 通过CUDA 6,英伟达推出了 CUDA 平台历史上最引人注目的编程模型改进之一——统一内存。在当今典型的PC或集群节点中,CPU和GPU的内存在物理上是不同的,并由PCI-Express总线分隔开。在 CUDA 6 之前,这正是程序员看待事物的方式。CPU 和 GPU 之间共享的数据必须分配在两个内存中,并由程序显式地在它们之...
GPU加速云服务器 GACS
ShaderJoy
2022-01-01 01:06:20
2869
0
0
2022-01-01 01:06:20
999+
0
0
页锁主机内存
原文 运行时提供的函数允许使用分页锁定(也称为固定)主机内存(与malloc()分配的常规可分页主机内存相反): cudaHostAlloc() 和 cudaFreeHost() 分配和释放页锁定的主机内存; cudaHostRegister() 将通过 malloc() 分配的内存的一定范围设置为页面锁定内存(限制参见参考手...
ShaderJoy
2022-01-01 01:06:18
552
0
0
2022-01-01 01:06:18
552
0
0
统一内存的性能调优
原文 为了实现统一内存的良好性能,必须达到以下目标: 应该避免错误:虽然可回放的错误对于启用更简单的编程模型是基本的,但它们可能严重损害应用程序的性能。错误处理可能需要几十微秒,因为它可能涉及 TLB 失效、数据迁移和页表的更新。同时,应用程序的某些部分的执行将被停止,从而可能影响整体性能。 数据应该是访问处理器的本地数据:如...
应用性能调优
ShaderJoy
2022-01-01 01:06:17
2946
0
0
2022-01-01 01:06:17
999+
0
0
高性能几何多重网格与 GPU 加速
英文原文 线性求解器可能是科学计算应用中最常见的工具。求解 方程有两种基本方法:直接法和迭代法。直接方法通常是健壮的,但是需要额外的计算复杂度和内存容量。与直接求解器不同,迭代求解器需要最小的内存开销,并且具有更好的计算复杂性。然而,这些求解器在变量数量上仍然是超线性的,并且通常具有较慢的低频误差收敛速度。最后,...
GPU加速云服务器 GACS
ShaderJoy
2022-01-01 01:06:17
2941
0
0
2022-01-01 01:06:17
999+
0
0
GPU 专业小贴士:在 Maxwell 架构上使用共享原子计算快速直方图
英文原文 直方图是一种重要的数据表示形式,在计算机视觉、数据分析和医学成像等领域有着广泛的应用。直方图是数据分布在预定义的 bin 上的图形表示。输入数据集和 bin 的数量可能会因领域的不同而有很大的不同,所以让我们关注最常见的用例之一:每个颜色通道使用256个 bin 的图像直方图。即使我们将使用特定的问题设置,同样的算法也可以使...
GPU加速云服务器 GACS
ShaderJoy
2022-01-01 01:06:08
2784
0
0
2022-01-01 01:06:08
999+
0
0
总条数:565
10
10
20
50
100
1
2
3
4
5
6
...
57
上滑加载中
https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
+ 关注
私信