Lv.1
keyboard artist
更多个人资料
33
成长值
0
关注
0
粉丝
+ 关注
私信
个人介绍
HPC编译器
感兴趣或擅长的领域
编程语言
个人勋章
TA还没获得勋章~
成长雷达
30
3
0
0
0
个人资料
个人介绍
HPC编译器
感兴趣或擅长的领域
编程语言
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
全部时间
全部时间
最近三天
最近一周
最近一月
全部
暂无专栏分类
Clang Driver的内部实现
本文介绍Clang driver的内部实现,主要的参考资料是https://clang.llvm.org/docs/DriverInternals.html,同时结合一些具体代码的介绍。 编译器Driver简介一个程序的“编译”实际上包含了复杂的流程,从源代码到可执行文件,中间经历了编译、汇编、链接等过程。以上过程可以通过clang -v看到。其中每个过程一般会有一个单独的进程负责执行,也会...
汇编语言
keyboard artist
2021-12-25 17:02:14
6181
0
0
2021-12-25 17:02:14
999+
0
0
使用Hugepage大页优化程序性能
页(page)的大小和程序的性能紧密相关。使用大页的好处:减少page table本身的内存开销减少单次page table walk所需的时间减少TLB miss的发生次数使用大页的坏处:增加内部碎片增加单次缺页异常(page fault)的开销这里构造了一个如下的小例子:#include <stdlib.h>#define TWOMB 2097152int main () { sr...
应用性能调优
高性能计算
keyboard artist
2021-12-25 16:20:51
4797
0
0
2021-12-25 16:20:51
999+
0
0
OpenMP在NUMA架构下的调优
OpenMP 和 NUMA架构OpenMP是一个基于共享内存的并发编程模型。在程序中加入了OpenMP引导语后,主线程会生成一系列的子线程,并将任务划分给子线程进行执行。这里需要强调的是,所有的线程在同一个地址空间内运行,每个线程有独立的栈和程序计数器,但是所有线程共享进程的堆、数据段、代码段等内存空间。NUMA架构全称non-uniform memory achitecture,是一种非...
任务调度
高性能计算
keyboard artist
2021-12-25 16:10:00
8980
0
1
2021-12-25 16:10:00
999+
0
1
https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
+ 关注