英伟达(NVIDIA)公司于近日发布了 CUDA 12.0 开发工具更新。本次更新带来了非常多的改变,包括支持最新的 Hopper 和 Ada Lovelace GPU 架构、升级 C++ 方言(Dialects)、正式支持 JIT LTO、改善和引入新的 API 等等。

IT之家了解到,CUDA 12.0 主要功能介绍如下


【资料图】

CUDA 12.0 为 NVIDIA 的 Hopper 和 Ada Lovelace 架构提供可编程功能。CUDA 12 为 Hopper 和 Ada 架构提供了很多张量操作(tensor operation)选项,这些选项很多都支持公共 PTX 中间表示法。合作网格阵列(CGA)支持 C 内置函数,用于 SM 多投的编程式二级缓存,基因组学 / DPX 指令,以及其它新增功能。

支持对标记为 CUDA_VISIBLE_DEVICES 的 GPU 使用虚拟内存管理 API。

应用程序和库开发人员可以以编程方式更新 CUDA 流的优先级。

改良后的 CUDA 动态平行化 API,与之前的 API 相比,性能有了 “实质性” 的提高。

现在通过 nvJitLink 库正式支持即时链接优化(JIT LTO)。

支持 GCC 12.1 主机编译器。

NVCC 和 NVRTC 对 C++20 方言的支持。

NVRTC 将其默认的 C++ 方言从 C++14 更新为 C++17。

更多关于 CUDA 12.0 变化的细节请参见发布说明。用户和开发者可以从 developer.nvidia.com 下载适用于所有主要平台的 CUDA 12.0。

推荐内容