Ubuntu20.04安装NVIDIA混合精度计算库apex全流程及各类报错问题解答
创始人
2024-06-02 08:13:29
0

目录

  • 一. 安装CUDA
  • 二. 安装apex
  • 三. 各类报错问题解决
    • 3.1 C++编译错误
    • 3.2 Apex优化算子错误
    • 3.3 CUDA错误
    • 3.4 g++或gcc错误

背景:跟李沐老师一起探索RTX 3090的深度学习浮点运算性能,需要安装apex进行半精度运算,本文总结了Ubuntu20.04安装NVIDIA混合精度计算库apex全流程及各类报错问题解答

环境:
Ubuntu20.04
AMD 5800 8-core 16-Thread
NVIDIA RTX 3090
Pytorch1.13(gpu)
Python3.9
CUDA11.7

一. 安装CUDA

确保你的apex跟CUDA版本对应,如果不对应,则在运行程序时会产生各类kernel fusion之类的错误。

wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
sudo sh cuda_11.7.1_515.65.01_linux.run

网不好可以先用浏览器下载,然后再安装。
安装时一直确认就可以了,如果已经安装过NVIDIA驱动可以去掉驱动的选项。
添加环境变量:

vim ~/.bashrc
export CUDA_HOME=/usr/local/cuda

source ~/.bashrc

如何进行软链接来对不同CUDA版本进行切换,看我其他专栏的相关文章写的很详细。

二. 安装apex

此前记得安装gcc g++ make,并确保三者都可以在命令行中直接找到。


git clone https://github.com/NVIDIA/apex
cd apex
pip install -v --disable-pip-version-check --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./

正常安装成功是没有任何error信息的,会显示成功安装:

请添加图片描述

三. 各类报错问题解决

3.1 C++编译错误

报错信息:

subprocess.CalledProcessError: Command '['which', 'c++']' returned non-zero

原因:
ubuntu提供了这样一个包 build-essential,编译c/c++的,安装build-essential:

sudo apt-get install build-essential

3.2 Apex优化算子错误

报错信息:

RuntimeError: apex.optimizers.FusedAdam requires cuda extensions

原因:Apex缺少cuda_ext 库,一定是没有正确安装好apex,需要卸载重装:

pip uninstall apex

3.3 CUDA错误

报错信息:

RuntimeError: Error compiling objects for extension

原因:没有正确安装CUDA库,或者CUDA版本与所安装的Pytorch版本不对应。
解决:重新安装正确版本的CUDA

3.4 g++或gcc错误

报错信息:

subprocess.calledprocesserror command ' 'which' 'g++' ' returned non-zero exit status 1

原因:gcc与g++不是同一个大版本,编译失败。
解决:

sudo apt remove g++ 
sudo apt remove gcc
sudo apt-get update
sudo apt-get install gcc-9 g++-9
#建立强链接
sudo ln -s /usr/bin/gcc-9 /usr/bin/gcc -f
sudo ln -s /usr/bin/g++-9 /usr/bin/g++ -f

相关内容

热门资讯

中证A500ETF摩根(560... 8月22日,截止午间收盘,中证A500ETF摩根(560530)涨1.19%,报1.106元,成交额...
A500ETF易方达(1593... 8月22日,截止午间收盘,A500ETF易方达(159361)涨1.28%,报1.104元,成交额1...
何小鹏斥资约2.5亿港元增持小... 每经记者|孙磊    每经编辑|裴健如 8月21日晚间,小鹏汽车发布公告称,公司联...
中证500ETF基金(1593... 8月22日,截止午间收盘,中证500ETF基金(159337)涨0.94%,报1.509元,成交额2...
中证A500ETF华安(159... 8月22日,截止午间收盘,中证A500ETF华安(159359)涨1.15%,报1.139元,成交额...
科创AIETF(588790)... 8月22日,截止午间收盘,科创AIETF(588790)涨4.83%,报0.760元,成交额6.98...
创业板50ETF嘉实(1593... 8月22日,截止午间收盘,创业板50ETF嘉实(159373)涨2.61%,报1.296元,成交额1...
港股异动丨航空股大幅走低 中国... 港股航空股大幅下跌,其中,中国国航跌近7%表现最弱,中国东方航空跌近5%,中国南方航空跌超3%,美兰...
电网设备ETF(159326)... 8月22日,截止午间收盘,电网设备ETF(159326)跌0.25%,报1.198元,成交额409....
红利ETF国企(530880)... 8月22日,截止午间收盘,红利ETF国企(530880)跌0.67%,报1.034元,成交额29.0...