Ubuntu20.04安装NVIDIA混合精度计算库apex全流程及各类报错问题解答
创始人
2024-06-02 08:13:29
0

目录

  • 一. 安装CUDA
  • 二. 安装apex
  • 三. 各类报错问题解决
    • 3.1 C++编译错误
    • 3.2 Apex优化算子错误
    • 3.3 CUDA错误
    • 3.4 g++或gcc错误

背景:跟李沐老师一起探索RTX 3090的深度学习浮点运算性能,需要安装apex进行半精度运算,本文总结了Ubuntu20.04安装NVIDIA混合精度计算库apex全流程及各类报错问题解答

环境:
Ubuntu20.04
AMD 5800 8-core 16-Thread
NVIDIA RTX 3090
Pytorch1.13(gpu)
Python3.9
CUDA11.7

一. 安装CUDA

确保你的apex跟CUDA版本对应,如果不对应,则在运行程序时会产生各类kernel fusion之类的错误。

wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
sudo sh cuda_11.7.1_515.65.01_linux.run

网不好可以先用浏览器下载,然后再安装。
安装时一直确认就可以了,如果已经安装过NVIDIA驱动可以去掉驱动的选项。
添加环境变量:

vim ~/.bashrc
export CUDA_HOME=/usr/local/cuda

source ~/.bashrc

如何进行软链接来对不同CUDA版本进行切换,看我其他专栏的相关文章写的很详细。

二. 安装apex

此前记得安装gcc g++ make,并确保三者都可以在命令行中直接找到。


git clone https://github.com/NVIDIA/apex
cd apex
pip install -v --disable-pip-version-check --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./

正常安装成功是没有任何error信息的,会显示成功安装:

请添加图片描述

三. 各类报错问题解决

3.1 C++编译错误

报错信息:

subprocess.CalledProcessError: Command '['which', 'c++']' returned non-zero

原因:
ubuntu提供了这样一个包 build-essential,编译c/c++的,安装build-essential:

sudo apt-get install build-essential

3.2 Apex优化算子错误

报错信息:

RuntimeError: apex.optimizers.FusedAdam requires cuda extensions

原因:Apex缺少cuda_ext 库,一定是没有正确安装好apex,需要卸载重装:

pip uninstall apex

3.3 CUDA错误

报错信息:

RuntimeError: Error compiling objects for extension

原因:没有正确安装CUDA库,或者CUDA版本与所安装的Pytorch版本不对应。
解决:重新安装正确版本的CUDA

3.4 g++或gcc错误

报错信息:

subprocess.calledprocesserror command ' 'which' 'g++' ' returned non-zero exit status 1

原因:gcc与g++不是同一个大版本,编译失败。
解决:

sudo apt remove g++ 
sudo apt remove gcc
sudo apt-get update
sudo apt-get install gcc-9 g++-9
#建立强链接
sudo ln -s /usr/bin/gcc-9 /usr/bin/gcc -f
sudo ln -s /usr/bin/g++-9 /usr/bin/g++ -f

相关内容

热门资讯

东方电子跌2.04%,成交额7... 5月14日,东方电子盘中下跌2.04%,截至11:00,报9.59元/股,成交7109.97万元,换...
龙利得涨2.30%,成交额24... 5月14日,龙利得盘中上涨2.30%,截至10:59,报5.79元/股,成交2494.39万元,换手...
国台办回应民进党当局加紧采购爱... 转自:财联社【国台办回应民进党当局加紧采购爱国者导弹】财联社5月14日电,国台办举行例行新闻发布会。...
格林精密跌2.04%,成交额5... 5月14日,格林精密盘中下跌2.04%,截至11:00,报14.92元/股,成交5458.96万元,...
晶华微跌2.06%,成交额17... 5月14日,晶华微(维权)盘中下跌2.06%,截至10:50,报25.66元/股,成交1777.62...
必得科技跌2.05%,成交额1... 5月14日,必得科技盘中下跌2.05%,截至10:56,报12.90元/股,成交1339.76万元,...
立方制药涨2.02%,成交额9... 5月14日,立方制药盘中上涨2.02%,截至10:57,报23.77元/股,成交9439.78万元,...
兰州市城关区首次开展公共服务政... 城关区首次开展公共服务政策健康影响评估  5月13日,兰州市城关区召开公共服务政策健康影响评估会议暨...
哪吒汽车关联公司超10亿人民币...   5月14日上午消息,天眼风险信息显示,哪吒汽车关联公司合众新能源汽车股份有限公司有10亿人民币、...
瀚川智能跌2.05%,成交额1... 5月14日,瀚川智能盘中下跌2.05%,截至10:51,报13.88元/股,成交1667.10万元,...
2024年上海宝山绿色低碳产业... 5月14日,界面新闻从上海宝山获悉,2024年宝山区绿色低碳产业规模已达1003.69亿元,首次突破...
美股三大指数涨跌不一 标普50... 来源:环球网 【环球网财经综合报道】当地时间周二,美股市场呈现分化走势,三大指数收盘涨跌互现。其中,...
瑞凌股份跌2.05%,成交额2... 5月14日,瑞凌股份盘中下跌2.05%,截至10:58,报10.03元/股,成交2729.60万元,...
研究称中国痴呆人数激增 【#研究称中国痴呆人数激增#】最近,上海复旦大学的一项研究显示,过去30年间,中国痴呆患者数量从19...
青少年阅读,筑就生命基石——来... 青少年红色阅读接力活动。 主办方供图当人工智能(AI)的浪潮扑面而来,全民阅读迎来变革之年,如何让阅...
技能之星丨赵慧仪:破茧成蝶的舞... 转自:邯郸网络广播电视台2025年河北省职业院校技能大赛舞蹈表演(中职组)现场,邯郸科实中等专业学校...
【研报推荐】华润微:25Q1盈... 转自:新华财经华润微季报点评_25Q1盈利同比高增,汽车和AI应用持续带来需求增量.pdf
费高云卸任安徽副省长,此前已任... 转自:长安街知事据安徽日报消息,5月14日上午,安徽省十四届人大常委会第十六次会议通过人事任免案,决...
电子烟概念股集体上扬 华宝国际... .ct_hqimg {margin: 10px 0;} .hqimg_wrapper {text-a...
中自科技跌2.03%,成交额4... 5月14日,中自科技盘中下跌2.03%,截至10:51,报22.64元/股,成交4916.13万元,...