安裝vscode
方法一:
依次輸入如下命令
1.sudo add-apt-repository ppa:ubuntu-desktop/ubuntu-make
2.sudo apt-get update
3.sudo apt-get install ubuntu-make
4.umake ide visual-studio-code
可以在應(yīng)用找到vscode即為成功
安裝git
1.sudo apt update
2.sudo apt install git
可以在git --version打印出版本即為成功
安裝cuda
在這里找CUDA Toolkit Archive | NVIDIA Developer
(nvcc -V的話是查詢系統(tǒng)安裝的cuda版本,而nvidia-smi是查看GPU使用情況的(也可以用來檢查驅(qū)動(dòng)是否安裝成功)。nvidia-smi之所以會(huì)出現(xiàn)cuda version,我印象里谷歌給的解釋是,release這個(gè)顯卡驅(qū)動(dòng)時(shí)英偉達(dá)使用的cuda版本。只需要保證nvidia-smi顯示的cuda version比nvcc -V顯示的版本高就行)
1.wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run
2.sudo sh cuda_11.3.0_465.19.01_linux.run
以下這樣即為成功
===========
= Summary =
===========
Driver: Not Selected
Toolkit: Installed in /usr/local/cuda-10.2/
Samples: Installed in /home/wohu/, but missing recommended libraries
Please make sure that
- PATH includes /usr/local/cuda-10.2/bin
- LD_LIBRARY_PATH includes /usr/local/cuda-10.2/lib64, or, add /usr/local/cuda-10.2/lib64 to /etc/ld.so.conf and run ldconfig as root
To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-10.2/bin
Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-10.2/doc/pdf for detailed information on setting up CUDA.
***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 440.00 is required for CUDA 10.2 functionality to work.
To install the driver using this installer, run the following command, replacing <CudaInstaller> with the name of this run file:
sudo <CudaInstaller>.run --silent --driver
Logfile is /var/log/cuda-installer.log
多種方式驗(yàn)證cuda是否安裝成功
ll /usr/local/
若看到 /usr/local/
目錄下已經(jīng)有 cuda -> /usr/local/cuda-10.2//
軟鏈接,則為成功
然后繼續(xù)配置cuda環(huán)境變量
打開.bashrc并修改
sudo vi ~/.bashrc
進(jìn)入文件后使用上下左右移動(dòng)鍵將光標(biāo)移動(dòng)到最后一行,然后使用字母按鍵o插入一行
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
繼而接著再插入一行
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
最后按下esc按鍵,然后輸入:wq即可保存
然后還要使得配置的環(huán)境變量生效,所以繼續(xù)輸入
sudo source ~/.bashrc
如果遇到source command not found情況,可以切換到root用戶,使用sudo -s切換,然后執(zhí)行source ~/.bashrc 即可成功
當(dāng)一切搞定,就可以測(cè)試cuda,查看cuda版本使用nvcc -V
卸載cuda
在cuda10.2里對(duì)應(yīng)torch1.7.0和torchvision0.8.1使用nvidia 3090不太行(原因:算力7.0的顯卡可以在支持最高算力7.5的CUDA版本下運(yùn)行,但是算力7.5的顯卡不可以在支持最高算力7.0的CUDA版本下運(yùn)行,同理算力8.x的顯卡不可以在支持最高算力7.x的CUDA版本下運(yùn)行),會(huì)報(bào)錯(cuò),所以此時(shí)只能升級(jí)torch版本
這里感覺裝了兩個(gè)無用cuda版本有點(diǎn)難受,所以卸載他們
cd /usr/local/cuda-xx.x/bin/
sudo ./cuda-uninstaller
當(dāng)下載cuda提示連接超時(shí)時(shí),建議直接重啟電腦
胡亂卸載導(dǎo)致nvidia-smi找不到設(shè)備了,故重新安裝nvidia驅(qū)動(dòng)
首先安裝驅(qū)動(dòng)前一定要更新軟件列表和安裝必要軟件、依賴(必須)
sudo apt-get update #更新軟件列表
sudo apt-get install g++
sudo apt-get install gcc
sudo apt-get install make
lspci | grep -i nvidia或者ubuntu-drivers devices 查看顯卡型號(hào),然后進(jìn)入這個(gè)網(wǎng)站
http://www.ythuaji.com.cn/uploads/allimg/m3wcri1aqcv.aspx
卸載原有驅(qū)動(dòng)
sudo apt-get remove --purge nvidia* # 或者nvidia-*
禁用nouveau(nouveau是通用的驅(qū)動(dòng)程序)(必須)
sudo gedit /etc/modprobe.d/blacklist.conf 或者(blacklist-nouveau.conf)
在打開的blacklist.conf末尾添加如下,保存文本關(guān)閉
blacklist nouveau
options nouveau modeset=0
在終端輸入如下更新,更新結(jié)束后重啟電腦(必須)
sudo update-initramfs –u
重啟后在終端輸入如下,沒有任何輸出表示屏蔽成功
lsmod | grep nouveau
安裝lightdm,lightdm是顯示管理器,主要管理登錄界面,ubuntu20.04、21.04、22.04需要自行安裝,然后上下鍵選擇lightdm即可
sudo apt-get install lightdm
為了安裝新的Nvidia驅(qū)動(dòng)程序,我們需要停止當(dāng)前的顯示服務(wù)器。最簡(jiǎn)單的方法是使用telinit命令更改為運(yùn)行級(jí)別3。在終端輸入以下linux命令后,顯示服務(wù)器將停止。(必須)
sudo telinit 3
進(jìn)入黑漆漆的文本界面tty(如果進(jìn)不去,就按Ctrl + Alt + F1~F6中的一個(gè) (分別對(duì)應(yīng)進(jìn)入tty1~tty6)),然后輸入用戶名和密碼
在文本界面中,禁用X-window服務(wù),在終端輸入(必須)
(如果是默認(rèn)的gdm3顯示管理器,命令為sudo /etc/init.d/gdm3 stop)
sudo /etc/init.d/lightdm stop或者(sudo service lightdm stop)
cd命令進(jìn)入到你存放驅(qū)動(dòng)的目錄,輸入命令:
sudo chmod 777 NVIDIA-Linux-x86_64-430.26.run #給你下載的驅(qū)動(dòng)賦予可執(zhí)行權(quán)限,才可以安裝
sudo ./NVIDIA-Linux-x86_64-430.26.run (–no-opengl-files) #安裝
簡(jiǎn)潔版
sudo apt-get update #更新軟件列表
sudo apt-get install g++ #安裝必要依賴
sudo apt-get install gcc
sudo apt-get install make
sudo apt-get remove --purge nvidia* #卸載原有所有驅(qū)動(dòng)(或者nviida-*)
sudo gedit /etc/modprobe.d/blacklist.conf #禁用nouveau,末尾添加如下兩行命令保存
blacklist nouveau
options nouveau modeset=0
sudo update-initramfs –u #更新
reboot #重啟電腦
lsmod | grep nouveau #檢查,輸入之后無其他輸出,成功,繼續(xù)
sudo telinit 3 #進(jìn)入文本界面
sudo service gdm3 stop #停止顯示服務(wù)
sudo chmod 777 NVIDIA-Linux-x86_64-430.26.run #給你下載的驅(qū)動(dòng)賦予可執(zhí)行權(quán)限,才可以安裝
sudo ./NVIDIA-Linux-x86_64-430.26.run #安裝
sudo service gdm3 start #重啟顯示服務(wù),完成
安裝anconda
Index of /anaconda/archive/ | 清華大學(xué)開源軟件鏡像站 | Tsinghua Open Source Mirror
在鏡像源下載anconda3-5.2.0-linux-x86_64版本
然后在下載文件位置打開終端,運(yùn)行(bash+文件名)
bash Anaconda3-2020.02-Linux-x86_64.sh
一直enter,然后兩次都yes
最后conda -v查看conda版本即可
配置conda鏡像源
首先看安裝地址有沒有.condarc文件,沒有則運(yùn)行
conda config --set show_channel_urls yes
然后,如果有可視化界面,直接使用text editor編輯負(fù)責(zé)這一段進(jìn).condarc文件即可
channels:
- defaults
show_channel_urls: true
default_channels:
- http://www.ythuaji.com.cn/uploads/allimg/duchgc4vjlj
- http://www.ythuaji.com.cn/uploads/allimg/wy4l4ru4lmb
- http://www.ythuaji.com.cn/uploads/allimg/x4v0ct0ikjg
custom_channels:
conda-forge: http://www.ythuaji.com.cn/uploads/allimg/qdq4hxvdmwk
msys2: http://www.ythuaji.com.cn/uploads/allimg/qdq4hxvdmwk
bioconda: http://www.ythuaji.com.cn/uploads/allimg/qdq4hxvdmwk
menpo: http://www.ythuaji.com.cn/uploads/allimg/qdq4hxvdmwk
pytorch: http://www.ythuaji.com.cn/uploads/allimg/qdq4hxvdmwk
pytorch-lts: http://www.ythuaji.com.cn/uploads/allimg/qdq4hxvdmwk
simpleitk: http://www.ythuaji.com.cn/uploads/allimg/qdq4hxvdmwk
實(shí)戰(zhàn)項(xiàng)目
接下來以實(shí)戰(zhàn)項(xiàng)目為例:fairmot的復(fù)現(xiàn)
首先我們?nèi)フ业巾?xiàng)目的github
遇到的第一個(gè)問題:cuda是11.4,沒有適配的torch,所以需要去安裝其他版本cuda,這里準(zhǔn)備降到10.2版本
多cuda版本使用
多版本cuda動(dòng)態(tài)切換(舉例):
1、更改環(huán)境變量,將cuda-10.1變?yōu)閏uda-9.0
sudo gedit ~/.bashrc
注釋掉原來的cuda10.1版本的環(huán)境變量,替換為cuda9.0的環(huán)境變量
export PATH="$PATH:/usr/local/cuda-9.0/bin"
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64/"
export LIBRARY_PATH="$LIBRARY_PATH:/usr/local/cuda-9.0/lib64"
2、刪除之前的軟連接,并生成新的軟連接
sudo rm -rf /usr/local/cuda #刪除之前創(chuàng)建的軟鏈接
sudo ln -s /usr/local/cuda-9.0 /usr/local/cuda #創(chuàng)建新 cuda 的軟鏈接
對(duì)應(yīng)項(xiàng)目所需torch去下載
https://download.pytorch.org/whl/cu113/torch_stable.html
- cu102:表示cuda版本為10.2,(可以直接更改這個(gè)跳轉(zhuǎn)鏈接)
- torch-1.7.1:表示torch版本為1.7.1
- cp38:表示適用python版本為3.8
- linux:表示適用于linux系統(tǒng)
- x86_64:表示同時(shí)兼容32和64位系統(tǒng)
然后在文件位置命令行運(yùn)行pip install +文件名 -i https://mirrors.bfsu.edu.cn/pypi/web/simple