मैं चाहता हूं कि कोई आपका TF2.4.1 वातावरण RTX 30X0 के साथ दे। अधिक विशिष्ट, मैं nvidia ड्राइवर, CUDA और CuDNN संस्करण जानना चाहता हूं। इसके अलावा TF2.4.1 स्थापना तरीके से सब के बाद।

मैं अपने पीसी में tensorflow2.4.1 स्थापित करने के लिए संघर्ष कर रहा हूं जो नीचे है। OS: Ubuntu 20.04 (संस्करण कोई फर्क नहीं पड़ता) CPU: Ryzen 5600X GPU: RTX 3070

मुझे पता है कि निम्नलिखित साइट के अनुसार TF2.4.1 की आवश्यकताएं CUDA11.0 w/CuDNN8.0.4 है।

https://www.tensorflow.org/install/gpu

हालाँकि, NVIDIA ड्राइवर संस्करण 457 RTX 3070 के लिए पहला संस्करण है और वर्तमान नवीनतम संस्करण Ver.460 है। इसलिए, मैंने टर्मिनल पर निम्नलिखित संस्करण 460 और 'एनवीडिया-एसएमआई' रिटर्न स्थापित किया। (जैसा कि आप जानते हैं, CUDA संस्करण 11.2 इस ड्राइवर स्थापना के साथ स्थापित नहीं है।)

| NVIDIA-SMI 460.73.01 ड्राइवर संस्करण: 460.73.01 CUDA संस्करण: 11.2 |

नीचे NVIDIA साइट से समर्थन मैट्रिसेस का कहना है कि CUDA 11.0 ड्राइवर ver.450 के लिए है। जिसका अर्थ है कि यह आरटीएक्स 3070 के लिए एक नहीं हो सकता है। आरटीएक्स 3070 के लिए, मुझे लगता है कि CUDA 11.2 या बाद में एक है क्योंकि यह Ver.460 का समर्थन करता है।

https://docs.nvidia.com/deeplearning/cudnn/support-matrix/index.html

CUDA11.2 w / CuDNN8.1.0 की स्थापना के बाद, मैंने पाइप से pyenv में टेंसरफ़्लो स्थापित किया। हालाँकि, TF CPU पर चलता है। मैंने 'tf.config.list_physical_devices('GPU')' द्वारा पुष्टि की, जो '[]' लौटा जैसा मुझे उम्मीद थी। जब तक NVIDIA पर्यावरण के संबंध में TF2.4.1 का प्रतिबंध प्रभावी है, क्या आपको लगता है कि मैं इस पीसी पर TF वातावरण नहीं बना सकता?

मैंने उबंटू की ताजा स्थापना के साथ बहुत सारे पैटर्न की कोशिश की। एक बार जब मैं DPKG त्रुटि के साथ ver.450 स्थापित करने में विफल रहा, लेकिन मैं पुनः प्रयास करूंगा।

0
Ihmon 3 मई 2021, 10:22
आप पुराने CUDA टूलकिट के साथ नए ड्राइवर का उपयोग कर सकते हैं। वहां कोई प्रतिबंध नहीं है,
 – 
talonmies
3 मई 2021, 10:49
इतनी छोटी सूचना में आपके उत्तर के लिए धन्यवाद। मैंने ड्राइवर ver.460 स्थापना के बाद CUDA11.0 स्थापित किया, लेकिन CUDA स्थापना के दौरान, '450' शब्द वाली कई त्रुटियां हुईं। इससे मुझे विश्वास हुआ कि CUDA11.0 को केवल ver.450 की आवश्यकता है। वैसे भी मैं उबंटू को फिर से स्थापित करूँगा और ver.450 स्थापना का प्रयास करूँगा। मैं परिणाम पर टिप्पणी करूंगा।
 – 
Ihmon
3 मई 2021, 11:02
CUDA Toolkit 11.3 संगत ड्राइवर के साथ आता है। कुछ भी इसका उपयोग करने से रोक रहा है?
 – 
Lukasz Tracewski
3 मई 2021, 12:22
धन्यवाद, लुकाज़। जैसे मैंने पोस्ट किया, TF2.4.1 केवल CUDA11.0 पर काम करता है। आज, मैंने इसे CUDA11.2 पर आज़माया, लेकिन TF ने केवल CPU के साथ काम किया और इसने RTX 3070 का उपयोग नहीं किया। जैसा कि आप जानते हैं, पुराना TF2 CUDA10.1 पर काम करता रहा, कोई फर्क नहीं पड़ता कि कौन सा CUDA संस्करण नवीनतम था।
 – 
Ihmon
3 मई 2021, 16:01

2 जवाब

सबसे बढ़िया उत्तर

आप सभी को धन्यवाद। मैंने पाया कि मेरी समस्या नीचे की तरह हल हो गई है।

Ubuntu 20.04 स्थापित होने के बाद, नवीनतम NVIDIA ड्राइवर स्थापित करें। (शायद कोई ज़रूरत नहीं है, क्योंकि यह CUDA स्थापना के साथ स्वचालित रूप से स्थापित हो जाएगा।)

sudo ubuntu-drivers devices
sudo apt-get install --no-install-recommends nvidia-driver-460
nvidia-smi
sudo reboot

CUDA11.0 स्थापित करें जो TF2.4.1 चाहता है। इस बार मैं डेब [स्थानीय] के बजाय रनफाइल [स्थानीय] का उल्लेख करता हूं जो मुझे पहले विफलता मिली थी। https://डेवलपर। nvidia.com/cuda-11.0-update1-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=2004&target_type=runfilelocal

sudo apt update
wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda_11.0.3_450.51.06_linux.run
sudo sh cuda_11.0.3_450.51.06_linux.run

*चेतावनी 'ड्राइवर का मौजूदा पैकेज मैनेजर इंस्टालेशन मिला।' ऊपर की लाइन पर दिखाई दिया और मैंने इसे निरस्त कर दिया। इसके बजाय नीचे किया गया।

sudo sh ./cuda_11.0.3_450.51.06_linux.run --toolkit --silent –-override

पुष्टि करें कि क्या usr/local/cuda-11.0/bin मौजूद है और संपादित करें bashrc.

sudo vim ~/.bashrc

Bashrc में निम्नलिखित 2 पंक्तियाँ जोड़ें।

export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

पुनः लोड करें

source ~/.bashrc

CuDNN स्थापित करें। टैर्ड लाइब्रेरी को पहले से डाउनलोड कर लें। https://developer.nvidia.com/rdp/cudnn-archive

cd Downloads
tar -xzvf cudnn-11.0-linux-x64-v8.0.4.30.tgz
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
sudo apt update

TF2.4.1 को https://www.tensorflow.org/install/pip?hl के रूप में इंस्टॉल करें =ja निर्देश देता है।

sudo apt install python3-dev python3-pip python3-venv
cd Documents/ML/tf-test1
python3 -m venv test1
source test1/bin/activate
pip install --upgrade pip
pip list
pip install --upgrade tensorflow

जांचें कि क्या टीएफ ठीक से स्थापित है।

import tensorflow as tf
print(tf.__version__)
print(tf.config.list_physical_devices('GPU'))
print(tf.test.gpu_device_name())

जब मैं अपना सीएनएन मॉडल करता हूं, 'कनवल्शन एल्गोरिदम प्राप्त करने में विफल। यह शायद इसलिए है क्योंकि cuDNN इनिशियलाइज़ करने में विफल रहा' फिट के रूप में हुआ ()। फिर मैंने हमेशा की तरह नीचे किया।

export TF_FORCE_GPU_ALLOW_GROWTH=true

फिर सुलझा लिया।

1
A.B 4 मई 2021, 09:51
इसने उबंटू 20.10 के लिए काम किया, जिसे मैं 3 दिनों के लिए मारा गया था।
 – 
A.B
4 मई 2021, 09:52
अगर कोई पिछली गड़बड़ी को हटाना चाहता है तो sudo apt-get --purge remove 'cuda*' sudo apt-get --purge remove 'nvidia*' sudo apt-get --purge remove 'libnvidia*' का उपयोग करें
 – 
A.B
4 मई 2021, 09:54

मेरे पास आपके जैसा एक ubuntu 20.4 है। लेकिन ताकि टेंसरफ़्लो GPU को अच्छी तरह से देख सके, मेरे लिए आखिरकार जो काम आया वह है: tensorflow-gpu 2.2.0 cuda 10.1 cudnn 7.6 और सभी संस्करण 460.73.01 के NVIDIA ड्राइव के साथ

0
ibra ndiaye 3 मई 2021, 12:17
मेरे सवाल का जवाब देने के लिए शुक्रिया। इस मामले में, एक महत्वपूर्ण कारक आरटीएक्स 30X0 श्रृंखला की तरह एम्पीयर आर्किटेक्चर जीपीयू है। क्या आपका पीसी RTX 30X0 सीरीज से लैस है? मेरे पास GTX 1070 के साथ एक और पीसी है जिसमें CUDA10.1 पर TF2.2 है। यह बहुत अच्छा काम कर रहा है।
 – 
Ihmon
3 मई 2021, 16:03
1
मेरे पास एक आरटीएक्स 2060 है ... लेकिन कॉन्फ़िगरेशन मैंने इसे एक जीथब टिप्पणी पर देखा था जिसे बड़े पैमाने पर वोट दिया गया था। इससे पहले कि मैं इस एक के सामने आया, स्वयं मुझे बहुत अधिक परेशानी हुई।
 – 
ibra ndiaye
3 मई 2021, 16:26
मैं आपसे पूरी तरह से संबंधित हो सकता हूं। जब मैंने वर्तमान पीसी को GTX1070 के साथ स्थापित किया, तो यह बुरा सपना था। एक कारण यह है कि यह 4 साल पहले था, इसलिए जापानी साइट में जानकारी कम थी। वैसे भी, मुझे लगता है कि मुझे इस RTX 3070 w/CUDA11.0 और ver.460 के साथ समाधान मिल गया है। मैंने कल जो किया वह पोस्ट करूंगा। धन्यवाद।
 – 
Ihmon
3 मई 2021, 16:34