मैं चाहता हूं कि कोई आपका TF2.4.1 वातावरण RTX 30X0 के साथ दे। अधिक विशिष्ट, मैं nvidia ड्राइवर, CUDA और CuDNN संस्करण जानना चाहता हूं। इसके अलावा TF2.4.1 स्थापना तरीके से सब के बाद।
मैं अपने पीसी में tensorflow2.4.1 स्थापित करने के लिए संघर्ष कर रहा हूं जो नीचे है। OS: Ubuntu 20.04 (संस्करण कोई फर्क नहीं पड़ता) CPU: Ryzen 5600X GPU: RTX 3070
मुझे पता है कि निम्नलिखित साइट के अनुसार TF2.4.1 की आवश्यकताएं CUDA11.0 w/CuDNN8.0.4 है।
https://www.tensorflow.org/install/gpu
हालाँकि, NVIDIA ड्राइवर संस्करण 457 RTX 3070 के लिए पहला संस्करण है और वर्तमान नवीनतम संस्करण Ver.460 है। इसलिए, मैंने टर्मिनल पर निम्नलिखित संस्करण 460 और 'एनवीडिया-एसएमआई' रिटर्न स्थापित किया। (जैसा कि आप जानते हैं, CUDA संस्करण 11.2 इस ड्राइवर स्थापना के साथ स्थापित नहीं है।)
| NVIDIA-SMI 460.73.01 ड्राइवर संस्करण: 460.73.01 CUDA संस्करण: 11.2 |
नीचे NVIDIA साइट से समर्थन मैट्रिसेस का कहना है कि CUDA 11.0 ड्राइवर ver.450 के लिए है। जिसका अर्थ है कि यह आरटीएक्स 3070 के लिए एक नहीं हो सकता है। आरटीएक्स 3070 के लिए, मुझे लगता है कि CUDA 11.2 या बाद में एक है क्योंकि यह Ver.460 का समर्थन करता है।
https://docs.nvidia.com/deeplearning/cudnn/support-matrix/index.html
CUDA11.2 w / CuDNN8.1.0 की स्थापना के बाद, मैंने पाइप से pyenv में टेंसरफ़्लो स्थापित किया। हालाँकि, TF CPU पर चलता है। मैंने 'tf.config.list_physical_devices('GPU')' द्वारा पुष्टि की, जो '[]' लौटा जैसा मुझे उम्मीद थी। जब तक NVIDIA पर्यावरण के संबंध में TF2.4.1 का प्रतिबंध प्रभावी है, क्या आपको लगता है कि मैं इस पीसी पर TF वातावरण नहीं बना सकता?
मैंने उबंटू की ताजा स्थापना के साथ बहुत सारे पैटर्न की कोशिश की। एक बार जब मैं DPKG त्रुटि के साथ ver.450 स्थापित करने में विफल रहा, लेकिन मैं पुनः प्रयास करूंगा।
2 जवाब
आप सभी को धन्यवाद। मैंने पाया कि मेरी समस्या नीचे की तरह हल हो गई है।
Ubuntu 20.04 स्थापित होने के बाद, नवीनतम NVIDIA ड्राइवर स्थापित करें। (शायद कोई ज़रूरत नहीं है, क्योंकि यह CUDA स्थापना के साथ स्वचालित रूप से स्थापित हो जाएगा।)
sudo ubuntu-drivers devices
sudo apt-get install --no-install-recommends nvidia-driver-460
nvidia-smi
sudo reboot
CUDA11.0 स्थापित करें जो TF2.4.1 चाहता है। इस बार मैं डेब [स्थानीय] के बजाय रनफाइल [स्थानीय] का उल्लेख करता हूं जो मुझे पहले विफलता मिली थी। https://डेवलपर। nvidia.com/cuda-11.0-update1-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=2004&target_type=runfilelocal
sudo apt update
wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda_11.0.3_450.51.06_linux.run
sudo sh cuda_11.0.3_450.51.06_linux.run
*चेतावनी 'ड्राइवर का मौजूदा पैकेज मैनेजर इंस्टालेशन मिला।' ऊपर की लाइन पर दिखाई दिया और मैंने इसे निरस्त कर दिया। इसके बजाय नीचे किया गया।
sudo sh ./cuda_11.0.3_450.51.06_linux.run --toolkit --silent –-override
पुष्टि करें कि क्या usr/local/cuda-11.0/bin मौजूद है और संपादित करें bashrc.
sudo vim ~/.bashrc
Bashrc में निम्नलिखित 2 पंक्तियाँ जोड़ें।
export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
पुनः लोड करें
source ~/.bashrc
CuDNN स्थापित करें। टैर्ड लाइब्रेरी को पहले से डाउनलोड कर लें। https://developer.nvidia.com/rdp/cudnn-archive
cd Downloads
tar -xzvf cudnn-11.0-linux-x64-v8.0.4.30.tgz
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
sudo apt update
TF2.4.1 को https://www.tensorflow.org/install/pip?hl के रूप में इंस्टॉल करें =ja निर्देश देता है।
sudo apt install python3-dev python3-pip python3-venv
cd Documents/ML/tf-test1
python3 -m venv test1
source test1/bin/activate
pip install --upgrade pip
pip list
pip install --upgrade tensorflow
जांचें कि क्या टीएफ ठीक से स्थापित है।
import tensorflow as tf
print(tf.__version__)
print(tf.config.list_physical_devices('GPU'))
print(tf.test.gpu_device_name())
जब मैं अपना सीएनएन मॉडल करता हूं, 'कनवल्शन एल्गोरिदम प्राप्त करने में विफल। यह शायद इसलिए है क्योंकि cuDNN इनिशियलाइज़ करने में विफल रहा' फिट के रूप में हुआ ()। फिर मैंने हमेशा की तरह नीचे किया।
export TF_FORCE_GPU_ALLOW_GROWTH=true
फिर सुलझा लिया।
sudo apt-get --purge remove 'cuda*'
sudo apt-get --purge remove 'nvidia*'
sudo apt-get --purge remove 'libnvidia*'
का उपयोग करें
मेरे पास आपके जैसा एक ubuntu 20.4 है। लेकिन ताकि टेंसरफ़्लो GPU को अच्छी तरह से देख सके, मेरे लिए आखिरकार जो काम आया वह है: tensorflow-gpu 2.2.0 cuda 10.1 cudnn 7.6 और सभी संस्करण 460.73.01 के NVIDIA ड्राइव के साथ
संबंधित सवाल
नए सवाल
python
पायथन एक बहु-प्रतिमान है, गतिशील रूप से टाइप किया हुआ, बहुउद्देशीय प्रोग्रामिंग भाषा है। यह एक साफ और एक समान वाक्यविन्यास सीखने, समझने और उपयोग करने के लिए त्वरित होने के लिए डिज़ाइन किया गया है। कृपया ध्यान दें कि अजगर 2 आधिकारिक तौर पर 01-01-2020 के समर्थन से बाहर है। फिर भी, संस्करण-विशिष्ट पायथन सवालों के लिए, [अजगर -२.०] या [अजगर -३.x] टैग जोड़ें। पायथन वेरिएंट (जैसे, ज्योथन, PyPy) या लाइब्रेरी (उदा।, पांडस और न्यूमपी) का उपयोग करते समय, कृपया इसे टैग में शामिल करें।
CUDA Toolkit 11.3
संगत ड्राइवर के साथ आता है। कुछ भी इसका उपयोग करने से रोक रहा है?