मैं कुछ ऑडियो क्लिप को वर्गीकृत करने की कोशिश कर रहा हूं, और ऐसा करने के लिए मुझे उन ऑडियो क्लिप को विभाजित करना होगा जो प्रत्येक 30 सेकंड लंबी हैं, 1 सेकंड क्लिप में। और फिर मैं इस 1 सेकंड के ऑडियो क्लिप को एक क्लासिफायरियर में रखना चाहता हूं और अपनी अंतिम प्रतिक्रिया के लिए सभी 30 एक-सेकंड की ऑडियो फाइलों के आउटपुट का औसत निकालना चाहता हूं। मुझे हर 30 इनपुट से 1 आउटपुट चाहिए।

मेरी समस्या यह है कि मैं नहीं जानता कि उन्हें अपने क्लासिफायरियर में कैसे खिलाना है, मैं सुझाए गए अनुसार एकाधिक आवेगों का उपयोग नहीं कर सकता यहां क्योंकि मेरे पास उनमें से 30 हैं और केवल 2 नहीं, यह एक गड़बड़ होगी।

1
MatteoUnt 3 अक्टूबर 2020, 18:23

1 उत्तर

सबसे बढ़िया उत्तर

आपके द्वारा संदर्भित लिंक 2 इनपुट ऑडियो क्लिप के बजाय 2 अलग इनपुट पाइपलाइन होने के बारे में है। आपको अपने 30 एक-सेकंड के ऑडियो डेटा को Tensor में लपेटना होगा (यदि आप Tensorflow का उपयोग कर रहे हैं, यदि नहीं तो आप जिस फ्रेमवर्क का उपयोग कर रहे हैं, उसके समकक्ष का उपयोग करें)

फिर Tensor को आपके डीप लर्निंग मॉडल की एक इनपुट पाइपलाइन में फीड किया जा सकता है।

Tensoflow में ऑडियो डेटा को संभालने के लिए ट्यूटोरियल चेकआउट करें: टेंसरफ़्लो ऑडियो डेटा तैयार करना और बढ़ाना ट्यूटोरियल

0
mb0850 3 अक्टूबर 2020, 15:42