Azure डेटा फ़ैक्टरी v2 में मैंने कई पाइपलाइनें बनाई हैं। मैंने देखा कि मेरे द्वारा बनाई गई प्रत्येक पाइपलाइन एक स्रोत और गंतव्य डेटासेट बनाया गया है।

ADF दस्तावेज़ के अनुसार: डेटासेट डेटा का एक नामित दृश्य है जो उस डेटा को इंगित या संदर्भित करता है जिसे आप अपनी गतिविधियों में इनपुट और आउटपुट के रूप में उपयोग करना चाहते हैं।

ये डेटासेट मेरी डेटा फ़ैक्टरी में दिखाई दे रहे हैं। मैं उत्सुक हूं कि मैं इनकी परवाह क्यों करूंगा? ये लगभग 'हुड के नीचे' वस्तुओं की तरह प्रतीत होते हैं ADF डेटा को इधर-उधर करने के लिए बनाता है। मेरे लिए ये क्या मूल्य हैं और मैं इनकी परवाह क्यों करूं?

1
Randy Minder 13 जून 2018, 22:07

3 जवाब

सबसे बढ़िया उत्तर

ये डेटासेट ऐसी इकाइयाँ हैं जिनका पुन: उपयोग किया जा सकता है। उदाहरण के लिए, डेटासेट ए को कई पाइपलाइनों द्वारा संदर्भित किया जा सकता है यदि उन पाइपलाइनों को समान डेटा (समान तालिका या समान फ़ाइल) की आवश्यकता होती है। लिंक्ड सेवाओं का पुन: उपयोग भी किया जा सकता है। मुझे लगता है कि इसीलिए ADF के पास ये अवधारणाएँ हैं।

0
Fang Liu 14 जून 2018, 05:33

यदि आप कॉपी विजार्ड टूल के माध्यम से पाइपलाइन बनाते हैं तो आप उन्हें अपने कारखाने में दिखा सकते हैं। यह आपके स्रोत और सिंक के लिए डेटासेट बनाएगा। कॉपी गतिविधि एडीएफ पाइपलाइनों में डेटासेट का प्राथमिक उपभोक्ता है।

0
Mark Kromer 13 जून 2018, 23:22

यदि आप डेटा बदलने के लिए ADFv2 का उपयोग कर रहे हैं, तो डेटासेट की आवश्यकता नहीं है। लेकिन अगर आप डेटा कॉपी करने के लिए एडीएफ कॉपी गतिविधि का उपयोग कर रहे हैं, तो डेटासेट का उपयोग एडीएफ को कॉपी करने के लिए ऑब्जेक्ट का पथ और नाम जानने के लिए किया जाता है। एक बार आपके पास एक डेटासेट बन जाने के बाद, इसे कई पाइपलाइनों में उपयोग किया जा सकता है। क्या आप कृपया मुझे यह समझने में मदद कर सकते हैं कि डेटासेट बनाना आपकी परियोजनाओं में आपके लिए एक घर्षण क्यों है?

0
Ye Xu 14 जून 2018, 05:57