मेरी समझ के अनुसार, डेटा अग्रेषण कनेक्शन से जुड़े ऑपरेटरों को जंजीर में बांधा जा सकता है। यदि वे जंजीर से बंधे हैं, तो उनके बीच केवल एक रक्षात्मक प्रति हो रही है (डिफ़ॉल्ट रूप से)।
इस निष्पादन ग्राफ को देखते हुए:
- क्या लेन-देन स्रोत के सभी ऑपरेटर संदर्भ/रक्षात्मक प्रतियों द्वारा डेटा साझा कर रहे हैं?
- लेन-देन स्रोत और गतिशील विभाजन के बीच क्या होता है? क्या वे जंजीर में हैं क्योंकि यह एक फॉरवर्ड डेटा कनेक्शन है (और यह प्रसारण के कारण सिर्फ नेत्रहीन रूप से अलग है)?
1 उत्तर
जंजीर ऑपरेटरों को हमेशा एक कार्य के रूप में दिखाया जाता है। इसलिए ->
से अलग किए गए सभी ऑपरेटर आपके स्रोतों में जंजीर में बंधे हैं।
गतिशील भाग जंजीर नहीं है, क्योंकि इसमें एक से अधिक इनपुट हैं। हालांकि फ़्लिंक टू चेन ऑपरेटरों में कई इनपुट के साथ कुछ समर्थन है, लेकिन इसे लागू करना कठिन है और डेटास्ट्रीम एपीआई में अनुशंसित नहीं है। टेबल एपीआई/एसक्यूएल उस तंत्र का उपयोग स्वचालित रूप से सब कुछ एक कार्य में विलय करने के लिए करेगा। [1]
गैर-जंजीर वाले फॉरवर्ड चैनलों के लिए, डेटा एक स्थानीय नेटवर्क चैनल पर भेजा जाता है। तो यह क्रमबद्ध है और बफ़र्स में विभाजित है लेकिन यह नेटवर्क इंटरफ़ेस को हिट नहीं कर रहा है।
[1] https://developpaper.com/flink-sql-performance- अनुकूलन-बहु-इनपुट/
संबंधित सवाल
नए सवाल
apache-flink
Apache Flink स्केलेबल बैच और स्ट्रीम डेटा प्रोसेसिंग के लिए एक ओपन सोर्स प्लेटफॉर्म है। फ्लिंक एक सिस्टम में बैच और स्ट्रीमिंग एनालिटिक्स का समर्थन करता है। विश्लेषणात्मक कार्यक्रमों को जावा और स्काला में संक्षिप्त और सुरुचिपूर्ण एपीआई में लिखा जा सकता है।