बस एक डिज़ाइन समस्या जिसका हम सामना कर रहे हैं।

मैं निम्नलिखित स्तंभों के साथ लकड़ी की छत प्रारूप में एक छत्ता बाहरी तालिका है:

describe payments_user
col_name,data_type,comment
('amount_hold', 'int', '')
('id', 'int', '')
('transaction_id', 'string', '')
('recipient_id', 'string', '')
('year', 'string', '')
('month', 'string', '')
('day', 'string', '')
('', None, None)
('# Partition Information', None, None)
('# col_name            ', 'data_type           ', 'comment             ')
('', None, None)
('year', 'string', '')
('month', 'string', '')
('day', 'string', '')

हम दैनिक आधार पर डेटा प्राप्त करते हैं जिसे हम गतिशील रूप से विभाजन में शामिल करते हैं जो वर्ष, महीने और दिन होते हैं। इसलिए यदि स्रोत पक्ष के डेटा को बदलना है जहां वे एक नया कॉलम जोड़ते हैं और बैच फ़ाइल भेजते हैं, तो हम डेटा को कैसे अंतर्ग्रहण कर सकते हैं। मुझे पता है कि एवरो में यह क्षमता है लेकिन पुनर्विक्रय को कम करने के लिए इसे लकड़ी के प्रारूप में कैसे प्राप्त किया जा सकता है?

यदि एवरो प्रक्रिया क्या है?

0
Andy Reddy 19 अप्रैल 2017, 00:43

1 उत्तर

सबसे बढ़िया उत्तर

आप जो खोज रहे हैं वह स्कीमा विकास है, यह हाइव द्वारा एवरो की तुलना में कुछ सीमाओं के साथ समर्थित है।

लकड़ी की छत प्रारूप में स्कीमा विकास

1
Community 23 मई 2017, 13:31