मुझे जावा वर्डकाउंट की तरह जावाआरडीडी का उपयोग करके जावा स्पार्क में एक अक्षर गणना कार्यक्रम बनाना है। लेकिन मुझे नहीं पता कि पैराग्राफ में प्रत्येक अक्षर की घटना को अलग/गणना करने के लिए विभाजन की स्थिति का उपयोग कैसे किया जाएगा। कृपया जावा स्पार्क में एक कामकाजी उदाहरण के साथ मेरी मदद करें अग्रिम धन्यवाद। मेरे javawordcount के लिए कार्य कोड नीचे दिया गया है ...

 JavaRDD<String> wordsFromFile = inputFile.flatMap(content -> Arrays.asList(content.split(" ")));

        JavaPairRDD countData = wordsFromFile.mapToPair(t -> new Tuple2(t, 1)).reduceByKey((x, y) -> (int) x + (int) y);

//The above condition is used for word count
-1
Python-Baby 19 जून 2019, 13:56

1 उत्तर

सबसे बढ़िया उत्तर

वर्ण गणना के लिए हम content.split("") का उपयोग कर सकते हैं

 JavaRDD<String> wordsFromFile = inputFile.flatMap(content -> Arrays.asList(content.split("")));

यह सामग्री में होने वाले प्रत्येक वर्ण की गिनती प्रदान करेगा, यदि आप केवल अक्षर (अक्षर) चाहते हैं तो फ़िल्टर का उपयोग करें।

1
rogue_leader 19 जून 2019, 11:30