जब भी कोई MS Word (या लिब्रे ऑफिस या अन्य वर्ड प्रोसेसर) दस्तावेज़ अपने संबंधित प्रोग्राम में खोला जाता है, तो शब्द सामान्य रूप से पृष्ठ पर दिखाई देते हैं, लेकिन जब दस्तावेज़ को टेक्स्ट एडिटर में खोला जाता है, तो इसमें से अधिकांश यूनिकोड अस्पष्ट होता है।
मैं समझ सकता हूं कि दस्तावेज़ में कुछ ऐसे हिस्से क्यों हो सकते हैं जो पढ़ने योग्य नहीं हैं, जैसे बुलेट पॉइंट या मेटाडेटा, लेकिन कम से कम कुछ सामग्री को प्लेनटेक्स्ट के रूप में संग्रहीत क्यों नहीं किया जाता है? क्या हर अक्षर एन्कोड हो जाता है?
2 जवाब
माइक्रोसॉफ्ट वर्ड का अंतिम प्रारूप डॉक्स एक एक्सएमएल है जिसमें सादा पाठ ज़िप के साथ संकुचित है। आप docx का नाम बदलकर ज़िप करके फ़ाइल को अनज़िप कर सकते हैं और फिर फ़ाइल को नोटपैड से खोल सकते हैं। तो यह आंशिक रूप से केवल संपीड़ित सादा पाठ के रूप में संग्रहीत किया जाता है।
मुझे लगता है कि यह शायद एक ब्रांडिंग चीज है। आप चाहें तो इसे टेक्स्ट फाइल में इम्पोर्ट कर सकते हैं।
यदि आप फ़ाइल> निर्यात> फ़ाइल प्रकार बदलें> सादा पाठ (*.txt) पर जाते हैं, तो आप वहां दस्तावेज़ निर्यात कर सकते हैं।
संबंधित सवाल
नए सवाल
encoding
एनकोडिंग पूर्वनिर्धारित नियमों का एक सेट है जो एक निश्चित प्रतिनिधित्व में सूचना के एक टुकड़े को पूरी तरह से अलग प्रतिनिधित्व में बदल देता है। दूसरे तरीके के राउंड को डिकोडिंग कहा जाता है। यह टैग बल्कि सामान्य है, लेकिन इसका उपयोग मुख्य रूप से आधार 64 और हेक्साडेसिमल जैसे द्विआधारी एन्कोडिंग योजनाओं के लिए किया जाता है।