तो अभी मैं .docx फ़ाइल के संग्रह में स्थित "document.xml" फ़ाइल को पार्स करने के लिए जावा में SAX पार्सर का उपयोग कर रहा हूं। मैं जो पार्स करने की कोशिश कर रहा हूं उसका एक नमूना नीचे दिया गया है ...

नमूना XML दस्तावेज़

<w:pStyle w:val="Heading2" /> 
  </w:pPr>
  <w:bookmarkStart w:id="0" w:name="_Toc258435889" /> 
  <w:bookmarkStart w:id="1" w:name="_Toc259085121" /> 
  <w:bookmarkStart w:id="2" w:name="_Toc259261685" /> 
- <w:r w:rsidRPr="00415FD6">
  <w:t>Text To Extract</w:t> 
  </w:r>
  <w:bookmarkEnd w:id="0" /> 
  <w:bookmarkEnd w:id="1" /> 
  <w:bookmarkEnd w:id="2" /> 

अभी, मुझे पता है कि विशेषता मान कैसे निकालना है, यह कठिन नहीं है। हालांकि, मुझे नहीं पता कि नोड्स के भीतर वास्तविक टेक्स्ट को कैसे प्राप्त किया जाए और कैसे पार्स किया जाए। क्या किसी के पास इसके साथ कोई विचार या पूर्व अनुभव है? पहले ही, आपका बहुत धन्यवाद।

1
This 0ne Pr0grammer 5 जुलाई 2011, 23:28

1 उत्तर

वर्ण देखें () ContentHandler विधि। जावाडोक को ध्यान से पढ़ें - जब आप केवल एक की अपेक्षा कर सकते हैं तो आप एकाधिक कॉल प्राप्त कर सकते हैं।

2
Ed Staub 5 जुलाई 2011, 23:39