ब्यूटीफुल सूप का उपयोग करते हुए, मैंने उक्त पृष्ठ के html दस्तावेज़ से एक वेब पेज पर टिप्पणियों को निकाला है। इस कोड का उपयोग करके मैं टिप्पणियों का प्रिंट आउट लेने में सक्षम हूं:

import urllib2
from bs4 import BeautifulSoup

url = "http://songmeanings.com/songs/view/3530822107858560012/"
response = urllib2.build_opener(urllib2.HTTPCookieProcessor).open(url)
html_doc = response.read()
soup = BeautifulSoup(html_doc, 'html.parser')

def loop_until(text,first_elem):
  try: 
    text += first_elem.string
    if first_elem.next == first_elem.find_next('div'):
        return text
    else:
        return loop_until(text,first_elem.next.next)
  except TypeError:
      pass 
      
wordList = []

for strong_tag in soup.find_all('strong'):
    next_elem = strong_tag.next_sibling
    print loop_until("", next_elem)

अब मुझे उस चयन से सभी शब्द लेने और उन्हें शब्द सूची में जोड़ने की ज़रूरत है, मैं ऐसा करने के बारे में कैसे जाउंगा?

0
Otis Cheng 4 मई 2017, 14:34

1 उत्तर

सबसे बढ़िया उत्तर

अपनी अंतिम पंक्ति बदलें, append का उपयोग करें

wordList.append(loop_until("", next_elem))
1
akash karothiya 4 मई 2017, 14:41