मैं विकिपीडिया से फिल्मोग्राफी प्राप्त करने की कोशिश कर रहा हूं। उस कठपुतली, मैं निरीक्षण तत्व से फिल्मोग्राफी अनुभाग का चयन कर रहा हूं और XPath की प्रतिलिपि बना रहा हूं। हालांकि, मुझे कोई फिल्म डेटा नहीं मिल रहा है।


scrapers.js

const puppeteer = require("puppeteer")

    const scrapeProduct = async (url) => {
    const browser = await puppeteer.launch()
    const page = await browser.newPage()
    await page.goto(url)


    const [el] = await page.$x(`//*[@id="mw-content-text"]/div[1]/div[8]/div`)
    console.log("el=>", el)

    browser.close()
}


scrapeProduct("https://en.wikipedia.org/wiki/Werner_Herzog")

यहाँ मुझे console.log(el) में क्या मिल रहा है:

https://hastebin.com/usozakisen.yaml

1
htheory226 25 नवम्बर 2020, 14:15

1 उत्तर

सबसे बढ़िया उत्तर

el एक ElementHandle है, सामग्री ही नहीं। आप उस हैंडल का innerText प्राप्त करने का प्रयास कर सकते हैं:

console.log(await el.evaluate(el => el.innerText));
2
hardkoded 25 नवम्बर 2020, 11:21