मैं यहां लेकिन उन्हें खोजने के लिए संघर्ष कर रहा हूं। क्या किसी को उस पृष्ठ से इन कड़ियों को खींचने का आसान तरीका पता है?

पॉपअप से उन लिंक के उदाहरण हैं:

फिर मैं उन लिंक पर तालिकाओं को pandas dataframe में बदलने के लिए bs4 का उपयोग करना चाहता हूं और उन्हें एक csv फ़ाइल में निर्यात करना चाहता हूं।

2
Funkeh-Monkeh 18 पद 2020, 20:56
मैं वास्तव में आपका प्रश्न नहीं समझ रहा हूँ। आप वास्तव में क्या स्क्रैप करना चाहते हैं? आपने कई लिंक प्रदान किए हैं। उन लिंक्स से जिन्हें आप स्क्रैप करना चाहते हैं Location, Address..?
 – 
MendelG
18 पद 2020, 21:25
वे एकाधिक लिंक यहां आपूर्ति श्रृंखला मानचित्र में मानचित्र में पॉपअप में दिखाई देते हैं - musimmas.com/sustainability/ ट्रेसबिलिटी इसलिए मैं पहले उन लिंक्स को और फिर उन लिंक्स में मौजूद टेबल्स को स्क्रैप करना चाहता हूं। लेकिन मेरी समस्या अभी सबसे पहले उन लिंक को उस एम्बेडेड Google मानचित्र से प्राप्त करने का प्रयास कर रही है।
 – 
Funkeh-Monkeh
18 पद 2020, 21:27

1 उत्तर

सबसे बढ़िया उत्तर

डेटा को JSON प्रारूप में GET अनुरोध भेजकर लोड किया जाता है

https://www.musimmas.com/presence/icof/

आप केवल requests मॉड्यूल के साथ डेटा निकाल सकते हैं, BeautifulSoup की कोई आवश्यकता नहीं है

import requests


headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36",
    "referer": "https://www.musimmas.com/sustainability/traceability/",
}

response = requests.get(
    "https://www.musimmas.com/presence/icof/", headers=headers,
).json()

# To get all links try the following
for data in response:
    if data["reports"]:
        reports = data["reports"]
        for links in reports:
            print(links["link"])
        print("-" * 20)

आंशिक आउटपुट:

https://www.musimmas.com/report/musim-mastika-oils-fats-johor-malaysia-july-september-2020/
/report/musim-mastika-oils-fats-johor-malaysia-april-june-2020/
/report/musim-mastika-oil-fats-johor-malaysia-january-march-2020/
/report/musim-mastika-oil-fats-johor-malaysia-october-december-2019/
/report/musim-mastika-oil-fats-johor-malaysia-july-september-2019/
--------------------
https://www.musimmas.com/report/musim-mas-pelalawan-riau-july-september-2020/
/report/musim-mas-pelalawan-riau-april-june-2020/
/report/musim-mas-pelalawan-riau-january-march-2020/
/report/musim-mas-pelalawan-riau-october-december-2019/
/report/musim-mas-pelalawan-riau-july-september-2019/
/supply-chain-map/summary-report/musim-mas-pelalawan-riau/period-april-june-2019.html
--------------------
1
MendelG 18 पद 2020, 22:10