अगर हमारे पास वाक्य है = "जॉर्ज y. 1998 में फुटबॉल नहीं खेल सकता था, लेकिन θ. 226 पर फुटबॉल खेलता है", जिसका अक्षर से मेरा मतलब ग्रीक या अंग्रेजी शब्दावली के किसी भी अक्षर से है। क्या आउटपुट के रूप में होने का कोई तरीका है = "जॉर्ज फुटबॉल नहीं खेलता है लेकिन फुटबॉल खेलता है"

मैंने यह कोशिश की, जिसने केवल संख्याओं को हटा दिया

re_numb = re.compile(r'\d+')
sent = re_numb.sub('', sent)
0
user15479632 11 जुलाई 2021, 11:43

1 उत्तर

पायथन में, \w ग्रीक अक्षरों से भी मेल खाता है। तो आप उपयोग कर सकते हैं:

\b\w\. +\d+\b

जहाँ \b एक शब्द सीमा है।

यदि आप नहीं चाहते कि \w का मिलान भी अंडरस्कोर से हो:

\b[^_\W]\. +\d+\b

देखें डेमो

3
horcrux 11 जुलाई 2021, 08:57