मेरे पास संदेश कॉलम वाला एक सीएसवी है और इसमें निम्न टेक्स्ट है:

muchloveandhugs                                  
dudeseriously                                    
onemorepersonforthewin                           
havefreebiewoohoothankgod                        
thisismybestcategory                             
yupbabe                                          
didfreebee                                       
heykidforget                                     
hecomplainsaboutit                               

मुझे पता है कि nltk.corpus.words में समझदार शब्दों का एक समूह है। मेरी समस्या यह है कि मैं इसे df['msg'] कॉलम पर कैसे पुनरावृत्त करूं ताकि मुझे ऐसे शब्द मिल सकें

df[‘msg’]
much love and hugs
dude seriously
one more person for the win
0
Questions 15 अक्टूबर 2018, 17:35

1 उत्तर

सबसे बढ़िया उत्तर

स्ट्रिंग्स में शब्दों को विभाजित करने के बारे में इस प्रश्न से बिना रिक्त स्थान के और यह नहीं जानते कि आपका डेटा कैसा दिखता है:

import pandas as pd
import wordninja

filename = 'mycsv.csv' # Put your filename here

df = pd.read_csv(filename)
for wordstring in df['msg']:
    split = wordninja.split(wordstring)
    # Do something with split
2
Stephen Cowley 15 अक्टूबर 2018, 15:06