from estnltk import Text #t=Text("Juku ja Maali tulid kooli") #andmed = t.get.word_texts.lemmas.postags.as_dataframe #andmed["pikkus"] = list(map(len, andmed.word_texts)) #print(andmed) #print(andmed.groupby(["postags"]).postags.count()) #print(andmed.groupby(["postags"]).pikkus.mean()) t2=Text(open("asd.txt", encoding="utf-8").read()) andmed2 = t2.get.word_texts.lemmas.postags.as_dataframe andmed2["pikkus"] = list(map(len, andmed2.word_texts)) print(andmed2) print(andmed2.groupby(["postags"]).postags.count()) print(andmed2.groupby(["postags"]).pikkus.mean()) print(andmed2.groupby(["postags"]).pikkus.std()) import matplotlib matplotlib.use('Agg') andmed2[andmed2.postags=="S"].pikkus.hist().get_figure().savefig("pikkusedhist.jpg")