from estnltk import Text t=Text("Juku ja Mati tulid kooli") andmed=t.get.word_texts.lemmas.postags.as_dataframe andmed["pikkus"]=list(map(len, andmed.word_texts)) print(andmed) print(andmed.groupby(["postags"]).postags.count()) #Leidke sõnade keskmine pikkus sõnaliikide kaupa print(andmed.groupby(["postags"]).pikkus.mean()) t2=Text(open("../javakys.txt", encoding="utf-8").read()) andmed=t2.get.word_texts.lemmas.postags.as_dataframe andmed["pikkus"]=list(map(len, andmed.word_texts)) print(andmed.groupby(["postags"]).postags.count()) print(andmed.groupby(["postags"]).pikkus.mean()) print(andmed.groupby(["postags"]).pikkus.std()) #Kuvage nimisõnade (S) pikkuse jaotumise histogramm ning karpdiagramm import matplotlib matplotlib.use('Agg') andmed[andmed.postags=="S"].pikkus.hist().get_figure().savefig("pikkusedhist.jpg") andmed[andmed.postags=="S"].boxplot(column="pikkus").get_figure().savefig("pikkusedkarp.jpg")