from estnltk import Text t = Text("Juku ja Mati tulid kooli") andmed=t.get.word_texts.lemmas.postags.as_dataframe andmed["pikkus"]=list(map(len, andmed.word_texts)) print(andmed) print(andmed.groupby(["postags"]).postags.count()) print(andmed.groupby(["postags"]).pikkus.mean()) t2=Text(open("../javakys.txt", encoding="utf-8").read()) andmed=t2.get.word_texts.lemmas.postags.as_dataframe andmed["pikkus"]=list(map(len, andmed.word_texts)) print(andmed.groupby(["postags"]).postags.count()) print(andmed.groupby(["postags"]).pikkus.mean()) print(andmed.groupby(["postags"]).pikkus.std()) import matplotlib matplotlib.use('Agg') andmed[andmed.postags=="S"].pikkus.hist().get_figure().savefig("joonis3.png") andmed[andmed.postags=="S"].boxplot(column="pikkus").get_figure().savefig("joonis4.png")