from estnltk import Text import matplotlib matplotlib.use("Agg") #t = Text("Martin ja Martt tulid kooli") #andmed = t.get.word_texts.lemmas.postags.as_dataframe #andmed["pikkus"] = list(map(len, andmed.word_texts)) #print(andmed) #print("----------------------") #print(andmed.groupby(["postags"]).postags.count()) #print("----------------------") #print(andmed.groupby(["postags"]).pikkus.mean()) #print("----------------------") t2 = Text(open("../javakys.txt", encoding="utf-8").read()) andmed = t2.get.word_texts.lemmas.postags.as_dataframe andmed["pikkus"] = list(map(len, andmed.word_texts)) #print(andmed.groupby(["postags"]).postags.count()) #print("----------------------") #print(andmed.groupby(["postags"]).pikkus.mean()) #print("----------------------") #print(andmed.groupby(["postags"]).pikkus.std()) #print("----------------------") andmed[andmed.postags == "S"].pikkus.hist().get_figure().savefig("joonis1.png") andmed[andmed.postags == "S"].boxplot(column="pikkus").get_figure().savefig("joonis3.png")