from estnltk import Text import pandas as pd #text = Text('Tervitan suurt ja ja värvilist maailma!') text= Text(open("artikkel1.txt", encoding="utf-8").read()) df=text.get.postags.lemmas.word_texts.as_dataframe print(df) print(df.sort_values(by="postags")) #Sorteerige lemma järgi print(df.sort_values(by="lemmas")) print(df.groupby(["postags"]).postags.count()) df["pikkus"]=list(map(len, text.word_texts)) print(df) print(df.groupby(["postags"]).pikkus.max()) print(df.groupby(["postags"]).pikkus.mean()) #Kuvage ka lühim pikkus igast sõnaliigist df.pikkus.hist().get_figure().savefig("joonis1.png") df[["pikkus", "postags"]].boxplot(by="postags").get_figure().savefig("joonis2.png")