import pandas as pd sonaliigid=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/sonaliikide_lyhendid.txt"); sonad=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/lambipirn_sonad_lemmad_sonaliigid.txt") dfkogused=pd.DataFrame(sonad.groupby("postags").postags.count()) dfkogused["liik"]=dfkogused.index lampkoos=sonaliigid.merge(dfkogused, left_on="liigilyhend", right_on="liik", how="left").fillna(0) lampkoos["postags"]=100*lampkoos["postags"]/len(sonad.index) #iga liigi esinemise protsent sonad=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/kunglarahvas_sonad_lemmad_sonaliigid.txt") dfkogused=pd.DataFrame(sonad.groupby("postags").postags.count()) dfkogused["liik"]=dfkogused.index kunglakoos=sonaliigid.merge(dfkogused, left_on="liigilyhend", right_on="liik", how="left").fillna(0) kunglakoos["postags"]=100*kunglakoos["postags"]/len(sonad.index) #iga liigi esinemise protsent molemad=lampkoos[["liigilyhend", "postags"]].merge(kunglakoos[["liigilyhend","postags"]], left_on="liigilyhend", right_on="liigilyhend") print(molemad) print("Jutus rohkem"); print(molemad[molemad.postags_x>molemad.postags_y]) #Kuvage, milliseid sõnaliike on laulus rohkem print("Laulus rohkem"); print(molemad[molemad.postags_x