import pandas as pd
sonaliigid=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/sonaliikide_lyhendid.txt");
sonad=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/lambipirn_sonad_lemmad_sonaliigid.txt")
dfkogused=pd.DataFrame(sonad.groupby("postags").postags.count())
dfkogused["liik"]=dfkogused.index
lampkoos=sonaliigid.merge(dfkogused, left_on="liigilyhend", right_on="liik", how="left").fillna(0)
lampkoos["postags"]=100*lampkoos["postags"]/len(sonad.index) #iga liigi esinemise protsent

sonad=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/kunglarahvas_sonad_lemmad_sonaliigid.txt")
dfkogused=pd.DataFrame(sonad.groupby("postags").postags.count())
dfkogused["liik"]=dfkogused.index
kunglakoos=sonaliigid.merge(dfkogused, left_on="liigilyhend", right_on="liik", how="left").fillna(0)
kunglakoos["postags"]=100*kunglakoos["postags"]/len(sonad.index) #iga liigi esinemise protsent

molemad=lampkoos[["liigilyhend", "postags"]].merge(kunglakoos[["liigilyhend","postags"]], 
   left_on="liigilyhend", right_on="liigilyhend")
print(molemad)
print("Jutus rohkem");
print(molemad[molemad.postags_x>molemad.postags_y])

#Kuvage, milliseid sõnaliike on laulus rohkem
print("Laulus rohkem");
print(molemad[molemad.postags_x<molemad.postags_y])

molemad.T.to_csv("vastus4.txt")  #.T (transform) vahetab read ja veerud