import pandas as pd
sonad=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/lambipirn_sonad_lemmad_sonaliigid.txt")
print(sonad.groupby("postags").count())
print(sonad.groupby("postags").postags.count())
print(type(sonad.groupby("postags").postags.count()))
dfkogused=pd.DataFrame(sonad.groupby("postags").postags.count())
dfkogused["a"]=dfkogused.index
print(list(dfkogused.columns))
dfkogused.columns=["kogus", "nimetus"] #tulpadele uued nimed
dfkogused=dfkogused[["nimetus", "kogus"]]  #küsin teises järjestuses
print(dfkogused)
  #tulemuseks vaid sõnaliikide andmed, mis mõlemas tabelis olemas
sonaliigid=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/sonaliikide_lyhendid.txt");
koos=sonaliigid.merge(dfkogused, left_on="liigilyhend", right_on="nimetus")
print(koos)
  #tulemuseks kõik vasakus (sõnaliikide) tabelis olevad liigid + vasted teisest tabelist kui on
koos=sonaliigid.merge(dfkogused, left_on="liigilyhend", right_on="nimetus", how="left")
print(koos)
print(koos.fillna(0))  #asendab kõik NaN (Not a Number) nullidega
koos["kogus"]=koos["kogus"].fillna(0) #muudab ainult ühte tulpa
print(koos[["liigilyhend", "kogus"]])