import pandas as pd sonad=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/lambipirn_sonad_lemmad_sonaliigid.txt") print(sonad.groupby("postags").count()) print(sonad.groupby("postags").postags.count()) print(type(sonad.groupby("postags").postags.count())) dfkogused=pd.DataFrame(sonad.groupby("postags").postags.count()) dfkogused["a"]=dfkogused.index print(list(dfkogused.columns)) dfkogused.columns=["kogus", "nimetus"] #tulpadele uued nimed dfkogused=dfkogused[["nimetus", "kogus"]] #küsin teises järjestuses print(dfkogused) #tulemuseks vaid sõnaliikide andmed, mis mõlemas tabelis olemas sonaliigid=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/sonaliikide_lyhendid.txt"); koos=sonaliigid.merge(dfkogused, left_on="liigilyhend", right_on="nimetus") print(koos) #tulemuseks kõik vasakus (sõnaliikide) tabelis olevad liigid + vasted teisest tabelist kui on koos=sonaliigid.merge(dfkogused, left_on="liigilyhend", right_on="nimetus", how="left") print(koos) print(koos.fillna(0)) #asendab kõik NaN (Not a Number) nullidega koos["kogus"]=koos["kogus"].fillna(0) #muudab ainult ühte tulpa print(koos[["liigilyhend", "kogus"]])