import pandas as pd lapsed = pd.read_csv("http://www.tlu.ee/~jaagup/andmed/muu/5klass.txt") #print(lapsed.head()) #print(list(lapsed.columns)) #print(lapsed.sort_values(by="eesnimi", ascending=False).head()) #print(lapsed[lapsed.pikkus>163].sort_values(by="mass")) #print(lapsed.pikkus.mean()) #print(lapsed.groupby(["sugu"]).pikkus.mean()) #print(lapsed.groupby(["sugu"])["pikkus","mass"].mean()) #print(lapsed.groupby(["sugu"])["pikkus","mass"].min()) (lapsed.groupby(["sugu"])["pikkus","mass"].min()).to_csv("lapsed2.txt", index=False) lapsed[lapsed.sugu=="n"].sort_values(by="pikkus").to_csv("lapsed3.txt", index=False) lapsed["pikkusm"]=lapsed.pikkus/100.00 print(lapsed.head()) print(lapsed[lapsed.eesnimi.str.find('a')>=0]) import matplotlib matplotlib.use("Agg") lapsed.pikkus.hist().get_figure().savefig("fig.jpg") lapsed[["pikkus","sugu"]].boxplot(by="sugu").get_figure().savefig("joonis2.png")