import pandas as pd lapsed = pd.read_csv("http://www.tlu.ee/~jaagup/andmed/muu/5klass.txt") # print(lapsed.head()) # print(list(lapsed.columns)) # print(lapsed.sort_values(by="pikkus", ascending = False).head()) # print(lapsed[lapsed.pikkus>163].sort_values(by="mass")) # print(list(lapsed.pikkus)) # print(lapsed.pikkus.mean()) # print(lapsed.groupby(["sugu"]).pikkus.mean()) # print(lapsed.groupby(["sugu"])["pikkus", "mass"].mean()) #print(lapsed.groupby(["sugu"])["pikkus", "mass"].min()) #print(lapsed.groupby(["sugu"])["pikkus", "mass"].max()) #lapsed[lapsed.pikkus>163].sort_values(by="mass").to_csv("lapsed2.txt", index=False) #lapsed2 = pd.read_csv("lapsed2.txt") #lapsed[lapsed.sugu=="n"].sort_values(by="pikkus", ascending = False).to_csv("lapsed3.txt") #lapsed["pikkusm"]=lapsed.pikkus/100.0 #print(lapsed.head()) #print(lapsed[lapsed.eesnimi.str.find("a")>=0]) import matplotlib matplotlib.use('Agg') #lapsed.pikkus.hist().get_figure().savefig("joonis1.png") #lapsed[["pikkus", "sugu"]].boxplot(by="sugu").get_figure().savefig("joonis2.png")