3+2
import matplotlib
import matplotlib.pyplot as plt
plt.plot([34, 14, 11, 11])
plt.show()
plt.plot([34, 14, 11, 11])
plt.xticks([0, 1, 2, 3], ["nimisõna", "tegusõna", "sidesõna", "lausemärk"])
plt.xlabel("sõnaliik")
plt.ylabel("kogus")
plt.title("Sõnaliikide kogused")
plt.text(1.2, 8, "sidesõnu ja lausemärke on ühepalju")
plt.axis([-0.5, 3.5, 0, 40]) #xmin, xmax, ymin, ymax
plt.grid(True)
plt.show()
plt.bar([0, 1, 2, 3], [34, 14, 11, 11])
plt.xticks([0, 1, 2, 3], ["nimisõna", "tegusõna", "sidesõna", "lausemärk"])
plt.show()
plt.xlabel("sõna")
plt.ylabel("tähtede arv")
plt.title("Sõnade pikkused")
plt.bar([0, 1, 2], [4, 4, 5], color=["green","black", "black"])
plt.xticks([0.5, 1.5, 2.5], ["Juku", "tuli", "kooli"])
plt.show()
import pandas as pd
sagedused=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/kunglarahvas_lambipirn_sonaliigid.txt")
sagedused.head()
sagedused.sort_values(by="kunglarahvas", ascending=False)
sagedused[sagedused.kunglarahvas>10]
sagedused[sagedused.kunglarahvas>10].sort_values(by="lambipirn")
sagedused[(sagedused.kunglarahvas>10) & (sagedused.kunglarahvas<20)]
sagedused["kokku"]=sagedused["kunglarahvas"]+sagedused["lambipirn"]
sagedused
del sagedused["kokku"]
sagedused
levinumad=sagedused.sort_values(by="kunglarahvas", ascending=False).tail(5)
sildid=[levinumad.sõnaliik.values[i] +"("+str(levinumad.kunglarahvas.values[i])+")" for i in range(5)]
plt.pie(levinumad.kunglarahvas, labels=sildid)
plt.show()
sagedused.kunglarahvas.hist()
plt.show()
sagedused=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/kunglarahvas_lambipirn_sonaliigid.txt")
sagedused.index=sagedused.sõnaliik
sagedused.sort_values(by="lambipirn")[["lambipirn","kunglarahvas"]].plot(kind="barh", stacked=True)
plt.show()
import math
sagedused=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/kunglarahvas_lambipirn_sonaliigid.txt")
keskmised=sagedused.mean()
standardvead=sagedused.std()/math.sqrt(len(sagedused))
keskmised.plot(kind="bar", yerr=standardvead,
title="Sõnaliikide esinemissageduse keskmine ja standardviga")
plt.show()
sonapikkused=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/kunglarahvas_lambipirn_pikkused_haalikud.txt")
keskmine=sonapikkused.groupby("lugu")[["sonapikkus"]].mean()
print(keskmine)
keskmine.plot(kind="bar")
plt.show()
from azureml import Workspace
ws = Workspace(
workspace_id='66e373b2084d4ffa9395c0e34ce9ccaa',
authorization_token='cprxdZKIidoX3epYhzeOCrJNt8aBY3QQZlCPi3nqD40fwbjmYuBbeem5UDWEBynF+gmpkOoGScgPwne0FzX4yA==',
endpoint='https://studioapi.azureml.net'
)
ds = ws.datasets['Automobile price data (Raw)']
frame = ds.to_dataframe()
frame.head()
varvid=["red" if n=="four" else "green" for n in frame["num-of-cylinders"].values]
frame.plot(kind="scatter", x="curb-weight", y="city-mpg", c=varvid)
plt.show()
Arvutage Miles Per Gallon ümber kütusekulu liitriteks 100 km kohta Koostage MPG histogramm Koostage kütusekulu liitrite histogramm Koostage kütusekulu liitrite karpdiagramm Koostage kütusekulu liitrite karpdiagramm silindrite arvu kaupa
frame["ltr100km"]=100/(frame["highway-mpg"]*1.6/3.8)
#frame[["highway-mpg", "ltr100km"]].head()
plt.clf()
frame["ltr100km"].hist()
#frame.boxplot(column="highway-mpg")
#frame.boxplot(column="ltr100km")
plt.show()
from azureml import Workspace
ws = Workspace(
workspace_id='66e373b2084d4ffa9395c0e34ce9ccaa',
authorization_token='cprxdZKIidoX3epYhzeOCrJNt8aBY3QQZlCPi3nqD40fwbjmYuBbeem5UDWEBynF+gmpkOoGScgPwne0FzX4yA==',
endpoint='https://studioapi.azureml.net'
)
experiment = ws.experiments['66e373b2084d4ffa9395c0e34ce9ccaa.f-id.e01ee3ee15eb475cab785a10b87db1d1']
ds = experiment.get_intermediate_dataset(
node_id='bcb7bc3e-8dd0-40a8-aaae-2396e893716d-804',
port_name='Results dataset',
data_type_id='GenericCSV'
)
frame2 = ds.to_dataframe()
frame2
plt.scatter(frame["city-mpg"], frame["curb-weight"])
plt.scatter(frame2["Scored Labels"], frame2["curb-weight"], color="red")
plt.show()
Kuvage joonisel bensiini- ja diisliautod erinevalt Ennustage kummagi jaoks kütusekulu mitme massi juures Kuvage andmed koos ennustustega joonisele
plt.scatter(frame["city-mpg"], frame["curb-weight"],
color=['red' if t=="diesel" else 'green' for t in frame["fuel-type"].values])
plt.scatter(frame2["Scored Labels"], frame2["curb-weight"],
s=[10 if t=="diesel" else 5 for t in frame2["fuel-type"].values])
plt.show()