In [1]:
3+2
Out[1]:
5
In [2]:
import matplotlib
In [3]:
import matplotlib.pyplot as plt
/home/nbuser/anaconda3_23/lib/python3.4/site-packages/matplotlib/font_manager.py:273: UserWarning: Matplotlib is building the font cache using fc-list. This may take a moment.
  warnings.warn('Matplotlib is building the font cache using fc-list. This may take a moment.')
/home/nbuser/anaconda3_23/lib/python3.4/site-packages/matplotlib/font_manager.py:273: UserWarning: Matplotlib is building the font cache using fc-list. This may take a moment.
  warnings.warn('Matplotlib is building the font cache using fc-list. This may take a moment.')
In [4]:
plt.plot([34, 14, 11, 11])
Out[4]:
[<matplotlib.lines.Line2D at 0x7f705d450e80>]
In [5]:
plt.show()
In [6]:
plt.plot([34, 14, 11, 11])
plt.xticks([0, 1, 2, 3], ["nimisõna", "tegusõna", "sidesõna", "lausemärk"])
plt.xlabel("sõnaliik")
plt.ylabel("kogus")
plt.title("Sõnaliikide kogused")
plt.text(1.2, 8, "sidesõnu ja lausemärke on ühepalju")
plt.axis([-0.5, 3.5, 0, 40]) #xmin, xmax, ymin, ymax
plt.grid(True)
plt.show()
In [7]:
plt.bar([0, 1, 2, 3], [34, 14, 11, 11])
plt.xticks([0, 1, 2, 3], ["nimisõna", "tegusõna", "sidesõna", "lausemärk"])
plt.show()
In [11]:
plt.xlabel("sõna")
plt.ylabel("tähtede arv")
plt.title("Sõnade pikkused")
plt.bar([0, 1, 2], [4, 4, 5], color=["green","black", "black"])
plt.xticks([0.5, 1.5, 2.5], ["Juku", "tuli", "kooli"])
plt.show()
In [12]:
import pandas as pd
In [13]:
sagedused=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/kunglarahvas_lambipirn_sonaliigid.txt")
In [14]:
sagedused.head()
Out[14]:
sõnaliik kunglarahvas lambipirn
0 asesõna 3 51
1 kaassõna 1 21
2 lausemärk 11 113
3 määrsõna 7 86
4 nimisõna 34 185
In [16]:
sagedused.sort_values(by="kunglarahvas", ascending=False)
Out[16]:
sõnaliik kunglarahvas lambipirn
4 nimisõna 34 185
7 tegusõna 14 143
2 lausemärk 11 113
6 sidesõna 11 50
3 määrsõna 7 86
0 asesõna 3 51
5 omadussõna algvõrre 2 31
1 kaassõna 1 21
In [17]:
sagedused[sagedused.kunglarahvas>10]
Out[17]:
sõnaliik kunglarahvas lambipirn
2 lausemärk 11 113
4 nimisõna 34 185
6 sidesõna 11 50
7 tegusõna 14 143
In [18]:
sagedused[sagedused.kunglarahvas>10].sort_values(by="lambipirn")
Out[18]:
sõnaliik kunglarahvas lambipirn
6 sidesõna 11 50
2 lausemärk 11 113
7 tegusõna 14 143
4 nimisõna 34 185
In [21]:
sagedused[(sagedused.kunglarahvas>10) & (sagedused.kunglarahvas<20)]
Out[21]:
sõnaliik kunglarahvas lambipirn
2 lausemärk 11 113
6 sidesõna 11 50
7 tegusõna 14 143
In [22]:
sagedused["kokku"]=sagedused["kunglarahvas"]+sagedused["lambipirn"]
In [23]:
sagedused
Out[23]:
sõnaliik kunglarahvas lambipirn kokku
0 asesõna 3 51 54
1 kaassõna 1 21 22
2 lausemärk 11 113 124
3 määrsõna 7 86 93
4 nimisõna 34 185 219
5 omadussõna algvõrre 2 31 33
6 sidesõna 11 50 61
7 tegusõna 14 143 157
In [24]:
del sagedused["kokku"]
In [25]:
sagedused
Out[25]:
sõnaliik kunglarahvas lambipirn
0 asesõna 3 51
1 kaassõna 1 21
2 lausemärk 11 113
3 määrsõna 7 86
4 nimisõna 34 185
5 omadussõna algvõrre 2 31
6 sidesõna 11 50
7 tegusõna 14 143
In [32]:
levinumad=sagedused.sort_values(by="kunglarahvas", ascending=False).tail(5)
sildid=[levinumad.sõnaliik.values[i] +"("+str(levinumad.kunglarahvas.values[i])+")" for i in range(5)]
plt.pie(levinumad.kunglarahvas, labels=sildid)
plt.show()
In [34]:
sagedused.kunglarahvas.hist()
plt.show()
In [43]:
sagedused=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/kunglarahvas_lambipirn_sonaliigid.txt")
sagedused.index=sagedused.sõnaliik
sagedused.sort_values(by="lambipirn")[["lambipirn","kunglarahvas"]].plot(kind="barh", stacked=True)
plt.show()
In [44]:
import math

sagedused=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/kunglarahvas_lambipirn_sonaliigid.txt")
keskmised=sagedused.mean()
standardvead=sagedused.std()/math.sqrt(len(sagedused))
keskmised.plot(kind="bar", yerr=standardvead, 
  title="Sõnaliikide esinemissageduse keskmine ja standardviga")
plt.show()
In [45]:
sonapikkused=pd.read_csv("http://www.tlu.ee/~jaagup/andmed/keel/kunglarahvas_lambipirn_pikkused_haalikud.txt")
keskmine=sonapikkused.groupby("lugu")[["sonapikkus"]].mean()
print(keskmine)
keskmine.plot(kind="bar")
plt.show()
           sonapikkus
lugu                 
kungla       4.760000
lambipirn    5.889447
In [46]:
from azureml import Workspace
ws = Workspace(
    workspace_id='66e373b2084d4ffa9395c0e34ce9ccaa',
    authorization_token='cprxdZKIidoX3epYhzeOCrJNt8aBY3QQZlCPi3nqD40fwbjmYuBbeem5UDWEBynF+gmpkOoGScgPwne0FzX4yA==',
    endpoint='https://studioapi.azureml.net'
)
ds = ws.datasets['Automobile price data (Raw)']
frame = ds.to_dataframe()
In [47]:
frame.head()
Out[47]:
symboling normalized-losses make fuel-type aspiration num-of-doors body-style drive-wheels engine-location wheel-base ... engine-size fuel-system bore stroke compression-ratio horsepower peak-rpm city-mpg highway-mpg price
0 3 ? alfa-romero gas std two convertible rwd front 88.6 ... 130 mpfi 3.47 2.68 9.0 111 5000 21 27 13495
1 3 ? alfa-romero gas std two convertible rwd front 88.6 ... 130 mpfi 3.47 2.68 9.0 111 5000 21 27 16500
2 1 ? alfa-romero gas std two hatchback rwd front 94.5 ... 152 mpfi 2.68 3.47 9.0 154 5000 19 26 16500
3 2 164 audi gas std four sedan fwd front 99.8 ... 109 mpfi 3.19 3.40 10.0 102 5500 24 30 13950
4 2 164 audi gas std four sedan 4wd front 99.4 ... 136 mpfi 3.19 3.40 8.0 115 5500 18 22 17450

5 rows × 26 columns

In [57]:
varvid=["red" if n=="four" else "green" for n in frame["num-of-cylinders"].values]
frame.plot(kind="scatter", x="curb-weight", y="city-mpg", c=varvid)
plt.show()

Arvutage Miles Per Gallon ümber kütusekulu liitriteks 100 km kohta Koostage MPG histogramm Koostage kütusekulu liitrite histogramm Koostage kütusekulu liitrite karpdiagramm Koostage kütusekulu liitrite karpdiagramm silindrite arvu kaupa

In [67]:
frame["ltr100km"]=100/(frame["highway-mpg"]*1.6/3.8)
#frame[["highway-mpg", "ltr100km"]].head()
plt.clf()
frame["ltr100km"].hist()
#frame.boxplot(column="highway-mpg")
#frame.boxplot(column="ltr100km")
plt.show()
In [78]:
from azureml import Workspace
ws = Workspace(
    workspace_id='66e373b2084d4ffa9395c0e34ce9ccaa',
    authorization_token='cprxdZKIidoX3epYhzeOCrJNt8aBY3QQZlCPi3nqD40fwbjmYuBbeem5UDWEBynF+gmpkOoGScgPwne0FzX4yA==',
    endpoint='https://studioapi.azureml.net'
)
experiment = ws.experiments['66e373b2084d4ffa9395c0e34ce9ccaa.f-id.e01ee3ee15eb475cab785a10b87db1d1']
ds = experiment.get_intermediate_dataset(
    node_id='bcb7bc3e-8dd0-40a8-aaae-2396e893716d-804',
    port_name='Results dataset',
    data_type_id='GenericCSV'
)
frame2 = ds.to_dataframe()
In [79]:
frame2
Out[79]:
curb-weight fuel-type Scored Labels
0 1000 diesel 71.321327
1 2000 diesel 42.645943
2 3000 diesel 28.219551
3 4000 diesel 21.552879
4 1000 gas 59.608261
5 2000 gas 32.286591
6 3000 gas 19.653877
7 4000 gas 14.798308
In [77]:
plt.scatter(frame["city-mpg"], frame["curb-weight"])
plt.scatter(frame2["Scored Labels"], frame2["curb-weight"], color="red")
plt.show()

Kuvage joonisel bensiini- ja diisliautod erinevalt Ennustage kummagi jaoks kütusekulu mitme massi juures Kuvage andmed koos ennustustega joonisele

In [98]:
plt.scatter(frame["city-mpg"], frame["curb-weight"], 
              color=['red' if t=="diesel" else 'green' for t in frame["fuel-type"].values])
plt.scatter(frame2["Scored Labels"], frame2["curb-weight"], 
            s=[10 if t=="diesel" else 5 for t in frame2["fuel-type"].values])
plt.show()