library(tidyverse) library(RMySQL) yhendus=dbConnect(MySQL(fetch.default.rec = 50000000), user='if17', password='if17', host='greeny.cs.tlu.ee', dbname='if17_film') dbListTables(yhendus) rs=dbSendQuery(yhendus, "SELECT * FROM efis_film"); filmitabel=fetch(rs) dbClearResult(rs) #Kuvage, millisel aastal mitu filmi on tehtud filmitabel %>% group_by(production_year) %>% summarize(filme=n()) %>% arrange(desc(filme)) #Kuvage tabelist efis_film_physical_description tulp amount ridades, #kus classificator_code2 = FILM_PHYSICAL_TYPE_FILM_FILM_DURATION #Püüa arvutada kestus ümber sekunditesse rs=dbSendQuery(yhendus, "SELECT film_id, amount FROM efis_film_physical_description WHERE classificator_code2='FILM_PHYSICAL_TYPE_FILM_FILM_DURATION'"); pikkustetabel=fetch(rs, n=5000000) pikkustetabel pikkustetabel %>% extract(amount, c("minutid", "sekundid"), "([0-9]{2}):([0-9]{2})", remove=FALSE) %>% mutate(kokkusek=as.numeric(minutid)*60+as.numeric(sekundid)) #tutvu greeny andmebaasiga if17_keelekorpus #kuva välja soome emakeelega A2 taseme tekstide bigramide sõnad ja sõnaliikide paarid #nt VS jookseb kooli yhendus=dbConnect(MySQL(fetch.default.rec = 50000000), user='if17', password='if17', host='greeny.cs.tlu.ee', dbname='if17_keelekorpus') rs=dbSendQuery(yhendus, "SELECT ngram2 FROM dokmeta INNER JOIN ngram2 ON dokmeta.kood=ngram2.tekstikood WHERE emakeel='soome' AND keeletase='A2'") ngramid=fetch(rs, n=50000) ngramid dbListConnections(dbDriver(drv="MySQL")) lapply( dbListConnections( dbDriver( drv = "MySQL")), dbDisconnect) rs=dbSendQuery(yhendus, "SELECT ngram2, ngram1.sona AS sona1, n1koopia.sona AS sona2 FROM dokmeta INNER JOIN ngram2 ON dokmeta.kood=ngram2.tekstikood INNER JOIN ngram1 ON ngram1.tekstikood=ngram2.tekstikood AND ngram1.alguskoht=ngram2.alguskoht INNER JOIN ngram1 AS n1koopia ON n1koopia.tekstikood=ngram2.tekstikood AND n1koopia.alguskoht=ngram2.alguskoht+1 WHERE emakeel='soome' AND keeletase='A2'") ngramid=fetch(rs, n=50000) ngramid