library(tidyverse) kohad=read_csv("http://minitorn.tlu.ee/~jaagup/kool/java/kursused/22/andmeanalyysi_lahendused_r_keeles/naited/1021/andmed/kohad.txt") kohad %>% ggplot(aes(pikkuskraad, laiuskraad, label=kohanimi))+geom_text() kohad_tekstid=read_csv("http://minitorn.tlu.ee/~jaagup/kool/java/kursused/22/andmeanalyysi_lahendused_r_keeles/naited/1021/andmed/kohad_tekstid.txt", c("koht", "tekst")) tekstidkohtadega=kohad_tekstid %>% inner_join(kohad, by=c("koht"="kohanimi")) tekstidkohtadega %>% ggplot(aes(laiuskraad, pikkuskraad, label=tekst))+geom_text() tekstidkohtadega %>% mutate(laiuskraad2=laiuskraad+runif(n(), -0.2, 0.2)) %>% ggplot(aes(pikkuskraad, laiuskraad2, label=tekst))+geom_text() tekstidkohtadega %>% mutate(laiuskraad2=laiuskraad+runif(n(), -0.1, 0.1)) %>% ggplot(aes(pikkuskraad, laiuskraad2, label=tekst))+ geom_text() + geom_text(data=kohad, aes(pikkuskraad, laiuskraad, label=kohanimi), color="red") tekstidk2=tekstidkohtadega %>% mutate(laiuskraad2=laiuskraad+runif(n(), -0.1, 0.1)) kohad %>% ggplot(aes(pikkuskraad, laiuskraad, label=kohanimi))+ geom_text(color="red", size=2)+ geom_text(data=tekstidk2, aes(pikkuskraad, laiuskraad2, label=tekst)) tkesk=tekstidkohtadega %>% group_by(tekst) %>% summarise(kp=mean(pikkuskraad), kl=mean(laiuskraad)) kohad %>% ggplot(aes(pikkuskraad, laiuskraad, label=kohanimi))+ geom_text(color="red", size=2)+ geom_text(data=tkesk, aes(kp, kl, label=tekst)) joonteandmed=tekstidkohtadega %>% inner_join(tkesk, by="tekst") kohad %>% ggplot(aes(pikkuskraad, laiuskraad ))+ geom_segment(data=joonteandmed, aes(kp, kl, xend=pikkuskraad, yend=laiuskraad), color="gray")+ geom_text(aes(label=kohanimi), color="red", size=2)+ geom_text(data=tkesk, aes(kp, kl, label=tekst)) kohad %>% ggplot(aes(pikkuskraad, laiuskraad ))+ geom_segment(data=joonteandmed %>% filter(tekst!="tl1"), aes(kp, kl, xend=pikkuskraad, yend=laiuskraad), color="gray")+ geom_text(aes(label=kohanimi), color="red", size=2)+ geom_text(data=tkesk, aes(kp, kl, label=tekst)) tekstidkohtadega %>% group_by(koht) %>% summarise(kogus=n()) kohadsuurusega=tekstidkohtadega %>% group_by(koht, laiuskraad, pikkuskraad) %>% summarise(kogus=n()) kohadsuurusega %>% ggplot()+ geom_text(aes(pikkuskraad, laiuskraad, label=koht, size=kogus), show.legend = FALSE, color="yellow")+ geom_segment(data=joonteandmed, aes(kp, kl, xend=pikkuskraad, yend=laiuskraad), color="gray")+ geom_text(data=tkesk, aes(kp, kl, label=tekst)) tkesk=tekstidkohtadega %>% group_by(tekst) %>% summarise(kp=mean(pikkuskraad), kl=mean(laiuskraad), kohtadearv=n()) kohadsuurusega %>% ggplot()+ geom_text(aes(pikkuskraad, laiuskraad, label=koht, size=kogus+1), show.legend = FALSE, color="yellow")+ geom_segment(data=joonteandmed, aes(kp, kl, xend=pikkuskraad, yend=laiuskraad), color="gray")+ geom_text(data=tkesk, aes(kp, kl, label=tekst, size=sqrt(kohtadearv)), show.legend = FALSE)+ annotate("text", 25, 59, label=" ", size=1)+ ggtitle("Tekstide kujutletavad asukohad") kohad_tekstid %>% group_by(koht, tekst) %>% mutate(kogus=n()) %>% ungroup() %>% spread(koht, kogus, fill=0) tekstid=read_csv("http://www.tlu.ee/~jaagup/andmed/keel/korpus/docnumbers.txt") xy=tekstid %>% select(-code) %>% head(100) %>% scale() %>% dist() %>% cmdscale(2) %>% as_tibble() xy %>% ggplot(aes(V1, V2))+ geom_point()