library(tidyverse) regiviisid=read_csv("http://www.tlu.ee/~jaagup/andmed/muu/muusika/regiviisid.txt") viisidmeta=read_csv("http://www.tlu.ee/~jaagup/andmed/muu/muusika/regiviisidmeta.txt") unique(viisidmeta$laululiik) viisidmeta %>% group_by(laululiik) %>% summarise(kogus=n()) %>% arrange(-kogus) %>% print(n=40) nrow(viisidmeta) prop.test(32, 4485) viisidmeta %>% filter(laululiik=="kadri") %>% group_by(viisiKog) %>% summarise(kogus=n()) %>% arrange(-kogus) %>% View() viisidmeta %>% filter(viisiKog=="Viljak, K.") %>% nrow() # 495 # Kadrilaule 8 prop.test(32, 4485, p = 8/495) viisidmeta %>% filter(viisiKog=="Tampere, H.") %>% nrow() prop.test(32, 4485, p = 3/284) #Leidke g-tugiheliga viiside juurest, mitme viisi puhul on esimene noot (P1) g #Leidke prop.test-i abil, milline on üldistatav P1==g usaldusvahemik #Korrake sama vaid Kuusalu kihelkonna viiside juures prop.test(845, 2246, 58/180) prop.test(58, 180, 845/2246) prop.test(58, 180, 845/2246)$conf.int[1] prop.test(58, 180, 845/2246)$conf.int[2] yldarv <- 150 katsetearv <- 20 kunglakogused <- sapply(1:katsetearv, function(x){ sonad %>% sample_n(yldarv) %>% filter(lugu=="kungla") %>% count() %>% .$n }) testivastused <- sapply(kunglakogused, function(kogus){ pt=prop.test(kogus, yldarv) c(x1=pt$conf.int[1], y1=0, x2=pt$conf.int[2], y2=0) }) ggplot() + xlim(0, 0.5) + geom_curve(aes(x=x1, y=y1, xend=x2, yend=y2), data=as_tibble(t(testivastused)))