isikud=read.table("d:/jaagup/xmldigi/masinope/isikud.txt", header=TRUE, sep=",") plot(isikud$kehamass, isikud$juuksepikkus, col=isikud$sugu) plot(isikud$kehamass, isikud$kehapikkus, col=isikud$sugu) plot(isikud$juuksepikkus, isikud$kehapikkus, col=isikud$sugu) tundmatud=read.table("d:/jaagup/xmldigi/masinope/tundmatud.txt", header=TRUE, sep=",") plot(isikud$juuksepikkus, isikud$kehapikkus, col=isikud$sugu) points(tundmatud$juuksepikkus, tundmatud$kehapikkus, col="blue") library(class) vastus=knn(isikud[, 1:3], tundmatud[, 1:3], isikud$sugu, k=3) vastus a2=read.table("d:/jaagup/xmldigi/masinope/keel/a2.txt", header=TRUE, sep="\t", encoding = "UTF8") head(a2) library(stringr) lause="Juku tuli kooli " str_length(lause) nchar(lause) str_sub(lause, 3, 4) lause str_trim(lause) str_c(lause, "kell kaheksa", " ", "hommikul") str_to_lower(lause) str_sort(c("Kati", "Juku", "Mati")) str_replace(lause, "Juku", "Madis") str_split(lause, " ")[[1]] str_split(lause, " ")[[1]][2] str_count(lause, "u") str_count(lause, "Juku") #Sõnast kindla pikkusega lõikude leidmine sona="kapsasupp" sonapikkus=str_length(sona) loigupikkus=3 sapply(1:(sonapikkus+1-loigupikkus), function(alguskoht){str_sub(sona, alguskoht, alguskoht+loigupikkus-1)}) jupid <- function(sona, loigupikkus){ sona=str_to_lower(sona) sonapikkus=str_length(sona) sapply(1:(sonapikkus+1-loigupikkus), function(alguskoht){ str_sub(sona, alguskoht, alguskoht+loigupikkus-1)}) } jupid("Kaalikas", 2) lausejupid <- function(lause, loigupikkus){ sonad=str_split(str_to_lower(lause), "[^a-zõäöü]" )[[1]] #tükeldab mittetähtede kohalt sonad=sonad[str_length(sonad)>0] #eemaldab tühjad lõigud vastus=c() for(sona in sonad){ vastus=c(vastus, jupid(sona, loigupikkus)) } vastus } lausejupid("Juku tuli kooli, kott! oli käes", 2) j1=lausejupid("Juku tuli kooli, kott! oli käes", 2) t1=as.data.frame(table(j1)) t1[order(-t1$Freq),] #Sageduste järgi kahanevas järjekorras library(readr) read_file("d:/jaagup/xmldigi/masinope/keel/juhenddigi.txt") lausejupid(read_file("d:/jaagup/xmldigi/masinope/keel/juhenddigi.txt"), 2) table(lausejupid(read_file("d:/jaagup/xmldigi/masinope/keel/juhenddigi.txt"), 2)) failisagedused<-function(fnimi, loigupikkus){ tabel=as.data.frame(table(lausejupid(read_file(fnimi), loigupikkus))) tabel[order(-tabel$Freq), ] } sagedused=failisagedused("d:/jaagup/xmldigi/masinope/keel/juhenddigi.txt", 2) sagedused