vormid=scan("sonavorm2.txt", what=character(), encoding = "UTF-8"); vormid=vormid[1:1000] sonad=scan("tekstsonad.txt", what=character(), encoding = "UTF-8"); vastussona=vector(mode="character", length(sonad)) muutsona=vector(mode="character", length(sonad)) lisasona=vector(mode="character", length(sonad)) kustutussona=vector(mode="character", length(sonad)) kokkusona=vector(mode="character", length(sonad)) muutkogus=vector(mode="numeric", length(sonad)) lisakogus=vector(mode="numeric", length(sonad)) kustutuskogus=vector(mode="numeric", length(sonad)) kokkukogus=vector(mode="numeric", length(sonad)) for(koht in 1:length(sonad)){ #for(koht in 1:10){ sona=tolower(sonad[koht]) print(sona) v=adist(vormid, sona) sarnased=vormid[v[, 1]==1] v=adist(vormid, sona, costs=list(insertions=5, deletions=5, substitutions=1)) sarnased=vormid[v[, 1]==1] muutsona[koht]=paste0(sarnased, sep=" ", collapse="") muutkogus[koht]=length(sarnased) v=adist(vormid, sona, costs=list(insertions=1, deletions=5, substitutions=5)) sarnased=vormid[v[, 1]==1] lisasona[koht]=paste0(sarnased, sep=" ", collapse="") lisakogus[koht]=length(sarnased) v=adist(vormid, sona, costs=list(insertions=5, deletions=1, substitutions=5)) sarnased=vormid[v[, 1]==1] kustutussona[koht]=paste0(sarnased, sep=" ", collapse="") kustutuskogus[koht]=length(sarnased) v=adist(vormid, sona, costs=list(insertions=1, deletions=1, substitutions=1)) sarnased=vormid[v[, 1]==1] kokkusona[koht]=paste0(sarnased, sep=" ", collapse="") kokkukogus[koht]=length(sarnased) #print(muutsona[koht]) } tulemus=data.frame(sona=sonad, muutkogus=muutkogus, muutsona=muutsona, lisakogus=lisakogus, lisasona=lisasona, kustutuskogus=kustutuskogus, kustutussona=kustutussona, kokkukogus=kokkukogus, kokkusona=kokkusona) write.table(tulemus, "sarnased2.csv", sep=";", row.names=FALSE, quote=FALSE)