import stanza import sys nlp=stanza.Pipeline(lang='et', processors="tokenize, pos") fnimi="A2_arenduskorpus.txt" if len(sys.argv)==2: fnimi=sys.argv[1] sisendfail="tekstid/"+fnimi try: koht=int(open("koht.txt").read().strip()) except: koht=0 valjund_sonaliigid="sonaliigid/"+fnimi f1=open(sisendfail, "r", encoding="utf-8") f3=open(valjund_sonaliigid, "a", encoding="utf-8") for nr in range(koht): f1.readline() rida=f1.readline() while rida: t=nlp(rida) sonad=[sona for lause in t.sentences for sona in lause.words] sliigid="".join([sona.xpos for sona in sonad]) print("^"+sliigid+"$", file=f3) f3.flush() koht+=1 with open("koht.txt", "w") as f4: print(koht, file=f4) print(koht) rida=f1.readline()