Vefdagbók
Myndaalbúm
Kveðjur frá gestum
Deila á Facebook
Deila á Twitter
Ingi Gauti Ragnarsson
Ingi Gauti Ragnarsson

Lucene stop orð fyrir íslensku

Hérna er listi af orðum sem ég notaði sem stop orð fyrir Lucene(icelandic stop words), ég fór aldrei lengran en þetta, bjó ekki til íslenskan Stemmer.

"og", "að", "eða", "það", "var", "í", "við", "á", "þar", "er", "um", "til", "þetta", "sv", "ég", "br", "sem", "með", "en", "fyrir", "svo", "bara", "mér", "af", "hvað", "þá","því", "eru", "svona", "þú", "vera", "ef", "hann", "hún", "þegar", "mig", "upp", "eftir", "alveg", "þið", "finnst", "hjá", "nú", "líka", "sé", "hef", "já", "eins", "verið", "fara", "allt", "út", "ykkur", "alltaf", "gera", "þér", "einhver", "hafa", "veit", "mín", "hvernig", "búin", "mikið", "væri", "hefur", "sér", "hér", "vel", "frá", "a", "fá", "inn", "úr", "sig", "held", "href", "blank", "http","target", "kv", "qout", "þau", "eitthvað", "sko", "fór", "þeir", "þær", "..."

Listinn kemur úr algengustu orðunum sem voru í indexinum hjá mér fyrir umræðuna ábland.is 

Þetta voru orð sem mér fannst ekki eiga við og fann að listinn virkaði ágætlega. Það er síðan hægt að taka þetta lengra með því að notaordid.isog mappa öll orð t.d. til að finna beygingar.

1 | 11.7.2011 17:06:02 #