Lucene stop orð fyrir íslensku
Hérna er listi af orðum sem ég notaði sem stop orð fyrir Lucene(icelandic stop words), ég fór aldrei lengran en þetta, bjó ekki til íslenskan Stemmer.
"og", "að", "eða", "það", "var", "í", "við", "á", "þar", "er", "um", "til", "þetta", "sv", "ég", "br", "sem", "með", "en", "fyrir", "svo", "bara", "mér", "af", "hvað", "þá","því", "eru", "svona", "þú", "vera", "ef", "hann", "hún", "þegar", "mig", "upp", "eftir", "alveg", "þið", "finnst", "hjá", "nú", "líka", "sé", "hef", "já", "eins", "verið", "fara", "allt", "út", "ykkur", "alltaf", "gera", "þér", "einhver", "hafa", "veit", "mín", "hvernig", "búin", "mikið", "væri", "hefur", "sér", "hér", "vel", "frá", "a", "fá", "inn", "úr", "sig", "held", "href", "blank", "http","target", "kv", "qout", "þau", "eitthvað", "sko", "fór", "þeir", "þær", "..."
Listinn kemur úr algengustu orðunum sem voru í indexinum hjá mér fyrir umræðuna ábland.is
Þetta voru orð sem mér fannst ekki eiga við og fann að listinn virkaði ágætlega. Það er síðan hægt að taka þetta lengra með því að notaordid.isog mappa öll orð t.d. til að finna beygingar.





