Petter Reinholdtsen

Endelig norsk stavekontroll med støtte for ord med bindestrek
26th December 2008

Etter flere års mislykkede forsøk på å skrive om byggesystemet for den norske stavekontrollen for bokmål og nynorsk til å ikke bruke bindestrek som ordskillemarkør, lyktes jeg endelig første juledag. Bruken av bindestrek som ordskillemarkør har gjort det umulig å få med ord med bindestrek i stavekontrolldatagrunnlaget, slik at ord som e-post og CD-spiller ikke kunne godtas av stavekontrollen. Hadde litt tid til overs å bruke på stavekontrollen, og satte meg ned med to kopier av byggsystemet og en liten testdatafil, og byttet ut - med = på utvalgte steder i byggsystemet og datafilen helt til jeg fikk samme resultat med det gamle og det nye byggsystemet. Dette tror jeg var forsøk 4, der de foregående har feilet uten at jeg klarte å forstå hvorfor. Det sier kanskje litt om kompleksiteten i det originale byggsystemet som Rune Kleveland laget i sin tid.

Etter å ha endret byggsystemet, var neste steg å importere ordene med bindestrek. Vi har en rekke slike i databasene for bokmål og nynorsk for korrektur av datagrunnlaget for stavekontrollen, og etter importen skulle nå 10350 nye ord bli godkjent som korrekt stavede ord av stavekontrollen.

Tags: debian edu, norsk, stavekontroll.

Created by Chronicle v4.6