SwePhones ordlista fungerar dåligt

SwePhones ordlista fungerar rent spontant ganska dåligt. Man får inte så bra förslag på ord (förslagen är ofta felaktiga) och att skriva går segt.

Tyvärr verkar skaparen av SwePhones ordlista inte supporta det han gjort. Det finns inte någon information om hur urvalet av ord gått till eller liknande.

Jag bestämmer mig för att kika närmare på SwePhones ordlista. Det här kommer jag fram till:

SwePhones ordlista består av tre filer, ”sv_SE-stems.dat”, ”sv_SE-unigrams.dat” och ”sv_SE-unigrams.idx”. Dessa filer ligger i katalogen /System/Library/KeyboardDictionaries/ på iPhone.

Ordlistan ligger i filen sv_SE-unigrams.dat.
kia@hej:~$ wc -l *-unigrams.dat.txt
74032 en_US-unigrams.dat.txt
228549 sv_SE-unigrams.dat.txt

Som synes innehåller den svenska ordlistan mer än tre gånger så många ord som den engelska. Det är förmodligen därför det går så långsamt.

Till skillnad från alla andra språk på iPhone så saknas det två filer, ”sv_SE-one-letter-words.dat” och ”sv_SE-two-letter-words.dat”.

Med iPhoneshops hjälp läser jag ut listan över alla ord från sv_SE-unigrams.dat. Här är en delmängd av orden som börjar på bokstaven a:

abbilsvägen true 50
abboremålavägen true 50
abborhult true 50
abborrakull true 50
abborrängen true 50
abborrar true 50
abborrarna true 50
abborraslätt true 50
abborrberg true 50
abborrberget true 50
abborrbo true 50
abborre true 50

Den första kolumnen är själva ordet. Den andra kolumnens betydelse vet jag inte. Den tredje kolumnen är ordets relevans.

En snabb titt säger mig x saker

  • Av orden ovan är det endast ett ord som jag känner till – aborre. De andra orden kommer jag aldrig någonsin att använda
  • Den andra kolumnen har alltid värde ”true”
  • Den tredje kolumnen har alltid värde ”50”. Det innebär alltså att alla ord har samma relevans.

Min slutsats: SwePhones ordlista verkar inte vara så genomtänkt.

Andra bloggar om: , , , , , , , , ,

Ett svar to “SwePhones ordlista fungerar dåligt”

  1. Saker att förbättra « Svensk ordlista till iPhone Says:

    […] min ordlista saknar de två filerna som alla andra befintliga språk har. Jag skrev om detta i ett tidigare inlägg. Hur relevanta filerna är för hur bra ordlistan fungerar vet jag fortfarande […]


Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s

%d bloggare gillar detta: