A leggyakoribb 500 kínai szó: nyelvtanulás statisztikai alapon?

2/28/2009

A múltkor a Wordle-vel játszadozva ugrott be az az elvetemült ötlet, mi lenne ha egy komplett beszélt nyelvet dobnánk be a gépbe és csinálnánk belőle pofás kis címkefelhőt, vagyis hogy mennyire lehet közel kerülni egy idegen nyelvhez statisztika módszerekkel, mondjuk sorba állítva a szavait gyakorisági alapon. Csak mert a jópofa és csodaszines nyelvkönyvek egészen életidegen feladatokkal tudnak előállni amiben hemzsegnek a felesleges szavak, miközben a bézik szinthez szükséges szókincset meg kispórolják. Persze a hatékonyságra törekvés ilyen matematikai alapú gondolatától minden nyelvész haja szála égnek állna, de amikor beírtam a keresőbe, kiderült hogy a metódus igenis létezik. Az egész komolytalanságától eltekintve érdekes dolog a lefedettség, vagyis a válasz a klasszikus kérdésre, hogy ha neadjisten egy olyan szép nyelvet akar az ember tanulni mint a kínai, akkor mennyi írásjegy ismerete szükséges egy átlagos napilap megértéséhez. Állítólag a leggyakoribb 500 kínai karakter (remélem nemsokára kijavítják a hibát) lefedi a nyelv 72%-át, kérdés persze hogy ez mire elég.
Kíváncsi lennék mit szólnak ehhez a nyelvtanárok, nyelvtanulók, nyelvészek...


Témába vághat még...



3 komment:

Anonymous said...

no letöltöttem valami hasonlot finn szavakkal. majd meglätjuk bejön-e:)
köszi az informäciot.

O'Seamus said...

:) Finnország lett külföld kategóriában a második legnagyobb látogatottság- beszállítóm:) Nézem itt az analizáló oldalamon, ez a Jyvaskyla nem te vagy véletlenül? Éljenek a nemzetközi kapcsolatok!

Anonymous said...

eljenek! :D