Simulatie van vroege taalontwikkeling

Martin P. Cats & Rik Ruhland

Rijksuniversiteit Groningen

email via: redactie

Terug naar inhoudsopgave

 

Inleiding

In dit artikel tonen wij aan dat met behulp van differentievergelijkingen de kwantitatieve aspecten van vroege taalontwikkeling zijn te simuleren. Hiertoe is een model geconstrueerd dat gebaseerd is op analyses van spontane taaluitingen van één kind. Uit deze analyses blijkt dat een aantal ontwikkelingsstappen (of stadia) te onderscheiden zijn. De wetenschappelijke belangstelling voor de opvatting dat ontwikkeling vaak stapsgewijs verloopt is niet nieuw. Met name dankzij het werk van Piaget (1929) heeft deze zienswijze in de ontwikkelingspsychologie een gewillig wetenschappelijk oor gevonden. Een meer recente uitwerking van deze zienswijze is te vinden in het werk van Kurt Fisher (1993). Ook parametrische modellen uit de linguïstiek (Borer & Wexler 1987) zijn te interpreteren als stapsgewijze benaderingen. Om een dergelijke stapsgewijze ontwikkeling te modelleren biedt een dynamische systeem benadering (Van Geert 1994) goede mogelijkheden. Deze vorm van exploratieve modelbouw is behalve hypothese toetsend ook hypothese genererend. Veelal leidt het exploreren van deze modellen tot nieuwe theoretische gezichtspunten. Wij claimen niet dat het hier gepresenteerde model een uitputtende representatieve beschrijving is van het gehele proces van de vroege taalontwikkeling. Veeleer beschouwen wij dit model als een eerste stap op de weg naar een vergroting van de kennis van dit ontwikkelingsproces. Er zijn alternatieve modellen onderzocht, maar we zijn tot de conclusie gekomen dat deze modellen verworpen moeten worden vanwege een onvoldoende theoretische onderbouwing, meer parameters (waarmee de eis van spaarzaamheid wordt ondergraven) en/of een aanzienlijk slechtere fit op de data.

Een drietal aspecten zijn van belang voor het simuleren van taalontwikkeling. Ten eerste zijn we geïnteresseerd in de processen die ten grondslag liggen aan de vroege taalontwikkeling. Het is daarom noodzakelijk over longitudinale datareeksen, die het proces omvatten, te beschikken. Op deze ruwe gegevens zijn analyses uitgevoerd. Per opnamesessie is bijvoorbeeld het aantal nieuwe woorden vastgesteld. De resultaten van deze analyses vormen de basis voor het model, dat op zijn beurt de basis van de simulaties is.

Ten tweede moet worden opgemerkt dat processen in taalontwikkeling over het algemeen nietlineair zijn. Brown (1973) merkte reeds op dat bijvoorbeeld functiewoorden plotseling (d.w.z., met een sprong) in de taal van kinderen verschijnen. Functiewoorden (FW) vormen samen de gesloten klasse van o.a. voorzetsels en lidwoorden, kortom, die klasse van woorden die niet of zelden uitgebreid wordt, in tegenstelling tot de open klasse van bijvoorbeeld zelfstandige naamwoorden. Ook het onderzoek van Dromi (1986) toont een nietlineaire ontwikkeling van de woordenschat.

In de derde plaats speelt de aanname dat linguïstische processen onderling nauw samenhangen een zeer belangrijke rol. We veronderstellen dat de processen op basis van structurele kenmerken aan elkaar gekoppeld zijn. Dit houdt in dat in het proces van taalontwikkeling deelprocessen uit of na andere deelprocessen ontstaan, zodat de variabelen die de deelprocessen kenmerken ook onderling samenhangen. Om een voorbeeld te geven: er moet eerst een aantal woorden in de woordenschat aanwezig zijn, wil het zin hebben op constructieve wijze (bijvoorbeeld op basis van eigenschappen als 'werkwoord', 'voorzetsel', etc.) de uiting te verlengen.

Voorts is het belangrijk om te weten dat de door ons gevolgde werkwijze niet kwalitatief (zoals in de linguïstiek te doen gebruikelijk is), maar kwantitatief is. Door bestudering van de kwantitatieve aspecten van spontane taaluitingen verwachten we de kennis van en het inzicht in de mechanismen en patronen van de vroege taalontwikkeling te vergroten.

Het model dat de basis vormt voor de simulaties is gebaseerd op analyses van longitudinale datareeksen bestaande uit gesproken, spontane taal van kinderen in de leeftijd tussen 18 en 36 maanden (zie voor een uitgebreide bespreking van deze data, de keuze van variabelen en linguïstische theorieën, Ruhland 1994 en Wijnen 1994). Op basis van theorie en de empirische data zijn tot nu toe een viertal stadia te onderscheiden. In het eerste stadium verwerft het kind woorden. Lorraine McCune (1992) heeft van de fonologische aspecten van dit proces een dynamische systeem beschrijving gegeven. In onze analyses is het eerste woord de start van het proces dat leidt tot de uiteindelijke taal en grammatica van een kind. Het is onduidelijk welke linguïstische mechanismen hierin een rol spelen, maar imitatie speelt een grote rol. De volgende stap in de ontwikkeling is het verlengen van de uiting. De éénwoordfase maakt plaats voor de meerwoordfase. Als uitingen verlengd zijn, ontstaan grammaticale kenmerken, waarbij ook de communicatieve mogelijkheden van het kind zeer sterk toenemen. Eerst worden werkwoorden verbogen en op hun vaste plaats in de zin gezet (Wijnen 1994). De voorlopig laatste stap is de introductie van zogenaamde functiewoorden: abstracte, grammaticale eenheden in de taal. Hierbij moet gedacht worden aan lidwoorden, voorzetsels, voornaamwoorden, en ook ontkenningen en voegwoorden. In figuur 1 staan deze vier stadia weergegeven.

Figuur 1

Zoals uit figuur 1 valt af te leiden volgen de periodes vrij snel op elkaar: binnen ongeveer negen maanden zijn de basisingrediënten van taal verworven. Voor een uitgebreide behandeling van de theoretische aspecten en de keuze van variabelen verwijzen wij nogmaals naar Ruhland 1994 en Wijnen 1994.

We beschikken nu over data op basis waarvan we met behulp van nonlineaire vergelijkingen en empirischtheoretische inzichten een dynamisch systeem model maken.

 

Dynamische systeem benadering

De dynamische systeem benadering, zoals deze door Van Geert (1994) in de ontwikkelingspsychologie is geïntroduceerd, omvat een verzameling beschrijvingsinstrumenten die zich bij uitstek lenen voor het modelleren van dynamische, ontwikkelingspsychologische processen. Deze kwantitatieve, dynamische systeem methode maakt gebruik van modellen die opgebouwd zijn uit nietlineaire mathematische vergelijkingen. Deze benadering kan beschouwd worden als een samensmelting van enerzijds de systeemdynamica en anderzijds de wiskundige, dynamische systeem theorie. De benadering is verder uitgebouwd en toegespitst op het ontwikkelingspsychologische domein.

Voor het modelleren van de vroege taalontwikkeling maken wij gebruik van gekoppelde logistieke groeimodellen zoals deze ontwikkeld zijn door Van Geert (1994). In deze modellen worden ontwikkelingsvariabelen (bijvoorbeeld woordenschat) groeiers genoemd. Groeiers worden door mathematische functies gerepresenteerd en iteratief berekend (zie bijlage 1).

De basisfunctie is de logistieke vergelijking van de demograaf Verhulst (zie o.a. Lauwerier 1993) waarvan hieronder een veelgebruikte variant is weergegeven (eq. 1).

eq.1: L[t+1] = L[t] + r * (L[t] L[t]^2 / K)

In deze vergelijking staat L[t] voor het level of niveau dat de variabele L op tijdstip t heeft bereikt. De groeiratio wordt gerepresenteerd door de parameter r en K staat voor de carrying capacity (groeiplafond of evenwichtsniveau).

Indien deze vergelijking iteratief wordt berekend nemen de opeenvolgende functie uitkomsten in een grafiek de vorm van een Scurve aan (gegeven: 0 < r < 3 en een beginwaarde > 0). De carrying capacity K is de waarde die de functieuitkomst zal benaderen indien de functie vaak genoeg geïtereerd wordt. In veel gevallen zal men de K op 1 zetten, zodat de functie waarden genereert die variëren van 0 tot 1. De Scurve is karakteristiek voor het verloop van veel leer en ontwikkelingsprocessen. Van Geert (1991) heeft deze vergelijking reeds succesvol toegepast om het verloop van de ontwikkeling van de woordenschat te simuleren.

Veel ontwikkelingsprocessen hangen dynamisch samen met andere ontwikkelingsprocessen. Een voorbeeld hiervan is de ontwikkeling van het lopen die in dynamische systeem termen uitermate verhelderend beschreven is door Esther Thelen (1989). Thelen toonde aan dat de verhouding tussen spier en vetweefsel in de ledematen van jonge kinderen bepalend is voor de ontwikkeling van het lopen. Vlak na de geboorte is deze verhouding zodanig dat de loopreflex probleemloos kan worden uitgevoerd. Na korte tijd neemt de hoeveelheid vetweefsel zo sterk toe dat het aanwezige spierweefsel onvoldoende kracht kan genereren om de loopreflex uit te voeren. Na ongeveer een jaar is de verhouding weer gewijzigd in het voordeel van het spierweefsel. Dergelijke complexe dynamische ontwikkelingsprocessen kunnen goed met de dynamische systeem benadering worden beschreven.

Het bijzondere van de groeimodellen van Van Geert is dat groeiers gekoppeld kunnen worden, zodat de dynamische relaties die tussen de verschillende empirische ontwikkelingsvariabelen waarneembaar zijn vrij eenvoudig kunnen worden gemodelleerd. De aard van de relatie tussen twee gekoppelde groeiers kan competitief of supportief zijn. Indien groeier A groeier B ondersteunt (support) zal de groei van groeier B sneller verlopen naarmate groeier A een hogere waarde heeft. Zo zal een jonge kat sneller groeien naarmate het meer en kwalitatief beter voedsel krijgt. In de volgende vergelijking ondersteunt groeier A groeier B.

eq.2 B[t+1] = B[t] + r * (B[t] B[t]^2 / K) + B[t] * (supportfactor * A[t])

Hierbij is de supportfactor een constante die vermenigvuldigd wordt met het absolute niveau van groeier A.

Een alternatief is om de supportfactor niet met het absolute niveau van A op tijdstip t, maar met de verschilscore (A[t] A[t1]) te vermenigvuldigen. Hierdoor is de ondersteuning van A voor B sterk op het moment dat de toename van A (over de tijd) sterk is. In het geval van een competitieve relatie wordt de competitiefactor (vermenigvuldigd met het absolute niveau of de toename (de verschilscore)) afgetrokken van de uitkomst van de rest van de vergelijking met als resultaat dat de groei wordt geremd (zie Van Geert 1994 voor meer informatie over de verschillende ondersteunende en competitieve relaties).

In ontwikkelingsprocessen zien we vaak dat verschillende processen elkaar volgens een vast patroon opvolgen in de tijd. Getalbegrip gaat vooraf aan tellen en dit gaat weer vooraf aan vermenigvuldigen. Dergelijke relaties noemen we precursor relaties en deze kunnen in gekoppelde groeimodellen eenvoudig gemodelleerd worden door het inbouwen van een groeivoorwaarde in de functie die een groeier representeert. Stel dat groeier B pas mag gaan groeien als groeier A groter is dan 0.1, dan definieert men de functie van groeier B als volgt.

 

eq.3 B[t+1] = B[t] + (IF (A[t] > 0.1) THEN 1 ELSE 0) * r * (B[t] B[t]^2 /K)

De IF functie heeft drie elementen. Het deel direct na de IF A[t] > 0.1 is de logische vergelijking. Is het resultaat van deze vergelijking waar, dan wordt de rest van de vergelijking vermenigvuldigd met het tweede element, d.i. 1. Als de voorwaarde niet waar is, dan wordt de rest van de vergelijking vermenigvuldigd met het derde element 0 en is er dus geen groei.

Veel ontwikkelingstheorieën beschrijven ontwikkeling in termen van ontwikkelingsfasen (bijvoorbeeld Piaget's cognitieve ontwikkelingstheorie). Een snelle overgang tussen twee opeenvolgende ontwikkelingsfasen noemen we een transitie. Binnen de dynamische systeem benadering geldt de catastrofetheorie (Zeeman 1976, Van der Maas 1993) als de meest geschikte methode voor het modelleren van transities. Een beperking van catastrofetheoretische modellen is dat deze zich niet goed lenen voor het simuleren van ontwikkelingstrajecten. Met behulp van gekoppelde groeimodellen is dat wel goed mogelijk en kunnen bovendien transities worden gemodelleerd. Dit noemen we zwakke transities omdat er strikt genomen geen sprong is, maar een extreem versnelde groei. Voor het produceren van zwakke transities wordt niet de gebruikelijke klassieke logistieke vergelijking (zie eq. 1) gebruikt, maar de kubieke variant (eq. 4).

eq.4 L[t+1] = L[t] + r * (L[t]^2 L[t]^3 / K)

Deze vergelijking produceert (iteratief berekend) een curve welke in tegenstelling tot de klassieke logistieke vergelijking niet een geleidelijke Svormige groei maar een plotselinge extreem versnelde groei vertoont. Het moment van de sprong kan door middel van koppeling afhankelijk worden gemaakt van de ontwikkeling van een andere groeier.

 

Simulatie van taalontwikkeling

De eerste stap in het modelconstructieproces bestaat uit het identificeren van de belangrijkste variabelen van het te modelleren ontwikkelingsproces alsmede het vaststellen van de relaties tussen deze variabelen. In figuur 1 zijn de ontwikkelingstrajecten van de belangrijkste variabelen (groeiers) weergegeven. Woordenschat (WS) is de absolute hoeveelheid woorden dat het kind gebruikt. Uitingslengte (Lu2+) is gedefinieerd als het percentage uitingen met een lengte van twee of meer woorden. Het aantal werkwoordsverbuigingen (WW) is gedefinieerd als het percentage van alle uitingen met een werkwoord waarbij het kind het betreffende werkwoord (al dan niet juist) verbogen heeft. De variabele functiewoorden (FW) is de absolute hoeveelheid functiewoorden (lidwoorden, voornaamwoorden etc.) die het kind gebruikt. Al deze variabelen zijn geschaald op een range van 0 tot 1 waardoor de grafische weergave en de statistische fitting eenvoudiger worden.

Op grond van nauwkeurige bestudering van de empirische data, linguïstische theorie (Ruhland 1994, Wijnen 1994) en intuïties zijn wij gekomen tot de formulering van een aantal relaties zoals die tussen de empirische groeiers lijken te bestaan. Onder empirische groeiers verstaan wij variabelen die op basis van de theorie (Ruhland 1994, Wijnen 1994), intuïtie en/of logica in de data zijn te vinden.

Precursor relaties.

1 De uitingslengte (Lu2+) begint te groeien zodra de woordenschat (WS) een bepaalde drempelwaarde bereikt heeft. Het kind moet de beschikking hebben over een minimum aantal woorden voordat het in staat is langere uitingen te produceren. Belangrijk is dat de woordenschat bestaat uit verschillende woorden. Dat wil zeggen, het is in feite mogelijk dat een kind eerst alle voorzetsels leert (of werkwoorden), maar combinaties van woorden (dus grotere uitingslengte) zijn dan niet of nauwelijks vruchtbaar. Bovendien blijft de extra communicatieve waarde gering.

2 Werkwoordsverbuiging (WW) begint te groeien zodra uitingen een lengte hebben van twee of meer woorden. Dit lijkt ook intuïtief plausibel want het verbuigen van werkwoorden is in de éénwoordfase van weinig nut (want hoe moet het werkwoord worden verbogen: wat is het onderwerp?).

3 Functiewoorden (FW) begint te groeien zodra werkwoorden verbogen zijn. Dit blijkt uit de empirische data. Een verklaring hiervoor zou kunnen zijn dat de interne hulpbronnen die het kind heeft moeten aanwenden om de werkwoordsverbuiging in het taalsysteem te incorporeren vrijkomen voor de volgende verfijning van het taalsysteem, de verwerving van de functiewoorden. Een linguïstische verklaring is dat de basisvolgorde van een zin klaar is, en dat functiewoorden hun plek kunnen krijgen.

We hebben enkele drempelwaarden van de precursor relaties gevonden, die zijn afgeleid uit de empirische data. We gebruiken deze drempelwaarden in de vorm van IfThen vergelijkingen, in een latere versie van het model hopen we van deze vergelijkingen af te komen. In hoeverre deze drempelwaarden theoretisch relevant zijn is nog onduidelijk.

 

Ondersteunende relaties.

4 Werkwoordsverbuiging (WW) en woordenschat (WS) ondersteunen de groei van uitingslengte (Lu2+). Hoe meer werkwoorden verbogen worden en hoe meer woorden beschikbaar zijn des te langer zijn de zinnen die gemaakt kunnen worden.

5 Werkwoordsverbuiging (WW) en uitingslengte (Lu2+) ondersteunen de groei van functiewoorden (FW). Een functiewoord is vooral zinvol in langere zinnen en in combinatie met een (verbogen) werkwoord.

Met behulp van de in de vorige paragraaf beschreven hulpmiddelen zijn bovenstaande relaties vrij eenvoudig om te zetten in een gekoppeld groeimodel. Dit model is geïmplementeerd in een spreadsheet programma. Dit heeft als voordeel dat onder andere correlatieberekeningen eenvoudig kunnen worden ingebouwd en dat berekeningen aanzienlijk sneller verlopen.

Gezien het feit dat WS de enige groeier is waarvan de groei niet afhangt van één van de andere groeiers beginnen we met het definiëren van de mathematische functie die WS in het model zal representeren. WS vertoont een groei die op het eerste gezicht lineair lijkt (zie figuur 1). Teneinde hierover zekerheid te verkrijgen is een lineaire en een logistieke functie gedefinieerd waarbij met behulp van de kleinste kwadratenmethode (Ferguson, 1976) bestudeerd is welke functie de beste fit oplevert. De kleinste kwadratenmethode (KKM), die wij ook gebruikt hebben als leidraad bij het schatten van de parameters van het model, werkt als volgt. Het verschil tussen een datapunt en het corresponderende modelpunt (residu) wordt gekwadrateerd waarna alle gekwadrateerde residuen worden gesommeerd. Dit resulteert in een waarde die door middel van het bijstellen van de parameterwaarden wordt geminimaliseerd. Het is gebleken dat met de logistieke functie een aanzienlijk betere benadering voor de ontwikkeling van WS te bereiken valt dan met de lineaire functie (Ruhland, 1994). Op basis hiervan hebben we de functie die woordenschat representeert als volgt gedefinieerd (eq.5).

 

eq. 5 WS[t+1] = WS[t] + r_WS * (WS[t] WS[t]^2 / K_WS)

 

r_WS is de groeiratio voor WS.

K_WS is de carrying capacity voor WS.

 

Figuur 2.

Het begin van de groei van uitingslengte (Lu2+) is afhankelijk van het niveau van WS. Ook Lu2+ vertoont een Svormige groei met dien verstande dat de groei veel sneller verloopt dan de groei van WS (zie figuur 1). Bovendien gaat de groei (licht fluctuerend) door nadat de grootste afvlakking heeft plaats gevonden. Wij veronderstellen dat deze latere groei vooral toegeschreven kan worden aan ondersteuning van WS en WW (zie eq. 6).

eq.6 Lu2+[t+1] = Lu2+[t] + (IF (WS[t] > 0.01 THEN 1 ELSE 0) *

r_Lu2 * (Lu2+[t] Lu2+[t]^2 /K_Lu2+) + Lu2+ * ((SupWS * WS[t]) + (SupWW * WW[t]))

 

r_Lu2+ is de groeiratio voor Lu2+.

K_Lu2+ is de carrying capacity voor Lu2+.

SupWS is de parameter die bepaald in hoeverre de groei van LU2+ wordt ondersteund door WS.

SupWW idem voor de ondersteuning door WW.

Figuur 3.

WW vertoont het meest van alle groeiers de karakteristieke Scurve. Er hoeft alleen maar rekening gehouden te worden met het gegeven dat het begin van de groei afhankelijk is van het niveau van Lu2+ (zie eq. 7).

eq.7 WW[t+1] = WW[t] + (IF (Lu2+[t] > 0.3 THEN 1 ELSE 0) *

r_WW * (WW[t] WW[t]^2 /K_WW)

 

r_WW is de groeiratio voor WW.

K_WW is de carrying capacity voor WW.

Figuur 4.

FW heeft de meest grillige curve van de vier variabelen. Duidelijk te zien is dat FW na een langzame begingroei een plotselinge sprong naar het maximale niveau te zien geeft en daarna over een brede range blijft fluctueren. Over de gemiddelde scores van vier proefpersonen is een fittingexperiment uitgevoerd waarbij de kubieke variant van de logistieke functie de beste fit opleverde (Ruhland 1994). Deze sprong of transitie kan dus het best met de kubieke variant worden gemodelleerd.

De groei van FW wordt bovendien ondersteund door de relatieve toename van Lu2+ en WW (zie eq. 8) in plaats van het absolute niveau van deze variabelen. Hier is voor gekozen omdat het een aanzienlijk betere fit tot resultaat heeft. Bovendien is dit een betere representatie van het gebruik van hulpbronnen (Van Geert 1994).

 

eq.8 FW[t+1] = FW[t] + (IF (WW[t] > 0.3 THEN 1 ELSE 0) *

r_FW * (FW[t]^2 FW[t]^3 / K_FW) + FW[t] *

((SupLu2+ * (Lu2+[t] Lu2+[t1])) +

(SupWW * (WW[t] WW[t1)))

r_FW is de groeiratio voor FW.

K_FW is de groeiratio voor FW.

SupLu2+ is de parameter die bepaalt in hoeverre de groei van

FW wordt ondersteund door de toename van Lu2+

SupWW idem voor de ondersteuning door de toename van WW.

 

Figuur 5.

Het model heeft in totaal 19 parameters, te weten: 4 initiële waarden voor groeiers, 4 groeiratio's, 4 carrying capacities, 3 precursor parameters en 4 support parameters. De waarden van deze parameters worden alle afgeleid uit de empirische data.

De volgorde waarin de parameters van het model geschat zijn is dezelfde als de volgorde waarin de vergelijkingen van de groeiers gedefinieerd zijn. We beginnen met de parameters van de groeier die niet afhankelijk is van andere groeiers, d.i. de woordenschat (WS). Vervolgens zijn de parameters geschat van de groeier die afhankelijk is van WS, d.i. Lu2+. Tenslotte zijn de parameters van WW en FW geschat.

De initiële waarden van de groeiers worden eenvoudigweg gelijkgesteld aan de beginwaarden van de empirische variabelen. Voor de carrying capacities kiezen we waarden die overeenkomen met het evenwichtsniveau dat de empirische variabele uiteindelijk bereikt. Omdat alle data geschaald zijn op een range van 0 tot 1 zetten we de carrying capacities op 1. De waarden van de precursor parameters worden rechtstreeks uit de empirische data afgeleid (zie vorige paragraaf). Ook de groeiratio's kunnen uit de data worden bepaald (Van Geert, 1994: 116). Deze methode is tevens gebruikt voor het schatten van de support parameters. Voor een verfijning van deze schattingen is de kleinste kwadratenmethode (KKM) van groot belang geweest. Bovendien hebben we de berekening van de correlatie tussen empirische en modeldata gebruikt als hulpmiddel bij het schatten van de parameters.

Het is niet moeilijk gebleken de parameters zodanig te schatten dat er sprake is van een redelijke fit. De best gevonden fit is weergegeven in de figuren 4 tot en met 7. De bijbehorende parameterwaarden en de KKM scores zijn weergegeven in bijlage 2.

De fit voor WW is de beste terwijl die voor Lu2+ en WS redelijk te noemen zijn. De empirische curve voor FW is moeilijk exact reproduceerbaar gebleken.

Teneinde de robuustheid van het model vast te stellen met betrekking tot de grootte van de feedback delay (zie bijlage 1) is een aantal numerieke experimenten uitgevoerd. Hierbij is het aantal modelpunten verdubbeld, verdrievoudigd, verviervoudigd en gehalveerd. De uitkomsten van deze experimenten zijn weergegeven in bijlage 2. Het is gebleken dat vergroting van het aantal modelpunten geen grote veranderingen in de fit tot resultaat heeft gehad. Wij leiden hieruit af dat het model niet erg gevoelig is voor vergroting van de feedback delay. Een halvering van het aantal modelpunten (13 i.p.v. 27) resulteerde wel in een duidelijk mindere fit.

Tenslotte hebben wij de (discrete) differentievergelijkingen van het model omgezet in (continue) differentiaalvergelijkingen en hiermee een aantal simulaties uitgevoerd. Binnen de dynamische systeem benadering wordt veel gediscussieerd over de vraag welke van deze twee klassen vergelijkingen het meest geschikt is (zie onder andere Broer & Verhulst, 1990). Deze simulaties zijn uitgevoerd met het computer programma Stella/I Think, dat bijzonder geschikt is voor het bestuderen van iteratief berekend mathematische modellen. Stella/I Think is bovendien speciaal voor differentiaal vergelijkingen ontwikkeld. In feite worden de differentiaalvergelijkingen als differentie vergelijkingen berekend, maar door het opdelen van de berekening in meerdere stappen en het gebruik van een integratiealgoritme kunnen differentiaalvergelijkingen zeer nauwkeurig worden benaderd. Het model is doorgerekend met stapgroottes van 1.0. 0.5, 0.25, 0.1 en 0.01. Bovendien zijn de effecten van drie verschillende integratiealgoritmen (methoden om met behulp van differentievergelijkingen differentiaalvergelijkingen te benaderen) onderzocht, te weten Euler, RungeKutta 2 en RungeKutta 4 (Press et al. 1989).

Uit deze numerieke experimenten is gebleken dat het model, geïmplementeerd in differentiaalvergelijkingen, kwalitatief hetzelfde gedrag vertoont als een implementatie in differentievergelijkingen. Het effect van verkleining van de stapgrootte heeft tot effect dat de groei iets sneller verloopt. Ook het gebruik van RungeKutta 4 als integratiealgoritme in plaats van Euler veroorzaakt een iets snellere groei. RungeKutta 2 vertoont hetzelfde effect in mindere mate. Opmerkelijk is dat de door Stella/I Think gegenereerde simulaties geen fluctuaties in het laatste deel van de curve van FW laten zien. Blijkbaar zijn deze fluctuaties aan de differentievergelijking gerelateerde effecten die verdwijnen zodra het model in de vorm van differentiaalvergelijkingen wordt doorgerekend. Hoewel Stella/I Think geen mogelijkheden biedt om de mate van fit tussen model en empirische data vast te stellen hebben wij met behulp van "eye ball statistics" vastgesteld dat het model bestaande uit differentievergelijkingen een betere fit op levert dan de versie bestaande uit differentiaalvergelijkingen.Discussie en conclusies

De vroege taalontwikkeling kan gekenschetst worden als een proces, dat bestaat uit vier fasen. De eerste fase bestaat uit de verwerving van woorden. In de tweede fase verlengt een kind de uiting, waarna het taalsysteem klaar is voor grammaticale kenmerken. De werkwoordskenmerken verschijnen (plaats in zin en congruentie met het subject), en vervolgens verschijnen de functiewoorden. Mogelijk zijn er nog meer stadia aan te wijzen, zoals de periode vlak na de verlenging van de uiting, waarbij patroonvorming, het onder de knie krijgen van vaste woordvolgordes in uitingen, wellicht een rol speelt, dit als mogelijke reden voor het ontbreken van een fase tussen de LU2+ en de WW.

Uit de KKMscores en de correlaties blijkt dat bij een aantal processen een logistieke vergelijking de beste keuze is (zoals bij de uitingslengte en de werkwoorden), terwijl voor de functiewoorden de beste fit te bereiken valt door middel van een kubieke vergelijking. Op basis van theoretische gronden en de data kunnen we stellen dat in de vroege taalontwikkeling precursorrelaties bestaan. Zo ontwikkelt zich eerst de uitingslengte, die een precursor is van de werkwoorden, die op hun beurt vooraf gaan aan de functiewoorden. De keuze voor 250 woorden in de woordenschat als drempelwaarde voor het begin van de ontwikkeling van Lu2+ is afgeleid uit de data. Toch hebben wij moeite te geloven dat alleen dit gegeven bepalend is voor het begin van de ontwikkeling van Lu2+. Wij vermoeden dat andere ontwikkelingsaspecten, zoals de verwerkingscapaciteit en de mate waarin de productie van taaluitingen geautomatiseerd is een minstens even grote rol spelen. Dit verdient nader onderzoek. Overigens zijn er gedurende dit onderzoek twijfels gerezen over de empirische categorie FW. Het grote probleem lijkt te zijn dat FW een absolute score is. Dat wil zeggen dat FW in absolute aantallen weergeeft hoeveel van deze woorden per sessie geuit zijn. Hierdoor is de toevalcomponent erg groot, wat ook tot uitdrukking komt in de curve die vooral in het laatste deel grote fluctuaties vertoond.

Wat betreft de dataverzamelingfrequentie en frequentie van simulatiedata valt het volgende te melden. Een verdubbeling van de modelpunten (wat overeenkomt met wekelijkse datasampling) geeft de zelfde fit als de enkelvoudige variant, terwijl een halvering (corresponderend met maandelijkse datasampling) een slechtere fit geeft. De gekozen frequentie van opname is, in overeenstemming met ander onderzoek (cf. Dromi 1986), blijkbaar zodanig dat het proces van taalontwikkeling in ruim voldoende mate kan worden beschreven. Een hogere frequentie van sampling dan eens per twee weken zal derhalve geen nauwkeuriger beschrijving van het proces geven. Wij leiden hieruit af dat de tweewekelijkse sampling frequentie voldoet als keuze.

Een probleem bij het toetsen van modellen van dit type is dat er geen "natuurlijke" manier bestaat om de toevalsfluctuatie vast te stellen. Er ontbreekt een uitgewerkte foutentheorie, een statistisch verantwoorde toetsing van de simulatieuitkomsten is (nog) niet mogelijk. Het gebruik van correlatie en de kleinste kwadratenmethode is het beste dat we op dit moment kunnen doen. Correlaties geven ook een indicatie voor de mate van overeenstemming tussen data en model. Echter, correlaties zijn hoog indien zowel data als model bij benadering dezelfde mate van toename of afname vertonen. Dit is met gekoppelde groeimodellen eenvoudig te realiseren. Correlaties hoger dan +0.95 zijn heel gewoon. Sociaal wetenschappers die crosssectioneel onderzoek verrichten zouden met dergelijke correlaties bij wijze van spreken Nobelprijzen winnen, maar bij simulaties van longitudinale datareeksen zijn deze resultaten van weinig belang. De kleinste kwadratenmethode verschaft een beter inzicht in de mate van overeenstemming tussen simulatie en empirie.

Het huidige onderzoek roept vele vragen op die gedurende vervolgonderzoeken beantwoord dienen te worden. Is het bijvoorbeeld met behulp van dit model mogelijk de vroege taalontwikkeling van andere kinderen te voorspellen? En hoe nauwkeurig zijn deze voorspellingen? Welke andere ontwikkelingsaspecten spelen een belangrijke rol in de vroege taalontwikkeling? Kan het model verbeterd worden door een herdefiniëring of opsplitsing van de variabele functiewoorden? Zijn er andere ontwikkelingsfasen die niet blijken uit de huidige data?

Ook de ontwikkeling van specifieke statistische methoden verdient extra onderzoek.

Het moge duidelijk zijn dat de dynamische systeem benadering uitermate interessante mogelijkheden biedt tot de simulatie van psychologische ontwikkeling en een belangrijke bijdrage kan leveren aan ontwikkelingspsychologisch onderzoek.Literatuur

 

Literatuur

Borer, H. & Wexler, K. (1987) 'The maturation of syntax.' In: T. Roeper & E. Williams (eds.) Parametersetting and language acquisition. Dordrecht, Reidel.

Broer, H.W. & Verhulst, F. (1990). Dynamische systemen en chaos. Utrecht, Epsilon.

Brown, R. (1973) A first language: the early stages. London, Allen & Unwin.

Dromi, E. (1986) 'The oneword period as a stage in language development: quantitative and qualitative accounts.' In: I. Levin (ed.) Stage and structure: reopening the debate. Norwood New Jersey, Ablex.

Ferguson, G. A. (1976). Statistical analysis in psychology and education. Tokyo:

McGrawHill Kogakusha.

Fisher, K. W. (1980). A theory of cognitive development: The control and construction of hierarchies of skills. Psychological Review, 87, 477531.

Geert, P. van (1991). 'A dynamic systems model of cognitive and language growth.' Psychological review 98 (1), p. 333.

Geert, P. van (1994). Dynamic systems of development. New York: Harvester Wheatsheaf.

Lauwerier, H.A. (1993). Computersimulaties van Chaos en Orde. Wetenschappelijk Tijdschrift voor Informatica en Modelbouw. Utrecht, SISWO.

Maas, H. van der (1993). Catastrophe analysis of stagewise cognitive development: model, method and applications. Doctoral dissertation, University of Amsterdam.

McCune, L. (1992). 'First words: A dynamic systems view'. In: C.A. Ferguson, L.

Menn & C. StoelGammon (eds.) Phonological development: Models, research, implications. Maryland, Timonium.Piaget, J (1929). The Child's conception of the world. New York: Harcourt, Brace Jovanovich.

Press, W.H., Flannery, B.P., Teukolsky, S.A. & Vetterling, W. T. (1989). Numerical recipes in Pascal: The art of scientific programming. New York, Cambridge University Press.

Ruhland, R. (1994) 'Modelling language development: from first words to grammar'. Unpublished paper.

Thelen, E. (1989) 'Selforganization in developmental processes: Can systems approaches work?'In: M. Gunnar & E. Thelen (eds.) Systems and development. Hillsdale, N.J., Erlbaum.

Werner, H. (1957) 'The concept of development from a comparative and organistic point of view.' In: D.B. Harris (ed.) The concept of development: an issue in the study of human behavior. Minneapolis, University of Minnesota Press.

Wijnen, F. (1994) 'Incremental acquisition of phrase structure: a longitudinal analysis of verb placement.' Unpublished paper.

Zeeman, E.C. (1976) 'Catastrophe theory.' Scientific American 234 (4), p. 6583.Bijlage 1. Iteratieve berekening van functies en feedback delay.


Bijlage 1: Interatieve berekening van funkties

Iteratie wil zeggen herhaling. Indien we zeggen dat we een functie iteratief berekenen bedoelen we dat we de uitkomst (of output) van die functie op een bepaald tijdstip gebruiken als invoer (of input) op een volgend tijdstip. In feite is dit een eenvoudige implementatie van feedback. Met andere woorden, de toestand waarin een systeem op een bepaald moment verkeert is door middel van feedback van invloed op de toestand van het systeem op een volgend tijdstip. Door de opeenvolgende functieuitkomsten te berekenen kunnen we het verloop van de functie in de tijd bepalen. De feedback delay is de vertraging die ontstaat door de grootte van de stap in de tijd. Een feedback delay van twee wil dus zeggen dat er twee stappen in de tijd gemaakt worden alvorens de functie te itereren.

Als voorbeeld geven we de iteratieve berekening van de lineaire functie X die gedefinieerd is als X[t+1] = X[t] + 1, de feedback delay is hierbij één.

Dit betekent dat de uitkomst van de functie op tijdstip t+1 gelijk is aan de uitkomst op tijdstip t waarbij één moet worden opgeteld.

Het is noodzakelijk dat voor tijdstip t = 0 een beginwaarde gegeven is, bijvoorbeeld 1.

Hieronder geven wij het verloop van bovenstaande functie over vijf opeenvolgende tijdstippen weer.

t

Berekening:

Uitkomst

0

X[t=0] = 1

1

1

X[t=1] = X[t=0] + 1 = 1 + 1

2

2

X[t=2] = X[t=1] + 1 = 2 + 1

3

3

X[t=3] = X[t=2] + 1 = 3 + 1

4

4

X[t=4] = X[t=3] + 1 = 4 + 1

5

Volgens dit principe zijn de logistieke groeifuncties in dit artikel iteratief berekend.


Bijlage 2. Parameters en statistische fit.

Het model heeft negentien parameters. Hieronder geven wij de parameterwaarden die de beste fit opleverden bij een gelijk aantal modelpunten en datapunten (d.i. 27).

Functieparameters:

Initial

r:

K:

WS

0.01

0.3

1.0

Lu2+

0.001

1.59

0.69

WW

0.01

0.7

1.0

FW

0.012

2.7

0.72

Precursor parameters:

Precursor Lu2+ (WS niveau): 0.011

Precursor WW (Lu2+ niveau): 0.3

Precursor FW (WW niveau): 0.3

 

Support parameters:

WW > Lu2+ 0.24

WS > Lu2+ 0.38

Lu2+ > FW 2.722

WW > FW 2.05

 

Fits voor 27 iteraties.

WS Lu2+ WW FW Gemidd.

Correlatie 0.9846 0.9881 0.9969 0.9537 0.9808

KKM 0.1407 0.0862 0.0342 0.2644 0.1314

 

Fits voor 54 iteraties.

WS Lu2+ WW FW Gemidd.

Correlatie 0.9850 0.9887 0.9974 0.9547 0.9814

KKM 0.1258 0.0818 0.0316 0.2679 0.1268

 

Fits voor 13 iteraties.

WS Lu2+ WW FW Gemidd.

Correlatie 0.9638 0.9479 0.9896 N.B. N.B.

KKM 0.1159 0.0472 0.0224 0.1353 0.0802

 

Fits voor 71 iteraties.

WS Lu2+ WW FW Gemidd.

Correlatie 0.9862 0.9875 0.9974 0.9363 0.9769

KKM 0.1171 0.0915 0.0305 0.3770 0.1540

 

Fits voor 108 iteraties.

WS Lu2+ WW FW Gemidd.

Correlatie 0.9864 0.9875 0.9979 0.9322 0.9760

KKM 0.1136 0.0919 0.0247 0.3881 0.1545

 

Fits voor 270 iteraties.

WS Lu2+ WW FW Gemidd.

Correlatie 0.9863 0.9877 0.9978 0.9058 0.9694

KKM 0.1076 0.0967 0.0249 0.5320 0.1903