Freistetters wereld van formules: taal leren kennen met wiskunde
Stel je voor dat we een signaal ontvangen via onze radiotelescopen. Een signaal dat niet is wat je zou verwachten van een ster, melkwegstelsel of ander natuurlijk object. Een signaal dat een bericht zou kunnen zijn van intelligente buitenaardse wezens aan ons. Natuurlijk begrijpen we de taal waarin het is geschreven niet. Erger nog, we weten niet zeker of het een bericht is – of misschien een natuurlijk fenomeen dat we nog niet hebben ontdekt.
Hier heb je wiskunde nodig, die ook de juiste formule heeft voor zo’n geval. Welke:
Dit is de wet van Zipf, genoemd naar de Amerikaanse taalkundige George Kingsley Zipf. In de jaren dertig werkte hij aan de frequentie van woorden in verschillende talen. U kunt alle woorden die in de tekst worden gebruikt sorteren en tellen hoe vaak ze zijn gebruikt. Woorden als “dit” of “en” zijn waarschijnlijk heel gewoon; Termen als ‘ontbijt’ of ‘room’ kom je zelden tegen.
Alle afleveringen van zijn wekelijkse column, die elke zondag verschijnt, zijn hier te bekijken.
Als de woorden in de tekst op frequentie zijn gerangschikt, kunnen ze worden ‘gerangschikt’. Het meest voorkomende woord heeft rang 1, het op één na meest voorkomende woord heeft rang 2, enzovoort. De wet van Zipf die in de formule wordt beschreven, relateert nu de kans p(i) dat een woord in de tekst voorkomt aan de i die dat woord bevat. Met andere woorden, het meest voorkomende woord in de taal wordt twee keer zo vaak gebruikt als het op één na meest voorkomende woord en drie keer zo vaak als het op twee na meest voorkomende woord, enzovoort.
Wat zeggen dolfijnen?
Het is natuurlijk geen exacte relatie. Je kunt je zeker teksten voorstellen waarin het woord ‘ontbijt’ veel meer voorkomt dan je zou verwachten. Georges Perek’s roman “Anton Foyles Furtgang” loopt volledig zonder de letter “e”, zowel in de Duitse vertaling als in het Franse origineel (“Geen minachting”), en daarom vertegenwoordigt het ook niet het gebruik van de taal.
“Analist. Schepper. Zombiefanaat. Fervente reisjunkie. Popcultuurexpert. Alcoholfan.”