Van oorsprong op LinkedIn gepubliceerd op 15 december 2017
De structuur van zinnen in menselijke talen laat ons interessante overeenkomsten met de basisstructuur van HTML5 zien.
Talen zoals het Nederlands, Engels, Russisch en Fins hebben net als HTML5 een modulaire structuur.
"Modulair" betekent hier dat een zin in het Engels en een HTML5-pagina beide uit blokken of functionele eenheden bestaan die samen hun unieke eenheid vormen: een bericht / een verhaal, een HTML5-pagina.
Elk blok dat we hier voortaan "element" noemen, heeft zijn eigen specifieke functie in het geheel, zowel in een zin in het Engels of Fins, als in een HTML-pagina.
Hierarchie. In beide systemen zijn alle elementen hierarchisch met elkaar verbonden. En daarenboven kent elk element weer een eigen interne hierarchie.
Menselijke taal. In de zin The old man is driving his new car is het predicaat/gezegde (zinsdeel dat de actie uitvoert) is driving het kern-element van de zin. Het subject/onderwerp ('degeen die handelt') The man en het object/lijdend voorwerp ('wat de handeling ondergaat') the new car zijn de uitwerking van de handeling en daarmee afhankelijke elementen van het predicaat in de zin.
In deze constellatie is het onderwerp functioneel dominant over het lijdend voorwerp. Het lijdend voorwerp kun je weglaten, het onderwerp niet. Iedere handeling - is de regel - vraagt expliciet om een uitvoerende. Maar het lijdend voorwerp van de handeling is zo blijkt minder belangrijk omdat bijvoorbeeld 'eten' een te eten object vooronderstelt.
In het gezegde is driving staan twee woorden die in een hierarchische relatie tot elkaar staan: driving is de kern van het gezegde en is kun je beschouwen als een grammaticaal attribuut dat aan driving is toegevoegd.
Deze interne hierarchie zien we ook in The old man en his new car. De attributen The, old, his en new worden hier links van de kernelementen man en car geplaatst.
HTML5. Vergelijk de besproken taalkundige eenheid (= de zin) nu eens met de HTML5-eenheid. Laten we de elementen 'head' en 'body' bekijken. Beide zijn van belang voor het overbrengen van de boodschap aan de bezoeker van de webpagina. Het element 'title' in de head-sectie toont de pagina-titel in de resultaten in een zoekmachine. De elementen 'p' en 'img" in de body-sectie die één of meer zinnen cq. afbeeldingen bevatten, presenteren de feitelijke content aan de bezoeker van de pagina.
In deze constellatie beschouw ik 'p' als belangrijker dan 'title'. Zonder de elementen 'p' en 'img' die tekst en afbeeldingen bevatten, is er niks te zien op de webpagina. Zonder het element 'title' is hoogstens de vindbaarheid van de pagina op internet gering. De content is daarentegen wel zichtbaar. Daarmee zou je de 'body' als het kernelement binnen het element 'html' (de webpagina als geheel) kunnen beschouwen, en 'head' als het attribuut van het geheel 'html'.
Binnen de 'body' zijn verschillende hierarchische relaties te onderscheiden. Het element 'div' is dominant over 'p'; de 'p' staat altijd binnen een 'div' en niet omgekeerd. Attributen - hierarchisch minder van belang - die aan een 'div' of 'p' worden toegevoegd staan links van de feitelijke content. Dat betekent dat een attribuut altijd in de begin-tag van het element staat. Hier zie je een gelijkenis met het Engels en Nederlands waar de attributen zoals het lidwoord (the, de) en bijvoeglijk naamwoord (old, oud) in de regel links van het zelfstandig naamwoord (man) staan.
Bovendien kunnen attributen worden weggelaten. Ze voegen slecht een toegevoegde waarde of functie toe aan de content (bijvoorbeeld 'alt' dat als vervangende info bij de foto dient of 'class' als verwijzing naar de opmaak). In menselijke talen vind je het hetzelfde principe: The en old zijn slechts grammaticale en semantische informatie toegevoegd aan man, attributen die in principe kunnen worden weggehaald zonder de betekenis van man geweld aan te doen zoals je ziet in Man bijt hond.
Korte samenvatting. De gelijkenis tussen het Engels en HTML5 bij de plaatsing van attributen links van het kern-element (the = attribuut, man = kern-element van het zinsdeel naast <p class="human">de man</p>) is frappant. Is hier misschien sprake geweest van een intuïtieve keuze bij het ontwerp van HTML, geïnspireerd door het Engels?
Terwijl het Engels en Fins en andere talen door de menselijke stem worden voortgebracht, is de taal HTML5 een abstract voortbrengsel van het menselijk brein.
Alle elementen in een zin vertegenwoordigen een deel van de inhoud, het bericht als een geheel. Alleen het body-element in een HTML5-pagina vertegenwoordigt de inhoud.
HTML. In HTML5 worden attributen altijd in de begin-tag geplaatst. Je zou het kunnen zien als een logische keuze. In de hierarchie wordt eerst het element gedefinieerd, vervolgens de opmaak ervan en tot slot de tekst in het element. Het volgt het principe dat in veel talen geldt: lezen van links naar rechts.
De vraag die ik me stel is de volgende. In hoeverre heeft de opbouw van het element (zinsdeel) in het Engels bijgedragen tot de keuze om het attribuut links van de content te situeren? Voor het hetzelfde geld had je het attribuut toch ook in de eind-tag kunnen plaatsen? Te meer daar de meeste elementen in principe een begin- en eind-tag moeten hebben, uitgezonderd het p-element in HTML5.
Hieronder vergelijk ik het Engels en Fins met elkaar om te laten zien hoe verschillend deze talen omgaan met de opbouw van een zinsdeel zoals 'op de tafel':
Engels. In het Engels staan attributen (voorzetsels, lidwoorden, bijwoorden, bijvoeglijke naamwoorden) altijd links van het kern-element (zelfstandig naamwoord) in het zinsdeel: On the table.
Fins. In het Fins is On the table letterlijk om te zetten naar 'tafelop': pöydällä. Dit gaat terug op de kern van het Fins als agglutinatieve taal waar rechts van het kernwoord attributen worden toegevoegd. Opgemerkt dient te worden dat het Fins geen lidwoorden kent.
Stel dat het ontwerp van een taal als HTML was geïnitieerd door ontwerpers die een taal zoals het Fins als moedertaal hadden gehad, dan is voor mij de vraag of het ontwerp wellicht beïnvloed was door het karakter van die agglutinatieve moedertaal. Dan was misschien de class niet in de begintag maar in de eindtag geplaatst: <p>pöydällä</p class="bg-success"> in plaats van de 'normale' situatie in <p class="bg-success">pöydällä</p>.
Dit artikel is een eerste stap, niet een definitieve uitwerking van een gedachte. Het dient als uitdaging voor iedereen die in menselijke en kunstmatige talen geïnteresseerd is.
(Gevalideerde) Voorbeelden: Voorbeeld met HTML5-broncode en Engels, Voorbeeld met HTML5-broncode, Engels en Fins.
Bronnen - taalkundig: Onzetaal.nl - Ontleden: redekundig - taalkundig, Google Images - 'sentence analysis model', Jufmelis.nl - zinsontleding, Onzetaal.nl - Zinsdelen (redekundig ontleden), Wikipedia - Dependency grammar, Wikipedia - Immediate constituent analysis, Wikipedia - Phrase structure grammar, Jufmelis.nl - woordsoorten, Onzetaal.nl - Woordsoorten (taalkundig ontleden), Orbilat.com - Linguistic Terms, Taaltelefoon.be - Taalkundige termen.
Bronnen - HTML: Wikipedia - HyperText Markup Language, W3C - HTML5 Tutorial.
Origineel op LinkedIn: HTML5 & menselijke talen - Een introductie
Joost van Meeteren
Validatie: Nu Html Checker | De W3C CSS Validatie Service