Kwaliteit is geen handeling, het is een gewoonte

vlag

De Visie van Rob Arntz

Feiten en Hypes

Een aantal jaren geleden was “Big Data” het toverwoord in de ICT. Geleidelijk aan heeft “Big Data” ook “Artificial Intelligence” als mededinger naast zich moeten dulden. De verengelsing van het vakgebied lijkt werkelijk niet te keren, maar dat terzijde. Belangrijker is dat er iets kenmerkend is voor beide trends: ze missen iets. En dat wordt elke keer weer pijnlijk duidelijk als ik de enorme hoeveelheid aan mails (nog een voorbeeld van voortschrijdende verengelsing) door moet worstelen.

Waarom voelt het doornemen en verwerken van die hoeveelheid mails als een worsteling? Omdat ik in elk email-programma dat ik tot dusver gebruikt heb de meest essentiële functie mis. Ik kan op vele manieren mijn mail sorteren behalve op de enige manier die ik graag zou willen: op relevantie. In Outlook kan ik sorteren op “urgentie”, maar dat is niet wat ik zoek. Want urgentie wordt in de eerste plaats aangegeven door de verzender en niet door mij als ontvanger; en wat een verzender urgent vindt, is dat beslist niet altijd voor mij. Sterker nog, een mail met urgentie naar mij versturen heeft bij mij een averechts effect: die komen bij voorkeur aan het eind van mijn worsteling aan de beurt.

Iets anders dat vreemd is aan de “urgentie” markering is dit: hij wijzigt niet in de loop van de tijd. Laatst kreeg een mailtje dat betrekking had op een overleg. Dat mailtje vereiste inderdaad directe actie, waardoor het voor mij hoge prioriteit zou hebben gehad. Helaas zag ik het mailtje pas na het overleg. Daarmee was de relevantie totaal verdwenen. Als mijn email-programma mij werkelijk had geholpen, had ik dat mailtje überhaupt niet meer te zien gekregen. De relevantie voor mij zakte immers van topprioriteit naar volstrekt irrelevant. Dat maakt een statische markering in elk geval nutteloos.

Een boeiende vraag is nu: waarom kan mijn email-programma de mail niet voor mij sorteren op relevantie? We hebben toch “Artificial Intelligence”? Als ik als mens moeiteloos kan rangschikken op prioriteit, dan moet dat voor een computer toch ook (om de haast onvermijdelijke 'piece of cake' maar eens te vermijden) een peulenschil zijn? Als een computer de wereldkampioen Go kan verslaan, dan moet iets als sorteren op relevantie toch relatief simpel zijn?

De laatste twee vragen moeten helaas nog negatief beantwoord worden. Een computer is hiertoe niet in staat. Nog niet in ieder geval. En dat heeft alles te maken met wat we aangaven met "ze missen iets", en dat iets heet “semantiek”. Simpel gezegd: de betekenis van mijn mail is de computer nog niet duidelijk. Dankzij Big Data worden we overspoeld door een stuwmeer van gegevens, maar de betekenis ervan, de semantiek, blijft nog altijd ongrijpbaar in de lucht hangen. Daarnaast moet de computer ook nog kunnen bepalen wat voor mij belangrijk is. Dat vergt interpretatie. En computers zijn nog erg slecht in interpretatie. Dat heeft onder meer te maken met hoe ICT-ers hun vakgebied benaderen: er is heel veel aandacht voor de ‘T’ in ICT, i.e. de technologie. Maar er is veel minder aandacht voor de ‘I’: de informatie.

Wat maakt iets eigenlijk tot informatie? Laten we voor het antwoord op die vraag te raden gaan bij de grootste informatiebron die we tot onze beschikking hebben. Het wereldwijde web heeft ons Wikipedia gebracht en daarin valt te lezen: “Informatie (van Latijn informare: "vormgeven, vormen, instrueren") is alles wat kennis toevoegt en zo onwetendheid, onzekerheid of onbepaaldheid vermindert.” Wikipedia vervolgt met “Strikt genomen is informatie pas informatie als die interpretabel is. Interpreteren en integreren van informatie resulteert in kennis.”; en dat is precies wat we de semantiek noemen.

Naast informatie kennen we ook het begrip gegevens (of dichter bij het Engels: data). Het verschil tussen gegevens en informatie is precies de semantiek. Gegevens worden informatie door hun samenhang in een bepaalde context en representatie, die valt uit te drukken in concreet geformuleerde feiten; en dat is de semantiek.

Dat semantiek een fenomeen is dat moeilijk te automatiseren valt, is evident. Maar de oplossing komt in zicht als we in IT de focus leggen op de ‘C’ die uit ICT is weggevallen: Communicatie.

Want door communicatie te vangen en te duiden kunnen we een begin maken met het digitaal vangen van de semantiek. De truc is dat we communicatie moeten gaan omzetten in feiten. Als we die stap gezet hebben komt een ideaalbeeld in zicht: ‘Big Semantics’.

In dit ideaalbeeld wordt informatie en mijn interpretatie daarvan ook aan de computer bekend. Hiermee begrijpt de computer - in de vorm van een algoritme - het belang van mailtjes en kan hij mij helpen de prioriteit van mijn mails te bepalen. Als het algoritme zaken niet kan duiden, omdat hij uit de context van de gegeven communicatie geen herkenbare feiten kan halen, moet hij dit voorleggen aan de enige persoon die daar wel een uitspraak over kan doen: ikzelf. Door de juiste vragen te stellen stelt het algoritme mij in staat om de relevante feiten in de gegeven communicatie te benoemen. Het komt er dus op neer dat het duiden van de relevante feiten uit de communicatie gefaciliteerd wordt aan de hand van … communicatie. Feitelijk gaat het om het opbouwen van mijn wereldbeeld aan de hand van mijn duiding van de feiten in de gegeven communicatie.

Uiteraard beperkt dit inzicht zich niet alleen tot mails. Het geldt voor de complete overvloed aan informatie die ons langs welke weg dan ook bereikt. E-mail diende hier als eenvoudig voorbeeld. Wellicht brengt het continu interpreteren van alle communicatie “big brother” associaties met zich mee. Maar ik en alleen ik ben de eigenaar van mijn op feiten berustende interpretatie van informatie. Die interpretatie moet dan ook zorgvuldig bewaakt worden en alleen beschikbaar worden gesteld aan mijzelf, wil ik niet hulpeloos in de vloedgolf van communicatie verdrinken. En dat geldt voor iedere eindgebruiker van een overvloed aan informatie.

Als we deze weg op gaan en de focus van de technologie in de IT kunnen verleggen naar informatie via communicatie, dan staan we aan de vooravond van een nieuw tijdperk, waarin we echt ondersteund gaan worden door computers, simpelweg omdat ze ons begrijpen. Om het maar eens in onvervalst Engels te zeggen: ‘The Era of Big Semantics'.

 

Links

Impressies:
Verwante sites: