AI & WIJ - “Tinder” voor Groepswerken
Je associeert een app als Tinder doorgaans niet met groepswerk. Maar stel je een wereld of klaslokaal voor waar de teamleden voor dat groepswerk niet geselecteerd worden door de leerkracht of of vriendjes-bij-elkaar, maar door een algoritme? Toekomstmuziek, zeg je? Het gebeurt al vaker dan dat je denkt. Steeds meer CV’s op de reguliere arbeidsmarkt worden doorgelicht én beoordeeld door allerhande artificiële intelligentie. Tijd voor een experiment én bewustwording met dit educatief AI project!
De ideale partner IRL
Of het nu gaat over dating of een vinden van een nieuwe medewerker, het draait rond matching. Je bent op zoek naar iemand met bepaalde kwaliteiten. Kwaliteiten die je goed vindt. Simpel, niet? Maar welke kwaliteiten vinden we nu ‘goed’?
Als we even stil staan bij dating en onze eigen psychologie, kunnen we een leuk experiment uitvoeren. Haal er het Instagramaccount ‘Siblings or Dating’ bij, en je hebt al even plezier. We merken er op dat het verdomd moeilijk is om ‘siblings’ of ‘love partners’ uit elkaar te halen. Dit komt door een simpele vaststelling: siblings lijken op elkaar, wegens gedeeld DNA en gedeelde opvoeding. Maar de mensen waar we voor vallen, lijken ook op ons! De ‘dating’ koppels lijken ook op elkaar! Wat is hier aan de hand?
De kwaliteiten die we zoeken in een liefdespartner, zijn vaak dezelfde als deze die wij bezitten. De uitspraak ‘opposites attract’, is statisch veelal een fabel. We vallen net op de gelijkenissen, en dat is ook maar logisch. Ben jij een grote fan van boeken en fantasy? Dan zal de kans groter zijn dat jouw partner dat ook is, in plaats dat ie een grondige hekel heeft aan boeken. Verschillen in interesses, meningen, opvattingen … kunnen zorgen voor wrijving. Het klinkt misschien wat onbedoeld narcistisch, maar we zijn aangetrokken tot de (positieve) kwaliteiten die wij ook bezitten! (Het is immer niet zo dat liefdespartners na een poos op elkaar beginnen lijken. Onderzoek, met AI, door Tea-Makron weerlegde onlangs die hypothese).
Tinder en schaakmat
Die kwaliteiten en voorkeuren kunnen we in een algoritme gieten. Dat is wat Tinder zo succesvol doet. Je maakt een profiel aan, laadt er jouw foto’s en bio in, duidt even jouw locatie aan … bingo, swipen maar! Het klinkt simpel, maar het is de taal van het algoritme achter de schermen om jou geschikte kandidaten te tonen. Daarvoor gebruikt het algoritme de gegevens die hebt opgegeven bij het aanmaken van jouw profiel. Het kent tags toe en zoekt naar personen met dezelfde scores of interesses. Natuurlijk neemt het nadien ook jouw gedrag op de app mee in de berekening. Wie swipe jij naar de juiste kant, en vooral wie veegt jou naar de juiste kant? Hier komt zelfs een stukje schaak bij kijken. Daar werkt men met een ELO score. Een ELO-score bepaalt jouw relatieve positie in een zero-sum game (een spel met één winnaar, één verliezer). Hoe meer potjes je wint in schaakt, en hoe minder je er verliest, hoe hoger de ELO score. Bij een potje schaak tussen een hoge ELO-score en een lage score, is de kans groter dat de hoge score zal winnen. Gebeurt dit, dan stijgt die speler zijn score een beetje. Is er een verrassingsoverwinning voor de lage ELO-score, dan zal die enorm stijgen.
Wat heeft dit nu te maken met Tinder en matchmaking? Wel, Tinder gebruikt in het algoritme een variant van de ELO-score. Wordt jij naar de juiste kant geswiped maar swipe je de andere naar de andere kant, dan ‘win’ jij en ‘verliest’ de ander. Een zero-sum game, als het ware. Gebeurt dit vaak, dan gaat het algoritme ervan uit dat jij vrij aantrekkelijk bent en dicht jou een hoge ELO-score toe. Het algoritme zal de gebruikers met hoge scores, of die het meent heel aantrekkelijk te zijn, aan elkaar beginnen matchen … voila! De knappe zielen hebben elkaar gevonden, wat een toeval!
Tinder voor Groepswerken
Nu, hoe kunnen we deze soort algoritmes toepassen in de klas? Daarvoor gebruiken we een variant van de sentimentsanalyse. Dat is een tool waarbij een AI doorheen een stuk tekst gaat en, aan de hand van voorafbepaalde trefwoorden, het sentiment van de tekst tracht te achterhalen. Wordt techniek wordt toegepast om te beoordelen of een restaurantrecensie positief of negatief is.
We werken dus op basis van een tekst. Een motivatiebrief als het ware. Deze zullen we laten inlezen door onze AI. Naast een motivatiebrief moet onze AI ook een lexicon krijgen. Dit is een lijst met alle kwaliteiten waar het algoritme op moet letten. Een woordenlijst met bijvoorbeeld ‘teamspeler’ en een bijhorende score of polariteit. Deze polariteit plaatsen we tussen de -2 en 2.
We stellen zo een lexicon op op basis van de kwaliteiten die ik plukte van de site van het uitzendkantoor Tempo Team. Deze lijst bevat zo grofweg 45 kwaliteiten waar het algoritme op zal letten en is vrij aan te passen.
Daarna zal de AI onze brief doorgeven aan een Natural Language Processor (NLP). Deze ‘begrijpt’ Nederlands en zal onze tekst onderwerpen aan enkele aanpassingen, zoals:
Lowercasing: verwijderen van de hoofdletters;
Tokeniseren: opdelen van de tekst. Deze gaat van één lange string naar een lijst. Leestekens worden gescheiden van het laatste woord van een zin …;
Part-of-speech tagging: van die afzonderlijke delen van de zin wordt de woordsoort bepaald (werkwoord, adjectief of zelfstandig naamwoord);
Lemmatisering: de (werk)woorden in de brief worden herleid tot hun woordenboekvorm. “Gepresteerd” wordt zo opnieuw “presteren”.
Bag of words: eenmaal alles is geknipt, worden de delen in een figuurlijke zak gestoken en door elkaar geschud. De AI zal het aantal keer een bepaald woord voorkomt tellen en een som maken van de polariteit. “Teamspeler” komt driemaal voor en kent een polariteit van 1.7? Dan zal de score stijgen met drie maal 1.7. Deze stap zal ook de Achilleshiel vormen van deze aanpak!
Het eindresultaat is een totaalscore. De AI heeft elk afzonderlijk woord in de brief geanalyseerd en bij de woorden uit het lexicon de polariteit berekend. Het eindresultaat is dus de som van de afzonderlijke polariteiten!
Zo kunnen we een lexicon opstellen van de kwaliteiten die wij belangrijk vinden. We laten een AI de vele motivatiebrieven analyseren en berekenen wie de meest geschikte kandidaat is voor ons groepswerk!
Objectiviteit bereikt! Toch?
Corona heeft de omslag naar digitale oplossing in een stroomversnelling gebracht. Zo ook in het zoeken van een job op de arbeidsmarkt. Vooral in Duitsland en de VS duiken meer en meer verhalen op waarbij werkzoekenden hun motivatiebrief of interview beoordeeld werd door een AI. Zo streven naar objectiviteit is toe te juichen. We merkten dat er bij mensen toch enkele psychologische vooroordelen spelen. Maar dat streven naar objectiviteit moet hand in hand gaan met transparantie! Want meet de AI wel wat we willen? Is het echt objectief?
Amazon
Een van de bekendste experimenten met zo een aanpak komt uit de stal van Amazon. Daar bouwde men een AI met die de sollicitaties voor programmeerjobs zou doornemen. Ze lieten die AI trainen op de profielen van de bestaande medewerkers zodat het een eigen lexicon zou uitbouwen. Het bouwde dus zelf een soort ‘gewenste-waarden-profiel’. Wat bleek: na een periode viel op dat de AI enkel witte mannen, circa 30 jaar … selecteerde. Het was immer getraind op het bestaande personeel en dat was … wit en doorgaans uit die leeftijdscategorie. Meer zelfs, het systeem had geleerd om mannelijke pronouns een positieve polariteit toe te kennen, en vrouwelijke een negatieve! Zo sloop het bestaande vooroordeel, minder vrouwen in dat soort beroepen, in de AI!
Videosollicitatie
In het Duitse Beieren ging een team journalisten op onderzoek. Hoe objectief van de AI die video-interviews moest beoordelen? Ze kwamen tot enkele schokkende ontdekkingen. Zo bleek de score te veranderen als je bril droeg of voor een fictieve boekenkast zat (denk Teams-achtergrond).
Bij het analyseren van het niveau van het Engels deed men twee testen:
de vragen beantwoorden in het Engels (de journalist kreeg een score van 8.5/9);
de vragen beantwoorden door de Duitse wikipedia-pagina over psycholo-analyse voor te lezen (score was 6/9).
De zelfs wanneer een verkeerde taal werd gesproken, kreeg de sollicitant een goede score. Hoe objectief meet de AI dan het niveau van het Engels … ? Meer informatie over deze en soortgelijke experimenten vind je in de uitstekende podcast uit de MIT-reeks ‘In Machines We Trust’.
In eigen boezem kijken
Ook de aanpak in dit educatief project heeft een eigen Achilleshiel. Deze zit in de bag-of-words-aanpak. Bij deze aanpak worden de woorden uit een tekst los van de context behandelt. Een brief waarbij elke zin begint met de ik-vorm en boordevol verkeerde vervoegingen staat, kan eenzelfde score schrijven als een beter geschreven brief. De aanpak van de AI neemt de context niet mee! Het let enkel op de voorafbepaalde kernwoorden in het lexicon. Dat is een heel nauwe benadering van een stuk tekst. Deze afweging moet meegenomen worden wanneer een tool zoals deze gebruikt wordt bij een sollicitatie. Het kan gebruikt worden als ondersteuning, maar wellicht niet als enige factor bij zo een belangrijke beslissing.
Wat deze oefening wel toont, zijn de mogelijkheden van deze technologie, waar het reeds gebruikt wordt en de moeilijkheden waar we met zijn allen op moeten letten. Objectiviteit én transparantie!
Vragen, opmerkingen?
Vragen of opmerkingen over dit project of een van mijn andere projecten? Dan kan je hieronder terecht!