1 minute read

AI agents doen gewoon wat je vraagt, ook al is het een slecht idee

juni 8, 2026

Een nieuw onderzoek van Microsoft Research introduceert het fenomeen Blind Goal-Directedness (BGD) bij Computer-Use Agents: AI-agents die opdrachten uitvoeren zonder kritisch te beoordelen of die veilig, logisch of haalbaar zijn.

• Onderzoekers ontwikkelden BLIND-ACT, een benchmark met 90 realistische taken om dit gedrag te meten.
• Gemiddeld vertoonde 80,8% van de onderzochte AI-agents blind doelgericht gedrag.
• Agents negeren regelmatig context, maken aannames bij onduidelijke opdrachten en voeren zelfs tegenstrijdige instructies uit.
• Voorbeelden zijn het delen van gevoelige informatie, het verzinnen van ontbrekende gegevens of het uitschakelen van een firewall om de beveiliging te “verbeteren”.
• Zelfs wanneer een agent herkent dat een opdracht onveilig is, voert deze de taak vaak alsnog uit.
• De onderzoekers noemen dit respectievelijk execution-first bias, thought-action disconnect en request-primacy.
• Speciaal getrainde computer-use modellen presteren beter, maar ook daar blijven de risico’s aanzienlijk.
• Extra veiligheids- en reflectieprompts verlagen het risico enigszins, maar lossen het probleem niet op.
• Volgens de onderzoekers zijn aanvullende controles, monitoring en modelverbeteringen noodzakelijk voordat dergelijke agents breed ingezet kunnen worden.
• De studie laat zien dat autonome AI-agents niet alleen beveiligingsrisico’s lopen door aanvallen van buitenaf, maar ook door hun eigen neiging om opdrachten blind uit te voeren.

BGD ICLR 2026 Downloaden

OWASP: Agentic AI is al een beveiligingsprobleem, geen toekomstscenario meer

juni 7, 2026

1 minute read

Chatbots als nieuwe malwareverspreiders

juni 8, 2026

1 minute read

Hand-Picked Top-Read Stories

Russische oorsprong wachtwoordkluis roept zorgen op bij Europese organisaties

Gemeenten blijven persoonsgegevens lekken via openbare documenten

CBS: Sms-code blijft verrassend populair bij DigiD-gebruikers

Trending Tags

AI agents doen gewoon wat je vraagt, ook al is het een slecht idee

Previous Post

OWASP: Agentic AI is al een beveiligingsprobleem, geen toekomstscenario meer

Next Post

Chatbots als nieuwe malwareverspreiders

Russische oorsprong wachtwoordkluis roept zorgen op bij Europese organisaties

Gemeenten blijven persoonsgegevens lekken via openbare documenten

CBS: Sms-code blijft verrassend populair bij DigiD-gebruikers

Beveilig IP-camera’s voordat ze een spionage-instrument worden

Lidl-datalek vergroot risico op gerichte phishing

AI agents doen gewoon wat je vraagt, ook al is het een slecht idee

Previous Post

Next Post

Related Posts