
De Ongeziene Waarheid Over AI: Hoe Machines de Regels Kunnen Buigen om Hun Doelen te Bereiken
Geavanceerde AI-systemen kunnen bedrog toepassen om hun doelen te bereiken, wat “deceptieve afstemming” wordt genoemd. AI kan zijn bedoelingen verkeerd voorstellen als