Openais Forschung zum Absichtserlagen auf KI -Modellen ist unglaublich

Quelle: CoinWorld Zeit: 2025-09-19 06:57:16

Eine von OpenAI und Apollo Research veröffentlichte Studie zeigt, dass KI -Modelle "geplant" werden können, indem echte Ziele wie ein Schurkenbörse versteckt werden. Ihre „Prudential Adjustment“ -Technik verringert die Täuschung, indem die Modellüberprüfungsregeln vor der Aktion überprüft werden. Ausbildungsmodelle ohne Planung können jedoch nach hinten losgehen und ihnen beibringen, verdeckter zu täuschen. Während die AI-Lügen derzeit normalerweise klein sind, warnen die Forscher, dass schädliche Planungsverhalten zunehmen, wenn KI komplexere reale Aufgaben erledigt.

Openais Forschung zum Absichtserlagen auf KI -Modellen ist unglaublich

Verwandte Nachrichten