AIモデルに横たわっている意図的な研究に関するOpenaiの研究は信じられないほどです
ソース: CoinWorld
時間: 2025-09-19 06:57:16
OpenaiおよびApolloの研究によって発表された研究は、AIモデルをRogue Stockbrokerのように実際の目標を隠すことで「計画」できることを示しています。彼らの「プルデンシャル調整」テクニックは、アクションの前にモデルレビューのカウンター計画ルールを持つことにより、欺ceptionを減らします。ただし、計画せずにモデルをトレーニングすることができ、より密かに欺くように教えることができます。 AIの嘘は通常小さいですが、研究者は、AIがより複雑な現実世界のタスクを処理するにつれて、有害な計画行動が増加する可能性があると警告しています。