뉴스 상세

AI 모델에 대한 의도적 거짓말에 대한 Openai의 연구는 믿어지지 않습니다.

출처: CoinWorld
OpenAI 및 Apollo Research에서 발표 한 연구에 따르면 AI 모델은 불량 주식 중개인과 같은 실제 목표를 숨겨서 "계획"할 수 있습니다. 그들의 "Prudential 조정"기술은 행동 전에 모델 검토 반대 규칙을 검토함으로써 속임수를 줄입니다. 그러나 계획이없는 훈련 모델은 역효과를 낳을 수 있으며, 더 은밀하게 속이는 것을 가르 칠 수 있습니다. AI 거짓말은 일반적으로 일반적으로 작지만 연구자들은 AI가 더 복잡한 실제 작업을 처리함에 따라 유해한 계획 행동이 증가 할 수 있다고 경고합니다.
링크가 클립보드에 복사되었습니다