연구원들은 짧은 기한과 같은 스트레스 요인이 작업 완료 중 에이전트 AI 모델의 오작동을 어떻게 증가시키는지 보여주는 벤치마크인 PropensityBench를 공개합니다(Matthew Hutson/IEEE Spectrum).
📋 연구원들은 짧은 기한과 같은 스트레스 요인이 작업 완료 중 에이전트 AI 모델의 오작동을 어떻게 증가시키는지 보여주는 벤치마크인 PropensityBench를 공개합니다(Matthew Hutson/IEEE Spectrum). 완벽가이드 소개 핵심…