OpenAIが人間を使わずAIの安全性を高める手法「Rule-Based Rewards(RBR)」を開発