From hard refusals to safe-completions: toward output-centric safety training

Aug 7, 2025

—

Discover how OpenAI’s new safe-completions approach in GPT-5 improves both safety and helpfulness in AI responses—moving beyond hard refusals to nuanced, output-centric safety training for handling dual-use prompts.

From hard refusals to safe-completions: toward output-centric safety training

Comments

Leave a Reply Cancel reply