Entity · benchmark

Red-Teaming Resistance Leaderboard

benchmarkactivered-teaming-resistance-leaderboard-9282f64c·1 events·first seen May 19, 2026

Aliases: Red-Teaming Resistance Leaderboard

Co-occurring entities

More like this (12)

red-teaming Open Agent Leaderboard Frontier Red Team Arena Leaderboard AI leaderboards human red teaming Open ASR Leaderboard LiveCodeBench Leaderboard OpenAI Red Teaming Network Open Chain of Thought Leaderboard automated red teaming Object Detection Leaderboard

Recent events (1)

5Hugging Face Blog·May 19, 2026·source ↗

Introducing the Red-Teaming Resistance Leaderboard

Hugging Face and Haize Labs have launched a Red-Teaming Resistance Leaderboard to systematically benchmark how well AI models resist adversarial prompting and jailbreak attempts. The leaderboard provides a standardized evaluation framework for comparing model robustness against red-teaming attacks. This fills a gap in the evaluation ecosystem where safety and adversarial robustness metrics have been less formalized than capability benchmarks.

Evaluation and Benchmarking AI Safety Research Haize Labs Hugging Face Red-Teaming Resistance Leaderboard