acceptance-bench

Public

A robust LLM evaluation framework measuring acceptance vs refusal across difficulty levels. Features multi-prompt variation testing, temperature sweeping, and LLM-as-judge evaluation. Current focus: creative writing benchmarks including erotica generation tasks.

MIT License

Updated Jan 17, 2026

Created Oct 16, 2025

87 stars

1 forks

1 watchers

0 open issues

Languages

Codebase composition by bytes

Top Contributors

EL ellydee

1 commits