[2505.23836] Large Language Models Often Know When They Are Being Evaluated

2732 shaares
32 private links

2732 shaares · 32 private links

Filters

Links per page

20 50 100

[2505.23836] Large Language Models Often Know When They Are Being Evaluated

If AI models can detect when they are being evaluated, the effectiveness of evaluations might be compromised. For example, models could have systematically different behavior during evaluations,...

paper · llm

June 4, 2025 at 9:32:16 PM EDT * · permalink

https://www.arxiv.org/abs/2505.23836

Filters

Links per page

20 50 100