基准测试 | AIUG

标签：基准测试

什么是大模型基准测试

什么是大模型基准测试？大模型基准测试（Benchmark）‍是指用于评估大语言模型（LLM）性能的标准化数[…]

AI解读

3个月前

什么是SEED-Bench基准测试

SEED-Bench是一个用于评估多模态大语言模型（MultimodalLargeLanguageMo[…]

AI解读

11个月前

什么是HumanEval基准测试

HumanEval是一个由OpenAI开发的基准测试，用于评估大型语言模型（LLMs）在代码生成任务中的[…]

AI解读

11个月前