← 返回首页

evaluating-llms-harness

版本 1.0.0 • 作者:Orchestra Research

lm-eval-harness: benchmark LLMs (MMLU, GSM8K, etc.).

📥 安装命令

hermes skill install evaluating-llms-harness
分类
uncategorized
版本
1.0.0
作者
Orchestra Research
同步时间
2026-06-06

🏷️ 标签

EvaluationLM Evaluation HarnessBenchmarkingMMLUHumanEvalGSM8KEleutherAIModel QualityAcademic BenchmarksIndustry Standard