全球AI工具

全球AI工具

  • 📚 站点推荐 ›
    首页 热门推荐 最新收录
全球AI工具

全球AI工具

首页
AI工具
AI写作工具 AI图像工具 AI视频工具 AI办公工具 AI智能体 AI聊天助手 AI编程工具 AI设计工具 AI音频工具 AI搜索引擎 AI开发平台 AI学习网站 AI训练模型 AI模型评测 AI内容检测 AI提示指令
AI应用
AI项目
AI工具 AI项目和框架
教程资源
AI专栏 AI问答 AI百科 AI名人堂
关于我们
  • AI写作工具 0
  • AI图像工具 0
    • 常用AI图像工具
    • AI图片插画生成
    • AI图片背景移除
    • AI图片物体抹除
    • AI图片无损放大
    • AI图片优化修复
    • AI商品图生成
    • AI 3D模型生成
  • AI视频工具 0
  • AI办公工具 0
    • AI幻灯片和演示
    • AI表格数据处理
    • AI思维导图
    • AI文档工具
    • AI会议工具
    • AI招聘求职
    • AI法律助手
    • AI语言翻译
    • AI效率提升
  • AI智能体 0
  • AI聊天助手 0
  • AI编程工具 0
  • AI设计工具 0
  • AI音频工具 0
  • AI搜索引擎 0
  • AI开发平台 0
  • AI学习网站 0
  • AI训练模型 0
  • AI模型评测 0
  • AI内容检测 0
    • 内容检测
    • 降AI/AIGC率
  • AI提示指令 0

AI模型评测

共 16 个工具 | 第 1/1 页
AI Ping
AI Ping
AI大模型服务性能评测平台
MagicArena
MagicArena
字节推出的视觉生成模型对战平台
MMLU
MMLU
大规模多任务语言理解基准
Open LLM Leaderboard
Open LLM Leaderboard
Hugging Face推出的开源大模型排行榜单
C-Eval
C-Eval
一个全面的中文基础模型评估套件
FlagEval
FlagEval
智源研究院推出的FlagEval(天秤)大模型评测平台
SuperCLUE
SuperCLUE
中文通用大模型综合性测评基准
AGI-Eval
AGI-Eval
AI大模型评测社区
OpenCompass
OpenCompass
上海人工智能实验室推出的大模型开放评测体系
CMMLU
CMMLU
一个综合性的大模型中文评估基准
MMBench
MMBench
全方位的多模态大模型能力评测体系
HELM
HELM
斯坦福大学推出的大模型评测体系
LMArena
LMArena
AI模型评估平台
LLMEval3
LLMEval3
由复旦大学NLP实验室推出的大模型评测基准
H2O EvalGPT
H2O EvalGPT
H2O.ai推出的基于Elo评级方法的大模型评估系统
PubMedQA
PubMedQA
生物医学研究问答数据集和模型得分排行榜