通用对话、推理数学、代码生成
Arena ELO
OpenCompass
MMLU
C-Eval
AIME 2024
MATH-500
LiveCodeBench
HumanEval
SWE-bench
图像与视频的生成和编辑,覆盖四种输入输出模态组合
GenEval
T2I-CompBench
EditBench
主观质量评分
VBench
VBench-I2V
主观动态质量评分
图文理解、文档解析、视频理解
MMBench
MMMU
DocVQA
MathVista
企业级语音识别转写与自然语音合成
LibriSpeech WER
AISHELL CER
Common Voice
MOS 主观评分
响应延迟
语义检索向量模型与重排序模型,构建企业知识库的核心组件
MTEB English
MTEB Chinese
BEIR
MTEB Reranking
以上标注「在线」的模型现已可用,其他模型可按需部署,最快当天开通。OpenAI 兼容接口,改一行代码即可接入。