星空体育官网10月17日志者获悉,司南 OpenCompass大道话模子评测榜9月榜单揭晓,阿里通义千问开源模子Qwen2.5-72B-Instruct 打败Claude 3.5、GPT-4o等闭源模子,成为该评测榜首个开源模子冠军。据明了,9月底通义千问开源模子Qwen系列的衍生模子数目初次超越Llama,成为环球最大的开源模子群。
司南 OpenCompass 是由上海人为智能实习室研发的大模子评测体例平台,OpenAI、阿里巴巴、智谱AI、Meta、零一万物等百余个最主流的大模子均已参加评测,是最具国际影响力的中国巨擘第三方评测榜单。司南 OpenCompass 自筑评测榜单每月一更,从道话、推理、学问、代码、数学、指令跟班、智能体等七大才能维度、十余项细分职司,对近期主流模子举办全盘评测领悟。
司南 OpenCompass 评判称,Qwen2.5的登顶,标识着开源社区正在模子周围赢得迅疾发扬,以 Qwen 2.5等为代表的国产主流厂商模子,正在通过最新一轮技艺迭代后,其功能有了明显提拔,与国际顶尖模子之间的差异正正在迅疾缩幼,揭示了国产模子的壮大逐鹿力。
早正在9月底,Qwen2.5-72B-Instruct就冲进Chatbot Arena大模子盲测榜单前十,是前十中独一的中国大模子。Qwen系列开原模子涵盖多尺寸的大道话模子、多模态模子、数学模子和代码模子,简直一切尺寸的模子都竣工了一致范围的最佳功能星空体育官方。截至9月底,环球开辟者基于Qwen系列二次开辟的衍生模子数目也已打破7.43万,超越Llama的7.28万,成为环球最大的开源模子群超越。星空体育官方超越Claude 35GPT-4o等顶尖关源模子阿里通义开源模子Qwen25斩获OpenCompass评测榜冠军