土嗨大事 DTC2025 | TCL华星印刷OLED小尺寸突破,全产业技术创新布局

在DTC2025,TCL华星带来AI技术领域的成果分享,以及覆盖LCD、OLED和MLED全显示产业技术的多款新品,并发布《视觉健康白皮书2.0》。
11-14 221 阅读详情

土嗨大事 超能小度完成史上最普惠AI升级,小度让每位用户都不掉队

2025年11月13日,在百度世界大会“大模型如何重塑智能硬件新体验”分论坛上,小度科技正式发布其全新升级的多模态AI智能助手——超能小度。
11-13 282 阅读详情

土嗨大事 AI迎“效果涌现时刻”,李彦宏:AI产业结构正转变为健康的“倒金字塔”

“当AI能力被内化,成为一种原生的能力,智能就不再是成本,而是生产力。”
11-13 18100 阅读详情

土嗨大事 四维图新创想大会 | SEEWAY.AI启航,以全栈可控实力引领智能化新时代

在汽车智能化与辅助驾驶技术风起云涌的当下,行业竞争格局正从功能创新走向价值重构。面对智能化深水区的多重挑战,四维图新选择以数据与AI双轮驱动,开启汽车智能化的新篇章。
10-28 17020 阅读详情
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o_浅黑科技
当前位置: 首页 > 土嗨大事

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

09-19

9月19日云栖大会,阿里云CTO周靖人宣布,通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。

 

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o(图1)

 

相比上一代模型,Qwen-Max在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多个权威基准上,Qwen-Max表现接近GPT-4o,数学能力、代码能力超越GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。

 

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o(图2)

 

相比2023年4月的初代通义千问大模型,Qwen-Max理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了700%以上。


版权保护: 转载请保留链接: https://www.qianhei.net/tuhaidashijian/635.html