阿里慎重发布千问最强AI(东说念主工智能)模子万博manbext体育官网。
1月26日晚间,阿里慎重发布预报已久的千问旗舰推理模子Qwen3-Max-Thinking。据先容,该模子创下数项泰斗评测大家新记录,性能比好意思GPT-5.2、Gemini 3 Pro,成为迄今为止最接近海外顶尖模子的国内最强AI大模子。通义团队还为其引入了两项中枢翻新:自符合器用调用能力和测试时彭胀技能(Test-Time Scaling)。
从参数来看,千问新模子总参数超万亿(1T),预覆按数据量高达36T Tokens,是现在阿里限制最大、能力最强的千问推理模子。该模子进行了更大限制的强化学习后覆按,并通过推理技能的系列翻新,最终完成模子性能的大幅飞跃。
此前,预览版Qwen3-Max-Thinking已斩获数学推理AIME 25和HMMT 25的国内首个双满分。在此基础上,阿里通义团队进行了更大限制的强化学习后覆按,全面擢升了郑再版Qwen3-Max-Thinking性能。
在多项要道性能基准测试中,千问推崇进步了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等顶尖模子,刷新科学常识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项要道性能基准测试的大家记录。

千问在多项要道性能基准测试中的推崇。起原:阿里云
据先容,在要道的模子推理能力擢升中,千问新模子罗致了一种全新的测试时彭胀机制。业界庞杂的推理时策画,只会简便加多并行推理旅途,重迭推导已知论断,变成冗余推理效果低下;而千问罗致的这一新机制,可对此前推理的限度进行“教唆索求”式的提真金不怕火,并据此进行多轮自我迭代,在换取的高下文中收尾更高效的推理策画,获取更智能的推理限度。
此外,Qwen3-Max-Thinking还大幅增强了自主调用器用的原生Agent能力。具体而言,通义团队对模子进一步在无数各样化任务上进行了基于秩序奖励与模子奖励的勾通强化学习覆按。模子粗略自主采取搜索、个性化记念和代码阐述器等三个中枢的Agent器勤勉能,提供和专科东说念主士同样水平的回应。同期,模子幻觉也大为缩小。
现在,等闲用户不错通过千问PC端和网页端试用模子,斥地者可在QwenChat上免费体验Qwen3-Max-Thinking模子,企业可通过阿里云百真金不怕火获取新模子API职业。据了解,千问APP也行将接入新模子,系数效户齐可免费体验。
阿里Qwen大模子的研发始于2022年,仍是成为大家排行第一的开源大模子。大模子Qwen3-Max发布于2025年9月,是通义千问家眷中最大、最强的基础模子。
26日本日,阿里巴巴好意思股(NYSE:BABA)跌1.07%收于每股171.38好意思元万博manbext体育官网,总市值4091亿好意思元;港股(9988.HK)27日盘前涨超2%。