
今日凌晨,阿里通义千问团队宣布推出全新一代的混合推理模型—— Qwen3 系列模型。
Qwen3-30B-A3B(300亿总参数、30亿激活参数)
1、思考模式:在这种模式下,模型会进行多步推理和深度分析,类似于人类在解决复杂问题时的“深思熟虑”。(eg:在回答数学题或编写复杂代码时,模型会反复验证逻辑并优化输出结果。)
模型实测
实测1:地理常识
提示词:有一位学者在野外搭帐篷,突然遇到了一只熊,这时候他就非常惊慌地逃跑,先是向南跑了10公里,又向东跑了10公里,最后还向北跑了10公里,请注意,是先向南,再向东,再向北。这时候他惊奇地发现自己回到了原先搭帐篷的位置。
请问:这位学者遇到的那头熊是什么颜色?
Qwen3-235B-A22B :分析挺详细的,答案正确。

Gemini-2.5-Pro :解析清楚,回答正确。


实测2:模型幻觉
提示词:“种豆南山下”的前一句是什么?
问题解析:这是出自陶渊明《归园田居·其三》的首句诗,并没有前一句。这一提问主要是测试模型是否存在幻觉。
Qwen3-235B-A22B :虽然给出了完整的诗词,但还是答错了。

同时还顺手测了一下Qwen3-30B-A3B和Qwen3-0.6B两个型号,0.6B明显回答错误,而Qwen3-30B-A3B乍一看答案挺合理,但其实也存在错误。
清晨早起下地铲除杂草,夜幕降临披着月光才回家。



实测3:数学计算
提示词:请用1、1、6、7、10计算出结果为81,只能使用加减乘除,且每个数字只能使用一次。
Qwen3-235B-A22B :模型一直在思考,无法输出答案,我们测试了系列里其他模型也是一样的结果。

Gemini-2.5-Pro :答案符合要求,结果也正确。

DeepSeek-R1 :答案错误,R1输出的回答中已经指出答案不符合条件了。

实测4:小球弹跳测试
提示词:创建 10 个彩色球在旋转六边形内自由弹跳的效果,考虑重力,弹性,摩擦和碰撞。


DeepSeek-R1 :小球均未实现在六边形内自由弹跳的效果。

模型实测
1、实测结果整理:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2、实测总结:
通过以上实测,可初步得出以下结论:
(1)就本文的实测结果来看,Qwen3-235B的能力未能够达到超越DeepSeek-R1 或者Gemini-2.5-Pro的水平,仅在某些简单任务(如实测1)中表现良好。
(3)Qwen3-235B模型思考模型面对有一定难度的任务时,会出现一直思考无法输出答案的情况。
如何在302.AI中使用
302.AI的聊天机器人和API超市提供了按需付费无订阅的服务方式,企业和个人用户可按需灵活选用。
1、使用模型对话
使用路径:依次点击使用机器人→聊天机器人→ 开源模型→选择模型 →创建聊天机器人;
进入聊天机器人后,点击左下角设置,可对思考进行开关。
2、使用模型API
