E-mail : xitang@126.com郑州市紫荆山路72号裕鸿花园D座5层
当前位置: 首页 >

为什么Qwen模型总给我一种又土又low的感觉?

本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。

虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。

为什么Qwen模型总给我一种又土又low的感觉?
分享到:

喜堂郑州店  TEL:0371-53737377 / 53737317  E-MAIL:xitang@126.com
                ADD:郑州市紫荆山路72号裕鸿花园D座5层
版权@|备案:皖-ICP备83350062号-1|网站地图 织梦模板