在一个下着毛毛雨的下午,我参观了位于中国杭州的柔宇科技(Rokid)总部。这家初创公司专注于智能眼镜的开发。当我与工程师们交谈时,他们的普通话被实时翻译成英语,并通过公司最新原型设备投射在我右眼上方的一个微型透明屏幕上。
柔宇科技的高科技眼镜使用的是通义千问(Qwen),这是由中国电商巨头阿里巴巴(Alibaba)开发的开源大语言模型。通义千问虽然不是性能最强的AI模型,在衡量机器智能的各项基准测试中,OpenAI的GPT-5、谷歌(Google)的Gemini 3和Anthropic的Claude通常得分更高。它也不是第一个真正尖端的开源模型,社交媒体巨头Meta于2023年发布的Llama才是这一领域的先驱。
已过时:Llama 4 疲态:GPT-5 新锐:通义千问
通义千问以及其他中国模型(如DeepSeek、Moonshot AI、Z.ai和MiniMax)越来越受欢迎,原因在于它们既高效又易于调试。据AI模型和代码平台HuggingFace统计,7月份其平台上中国开源模型的下载量首次超过美国模型。虽然DeepSeek以较少的计算资源发布了一个尖端大语言模型而震惊世界,但据AI模型查询平台OpenRouter数据显示,通义千问的人气在今年迅速上升,已成为全球第二受欢迎的开源模型。
通义千问能够完成用户对先进AI模型的大多数需求。对柔宇科技的用户来说,这包括识别内置相机拍摄的产品、获取地图导航、起草信息、网络搜索等功能。由于通义千问可以轻松下载和修改,柔宇科技部署了一个针对其特定用途优化的版本。此外,通义千问还可以在智能手机或其他设备上运行精简版本,以应对网络中断的情况。
中国AI公司采取的开放态度,经常发表详细介绍新工程和训练技巧的论文,这与美国大公司日益封闭的做法形成鲜明对比。据Laude研究所(Laude Institute,一个倡导美国开源模型的非营利组织)联合创始人安迪·科温斯基(Andy Konwinski)表示,美国公司似乎过于担心泄露知识产权。通义千问研究团队的一篇论文,详细介绍了在训练过程中提升模型智能的方法,被评为今年NeurIPS会议最佳论文之一。
目前,不仅中国公司在使用通义千问进行原型设计和开发,美国企业也开始采用这一模型。Airbnb、Perplexity和英伟达(Nvidia)都在使用通义千问。据传,就连曾经的开源模型先驱Meta现在也在使用通义千问来帮助构建新模型。
科温斯基认为,美国AI公司过于关注在数学或编程技能等狭窄基准测试上获得边际优势,导致陷入疲惫和目标偏离的状态。通义千问和其他开源中国模型的崛起表明,衡量AI模型的关键标准不仅在于其智能程度,更在于它能在多大程度上被用于构建其他应用。从这个标准来看,通义千问和其他中国开源模型正在快速发展。