心流logo

Deep Cogito发布新一代混合推理AI模型 混合AI模型将如何改变我们的工作方式? 为什么推理能力对AI模型如此重要? 通用超级智能是否真的可以实现?

创新技术突破

深度认知科技公司(Deep Cogito)正式走出隐身状态,推出一系列开放可用的AI模型。这些模型最大的特点是可以在"推理"和非推理模式之间灵活切换。得益于其能够通过逐步解决复杂问题来进行自我验证的能力,推理模型(如OpenAI的o1)在数学和物理等领域展现出了巨大潜力。

技术优势

所有被称为Cogito 1的模型都采用混合架构设计。这种设计既可以快速回答简单问题,又能在处理复杂查询时投入更多时间进行深入思考。公司表示,这些模型的性能超过了同等规模的最佳开源模型,包括Meta和中国AI初创公司深度求索(DeepSeek)的产品。

模型规格与性能

Cogito 1模型系列的参数规模从30亿到70亿不等,公司计划在未来几周和几个月内推出参数规模达到671亿的新模型。值得注意的是,Cogito 1是基于Meta的Llama和阿里巴巴的Qwen模型构建的,通过创新的训练方法提升了基础模型性能。

根据内部基准测试,启用推理功能的Cogito 70B模型在数学和语言评估方面超越了深度求索的R1推理模型。同时,在禁用推理功能的情况下,该模型在通用AI测试平台LiveBench上的表现也优于Meta最新发布的Llama 4 Scout模型。目前,所有Cogito 1模型都可以通过Fireworks AI和Together AI云服务提供商获取。

Cogito 1与其他主流开源AI模型的性能对比图(图片来源:Deep Cogito)

公司背景

总部位于旧金山的Deep Cogito成立于2024年6月,由德里尚·阿罗拉(Drishan Arora)和德鲁夫·马尔霍特拉(Dhruv Malhotra)共同创立。马尔霍特拉此前在谷歌DeepMind担任产品经理,负责生成式搜索技术;阿罗拉则曾任谷歌高级软件工程师。

在South Park Commons等机构的支持下,Deep Cogito致力于构建"通用超级智能",目标是开发出能够超越人类表现并发掘全新能力的AI系统。公司表示,目前仍处于扩展曲线的早期阶段,仅使用了传统大语言模型训练所需计算资源的一小部分。