心流logo

印度AI公司获Meta千万美元资助 多语言AI如何破解数字鸿沟? 开源模型能否改变印度科技格局? AI本地化对新兴市场意味着什么?

项目背景

Meta今日宣布将印度科技公司认知实验室(CognitiveLab)列为2024年Llama影响力基金的全球获奖者之一,以表彰其在Nayana多语言AI项目上的突出成果。该研究团队将利用这笔资金扩大AI在22种以上语言中的应用,预计覆盖超过30亿人口。

技术优势

Nayana是一个多语言、多模态语言模型,整合了Llama用于文档和图像处理,重点支持资源稀缺的印度语言。该模型涵盖文本、视觉和语音功能,在10种印度语言的光学字符识别(OCR)方面的表现优于现有基准。

Meta印度公共政策副总裁兼负责人希夫纳特·图克拉尔(Shivnath Thukral)表示:"开源AI是弥合数字鸿沟的有力工具,尤其是在印度这样多元化的国家。通过2024年Llama影响力基金,我们很自豪能够支持Nayana项目,使数十亿人能够接触先进的AI技术。"

发展规划

CognitiveLab创始人沙希·库马尔(Shashi Kumar)表示:"Llama影响力基金使我们能够加快Nayana项目的发展进度,包括扩大语言覆盖范围、增强多模态功能,并为资源稀缺的语言社区构建高质量训练数据集。"

Llama影响力基金始于2023年,支持基于Meta开源大语言模型(Llama 2、Llama 3和Llama 4)开发的项目。目前,Llama系列模型已获得超过10亿次下载,派生出8.5万个模型,在全球研发社区得到广泛应用。

未来展望

CognitiveLab计划利用这笔资金改进印度语言分词器,开发语音、文本和图像处理的新数据集,并发布适用于资源受限环境的部署工具。印度作为Llama最大市场之一,当地开源开发者正积极利用这些模型构建满足本地需求的解决方案。