印度AI公司获Meta千万美元资助多语言AI如何破解数字鸿沟？开源模型能否改变印度科技格局？ AI本地化对新兴市场意味着什么？

项目背景

Meta今日宣布将印度科技公司认知实验室（CognitiveLab）列为2024年Llama影响力基金的全球获奖者之一，以表彰其在Nayana多语言AI项目上的突出成果。该研究团队将利用这笔资金扩大AI在22种以上语言中的应用，预计覆盖超过30亿人口。

技术优势

Nayana是一个多语言、多模态语言模型，整合了Llama用于文档和图像处理，重点支持资源稀缺的印度语言。该模型涵盖文本、视觉和语音功能，在10种印度语言的光学字符识别（OCR）方面的表现优于现有基准。

Meta印度公共政策副总裁兼负责人希夫纳特·图克拉尔（Shivnath Thukral）表示："开源AI是弥合数字鸿沟的有力工具，尤其是在印度这样多元化的国家。通过2024年Llama影响力基金，我们很自豪能够支持Nayana项目，使数十亿人能够接触先进的AI技术。"

发展规划

CognitiveLab创始人沙希·库马尔（Shashi Kumar）表示："Llama影响力基金使我们能够加快Nayana项目的发展进度，包括扩大语言覆盖范围、增强多模态功能，并为资源稀缺的语言社区构建高质量训练数据集。"

Llama影响力基金始于2023年，支持基于Meta开源大语言模型（Llama 2、Llama 3和Llama 4）开发的项目。目前，Llama系列模型已获得超过10亿次下载，派生出8.5万个模型，在全球研发社区得到广泛应用。

未来展望

CognitiveLab计划利用这笔资金改进印度语言分词器，开发语音、文本和图像处理的新数据集，并发布适用于资源受限环境的部署工具。印度作为Llama最大市场之一，当地开源开发者正积极利用这些模型构建满足本地需求的解决方案。