阿联酋推出低成本AI推理模型宣称“性价比”超同行20倍

作者：

在

财联社9月9日讯（编辑赵昊）当地时间周二（9月9日），阿联酋穆罕默德·本·扎耶德人工智能大学（MBZUAI）在官网宣布，其与G42共同推出了一款低成本的推理模型“K2 Think”。

新闻稿声称，K2 Think仅需320亿个参数，却能超越其他公司的、规模大20倍的推理模型。该模型基于阿里巴巴开源Qwen 2.5模型构建，并在Cerebras提供的硬件上运行和测试。

MBZUAI基础模型研究所所长Hector Liu告诉媒体，团队通过多种方法实现了高性能表现，包括：长链式思维监督微调（CoT） —— 一种逐步推理的方法；推理阶段扩展（test-time scaling） —— 在推理阶段分配更多计算资源来提升表现。

Liu表示：“特别之处在于，我们把它当作一个系统来对待，而不仅仅是一个模型。和普通的开源模型仅仅‘发布’不同，我们会实际部署该模型，并观察如何随着时间的推移改进模型。”“如果问哪一步最关键，很难单独指出。这更像是一整套方法的组合，才得出了最终结果。”

新闻稿写道，“K2 Think不仅仅是一项技术成就，更是阿联酋人工智能领域的一个决定性时刻。”

近年来，阿联酋也试图将自己定位为AI全球领导者，以提升地缘政治影响力，并减少对原油的依赖。

阿联酋的AI企业G42就是其突围的例子。但其竞争对手包括邻国沙特，后者今年5月通过主权基金成立Humain，致力于打造全栈AI能力。

更宏观来看，阿联酋AI产业要追赶中美仍有很长路要走。美国的OpenAI和科技巨头已占据先机，中国也早已把AI列为战略重点。

尽管K2 Think的表现可与OpenAI相媲美，开发者强调，他们的目标并不是打造另一个ChatGPT。

MBZUAI基础模型研究所总经理Richard Morton解释说，这个模型是为数学、科学等特定应用领域而设计。

他说：“人类大脑的基本推理能力是所有思维过程的基石。这个应用能把原本需要1000到2000人耗费五年时间才能完成的问题思考或临床实验，大大缩短周期。”

此外，它还能让缺乏美国那样资本与基础设施的地区，也能使用先进AI技术。Morton总结道：“我们正在发现，用更少的资源，其实可以做到更多。”

2020最新自助免费申请Office365教育版，免费5TOneDrive云盘详细图文教程