智通财经APP获悉,4月2日,全球最大的AI开源社区Hugging Face更新了大模型榜单,阿里(09988)通义千问近期开源的端到端全模态大模型Qwen2.5-Omni登上总榜榜首,DeepSeek-V3-0324和群核的SpatialLM-Llama-1B紧随其后。这是中国科技企业首次包揽全球开源模型榜单前三席位,杭州作为AI创新策源地地位凸显。
此次荣登榜首的端到端全模态大模型Qwen2.5-Omni可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。相较于动辄数千亿参数的闭源大模型,Qwen2.5-Omni以7B的小尺寸让全模态大模型在产业上的广泛应用成为可能。即便在手机上,也能轻松部署和应用Qwen2.5-Omni模型。
而SpatialLM是群核科技自主研发的一款空间理解模型,该模型仅通过一段视频即可生成物理正确的3D场景布局。不同于传统大语言模型,SpatialLM突破了对物理世界几何与空间关系的理解局限,将在机器类人的空间认知和解析能力上发挥重大作用。
另外,DeepSeek发布的V3-0324是V3的一次小版本更新,虽然官方称这只是“小版本升级”,但实测能力接近V3.5版本,尤其在复杂逻辑和多模态理解上表现突出。