5月27日,知乎联合面壁智能在“2023中国国际大数据产业博览会”(以下简称“2023数博会”)上发布了最新的大语言模型成果。知乎合伙人、首席技术官李大海宣布,知乎模型应用“搜索聚合”即日开启内测,面壁智能研发的中文基座大模型CPM-Bee10b全面开源,并发布了对话类模型产品“面壁露卡”。李大海表示,知乎将携手面壁智能,让中文用户在大模型时代享受到最优质的服务。
(知乎合伙人、CTO 李大海)
在4月“2023知乎发现大会”上,知乎发布了大语言模型“知海图AI”并内测首个站内大模型应用功能“热榜摘要”。此举令知乎成为国内首批具备大语言模型能力的公司,并且让更多人开始关注知乎的技术发展。时隔一个月之后,知乎再度联合面壁在“2023数博会”上带来惊喜。李大海介绍,两家公司在技术上联合研发,同时产品上各有部署。
(知乎X 面壁 大模型成果发布会现场)
继“热榜摘要”之后,知乎带来了又一款站内的大模型应用功能“搜索聚合”。该产品将大模型能力应用到了知乎搜索上,每当用户触发搜索时,系统就会从大量提问和回答中聚合观点,提高用户获取信息、形成决策的效率。李大海表示,“搜索聚合”即日开启内测,知乎将继续夯实大模型基础能力,开发更多的社区应用让用户享受一流的大模型服务。
(“搜索聚合”展示图)
发布会上,面壁智能联合OpenBMB 社区,将自研CPM-Bee 10b 模型开源。李大海介绍,该模型从零开始自主训练,基于Transformer架构,中英双语表现优秀,拥有百亿量级参数、万亿级高质量语料。在ZeroCLUE评测中,CPM-Bee 10b以总分78.18分登顶;在英文常识知识推理榜单上,CPM-Bee 10b得到了67分的平均分,媲美英文开源模型LLaMA。“CPM-Bee10b 将全面开源,并允许商用。”李大海称,面壁智能一直坚持开源路线,未来也会持续拥抱开源,促进大模型领域技术和生态的繁荣。
发布会还带了面壁智能研发的对话类模型产品“露卡”(Luca)。该产品在开源基础模型上又有进一步性能提升,可以进行智能交互并支持多轮对话。在发布会现场演示中,“露卡”展示了多项能力,既能帮助人了解世界知识、处理数理逻辑、编写程序代码、激发创作灵感;还可以利用海量知识数据,帮助人更好地获取信息、做出规划、解决问题。发布会现场还展示了“露卡”优秀的多模态理解能力,不仅可以解析风景、地理等图片信息,还可以理解人物类图片所传达的情绪含义。此外,“露卡”还可以查找论文并生成摘要。李大海介绍,“露卡”目前已开启内测,面壁将不断完善功能,让更多用户体验到大模型带来的便利。
(面壁露卡对话展示图)