快手“快意大模型”获信通院5级评估

16 6月28日
share-image.png
邵翔宇

在近日举办的“可信AI·南京人工智能产业发展论坛”上,中国信息通信研究院(中国信通院)正式揭晓了“可信AI”大模型评测结果,快手“快意大模型”(KwaiYii-175B)在其组织的可信AI大模型评测中荣获最高等级——5级评估,这也是国内首个获得“大语言模型专项”5级评估的大语言模型,彰显了其在人工智能领域的技术创新实力与行业领先地位。

「快意」是快手大模型团队自主研发的大语言模型,能够实现高效的自然语言理解和文本生成,为复杂的知识问答、文案创作、实时翻译、逻辑推理,以及代码编写与分析等任务提供强大支持。

自去年 8 月份快手(01024)发布自研大语言模型「快意」(KwaiYii)-13B 版本以来,半年内快手又相继研发了 66B、175B 版本的大模型,用以适配不同的业务场景的需求。经过数万亿 Tokens 训练的快意大模型在 MMLU、C-Eval 等中英文权威榜单上均取得了行业领先的成绩,在实际用户体验和反馈中可以看到,快意 175B 的模型效果已显著超越了 ChatGPT-3.5,并达到了接近 GPT-4 的水平。

据介绍,“快意”模型通过硬件优化与混合并行算法的结合,实现了GPU集群算力利用效率超50%的提升,同时将推理成本有效控制在开源方案的十分之一,极大地推动了AI应用的经济性和实用性。

在数据处理层面,“快意”模型成功将PB级别的原始数据精炼为TB级高质量训练集,不仅大幅度降低了数据处理的负担,还通过课程学习式的组织方式,确保了模型训练的高效与平稳。此外,该模型覆盖了广泛的领域知识,进一步强化了其在多元化应用场景中的适应能力。

算法创新是快手此次获奖的关键。据悉,快手与国内外顶尖学术机构携手,共同提出了Temporal Scaling Law理论,为超参数优化提供了新的理论支撑。同时,通过创新集成Scaffold-BPE、MiLe Loss等务实高效的前沿算法,快手在提升模型预训练效率和效果上取得了重大进展。

在对齐技术上,快手采用Rejection Sampling等技术显著改善了数据质量,并通过多样本Packing、Iterative DPO/PPO、细粒度Loss等策略,有效提高了训练的稳定性和模型性能。在解码策略上,提出了创新性的并行解码预测策略,大幅提升了推理速度。

接下来,快手还将在即将召开的2024世界人工智能大会(WAIC)上,举办以“新AI·新应用·新生态”为主题的大模型技术生态论坛。届时,快手将发布最新的大模型技术与应用战略,包括快手大模型技术矩阵全景、基座模型技术创新、应用和落地情况等。

相关港股

相关阅读

快手-W(01024)6月27日斥资约2943.7万港元回购63.15万股

6月27日 | 钱思杰

快手-W(01024)6月25日斥资2931.14万港元回购62.5万股

6月25日 | 谢雨霞

快手-W(01024)6月24日斥资约5694.4万港元回购121.2万股

6月24日 | 吴浩峰

快手-W(01024)6月21日斥资2939.21万港元回购60万股

6月21日 | 钱思杰

快手-W(01024)6月20日斥资5856.19万港元回购118.56万股

6月20日 | 吴经纬