打开APP
阿里巴巴(09988)旗下通义千问发布Qwen3-Omni原生全模态大模型
蒋远华 09-26
阅读量

智通财经APP获悉,9月26日,阿里巴巴(09988)旗下通义千问正式发布了Qwen3-Omni。据通义千问介绍,Qwen3-Omni是原生全模态大模型,预训练全模态不降智,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音输出。

模型架构上,Qwen3-Omni采用Thinker-Talker架构:Thinker负责文本生成,Talker专注于流式语音Token生成,直接接收来自Thinker的高层语义表征。为实现超低延迟流式生成,Talker通过自回归方式预测多码本序列:在每一步解码中,MTP模块输出当前帧的残差码本,随后Code2Wav合成对应波形,实现逐帧流式生成。

香港交易所资讯服务有限公司、其控股公司及/或该等控股公司的任何附属公司均竭力确保所提供信息的准确和可靠度,但不能保证其绝对准确和可靠,且亦不会承担因任何不准确或遗漏而引起的任何损失或损害的责任(不管是否侵权法下的责任或合约责任又或其它责任)
更多精彩港美股资讯
相关阅读
点击下载