OpenAI公布最新版本GPT-4 称其能在SAT考试中击败90%人类

318 3月15日
share-image.png
许然 智通财经编辑

智通财经APP获悉,周二,OpenAI公布了其主要大型语言模型GPT的最新版本GPT-4,并表示模型在许多专业测试中表现出“人类水平的性能”。

ChatGPT-4比以前的版本“更大”,这意味着它已经在更多的数据上进行了训练,它的运行成本也更高。

目前,此领域的许多研究人员认为,人工智能领域的许多最新进展,都来自于在数千台超级计算机上运行越来越大的模型,这些模型的训练过程可能耗资数千万美元。GPT-4是“扩大规模”以获得更好结果的训练方法的一个例子。

OpenAI表示,它使用的是微软(MSFT.US)Azure训练模型,微软已经向这家初创公司投资了数十亿美元。OpenAI没有公布具体模型大小的细节,也没有公布用来训练模型的硬件,理由是“竞争情况”。

OpenAI的GPT大型语言模型为许多人工智能演示提供了支持,包括必应的AI聊天和ChatGPT,这些演示在过去六个月里让科技行业的人们惊叹不已。最新版本是新技术的预览,可能会在未来几周内开始整合到聊天机器人等消费产品中。微软周二表示,必应的人工智能聊天机器人将使用GPT-4。

OpenAI表示,新模型将产生更少的错误答案,更少地偏离话题,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。

OpenAI称,GPT-4在模拟律师资格考试中排名第90,在SAT阅读考试中排名第93,在SAT数学考试中排名第89。

然而,OpenAI警告说,新软件还不完美,在许多情况下,它的能力不如人类。公司表示,它仍然存在“幻觉”或自己编造的主要问题,而且在事实问题上并不可靠。它仍然倾向于在错误的时候坚持自己是正确的。

公司在一篇博客文章中表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。在闲谈中中,GPT-3.5和GPT-4之间的区别可能很微妙。当任务的复杂性达到足够的阈值时,差异就显现出来了——GPT-4比GPT-3.5更可靠、更有创造力,能够处理更细致的指令。”

新模型将提供给ChatGPT的付费用户,也将作为API的一部分提供,允许程序员将AI集成到他们的应用程序中。OpenAI将对750字左右的指令信息收费3美分,对750字左右的响应信息收费6美分。

相关阅读

浙商证券:OpenAI开放ChatGPT API 成本大降推动技术普及利好行业发展

3月8日 | 张计伟

如何看待OpenAI开放ChatGPT商用API? 中信证券:有望推动更多AI产品在中短期的商业化落地

3月6日 | 张计伟

OpenAI向付费企业提供ChatGPT工具 Shopify(SHOP.US)、Snap(SNAP.US)等公司已是客户

3月2日 | 许然

ChatGPT制造商OpenAI称正在努力减少偏见和不良行为

2月17日 | 李均柃

微软(MSFT.US)公布AI技术嵌入必应后的初步反馈 71%测试者给予认可

2月16日 | 宏林