就当我们还在为OpenAI的Sora实际效果感到震撼,惊叹未来已来的时候。短短一个月,OpenAI的“家”就被人偷了,昨晚北京时间凌晨Anthropic公司宣布Claude-3正式发布,带有三个高性能的模型形态,并宣布在AI逻辑基准测试中超过了ChatGPT-4。
可能国内的小伙伴很少知道Claude,这是一个在海外备受关注且用户基数较大的一个AI模型,其从诞生以来就一直与GPT相爱相杀,在AI性能排行榜上紧追不舍。其也是基于GPT(Generative Pre-trained Transformer)技术的大型语言模型,通过在大规模文本数据上的预训练,学会了自然语言理解和生成的能力。
亚马逊于今日宣布使用Claude3来优化其商业逻辑
该系列包含三款各具特色的型号:Claude 3 Haiku、Claude 3 Sonnet 以及 Claude 3 Opus,它们在性能与应用功能上各有侧重,旨在满足多样化的应用场景需求。
Claude 3 Haiku
Haiku 型号凭借其极速处理能力和高性价比脱颖而出。它能够在短短三秒内完成对一篇含有约 10,000 个标记、信息浓缩且数据密集的 arXiv 研究论文的阅读工作,包括对图表和图形的理解。Haiku 尤其适用于那些对处理速度有极高要求但性能负荷相对较轻的平台。
Claude 3 Sonnet
Sonnet 型号在处理大多数工作负载时的速度是 Claude 2 以及 Claude 2.1 的两倍,且模型效果与性能一致,并提供更高层次的智能分析能力。它特别擅长处理那些需要快速反应的任务,例如知识检索和销售流程自动化等。
Claude 3 Opus
Claude 3 Opus 是系列中的高端型号,具备与市场上其他顶尖模型相匹敌的复杂视觉处理能力,能够处理多种视觉格式,包括照片、图表、图形以及技术图解。相较于 Claude 2.1,Opus 在解决开放性问题上的准确度提升了一倍,同时也显著降低了错误答案的比例。
其他亮点
全系列模型均能处理超过 100 万个标记的输入,为那些需要更强大处理能力的客户提供可靠支持。Claude 3 系列在执行复杂多步骤指令方面表现卓越,尤其在遵循品牌语调和响应指南上,能够为用户打造出值得信赖的客户体验。此外,这些模型还擅长生成流行的结构化输出格式,如 JSON。
目前,Opus 和 Sonnet 已经通过 API 对外开放,开发者现可直接注册并开始体验这些尖端模型的强大功能。比如,POE就已经支持Claude-3-Opus模型,购买POE“月卡”后就可以体验。
超越GPT-4;兼顾视觉功能
根据Anthropic的说法,Claude 3 Opus 在10项人工智能标准测试中超越了GPT-4,包括MMLU(本科水平知识)、GSM8K(小学数学)、HumanEval(编程)以及HellaSwag(常识)。
其中一些胜利的优势非常微小,例如Opus在MMLU五次尝试中得到86.8%的得分,而GPT-4得到86.4%,一些差距则较大,例如在HumanEval上Opus得到90.7%的得分,而GPT-4得到67.0%。这可能就意味着Claude 3对于新手码农要更加友好。
与前代模型相比,Claude 3系列在分析、预测、内容创作、代码生成以及多语言对话等方面展现了改进。据报道,这些模型还具备了增强的视觉能力,允许模型处理照片、图表和图解等视觉格式,类似于GPT-4V和谷歌的Gemini
在实际测试中,Claude 3相比于GPT-4V对于PDF的解读要更加快速,同时对于中文输出的逻辑与优化也要明显好于前代,也是达到了GPT-4平替的水准。
网友评论