Inflection公司推出了其最新版本的个人人工智能助手Pi,名为Inflection-2.5。这个升级版的模型在性能上与全球领先的大型语言模型(LLMs)如GPT-4和Gemini相竞争,同时保留了Pi特有的个性和独特的共情微调。Inflection-2.5现在向所有Pi用户开放,可以在pi.ai网站、iOS和Android应用以及新的桌面应用上使用。
Inflection-2.5在训练时的计算资源使用效率非常高,仅用了GPT-4训练资源的40%,但在性能上接近GPT-4。特别是在编程和数学等智力(IQ)方面取得了显著进步,这在关键行业基准测试中得到了体现,确保Pi始终处于技术前沿。此外,Pi现在还整合了世界级的实时网络搜索功能,以便用户能够获得高质量的最新新闻和信息。
Inflection-2.5的推出已经对用户满意度、参与度和留存率产生了显著影响,加速了有机用户增长。目前,Pi的每日活跃用户达到一百万,月活跃用户达到六百万,用户与Pi的交流已经超过了四十亿条消息。平均每次与Pi的对话持续时间为33分钟,每天有十分之一的用户对话时间超过一小时。大约60%的用户在与Pi交流的一周后会再次回来,并且月度用户粘性高于行业领先竞争对手。
Inflection-2.5在多个行业基准测试中展示了其强大的能力,特别是在STEM(科学、技术、工程和数学)领域。例如,在MMLU基准测试中,Inflection-2.5在各种任务上的表现显著优于Inflection-1。在GPQA Diamond基准测试中,这是一个极其困难的专家级基准测试,Inflection-2.5也表现出色。在匈牙利数学考试和物理GRE(研究生入学考试)中,Inflection-2.5的表现也非常出色。
Inflection-2.5在MBPP+和HumanEval+两个编程基准测试中,相较于Inflection-1有了巨大的提升。在HellaSwag和ARC-C,这两个广泛报道的常识和科学基准测试中,Inflection-2.5也展现了强劲的表现。
总的来说,Inflection-2.5在保持Pi的独特个性和卓越的安全标准的同时,成为了一个更加全面的帮助模型。Inflection公司感谢Azure和CoreWeave等合作伙伴的支持,使得Pi背后的最先进语言模型能够服务于全球数百万用户。
模型地址:
https://inflection.ai/inflection-2-5
本文地址:https://www.163264.com/6701