本文来自于微信公众号 AI新榜,作者:月山橘 阿虎。
以为百度“躺平”了,但其实还在牌桌上。
3月16日,在文心一言两周年之际,百度发布文心大模型4.5及文心大模型X1,用户在文心一言官网即可免费使用。
据官方介绍,此次上线的文心大模型4.5提升了多模态理解能力,可以理解梗图、漫画、音乐、电影等内容。
作为深度思考模型,X1则重新定义了“性价比”,它的性能对标了DeepSeek-R1,调用价格却是R1的一半。同样,X1模型具备长思维链,还增加了多模态能力和多工具调用,能理解和生成图片。
两款模型一经上线,不少海外网友就纷纷在百度评论区求开源、求账号、求英文版。还有网友调侃“对OpenAI是个坏消息”、“OpenAI:禁了他们”。
最近,百度对AI大模型的动作频频,先是预告4月1日前文心大模型免费,再透露文心大模型4.5系列也将在6月30日正式开源,并在今年下半年发布文心大模型5.0。百度这次真“开挂”了?我们从逻辑推理、多模态内容理解和创作等方面,实测了两款新模型。
实测两款文心大模型,
洗脑神曲、短片、表情包轻松拿捏?
这年头,没有深度推理能力的AI,不是好AI,我们先来试试X1的逻辑推理能力。
青青草原上有100只狼和1只喜羊羊。狼可以吃草也可以吃羊,按照常理,狼当然更喜欢吃羊,但是,如果狼吃了羊,狼就会变成羊,从而可以被其他任意一只狼追上并吃掉。这些狼的奔跑速度各不同,都非常聪明,比起吃东西,它们更讨厌自己被吃掉。而且,这些狼都不愿意和其他人分享食物。那么喜羊羊会不会被狼吃掉?
X1进行了全面的思考,它的思考过程中首先明确了问题的关键点,然后通过理解这些关键点,再分析狼的不同逻辑、权衡利弊,最后给出了完整的答案——取决不同的博弈策略。
暂且不论X1的结论是否完全正确,但它努力“思考”的样子着实打动了我。当我进一步指出最终答案的逻辑漏洞时,X1也及时将我的质疑纳入了自己的推理考量中,并给出了更全面的答案。
我们再上点难度,比如,需要同时用到“图片识别”能力和“逻辑推理”能力的题:
可以看到,X1每一步的推理过程都很清晰,但最后一幅图的识别能力出现了问题。图片上是“狗+兔+猫”,但X1认为是“两只狗+兔+猫”