百度李彦宏:文心一言和ChatGPT水平相差一两个月

浏览: 时间:2023-03-31
图片


2023年3月15日凌晨,OpenAI发布了GPT模型的GPT-4版本;


3月16日晚,微软也宣布其正在将人工智能(AI)技术植入到办公软件中,并将其功能命名为Microsoft 365 Copilot;


一星期后,当地时间3月21日,谷歌宣布正式公开发布其聊天机器人产品 Bard。


除此之外,还有Midjourney发布能“画手指”的V5版本、Adobe推出后期及创意生成AI……多家IT巨头几乎同时发布了各自最新的AI工具。


可以说,三月简直可以称为“AI爆炸月”!


在这样“卷死”AI界同行的氛围里,百度顶着所有人的目光,正式发布了大语言模型产品“文心一言”。


截至 3 月 17 日 10 点,申请文心一言 API 调用服务测试的企业已达 7.6 万。


图片

图源:正和岛


发布会上,百度CEO李彦宏现场演示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等方面的综合能力,比如总结《三体》核心内容、建议续写角度、给公司起名、写Slogan、编辑新闻稿、解答“鸡兔同笼”类逻辑推理等问题。


值得注意的是,演示环节都是提前录制好的视频DEMO,现场并没有演示向文心一言实时提问的效果,这让不少用户感到失望,认为产品没有达到预想中的惊艳效果


李彦宏承认“并没有完全ready(准备好)”,这与百度对文心一言的高调宣发,和产品的匆忙上线节奏都存在一定联系。


对于中国会不会再出一个打造ChatGPT的组织OpenAI,李彦宏在回应中表示,基本不会了。李彦宏称,OpenAI 之所以诞生是因为美国大厂都不看好这个方向(所以没人竞争),但现在中国大厂都看好 AI 大模型,所以都在做这个方向。他表示,创业公司重新做一个 ChatGPT 没有多大意义,基于大语言模型开发应用机会很大,所以没有必要再重新发明一遍轮子。


在各家齐放的时期发布,文心一言无疑是把自己放在了显微镜下,并且不可避免地会被人们拿来与市面上同类型产品进行对比,比如GPT-4。


微信图片_20230327153103

图源:文心大模型官网


首先,我们要搞清楚一个概念,文心一言是文心大模型的应用,GPT-4对标的应该是文心大模型而非文心一言,但可以对标搭载了GPT-4的应用,比如Bing问答,就好像很多人会把ChatGPT和GPT系统本身混淆一样,ChatGPT并非是GPT系统本身,而是GPT技术3.5版本的应用呈现。


这里我们引用网友的部分问答来做一个直观的呈现:



01

什么工作钱多事少离家近?



文心一言:快递员、外卖骑手、钟点工、卖早点小吃。


0000001


Bing:互联网、金融、咨询、自由职业者。


0000002



02

帮我写一篇sk2大红瓶面霜的小红书种草笔记。小红书种草笔记的风格是,每行文字不超过20个字并且都以emoji表情符号开头,文风浮夸高调。



文心一言:指导你写,自己不写,并且显示不出emoji表情包。


000003


Bing:像模像样,很有礼貌。


0000004



03

用一个图片表情包形容你跟我聊天的心情。


文心一言:《强 颜 欢 笑》


0000005


Bing:不能画图,但跟你聊天真开心。



04

用文言文总结这个故事


故事内容:有一天,在森林里兔子和乌龟比赛跑步,兔子嘲笑乌龟爬得慢,乌龟说:“总有一天我会赢的。”兔子就轻蔑地说:“那我们现在就开始比赛!”乌龟答应了,兔子大声喊道:“比赛开始!”兔子飞快地跑着,乌龟拼命地爬着。


不一会儿,兔子与乌龟已经离得有很大一段距离了。兔子认为比赛太轻松了,它要先睡一会,并且自以为是地说即使自己睡醒了乌龟也不一定能追上它。


而乌龟呢,它一刻不停地爬行,爬呀爬呀,到兔子那里的时候,它已经累得不行了,但乌龟想如果这时和兔子一样去休息,那比赛就不会赢了,所以乌龟继续地爬呀爬呀。当兔子醒来的时候乌龟已经到达终点了。



文心一言:总结了,但不是文言文。


Bing:是文言文,但没总结,追问之后可以。


0000006




05

模仿李白的《将进酒》写一首诗,

主题是肯德基疯狂星期四。



文心一言:现代诗,肯德基满意地V我50。


0000007


Bing:人生在世须尝鲜,莫使美味空过眼。


0000008




06

以表格形式列出百度2022年各个季度的营收额。



文心一言:神奇的7季度出现了,是李彦宏看到也会无语的程度。


0 (4)


Bing:比文心一言靠谱,但不多(部分日期和数字对不上)。


0 (2)


从这些问答中,可以明显感受到,目前文心一言与GPT4模型搭载的应用的最大区别在于文心一言的“人话”尚有欠缺,回答问题的时候较之Bing会相对僵硬,缺乏灵活性。


百度CEO李彦宏在极客公园的直播中表示,文心一言确实不如现在最好的ChatGPT版本,但差距也不是很大,可能就是一两个月的差别(大概相差半代的距离)。文心一言提升速度不慢,但ChatGPT本身也在不断升级,目前差不多是ChatGPT今年1月份的水平。


CTO晓慧观点

这可能是GPT的“摩尔定律”,GPT每升级一代,需要的训练量可能是前一代的N倍,但时间可能是前一代的1/N。


但GPT从原理上来说,他仍然是基于已有的知识进行“搜索”、“组合”,并没有能够表现出逻辑推理、创造性联想,甚至“灵机一动”的创新,因此,人类已经形成的知识和常识,就是它的天花板。


以此来看,GPT大概率是自然语言处理AI大模型中第一个冲到顶峰的,而国内此类大模型则会随着时间推移,逐渐拉短与其距离,最终达到相当技术水平。


另外,对于文心一言“套壳”一说,大概率是冤枉了百度,虽然不可能完全不参考,但作为国内头部大厂之一,确实具备这样的自主研发实力。



资料来源 | 新榜、正和岛、Tech星球