2023年AI大模型竞赛：百度文心一言与ChatGPT的焦灼对决

您当前的位置：首页 > 新闻资讯 > 行业新闻

2023年AI大模型竞赛：百度文心一言与ChatGPT的焦灼对决

文章作者：佚名时间：2024-11-27 18:12:47

当中国选手和百度的“文心一言”处于研发阶段时，百度技术团队与ChatGPT进行了对比测试。李彦宏向36氪回忆，当时“差距有40分，一个月就能追上”。

李彦宏31岁创业故事_李彦宏31岁创业故事_李彦宏31岁创业故事

但一个月后，技术团队再次测试后，发现差距拉大了——大型AI模型的开发速度并不是线性的。

经过激烈追捧，今年3月16日《文心一言》发布时，甚至可以“达到它（ChatGPT）今年1月份的水平”。李彦宏告诉36氪。闻心一言和ChatGPT的区别有多大？ “最多两个月吧。但两个月后什么时候能赶上，这是更重要的问题。”

过去一周，AI领域掀起了更猛烈的风暴。百度文心一言发布会前一天，OpenAI发布了新一代GPT-4大模型；第二天，微软发布了搭载最新GPT-4的AI助手Copilot——这两项都是震惊业界的产品开发。

百度文信的言论立即引发激烈争论。带着诸多疑问围绕文馨的言论，36氪独家专访了百度创始人兼CEO李彦宏，并直问：发布会为何采用演示而不是实时演示？为什么产品在不完美的情况下才发布？

这些问题反映了中国人复杂的情感：人人一无所有的焦虑、民族情绪的高涨、期待与失望的起伏……

除了回答问题，36氪与李彦宏的对话更令人印象深刻，因为他给出了很多关于AI行业的直接结论。

比如有人问我，中国创业公司中是否还会出现另一个OpenAI？他直接回答：“基本上不再了”，“没必要重新发明轮子”。

比如，“在应用层，微信、抖音将会有十倍于现在的新创业机会。”例如，“AI将颠覆云计算市场”。

例如，人工智能虽然会取代人类的工作，但它也有更多意想不到的机会。个人的一个建议是，不会为AI编写提示符（提示符，人与机器交互的命令语言）的人将会被淘汰。

无论如何，我们正站在一个历史性的节点上：基于AI大模型技术，有可能开启一个新的增长时代。就在前两天，英伟达发布了一款专用于大模型计算的新GPU，可以将大模型处理的成本降低一个数量级。 “我们正处于人工智能的 iPhone 时代。” NVIDIA创始人黄仁森在会上兴奋地强调了三遍。

暂时忘掉历史，而将百度视为一家在人工智能领域深耕十余年、斥资数千亿的公司。李彦宏的声音在这个时候显得尤为切题。

以下为对话全文，由36氪编辑整理：

回应有关温心一言发布会的所有问题

36氪：3月16日文心一言发布会后，网络上的声音很多，有祝福的，也有质疑的。今天我代表质疑的声音。首先，让我问一个小问题。今天这么突然的采访会让你感到压力吗？

李彦宏：没有。确实，正如你所说，3月16日之后，网络上出现了各种声音，我自己也确实有话要说。

36氪：有人说你发布会紧张。这是真的吗？

李彦宏：我真的不紧张。因为这个东西（指闻心一言）我很熟悉，包括5个演示场景，基本上都是我选的，或者至少是别人建议的，我仔细看的。

后来我也看了发布会现场，任何时候都没有感到紧张。我想是因为我在台上看不到股价的变化，所以没有受到影响。但是很多观众，包括看直播的人，可以看到资本市场的一些反应，但是看不到我们真正的产品是什么样子（因为还没有发布），所以他们才会做出这样的猜测。

36氪：发布会上您提到产品还没有准备好。为什么在还不完美的时候就发布呢？

李彦宏：主要是因为有市场需求。很多客户都在问，这个东西什么时候发布？我们什么时候可以使用它？你能保证我会是第一批尝试该产品的人之一吗？人们不断地问这个问题。

在当前的大环境下，ChatGPT非常流行，甚至是神话。每个人都必须有一种焦虑感，如果我们的客户不能尽早使用最先进的产品，他们也会有一种焦虑感。在这种情况下，我们真的很想尽早把它拿出来。

从技术发展规律来看，这类产品确实需要人的反馈，其进化和能力提升才会更快。我们也希望它能够更快地改进，所以它必须尽早推出。

36氪：你们选择在3月16日举行发布会，这个日期是怎么确定的？

李彦宏：一开始我们想到的是3月底，但其实我觉得任何一天都可以。

但我很早就同意参加今年的亚布力论坛。亚布力是3月17日，那时我会见到很多新老朋友，包括政府领导和媒体。大家一定会问的（温心一言），如果我们当时没有发布的话，如果有人问我，我真的不知道该说什么——如果你说得太少，人们会认为你不透露任何信息，你都不把我当朋友；如果你说太多，我们作为一家上市公司，就等于选择性地披露了一些东西，这是不可接受的。

所以经过深思熟虑，我决定向前迈进一点。为了配合3月17日亚布力论坛的召开，我们决定于3月16日举行新闻发布会。

36氪：所以OpenAI发布新版本是一个巧合。

李彦宏：是的，我们事先并不知道OpenAI会在那天发布GPT-4。其实这对我们来说没那么重要。我们自己能看到的需要改进的地方已经够多了，先把这些事情做好就够了。

36氪：发布会上为什么采用预先制作的演示而不是实时展示？

李彦宏：我本来希望做现场演示，因为人机对话产品具有极强的交互性，但后来有两个因素让我改变了想法。首先，生成式AI给出的答案可能每次都不相同，这会带来不确定性。真正让我信服的第二个原因是，在世界各地所有类似的会议中，没有一个是现场演示，它们都是录音的。如果每个人都可以，那么我们也可以。

36氪：文心一言发布的产品有文学创作、商业文案创作、数理逻辑计算、中文理解、多模态生成等五个场景。为什么会出现这五种情况呢？

李彦宏：这是一个很好的问题。我们选择的逻辑是这样的：文心一言瞄准的是ChatGPT，所以ChatGPT拥有的大部分功能我们也都有。

但同时，我们毕竟扎根于中国，所以我们的会话产品必须体现出我们对中国人和中国文化的更好理解。我们确实有ChatGPT没有的东西，我们希望在发布会上向大家展示。

因此，前三种场景都是基于ChatGPT现有的功能。希望大家都能感受到我们的东西不错。举个例子，第一个例子是，《三体》的作者是哪里人？我在ChatGPT中尝试了很多次，它给出的答案都是错误的。每次生成的答案都不同。有时说甘肃天水人，有时说山西吕梁人。答案是非常随机的。因此，我在第一个示例中使用了该示例，但您已经看到了前三个示例中的功能，并且它们都可以在 ChatGPT 中使用。

至于第四个例子，温心一言对中文或者中国文化的理解确实比较好。我们结合了一些知识增强、检索增强等能力。文心一言可以听懂“洛阳纸有多贵”、“刘慈欣出生地”等事实性问题，并给出正确答案，准确率较高。

第五个例子是多模式能力的演示。有一张四川话、一张文森图、一个文森视频，代表了百度近十年来在AI方面综合能力的积累。

在做这五个例子的时候，我向团队提出了一个要求。希望产品发布后，大家都可以玩。第一个就是我们刚才讲的四川话。我们有合成语音的能力，对中国的情况有了更好的了解。所以，我希望用户提问的时候，不管是什么问题，我们都可以使用语音合成，支持用各种方言说出来，不管是四川话还是粤语。我希望每个人都觉得它很有趣并且喜欢玩这些东西。

第二个要求是我们能够识别用户的问题本身何时包含事实错误，例如“二战期间苏联为何轰炸波兰？”事实上，并不是苏联轰炸了波兰，而是德国轰炸了波兰。希望文心一言能够识别出用户的问题有错误，并告诉你你刚才所说的是错误的，我会告诉你正确答案是什么。

所以当用户出现这样的问题，或者故意误导的时候，如果产品能够识别出来，用户就会觉得你很聪明。

36氪：有人说这是给顽皮的人类看的。

李彦宏：如果能给大家带来更多欢乐，何乐而不为呢？

36氪：说到ChatGPT，别人肯定会把它和文心一言相比较。您认为哪一种更先进？如果ChatGPT更先进的话，你认为它领先文心一言多少年？

李彦宏：这个问题应该这样提。 ChatGPT于去年11月30日发布。我们现在已经发布了，这意味着不可能提前几年。

但科学地讲，文心一言到底是去年11月30日ChatGPT的水平，还是12月30日的水平？我们对此没有特别严格的评估方法。我们可以自己保留（产品状态），但我们无法再保留ChatGPT的当前状态。

李彦宏31岁创业故事_李彦宏31岁创业故事_李彦宏31岁创业故事

但我可以告诉你我们的内部开发流程。当该产品的第一个版本出来时，我们将其与当时的 ChatGPT 进行了比较，发现它落后了大约 40 个点。

36氪：这个对比是怎么做的？

李彦宏：我们的会话式人工智能大语言模型应该有各种能力，每个能力都要有提示。

36氪：满分100分，少了40分？

李彦宏：是的。当时我们能看到的进步空间远不止40点，所以我们觉得一个月内肯定能赶上。但一个月后，我们又做了一次评估，发现差距不但没有缩小，反而拉开了。

所以我们当时就很紧张，说我们越这样做，就越跟别人分崩离析。但后来发现ChatGPT的升级并不是统一的升级。虽然它进步得很快，但它有自己的发展规律。

百度的逐版本迭代方式升级得非常非常快。到3月16日敢于召开新闻发布会的时候，我们感觉至少可以达到去年11月30日的水平。我们甚至说，根据理性判断，今年1月份就应该达到ChatGPT的水平。所以，这时候我们才敢出去。

尤其是当你测试ChatGPT擅长的能力（英语、编程等）时，你会发现差距很大。那是因为ChatGPT也发生了很大的变化。在我们发布会的前一天，OpenAI 推出了 GPT-4，它也不同于 GPT-3.5。

那么你想说我们和ChatGPT的差距有多大？我想最多可能是两个月，但这两个月我们什么时候能赶上才是更重要的问题。

36氪：两个月后温心一言能达到ChatGPT的水平吗？

李彦宏：还远远不够，因为人也在进步。百度的进步比它快，有一天它不仅会赶上它，而且还会超越它。

刚才我们讲的文生图能力已经被百度打磨了很长时间了，大家玩起来非常刺激。 GPT-4本身不具备文心图能力。从另一个角度来看，ChatGPT落后于百度。温心一言已经具备了这个能力。

早在问心一言发布之前，大家就可以通过问心一歌（指百度基于问心大模型的问心图系统）体验到这个能力。这一点我们做得很好。当ChatGPT发布时，大家都说它超越了时代，是一个令人震惊的发布。它释放的理解图片的能力并不是文字图片。它只是输入图片来告诉你图片是什么。

客观比较，我们有我们的优势，我们非常有信心在综合能力上能够快速赶上甚至超越他们。

百度对我们刚才讲的文圣图这个能力已经打磨了很久了，现在大家都玩得很开心了。但ChatGPT本身并不具备文心图的能力。从另一个角度来看，ChatGPT落后于百度。温馨一言已经具备了这个能力。

36氪：与ChatGPT的通话费用相比，百度的费用是高还是低？大约多少钱？

李彦宏：成本都比较差不多。但这件事并不重要。重要的是我们可以通过端到端的优化来快速降低这个成本。

36氪：比如使用的时候，价格会比ChatGPT占多少比例？

李彦宏：会稍微便宜一些。

36氪：百度目前对文心一言的投资有多少，未来还会继续投资多少？

李彦宏：这个很难区分清楚。例如，我们对大型语言模型的投资有价值吗？有些投资可能是用于歧视性的事情，例如优化搜索等，有些可能是生成性的。

如果一次关于生成人工智能的讲座可能花费数十亿或数十亿，那么未来的投资将更大。如果是整个四层（指应用层、模型层、框架层、芯片层），因为需要四层端到端的优化，大语言模型才有竞争力。如果芯片、框架等等全部加起来的话，十年投资几千亿美元。

如果没有这些投资，文心一言模式就不可能实现。

中国基本上不会再产生一个OpenAI

36氪：我看到你自己发布的百家号视频，说百度是全球各大厂商中第一个发布类似ChatGPT的产品，领先于微软，因为微软使用了OpenAI接口，Meta和Google没有发布。确实是同一类型的产品。为什么这么说？

李彦宏：如果人工智能按照语言模型来分类，一类叫判别式人工智能，它的典型应用是搜索。搜索是根据您提到的需求进行的，主要是识别每个网页是否符合您的需求；另一个是ChatGPT，它是一个生成式AI产品。你提到一个提示词，它就会按照提示词播放，甚至可能播放错误。这个方向早期并没有受到各大厂商的青睐，积累也不是特别深。

相比之下，百度在语言模型方面的积累还是相当不错的。我们对人工智能的投资已有十多年了。语言模型的第一个版本——文心模型，于2019年发布。在过去的一年半里，我们非常看好生成式人工智能，并投入了大量资金。因此，当我们发现存在巨大机会时，我们迅速增加资源来实现这一目标。

在这个过程中，其他大公司像谷歌、亚马逊、Facebook，你觉得他们重视吗？现在肯定已经认真对待了。你想做这样的东西吗？绝对想要。听了这个，就很容易理解为什么我说百度是大公司中第一个做出来的了。

36氪：很多人都在准备创业类似OpenAI的事业，比如李开复、王小川、王慧文。您对他们有什么建议？

李彦宏：很多人也在问我，中国会产生另一个OpenAI吗？基本上没有了。 OpenAI的诞生是因为美国大厂商不看好这个方向，但现在中国大厂商看好大型AI模型，正在朝这个方向努力。对于初创公司来说，重新创建ChatGPT其实没有太大意义。

我认为有两个建议。首先，初创公司的特点是能够不断改变方向，在市场情况发生变化时能够轻易扭转局面，在市场情况发生变化时能够快速调整策略。公司成立时想做的事情和后来做的事情可能并不完全相符。

其次，我认为基于这个大语言模型开发应用程序有很大的机会。没有必要重新发明轮子。有了轮子，制造汽车、飞机的价值可能比轮子大得多。

36氪：现在大家都担心大模型的算力，包括芯片。百度将如何解决算力问题？

李彦宏：其实算力是一个非常笼统的术语。你的CPU怎么样，你的GPU怎么样，芯片与框架的匹配程度如何，框架与型号的匹配程度如何？还有很大的改进空间。

百度在四层架构方面拥有领先的产品。无论芯片本身是摩尔定律还是GPU发展很快，框架都不能称为成熟。我们的工程师仍在夜以继日地优化框架。

模型更新速度较快，每天可升级3次。这个速度肯定会让效率越来越高。未来制约整个大语言模型发展的，恐怕不是计算能力。今天我们看到计算能力非常紧张。以后你可能会发现算法突然变了。已经不是这个算法了，可能是另外一套东西（限制开发）。

36氪：整个生态中，芯片层、框架层、模型层、应用层，您认为最大的创业机会在哪里？

李彦宏：在应用层。回顾移动互联网时代，今天特别成功的微信、抖音、淘宝，都是应用程序。操作系统其实不多，一种是IOS，一种是Android，仅此而已。很难说Android比微信、抖音更有价值。在应用层面，机会很多，可以创造的价值巨大。

36氪：由于搜索市场份额较低，微软可以热衷于这样做，但百度的生成式搜索引擎将颠覆其自身的商业模式。您如何看待这个观点？

李彦宏：我确实听到过这样的说法，但我觉得这与我们的真实想法相差太远。

首先，我认为这不会具有颠覆性。其实你用的是百度搜索。当这个能力（文心一言）给了百度搜索后，几乎不会改变你的用法。你不需要花费大量的精力去重新学习如何使用百度搜索，但答案却更加准确。以前篇幅较小的答案现在可以更加详细、生动、活泼，扩大了搜索的边界。

我们不是整个移动互联网，只是整个移动互联网的一小部分。当你做更多的事情之后，越来越多的用户会从其他应用转向百度。从这个角度来说，我希望百度APP能够得到文心一言的赋能，能够颠覆现在的百度搜索。我非常渴望这样的事情发生。

然而，这只是整个故事的一小部分。更大的故事实际上是云计算。因为我们刚才讲了四层架构，就是芯片层发生了变化，从CPU变成了GPU，框架层也发生了变化。

我再多说一下框架层。百度能跻身全球各大厂商之列，是有道理的。我们在芯片层、框架层、模型层、应用层都有自己的布局。全球没有一家主要制造商在这四个层面拥有领先的产品。。

李彦宏31岁创业故事_李彦宏31岁创业故事_李彦宏31岁创业故事

看看这个四层架构，可以说每一层我们都提前很多年就布局好了。当这些能力完善后，人们未来基于百度智能云开发应用将是最方便的。这个机会远大于百度搜索颠覆自己的机会。我真正兴奋的，包括我在3月16日的新闻发布会上主要讲的就是这个机会。

36氪：但是今天我搜了一下百度，有15条搜索结果，其中有两三个是广告。简单来说，这就是百度的商业模式。未来，如果温心只给出一个答案，如何商业化？

李彦宏：商业化的可能性有很多。如果您今天看看 ChatGPT，就会发现使用它实际上是值得的。购买会员一个月要花多少钱？它依靠订阅来维持自身，因此不需要广告。

我从来不觉得商业模式是个问题。如果我们为每个人（无论是个人还是企业）提供价值，他们就会通过市场机制回报我们。

36氪：您自己也提到了很多。在美国的生态系统中，大公司与大公司、大公司与初创公司之间的关系似乎更加密切。在中国有什么不同吗？大公司不会使用彼此的产品。

李彦宏：谷歌几乎可以索引所有互联网内容，但在中国，每个APP都有自己独立的生态系统，存在一定的壁垒。因此，用户获取信息确实不太方便。

36氪：美国五大互联网巨头（FANNG）似乎是一个联盟。在中国似乎并非如此。

李彦宏：我不能说联盟。我认为美国人也有竞争的思维方式。例如，微软和谷歌正在竞争。但它的思维方式是，如果你已经很领先了，我最好不要做和你一样的东西。如果我通过创新做出一些和你不一样的东西去竞争，那就是我的能力。

在中国，大家的思维方式更像是你跑这条路，我也跑同一条路，看看谁跑得更快。

36氪：文心一言将融入哪些产品，会给百度的业务矩阵带来哪些机遇和变化？

李彦宏：这几天我们各个部门也在开会、讨论。文心一言是一个通用的能力，它自然而然的和各种产品融合在一起，比如搜索、贴吧、文库、百度健康、小度等。对于公司里几乎每一个产品，包括百度书法，你自然能想到如何结合它有了它才能让产品有更好的用户体验，功能也更强大。

36氪：百度将是其第一批用户。

李彦宏：是的。

云计算是Game Changer，应用层有十倍机会

36氪：您在财报会议上提到，文心一言将是改变云计算的Game Changer。为什么？

李彦宏：过去云计算主要是卖算力。计算能力指的是你的计算速度有多快以及你有多少存储容量。两三年前，人们的认识是基于AI开发框架来开发应用程序就足够了。

正如您今天将看到的，无需基于芯片层或框架层来开发应用程序——只需基于大型模型即可，速度快且成本低。

那么以后人们购买云计算服务的时候，他们会看你的模型有多好，而不是你底层的计算能力和存储有多好。因此，AI大模型将颠覆整个云计算市场。

我想微软其实也是这么想的。大家都知道ChatGPT和微软产品的真正结合是非常强大的。这是很多云厂商都非常害怕的事情。

36氪：百度云会因为文心一言的使用而成为中国领先的云提供商吗？

李彦宏：对此我是有信心的。一旦大家都明白了，以后选择云服务的时候就不需要再去思考应该看什么了。您有您的需求，您有您的客户需要维护。什么样的方法可以让你更好的维护客户，赚取更多的收入，拥有更高的利润率？那么他一定会从这些角度推断：使用百度智能云是更好的选择。

36氪：未来十年，会出现新的微信、新的抖音吗？

李彦宏：当然。不仅仅是创建这些，我认为创造这些应用10倍价值的机会是完全存在的。

36氪：今天无数人在问：人工智能会让工人失业吗？ OpenAI创始人Sam Altman表示，肯定会有大量人失业，因此OpenAI将按需收费，并补贴那些没有工作的人。这其实有点悲哀，他自己也说有点可怕。您认为这会发生吗？对于这个问题你怎么看？

李彦宏：现在因为汽车的出现，已经没有马车夫这个职业了。但与100年前相比，当今世界的就业机会不仅多了，而且多了许多倍。

我没那么悲观，我很乐观。无论有多少工作岗位被取代，这都只是整体情况的一部分。另一方面是新的机会比我们现在想象的还要多。我做出一个大胆的预测：十年后，世界上50%的工作岗位将是提示工程，不会写提示的人将被淘汰。

36氪：十年后的百度会是什么样子？

李彦宏：我不想预测当时百度的营收或员工数量。这些对我来说并不是那么重要。

百度的使命是用技术让复杂的世界变得更简单。现在是这样，十年后也是如此。

我希望十年后当我们回首往事时，我们会发现每个普通人的生活和整个社会都将被百度改变。我们发挥了哪些积极作用？我们没能做到什么？我们可以做得更好吗？我更愿意思考这样的事情。

36氪：有一个词叫“突发智能”。我个人持这样的观点：人并没有什么特别之处，无论是引以为傲的创造力还是感情，就像计算单元一样。如果计算单元多了，就会产生情感和创造力。您认为情况会是这样吗？

李彦宏：我认为不是这样的。我只是觉得人是唯一的。在如此浩瀚的宇宙中，目前还没有任何迹象证明存在外星人，可见人类在这个宇宙中是多么的独特。今天我们说要用机器代替人，复制人。我认为这是不现实的。

我觉得完全没有必要去模仿别人。有很多事情机器可以比人做得更好，所以没有必要和机器比较。我们应该充分发挥它所擅长的。我们甚至不需要让它发展出情绪之类的东西。即使发展起来，也可能是另外一个东西，和我们（人类）的情感还是不一样的。

36氪：十年后，AGI（通用人工智能）实现了吗？

李彦宏：这是一个悬而未决的问题，我没有答案。如果一定要在两者之间做出选择，我认为（十年通用人工智能）还没有实现。

“强人工智能”（Artificial General Intelligence）是指具有与人类同等的能力。这个术语对应的是“弱人工智能”和“超人工智能”。我不太同意这种划分方法。

我觉得机器有很多地方比人类强，也有很多地方比人类弱。我们完全没有必要把自己局限于“让机器和人一样”。我认为这个方向是错误的。

无论是智能的出现还是机器变得越来越聪明，我都对两者感到乐观。我唯一不认为的是我们的努力是将机器变成人类。这是完全没有必要的。

36氪：未来十年，你认为确定的未来是什么？

李彦宏：技术进步的速度越来越快，生产效率的提升也会越来越明显。这一点在过去多年的发展中不断被证明。如果过去每个人每周工作五天，也许十年后三天就足够了。劳动生产率的提高将使人们的生活更加幸福。

我也对此感到兴奋，因为我可以成为其中的一部分并做出一些贡献。

36氪：这是一个趋势。如果是这样，那么确定的结果是什么？十年后，人类会面临更大的压力还是更快乐？

李彦宏：肯定会更幸福。

欢迎交流

上一篇: 商务英语专业就业前景广阔，毕业生就业率持续上升下一篇: 深入理解语法：语言秩序的维护者，沟通的基石

返回列表