NFT:AI新时代 是时候重估百度了_okey币官网

发力AI近十年,百度正在迎来最好的机遇。

2月22日晚间,百度发布2022年Q4及全年未经审计的财务报告。2022年全年,百度实现营收1236.75亿元,归属百度的净利润206.8亿元,同比增长10%。

第四季度,百度实现营收330.77亿元,归属百度的净利润53.71亿元,同比增长32%。2022财年,百度核心业务连续四个季度业绩超市场预期。

除了公布财务业绩,对于近期备受关注的类ChatGPT产品「文心一言」,李彦宏在电话会上表示,文心一言将率先集成进搜索产品,通过新功能吸引到更多的用户,并给广告业务带来更多机会。

2022年以来,百度围绕文心大模型展开了一系列动作。5月,百度提出了「构建更适配应用场景的模型体系」;11月,文心大模型全面升级,发布了包括5个行业大模型在内的11个大模型,同时发布了AIGC绘画产品「文心一格」。

关于即将发布的「文心一言」,截至目前已有爱奇艺、集度汽车、小度、智联招聘、太平洋汽车网等多个合作伙伴宣布加入百度文心一言生态圈。

基于长期建立的大模型体系,百度已有的业务体系也有望迎来新一轮升级。不论是百度自身的C端搜索产品,还是旗下的小度音箱、集度汽车智能座舱等产品,都能够直接接入语言大模型的能力,获得性能和体验提升。

而以AI能力为优势的智能云业务,接入大模型能力后,也将能够向企业客户输出语音交互、内容生成的能力,赋能软件企业。

百度创始人、董事长兼首席执行官李彦宏表示,「凭借在AI领域的长期投入,百度将抓住即将到来的AI拐点,为我们的整个业务组合——从移动生态到智能云、自动驾驶、智能硬件等——开拓全新的机遇。」

核心业务持平,多项主流业务与「文心一言」整合

2022年对中国乃至全球互联网公司来说都是极其不易的一年。但整体来看,百度在2022财年的业绩表现依然相当稳健。

总体来看,百度的核心业务持平,营收增长由非在线营销收入贡献。李彦宏在财报会上表示,随着疫情缓解,在线营销开始出现复苏迹象。

2022财年,百度核心业务营收为954亿元人民币,与去年基本持平。其中,网络营销业务营收为695亿元人民币,同比下降6%。

非在线营销收入方面,2022年的整体营收为259亿元人民币,同比增长22%,主要由云计算和其它基于AI驱动的业务推动。

业务表现上,过去一年,百度搜索规模年同比增长17%;移动端搜索查询次数和信息流分发量,均实现了两位数的同比增长。百度App月活用户数于2022年12月达到6.48亿,同比增长4%。此外,2022年前九个月,小度位居中国智能屏和智能音箱出货量第一。

在智能云业务上,百度ACE智能交通系统从2021年的35个城市扩展到69个城市,合同金额超过1000万元人民币。根据IDC2022年上半年发布的中国公共云市场报告,百度第四年被评为第一大人工智能云供应商。李彦宏在内部信中表示,「百度智能云利用AI技术,为行业提供标准化的解决方案,提高了利润率。」

智能驾驶方面,截至2023年1月底,萝卜快跑累计订单量超过200万单。

升级后的文心大模型体系|来源:百度

相比已经存在的基本盘,今天更受关注的还是百度在语言大模型方向的探索。作为百度乃至国内发布的首个类ChatGPT产品,文心一言的进展,背后的文心大模型,以及与现有业务结合的规划,都是外界关注的重点。

未来,百度主流业务将与文心一言整合。除了升级相关产品外,李彦宏强调了其对云服务的意义,「之前选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同。这会根本性地改变云计算市场的游戏规则。」

始于四年前的文心大模型

ChatGPT出圈,让普通人也感受到语言大模型的能力与优势。而在产业界,对于大模型的探索已存在多年。谷歌等公司5年之前开始语言大模型的布局。对AI技术持续投入的百度,也在4年前开始了大模型的技术积累。

谷歌2017年发布神经网络架构Transformer后,语言大模型开启了新时代。Transformer能够让机器在处理语言信息时关注单词之间的联系,并预测接下来会是什么单词。这大大增强了语言的理解能力。如果将语言大模型比喻成复杂的建筑,Transformer便是搭建时最好用的砖头。

在此之后,所有的大模型,都基于这一架构进行设计。2018年,谷歌发布发布了基于Transformer的预训练大模型BERT;OpenAI则发布了GPT,这是ChatGPT的第一代模型。

紧随其后,百度于2019年发布了初代文心大模型:ERNIE1.0。这也是文心系列模型的起点,初代文心模型基于谷歌BERT模型结构,增加了优化设计。

预训练模型大模型可以看作一种新的研究思路。在过去,自然语言理解有各种不同的任务,如翻译、知识问答、多轮对话等。解决每一个问题,需要专门训练出模型,但能力的提升却容易遇到瓶颈。预训练模型则换了另外一种思路,先用大量数据训练出一个具备基础语言理解能力的模型,再通过少量数据的微调,让其具备处理某种任务的能力。

文心大模型优化的一个关键点在于加入了知识图谱。作为一种信息加工方式,知识图谱将现实世界中存在的概念、以及相互关系用符号表示出来,最终形成一个可视化的「图谱」。将这种方式加入预训练,就增加了大模型在知识相关任务上的能力。

在训练数据上,文心大模型也有明显特点。基于百度自身的数据优势,训练模型的语料来自百度百科、百度新闻、百度贴吧、以及中文的维基百科。这其中包含了大量的知识性的语料。

2019年7月,百度再次升级模型,发布了ERNIE2.0,并在2020年全球全球规模最大的语义评测比赛SemEval上,获得了5项世界冠军。发展至今,百度语言大模型文心一言突出的能力是「知识增强」,能够生成对话、进行文本创作。

大模型是未来AI产业体系的重要组成,但要把大模型用起来,还需要底层算力、上层应用的共同搭建。百度也在这一方向上进行了诸多实践。

「文心一格」平台页面|来源:百度

直接支撑文心大模型的平台,是飞桨产业级深度学习框架。这是目前被广泛使用的深度学习框架。截至2022年11月底,飞桨平台上已凝聚535万开发者、创建67万个AI模型,服务20万家企事业单位,位列中国深度学习平台市场综合份额第一。在百度AI能力的整体架构中,深度学习框架位于第二层,整体的四层能力包括「底层芯片+深度学习框架+大模型+应用层」。

去年底,百度发布了最新的生成式AI产品「文心一言」,这是应用层的最新产品,目前已经被不少新媒体用来生产配图素材。这是一个AI作画平台,由飞桨学习框架和文心大模型提供技术支持。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,百度将文心大模型已经形成「模型层+工具与平台层+产品与社区层」的整体布局。

「文心一格」产品的发布,意味着百度已经开始积累大模型的工程化落地能力,而接下来「文心一言」产品的发布,将沿着这一方向进行更多探索。

「文心一言」融入更多业务

深度学习三巨头之一的LeCun表示,新的AI热潮,将带来企业内部深度学习研发的复兴。对于百度来说正是如此。与学术性质的研发不同,在企业中的技术研发,不仅仅涉及概念验证,还因探索与业务场景结合、规模化而需要更大成本。

如微软总裁纳拉德所说,AI将从根本上改变每一个软件类别。如今,正来到了探索大模型与更多业务场景结合、赋能产品的加速时期。百度也已经公布了相关规划。

三月份即将发布的「文心一言」是基于文心大模型所发布的新的语意理解平台。从英文名Bot可以看出,底层的技术将是一个类似聊天机器人的对话模型。「文心一言」将会利用跨模态、语言理解和生成能力等,为人们提供自然流畅的聊天体验。

对于百度来说,拥有了这样的新技术平台,首先能够提升的便是搜索产品。目前,搜索产品的收入大约占到百度整体收入的60%,依旧是最重要的产品之一。

多年来,搜索产品的形态和用户体验没有太大的变化。当对话体验与原有的搜索引擎形成互补,用户在搜索相关链接的同时,也能够直接阅读定向生成的内容,将是十多年来搜索产品最显著的一次产品变革。这也将成为互联网的新流量入口。

这种对话能力,还能够接入智能座舱的场景中,以语音交互的形式体现。前不久的三里屯体验中心启动会上,集度汽车CEO夏一平表示,「集度将融合百度文心一言的全面能力,支持汽车机器人实现自然交流的再进阶。」当新的模型能力接入汽车终端,人们在座舱内不仅能够通过语音对设备进行更全面的控制,还能够获得类似于和一个「人」交流对话的体验。

集度概念车内景|来源:集度

除了C端产品之外,模型能力也将接入百度的智能云中,为B端服务能力带来提升。百度集团执行副总裁、百度智能云事业群总裁沈抖表示,「文心一言」将通过百度智能云对外提供服务,率先在内容和信息相关的行业和场景落地。

将大模型的能力引入云服务,将是必然的趋势。微软此前已经表示,计划将OpenAI的多项技术引入Azure云服务中,包括ChatGPT以及绘画模型DALL-E。将来,通过云服务的方式,AI改写软件的进程才会真正发生。

百度智能云宣布,将在5月推出针对「文心一言」模型的API接口。这将使百度智能云在语音合成、机器翻译、自然语言处理方面的服务能力提升,客户可以直接调用相关能力应用到具体的场景里。

去年百度智能云年增长为12%,在AI云市场位列第一。具体而言,在数字人、智慧城市等领域,百度智能云为市场份额第一。百度搜索业务之外的其它业务,主要受智能云及其他AI驱动业务的推动。大模型能力的接入,将带来更强的增长势能,也将拓展AI云的服务范围。

来源:元宇宙之心

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

区块博客

[0:15ms0-7:119ms