返回顶部
分享到

在百度搞发明的人

科技 2023-2-2 09:31 751人浏览 0人回复
摘要

雷刚 发自 副驾寺量子位 | 公众号 QbitAI“如果不在百度,可能就不是我了。”在百度十大科技前沿发明颁出这一天,入围者这样说。一个人这样说多半是谦善,但他们中的一半人都这样说——而且照旧量子位现场问到的全部

雷刚 发自 副驾寺量子位 | 公众号 QbitAI

“如果不在百度,可能就不是我了。”

百度十大科技前沿发明颁出这一天,入围者这样说。

一个人这样说多半是谦善,但他们中的一半人都这样说——而且照旧量子位现场问到的全部人,或许就在反映着什么。

但仍然有诸多相关的谜团待解。

一个产业化公司搞啥发明?有什么用?如何开始的?又会往那里去?以及最紧张的:这些发明含金量几何?

在百度搞发明的人

百度十大科技前沿发明

百度可能是中国最重视技能创新和专利掩护的公司。

特别是进入AI技能创新周期后,每年的AI专利进展都会成为关注的对象。但今年有所差别,这次在专利积累之上,推出的百度十大科技前沿发明更成为关注的焦点。

这十大发明,根本都是数字技能、智能技能上的突破和积累。

AI天生和创造相关的如:跨模态通用可控AIGC、知识加强盛模子、数字人智能化生产。

“AI司机”主动驾驶相关的如:无人车传感器融合处理体系、面向主动驾驶的车路协同关键技能、主动驾驶多模态行人运动猜测。

另有深度学习通用异构参数服务器架构、基于AI的生物计算平台PaddleHelix、聪明都会全要素双总线技能,以及全平台量子软硬一体,也根本是AI驱动的期间级技能革新

团体来看,都是目前环球技能创新竞速中的最前沿阵地。具体到所处的赛道,百度的发明项目进展不仅显现着原创性,也显现出领先性。

好比AIGC,国外有微软加持的OpenAI出品的GPT、DALLE,谷歌的Imagen,都是文和图天生方面的各自代表性工作。

但百度的通用可控AIGC,实现了能力上的集大成和结果上的可控。百度的AIGC不仅在环球首次实现了语言和视觉大一统的明白与天生,而且单一模子一经出炉就登顶了视觉和语言榜,横扫VQA、VCR、aNLI三大国际权势巨子榜单。

在百度搞发明的人

又好比量子计算方面,在硬件打造和量子良好性争夺之外,百度还新增开发出了产业化加速门路,通过基于“乾始”研发的环球首个全平台量子软硬一体化解决方案“量羲”,提供私有化部署、云服务、硬件接入等一系列服务,简化量子硬件部署到量子服务的全流程,实现差别量子芯片的“即插即用”。

在百度搞发明的人

另有主动驾驶,在百度TOP发明中十中有三,不仅秀的是该领域上的技能实力,而且也已经通过落地,在订单数、里程数和落地都会数目上实现技能驱动下的环球领先——目前环球最大的主动驾驶出行平台,是百度旗下的萝卜快跑

在百度搞发明的人

与发明形成呼应和反差的,是背后的发明者。

或许你对百度在技能上的影响力和吸引力并不陌生,也多少听过百度内部以技能声名在外的专家、大牛和大神。但在这次十大科技前沿发明和专利发明人中,不少人低调十足,根本没有过对外表态

他们有各自具体性的一面,有人应届毕业就来了,有人在其他同样以技能标签知名的公司待过,另有人之前履历都在学术界。

然而共性一面是工龄司龄都不短,根本对外处于隐身无闻状态,并且被问到发明背后的关键时表述差别但指向一致:

如果不在百度,几乎不会成为这项技能的发明人。

在百度搞发明的人

“不在百度成不了发明人”

上述异口同声的共同归因,须要联合发明的源起才气更好明白。

好比跨模态通用可控AIGC、知识加强盛模子、数字人智能化生产,都可以明白为在百度过往技能和业务根本上生长出的新能力

跨模态通用可控AIGC的发明人之一严萧,中科院计算所博士,正高级工程师,毕业不久就参加了百度,迅速成长为百度主任架构师,并且在业内公认的百度NLP沃土上斩获50多项授权发明专利,相关成果被广泛用于搜索、推荐、输入法和云服务等业务场景中。

严萧说,近一年以来,AIGC确实成了风口,巨细玩家也都进入了赛道,但AIGC底层的同一模子,百度早就在预研和攻坚了。在GPT-3和DALL·E打响名气之时,百度内部已经在紧锣密鼓的推进包含文章、图片都在内的语言视觉大一统模子,并且完成了第一代版本发布。

“你可以借助开源很快做出点什么,但做不到为所欲为,我们希望它能像人一样想天生什么风格就天生谁人风格”,严萧回想,百度团队从一开始就铆足劲“北坡登珠峰”,在AIGC方向上实现通用且可控,由于这样才气在结果上实现工业化落地应用

整个AIGC的立项很快,一方面是百度在这个方向上有积累也有人才,NLP和搜索等技能都具备领先性,把须要的人才横向抽调出来,就搭建好了班底架构;

另一方面,百度还具备技能落地的业务场景,AIGC相关的模子,从撰写资讯、文章到天生图片,都能在百家号、搜索、输入法和云业务中落地、迭代、再训练、再迭代,日臻进化。

所以在时势和好汉的命题上,严萧很坚定:如果他不在百度,几乎不会成为如此领先技能的一个发明人。

在百度搞发明的人

费扬昭也表达了类似的观点。他是数字人智能化生产的发明者之一,入职百度3年多,之前在其他科技公司从事计算机视觉技能方面的工作。

他以为数字人是一个必然发生的技能趋势,但如果不身处百度,很难完成智能化、规模化生产和应用。

费扬昭刚入职,就参加了百度与某重点客户的数字人打造项目中,那也是业内最早的商用数字人产品,听说造价成本高达百万元。这种制作门槛,一方面是由于技能难,另一方面是由于数字人CG资产制作和训练数据采集上的费时费力费资本。

但在百度,语音和NLP(自然语言处理)方面的技能积累,早在小度等产品就显现过,从技能到数据都具备根本,焦点攻坚集中于主动化、批量化打造和应用上。

费扬昭透露,现在数字人的生产“智造”,到了“寻常百姓家”前夜,而且百度的数字人不仅通过商用实现了商业代价,更通过手语数字人等落地,推动了社会代价。

“百度在这方面不仅有根本,另有技能实现能力和刻意,管理层也非常支持这种投入,在其他地方不敢想的…”

不过,这种基于固有业务生长出的发明,只是小比例的一部分。解释不了百度在主动驾驶、量子计算等赛道上的投入缘故原由。

所以杨吉林给出了他的归因:技能信仰

百度创始人李彦宏在最紧张的场所,都会商到百度对于技能的信仰。好比回港股二次上市,表达的是即便只有1块钱也会坚定投技能。好比在疫情之下的财报季,内部全员信中通报的都是再难不会难研发

而在杨吉林那边,这种“技能信仰”是7年时间垒起的实践总结。他是清华汽车方向的博士,在校期间就围绕L2级智能驾驶展开研究,并在2015年底百度首次将无人车驶上五环后,深受震撼,参加成为百度主动驾驶团队一员,是十大发明中主动驾驶多模态行人运动猜测的发明者。

在百度搞发明的人

杨吉林说,即便是2016年百度开始创建事业部推进主动驾驶时,L4级主动驾驶还是一项短期看不到利润的业务,而且环球入局者寥寥,当时中国更是仅此一家,可以说是孤军作战。但即便如此,百度在主动驾驶投入上没有过犹疑,可以孤军投入、恒久投入,还坚信可以第一个到达

“这背后没有技能信仰,根本做不到。”

辛望也表达了同样的观点。他是悉尼科技大学量子计算博士,毕业后在美国马里兰大学从事量子计算理论的研究,2018年受到导师段润尧——百度量子计算研究所所长感召返国,是十大发明中“全平台量子软硬一体”的焦点研发成员。

在百度搞发明的人

辛望对这个话题提供了另一种维度——通常科技公司、商业公司,紧张的表扬往往会颁向那些跟钱更近的项目,好比给公司赚了几个亿,或者给公司省了几个亿…

量子计算作为一个具有产业革命潜力的科技项目,还属于前沿,前期投入就须要巨大且连续,然而百度投入很果断,百度在2021年工信部发布的量子计算高代价专利及创新驱动力排名中,取得了环球第三、国内第一的认可。

辛望以为,量子计算方面的投入,并没有对短期长处过多追求,而是以更加长远的战略视角举行技能结构,努力在量子科技关键领域去实现技能积累与突破,而且他自己归国后的感受来看,这样前瞻性的技能结构是百度差别于一样平常科技公司、商业公司的显著特色,也将为百度积蓄起支撑未来发展的强盛势能。

在百度搞发明的人

固然,也有发明者笑称:如果不在百度,没有百度这样的专利保障体系,可能也不会成为发明者。

虽然有幽默的成分,但表达的依然是事实:百度确实是国内最重视创新和专利的公司,乃至没有之一。

毕竟百度的成立源起,就是发明专利的成果转换。工程师李彦宏的“超链分析技能”,让高效准确的中文信息检索成为了可能,从一项发明开发了一个中文搜索期间。

到了新一轮技能创新周期中,百度也是人工智能发明专利最知名的公司。深度学习专利申请量到2021年已是环球第一主动驾驶专利族数目也排名环球第一,人工智能环球专利申请量2.2万件,中国超1.6万件,中国授权专利4600多件,荣获AI交互领域的唯一中国专利金奖,成为AI领域得到中国专利奖项最多、级别最高的科技企业

在百度搞发明的人

百度也是国内最早建制专利变乱部的公司之一,2011年就成立了专门团队,将技能创新转化形成发明专利,培养创新的文化。

所以这次的十大发明成果,也是一次完满的发明体系的显现,从台前具体的技能创新、突破,到幕后的协同后勤团队及构造文化,相辅相成,缺一不可。

“少有人来百度前就是大神”

在百度搞发明是种怎样的体验?

十大发明的获奖者答复不一,但都提到了相似的关键词:

自由度高,工程师氛围,不消说服,可以一直干下去。

硕士毕业于北大计算机系的黄烁华,2015年校招中参加百度,两次荣获百度最高奖,这次十大发明荣誉中也有他参与的知识加强盛模子。

在百度搞发明的人

知识加强盛模子是百度在预训练模子上的创新突破。在业内围绕“鼎力大举出奇迹”方向,堆砌训练数据、堆叠参数的时候,百度依托在NLP和知识计算方面的积累,利用知识加强的方法,实现了从规模知识和海量无结构数据中融合学习,学习服从更高、结果更好,具有良好的可解释性。

知识加强盛模子初代目大魔王是2019年3月中国率先开源的预训练模子文心ERNIE 1.0,目前则已经升级成了产业级知识加强盛模子家族,涵盖了自然语言处理(NLP)大模子、计算机视觉(CV)大模子以及跨模态大模子,在产业落地中输出生产力,成为大模子产业化落地和应用的头号玩家。

据黄烁华回想,大概在2018、2019的时间点,百度内部的模子也显现出海量数据训练后的提效表现,显现出一种极新的技能范式,但根本还停留在专用模子解决任务的范畴,于是思考用更通用的模子解决通用问题。

“都懂技能,不消怎么说服”,很快这个新想法就得到立项、批研发预算,并且可以“霸占一间会议室”做封闭开发。

在百度,即便有着数目众多的会议室,但依然在更大的需求眼前显得僧多粥少,抢到、乐成预订会议室都是项目推进的紧张构成。

而大模子研发团队,在立项通过后就得到了一间容纳20、30人的会议室,多少能说明些什么。

在百度搞发明的人

黄烁华说,对大模子跑起来那天的场景影象犹新,虽然会议室里都是不善言谈的工程师,但冲动和高兴洋溢在每个人脸上。而再过一些时间,他们才知道自己成为了该领域的中文开创者,从技能创新到应用结果,都将带来巨大改变。

“如果不在百度,不一定有这样的机会和空间”,黄烁华在参加百度前,有过外资科技巨头和国内创新公司的实习,但那种技能相关的工作豪情,他说百度的最强烈。

现在回看大模子,好像顺理成章全部巨头都有入局。但黄烁华以为,在当时谁人时间点,这样的创新不仅须要技能视野、技能自信,还须要敢投入的勇气,毕竟在AI领域,更多的数据、更大参数,就意味着更多的显卡和计算资源在燃烧,如果失败,就是一次完全打水漂的实验

但在整个过程中,没有由于投入而担心过。

在百度搞发明的人

如果大环境连续不可,你会担忧百度节流技能研发吗?

在现场,这个问题同样被问到了全部发明者,但给出的答案仍然一致:

不担忧。

通用可控AIGC的发明者之一严萧,来百度快10年了,他说百度做的很多技能投入和创新,都有业务场景驱动落地,不是为了创新而创新,不会由于大环境冷与热而改变。

同样快10年司龄的杨吉林,则以为可以听其言观其行,可以用已经发生的事实去推测未来

而事实是,百度已往十年来对技能研发的连续投入只增不减,从比例上来看,2021年研发投入占比收入,乃至高出了23%,这种匀称赚100块就有20块投入技能研发的案例,在中国罕见,在环球也不多。

在百度搞发明的人

杨吉林再次用主动驾驶举例,即便知道主动驾驶有光明的未来,但在没人能给出清晰路径的时候就敢投入、连续投入,没有任何一家其他中国公司敢于这样做。

在中国科技互联网的发展史上,更保险稳妥的办法是“后发制人”,看清晰第一个吃螃蟹的人怎么吃,然后快速依靠人才密集度、勤劳度和市场运营能力跟上,实现后发先至的超车。

但在主动驾驶领域不存在这样的条件,杨吉林认可,谷歌Waymo确实出发更早,但各人也都知道大概方向,细节都是各自探索的,跟登月、造原子弹差不多——他还夸大,现在百度Robotaxi落地比谷歌Waymo更快,没有背后的细节技能上的领先,做不到。

在百度搞发明的人

有意思的是,百度在主动驾驶与人工智能领域的连续投入,也成为了量子计算博士辛望返国加盟的影响因子之一。

他在马里兰大学做的是量子计算理论的研究,当时的量子计算发展间隔产业化爆发另有相对显着的间隔,但在百度量子计算研究所去推动量子计算机的研制,有望成为动员量子计算产业化的先行者时,他心动了。

“一家在主动驾驶、人工智能等前沿科技投入那么多年的公司,一家在创新投入和研发结构均走在国际前线的公司,是有显着技能对峙和技能自信在基因里的,信赖至少会是一家具有战略眼光的长跑型公司。”

在百度搞发明的人

厥后参加后,辛望说他想的没错,这样以技能创新为信仰的基因,从创始人、管理团队那边就写下了。

在AIGC之前,严萧的技能研发和应用涉及过很多业务,好比信息流、输入法,让他印象深刻的是频频来自厂长(李彦宏)的反馈,看得非常技能也非常细节

费扬昭由于参与数字人项目,也接触了不少百度的其他团队和工程师,他觉得跟之前履历相比,百度的管理者都是技能出身,沟通起来很简单。

在交流中,这些发明者也在表达,百度上上下下的这种技能性,也是他们以为可以在这里一直做下去的焦点缘故原由,既可以手轻脚健时冲在一线,也可以在技能视野的磨砺中,站到后方提供弹药和把关。

至少目前为止,很多大神——外面知道的不知道的,就是这样的,他们就站在那边,让你知道可以一直做技能。这些大神名字里,被提到最多的是王海峰吴华陈竞凯

但百度不也有“黄埔军校”的名声吗?意味着人来人往里的聚散流失。

2016年以来始终身处百度主动驾驶的杨吉林,对此给出自己的答复:

很少有人来前就是大神,是在百度成了大神,这个土壤养成了大神。

“被迫有了一种民族紧迫感”

所以百度为啥还要证明技能性?

在现场,针对这些发明的代价和意义的提问,让工程师们惊诧。

黄烁华以为,现在这些发明落地很多成了赛道风口,大模子、AIGC、主动驾驶……但这些发明百度没有一项是在风口时出发的,都是出于技能判断和信仰提前出发,苦功突破,终极实现引领。别人或许等风来,百度却是造风口。

他还举出新例子,量子计算和生物计算,间隔风口都另有时间吧?但百度又已经提前出发了,“百图生科像不像5年前的主动驾驶?”

在百度搞发明的人

杨吉林则补充,从无到有做成无人驾驶是难如登月的,但如果未来一定会实现,Robotaxi注定成为全部人出行的广泛选择,那信赖百度会是第一个到达这个目标地的公司。

即便大环境下行,财报和业绩通报出的压力感知得到,但让杨吉林更加坚定信心的是投入的一直连续,他说他们的部门一直在扩张。从人到公司的底色上,就是写满了技能,围绕着技能,这种东西已经深入骨髓,干事情很爽。

“如果还觉得百度不敷技能,我会邀请他乘坐我们的无人车,无人车够技能含量了吧?”

有意思的是,百度的量子计算硬件实验室,也选在跟无人车运营相近的地方——北京亦庄。

所以辛望说他在工作间隙,也直接感受了一次无人车,情绪很特别,有高兴,有惊喜,也有自豪。

这种特别的情绪,在他返国完全投身量子计算后,有了更明确的表达。

现在国际上对于关键信息技能的逐步封闭,使得他们这样的焦点研发职员无形中多了一种民族紧迫感,更加深刻意识到在关键领域实现自主可控的紧张性与使命感。

在百度搞发明的人

所以现在研发中积累专利的意义是什么?

辛望觉得意义在于从头就有了技能和专利,可以从实际产品、知识产权等多个角度避免了未来被卡脖子。

实际上,这也是近几年来谈论技能创新时再也无法绕开的挑战。太平洋风云变幻,每一次东海岸传来的新消息,本日这个不能用了,明天谁人也收紧了。

但也是这种大配景下,百度在中国科技公司中的某种“独家性”反而被不绝凸显,由于在以AI为焦点的这波技能创新周期中,百度的技能、研发和结构,不仅够根本源头,还全栈全链,最紧张的是具备竞争力和领先性。

所以有一种说法,也是在这种大配景下提出的,说在AI领域,以及百度技能创新和发明已经显现成果的领域,中国着实都多了一种选择、拥有了一项珍贵的自由:免于断供恐惊的自由。

这或许不是百度搞发明和技能结构时的全部出发点,但也确实成了不争的事实和了局。

(受访者意愿,文中受访工程师用了化名。)

本文暂无评论,快来抢沙发!

最新问答
天盟传媒网是一个由会员自行发布传媒的平台,一家集新闻稿发布平台,软文发稿平台,广告交易平台,媒体投放平台,为一体的全网媒体资源自助发布平台。尽一网在手,晓其所有!人人都是传媒者!。
  • 官方手机版

  • 微信公众号

  • 客户端下载