陆奇说景鲲是最优秀的产品经理之一,原因竟是?

2017-07-05 17:01:00 作者:佚名 分类 : 新闻中心

  让一个只会说英文的音箱学会说中国话需要多久?答案是1分钟。百度工程师仅用17行代码,1分钟时间,就让搭载了Alexa系统的Anker音箱,从只会讲英文变成听得懂且说得好中国话。在7月5日的“百度AI开发者大会”现场,百度度秘事业部总经理景鲲发布DuerOS开放平台,将语音交互“唤醒万物”的能力提供给所有开发者。而1分钟让音箱完成中英文语言的转变,是让搭载类似亚马逊Alexa等语音助手的国外硬件设备更好进入中国市场。

  景鲲说:“百度通过打造AI时代的安卓——DuerOS,让每个人,无论你是大公司还是小公司,甚至普通开发者,都能够以低门槛打造属于自己的智能语音交互设备。”为了让开发者感知到这个“门槛”到底有多低,景鲲还变魔术一般从衣兜里接连掏出三款DuerOS开发套件和一款硬件参考设计。开发者使用这些开发套件,只要接一个电源,接一个麦克风,就可以让身边的家电说话。

  DuerOS为什么能实现如此“神奇”的功能?什么是真正的“唤醒万物”?背后又需要多少技术支撑?

  百度集团总裁兼首席运营官陆奇在演讲中称景鲲是最优秀的产品经理之一,以下是景鲲的演讲实录:

  欢迎大家来到百度Create2017百度开发者大会,非常高兴今天有机会跟大家分享DuerOS作为百度生态平台之一,我们如何向开发者赋能,为合作伙伴服务。

  在讲DuerOS唤醒万物之前想先解释一下什么是唤醒万物。每天离开家之前嘱咐妈妈电视这么多的按纽别按错了,按错了导致错误的话,你今天一天都不能看电视了,电视机上为什么有这么多的按纽,人和设备的交互为什么这么复杂,设备为什么不能听懂我的语言跟人类自由的交流,这样的需求不仅存留在老年人心中,存留在每一个人心中。每个人都幻想着过着动口不动手的生活,每天回家对电视说,电视打开调到我上次看的节目,睡觉前想放松一下,想和床头的智能音响说,能不能播放舒缓的音乐。冬天很冷,想对电灯说,电灯关灯。为什么人和设备不能自由沟通,而DuerOS的核心理念就是唤醒万物,让设备和人之间能够用自然语言进行沟通,能让设备听懂用户说话,能够让设备懂得用户的需求。

  而当我们回望整个科技的发展,每一次人机交互的更迭,也将推动时代的变革。最开始通过学习鼠标和键盘学会怎么跟计算机进行交互,近而接触到了互联网,而互联网和计算机推动整个时代的变革。感谢iOS和安卓创造最大的生态,让人们现在可以更加自由地用手指和屏幕交互,跟计算机交流。

  而现在智能语音对话将成为更主流的自然语言交互,因为他是我们人类的语言,从生下来就会的语言,而他产生的影响相比移动时代大的多。因为他适用于每个人、适用于每个物、适用于每个地点。

  看一下国外市场,国外市场也已经进入到了白日化的竞争,科技上亚马逊、谷歌苹果微软都已经投入巨大的人力来推动这个时代的变革,来抓住这场人机大战的机会。我们看一下国内市场,国内市场潜力巨大,需求急剧升温,中国有4.5亿家庭,3亿辆车。中国的市场要比美国市场大的多,我们看IDC出具的2020年行业报告,智能语音在家居可穿戴市场上急剧提升。

  在时代变革期需要一个底层的开放平台支撑推动整个行业的发展,所以DuerOS是人工智能时代安卓系统,我们希望成为一个开放赋能的生态,就像安卓优化人和屏幕之间的手指一样,DuerOS优化用户和设备之间用自然语言沟通,而DuerOS将支撑整个行业完成这样一个转变。

  我们推出DuerOS之后,DuerOS也迅速成为最具活力的生态系统,在DuerOS阵营中大家不乏看到家居企业的龙头企业,当然也包括移动设备的佼佼者、可穿戴倍的佼佼者,除了硬件厂商还包括开发者、内容平台、最大的芯片商,还有我们的方案商。大家都加入到DuerOS平台里,来推动整个时代的变革。

  为了推动这场时代的变革,我们也在总结有什么样的关键因素、什么样的核心条件来满足能推动这场时代的变革。所以我们总结了一下,唤醒万物最核心的三要素是听清、听懂、满足。

  由于整个市场在急剧升温,大家了解到中国很多友商在做类似的事情,有的友商只能做好听清,但根本做不好听懂。只有解决好听懂,用户才能跟设备自然的交互。有的友商有互联网内容,但技术底子薄也做不好,只有真正把听清、听懂、满足解决才能实现,而百度唯一能够做好听清、听懂、满足的公司。

  百度的语音识别率达到97%以上,百度的Deep Speech2016年MIT十大突破性技术之一。只做好这些还不够,人工智能时代要与场景结合,放在家庭条件、家庭小房间,放在车上,把技术真正放在场景里解决问题。所以我们研发了远场相关的语音技术包括麦克风阵列、回声消除、波束成形、语音唤醒、远场识别。

  所以听清我们做好了,但还不够,我们要做好听懂。听懂是AI时代用技术解决的核心问题,只有解决听懂,用户才能跟设备自由的进行沟通和交流,而数据多、技术深是打造对话系统的必要条件。百度在这个市场上具备着巨大的优势,在屏幕上的关键词,千万、亿级、十亿、百亿、千亿。百度拥有亿级的多轮对话机制,让我们知道用户跟百度对话过程中究竟表达哪些需求,究竟多轮是什么样的场景。我们具有十亿级的数据和百亿级的知识,知识将是这次AI革命非常重要的一个数据,只有知识、具备很多的知识才能真正听懂用户说的话,才能听懂用户表达的每一个关键词的意思。

  除了数据之外百度在技术上一直是佼佼者,率先把机器学习应用到多个领域里来打磨我们的技术,对话、搜索、广告来打磨我们的技术。我们的自然语言处理技术一直是行业领先者,我们有十多年的技术储备,覆盖基本上所有自然语言和方向。我们的DuerOS技术率先采用深度学习和增强交互的方法,应用在场景个性化等多轮对话系统。我们的搜索技术更没有问题,世界上首家率先引入语音图象多轮交互的功能化搜索和智能化交互。

  有了数据、有了技术,就要满足用户所求,当用户跟一个设备说,我想放一首歌的时候,要满足用户的所求,这些在人工智能时代还不够,因为人们在跟设备沟通的时候会表达更自然的表达法,这些是Create真正在设备之间在人机对话的数据,我要说一句歌词,这是周杰伦的一句歌词,想通过歌词来听歌曲,这是用户自然语言表达的一个需求。只有把这些自然语言都满足才能做到一个听懂的系统,不仅做到单轮,在兼容里边还会做到多轮。

  接下来一段视频我们来一起看下百度如何在DuerOS系统里满足用户的需求。

  (播放多轮语音交互视频)

  刚才这是一款搭载了DuerOS的手机,只要用户轻轻捏着边框就可以语音助手,设备在我们展区,有兴趣一会儿可以体验一下。只有解决多样用户的表达,满足多轮场景的需求,才能真正让设备听懂用户的表达。而听懂的目标我们的设计FREESTYLE,在座有一些人可能有一些陌生有一些人比较熟悉,FREESTYLE这是最近非常流行的词语,FREESTYLE是希望用户表达不要有拘束,不要记住特定的指令,想你所想,说你所想表达的东西,这是我们的目标。

  百度对技术的追求一直永无止境,除了自己的技术,我们会聚全世界最顶级的数据开放赋能,为我们的合作伙伴服务。KITT.AI,是一家顶级的人工智能创业公司,是一家西雅图创业公司,入选了CB Insights人工智能创业公司100强,他专注在设备的语音唤起和自然语音处理技术,是世界上唯一一家同时获得亚马逊、Alexa和微软联合创始人POERRY投资的公司。今天我非常高兴地向大家宣布,百度将全资收购KITT.AI,并且将他的语音能力、自然语言处理能力全面加入百度开放平台,全面免费向合作伙伴开放。所以在此我也有请KITT .AI的联合创始人陈果果上台,为大家演示一个产品SNOWBOY。

  陈果果:今天我会给大家展示我们其中的一款产品,是跟唤起词相关的产品叫做Snowboy。首先在座各位可能不是特别理解什么是唤起词,其实人和设备的交互和人跟人的交互是非常类似的。举一个例子路上碰到了景鲲,想跟景鲲说话,我自然的知道了景鲲的名字,景鲲听到就停下来跟我对话,人跟设备的交互一样。我们说到唤起词的时候,设备就会意识到,我们想跟设备通话。接下来演示如何用SNOWBOY如何快速激起唤醒词。

  登陆网页首先是唤起词列表,来自全国各地开发者训练的各式各样的唤起词,2012年5月份至今超过12000名开发者,将近9000个不同的唤起词,有中文、英文、俄语、法语以及其他语种的小语言。SNOWBOY这么受欢迎是两方面的原因,一个是性能上的优势,将大型的神经网络压缩到几个兆,甚至更小几百K,SNOWBOY就可以运营起来。第二个原因是简单运用。

  首先点按纽新建唤起词,第一步需要输入唤起词的基本信息,刚刚用到了景鲲的例子,所以输入一个唤起词,你好景鲲,语言是中文。输入完毕可以进入第二步,第二步需要将唤起词说上三遍。到这一步的时候唤起词进入完毕,测试的时候会对唤起词本身做出反映。测试一下,你好景鲲,在此之后说其他的语言他不会做任何的反映,只会对唤起词做出反映,测试完成点击保存并且下载。

  到现在为止,你好景鲲这个唤起词已经新建完成。SNOWBOY后续支持特别多的编成语言和硬件平台,开发者可以根据自己喜好选择他所想要的唤起词,选择他想要的唤起词语言,并且加入进来。SNOWBOY已经成为最大的开发唤起词社区,我们也是受到亚马逊绢纺推荐作为第三方Alexa唤起词技术提供商,KITT唯一一家受到亚马逊投资做唤起词技术的公司。

  最后我感到非常荣幸KITT之可以加入到百度DuerOS大家庭,KITT已经在中国获得非常大的成功,我们非常期待和行业领先者走在一起一起将语音交互变的更加简单。

  景鲲:大家已经看到了,我稍微解释一下,通过陈果果三次的训练,那个笔记本就叫景鲲了,以后看到这个笔记本的时候就可以说,你好景鲲。

  百度不仅仅是KITT公司进入到百度,我们希望全世界最顶尖的技术,我们会吸纳全世界最顶尖的技术,并且加入到百度开放平台当中,向外界开放赋能。

  说了听清、说了听懂,最后满足也非常关键。不能听的清又听的懂,百度是中国市场唯一具备数据范围非常广的公司,我们覆盖的内容和服务非常多。当一个设备接入DuerOS,会有十大类,一百多类的小能力为设备厂商进行开放。不止这些,还会有第三方开发平台,引入第三方内容方和开发者,为百度,为DuerOS,为设备贡献更多的内容。这是一些百度数据的冰山一角,我们有1300万的百科,360万个餐厅,6亿个商品库,2000万的歌曲。今天开始只要设备接入到DuerOS,所有的设备、所有的数据都会全面免费向设备进行开放。

  所以DuerOS是真正能够做到听清、听懂、满足的开放生态系统。但是直到这些我们觉得还不够,因为在AI时段,软硬结合将是一个趋势,软件和硬件更多的会融合到一起,目前软硬结合还会有很大的障碍,开发成本还比较高,很多写软件的同事不知道怎么写硬件,写硬件的人不知道端的软件怎么做。所以为了针对这个问题、解决这种困难,DuerOS将提供最容易上手的软硬件一体化解决方案。

  软硬件一体化解决方案包括了多样化的开发套件和完全开放的参考设计。其中开放套件包括个人版,利用先进技术做的个人版开发套件,让每个开发者拿配件回家就可以组装成一个可以对话的设备。包括和RDA、Realtek合作设计轻量版的语音功能,也包括标准版我们跟业界听见公司MTK、全志、Intel、Rockchip、高通、科胜讯、声智、先声6个、8个的麦克风。还包括一体化的参考设计,电路板设计、开放结构设计、开放麦克风陈列设计,大家可以登陆DuerOS官网马上下载并且申请相关的材料。

  光说不练假把式,在我的口袋里就是DuerOS的个人版的开发套件,今天大家就可以登录官网把开发套件带回家,搭建属于自己的个性化的设备。在我的口袋里还有另外一个智慧芯片,他的大小大概是1块钱人民币的大小。把DuerOS智慧芯片加上电源、麦克风、扬声器,就是一款可以对话的设备。

  当然除了个人版、轻量版、标准版我们也准备了,只是我口袋里装不下。大家可以看到这就是我们跟合作伙伴一起研发的DuerOS多麦克风陈列的标准版设计,把这些多麦克风全部放在一个设备里,这是今天完全开放DuerOS参考设计,所有屏幕上的一切,大家都可以即刻登陆DuerOS官方网站下载、申请。

  除了开发套件之外,我们针对我们的合作伙伴还开发场景一体化的整体解决方案,无论我们的合作伙伴是在做音响、电视、冰箱、空调,任何一个设备场景化的整体化的解决方案为你服务。

  还有一类特别的合作伙伴Anker就是这样一个例子,他是涉及配件全球领导的一家企业,是在深圳的一家公司,致力于弘扬中国制造资本。他下面希望打造一款人工智能音响,让用户跟设备之间可以用语音进行对话、交流,所以他希望跟全世界的领先技术先行者一起合作打造这款音响。在美国他选择了Alexa,在中国他选择了DuerOS。要把一款销往美国的设备搭载DuerOS重新销往中国,需要重新研发。为了满足用户的需求,感谢Anker开放了Alexa,能够把一款销往美国的设备很快销售到中国。

  有请百度度秘工程师罗兴给我们演示如何搭载这样的一个设备迅速接入到DuerOS。

  罗兴:谢谢景坤,大家好,我是DuerOS的工程师罗兴,在我的前面是数模块,在前面已经接入DuerOS的设备,我现测试一下这个设备。

  接下来我将现场将这个设备接入到DuerOS,大家可能不知道,一个设备要接入新的服务需要复杂的事情,我们需要开发所有的功能代码,需要至少五个人来做产品功能研发,整个调试周期长达3到6个月,但是今天这一切将变得非常简单。到底有多简单呢,我来给大家演示一下。

  搞定,就是这么简单。接下来我给大家介绍我的操作,我刚才运营了一行命令,这个命令对修改程序17行代码,其中17行是让设备登录DuerOS的帐号登陆,后边一行让设备连接到Alexa的开放协议地址。现在测试一下接入到DuerOS的设备效果。你叫什么名字?小度:我叫小度,以后有事情都可以来找我。今天天气怎么样?小度:北京今天空气质量指数为114,空气质量轻度污染。上海呢?小度:上海今天空气质量指数为60,空气质量良。5点提醒我去上海。小度:请问是今天下午还是明天凌晨。今天下午。小度:为你设置了今天下午五点的闹钟,小度准时提醒你去上海。

  一分钟让接入到Alexa设备接入到DuerOS。我的演示完了,刚才所有的演示文档都可以在DuerOS的开放平台上获取到,现场如果接入到设备厂商,我们今天就可以回家试试,只需要一分钟时间,就可以让你的设备进入到中国市场。

  谢谢大家!

  景鲲:原来一款打在Alexa服务的销往美国的音响,我们把他搭载DuerOS销往中国,这个过程只需要1分钟。今天合作伙伴就可以到DuerOS官网下载相关材料。

  在我们的合作中还有一位特别的开发者,我们有很多的开发者用户,但这一位开发者用户尤为特别。今年4月份的时候,我们收到来自与杜志鹏的一封信,杜志鹏是一名深圳嵌入式工程师,他的小外甥特别喜欢一个玩具,跨下海口说我把你的玩具改造成可以对话的玩具,最后发现百度的DuerOS是最适合他搭建这样一个设备的服务。所以他联系到我们,在他整个信件最后一句说,你们能不能帮我实现这样的目标,我不想成为说大话的大舅。

  看完这封信我们很触动,为了让杜志鹏不是成为说大话的大舅,为了让语音对话设备进入千家万户,我们把轻量版套件寄给了杜志鹏。接下来请大家看一段视频。

  (播放视频)

  我们非常高兴让DuerOS的能力也能支持像杜志鹏一样的普通的开发者,我们今天也特别有幸请到了杜志鹏和他的外甥本人来到了现场。有请!当然我们还要有请一个特殊的合作伙伴,来自乐高中国市场部副总裁王俐。

  杜志鹏,你为什么想做这样一个语音交互的玩具?

  杜志鹏:我看见小外孙这样一个机器人,我希望可以让他更可爱可以跟他聊天。

  景鲲:小朋友,你喜欢跟他聊天,你最喜欢问他一个问题,问了之后笑哈哈,是什么问题?

  小朋友:恐龙是怎么灭绝的?那是怎么灭绝的?

  杜志鹏:恐龙自己吃的比较多,放屁产生了温室气体,他觉得在这个场合不太适合。

  景鲲:你希望大舅多做一些可以对话的玩具给你吗?

  小朋友:希望。

  景鲲:王总,为什么希望从乐高角度支持杜志鹏完成这样一个项目。

  王俐:作为乐高非常希望让玩具展现非常不一样的玩的体验、互动的体验,和百度一样,乐高品牌也是致力于拼打体验过程,将具备可视化的变成功能,未来乐高非常期待和百度这样人工智能的领跑者进行合作,给全世界的乐高消费者带来丰富的玩乐体验和充满想象力的创造空间,未来属于创造者。谢谢百度。

  景鲲:谢谢!所以DuerOS不只希望赋能于行业巨头的合作伙伴,也不只是希望行业剧透的创业公司,我们希望赋能每一个有梦想的人,只要你有梦想,你想做一款语音交互的设备,我们就希望把这个设备开放给你,今天在线下还有看直播的同学,可以即刻登录DuerOS官网,下载打造一个可以对话的设备。

  今天下午我们也会有更加密集的活动,向大家详细讲解DuerOS架构,其中包括小度智能设备开放平台,小度对话开放平台。小度对话开放平台如何做到能听清听懂,小度对话开放平台如何做到引入,我们有核心接入组件等软件方案,让他成为一款可以最容易上手的开放平台,今天所有的开放平台资料都可以在官网找到。

  最后,我们也希望DuerOS作为百度核心人工智能开放平台之一,真正开放赋能,推动时代的变革,赋能我们的合作伙伴,赋能内容商,赋能芯片商、赋能整个生态,希望大家一起共同开创美好的明天。

  谢谢大家!

芥末视频

最近更新
科普

科普图集
带着朋友和机器人上月亮散步

带着朋友和机器人上月亮散步>>详情

邮件订阅

软件信息化周刊
比特软件信息化周刊提供以数据库、操作系统和管理软件为重点的全面软件信息化产业热点、应用方案推荐、实用技巧分享等。以最新的软件资讯,最新的软件技巧,最新的软件与服务业内动态来为IT用户找到软捷径。
商务办公周刊
比特商务周刊是一个及行业资讯、深度分析、企业导购等为一体的综合性周刊。其中,与中国计量科学研究院合力打造的比特实验室可以为商业用户提供最权威的采购指南。是企业用户不可缺少的智选周刊!
网络周刊
比特网络周刊向企业网管员以及网络技术和产品使用者提供关于网络产业动态、技术热点、组网、建网、网络管理、网络运维等最新技术和实用技巧,帮助网管答疑解惑,成为网管好帮手。
服务器周刊
比特服务器周刊作为比特网的重点频道之一,主要关注x86服务器,RISC架构服务器以及高性能计算机行业的产品及发展动态。通过最独到的编辑观点和业界动态分析,让您第一时间了解服务器行业的趋势。
存储周刊
比特存储周刊长期以来,为读者提供企业存储领域高质量的原创内容,及时、全面的资讯、技术、方案以及案例文章,力求成为业界领先的存储媒体。比特存储周刊始终致力于用户的企业信息化建设、存储业务、数据保护与容灾构建以及数据管理部署等方面服务。
安全周刊
比特安全周刊通过专业的信息安全内容建设,为企业级用户打造最具商业价值的信息沟通平台,并为安全厂商提供多层面、多维度的媒体宣传手段。与其他同类网站信息安全内容相比,比特安全周刊运作模式更加独立,对信息安全界的动态新闻更新更快。
新闻中心热点推荐
新闻中心以独特视角精选一周内最具影响力的行业重大事件或圈内精彩故事,为企业级用户打造重点突出,可读性强,商业价值高的信息共享平台;同时为互联网、IT业界及通信厂商提供一条精准快捷,渗透力强,覆盖面广的媒体传播途径。
云计算周刊
比特云计算周刊关注云计算产业热点技术应用与趋势发展,全方位报道云计算领域最新动态。为用户与企业架设起沟通交流平台。包括IaaS、PaaS、SaaS各种不同的服务类型以及相关的安全与管理内容介绍。
CIO俱乐部周刊
比特CIO俱乐部周刊以大量高端CIO沙龙或专题研讨会以及对明星CIO的深入采访为依托,汇聚中国500强CIO的集体智慧。旨为中国杰出的CIO提供一个良好的互融互通 、促进交流的平台,并持续提供丰富的资讯和服务,探讨信息化建设,推动中国信息化发展引领CIO未来职业发展。
IT专家网
IT专家新闻邮件长期以来,以定向、分众、整合的商业模式,为企业IT专业人士以及IT系统采购决策者提供高质量的原创内容,包括IT新闻、评论、专家答疑、技巧和白皮书。此外,IT专家网还为读者提供包括咨询、社区、论坛、线下会议、读者沙龙等多种服务。
X周刊
X周刊是一份IT人的技术娱乐周刊,给用户实时传递I最新T资讯、IT段子、技术技巧、畅销书籍,同时用户还能参与我们推荐的互动游戏,给广大的IT技术人士忙碌工作之余带来轻松休闲一刻。