您所在的位置:物联网>正文

科大讯飞2017年发布会讲了啥?全在这里了:推出十大重点产品,囊括四大消费场景

聚行业--物联网 it.sohu.com   2017-11-12 16:42

物联网-全文略读:但是我想这句话有他对的地方,但是大家没有看到语音产业背后的实质是人工智能,虽然我们在一开始的时候也许不知道自己追求的是那么伟大的一个事情,但是我们坚持下来了。这就像公司经常说起的一句激励我们自己的话:“你所清楚遇见的、热烈渴望的,最后都会自然而然地...

 

物联网--科大讯飞2017年发布会讲了啥?全在这里了:推出十大重点产品,囊括四大消费场景

 

11月9日,科大讯飞2017年度发布会在北京召开,科大讯飞董事长刘庆峰、轮值总裁吴晓如分别在大会就人工智能技术、行业应用做了报告,执行总裁胡郁则向所有人公布了公司在人工智能领域的最新产品。

 

据刘庆峰透露,12月6号,科大讯飞刚刚创造了一个历史性记录:讯飞智医助手,成为第一个通过国家医师资格证的机器人。据刘庆峰透露,讯飞智医考了456分,超过分数线达96分以上,在安微省2万多考生中,名列前100名。

 

刘庆峰提到人工智能的三级跳:

 

1.基础算法的突破,特别是CNN,RNN等算法的创新;

 

2.技术体系;

 

3.应用体系。

 

此后,对于科大讯飞在技术和应用的具体成绩,刘庆峰开始了疯狂打CALL的进程中。

 

他提到在BLIZZARD CHALLENGE 比赛,无监督MACHINE LEARNING 任务比赛,科大讯飞均拿下第一。

 

讯飞输入法的识别率达到98%,方言识别已覆盖22种方言,其中在四川话,东北话,天津话等方言中,识别率达到90%以上。

 

讯飞在英文手写识别准确率达到97%,目前手写识别已经可以用在作文、英文考试阅卷中。

 

2017年10月在CITY SCAPES大赛中,讯飞以81.45%的自动驾驶场景分割任务的分数刷新该比赛的纪录。

 

谈及AI 走进亿万家庭。刘庆峰主要提到四个方面:教育,医疗,司法,公益。

 

其中科大讯飞在医疗中的应用为人工智能辅助诊疗中心,其在医学影像方面识别率可达94.1%,并在2017年8月刷新LUNA世界纪录。

 

关于赋能司法,目前,科大讯飞在卷宗录入的准确率达98%,语音庭审可节约28%的时间,辅助判案中罪名分类准确率达97.2%。日前已覆盖31省,360家法院,100家检察院。

 

此外,在公益方面,科大讯飞科大讯飞首期的四个项目包括:教育公益,医疗公益,方言保护公益,无障碍公益(针对残障人士)。

 

关于行业应用,轮值总裁吴晓如则具体从教育、客服、医疗等方面进行介绍。其中,医疗上让人印象比较深的是对于语音电子病历的演示,效率上比传统病历录入提升4倍。

 

此外,关于医学诊断系统,主要赋能影像科医生,其在LUNA比赛中高达94.1%的准确率,可以媲美三甲医院的医生。

 

有意思的是,三甲医院的医生也被请来现场演示和现身说法,详细说明了人工智能医疗产品到底在哪些地方对医生起到助力作用。

 

在具体的产品上,执行总裁胡郁则重点介绍了翻译场景,移动场景,车载和家居场景等重要场景。

 

翻译产品包括讯飞晓译,其中讯飞晓译的紧急演示系统,可以提供安全方面的支持。

 

此外,胡郁还介绍了面向儿童英语教育的译呗、阿尔法蛋,之后还有黄金蛋等。

 

在移动方面,胡郁提到了输入引擎,赋能每个人的日常生活。

 

在车载方面,其推出的飞鱼系统已卖出1000套以上,月活数达到90%。在发布会现场,胡郁发布了飞鱼2.0系统。

 

家居场景,胡郁则重点演示了魔飞等产品。

 

以下为三人的演讲实录的编辑整理,部分内容有删节。

 

1刘庆峰演讲实录

 

在过去一年中,人工智能正在全球范围内不断掀起全新的热潮,而科大讯飞自1999年创业以来,18年一直立志于要让机器像人一样能听会说、能理解会思考,用人工智能建设美好世界。

 

人工智能将替代什么?

 

两年前在这里,科大讯飞举行了“AI复始,万物更新”的年度发布会。我们给大家展示了全球第一次能够把大会的演讲用人工智能直接转化成文字,而且转写准确率超过了人工记录人员的技术成果。

 

去年,又是在这里,我们进一步提出“当前社会已经从互联网+开始要升级到人工智能+全新时代”,首次发布了全球可以达到大学六级口语的翻译系统,讯飞的翻译机。今天科大讯飞又给大家带来什么样惊喜呢?

 

首先我非常高兴地告诉大家,就在三天前的11月6日,我们迎来了一个可以载入中国甚至全球人工智能史册的研究成果,那就是科大讯飞人工智能机器人,“讯飞助手”。它参加了2017年国家医师资格考试,成为了全球第一个通过了国家考试的机器人。

 

这个考试每年都举行,满分600分,今年的分数线是360分。而专业毕业的医疗专业的毕业生工作几年之后,通常少于一半的人能通过这个考试,今天讯飞智医助理考了456分的高分,超过分数线96分,在安徽省2万多考生,科大讯飞的智医助理名列前100名。这就是人工智能给我们带来的惊喜,跟人类学子在一起,它已经不止是百里挑一了。

 

很多朋友听到这个消息以后欢欣鼓舞,认为这将使得人工智能未来可以成为全科医生服务中国公众。但是,也有医生朋友给我打电话,表达了他们的担心和顾虑。

 

我告诉他们,科大讯飞的人工智能,“智医助理”,不是用来替代医生的,我们是帮助医生的。我们希望通过“智医助理”,这个人工智能辅助诊疗系统,使得医生的水平有所提升,优秀医生的服务能力进一步扩大。

 

很多人在关心,目前的人工智能已经进入到了哪些领域?又即将在哪些行业真正替代人类现有的劳动?

 

我们来看一个相关统计数据。现在科大讯飞人工智能平台每天的使用人次已经超过了40亿。在这个平台上,使用最多的应用是教育,占22%。其次是通讯相关的社交,有18%。排在前面的还有生活相关的智能硬件,这些是跟现在的整个创业生态和社会关注热点以及大家的民生需求紧密耦合的。

 

我们再看一下最近很多的第三方媒体和分析机构的权威分析,未来最有可能被人工智能替代的行业,或是由于人工智能提供的帮助所释放的劳动力。数据显示,99%电话推销员、95%打字员会被替代。但是教师在这个中间是最低的,只有0.4%可以被替代,跟心理医生一样,都是属于1%以下的。

 

这样一个统计说明了以下几个问题:

 

1、只要是简单、重复性的技能,未来都可以被机器大幅度替代的。

 

2、你需要学习、训练得到的,而不是依靠你的天分的技能,未来也会被人工智能所替代。

 

但是人工智能替代不了的,是人类的沟通社交能力或者是人情的艺术,这些机器现在还不具备。机器不具备人类更大的感性,我们对未来很多梦想、创意和灵感,是机器做不到的。

 

换句话说,我们可以看到未来人类和机器的发展正走在不同的路线和分工之上。而人工智能将要大幅度替代的恰恰也是人类并不喜欢的这些岗位。依靠人工智能,,我们可以可以从这些岗位中释放出来,从而有更多的时间、精力来发展自己,来做更有创意、灵感和乐趣的工作。

 

这只是一个展望,究竟人工智能能在多快的时间、多广的广度和多深的深度影响我们的时代呢?现在有人认为人工智能已经开始更加超越人类,主宰地球,也有人认为人工智能只是一个更加虚幻的概念、泡沫居多。

 

我觉得,我们要给出答案来,绝不是凭感性来判断,要实实在在地回归到科学的本质。在人工智能的发展中,核心技术的进展决定了产业竞争。我们要看看今天核心技术到底能做什么,这就是我们发布会的主题“顶天”的含义。

 

人工智能“三级推进”体系

 

其实人工智能技术这几年来不断地在各个细分算法和相关应用领域取得了突破,总体来说第三次全球人工智能浪潮主要还是起源于2006年深度学习的相关算法的提出,在数学统计建模上已经可以取得重大的突破,可以使得机器在感知和认知智能上面开始做出以往根本想象不到的优秀表现。另外我们的以往的科学也在不断地突破。希望在未来,通过神经元的传导机制,能够进行更好地计算、架构,对人类进行更好地模拟和学习。

 

但今天,围绕着统计建模作为主要的通道,到底能做到哪些呢?各种单点的创新究竟怎么为这个时代怎么汇聚我们的能量呢?

 

我们可以形象地把人工智能的发展和技术分成三级推进的体系:

 

第一级是各种基础算法,从深度学习DNN的算法,在2006年那年在语音识别领域取得了突破。卷积神经网络CNN算法在2012年以后开始在图象识别中取得了突破,包括递归神经网络、注意力机制、对抗机制和增强神经网络等方法,开始不断地在机器翻译、无人驾驶和医疗等领域取得了突破。这些是基础算法。

 

在这个创新的基础上,最终集成出来的技术成果主要可以分为感知、理解和推理这三个层次。基于这些基础算法的创新,通过感知的智能,可以把各种原始数据进行分析和处理,变成有效的信息。就像我今天这个报告,可以把我的语音文件原来没法结构化处理的直接变成文字信息,而且还翻译成了英文,变成了有效信息,这是第二步。

 

变成了有效信息之后,再通过人工智能的理解,把有效信息变成结构化的知识,供下一步的学习、训练和推理,再由推理的模块进行决策,无论是下围棋,还是学习、司法、医疗,都可以进行决策的呈现。

 

有了感知、理解和推理这三层之后,也就是基础算法是一级推行体系,技术体系是二级推行体系,就可以把人工智能推进到社会生活的各行各业。今天在基础算法领域,中国的科研机构,包括我们科大讯飞自己,已经有很多的算法上新。但是今天,我想更侧重到技术体系的这三级:感知、理解和推理上面,看看我们在2017年又有些技术取得了突破。

 

科大讯飞实现了哪些突破?

 

在感知技术中,非常重要的语音合成,让机器像人一样开口说话。2017年国际英文语音合成大赛(也是国际最权威的语音合成比赛)暴风雪竞赛,科大讯飞第12次蝉联了全球第一名,而且今年依然是全世界唯一让语音合成技术能够达到真人说话水平的。

 

我们可以看到我们是4.0分,5分是播音员,4分代表美国大学生、普通老百姓的发音,4.8是作为参照性的美国播音员的水平,全世界让计算机练英语,迄今为止只有中国人做的产品能够达到真人的水平。这是2017年的比赛结果。

 

但是我更高兴地告诉大家,在2017年还有一个在原来一个比赛上的新的比赛类型,国际语音合成的比赛怎么比呢?由播音员录几千句话,各家参赛单位把这几千句话拿回来,通过分析这几千句话,生成一个语音合成系统,可以合成任意文本,然后把系统提交过去,主委会找政治新闻、娱乐新闻、小说等等来测试系统的水平,这是以前的模式。

 

而今年随着人工智能的进展和进步,主委会说我们希望除了把3000句语料送给各家训练以外,有没有本事你们所有人都不要看是什么语料,给一套机器系统,全自动学习,也就是我们说的无监督学习,不要人来做任何的介入,全部机器自动自己学习。今年启动了一个全新的比赛,叫无监督的机器学习任务,大家都在拭目以待,结果出来了,科大讯飞不仅是全球第一,而且和第二名的差距比传统方法差距更大。这充分证明了我们在机器的自主学习方面取得了全球瞩目的成果,这个技术也使得我们有能力,未来在全世界各个新的语种,只要我们有适当的语料,完全机器自主就可以学习训练,生成一个一个方言的语音合称,甚至一个一个小语种的语音合成。

 

所以,我们提出来“抢救方言”,用这个技术我们就可以使得人类的方言不断地得以保存和重现,这是技术突破给这个时代带来的机会。

 

除了语音合成,我们再看看感知智能非常重要的另外一个方面语义识别到底要什么程度了。今天我们语义识别的准确率进一步提升到了98%,这个数据是针对1亿多的月活用户平均结果可以做到98% ,应该说是非常了不起的进步。

 

在最近一次的国际英文合成大赛是去年年底在Google举行的,科大讯飞也是全世界的第一,但是我们现在中文的准确率是超过了在英文中的准确率,使中国用户享受到了全世界最好的技术成果。

 

另外,我们也分析发现,98%是平均准确率,还有10%-20%由于口音和方言的问题,准确率只有80%多甚至更低,为了解决这些问题,为了让我们年迈的父母亲和更多的社会人群都能使用到人工智能技术的福利,我们在2017年进一步大幅度提升了方言识别的水平,现在科大讯飞的方言识别已经有22种,是国内唯一能够做多种方言的核心技术厂商。

 

另外,我们的相对指标相比2016年提升了50%以上。现在方言识别的准确率超过90%的已经接近10种。我们还将在这22种方言中不断地拓展,要让信息实现真正的所有人群沟通无障碍。

 

除了语音合成和识别之外的手写识别领域,去年和前年已经用人工智能使得机器在英语和语文的作文评分上可以超过一般老师的评价水平。这其中的第一个门槛就是能够把学生在纸面上的手写文字,就是一个图,没有笔顺、笔划的信息,让机器进行识别。这方面,我们在业界处于领先的情况。在把它做到了在中、高考的作文评分中都能使用的前提下,今年又有了进一步的突破。

 

现在我们的英文手写识别准确率已经达到了97%。它不仅是业界最好的,而且跟全世界现有的第二名有代差级的优势。

 

更进一步,大家说有了英文、中文,能不能识别公式、图形?比如说在数学题目中,我们又有了突破,今年我们呈现的成果可以识别的准确率达到了92%以上。也就是说,将来它是可以读任何相关信息的。这个成果将使得学生家庭作业个性化数据的采集成为可能。

 

除了图文识别,另一个非常重要的人工智能领域就是医学影像。影像科医生非常辛苦和敬业。在一些医院,一个影像科医生5分钟就得看一个癌症病人肺部结节的图片,包括200多张图片,工作量非常大,能不能让人工智能帮忙?

 

国际最权威的医学影像的人工智能的比赛就是针对肺部结节的测试,是美国的一批医生针对美国的患者做了标注,一部分拿出来训练,大家去学习,一部分在后台,保密,然后用来测试。

 

科大讯飞今年8月份,刷新了全球肺结节测试的世界纪录,我们的准确率达到了94.1%。我们在安徽省立医院的三甲医院的测试结果表明,现在对肺结节的判断,人工智能技术已经达到了三甲医院医生的平均水平。这就是今天人工智能对医疗实实在在的帮助。

 

而且,我们已经在安徽开通了人工智能在线诊疗平台,已经可以对全省41个县市提供实时帮助,下一步计划将105个县全部接入。

 

医学、影像之后,另外一个热点是图象识别和图象理解。我们的正面的人脸识别机器,在光线好的时候,已经超过了美国FBI最好的特工人脸识别能力,做到了99%以上。

 

而未来图象识别一个非常重要的领域是智能驾驶或者是人工智能辅助驾驶。在这个领域的一个最关键的技术,就是车辆在行进的过程中,摄像头看到的前方,我知不知道哪些是人,哪些是车,哪些是道路,这种区隔历来是人工智能在自动驾驶中的非常关键的任务。

 

今年10月份,我们参加了奔驰发起的国际自动驾驶领域最权威的比赛的。全球44家单位参加,包括了Google在内,科大讯飞是全世界第一名。

 

所以,从这个角度就可以看出来,我们能够在感知智能中有这么多的突破,是因为我们在人工智能的三级推进体系的第一级源头算法中有了很强的积累。

 

另外,在第二步“理解”,把有效信息变成结构化信息中,我们也是成果颇丰。

 

由斯坦福大学牵头的叫SQUIG的国际机器阅读理解大赛是业界公认最顶尖的比赛,纯英文的,大概10万篇文章。人看过以后会提各种问题,机器阅读要能回答这些问题,而且告诉他文章的出处是什么地方。过去两年都是微软是全世界第一。但是今年10月份,科大讯飞和Google、IBM、微软、Facebook全部都参加了,科大讯飞改写了这个世界纪录。

 

所以,有了这些理解,就使得我们有能力阅读机器的各种作文,有能力阅读各种病例和处方等等,这是一个基础性的核心能力,而我们中国再次走在了世界的前列。

 

有了阅读理解,推理怎么样?去年在纽约举行的国际推理比赛,科大讯飞拿了全世界第一。加上我们刚刚给大家报告的好消息,就是我们的医学推理智医助理考了456分的高分。

 

大数据到认知计算的是IBM,2011年IBM的Watson在美国的一个脱口秀节目中战胜了人类冠军,引起了全球人工智能界的轰动。它的负责人是戴维,就想在2012年之后能够有一天让IBM的Watson通过美国国家医师资格考试。而今天我们中国率先实现了这个突破。这个技术是非常难的,为什么难?给大家看一看。

 

因为我们要做好这样一个推理,首先必须要对海量的医学知识进行学习,要从医学的教科书中学大量知识,我们跟人民卫生出版社合作,把所有医学专业的学生应该学的53本教科书全部学习进来,要学习最前沿的国际论文和大量的案例,学完之后,怎么样能够表达出来?传统的搜索根本没法做,然后一般意义上的知识图谱也很难表达这么复杂的信息,因此我们创新了这样的模式来进行原有知识的学习和沉淀。

 

光有这个还不够,当一个相关信息问题过来之后,你能不能理解问题?这就是我刚刚讲的自然语音理解要发挥的作用。理解完以后,在各个选项中怎么进行选择,是需要通过语义证据的抽取,进行多尺度的推理,包括关键点的推理、上下文相关的推理以及关于证据链的推理等等一系列复杂的动作,最终才能取得我们刚才说的成果。

 

我给大家简单展示一下。

 

这是一个问诊过程,问诊过程中问出来的各种相关信息大家用语音识别,问完之后会根据对话自动找到里面的关键内容,就是通过自然语言理解,对关键内容的了解和识别。了解完之后,可以预判这个患者大概可能是哪几种病,这几种病预判之后,每一种病的症状和患者的实际症状要进行人工智能的推理和相关的耦合学习和训练,然后不断地对比,最终推论出这样一种病症表现。

 

这是一个非常严密的推理过程,来不得半点虚假,绝不是传统意义上的简单搜索能做到的,是在搜索的基础之上,我们要有感知智能、语义理解,然后进行推理,才能得到这样的结果。

 

所以,今天我们可以说,在越来越多的领域,AI可以学习顶尖专家知识,达到一流专家水平,从而可以超过90%普通专业人士。正是因为这些技术的突破和进展,所以我们今天可以非常高兴地宣告,AI已经准备好为世界赋能!

 

我们再给大家举一些例子,到底科大讯飞希望在AI为世界赋能的时候能够做出一些示范和标杆,让大家看得见、摸得着。我们优先做了哪些事情?我给大家举几个例子。

 

AI赋能教育。这是讯飞的情怀,因为教育决定了一个民族的未来,我们希望能够为了少年儿童的健康成长和快乐学习,来让AI赋能教育。

 

在这中间,AI的核心能力我们可以把它概括成两点,就是发现你和成就你。发现你怎么做?基于大数据的智能分析和评价,我们怎么能够把学生的过程性的作业、课堂的训练这些东西都汇聚上来?没有我刚才讲的OCR的识别,没有公式和中英文的识别,这些是不可能做到的。

 

能不能把老师讲课过程中的内容汇聚上来?没有语音识别是做不到的。汇聚上来以后,还要进行语义理解、分析,用讯飞来进行评价,知道他做得对还是错,他的作文得90分还是60分,怎么改进。这是“发现你”,必须要依靠人工智能。

 

成就每个孩子,让每个孩子回到家的作业都不一样,把原来大量的无效重复学习砍掉,让孩子学得更有趣,让学习内容更有针对性。这就是要基于AI的知识图谱,要分析出这个孩子知识点掌握的前后项关系,知道他的薄弱环节,以便他可以按图索骥,最精准地来提升这个环节,我们再给他进行个性化的推荐。

 

在过去两年之内,我们的在过去两年之内,我们的这样一套人工智能体系体系已经跟1.2万所学校合作,跟中国百强中的68所合作,包括人大附中等很多著名中学。我们共同希望能够用AI赋能教育,用人工智能帮助老师更好地进行因材施教。

 

那教师的人工智能替代率只有0.4%的原因是,教育是有情怀的工作,老师不光是教孩子知识,更是要教孩子们怎么做人。就像爱因斯坦说的,教育的本质是什么?就是他忘记了自己学的具体知识,还剩下的那个东西,才是教育的本质,这正是教师不可替代的重要原因。

 

但是从另一个角度我们可以看到,在1.5千万学生中使用人工智能之后,今年已经有14个省状元是我们的用户。由于我们有很多应用是从高一开始布局的,我们认为明年不出意外将至少超过20个省的状元是科大讯飞的用户。我们希望用人工智能帮助每一个孩子实现他的人生梦想。做好教育,人工智能就将影响中国的未来乃至世界的未来!

 

第二,AI赋能医疗。我们希望让普通百姓都可以享受优质医疗服务,我们要来赋能医疗。今天我们可以用语音技术,大幅度提高语音电子病例的普及度,使得我们的分级诊疗的源头数据得到总结、提炼和分享。我们可以用医学影像帮助影像科技提升能力,我们正在抓紧研发医考机器人,让它成为一个帮助一线提升全科医生能力的助手。而这些工作,我们希望是通过一个人工智能辅助诊疗中心的形式,为所有边远地区的医生和基层的医疗点提供帮助。

 

在安徽,我们的人工智能在线诊疗平台,即将覆盖所有的病种,包括发病率最高的癌症,并推广到105个县。而现在根据国家卫计委指导,已经进一步延伸到了全国更多的偏远地区来提供在线诊疗,希望人工智能让优质的诊疗能力可以越过千山万水,无所不战。

 

而后台是我们跟中国医学科学院、协和医学院共建的医学人工智能研发中心,跟安徽省立医院等更多医院建立的联合实验室,我们希望把最好医生能力通过机器学习之后,造福更多的普通大众。

 

第三,AI赋能司法。我们现在说到法制中国决定了每一个中国百姓的未来,如何使每一个公民都能够按照法律的本意,能够得到公平正义的的法制保护。在这方面,人工智能是可以提供非常大的帮助的。今天我们的法院检察院其实都非常尽力想把法律落实得更好、更科学、更公平,但是案多人少始终是个困扰大家的事情,我们通过欧许亚识别等卷宗录入,通过语意理解自动填出,可以使卷宗录入的准确率达到98%,用语音庭审可以节约接近1/3的时间。我们还再继续提升之中。

 

更进一步,我们用人工智能辅助判案。今年在上海,科大讯飞完成了上海高院牵头的中央政法委的一号工程206专项,叫人工智能刑事案件的辅助审判系统,在杀人案、盗窃案、非法集资案和电信诈骗案中我们用人工智能可以实现以下几个突破:

 

第一,可以自动分析证据链是否确实、自相矛盾,以判断是否(公正)。

 

第二,能够防止冤假错案。

 

第三,能够自动知道相关的案情所对应的法律法规。

 

第四,告诉它类似的案件别人怎么判的,同时给出罪名的建议和判刑量刑的建议。

 

这套逻辑已经走顺了,刑事案件做完以后,现在正在做剩下的79个常见的案件罪行,同时也在做民事和商事,现在我们相关人工智能在司法领域的应用,已经覆盖到全国31个省,360家法庭和100多家检察院。我们相信,人工智能的辅助审判可以帮助一线的法官和检察官大幅提高能力和效率,也可以把优秀检察官和法官的能力延伸到全国各地。

 

除了刚才看到的这些技术之外,我们另外可以看到的是,除了我们在各个行业的应用,我们的人工智能还继续进入到了亿万家庭。我们的输入法、学习软件、配音格、叮咚音像、玩具等等越来越多的产品开始进入到寻常百姓的家庭。

 

那么,人工智能今天做了这么多的工作,对科大讯飞来说,我们希望不仅仅是我们能够把这些服务工作做好,我们还能为社会做更多的公益性的事情。所以科大讯飞从今年开始启动了1000万的AI+教育的公益,让我们人工智能技术伴随着我们教育的产品,可以进入到每一个偏远山区和教学点的孩子。

 

刚刚我们提到了,科大讯飞我们在AI时代做了这么多事情。但是我更想告诉大家,AI时代是一个产业体系的发展,是一个整个生态的繁荣机会,所以AI时代是科大讯飞的时代,更是千万开发者和科学家的时代。为什么这么说?从科大讯飞人工智能开放平台,就能拿到这个发展的速度,和我们现在所做的工作。我们正式推出人工智能领域的AI、UI,使得所有创业者可以非常简单零技术门槛和零成本的,在他各个擅长领域,把人工智能技术做到相关的应用,因为人工智能落地到各个细分市场,需要相关数据,需要懂这个市场的专家,或者有感觉有品位的创业英雄一起合作。

 

AI人才方面,过去一年,科大讯飞平台上的开发者团队已经从23万多增加到了46万,短短一年增加了23万人,这都是实名认证的团队数量。过去18个月累计用过我们人工智能技术的独立终端数已经突破15亿,每天使用量已经超过40亿人次。

 

在这个过程中,我们把各个核心的技术,通过AI、UI开放给所有的开发者。现在我们不光开放给开发者,今年科大讯飞进一步把人工智能生态延伸到了我们的源头技术创新的科学家,让我们每一位科学家,把他的源头技术创新成果可以集成到AI、UI上。一旦集成进来,马上46万的创业团队就能看得见,就能把最新的成果用到他们希望用的领域,帮助科学家的技术成果去推广应用。另外我们可以把一线的各种数据进行脱敏处理以后反哺回来给科学进行训练。人工智能是需要数据迭代不断在应用中发展的,是一个典型的应用赋能型的科研成果,是应用研究型的成果。

 

所以,我希望我们的人工智能开放平台AI,UI不仅能够赋能开发者,还能成就科学家。这个理念,促成了昨天中国科学院正式成立了中国科学院产学园创新联盟。这个联盟是为了推动面向人工智能领域以企业为主体,产学园合作的创新机制。这是进行紧密型的合作,由科大讯飞和中科院自动化所作为联席理事长来推动这个创新联盟。

 

我们坚信在人工智能时代,由于源头技术的发展,中国企业已经在很多领域跟全球,有的是跟跑、有的是同步,部分已经领跑了。而在应用驱动的重要特点中,中美是同步进入无人区的。同步进入无人区之后,由于中国海量用户的优势和中国社会治理的优势,使得人工智能在各个领域可以更快、更广地得到验证、使用,为中国早服之后就可以走向全世界。所以,我认为我们国家制订的新一代的人工智能战略规划,2020年是跟着全球平行同跑,2025年部分领域在全球领先,2030年是整体领先,我觉得这个梦想一定能够实现。

 

下一个人工智能时代

 

大家也在说,这个梦想实现了,中国成为全世界的人工智能巨头,科大讯飞成功了,创业者成功了,科学家成功了,普通老百姓说跟我有什么关系。科学杂志说2045年之前,全世界50%的现有工作被人工智能替代,在中国这个数据是77%,而我们认为,未来10年,就有可能现有的工作岗位50%会被人工智能替代,那老百姓怎么办?

 

其实,我想告诉大家,今天只要我们的技术研发方向是有情怀的,按照未来社会人机耦合的方式进行的。只要我们整个社会治理是按照人工智能时代正确的方向前进,那么AI时代不仅是从业者的时代,更是每个人的新时代。我们来看看,是不是这么回事。

 

首先,人工智能时代,一定要有更完备的,跟以前不一样的法律保障和人文伦理。大家可以看到,2016年4月份,科大讯飞就在工信部的支持下,牵头了国内一批顶尖的企业和科研院所发布了人工智能深圳宣言。今年7月20号,国家发布了新一代人工智能发展规划,里面都提到了关于法律治理和人文伦理的问题。当然人工智能,使得社会生产力极大提升。当社会财富将来由少数人工智能巨头来创造的时候,社会的保障体系怎么办?一定要研究在人工智能时代更好的法律保障和社会兜底的体系,这是一个前提。

 

关于这一点,我非常高兴。正是我们宣布的所有资料中,科大讯飞是国内首次提出要做AI时代的法律保障和人文伦理的,并且这两届的全国人大会,我们不断地在提相关建议,今年的全国两会,科大讯飞提了9条关于人工智能的建议,全部被吸收在国家新一代人工智能规划之中,其中就有专门的一条。另外,中国科学院人工智能产学园联盟的6个工作组专门有一个是做法律标准和伦理相关研究。

 

这是一个保障,使得每个人在人工智能时代,不至于没有生存的空间。但我们还进一步在想,当我有了救济,有了生存,我活得没有尊严,人工智能对我来说仍然是一个噩耗,我们怎么解决?我觉得人工智能其实不仅仅可以有法律兜底保障体系,还可以做更多。

 

给大家举一个例子,在去年的5月21号,在广州有一个非常有趣的事件发生,就是科大讯飞我们下属一个公司做的玩具阿尔法蛋跟广州的天才少年去PK科普知识。最终结果是,阿尔法蛋战胜了天才少年团,当时这些孩子们有的很兴奋、有的很沮丧。

 

但我们告诉大家,在人工智能新的时代,我们不要讨论我们跟阿尔法蛋怎么去PK,也不要讨论人类棋手跟Alpha Go怎么下围棋,其实今天要考虑的是,每一个少年能不能都带着一个阿尔法蛋成为他的助手,然后再去做出老师和家长永远想象不到的创新的成果和创意的未来。应该说,让每一个人都站在人工智能的肩膀之上,将来我们不是人跟机器下围棋,是每一个棋手都带着一个人工智能助手再去PK围棋那才有意思,可以体会到人机耦合前所未有的智慧和乐趣。

 

那做到让每一个孩子和每一个孩子带着人工智能助手时,孩子又需要什么呢?我觉得首先我们要有一个正确的心态,我们人类不是跟AI去PK的,比人类更强大的绝不是AI,而是掌握了AI的人类。掌握AI的人类,一方面通过科大讯飞这样的公司,我们做顶天立地的研发,另外每一个普通个人也可以掌握AI的应用。让AI真的像水和电一样,使每个人都能方便地使用,其实这是讯飞的梦想,我们希望未来每个人都拥有自己的AI助手。

 

第一天当你有了一个人工智能助手的时候,它可能只懂你10%,可以帮你做10%的工作,一年以后它可以帮你做30%的工作,5年以后可以做60%的工作,10年之后可以帮你做90%的工作,你只要做有创意、要决断需要梦想的事情。在未来,如何能够让一个人工智能的助手如影随形帮助你、成就你,这是我们希望做的事情。如果这一天能到来,每个人就可以站在人工舞台之上。

 

人工智能赋能人类的瓶颈

 

但它有难度,人工智能赋能教育,我们可以在人大附中投入很多经济跟人大附中最优秀的老师去打磨,我可以投入1个亿、10个亿打磨完,给全中国、全世界的学校去使用,投出这么多精力。在医疗,我可以跟协和医学院、安徽省立医院,我们可以投入几亿、几十亿的成本,可以有几百个、几千个科学家和工程师一起协同研发,研发完给全中国的医院、全世界的医院去使用。但是,给每个个人如果做了助手,一般来说只能给他个人来使用。

 

所以说,今天的算法还做不到为每个人赋能,因为成本太高。那它受到的限制有哪些呢?需要的核心技术突破,包括怎么能做到无监督训练,不需要人工参与,所以学习训练成本就可以大幅下降。将来每个人都用人工智能助手,一定是低成本运算得以实施,人工智能算法运算复杂度要下降,还得要有新的算法、新的能源出来,这是一个伟大的梦想。

 

我们认为,让每一个人拥有AI助手,其实是一个非常充满挑战而又长期艰巨的过程。所以,AI+时代,是一个无比艰巨的任务,但同时又充满乐趣的历史进程。

 

所以,我们未来还将继续源于热爱地长期坚持下去,讲到了人工智能今天的发展,今年科大讯飞18周岁,我们希望在2029年,讯飞三十而立的时候,我们希望世界能有所不同,我们有很多展望都封存在这里。但是,我想今天,我们大家尽可以展开更大的想象,未来将会怎样,当人工智能可以帮我们做了90%的工作以后,我们有可能今年的工作的制度发生变化,我们每周只要工作3天,每天只要工作两小时,我知道很多人都想这样。

 

那样,当人工智能创造出极大的社会物质的时候,是不是我们真的可以走到有一天,我们可以使社会物质按需分配的年代可以到来,这个时候我们人类就可以腾出更多时间做有情怀的事情,做有创意、有灵感的事情,我们人类会变得更聪明,这是AI带来的。

 

另外,在AI时代,当我们能不能做得到,我们不用再为找一个合适的保姆而烦神,我们不用再为我们的孩子能不能去最好的学校、找到最好的老师而产生无比大的焦虑感,我们也不用为我们生病之后找不到好的医生,付不起高昂的医疗费而感到无比地痛苦,人工智能将有望把这些问题都解决,使人类更幸福。

 

我觉得,人工智能未来的核心,是要让人类更聪明,更有情感,人类更加地有创意,同时要让我们每个人都更幸福,我想这是未来的主要方向,靠我们一起来落实。那么人工智能的未来,确实是一个伟大的历史进程,它涉及到了研究技术、产品、社会治理、法律伦理和人文的方方面面,需要全社会的共同参与、共同关注。如果大家都带着一个善意的美好梦想,都认为人工智能时代从是要建设一个美好世界的,我们就可以坚信今天技术已经到来,已经在很多领域可以赋能了。

 

AI赋能,将使得一切皆有可能。谢谢大家!

 

2吴晓如演讲实录

 

在过去一年中,科大讯飞在人工智能更多的关键技术上做出了更多突破,更重要的是我们开始把更多技术放在应用中进而产生了更多价值,这种技术和应用双轮驱动形式有助于推动公司的产业进入到一个非常迅猛的发展时期。

 

我们一方面把核心技术提供给行业更多的开发者使用,用来共同创造AI的新时代;另一方面,我们在社会广泛关注、需求又非常迫切的一些领域进行战略布局,过去一年中取得了非常大的进展。

 

下面我们就以教育、医疗、客服这三个方面以及与每个人、每个企业息息相关的行业出发,来介绍科大讯飞在过去一年里通过人工智能为这些行业带来了什么。

 

今天我在这三个行业方向上要介绍十个产品,其中我们要对八个产品做实际的演示,希望大家通过产品介绍,来了解人工智能到底能够给我们带来什么。

 

人工智能在教育方面的应用

 

智慧微课工具

 

简单说就是把课堂的教学过程非常方便地录制下来,并且形成优质课件的工具。智慧微课工具可以把所有讲解过程实时记录下来,并且通过科大讯飞的语音识别技术,同步把所有讲解的声音转换成文字,基于这些文字,就可以非常方便地把所有所讲解的内容(课堂的课件)转化成结构化,未来学生在查找的时候就非常方便。

 

不但如此它还可以把讲解的过程和PPT实现完全同步,未来在查找的时候可以基于PPT实时看到整个讲解的过程。更为重要的是,我们在中间还使用到了语义理解技术。通过语义分析,可以更加精准地了解讲课中的关键点,这样孩子在复习的时候,可以更快、更迅速地找到他需要的内容。

 

智慧纸笔课堂

 

在这个产品上,学生就像在普通的纸张上一样可以写作业、做笔记,写的结果可以被数字化,同时还可以把它变成数据,通过手写识别技术,甚至我们还可以进行智能批改,这样学生可以得到更好的反馈。

 

智慧作业平台

 

现在有很多的孩子在教辅作业本上完成他的作业,教辅作业本做完以后就会被扔掉了,非常可惜,中间很多作答、学习的过程都没有被记录下来。我们通过这个产品可以非常迅速地把一个普通的教辅转换成多媒体化、互动化的智能教辅。

 

可以看到对于选择题已经给了评价,填空题对错系统也准确地识别了出来。我们再看一下作文题,我们可以点击进去,看到学生原始书写的笔记,系统识别的结果都已经一目了然,同时对于整个写作中存在问题的地方,系统也自动标记出来了,并且给出了他出问题的原因。

 

这样一个作业做完以后,简单地拍照,学生就可以得到各种反馈,这样可以让他在反馈中更快地学习。

 

目前已经有近20家出版社和我们进行合作,把他们的教辅作业转化成了智能化的作业。智慧作业平台中间的核心技术拍照识别准确率超过了95%,作文批改和专家的相关度也达到了95%。

 

智慧组建工具

 

可以点击进去,选择今年高考数学的一个样卷,可以对这个样卷做分析,通过人工智能技术对这个样卷里面各种知识点的覆盖、难度技术、考察的学科能力,系统非常迅速地就给出了一个分析,就像分析人的DNA一样,会迅速地把这个试卷里面各种关键的特征抽取出来。

 

下面我们以这种已经分析的结果来重新组一张试卷,点击“组卷”,可以看到系统的反映非常迅捷,从后台800万海量的试题库里面挑出和这些特征最相似的试题,组成一套新的试卷。

 

这样我们可以看到,整个的组卷变得无比方便,一个老师一分钟就可以成为一个命题专家,我们这个演示非常方便,两个按键,分析、重新组卷,就可以组出一套新的试卷,三分钟就可以完成一个试卷的组卷工作。

 

新一代自学产品2.0

 

在过去自学产品1.0中,我们通过采集个性化的数据给学生提供个性化的学习方案,目前这个产品也已经在超过1万所学校,采集了350亿条的中间过程数据。

 

关于自学2.0产品的结构。首先要构建一个学科的知识图谱,然后根据学生的数据,分析得到关于这个学生个性化的学前图谱,最后根据学前图谱就可以给学生推荐个性化的学习方案了。

 

大家可以看到,通过这种基于个人学前知识图谱的学习方式,可以指导学生非常充满了趣味性和针对性的学习,就像打游戏一样。

 

人工智能在企业客户服务方面的应用

 

我们看一下人工智能在智能客服中的进一步深度应用,给我们带来的智能客服2.0,将会使客服领域发生什么样的变化。在这里有两个系列产品。

 

全语音门户

 

智能客服助手

 

在通话过程中,它也变成了座席的另外一双耳朵,可以实时地对通话的内容进行分析和梳理,根据用户的需求可以实时地推送一些合适的话术,推荐一些更适合的产品和服务,这样可以让销售、产品推荐的成功率大幅度提高。通话结束以后,它就像一个秘书,可以把整个通话过程中的关键信息自动记录下来,以备下一次给这个客户能提供进一步更好的活动。

 

目前智能客服2.0产品已经在中国移动的安徽公司和浙江公司、平安集团进行了试点,取得了非常大的突破。对于人工话务的分流力已经从原来的10%提高到了50%,对于原来传统按键式话务,通话时长从原来的30%下降到了50%,对客户满意度和成本都是一个巨大的提升。

 

人工智能在医疗行业的应用

 

语音电子病例产品

 

语音电子病例产品非常彻底地解决了医生书写电子病例的时候耗时耗力,而且因为时间紧张,可能写得比较简单,以后留下来对整个医学科研也没有太大的价值的问题。

 

医学影像辅助诊断系统

 

不仅是肺部影像,在女性最高发病的乳腺,像心电图目前我们都已经可以提供完整的解决方案了。随着我们技术进一步往前推进,以后可以解决更多的影像处理的问题。

 

最后,我们再来看一下我们致一助理产品。讯飞的医学机器人参加了今年的临床职业医师的综合考试的笔试取得了456分的成绩,这应该是一个非常非常高的成绩,那么这个技术在医生日常的诊断过程中,能够发挥什么样的作用?

 

当一个病情来了以后,医生可以给出诊断建议,同步我们的致一助理也可以给出诊断建议,如果诊断建议发现还不能确诊,致一助理和一生都可以要求再做进一步的检查,把检查的结果再一次补充道病情里面去,在通过这个循环的环节,直至最后我们对最终的一个复杂的病情进行确诊。

 

基于这三个产品,我们也启动了人工智能辅助诊疗平台,通过人工智能技术和医疗专家的协同工作,我们将把医疗诊断和一些复杂病情的诊断服务,开放给更多的医院。

 

3胡郁演讲实录

 

科大讯飞的人工智能——讯飞超脑不仅给行业用人工智能的方法来学习行业里面的专家、大数据,而且它还能改变我们和面向消费者的产品之间的交互方式,并且让这些产品更懂我们。所以,我们就一起来看看科大讯飞的人工智能技术是怎么引领我们面向消费者的。

 

当今世界已经不是一个公司单打独斗的时候了,我们都在讲一个词,叫生态系统。也就是说讯飞开发者其他的公司最终的消费者我们其实是在一个生态里面,我们是在一个共同的生态圈里面看,公司如何获得收益,消费者如何获得好的产品,而开发者能够获得他们的乐趣。

 

所以,这个题目就非常显而易见了,如何打造以消费者为中心生态系统?

 

刚才说过,我们有一个非常有意思的事情,就是我们经常说人类的80%收入信息是来自于我们的眼睛,但是可能有一个信息大家没有听说过,就是我们人类如果想把我们的信息表现出来,其中有90%是通过什么呢?人类可以跳舞、写文章、画画,但是最自然便捷的方式就是我现在跟大家用语音来表达。

 

语音为什么能够成为人和机器之间最自然、便捷的方式?因为机器正好有一个显示器,而机器传达它的输出最有效的方式是图象,而不是语音。反过来机器接收信息的方式最主要的是什么呢?因为机器现在已经可以理解我们的语言了。

 

所以,这样一个人机交互的系统,也就是我们看到机器输出图象,人类接收图象,人类输出语音,而机器接收语音,这样的一个闭环构成了非常重要的人机交互模式。在这样的情况下,我们说成是强视觉呈现下的语音交互。

 

与此对应的就像传统的打电话一样,我们也可以用纯语音的方式和机器进行交互,我们把它叫做弱视觉呈现的语音交互。

 

在这样的环境下,其实在过去的几年,我们一直按照交互方式的演变去建立我们的生态系统,要研究这样的交互方式是非常非常不容易的。

 

在2010年第一次发布“讯飞语音云计划”以后,我们可以看到讯飞把源头核心技术创新做得越来越好,而我们自己也做了很多产品创新、应用创新。与此同时,我们也把整个云平台开放出去,众多的创业者在我们的云平台上做了非常多的微创新。

 

今天这个生态已经发展到什么阶段了呢?我们一起看一下。在过去的12个月当中,我们的开发者的数量从原来的23万涨到了46万,接入的设备数从原来的9亿台增加到了现在的15亿台,我们提供的服务次数从原来的29亿次增长到了40亿次,其中在线服务的数量更加惊人。

 

所以,在这种情况下,我们现在正在经历一个全新的时代,就是我们用我们的整个平台,把我们的能力输出出来。

 

AI UI 1.0系统支持全双工交互,支持非常先进的纠错能力,支持在方言识别和多人对话方面的能力。现在利用这个AI UI1.0的平台,我们向用户提供了很多的内容,包括软件授权、解决方案和用户界面。

 

今天我们又给大家提出了最新的2.0平台,这个平台在原来我们已有技术的基础上又增加了主动式对话、多模态交互、自适应和个性化识别,为什么要提供这些能力?等一下我会在各个场景的应用中给大家详细道来。

 

在这种情况下,在讯飞语音云的平台上我们已经提供了超过20多种像语音识别、合成、语种等不同的内容,也通过用户在上面开发内容的分析,提供面向智能音箱、会议系统、电子病例等不同20多种的解决方案,并且这些解决方案全部是面对最重要的数十个场景,包括翻译、移动、车载、家庭。

 

在这个里面就是科大讯飞的iFLYTEK inside,我们希望只要采用了科大讯飞的iFLYTEK inside,就能够得到一个最好的效果,我们最终的产品就能给用户最好的用户体验。

 

虽然讲我们最后的体验是这样,但是具体在哪些场景下能最好地服务消费者呢?我下面选几个最主要的场景给大家解释一下。

 

第一,人工智能和翻译场景的结合。

 

如果大家还记得的话,在去年讯飞的发布会上,我们发布了一个明星产品,叫做讯飞晓译翻译机1.0,应该讲这款明星产品获得了很多爱好者的追捧,搞得我们都脱销了。但是在我们的分析过程中。其实我们发现用户的需求远不于此,通过这些售出去的20万台翻译机超过1亿次的翻译请求深度分析的过程中,我们发现其实用户还有三个非常重要的痛点。

 

1、我们原来以为外国做得比中国好,其实我们出国了才知道,原来中国是世界上基础设施最好的地方,很多国外的地方居然连信号都不是很稳定,甚至没有信号。这个时候晓译翻译机就成了一个摆设了,所以大家非常迫切地说,有没有可能在没有网络信号的地方,我们也可以用晓译翻译机?

 

2、我们统计了这些出去的人流,除了中文和英文的翻译是刚需以外,我们发现对于日语、汉语、法语、西班牙语,这四个语言所有的人流加起来超过了80%,这些人员也非常需要在这些地方头部的流量需要这样的翻译。

 

3、关乎我们的自身安全,同样和拥有翻译机相比的一个刚需是什么呢?就是在国外的安全保障和紧急联络。大家都知道最近这几年世界上并不太平,我们看到国际恐怖组织活动,特别是一些中国的留学生在欧美甚至欧洲的这些发达国家居然都遭到了人身攻击,所有在外旅游的人员都希望在紧急的时候我们能够有一个帮我们进行紧急联络处理的这么一个工具。

 

今天我就在这里向大家宣布,讯飞晓译翻译机1.0PLUS系统正式推出,针对刚才我们讲的用户的几个痛点,我们在业界第一个推出了可以放在晓译翻译机当中的离线翻译系统,因为神经网络翻译系统本身的资源消耗是相当大的,因为里面有识别、合成和翻译,但是我们的工程师夜以继日在一年多的时间里面,把现在世界上最先进的中英文语音互译系统放在了我们的翻译机中,已经能够满足一般情况下的满意需求。

 

我们在研究的过程中,把另外的其他四种语言(中日、中韩、中法、中西)介入到系统当中去。这次晓译翻译机1.0PLUS最重要的一个功能,我们在翻译机上增加了一个非常重要的按钮,它的背部有一个SOS的按钮,我们把它叫做紧急联动按钮,只要在任何的地方,你按下这个按钮三秒钟,后台的专业服务就会直接联络到你,并且给你提供服务。

 

今天我又给大家带来了另外一款,也是世界上首款面向儿童英语学习的讯飞译呗翻译机。过去我们有20多万台的晓译翻译机,1亿次的使用,我们统计了其中大概有3000条左右在旅游的过程中经常使用的对话,我们把它存储在译呗翻译机里。同时我们还看到,我们搜寻了1.3万多个最常用的中英文对话,也把它存储在翻译机里。

 

有没有可能我们在会议的时候,我不需要拿任何的东西就可以直接和外国友人进行交谈?有没有可能这个系统就自动地能够识别出来我讲的语言,甚至我的身份?

 

我们在业界第一个推出了可以放在晓译翻译机当中的离线翻译系统,因为神经网络翻译系统本身的资源消耗是相当大的,因为里面有识别、合成和翻译,但是我们的工程师夜以继日在一年多的时间里面,把现在世界上最先进的中英文语音互译系统放在了我们的翻译机中,已经能够满足一般情况下的满意需求。

 

我们的Alpha蛋和它的系列是今年的中国智能玩具的销量冠军,除了Alpha蛋以外,最近还要马上推出英语蛋和黄金蛋。刚才我们演示整个的智能语音交互、全双工翻译的功能,也很快会在Alpha蛋进行上线,我们非常期待今天的各位朋友能够购买Alpha蛋,或者是到我们最新的网站上去体验这个效果。刚才我们看到的就是整个全双工语音交互的场景在翻译场景下如何使用,但是我们来看下面一个场景,这个场景在我们的生活中更普遍。

 

第二,移动场景。

 

我们经常能够看到的是什么?就是我们的手机和手机的相关配件。在2010年科大讯飞第一次推出了讯飞语音输入法,引领了整个输入法中语音输入的潮流,到今天为止,我们的输入法已经拥有5亿用户,其中有1.2亿月活。

 

按照我们今天发布的最新在线语音识别引擎的效果来看,我们的识别率达到了98%,是不是我们就可以满足了呢?同样的不是,我们要继续分析所有的1.2亿月活、5月用户他们中间使用的结果,发现都98%了,我们是不是还能进一步提升?

 

有很多用户也提出了一个需求,你能不能用语音就能进行修改呢?让我们的修改方便一点。我们分析的数据可以看到,这个98%是一个平均的结果,其中有23%的人他们的识别准确率并没有达到98%,另外还有一些人他们根本就没有开口说话,什么原因呢?

 

我们进一步深入分析,发现这些人不敢开口,首先因为声音的问题,就是因为他的口音、前后鼻音、卷翘舌发不清楚。还有一个问题更重要,就是说他的个人专业词汇和习惯用语可能是不一样的,每个人都不同,而我们原来的识别引擎是针对所有人的。

 

所以,在这种情况下我们推出了一个新的技术,叫语音个性化。我们可以对他的声学模型做个性化,也可以对他的语言模型做个性化。在过去一年当中,我们选取了600万粉丝用户,对他进行了灰度测试,最后我们发现,采用语音个性化的效果其实我们可以将整个性能再额外提升20%。

 

个性化、自适应,是不是这个技术很容易就能达到呢?

 

为什么其他家到现在都没法推出这个技术呢?其实很简单,首先从技术上来讲,个性化自主学习、个性化语言模型、优化识别结果,我们是这么一种全新的个性化的方案,在技术研究上本来就有难度,但是还有一个更大的难度是工程上的。大家想象一下,原来我们识别引擎对所有人都是一样的,对上亿的人,在不同的服务器上调度非常容易。

 

但是现在是,我们要给每一个人,百万级的,千万级的,给每一个人要做一个识别引擎,在算法优化方面我们把资源利用率提高了100倍,在工程优化方面我们把吞吐量提高了50%,在架构优化方面我们又把效率翻了一翻,只有在这种情况下,我们才能够在在座的所有每个人,建立一个独一无二的优尼科的输入引擎。

 

当然了,刚才讯飞输入法我相信大家都是老客户了,你们可以直接下载、用手机注册,马上就可以享用我们所有的这些新的技术和概念。

 

刚才我们说过了移动,我们还有一个移动的场景是车,其实在过去的几年当中,我们在车载里面,是我们第一个爆发的点,因为在车里面涉及到安全太重要了,在过去的几年当中,也是去年发布了飞鱼系统,以及它的前辈们,已经被卖出1000多万套以上,活跃的用户超过了400万用户,而且这里面还有个惊人数字,就是这些活跃的月活数达到了90%。大家知道,在手机上一个软件达到9%是什么概念吗?就是只有一个软件。

 

这样在说出电影的任何一个名字,马上可以进行匹配,这就是我们讲的强视觉呈现语音交互的内容,当你看到所有的内容,立马可以说出来进行控制,也就是我们说的所见即可说。

 

大家可能觉得家庭里面电话通话已经没什么稀奇的了,但是大家可能没有注意到一个痛点,现在你在家里面直接用电话通话的时候是没法用的,除非你手里拿一个麦克风,但是用远程麦克风阵列可以保证在客厅的范围内,在任何地方,你都可以直接和另外一端进行视频通话,真正解放你所有的全身。

 

刚才我们看到了,其实我们在家庭里面已经可以放开双手,可以用你的嘴巴和肢体语言解决很多的家庭控制问题,是不是也就到此为止了?我们的想象力是不是已经到站了?其实底下很多人跟我讲,人类现在已经很懒了,甚至连脚指头都不想动,你们有没有这种方法?我脚指头都不想动就可以操纵家里面的电器、叫外卖、看电影,你别说,科大讯飞还真的做了这种技术。

 

我们希望科大讯飞的人工智能all for you,这个you代表了很多人员,代表了行业的合作伙伴、开发者、最后的用户,他们为你到底做什么呢?我们来看一下。

 

1、沟通无界,增强人机之间的交流、交互。

 

2、连接无限,我们正在进入一个无所不连、物联网的时代,我们也能连接与不同场景之间的串联。

 

3、想象无边,因为人机交互背后需要的是内容、场景、服务,所以我们将来的想象空间还无所不在。

 

最后,我想给大家分享一下在过去18年来科大讯飞自己的心理路程。

 

在一开始的时候,我们讲有语音产业,很多人都笑话我们,说我们只听说过汽车产业、钢铁产业,没有听说过键盘、鼠标可以成为一个产业的。但是我想这句话有他对的地方,但是大家没有看到语音产业背后的实质是人工智能,虽然我们在一开始的时候也许不知道自己追求的是那么伟大的一个事情,但是我们坚持下来了。

 

这就像公司经常说起的一句激励我们自己的话:“你所清楚遇见的、热烈渴望的,最后都会自然而然地实现。”让我们一起,在中国用人工智能改变世界,谢谢。返回搜狐,查看更多

 

84
标签: