1 月 14 日,在 2017 极客公园 GIF 大会上,搜狗 CEO 王小川发表人工智能和你我会是什么关系的主题演讲。
在演讲中,王小川对人工智能学术与应用之间的关系进行了阐述。王小川认为,从技术到产品再到商业价值要从彼此实现的角度来看。
王小川认为,有技术不一定有产品,不一定代表用户的规模,有技术有用户规模,也不一定背后可以带来商业价值。
基于这样的理解,王小川介绍,搜狗人工智能的大逻辑是让人工智能技术通过一些产品来实现,使得已经让千家万户用到的产品做升级,其实深度学习已经通过搜狗武装到了牙齿。
在演讲中,王小川还首次对外发布了搜狗的最新产品海外搜索,针对中国人,帮助英文不够流利,或者还是效率不够高的用户,实现用中文词输入可以翻译成英文,检索英文世界的内容,同时把它翻译成中文的结果。
我们之前看到大量对海外感兴趣的事情,细胞免疫疗法,在中国得到很多虚假的信息,可以看到海外怎么说这个事。
最后,王小川还阐释了他对人工智能与人之间关系的思考,王小川对人工智能的意义表示乐观,他认为人工智能不是取代人,而是帮助人类获得新的自由。
我愿意把机器的智能文明带到人的世界里去,另一方面我们对于已经被分工细化的人有新的解放,强迫我们获得一种新的自由,去寻找更多创造性的意义。
以下为王小川演讲实录:
极客公园的朋友们大家好!今天给大家分享人工智能,这个话题已经谈了一年多。李飞飞教授给大家做了一个 89 页的 ppT,讲了一下研究界做了多少工作。这种情况下我做了一个子标题,人工智能照进现实,我们把这些科研成果变成实实在在能够用到的产品。
一年的时间里面我们学了太多的词汇,包括 Alpha Go、语音识别,里面有很多的学术概念。更多像对抗生成网络,有各种各样的词汇。
我提一个简单的模型,这个模型不仅对于人工智能或者对技术使用,我们从技术怎么把它变成产品,再怎么变成一个商业价值或者全人类共享的价值,要从三个维度看。
我自己讲,现在有一个词高大上,叫全栈工程师,我自己对自己的理解是需要做全栈的 CEO。这里面我们看到,如果你一开始没有一个你的技术含量,我们知道是很难变成产品的,有技术不一定有产品,不一定代表用户的规模,有技术有用户规模,也不一定背后可以带来商业价值。
在这里面,我们简单做了一个图,我试图把我们现在有的技术产品放进去。在去年 3 月份,Alpha Go 是一个黑科技,我们今天看在这些技术里面,我把所有跟人工智能相关的前沿都表达成是我们一种新技术。列的这些都有技术,但是前三项里面 Alpha Go 还有图像描述,刚才李飞飞教授讲的图像描述,还没法形成用户规模。我们说云端大家作为好奇者,你可以看到很惊艳的科技,其实没让你用到,还没有走到第二步。
今天在图像描述、图像合成里,包括大家注意到没有,张鹏和李飞飞都有一个风格迁移的技术。我称之为图像合成子的方向,这种产品没法形成用户的规模。有些技术不仅是黑科技开始变成用户规模,语音的识别、人脸识别,这两个技术我反复讲它不是让机器做判断做选择,最后它形成的商业价值或者给用户带来的变化,还是不够大的。
能够看到什么东西,我们作为一个好奇的群体,我们在想能够在无人驾驶,这是大家觉得既是黑科技又有很大的用户规模,对不起还没有面世。从这个维度讲,我们会发现今天人工智能变成所有人追捧的热潮,但是并没有找到一个既面世又是同时有巨大用户规模和改变世界的技术。这是在最近两三年需要发生的事情。
这个过程当中变得很难,我们能够做出技术,并且让技术领先就是一个困难的事情。有些技术刚刚引回国的时候是领先,还没等到产品的商业化,这个技术就开始落后了,发展特别快。保持技术领先,这是一个难题。
更难的是把技术变成产品,让很多的用户去受益。更难的是这个技术不仅有它的用户规模,还可以改变世界,有很大的商业上的意义,和对世界的冲击。
今天我分享的是我们在做的一些尝试。我之前的 ppT 叫 AI 这在过河。这个过河只是从搜狗,我们的想法是第一件事情,我们有这种技术,而且我们把这种技术用到搜狗的产品里去,很多创业的公司试图构造新产品。我们大的逻辑使得已经让千家万户用到的产品做升级,其实深度学习已经通过搜狗武装到了牙齿。我们主产品大量的使用,比如输入法就会用到语音识别和图像识别的能力,语音识别我们现在一天已经做到了用户规模有 2 亿次的识别量,7% 的搜狗输入法的用户会运用到语音识别的技术。
同时,一天识别生产的语音数据量大概进入到 18 万小时,我们用了 400 台服务器支撑这样的规模。打开输入法可以看到 OCR 的能力,可以手写,或者拍照片,我们在做一个渐进的事情。我昨天在硅谷还跟 Google 他们的核心人在沟通,Google 他们讲到用深度学习可以对于用户输入的命令去做分解,以前靠我们人在里面统计这些规则。今天靠深度学习做,对搜索引擎的规则描述,它的准确率提升了 30%,和我们一样的,已经成为搜索引擎排序里面第三重要的因素。
深度学习我们在搜索这个类型的公司里面可以快速推向使用,但是这样一个技术还没有到颠覆性。符合刚才讲的面世了,有黑的技术,有大的用户规模,但是并不够对世界有更大的冲击。这里面我们还会做一些新的东西,这是今天我很荣幸可以在极客公园会场可以跟大家发布我们一款新的产品。
回到搜狗的逻辑,用户表达和获取信息更简单,通过输入法,很多中国人在打字里面提高的效率,搜索让大家获得很多信息。通过深度学习使得这样的产品更加聪明和丰满,还有什么事情可以借助深度学习前人的成果,我分享一个《圣经》里面的小故事,关于通天塔的故事,人类想通过自己的努力构造通天塔可以和上帝对话,上帝觉得藐视了他的权威,因此他让不同的人,不同的民族去说不同的语言。
由于大家说不同语言,沟通变成了一个障碍,所以人就没有能力修建通天塔。这是我经常引用的,由于信息不对称,使得我们难以合力做一件最伟大的事情。这里面不仅是网络连接,还有不同民族语言不一样。
去年 11 月份 Google 有一篇论文,把机器翻译推到一个新的高度,我们去畅想如果在表达,在获取的时候能够让不同民族的人,包括中文、英文自由交流,可以获得他们完整的信息,这世界会因此而变。这样的使命里面,我会认为如果能够跨语言进行沟通,这样的一个技术进步,人类发明电一样是很重要的事情,电使得我们生产力得到巨大解放。做到跨语言沟通,地球的文明会重新改写,大家战争会变得更少,不同民族之间的交流会带来新的文明产生。
这里面我们做了很多的工作,一方面在 Google 技术的指引下我们用了这样的技术,基于类似于深度神经元网络的翻译模型,已经被我们掌握的非常好。我们有幸和清华有更多的合作,有很多技术的经验融入到我们模型里面。不仅是深度学习的网络还有其他的合力。
我们比 Google 更有动力和决心去做好翻译这件事情,Google 代表技术的高度,它在我心中有一种玩票的心态,作为中国人我们非常有意愿要和英语的直接去对话,Google 一做就是上百种语言,或者 8 种语言之间怎么互译。对它是一种秀肌肉的事情,对于世界上最大的民族,中文我们有非常大的动力去真正变成现实。
在这样一种动力驱动下,我们实际做的产品的识别准确度比 Google 更加高。基于这样的事情,我们开始在产品上去发力,有一些黑科技。我们在去年乌镇互联网大会上首发了机器同传,在香港科技大学我们把同声传译带到实用。乌镇的会我们叫首秀,乌镇互联网大会说是世界互联网,但是在座的观众基本都是中国人。这个发布是一个概念性的产品,我们在香港科技大学发布这个产品,下面有 30%,真正是国外的学生,没有提供同传的设备,问他们听懂了吗,他们说用中文演讲的内容也可以听懂。
我们没有做视频的宣传,在网上有一些传播。这样的技术并不符合我刚才的理念,是很好的技术,并不是给所有人去使用。在去年年底,我们把这个技术放到搜狗输入法你在里面敲中文的时候,只要点一个键,这句话就可以翻译成英文,再点一个键就可以发送出去,使得你跟国外的朋友去做聊天或者写邮件的时候,变得更加容易,这是我们输入法增加的功能。
点翻译键就可以得到后面翻译的结果,今天我想给大家带来的是之前一直保密,也是因为极客公园我们准备的一个新的产品,在这个场合下发布。我们叫做搜狗的海外搜索,能听到这个词一定和跨语言的翻译工作相关。它是什么?我们在以前搜索的时候,中文信息可能只占世界信息的 10%,不会更多了。很多大量优质的内容是在海外,但是很不幸,一个是 Google 被封掉,即便我们会用 Google,作为一个中国人英文水平确实承认不够高,用中文搜索的时候没有更多的信息。我们今天发布的海外搜索产品,是给中国人用,帮助英文不够流利,或者还是效率不够高的朋友,我们实现了你用中文词输入可以翻译成英文,检索英文世界的内容,同时把它翻译成中文。
这个产品三页就可以看到左边是搜索海外的英文内容,你点一个键就可以以中文的方式阅读,而且提供双语的翻译。可以干吗?我们之前看到大量对海外感兴趣的事情,细胞免疫疗法,在中国得到很多虚假的信息,可以看到海外怎么说这个事。人工智能国外发展,我们可以看人工智能国外初创公司,这个搜索到的就是国外最前沿的人工智能公司。我们想知道明星 lady gaga,我们可以看到在西方世界怎么样的。
我们可以搜索到 90% 的世界,这对我们是巨大的促进。我们今天首发这样的产品,这是搜狗第一次在极客公园首发,而且也是全球第一次把神经网络元系统和产品相关的产品能够给你一个单独的翻译产品,我们放到搜索里去,就可以使得我们去搜索全世界的内容。
右边有我们的二维号,今天有机会给大家做这样的发布,欢迎大家来试用。
背后有很多工作要做,这个翻译技术非常的细腻,有些前沿的词汇并没有中英文对应。我昨天从美国回来,我查美联航空在线值机,翻译过去再翻回来就变成联合航空。我们需要把搜索技术和网页搜索做一个合体,现在是单独的海外搜索,之后要和网页搜索做整合,投入更大的资源,大家可以全面浏览不仅是搜索可以做翻译,使得海外的内容可以做到中文阅读,翻译之后用中文看到整个世界。
这里面我们做这个工作,翻译技术如何去解决,我们想到底去做思考未来有什么变化。我们是去取代人类还是帮助人类?在网上有了这样的讨论。取代人类,如果我们的翻译系统把专业的翻译给仍掉了,这个人群就没有工作,对更多人是有了帮助。我们反复讨论一个题目,有了机器学习之后,有了深度学习之后,究竟机器和人是什么关系?这是我的两个思考的结论。
我在前年极客公园大会上提到智慧的体外进化,有了机器之后我们要心甘情愿和机器合体,我和机器融合,不要孤立看人。我把机器当成我生命中的一部分,我们变得更加强了。你问一只猴子你希望变成人吗,猴子可能会茫然,你问一个人,你希望变成超人吗,我们可能会很茫然。
如果我的工作被取代了,是怎么样的?这几天我在读一些哲学的书,用尼采的思考,他说这个地球开始变成一个大的分工,每个人就像螺丝钉一样做了一个局部的事情。比如说翻译、司机,我们好像找到了一份工作,其实我们被限制了我们的自由,我们精确在社会工作中间完成我原有的使命。机器取代精确的分工之后,是把我们的束缚解放了,要求我们做一些更我创造性的事情,没有失去就没有新的获得。
我愿意把机器的智能文明带到人的世界里去,另一方面我们对于已经被分工细化的人有新的解放,强迫我们获得一种新的自由,去寻找更多创造性的意义。
这是我想阐述的 AI 和我们之间的关系。
我给大家放一分钟时间的视频,是我们在乌镇和香港的视频。同声传译今天做到的高度,我今天给大家的演讲就分享到这,希望海外搜索会成为第一款面世能够改变我们生活,也是被广大用户使用的人工智能产品,谢谢!
济宁IT新闻