注册

搜狗CEO王小川:“搜索的未来是问答” | GAIR 2017


来源:雷锋网

由中国计算机学会(CCF)主办、雷锋网与香港中文大学(深圳)全程承办的 AI 盛会 --「全球人工智能与机器人峰会」(CCF-GAIR),将于 7.7-7.9 日在深圳召开。

CCF-GAIR 为国内外学术、业界专家提供一个广阔交流的平台,既在宏观上把握全球人工智能趋势脉搏,也深入探讨人工智能在每一个垂直领域的应用实践细节。

延续上一次大会的顶级嘉宾阵容,本次 CCF-GAIR 2017 将会迎来更多人工智能和机器人行业重磅专家。在未来的一段日子里,雷锋网将陆续放出嘉宾介绍。今天要介绍的是搜狗CEO王小川。

搜狗CEO王小川

王小川是搜狗公司CEO,曾任搜狐高级副总裁、首席技术官,当时以27岁的年纪成为搜狐最年轻的副总裁。2010年搜狗从搜狐独立运营后,王小川全面负责搜狗公司的战略规划和运营管理,带领搜狗持续深入及拓展业务。2014年,王小川获得本年度华人经济领袖大奖。今天搜狗已经成长为中国用户量第二的互联网公司。

从搜狐到搜狗

王小川是技术出身的,他毕业于清华大学计算机系本科,2003年获得工学硕士学位,曾获第十一届国际信息学奥林匹克竞赛金牌。1999年,他进入初创的Chinaren兼职,那时刚好Chinaren的网站需要做一个搜索系统;2000 年搜狐收购Chinaren后,王小川也就留在了搜狐,尽管还是兼职的学生,但当时做过聊天、交友方面的开发和内容管理系统的他,身份已经是高级经理。直到有一天,张朝阳找到他,宣布公司的决定,由他来组建团队做搜索开发。王小川用一年的时间完成了别人两年到四年的工作,产品成功上线。2006年初,王小川成为搜狐的副总裁。

搜狗10年来发展的各个阶段,王小川多次有机会离开,互联网业界诸多大佬都暗地里约过王小川,开出丰厚条件。但即使在最不得志的2008至2010年之间,王小川依然没有抛下搜狗。他如此解释自己的行为方式:大部分人对近处经历的事情更多会看到困难,对未经历的事情更多看到诱惑。“这时不如聚焦到正在做的事情上只要还有进步就不要放弃。”

2008年是搜狐最辉煌的一年,要钱有畅游,要用户有搜狗输入法,要品牌有奥运,张朝阳也下定决心要做成搜索。

王小川在搜狗拼音输入法成功过程中,突然明白应该如何做搜索:必须通过浏览器做桥梁,否则一点儿机会都没有。当他说要做浏览器,张朝阳充满了质疑:“微软的IE市场份额那么大,都没有把Bing做起来,凭什么浏览器做成搜狗搜索就能做成?”何况浏览器对搜狐当时的成功蓝图矩阵策略没有太大帮助。

2011年,搜狗高速浏览器发布会上的王小川

浏览器策略让王小川和张朝阳产生巨大分歧,浏览器项目在内部甚至是“非法”的。张朝阳不仅解除王小川的搜索职务,还直接问“你还想做点什么”,那会儿很多人都以为他会离职。

那是王小川最有理由离开搜狐的一次,可是他没有。在没有控制权、没有资源投入情况下,王小川打起“游击战”,一边做着公司需要的视频P2P项目,一边从各个项目划人做浏览器。好在事实上张朝阳对王小川也非常宽容,对“违规”做浏览器项目后来并没有强制干涉。

“非法”浏览器项目打了一年半游击战。在原有搜索业务资源流失、业务量变化不大的情况下,张朝阳开始着急。这时王小川开始推浏览器,浏览器一涨搜索量就线性上涨,最终证明自己的眼光。当时王小川已经认识到,不仅要做浏览器,还需要让搜狗独立发展。

这时出现了一个对搜狗独立起到重要推动作用的人,他就是周鸿祎。

周鸿祎是何等聪明人物,他对互联网产品的理解非常透彻。360的入口能力非常强,但它缺乏搜狗的技术能力和搜索引擎这种变现工具,如果它拥有搜狗,把两者的能力结合起来,再加上360安全软件的定位以及独特的“商业手段”,对百度能够形成不小的威胁。周鸿祎找到张朝阳,想要投资搜狗。讲了三个关键点:第一是浏览器一定能成,浏览器对搜狗帮助很大。第二搜狗需要独立发展。第三搜狗独立出来需要王小川牵头。张朝阳开始留意王小川的浏览器业务带给搜索的增长。

如果希望周鸿祎是来免费帮王小川做说服工作的,那就把老周看的太简单了。周鸿祎同时向张朝阳提出,把搜狗浏览器业务转给360,同时360和搜狐成立一家合资公司专做搜索。

周鸿祎要搜狗浏览器,是王小川没有预料到的,因为如果没了浏览器,搜狐也就失去了对流量的控制能力,最终也会丧失在(与360的)合资公司中的话语权。但当时张朝阳对这个提议还是颇有兴趣,他心里装的是搜索,并不认为浏览器一定要放在搜狗里,所以就有了王小川只身一人赴杭州见马云的故事。

之前王小川从来没见过马云,而这次谈话也只有短短的40分钟。马云先问搜狗输入法是不是王小川做的,接着说了投资的三个原则:第一是有没有机会做成,第二是团队可不可信,第三是对阿里有没有好处。

第一点一直是王小川最坚持的,他和马云说搜狗一定能成,现在的投资非常关键。第二点张朝阳在行业里品行大家都看得见,马云相信张朝阳。第三如果搜狗做成会抑制百度,对阿里有好处。这次谈话后,马云开始做调研,同时找张朝阳谈入股。

2010年10月搜狐宣布分拆搜狗,阿里作为战略投资者、云峰基金作为财务投资者联手投资搜狗。与2008年搜狗1.38亿美元的估值相比,上述交易中搜狗估值为2.37亿美元,增幅超70%,王小川出任搜狗CEO,帮助搜狗完成第一次蜕变。

2013年9月16日腾讯入股搜狗,腾讯董事长马化腾、搜狗CEO王小川、搜狐CEO张朝阳合影留念

三年后,搜狗再次面临360收购。这又是一个戏剧化的故事,一直活跃的360出局,搜狗除了获得腾讯4.48亿美元投资保持独立,还接盘腾讯旗下的搜索和 QQ 输入法业务,以及获得腾讯各个一级入口。

搜狗的业务此后进一步持续快速增长。根据艾瑞咨询2016年12月数据,搜狗PC用户规模达5.28亿,仅次于腾讯,成为中国第二大互联网公司。2017年4月24日搜狗公司公布了2017年第一季度财报,第一季度收入达到人民币11.2亿元,较上年同期增长16%,继续快于行业增速,搜狗搜索PC端、WAP端和APP端三个终端总覆盖人群比例达32.8%,位居行业第二。整体搜索流量较一年前增长26%,特别是移动搜索流量增长50%以上。移动搜索收入对整体搜索收入的贡献进一步提升至72%。王小川也已经成功地由顶尖技术人才转型为全面的管理者。

搜狗的“汪仔”和人工智能布局

一站到底上亮相的搜狗“汪仔”

2017年2月,江苏卫视的益智答题类节目《一站到底》迎来了一位特殊的参加者,来自搜狗的问答机器人“汪仔”。虽然一站到底节目为了娱乐性,选取的问答题目并不难,但汪仔除了天生的快速搜索能力之外,还是需要有足够的识别、理解、推理能力才能给出正确答案,而且还需要比人类对手更快才能得分。即便人类选手以3:0的领先地位开局,汪仔最后还是以7:9的比分反超取得了这场比赛的胜利,

汪仔是搜狗和清华大学天工智能计算研究院联合研发的问答机器人。

汪仔背后是搜狗最新研发的“立知”系统,通过它,人们只要通过提问的方式向机器发问,机器就会给出精准的答案。据搜狗搜索技术负责人许静芳介绍,汪仔系统能从节目环境中同步采集问题的语音和视频,采用增量识别方法以最快速度的识别,再将截止目前所有包识别内容进行拼接后发给问题识别融合模块来融合结果、提高识别正确率,预测更为准确当前的问题的文本发给问答模块。由于问答会根据完整题目输入或部分题目输入采用不同的方法与参数,所以还有一个问题完整性识别的模块,根据当前题目是否完整的判断将识别的题目问题分别发给答题和抢答模块。问答经过计算后会给出答案及置信度,根据不同置信度会决定此时答题或暂不答题。

汪仔语音识别的声学模型使用了 CLDNN(CNN+LSTM+DNN)+CTC 的端到端模型结构,特别是为了降低识别延迟,LSTM 使用了单向 LSTM,特征尽量少的使用下文特征,降低时延,为后续答题模块抢答流出足够时间。同时考虑到一站到底题库中专有名词、命名实体等类型词汇较多,在训练汪仔语音识别的语言模型时,除了基于搜狗搜索和输入法的海量文本数据之外,还重点结合了知乎、搜狗百科等领域相关数据,最终完成了 Ngram+RNNLM 的模型训练。

搜狗在人工智能方面的布局其实也早已开始。2016年4月,搜狗宣布捐赠1.8亿元给清华大学,联合成立了“清华大学天工智能计算研究院”,致力于人工智能技术的研发。借助这一平台,搜狗邀请着世界顶级科学家参与项目研发,相关研究成果会逐渐在搜狗的产品中得到体现。

2016年11月,搜狗实时机器翻译技术首次在乌镇世界互联网大会上亮相,随后在香港科技大学实现首次落地应用。2017年4月的前哨大会上,搜狗的机器同传技术大放异彩。活动现场邀请了许多外宾,却没有安排人工同传,而是通过搜狗的机器同传,将演讲者的中文进行准确语音识别,同时由机器将中文翻译成英文,中英字幕实时上屏,准确给出每句演讲的内容,实用性和体验性超出想象。

除了大会同传,搜狗的机器翻译还应用于“搜狗英文搜索”产品中,2017年1月,搜狗将英文搜索全面升级,作为跨语言搜索引擎,搜狗英文搜索旨在帮助不精通英文的中国人,搜索和阅读全世界的医疗、科技、人文信息。

未来,搜狗打算始终专注于人工智能,在知识计算与自然交互的引领下,实现自己“让表达和获取信息更简单”的使命。搜狗希望成为中国领先的人工智能企业,以创新的技术型产品为用户不断创造价值,为伙伴和投资者带来高效回报。

王小川以前就曾表示:“搜索和输入法未来都将向问答发展,从而形成前台的自然交互与后台的知识计算相结合的人工智能。借助深度学习的机器翻译技术则能帮助用户进行跨语言的自由沟通。搜狗未来会把人工智能应用到更多的产品中,让用户表达和获取信息更简单,让人工智能真正惠及人类。”

人工智能已成为近两年最火热的名词,基于人工智能概念的创业热潮也已兴起,但真正能够将人工智能理论与实际应用相结合的公司却不那么多,甚至出现了“人工智能无用论”。搜狗主打的“自然交互+知识计算”的人工智能战略,以语言处理为核心、依托搜索与输入法两大核心产品已初见成效。作为人工智能领域的先入者,搜狗正用自己的方式打破“人工智能无用论”,在坚持前沿技术研发的同时,不断推动人工智能产品落地,人工智能引领的技术与内容差异化,使得搜狗越来越具有影响中国搜索行业格局的力量。

你想不想更进一步,当场听王小川介绍搜狗在人工智能方面的最新成果、听他讲述对人工智能的最新打算呢?在今年 7 月 7 日至 7 月 9 日,由中国计算机学会(CCF)主办、雷锋网全程承办的 AI 盛会——「全球人工智能与机器人峰会」(CCF-GAIR)有幸邀请到王小川莅临我们的大会现场,分享他在研究领域的心得体会和最新研究成果。

CCF-GAIR 为国内外学术、业界专家提供一个广阔交流的平台,既在宏观上把握全球人工智能趋势脉搏,也深入探讨人工智能在每一个垂直领域的应用实践细节。延续上一次大会的顶级嘉宾阵容,本次 CCF-GAIR 2017 将会迎来更多人工智能和机器人行业重磅专家。在未来的一段日子里,雷锋网将陆续放出嘉宾介绍,敬请期待。

CCF-GAIR 2017折扣票火热预售

去年8月,雷锋网在深圳举办了首届 CCF-GAIR ——全球人工智能与机器人峰会,我们请来了 10 几位国际人工智能学会的 Fellow 以及在各个学术领域有突出贡献的学者,其中 8 位是中美工程院院士;除此之外,BAT 等一线公司以及今日头条、搜狗、滴滴等 AI 新贵的高管也悉数在列。

(CCF-GAIR 2016部分嘉宾)

把人工智能领域所有的峰会挨个儿数一遍,除了 AAAI、ICML 等等历史悠久的(纯)人工智能学术会议之外,跨学术界和产业界的峰会, CCF-GAIR 2016 的嘉宾规格都堪称最高。我们还是可以毫不脸红地说一句,CCF-GAIR 2016 可能是世界上最好的人工智能与机器人峰会。

今年,如果新广告法不反对的话,我们想把这个“可能”去掉。


推荐

凤凰资讯官方微信

凤凰新闻 天天有料
分享到: