关于陆奇离职传闻、医疗广告争议,百度搜索总裁向海龙这样说……
2018-05-24 09:01:23 作者: 来源:一财科技 浏览次数:0 网友评论 0 条
中华PE:

“没有,从来没有”。
百度高级副总裁、搜索公司总裁向海龙摇着手,对记者斩钉截铁地说。
5月22日的一场媒体沟通会上,当一财科技记者提问他关于和陆奇是否有过提议希望取消部分垂直领域广告的讨论时,他予以否认。此前有传闻称,导致陆奇离开的导火索是其任职期间,曾提出取消百度搜索业务部分垂直领域如医疗、互金广告,但遭到搜索部门反对。
“我是个比较理性的人,不在乎没根据的话,更重要的是看长期。”向海龙这样回应。他同时主动谈及近期陆奇的离开,称确实是家庭的原因:“但陆奇和李彦宏的私交非常好,未来还是会成为百度的顾问。”同时他也强调,自己在百度是陆奇的下属:“这一年多,我们的沟通非常愉快。”
向海龙在百度工作已经有14年之久。他对记者说,因为性格的原因,十多年把精力放在工作和内部工作上,几乎很少出面。但最近外界关于他离职的炒作有点勤。“再不说又要传离职了。”
一个半小时的沟通会里,向海龙与百度副总裁、搜索公司CTO 郑子斌、百度副总裁吴海锋、百度搜索公司运营总经理曹越等一众搜索业务核心高管,回答了关于陆奇离职与搜索公司的传闻、AI如何驱动搜索业务、算法要不要有价值观以及备受争议的医疗广告等热点问题。
向海龙对记者表示,AI和百度搜索并不矛盾。现在大家把AI狭义地理解为是无人驾驶、人机对话操作系统等等, 但机器学习、大数据解决问题都是AI,百度成立的那一天就是一家AI公司,搜索与机器学习密不可分。
对于百医疗类信息监管问题,向海龙对记者表示,无论广告还是搜索结果,真实性和权威性都是百度在意的。围绕这一点,百度提出企业加V认证,以此希望真实企业发出的信息能够迅速找到法律承担责任人,产生威慑作用。另外,还将推动实地验证实体医院,以此保证提供内容的真实存在。
他还对记者透露,接下来搜索产品会做比较重要的升级,计划把内容全部装进熊掌号,熊掌号的概念就是百度希望检索到的网站的结果都放到百度自己的服务器上,“因为现在有一个问题是,一家可能非常正规的企业做了一个网站,被百度收录了,收录这一刻没有问题的,有可能中途篡改网页,网页会有一些夸大诱导(信息)还有网站被黑客黑了,放了一些违法信息最后检索被网民搜了,出现了问题。”
他称,希望熊掌号最先在医疗行业覆盖,通过一两年的时间,把医疗网站全部的放进熊掌号,保证整个搜索结果更加安全可靠。
以下是经过整理的沟通会实录,略有删节。
主持人:今天我们请来了百度高级副总裁、搜索公司总裁向海龙,百度副总裁、搜索公司CTO郑子斌,百度副总裁吴海锋,百度搜索公司运营总经理曹越。
向海龙:各位媒体朋友大家下午好,我加盟百度已经14年了,14年里的确我一直都是精力放在工作上面,很少对外沟通。这次公关部找到我,说海龙一定站出来说一下,你再不出来又要被传离职了。其实我发现我这几年每年都被传离职,我不太介意这个东西,传可能过一段时间,反正也没有离职,过几个月大家认为这是一个假消息有算了就过去了。
最近感觉到传的有一点频繁,整个公司管理层也发生了一个变化,昨天我们公司内部专门和员工开了一个沟通会,这前后评论我的人也很多。昨天看到陆奇,他自己做了一些说明,首先一点他不再做百度公司的COO的确是他个人和家庭原因,这个是他自己说的。第二,他其实跟李彦宏真的是20多年的交情,他会继续当李彦宏的顾问。另外实际上自己说了,跟我们的高管团队,包括跟他的下属,我实际上是他(陆奇)的下属,工作上面一年多来也是非常愉快的。
我在百度14年了,自己创业五年之后,百度把我收购然后进入百度,我一直都在搜索这个领域工作,从刚开始的时候负责营销这一块,后来到了商业产品,一直到最后的整个搜索公司。
其实我们搜索公司成立将近两年的时间了,当时成立的时候就说是把这个全部放在一起,我们更好的从用户体验的角度来思考搜索产品怎么样给客户带来更多的价值,前几年我们的一次张家界的那一次联盟峰会的时候我们专门讲了一个话题,用户产品商业产品怎么样更好的融合,其实我们内部做了非常多的工作。
提问:很多人说百度all in AI了,搜索这个业务就变得不重要了,或者搜索这个业务现在整个百度体系居于什么样的战略地位?
向海龙:有些场合我们有的百度别的高管也在讲,百度all in AI。但是有一次李彦宏说我们没有说过all in AI,大家感觉有一点矛盾,其实我觉得一点不矛盾,他想说大家怎么样理解AI,不要狭义地理解AI,就是百度实际上是成立那一天就是一个AI公司。大家讲的AI往往片面的理解可能跟智能硬件的结合,实际上不是的,实际上我们百度搜索天生就是一个AI。通过整个机器学习,然后大数据能够解决一些问题。
我们现在做的产品实际上也是AI,搜索公司的使命就是人找信息、信息找人,就是怎么样快速地找到信息,其实就是AI驱动的产品,百度可以来讲all in AI也是对的,百度除了搜索业务未来新的业务都是基于AI做,并且发挥百度算法大数据上面的优势。
提问:请从内容生态产品角度聊一下算法跟价值观的问题。
吴海锋:百度作为平台型的公司,我们深知对于整个网民影响很大,既然影响大,我们必须承担起这样一种社会责任。百度去年更新了我们的使命:用科技让复杂的世界更简单,这样的使命之下怎么样变得更加简单,其实就是构建一个真善美的内容生态,我们把最优质量最优质不低俗的内容更好地放到用户前面满足用户的需求。
因为我们的产品要让人过的更好活的更美,所有这个问题之下,我认为我们不能简单的去理解算法的价值观的问题,而是要把算法跟这个算法所在的产品结合起来去把这个产品的价值观导向做上去,对于百度而言实际上我们在这个方面做了很多工作。比如说我们最近和人民日报有一个联合的项目,我们跟这样的权威媒体一起从我们的内容源头上来开始做一些工作,让这个内容最低质的那部分怎么样越来越少,整体越来越干净。
在算法上面大家知道AI算法最原始的应用之一就是对于内容的理解和对内容的过滤,虽然它做不到百分之百,我们一个人看一张图可以半秒钟一毫秒可以反应了,但是机器需要一个准确率召回率,我们不断的投入资源人力把信息过滤内容过滤做的更好但是它是一个无止境,永远逼近理想,但是我们应该承认光光用技术距离理想还是有差异的,我们不断地缩小差距。
当然我们不排除一些特定的领域一定要人工审核我们加入人工的力量,人工也好算法也好都是手段,我是这样看待算法跟价值观的问题。
提问:我想请曹越给大家介绍一下,究竟哪些提供医疗服务的机构可以在百度投放广告?
曹越:这个问题说一下,百度其实对于在百度做广告的企业有一套非常严谨的审核机制,医疗机构也是一样的,首先对于想在百度做推广的医疗机构来说,要提供它的企业营业执照。同时,作为医疗机构还必须要有医疗机构的许可证,这两点是来保证这个企业是在线下合规的、正常经营的医疗机构的必要要素。
与此同时,我们还会通过银行打款的方式实现对公验证,这个是保证合规的医疗主体以真实的身份在百度做推广。这两个是综合保证了在百度所有做推广的医院,都是在政府的监管之下,以合规、正规的医院身份进来的。
提问:在最近媒体报道里面,有提到是不是PC端、移动端的广告是不同的标准,请解释一下。
曹越:首先说一下移动PC上面广告差别的情况,我们的所有广告管理都是广告主自己操作的,他可以在我们广告后台设置所要推广的媒体的属性,比如说我要在PC推广还是移动上面推广,究竟这个推广的时段从早上八点还是晚上八点,还是全天24小时都在在线,包括需要什么关键词下面买广告,这些都是广告主自己的自主行为。
现在我们看到的PC和移动的广告差异其实根源上来自于网民行为的差异,其实现在随着智能手机的普及,百度50%以上的流量来自于移动端,所以广告主无论是在百度的推广还是其他的媒体推广,一定都是追随着网民行为的改变发生推广行为的变化,所以在这种网民行为的变化之下,广告主也会把他更多的预算、更多的流量倾斜到移动上面,获取潜在的用户群,这个也是大家看到的可能觉得PC上面广告似乎少了一点,移动上面的广告似乎更多了的根本原因,百度没有差异化的标准或者主动引导客户做什么事情。
提问:搜三甲医院这个结果结果不是这个医院,有没有李鬼代替李逵的情况?
曹越:到现在为止,百度已经积累了近两万个公立医院的寻址类保护,第一位不允许出广告的。我们做这样的保护措施,但是仍然被媒体发现我们还有一些漏网之鱼,我们自己也发现了我们的这个漏洞。以往百度更多依靠自己的能力挖掘这些漏网之鱼,但是发现仅靠自己是不够的,我们需要寻求更加广泛的社会合作,与更多的社会机构、政府机构建立合作,希望可以让公立医院的信息搜集更加完整,同时不仅有精确的名称,我们还会了解大家更加容易表达的一些简称,我们这些精确的名称还有简称下面都能够对寻址的结果进行保护,保护的结果就是我们希望我们第一条结果尽量是官网或者百科或者我们的一些智能聚合卡片,这些综合给网民的结果就是要使搜索的第一条结果,最有效、最准确地满足当前的寻址搜索需求。
提问:过去很多年,百度都在提升整个医疗类的信息搜索和广告质量,包括背后投放的企业资质还有他们所提供的服务质量,以及我们本身所提供的信息质量。是不是给大家更加系统地分享一下最近在做什么事情。
曹越:医疗其他行业不一样,毕竟关注着人的健康和安全,所以政府和媒体也对百度承担的社会责任有更高的要求,我们也非常理解,就像刚才所说的百度对于医疗行业的客户引入一套严谨的标准,2017年我们发现企业在百度上违规宣传的行为,我们拒绝下线了60多万家的医疗推广账户,基于百度的机器挖掘识别的方法,我们下线了五千多万条的违规医疗广告。
同时百度的风控体系里面,仅针对医疗行业的黑名单风控词表就达到30万左右,打击医疗广告百度任重道远,所以不管人力投入还是技术投入上面,我们会继续加强。
我们会更加清晰地标识出来某条信息是广告,而不是自然结果。现在百度上面看到任何的广告结果都会直接有广告两个字标注在后面,让大家可以更好的进行区分。
在医疗整个行业,包括药品、保健品、一些医疗机构的查询、疾病治疗方案的查询需求结果里面我们都会进行必要的风险提示,也就是说,让网民能够引导网民,时刻提醒自己提高风险防控意识。
百度以往做的很多都是基于百度平台上面的行为,比如说广告主能不能百度上做推广,百度上展现的广告信息是否合规。我们发现了做到这一步其实还是不够的,我们还是需要加强对于广告点击之后的这些行为的管控,包括对于广告主落地页的监管,我们现在已经严厉打击通过软文推广这种落地页上面的推广行为,我们也会结合百度新的搜索生态能力,比如说熊掌号的能力,我们希望网民点击广告之后与这个信息的互动行为,可以适当的被监控。另外希望引导网民在百度的生态里面来提交对于这些医疗服务机构的评价和反馈的意见,基于这些广告点击后的行为,让百度可以更好的了解我们所服务的医疗广告主真实的医疗服务能力和诚信的情况,让我们在广告的排序当中有更好的一些判断依据,同时也为百度已经经营多年的先行赔付机制积累更多的信息跟资料。
刚才讲的这些都是广告方面的,相信大家来百度除了商业结果,更主要的可能还是希望通过自然结果找到大家可信的信息,自然结果方面也是跟吴海锋团队一直商量,我们努力提高医疗结果权威可信度。第一,打击的其实有一些不良的医疗机构他们通过搜索引擎优化,就是大家所熟悉SEO方式自然结果拿到一些不当的获利,这个我们的会一起专项做打击。自然结果方面我们也会更加开放的跟社会各界更多进行合作,包括一些知名的公立医院,包括知名权威的医疗机构,包括一些科普的平台,我们希望通过和他们的合作,能够让百度拿到更多的权威医疗信息,并且结合百度自身丰富的产品举证能力,能够全面的让这些真实的医疗信息更广的触达网民,通过百度平台让网民更加便捷地获得到真实可信的结果。
作为一个互联网企业,一个肯定得承担责任,我们与政府加大合作,比如说市场监督总局、食品药品监督管理局,包括工商、工信部门,合作打击医疗违规行为,以及线上的其他不良信息。
提问:目前究竟什么决定我们的商业广告的排序规则,然后这些年包括人工智能的引入还有深度学习还有类似于预估专业的词都用上来了,你给我们讲一下目前商业广告的排序怎么样做的?
郑子斌:商业广告的排序很多时候媒体会说是竞价排名,竞价排名只是一个非常古老的产品名称,是我们09年上线凤巢系统之后叫的。一个广告是由很多因素决定排序的,比如说广告的内容跟用户的搜索需求相关性这个是很重要的。
第二,还有广告的质量本身。我们会通过人工智能的技术去做判断,同时又有一个审核的团队去确保广告的质量。然后再加上广告主的网站落地页的质量,刚才曹越提了一些关于这个方面的监管工作。
还有就是我们对于用户信息做个性化的推荐技术,所谓的千人千面。我们有一个非常庞大的机器学习系统去预判用户会不会接受广告信息,这个就是我们所谓的点击率的预估信息。当然价格是其中的一个因素,综合所有因素之后,我们决定怎么样更好的满足用户需求。
还有一点补充一下,就是刚才曹越提了很多关于企业的资质审核方面的工作,广告主的企业信誉也是我们排序里面非常重要的因素,所以这个结合了人工智能还有我们的审核团队整体的力量,我们一起去把这个排序达到最优的效果呈现给我们的用户。
提问:第一个问题:医疗广告广受争议,每年都会出现虚假医疗广告问题,百度有没有分析过背后的原因?是否取消某些垂直领域比如医疗广告?第二个问题:昨天沟通会上面,提到了百度的搜索团队出一款简单搜索的App,能否介绍一下简单搜索的情况还有目前的应用有什么不同,背后有什么创新。
向海龙:我认为整个互联网广告,真实性非常重要,这个其实我们在做整个搜索过程当中,我们不管是我们的广告还是我们的自然结果,真实性、权威性对于我们来讲都是非常非常重要的,这是用户体验的一个基础。
所以,在真实性上面我们很早就提出了一个加 V 项目,针对一些企业我们必须要进行一个加 V 的认证,这个加 V 认证企业所发的内容在搜索结果一个标志,我们希望一个真实的企业发的信息如果说是有问题的话 ,我们能够很快的在法律上面找到这个承担法律责任的人,这个也是相当于对他一定的威慑作用,所以我们之前做了这个比较重要的加 V 项目。
针对医疗加 V 工作大概介绍了下,我们要求更加严格些。我们刚才讲了对公账号的验证,甚至一些资质的验证我们完全是拿到官方的这个信息来验证的,不是拿到他们给我们的一个纸面东西验证的,这个非常严格。另外医疗这块我们甚至要做到实地验证,我们要派人到当地看看是不是这样的一个经营场所,是不是这样的一个办公楼,或者这样的一个实体医院,通过这个方式我们想保证提供内容的实体单位是真实存在的。
当然刚才提到一个相关性的问题,相关性非常重要,我们现在实际上医疗上面有些人会说搜的过程当中准确性不够,比如说中日友好医院,有的人搜的是中日友好,得到的结果可能不是中日友好医院,这个过程当中相关性的问题。相关性的我们也是想尽办法更大的幅度提升,希望这个匹配更加准确,因为相关性其实并不是说匹配的不好找到了一个骗子医院,其实医院实际上也是合法正常的医院,但是可能会对他有看法——就是误导了我,我找的不是这个医院,你给了是这个医院,就算这个医院正规医院也有上当受骗的感觉。
这个是相关性的问题,相关性的问题也是技术上面需要提升的。
今天非常多的项目想方设法提到搜索结果的相关性,搜索结果有一个结果,这个就要从上到下排序的,我们给客户的准确性相关性上面看到很多误会。我们看到最近的一些报道,的确这个个人感觉医疗单位非法企业的问题实际上是一个相关性的问题。
我们现在也在想用另外的一个方法解决,我们在用一个聚合的卡片的形式解决,你搜的时候我可能猜的不是很准的时候给你一个卡片,你再进行一次选择。这样保证了你在看到选择的这个结果当中,是你有一定的主动权的而不是被动的,这样被误导的可能性变少,我们希望在产品的交互上面采用更多的更好的这种研究的方法解决这个问题。
其实搜索结果不管自然结果还是说商业结果,我们未来都会在这两个方面加强,我们希望用这种方式提升整个在这些垂直领域的这样的一个用户体验,另外的一个就是我们的产品上面我们也会再做另外的一个比较重要的升级,就是我们把内容我们未来计划全部装进熊掌号,熊掌号的概念就是我们希望检索到的网站的结果都到我们的服务器上面,现在有一个问题这个企业上面有可能是一个非常正规的企业他做了一个网站,他被我们收录了,收录这一刻没有问题的,有可能中途篡改这个网页,网页会有一些夸大诱导(信息)还有网站被黑客黑了,放到一些违法的信息最后检索被网民搜了,出现了问题。
为了避免这个事情发生,未来比较敏感危险的行业,我们会把它的服务器放到我们的服务器上面,放在我们的熊掌号里面去,这个里面只要网站发生任何改变我们全部知道,这样保证网站上面的信息不容易篡改,这样安全性也会很大的调整,所以今年其实我们做了一个技术就是我们希望熊掌号最先在医疗行业覆盖,我们未来希望通过一两年的时间,我们把我们的医疗网站全部的放进我们的熊掌号,未来有可能不在熊掌号里面搜不到了,这样的可以保证网站被篡改的可能性。
否则我们对于资质服务验证了,网站上面被人篡改了,或者有人故意篡改蒙蔽我们,也会杜绝掉这样保证了整个搜索结果更加的安全可靠。
大家甚至还有可能看到里面没有文字结果,现在没有做到这样。
提问:陆奇曾经想把一些垂直领域的推广不做这个方面的商业推广有其他人不同意,有没有这个事情?
向海龙:没有,从来没有开过这样的会。


已有