搜索imdb弹出涉黄推荐:同样的“黄”坑百度还要掉几次?专栏号

/ 刘志刚 / 2018-05-17 21:31

百度又有负面了!这句话在近几年似乎是一个高频词语。在市值被京东等后起之秀奋力追赶的今天,百度重压了筹码在人工智能领域。然而不得不说的是,AI也只是代表着未来,对于百度来说,眼前的负面频传同样是不容忽略的问题。

近日,笔者在刷朋友圈时看到有人晒图,在搜索imdb时,百度居然推荐了一些涉黄词汇!可以称之为国民百科助手的搜索引擎居然出这样的问题,或许百度真的应该从AI上分出些精力治理了。

涉黄信息“剪不断”:“游击式”治理等同不作为

从报刊广播电视到PC时代,再到移动互联网时代,媒体的传播伴随新技术的演变而不断变化,在PC时代,百度充当着很多信息的入口,国人也一直有着“有问题,找度娘”这样一个观念。

在PC互联网时代,百度没有腾讯的产品好,不如阿里运营出色,但却牢牢抓住了搜索这一强大的工具就足以让百度受益匪浅,因为无论当时还是现在都奉承得入口者的天下的理论,百度形成的搜索+推荐的双引擎驱动,在PC时代称之为控制普通人接触信息时代的入口也一点不为过。而搜索引擎也极大地方便了人们使用,奠定了百度巨头的地位。

然而或许“英雄变恶龙”真的是互联网时代不可避免的走向,近几年的与百度如影随形的却是各种负面传闻,百度旗下产品单是涉黄就出现了不止一次。

早在2014年,全国“扫黄打非”办称有群众举报百度网盘的部分账号存在传播淫秽色情信息问题,随后北京市文化市场行政执法总队依法约谈百度有关负责人,要求百度网盘立即删除相关内容,限期整改。

早在2016年,央视记者通过调查发现,在百度贴吧,存在商业推广。一些色情场所的广告,竟也出现在百度贴吧的商业推广中。而网信办相关负责人也指出,经核查发现,部分贴吧存在包括淫秽色情在内的多项违法违规信息,责令百度进行整改。然而在此之后又有不少媒体报题报道称百度在这方面整改不力的消息,贴吧仍存在大量涉黄信息,甚至有人在贴吧中进行淫秽信息交易,或者以色情信息交易为诱饵进行网络诈骗。

去年,作为百度移动互联网少有的亮点,百度地图被曝成为不法分子招嫖的“神器”。不法分子利用虚假营业执照等信息,提交虚假标注,以违法的手段获取利益。百度地图到底是否存在售卖或者推广地图标注的行为笔者不得而知,但单方面采集信息,连营业执照真伪都无以辨别,在那次地图招嫖事件中,作为平台方的百度有不可推卸的责任。

除了“黄色信息”以外,百度还曾被曝涉嫌“推广赌博网站”,这也引起了舆论的不满。

如今,再加上此次的案例,这些现实不难呈现出这样的一个事实:百度对旗下产品把关不严,致使其在一定程度上有些“藏污纳垢”了。但不得不说的是,为何百度旗下产品“扫黄”却屡禁不止?对于一个搜索引擎来说,其最大的价值或许就是能够实现网民的搜索需求,让网民能够更容易、更快捷的获取到所需要的信息。网民希望看到的是,搜索的什么信息,搜索引擎就能自动去除冗余信息的糟粕,给出精确的信息。

目前我们的印象似乎都是问题在被舆论曝光后百度才去解决,作为互联网之前就存在的事物,“黄”和“赌”、“毒”一样绝对是社会毒瘤,扫除这一类信息应该是平台最基本的底线,而不应该“游击式治理”,哪里曝出去哪里,没被大面积曝出就不闻不问?这些事件的发生,除了不法分子利益驱动以外,作为平台方的百度旗下产品涉黄为何经常发生?

技术不够“硬”or流量驱动的作恶:禁黄不止的原罪究竟为何?

一般来讲,人们面对无法解决的问题时的原因大致可分为两类:能力问题和态度问题。能不能做,是能力问题;肯不肯做,是态度问题。对于百度旗下产品屡次出现涉黄行为而言,问题讨论的关键就是这到底是是因为其把关技术不到位,还是责任意识缺失。

第一种可能,技术不到位,那是能力问题,这没有办法,毕竟客观条件是不以人的意志为转移的。

在PC互联网时代,计算机视觉技术取得长足进步,用肤色识别或者敏感词算法过滤掉一些没那么多“黄色”内容的图片或者文字信息,剩下的再进入到人工审核,可以大大节约审核量。

而到了移动互联网时代,各种类型的网络数据量暴增,人工审核连20%的数据量也无法承受了。与此同时,人工智能的技术热潮开始研发机器学习的鉴黄系统。AI正在熟练掌握分析图像和视频的技术。并且取得了显著成果。简单来讲,就是收集样本、建立模型,再通过基于图像识别技术下的附加功能进行审核。

盛名之下无虚士,虽说和阿里的运营,腾讯的产品一样,百度的技术已经成为众所周知的标签,如今更是“ALL in AI”,但不得不说的是,这只是一种战略,是基于未来发展的,任何战略简而言之就是就是长时间的战术,是需要一点点去攻克的。

解决黄色信息的传播问题,百度的人工智能技术是否可以办得到呢?这个恐怕涉及公司发展的核心技术,外人不得而知,因此百度利用AI清除不良信息的力度也很难不明确。而且AI无法对所有的情景做出准确的判断。尽管在寻找不良迹象速度方面,AI比人类快得多,但是分析复杂的情形和事件时,还得由人类出马。因此,百度在技术上或许还无法彻底解决黄色信息问题,但这也从侧面反映了AI的发展任重道远。

在世人看来,百度贪恋PC时代遗产,在移动互联网转型之际有些转型拖泥带水,造成落后,如今百度加大AI转型力度,却也不得不在奉劝一句:三思而后行,AI是未来,但不是现在。

不过值得一提的是,一些很明显的词汇无法识别出而且进行推荐似乎有些说不过去了,如下图所示的那些不良信息,已经ALL IN AI的百度无法进行技术识别出吗?难道以技术见长的百度技术实力还不够“硬”?

第二个可能,那就是技术方面没问题,有问题的是态度。虽说我们不能以最坏的揣测来推断别人,但百度之前在态度方面似乎存在着为人诟病地方的地方。

天下熙熙,皆为利来;天下攘攘,皆为利往。在2016年负面事件缠身,血友病吧事件、魏则西事件,将百度推向舆论的漩涡,百度的竞技排名已经成为最为人诟病的地方,把推广广告和正常的搜索结果放在一起,虽然有明确的推广字样,但是还是很大一部分群不知道,用户可能只是单纯的查资料,但却稀里糊涂的进入了企业的网站,致使一些网友就打趣称百度搜索越来越难搜到想要的信息了。

事实上,很多企业也都有着推广的需求,因此竞价排名这一行为本身也无可厚非,但从用户体验的角度来看,对搜索这一最本质的功能需求已经有所影响,这就值得百度仔细考量了。不得不说的是,竞价广告业务是百度主要的收入来源,让百度割弃这块肥肉似乎也是不可能的,于是乎,关于百度竞价排名的骂声也因此不绝入耳。

那么假设推荐内容涉黄屡次发生是态度问题,百度又是在哪种利益驱动下冒天下之大不韪呢?答案很有可能是流量。

移动互联网时代,以技术驱动见长的百度,遭遇到了一个产品运营驱动的市场,再加上各种布局的后知后觉,导致百度掉队,而且流量入口变得多样化,可替代性强,不同于阿里、腾讯的到处投资,百度似乎只有一个低频、工具属性强的百度地图拿的出手。流量这门生意的市场被分的越来越细。短视频百度的爱奇艺与腾讯、优酷争雄;短视频有抖音等平台;资讯类有今日头条、一点资讯;提问方面用户也逐渐从由百度知道向知乎迁徙,流量获取对于百度来说已经迫在眉睫。

最原始的方法或许是最有效的。人类最基本的本能中,性欲本能与个体生存本能是每个人的天性。而荷尔蒙本来就是人性的本质需求。一部互联网的发展史,其实就是人性的需求的探索史,早已脱离创业阶段的百度是否再通过一些敏感词汇吸引用户呢,笔者不得而知,但并不是没有这样的可能。

当然了,无论是能力问题,还是态度问题,百度真得想办法肃清旗下产品环境了,近段时间快手下架、内涵段子永久关停、二更被封就是前车之鉴,涉及图文视频等多个领域,这充分说明内容的质量问题俨然成为当前社会关注的焦点。而且,无论如何作为当事人的百度,不能将责任归咎于外人。如果在搜索问题上和网民渐行渐远,百度势必会被更多的用户抛弃。毕竟移动互联网时代,水能载舟亦能覆舟,用户流量的最大化能让平台价值最大化,但与此同时舆论的不满也可能对平台对品牌带来极大的伤害,对于百度来说,是时候静下来好好思考一下这个问题了。

科技自媒体刘志刚,订阅号:互联网江湖,微信号:13124791216,转载保留作者信息违者必究。



1.砍柴网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为砍柴网或将追究责任;3.作者投稿可能会经砍柴网编辑修改或补充。


阅读延展




1
3