转载

百度严打虚假推广 清理38亿条违规链接仅是开始?

中新网1月27日电  信息爆炸时代,互联网的高速普及和生产海量信息,给人们的生活带来空前便利的同时,大量恶性低俗、虚假内容也趁机混入互联网信息浪潮。

如今百度已经是全民搜索的首选,每10个人中就有8个人在用百度。这些恶性的内容自然会最先对百度进行冲击,网民体验将大大受损。

然而百度“黑科技”并不会“吃白饭”。据悉,百度已屏蔽有害链接38亿条,站点级别已超1亿个,大部分有害信息均为机器干预。其中人工干预链接近50万,站点超100万。虽然人工干预成果对于机器干预而言“微不足道”,但由于有害信息的传播源是人在操控,所以仍会有少量信息逃过机器“法网”,这时人工干预称为拦截有害信息的最终屏障。最近百度再次新增近60人审查团队,互换3班24小时不间断审核,并且在原有的机器与人工审核两道流程之上,又增加了一次人工审查作为“第三层保险”。

能把以技术为看家本领的百度逼到这个地步,发布恶性信息的人也是绞尽脑汁。

一些不法广告主会在Flash广告中嵌入第三方外链或php脚本内容,控制作弊Flash物料会根据IP、时间、设备等不同状态因素进行跳转。简单来说,在审核时看到的是钢材的广告,到了晚上或者坐仨小时火车,在相同的网页相同的地方就会看到低俗广告。针对于此,专项组程序猿通过升级Flash物料的代码解析模块,主动发现其中“不应出现”的外链或php脚本内容。

对于“百变”的有害信息,百度一直坚定“严格把关,绝不姑息”的决心,重点对低俗、虚假、欺诈、高危信息等多个维度进行层层把关。如今,百度已拥有一套完整的预防、监控、处理流程体系。经过为期数个月的措施整治后,现已基本杜绝了此类作弊物料。据悉,截至目前百度共封禁Flash账户超1.5万个,涉及Flash物料数超570万条,其中机器拒绝违规Flash物料通过共近60万条。度娘为了这些小广告也是操碎了心。

然而这还不足以证明恶性广告主的“决心”。

除了钻技术空子之外,还有一些不法广告主打着品牌词的主意。在得到风险词和品牌词的控制权之后,小学语文满分的诈骗广告主们便开始利用汉语当中的同义词、同形字、同音字等语言规则将广告关键词进行“变形”,或者在合规词汇中插入不显眼字符企图逃避审核。在前不久,百度就查处了一条利用合规客户品牌名“金蝶软件”当中的“蝶”字进行同音字替换的恶性物料。该物料以“碟”字仿冒合规品牌,严重侵害合规客户的利益,并且对广大的网民造成利益损害。

百度严打虚假推广 清理38亿条违规链接仅是开始?

不过“决心”并不能使他们如愿以偿。百度在第一时间利用变体系统将“变体字”查出,并对相应形式进行系统控制,一套完整的应对策略避免互联网中隐藏的变体形继续猖獗。

打击互联网有害信息,打造互联网绿色生态,始终是百度所不断追求的企业使命。尽管互联网当中隐藏着诸多恶性信息及非法物料,百度也始终通过自身的技术优势和严格的审查体系,持续将这些危害互联网环境的隐形毒瘤进行驱除,旨在为互联网的绿色生态体系提供多一份保障。

原文  http://www.chinanews.com/it/2016/01-27/7735336.shtml
正文到此结束
Loading...