2009年4月8日星期三

FreeRange story - 可笑的网页关键词过滤

FreeRange user liu monokeroz wanted you to see this:

"可笑的网页关键词过滤"

上次提到的CHM电子书设置关键词过滤,实际上应该是在网页打包成CHM时,网站本身设定的关键词过滤脚本,因为CHM要调用到web engine。随着反低俗运动的进展,目前网站设置的过滤脚本也越来越复杂和夸张,如以起点中文网为例,打开网页的源代码,你会找到一段forbidKeywords脚本,后面的关键词之多令人胆寒(不是明文,是UTF8编码格式)。但这种简单的被禁词语替换方式,常常会对文字语境和理解造成不必要的困惑。一位读者在看小说《窃明》时候,体验到了这种可笑的关键词屏蔽,如: 1、贺宝刀小心地把熏好的刀(禁止)鞘中,又开始熏他的抢头 答案:这里的(禁止)是"插入".... 3、"他们要稍微蓄养一(禁止)力。" 答案:这里的(禁止)是"下体"... 4、陈继盛这话说得就如同一个乞丐,然后就眼巴巴地望着黄石,希望他松(被禁止)出些钱来。 答案:这里的(被禁止)实在是有点难猜,后来想明白应该是"口交"!

Solidot

FreeRange WebReader - bringing the Internet to your mobile phone like never before!

Reading this on your Windows Smartphone, Palm or Blackberry? Try it now by clicking http://mwap.at

没有评论: