电视猫网站是专业的网站,而搜视网站,则不是专业的网站。

业界对百度封站一直多有议论,在donews及一些站长站中,不时会有很多咒骂的声音出现,由于百度在中文搜索中,现在占有绝对的优势,因此,从百度的搜索引擎来的用户一般会占有重要的比例,也就是说,百度封站对于一个站来说,绝对是一件非常不利的事,这也是为什么百度封站后,会有不少的站长因痛失流量而愤怒以致声讨百度的原因。

在以前的声讨文章中,我们极少能听到具体封站过程及解封的消息,以致,从百度内部人士所透露出来的消息,都是: 封了,要解封,就难了。

这些传递出来的信息,一经演化,就形成一个印象: 百度封了你,你就死定了,而不管你是不是被冤枉的还是真正作弊。 这个印象,也正是在我的站被封及解封之事发生前的印象。

2006年7月26日左右, (是一个专业的面向中国老百姓提供的小站,通俗的说,是一份网上)  站的频道 (该频道收录全国几乎所有的P2P并免费提供给老百姓观看) 发现被从百度的索引中删除。实际上,当时,该频道虽然用户量已经不少,但并不信赖于百度的流量;但百度的影响不容小视,重要的是,一个频道的流量来源,尤其是从搜索引擎的流量来源,总是随着你的经营时间的越来越长而会来的人越来越多的。 这与搜索引擎爬虫(spider)抓取你的数据越来越多,搜索引擎随着时间对你的信任度越来越高,引用你站的外链接越来越多而有关。 因此, 百度封掉了该频道,则意味着,无论你如何经营,从百度来的流量会始终为0了。

这是一件大事! Team为此经过了讨论,下定决心一定要解决此事。这包括两个目标:
1) 查清楚免费网络电视频道为什么会被封杀?是技术性问题,还是人为的,我们的竞争对手支持的? (抱歉我当时的确有此想法,这是商业社会,什么事都有可能发生); 查清楚此事的意义在于: 无论如何,不管免费网络电视频道是不是可能被解封,我们也要避免其它频道被封杀。
2) 想办法解封免费网络电视 频道。

为了目标1,我开始寻求向百度打听我站为什么被封杀的原因,但苦于我在百度确实不认识相关的人,没有结果。我偿试向百度发送了第一封信,内容与其它站在网上抱怨的词差不多,大概为: 我的站没有违反百度的规则,为什么会封我啊? 等等…,约2天后,一封貌似自动回信回来,说我的站违反了规则,但不说具体规则,去查百度的指南… 我一看,要疯了,与以前的站长抱怨的一样,解封无望。

我开始耐下心来研究我的站,看是不是什么地方有问题? 但我们从没有想过要作弊啊? 程序都是自已写的,也没有问题啊? 但在我查看到网络电视节目表页 时,我惊呆了,里边全是类似:
02:30 (恶搞)中国队勇夺世界杯
03:30 (恶搞)中国队勇夺世界杯
04:30 (恶搞)中国队勇夺世界杯
05:30 (恶搞)中国队勇夺世界杯
06:30 (恶搞)中国队勇夺世界杯
07:30 (恶搞)中国队勇夺世界杯

我一下明白了,肯定是所有与各个网络电视节目表相关的页引发了百度封掉了频道。这不是典型的关键字重复吗? 这是哪来的呢? 这是我的一个网络电视节目供应商提供的节目表数据,由于该网络电视频道实际上是循环的播放,在此,对方自然的提供了节目名相同,但时间却不同的节目表过来。 害死我们了!!! 没想作弊,却还是"作弊"spam了。 这能怪百度??? 当然不能,我只能服了,这是自已的原因。 我估计,百度封站的过程是: 以技术手段,来从上亿个网页中"推荐"某些页存在作弊,后台有管理员,手工看一下该页,发现确实是,封杀之。

频道就这要完了? 当然不能。 既然找到了技术问题,就先解决它吧,于是我弄了个小算法来判断这些作弊的节目表,发现重复严重,被简单的替换成 “XXX 节目24小时循环播放”, OK?  OK,问题搞定。

接下来,我写了一封信,信的内容与我上边陈述的事实基本上差不多,向百度再次申诉,然后,就是等待。

约在3天后,就是在8月12号,我正在北戴河休假时,该酒店提供free的上网服务,我上百度查看,主啊! 百度恢复了索引免费网络电视频道。

我知道是我的信起了作用,或者是说:是我们采取的正确的解决问题的方法起了作用。

电视猫的日用户量虽然已经达到独立IP7万,但是,仍然是一个无名的小站,因此,我深信,在整个事件中,应该没有任何与技术无关的其它因素影响这件事情的处理。 换句话说,百度拥有一套完整的处理封站与接受申诉的流程的,管理员会仔细的查看你申诉的理由并予以处理,而不象外界传言的:封了就不能解封了。

封站与解封网络电视频道一事中有一个关键,就是: 我们正确的发现了百度封我们的理由,就是我们无意中作弊了。 且正确的解决了它然后再将结果反馈给了百度。

从百度的角度来思考问题:百度的爬虫,日以继夜的在抓取全中国的各个大小的网站, 抓取的频率是GOOGLE的3倍左右,费那么大劲,费那么大的流量(中国的带宽是贵的惊人的,不做站不知道),再费那么大的服务器运行资源(处理你的网页,是需要CPU内存及耗电的)来处理网页, 目的只有一个, 增加有效的数据量。 网页就如同百度的食物,没有了网页,用户来搜索啥? 每一个做搜索引擎的CEO,如SOHU的张朝阳同学,就会公布,SOGOU又抓(索引)了多少网页了,百度闲着没事,将你的网页抓下来,又闲着没事,将你的网页封掉??? 这中间,维系与主宰事情的就是:百度的规则。 我们的站都希望被索引,被排在百度的前边,不被封站,那只有一件事能实现目标:去研究百度的规则,不管是封站的规则,排名的规则。 如果我们的网站,干扰了他的规则,让他的搜索不能正常工作(作弊),那他就会惩罚你。

我写此文章(花了我2小时整)的目的有两个:

1)  给各个站长们介绍一个成功解封的经历,以后可以借鉴。 也提醒大伙儿,做网站要谨慎小心(做站也不容易啊)。
2) 也稍微的介绍一下可能的百度的工作流程,如果能有助于稍缓解一下外界对百度封站的妖魔化(这对百度不公平),也是我希望的。

我知道有一些被封的站长心里肯定不好受(我被封时也如此),看了此贴不一定很开心,如有冒犯,请多包涵。

搜视网 - 电视节目预告,电视节目表,电视剧剧情介绍,收视指南

我要回帖

更多关于 网视界 的文章

 

随机推荐