搜索引擎背后隱含著很大的經濟利益,更容易被搜索到是提高點擊率的一個重要途徑,也是互聯網“注意力經濟”的一個重要指標,搜索引擎與作弊網站之間的矛盾,不光是技術上的攻防游戲,實際上是一個嚴肅的產業問題
“芙蓉姐姐”成作弊工具
打開Goo
gle,選關鍵詞“芙蓉姐姐”點擊,再任選一個“芙蓉姐姐”出現較多的一篇點擊,接著出現兩種可能:第一,只數秒鐘,頁面便突然彈跳到“亞洲在線最大的寬頻影院”等等網頁。第二,出現無數的“芙蓉姐姐”,再任意選擇一個“芙蓉姐姐”點擊,出現與第一種可能一樣的頁面———其內容與“芙蓉姐姐”絲毫無關,撲入眼里的是女人半裸的身體或半裸的乳房。
這便是一次完整的“作弊網站”體驗。

例如上面這個網站,屬于非常典型的SPAM,它在網頁標題中堆積大量無關關鍵詞,或者在網頁的meta
keywords中堆積大量無關關鍵詞。 網站畫面截圖(來源:eNet硅谷動力)
幾乎沒有一次例外,當網絡上有某一個詞成為熱點時,它必將成為作弊網站(亦被搜索引擎稱為“垃圾網站”)最為熱門的“作弊工具”。這一次輪到“芙蓉姐姐”。
在互聯網搜索引擎領域,作弊網頁已達到泛濫成災的地步。
這是據芙蓉姐姐走紅的7月12日的統計。以“芙蓉姐姐”為關鍵詞,通過Google進行查詢,約有1,030,000個相關網頁。查看前40篇的網頁,約有15條比較符合“芙蓉姐姐”的內容,占37.5%,有25條不符合“芙蓉姐姐”的內容,占62.5%。
除了最近兩天剛排到第一位的門戶網站新浪外,第二位是Mblogger,第三的是,均名不見經傳。以排在前10位的來分析,除新浪外,幾乎全是在BSP(Blog Service Provider托管服務提供商)上申請的BLOG網站(中文稱“博客網站”),而在搜索結果的摘要內容上,這些網頁類似于專題的形式,滿目都是“芙蓉姐姐”,任意點開其中一個,大多彈出的是性感電影手機注冊下載或鈴聲下載等頁面。
在百度里,以“芙蓉姐姐”為關鍵詞,找到相關網頁約1,340,000篇,在前40篇中,排在前面的主要是網易、TOM、新浪女性、QQ等門戶網站的專題,而在Google中,這些內容均被作弊的blog擠出前40篇之外。
據一位不愿透露名字的反spam(垃圾網站)專家王某介紹,百度這種搜索結果,并非百度偏好門戶專題新聞類內容,根本原因在于,百度已將上文提到的Google前40篇內大部分的作弊網頁自動刪除掉了,結果比較符合“芙蓉姐姐”的網頁內容自然在搜索中排得靠前了。
以“芙蓉姐姐”為關鍵詞對照百度和Google兩個主要搜索引擎的搜索結果,可以感受到百度搜索的用戶體驗要比Google好,因為在Google中查找意味著需要在一堆“垃圾”中尋找有效的網頁。
作弊聯盟
有意思的是,百度屏蔽這些垃圾網站時,遭到了這些網站在技術層面上的攻擊。
“百度一下”關鍵詞“反百度聯盟”會發現,在百度網站上有無數條有關“反百度聯盟”的信息。自6月1日“反百度聯盟”網站上線以來,目前已有2000多人次簽名。
該網站上線之初,氣勢較大,但最近幾乎沒有了動靜。
“反百度聯盟”發起人為一個網名為“踏雪無痕”的網友,據稱,其“美人魚”個人文學網站于去年底被刪除。該聯盟在宣言中表示,該聯盟是為了反對百度公司對廣大站長和網友不公正而成立的同盟組織,本同盟成立的目的是“為了收集百度公司對待站長和網友不公正的證據,促進監督百度公司走向公正”。但是,該聯盟成立一個半月以來,至今沒有發現該聯盟握有多少百度“對待站長和網友不公正的證據”。
而百度對待“反百度聯盟”的態度是“兼容”,直接通過“百度一下”,即可獲得該聯盟的所有信息。但據稱,百度對此聯盟相當重視,從該網站一出現,便組織專業人員對聯盟成員及聯盟成立原因進行調查,最終得出結論,從已明示網站站名的該聯盟成員來看,被百度屏蔽的網站無一例外都曾違反了百度的搜索引擎反垃圾網頁規則。
業內專業人士認為,成立反百度聯盟是一件不正常的事情,這就像成立“假冒偽劣俱樂部”或“垃圾郵件聯盟”一樣,是不為一個社會所容的。
目前,搜索引擎領域的垃圾網站,已到了泛濫成災的地步。其發展趨勢完全等同于當年垃圾郵件,已像蝗災一樣,不僅危害搜索引擎,也直接危害互聯網。
據百度PM總監俞軍介紹,與作弊網站的斗爭,將是互聯網上一個長久的過程,目前雙方的博弈與全球反病毒在技術與形式方面已沒有什么區別。
俞軍認為,從某種角度來說,幾乎是垃圾網站在推動著搜索引擎的進步。
在搜索引擎發展初期,搜索引擎的專業人員一直在思考,如何讓搜索者以最快速度搜索到最有價值、最為相關的結果,因而發明了metatag———這是一種“超文本標志語言”,在互聯網體系中的作用是表明該網頁或網站的屬性。
起初,meta tag是很好用的。那時候,誠實的web站點管理員(webmaster)們如實地填寫網站摘要,如實地列出跟他的網站最相關的關鍵字,搜索引擎們抓取、索引、檢索這些誠實的meta tag,并作為搜索結果排序的重要依據。為了有效提高搜索結果,有專門的網絡人員研究SEO(搜索引擎優化),專門為網站提高搜索結果而進行優化。
然而,人們越來越發現,搜索結果的排序,是一個巨大的利益空間——如果誰的網站或網面能夠排在搜索結果的前列,誰就有可能獲得最大的“廣而告之”效益而產生巨大利益。因而,許多“覺醒”過來的網站為了追逐這一利益空間而開始追求頁面瀏覽量(pageview)——打開一個頁面,卻可包含數個頁面元素,從而獲得眾多的點擊數(Hits)——點擊數則是“注意力經濟”的一個重要指標。
而到了這個地步,一度推動技術進步的“搜索引擎優化”(SEO)已異化成“搜索引擎作弊工具”(英文簡稱“SEO SPAM”)。
從Google的“芙蓉姐姐”的搜索結果便可看到這一典型的作弊:在metatag中塞進成堆的關鍵字,或塞進跟自己的網站內容無關,但是非常流行的關鍵字———但當你打開它時,它又迅速地跳轉入作弊網站設定的網頁頁面中。