登入

會員權益

獲取需求

查看名片

專屬客服

尊貴標識

VIP低至1.5U/天

Google內部檔案外洩,搜尋引擎運作細節引猜疑

分享

支付動態

2024-05-31

Google搜尋內部API檔案洩漏,揭露多項可能影響搜尋排名的特徵,不過,Google拒絕評論檔案內容的真實性

Photo by Karollyne Videira Hubert on Unsplash

近期網路上流傳一份Google內部描述搜尋引擎運作細節的API檔案,在一段時間的沉默後,Google終於發出聲明,警告外界不要根據缺乏脈絡與不完整的資訊,對搜尋做出不準確的假設,並強調他們已經分享了大量搜尋運作的方式,同時也致力於保護搜尋結果不被操縱。

之所以該檔案引起搜尋引擎最佳化(SEO)專家的注意與興趣,是因為其中描述的細節與Google過去公開聲明的資訊相矛盾,包括不使用網域權重、不使用點擊評份以及沒有使用沙箱等。

Sparktoro共同創辦人Rand Fishkin在5月初的時候收到了一份匿名寄送的信件,內容是一份Google搜尋部門內部的API檔案,而這份檔案經過前Google員工、iPullRank執行長同時也是SEO專家的Mike King檢視,初步認定可信度極高,再加上Google最新的聲明,更間接證實了該份檔案確實來自Google

Google遭洩漏的API檔案超過2,500頁,涵蓋2,596個模組14,014項屬性,Mike King指出,這份檔案的內容與不少Google過去所公開的搜尋規則相矛盾,他認為,Google的發言人從系統運作方面誤導SEO工程師,以及潛在的垃圾郵件發送者,使得外界無法得知影響尋引擎的方法。

Mike King提及數項檔案與Google公開宣稱不符的資訊,包括Google曾經多次說過,Google搜尋不使用網域權重,但是檔案中載明有一個稱為siteAuthority的指標,用於評估網站權重,siteAuthority指標存在於Google的Compressed Quality Signals中,並在Q*排名系統中使用,而這項資料與Google官方聲明相矛盾。

Google官方過去也否認使用點擊資料進行排名,但是Google搜尋中的NavBoost系統顯示,Google確實使用不良點擊、良好點擊和最後的長點擊(Long Click)行為作為排名演算法的一部分指標。不只如此,官方多次否定的沙箱機制,在檔案中的PerDocData模組,顯示出確實存在一個hostAge屬性,Mike King指出,Google在某些情況下會根據網站年齡和缺乏信任的訊號,來對網站進行隔離處理。

另外,Google也多次對外宣稱不使用Chrome資料作為搜尋的一部分,但是Mike King根據洩露的檔案表示,Google確實使用了Chrome資料,來自Chrome存取的資料被用於即時增強訊號的一部分,用於提升搜尋結果的品質和相關性。

不過值得注意的是,Mike King指出,雖然有許多Google搜尋用到的特徵被揭露出來,但是從檔案中,目前還無法看出各特徵在下游的評分函式權重,因此也不確定這些特徵具體使用方式。不過,由於該檔案洩漏了2024年3月Google搜尋內容儲存的現行架構,以及相關程式碼提交歷史,證明這份資料是新資訊。

免責聲明:
詳情

Please Play Responsibly:

Casino Games Disclosure: Select casinos are licensed by the Malta Gaming Authority. 18+