SrcRank / Googlebot
看到「頁面大小超過限制」,通常不是工具壞了
這個訊息不是在判斷「瀏覽器能不能打開這頁」,而是在判斷「Google Search 到底有沒有完整看見這頁」。如果父 HTML 已經超過 Google Search 對單一 HTML / 文字型內容的處理上限,SrcRank 把它算成擷取失敗,反而比硬算成功更誠實。
一句話版本
真正的問題不是網站重不重,而是你的 critical SEO signals,有沒有活在前面的可見 bytes 裡。
Google 一直在強調 HTML 要精簡,而且重要訊號的順序很重要。翻成白話就是:不是你頁面裡有什麼比較重要,而是你把什麼排在前面,比較重要。
SrcRank 為什麼把它判成失敗?
因為 SrcRank 要模擬的是「這頁對 Google Search 是否仍然完整可見」。如果超過限制之後的內容,Google 很可能不看、不 render、不納入 index 判斷,那把它標成成功只會給錯誤安全感。
這個限制不是你亂設的嗎?
不是。這個判斷是依照 Google 官方近年的 crawler limitations 與 Googlebot 文件精神:Search 會優先處理父 HTML 的前段內容,重要訊號應盡量靠前放置,避免超過切點後才出現。
先釐清一件事:不是整頁所有資源加總只有 2MB
問題主要在父 HTML。外部 CSS、JS 會另外抓,各自有各自的抓取限制,並不是把圖片、樣式、腳本全部加總後只剩一個總額度。真正要擔心的是,你最重要的 SEO 訊號是否已經在父 HTML 前面就出現。
應該盡量往前放的內容
- • title、meta description、canonical
- • 主要 structured data
- • H1、定義先行段落、FAQ
- • 產品重點、價格、主文摘要
- • 真正要被引用或索引的正文內容
常把重點往後擠的東西
- • 大量 inline CSS
- • 大量 inline JS
- • hydration state / app state dump
- • page builder 產生的肥大 template
- • mega menu 與重複導覽 HTML
- • tracking code 與非關鍵 widgets
SrcRank 想提醒的,不是頁面打不開
很多網站現在的問題,不是沒有內容,也不是沒有 schema,甚至不是沒有 technical SEO。真正的問題是:Google 根本還沒看到你最想讓它理解的內容。
如果 canonical、結構化資料、FAQ、產品重點與正文都被大量 inline CSS、inline JS、template 與 tracking code 擠到後面,那超過切點之後的內容,實務上就像不存在一樣。
團隊可以怎麼自檢?
- 1
先抓原始 HTML 大小,而不是只看瀏覽器載入後的畫面。
- 2
確認 canonical、meta description、重要 structured data 是否都出現在前段 HTML。
- 3
檢查 FAQ、產品重點與主文摘要是否被 inline CSS、inline JS 或 mega menu 擠到後面。
- 4
把可外掛的 CSS / JS 拆出去,避免把父 HTML 塞滿。
- 5
減少 hydration state、builder template 與重複導覽輸出。
- 6
重新測一次,確認關鍵訊號是否仍落在前 2MB 內。
你可以怎麼對使用者解釋這個錯誤訊息?
擷取失敗:抓取失敗:頁面大小超過限制。這通常不是 SrcRank 壞掉,而是頁面的父 HTML 超出 Google Search 的可見範圍。SrcRank 把它判成失敗,是因為它要模擬 Google 是否完整看見你的 SEO 訊號,而不是模擬瀏覽器能不能把頁面打開。
常見問題
看到「擷取失敗:頁面大小超過限制」,代表 SrcRank 壞掉了嗎?
通常不是。這代表頁面的父 HTML 已經超過 Google Search 對單一 HTML / 文字型內容可處理的大小限制,SrcRank 故意把它視為失敗,因為它要模擬的是 Google 是否完整看見,而不是瀏覽器能不能打開。
這個限制是把整頁所有 CSS、JS、圖片一起加總嗎?
不是。核心問題是父 HTML 本身前面的 bytes 有沒有先放進 canonical、meta、structured data、FAQ 與主內容。外部 CSS、JS 會另外抓取,各自有各自的限制,不是全部資源共用同一個 2MB 配額。
如果頁面超過限制,Google 會晚點再補抓後面的內容嗎?
對 Search 來說,不應假設後面的 bytes 之後會被補看。超過切點之後的內容,實務上就是高風險不可見區,不能把它當成穩定可索引內容。
我應該先優化什麼?
先把重要訊號往前搬:title、meta description、canonical、重要 structured data、H1、FAQ、產品重點與正文摘要。再減少 inline CSS、inline JS、hydration state、page builder 輸出的肥大 HTML。