SEO 菜鳥成長史 · #25

發布：2026-06-30

閱讀

中

帶最多流量的頁,反而可能在拖累你想排的詞:我用語意地圖抓自己網站的主題漂移

Q: 為什麼用 TF-IDF 不用神經 embedding?

跑的當下 API 金鑰卡住,而我要分的群(SEO 科普 vs AI / Claude)詞彙天然分得很開,TF-IDF 就足以量距離,還免 API、讀者更好複現。神經 embedding 會更細,但這題用不到。

Q: 發現漂移後第一步該做什麼?

先導流不是先刪。順序是 導流 → 合併 → noindex → 搬 → 最後才刪。我先做最可逆的:在離核心的頁加導回核心的橋接,等 60-90 天看重心有沒有移再決定。

先講重點

高流量的頁怎麼會拖累排名?我把全站 75 頁各自向量化、算出一個「語意中心」,發現帶最多曝光的 SEO 科普頁(什麼是 gsc 那類)離我真正想變現的 AI / 陪跑核心最遠 — seo-journey 整群平均距離 0.88,workflows 只有 0.62。重心跑去 SEO、金礦卻在 AI,這就是主題漂移。我先用一處改、全站生效的橋接把流量導回核心,不急著刪。

我打開 GSC,過去三個月曝光最高的查詢是「什麼是 gsc」63 次曝光。第一反應是爽 — 終於有人搜到我了。第二反應才慢半拍:這 63 次曝光,點擊是 0,排名第 40 名。而且搜這個詞的人,是來學 SEO 工具的,不是來找「一個不會寫程式的人怎麼用 AI 蓋東西」的。

我真正想被找到、也真正會轉換成陪跑客戶的,是 AI Agent 工作流那一塊。但站台的搜尋足跡,正在被一堆「什麼是 gsc / google search console / csp」的科普詞堆出來。@darkseoking 講過一件反直覺的事:帶來最多流量的頁,反而可能正在拖累你真正想排的關鍵字 — 因為離核心太遠的頁,會把整個站的主題訊號拉散。

這篇紀錄我怎麼把這件「感覺」變成「數字」:把 75 頁全部向量化、畫出語意地圖、量出哪些頁在稀釋,然後動了第一刀(最可逆的那刀)。一樣是丟給 agent 跑,我出判斷。

1. 反直覺命題:你 GA4 看到的英雄,可能是拖油瓶

只盯流量數字,你很難發現這件事。科普文點擊最高、曝光最大、數據最亮,很自然把它們當英雄。但「離核心生意多遠」這個維度,流量報表根本不會告訴你。

我的轉換核心是陪跑服務(教非工程師用 AI 建工具),workflows 是免費誘餌、newsletter 收名單。搜「什麼是 gsc」的人,跟想學 AI 的人,幾乎是兩群不重疊的受眾。流量再漂亮,他不會變客戶,卻會讓 Google 越來越搞不清楚這個站到底是誰。

2. 語意地圖怎麼畫?把每頁變成空間裡一個點

做法借自 darkseoking:把全站每一頁用向量化轉成空間裡的一個座標。同主題的頁會自然靠在一起,差很遠的就離得很開。再取全站座標的平均,就是「站點語意中心」。然後量每頁離「商業核心」(我這裡定義成 service.html + 所有 workflows)多遠 — 越遠,越是在稀釋。

兩個我必須老實講的地方。第一:這不是 Google 內部一定這樣算,而是我用來診斷主題漂移的實用模型。Google 官方只反覆強調「整體內容是否有幫助」「是否為人而寫」,很多判斷看的是全站不是單頁 — 我這張圖只是把那個抽象概念畫出來給自己看。第二:正規做法是用神經網路 embedding,但我跑的當下 API 金鑰卡住,而我要分的群(SEO 科普 vs Claude / AI)詞彙天然分很開,所以改用 TF-IDF 詞頻向量當近似 — 免 API、秒出、讀者也更好自己複現。要分粗群這夠用,要更細才需要動用 embedding。

3. 數字攤開:seo-journey 離核心最遠

75 頁跑完,各區平均離商業核心的距離(數字越大 = 整群越離題):

區塊	平均離核心距離	解讀
workflows	0.62	最近核心(它們本來就是核心)
newbie-pitfalls	0.81	中間(Claude Code 教學,半核心)
seo-journey	0.88	離核心最遠 = 最大稀釋源

離核心最遠的 Top 20 頁裡,16 個是 seo-journey;而 GSC 上帶曝光的四個磁鐵(gsc-basics / tech-seo / ga4-csp-trap / gsc-new-site-day5)全擠在遠端。對照 GSC 查詢:過去三個月曝光大約七成是 SEO / GSC 科普意圖(什麼是 gsc 63、各種 gsc 是什麼變體破百、darkseoking 35),只有約三成是 AI 類(ai workflow 是什麼、claude 跟 claude code 差別、ai agent 怎麼用)。

4. 診斷:站台重心,跟金礦不在同一個地方

最刺的一張對照:那群 SEO 頁離全站「語意中心」最近(它們把中心往自己拉),卻離我的「商業核心」最遠。換句話說,網站的重心落在 SEO 內容上,但會成交的金礦在 AI / 陪跑那一邊。重心和金礦不在同一個點 — 這就是主題漂移,被量化出來了。

套 darkseoking 的比喻:我像一個賣 AI 導入陪跑的人,站上卻堆滿「什麼是 GSC」的免費科普。這些東西帶流量,卻可能把我從「AI 工具教學者」稀釋成「免費 SEO 資訊站」,結果真正想排、真正會轉換的頁反而更難被理解成核心。

5. 動的第一刀:橋接,不是刪

地圖出來後,對每個高流量頁只問一句:這批讀者會變成客戶,還是吃完免費內容就走?答案是後者的,就需要重新安置 — 但安置的第一步永遠是導流,不是刪除。

我做的最可逆動作:在全部 seo-journey 文章的標題正下方,注入一段橋接 — 一句話把這頁重框成「我用 AI 蓋這個站邊學邊公開的紀錄」,並導向 AI 工作流 / 陪跑。技術上是改一處 build 模板、全站 seo-journey 自動生效;要撤掉砍那段就回原狀,完全可逆。它同時做兩件事:把語意往 AI 拉(重框)+ 把流量導回核心(漏斗)。你現在看到這頁標題下那塊,就是它本人。

6. 為什麼不直接把離題頁刪掉?

最後一條紅線:千萬別圖省事直接刪高流量頁。一刪,流量、外鏈、品牌入口可能一起沒,那才是真虧。darkseoking 給的順序是:加強導流 → 合併 → noindex → 搬走 → 最後才考慮刪。我目前只走到第一步(導流),刻意沒動任何索引或 URL。

而且站台還很新(這時候全站 90 天才個位數點擊),這反而是趁早、趁低風險修架構的最好時機 — 流量小到幾乎沒東西可損,卻能在主題訊號定型前先把方向扳正。怕搬會掉流量是對的,但這是分流不是懲罰;真正的目標不是保住每一個點擊,是讓會成交的頁在語意上更集中。

7. 下一步:等 60–90 天,再跑一次地圖

改完別以為結束。誠實說,這篇只有上半場 — 我還沒有「橋接之後重心真的移了」的結果,因為那需要給 Google 60 到 90 天重新爬取、重新理解。到時我會把同一個腳本再跑一遍,看 seo-journey 的離核心距離有沒有縮、重心有沒有往 AI 移。如果中心沒動,通常不是模型錯,而是我還留太多離題頁、或橋接力道不夠。

那一篇(假設有變化)才會是完整的弧線:診斷 → 橋接 → 數據真的動了嗎。先把這半場記下來,下期接著講。高流量從來不等於對的流量;SEO 也不是單頁遊戲,是全站每一個被索引的頁,一起在告訴 Google:你到底是誰。

▸ 常見問題

Q1:高流量的頁怎麼會拖累 SEO?

離你核心生意太遠的高流量頁,會把全站的主題訊號拉散,讓 Google 比較難判斷你真正想排的核心是什麼。流量漂亮但跟轉換無關時,要先導流、合併,不是先砍。

Q2:語意中心是 Google 真的這樣算嗎?

不是。語意中心 / 距離是我用 embedding 概念做的診斷模型,Google 官方只強調「整體內容是否有幫助、是否為人而寫」。我用它來「看見」主題漂移,不是還原 Google 演算法。

Q3:為什麼用 TF-IDF 不用神經 embedding?

跑的當下 API 金鑰卡住,而我要分的群(SEO 科普 vs AI / Claude)詞彙天然分得很開,TF-IDF 詞頻向量就足以量距離,還免 API、讀者更好複現。神經 embedding 會更細,但這題用不到。

Q4:發現漂移後第一步該做什麼?

先導流不是先刪。順序是導流 → 合併 → noindex → 搬 → 最後才刪。我先做最可逆的:在離核心的頁加一個導回核心的橋接,等 60-90 天看重心有沒有移,再決定下一步。

一個不會寫程式的人,也能把網站當資料庫看一次:把全站向量化、算重心、量距離,用數字看見「我這個站在 Google 眼裡到底是誰」。這篇是上半場(診斷 + 橋接),下半場等 60-90 天重 measure 才知道有沒有用。下期接著講。

名詞解釋

嵌入向量（embedding）: 把一段文字轉成一串數字座標,讓電腦能用「距離」比較兩段內容主題像不像。
TF-IDF: 一種用詞頻算文字相似度的經典方法,不用 AI、純算「哪些詞在這頁特別常出現」。本文用它當免 API 的向量化近似。
語意中心（centroid）: 把全站每頁的座標取平均得到的那個點,代表「整個網站平均在講什麼」。
主題漂移（topic drift）: 網站內容重心慢慢偏離你真正想被搜到的主題;離核心生意太遠的高流量頁是常見元兇。
SEO（搜尋引擎優化）: 讓網站在 Google 搜尋結果排得更前面的一整套方法，涵蓋技術體質、內容品質、連結結構三層。
GEO（生成式引擎優化）: 讓 ChatGPT、Perplexity 這類 AI 在回答問題時引用你網站內容的優化方法，是 SEO 在 AI 時代的延伸戰場。
GSC（Google Search Console）: Google 給網站主的免費後台：看自己網站在搜尋的曝光、點擊、排名跟索引狀態。做 SEO 的人天天開的儀表板。

看完這篇之前先確認:

適合你

內容跨好幾個主題、不確定哪些在稀釋的個人站 / 部落格
想用數據(不是直覺)決定哪些頁該導流 / 合併
會一點 Python、想把網站當資料庫診斷

不適合

單一主題、內容很集中的站(沒有漂移問題)
完全不在乎轉換、純衝流量的內容站
不想碰任何腳本、只想看排名數字

最常踩

把『離核心遠』直接當成『該刪』— 高流量頁要先導流不是先砍
把 TF-IDF / 語意中心當成 Google 真實算法 — 它只是診斷近似
薄頁(聯絡 / 工具頁)混進排名製造雜訊 — 分析時要排除

如果內容對你有用就太好了
隨喜斗內

NEXT CHAPTER ▸ #22 Claude Code / AI Agent keyword 30 天回收記:把中心扳回 AI 的前一役

帶最多流量的頁,反而可能在拖累你想排的詞:我用語意地圖抓自己網站的主題漂移

1. 反直覺命題:你 GA4 看到的英雄,可能是拖油瓶

2. 語意地圖怎麼畫?把每頁變成空間裡一個點

3. 數字攤開:seo-journey 離核心最遠

4. 診斷:站台重心,跟金礦不在同一個地方

5. 動的第一刀:橋接,不是刪

6. 為什麼不直接把離題頁刪掉?

7. 下一步:等 60–90 天,再跑一次地圖

▸ 常見問題

名詞解釋

看完這篇之前先確認:

相關閱讀