為什麼你必須測量 AI 能見度?
GEO 成效追蹤是指系統性地監測品牌在 ChatGPT、Perplexity、Gemini 等 AI 引擎回答中的出現頻率、引用狀況與情感傾向,藉此量化 GEO 優化行動的實際效果,並找出改善空間。
傳統 SEO 有完整的工具鏈:Google Analytics 告訴你流量來源,Google Search Console 告訴你哪個關鍵字排第幾名,Ahrefs 告訴你競品在做什麼。這套體系建立了 20 年,CMO 已經習慣用「排名」和「點擊率」說話。
但 2026 年的市場現實是:越來越多消費者根本不點搜尋結果,他們直接問 AI。
想像一個情境:你的潛在客戶在考慮導入 CRM 系統,他打開 ChatGPT 問「台灣中小企業最適合哪個 CRM?」。AI 回答了三個品牌名,你的競品在第一位,你的品牌不在這個回答裡。這筆生意,在客戶打開你官網之前就已經輸了。
隨著 ChatGPT、Perplexity、Gemini 的普及,越來越多決策者在接觸業務之前,就已經透過 AI 引擎做初步篩選。這不是未來趨勢,這是現在進行式。
「我的品牌有沒有被 ChatGPT 推薦?」已經成為 2026 年 CMO 最常問的問題之一。問題是,大多數品牌根本沒有方法系統性地回答這個問題。這篇文章就是要解決這個空缺。
GEO 成效的 5 個核心指標
以下是 mrgeo.ai 整理的 GEO 成效追蹤框架,涵蓋 5 個關鍵指標。掌握這 5 個數字,你就能把「AI 有沒有推薦我」從直覺感受變成可量化的 KPI。
指標 1:Brand Mention Rate(品牌提及率)
定義:在你設定的核心問題集中,AI 回答有提及你的品牌的比率。
計算方式:
Brand Mention Rate = 品牌被提及的次數 ÷ 總查詢次數 × 100%
現實場景:假設你是一家台灣的 SaaS 行銷工具公司,你準備了 30 個相關問題(如「台灣最好的行銷自動化工具」「適合電商的 EDM 工具推薦」等),在 ChatGPT、Perplexity、Gemini 各問一輪,共 90 次查詢。其中 27 次出現你的品牌名,Mention Rate = 30%。
一般經驗等級:
- 尚未做 GEO 的品牌:通常接近 0%
- 有基礎內容佈局的品牌:開始出現個位數到兩位數
- 有系統性 GEO 策略的品牌:顯著高於競品
具體數字因產業和問題集而異,重點是建立自己的基線,追蹤趨勢變化,而非跟跨產業的絕對值比較。
指標 2:Citation Frequency(引用頻率)
定義:AI 在回答中把你的網站或內容列為明確引用來源的次數。
Brand Mention Rate 和 Citation Frequency 的差別很關鍵:AI 可能「提到」你的品牌名(例如「市場上有 A、B、C 三家工具」),但「引用」代表 AI 把你的頁面當作知識來源,通常表現為 Perplexity 的來源連結或 ChatGPT 的 References。
為什麼引用比提及更有價值?
引用代表 AI 引擎視你的內容為權威來源。被頻繁引用的品牌頁面往往能長期維持在 AI 回答中,即使競品加大 GEO 投入,也更難被取代。這是 GEO 的護城河效應。
追蹤方式:在問題集查詢時,特別記錄 Perplexity 的引用連結欄位(Perplexity 是目前引用機制最透明的 AI 引擎)。
指標 3:Share of Voice — AI(AI 聲量份額)
定義:在特定問題集中,你的品牌出現次數 vs. 競品出現次數的比例。
這是最能說明競爭態勢的指標。單看自己的 Mention Rate 不夠——你需要知道,在同一個問題集裡,競品的表現如何。
計算方式:
AI Share of Voice = 自家品牌提及次數 ÷ (自家 + 所有競品提及次數) × 100%
現實場景:同一個 30 題問題集,ChatGPT 在相關問題中提及:
- 你的品牌:18 次
- 競品 A:24 次
- 競品 B:12 次
- 競品 C:6 次
你的 AI Share of Voice = 18 ÷ (18+24+12+6) × 100% = 30%
這個數字可以按引擎分開計算,你可能在 Perplexity 領先,但在 ChatGPT 被壓制——這代表不同的優化方向。
指標 4:Sentiment Polarity(情感極性)
定義:AI 在提及你的品牌時,用的是正面、中性還是負面的描述方式。
這個指標常被忽略,但風險極高。AI 不只會「推薦」品牌,也會「警告」品牌。
常見的負面情況:
- AI 提到你的品牌,但緊接著說「但有用戶反映客服回應慢」
- AI 把你歸類為「適合新手但功能有限」——如果你的目標客群是進階用戶,這是負面定位
- AI 引用了 2022 年的舊評論,說你的產品「還在早期階段」——即使你已完全升級
追蹤方式:人工標記每次 AI 提及的情感傾向(正面 / 中性 / 負面),計算三者比例。目標是盡可能拉高正面比例,壓低負面比例。
mrgeo.ai 建議把所有 AI 負面提及截圖存檔,這些往往是品牌修復行動的最佳切入點。
指標 5:Position & Context(位置與情境)
定義:品牌在 AI 回答中出現的位置(開頭推薦 vs. 列表末尾)以及被放在什麼情境下。
位置的重要性:
直覺上就能理解:AI 回答中第一個被推薦的品牌,比被列在末尾「順便提一下」的品牌,在用戶心中的權重完全不同。「首推」和「也有人用」在商業轉化上天差地別。
情境的重要性:
- 好情境:「如果你想要功能完整的行銷自動化工具,[你的品牌] 是台灣市場評價最高的選項之一」
- 差情境:「市面上有很多工具,包括 A、B、C、[你的品牌] 等,各有優劣」
後者你雖然出現了,但被放在一個模糊的「等等」清單裡,幾乎沒有轉化價值。
追蹤方式:記錄每次出現是「首推」「列表前三」「列表其他」「附帶一提」四個等級。
實測方法:手動追蹤 SOP(完全免費)
這套方法不需要任何付費工具,一個人執行,每週約需 2–3 小時。根據 mrgeo.ai 的建議,這是所有品牌在投入自動化工具前應該先跑完的流程——因為手動過程會讓你真正理解 AI 是如何描述你的品牌的。
Step 1:建立核心問題集(20–30 題)
問題集分兩類:
A. 品牌直接問題(5–8 題)
- 「[品牌名] 怎麼樣?」
- 「[品牌名] 跟 [競品名] 哪個好?」
- 「[品牌名] 有什麼缺點?」
- 「[品牌名] 適合什麼類型的公司?」
B. 產業問題(15–22 題)
這類問題不直接問品牌,但是你的潛在客戶會問的問題:
- 「台灣最好的 [你的產品類別] 工具推薦」
- 「[產業] 公司應該用什麼 [你的功能] 解決方案?」
- 「[使用情境] 有哪些軟體可以用?」
- 「如何選擇適合中小企業的 [你的服務類型]?」
問題集模板範例(以 B2B SaaS 行銷工具為例):
| # | 問題類型 | 範例問題 |
|---|---|---|
| 1 | 品牌直接 | 「HubSpot 台灣版跟本地工具哪個好?」 |
| 2 | 品牌直接 | 「[你的品牌] 適合多大規模的公司?」 |
| 3 | 產業問題 | 「台灣電商推薦什麼 EDM 工具?」 |
| 4 | 產業問題 | 「行銷自動化工具怎麼選?2026 年推薦」 |
| 5 | 產業問題 | 「中小企業 CRM 台灣推薦有哪些?」 |
| 6 | 情境問題 | 「剛創業的公司需要行銷工具嗎?推薦哪個?」 |
| 7 | 比較問題 | 「Mailchimp、Klaviyo、本地工具哪個適合台灣用戶?」 |
| 8 | 痛點問題 | 「台灣電商怎麼提升 Email 開信率?有工具推薦嗎?」 |
Step 2:執行查詢
每週固定一天,用同一個帳號(或新開 incognito 視窗),在以下三個引擎各問一輪問題集:
- ChatGPT(GPT-4o 或最新版本)
- Perplexity(記得用 Focus: Web 模式)
- Gemini(Google Gemini Advanced)
重要原則:每次查詢開新對話,避免前一個問題影響後續回答。
Step 3:記錄格式
用 Google Sheets 建立追蹤表,欄位如下:
| 日期 | 問題 | 引擎 | 品牌出現? | 位置 | 情感 | 引用連結 | 競品出現(哪些) | 備註 |
|---|---|---|---|---|---|---|---|---|
| 2026-03-22 | 台灣最好的 EDM 工具 | ChatGPT | ✓ | 列表第2 | 正面 | — | Mailchimp, A品牌 | 被描述為「本地支援好」 |
| 2026-03-22 | 台灣最好的 EDM 工具 | Perplexity | ✗ | — | — | — | Mailchimp, B品牌, C品牌 | 完全未提及 |
Step 4:建立 Google Sheets Dashboard
mrgeo.ai 建議在 Sheets 裡建立以下自動計算欄位:
Brand Mention Rate = COUNTIF(品牌出現欄, "✓") / COUNTA(品牌出現欄)
按月建立趨勢圖,視覺化呈現 5 個核心指標的變化。
進階方法:API 自動化追蹤
當你的問題集超過 50 題、需要每日追蹤、或要同時監測多個競品時,手動追蹤會成為瓶頸。這時候可以考慮 API 自動化方案。
架構概念
[問題集 CSV / Google Sheets]
↓
[Python/Node.js 批次腳本]
↓
[API 查詢:Perplexity API + OpenAI API]
↓
[品牌提及自動偵測(Regex / NLP)]
↓
[寫入 BigQuery / Google Sheets]
↓
[Looker Studio / Tableau Dashboard 視覺化]
可用 API
Perplexity API(最推薦用於 GEO 追蹤)
- 支援 sonar 模型,有完整的 citations 欄位
- 每次查詢回傳的
citations陣列直接記錄引用來源,省去人工辨認 - 價格:約 $0.001–0.005 / query,30 題每日追蹤月成本約 $5–15 USD
OpenAI API
- 使用 ChatGPT-4o,關閉記憶功能確保結果一致性
- 需自行解析回答文字偵測品牌名稱
品牌提及偵測邏輯
# 簡化範例
brand_keywords = ["你的品牌名", "品牌縮寫", "品牌網域"]
def detect_mention(response_text):
for keyword in brand_keywords:
if keyword.lower() in response_text.lower():
return True
return False
進階版本可以加入情感分析(使用 GPT-4o 做二次分析,判斷提及的情感傾向),以及位置偵測(判斷品牌名在第幾句話出現)。
mrgeo.ai 建議先用手動 SOP 跑 4–8 週建立基線,再考慮導入 API 自動化——這樣你才能驗證自動化結果的準確性。
GEO 成效基線怎麼建?
沒有基線,所有的「優化」都是空話。以下是 mrgeo.ai 建議的 Week 0 基線建立流程。
Week 0 測量:30 題 × 3 引擎
在任何 GEO 優化動作開始之前,先跑完一輪完整的基線測量:
- 確定 30 個核心問題(按上述 SOP 建立)
- 在 ChatGPT、Perplexity、Gemini 各問一輪(共 90 次查詢)
- 完整記錄所有結果(不要只記「有沒有出現」,把完整回答截圖存起來)
- 計算 5 個核心指標的初始數值
Baseline Scorecard 範例
| 指標 | Week 0 基線 | 目標(12 週後) |
|---|---|---|
| Brand Mention Rate | (你的 Week 0 數據) | +20pp |
| Citation Frequency | (你的 Week 0 數據) | ×3 |
| AI Share of Voice | (你的 Week 0 數據) | +15pp |
| Sentiment Polarity(正面) | (你的 Week 0 數據) | 正面比例 > 基線 |
| Position(首推 or 前三) | (你的 Week 0 數據) | +20pp |
每月追蹤節奏
mrgeo.ai 建議的追蹤週期:
- 每週:快速查詢 10 個最重要問題,看有沒有明顯變化
- 每月:跑完整 30 題問題集,更新 Dashboard,計算 5 個指標
- 每季:重新評估問題集是否需要更新(市場焦點會改變),做競品分析
5 個常見追蹤陷阱
陷阱 1:把單次查詢當結論
AI 回答具有隨機性(Temperature 設定導致),同一個問題問三次可能得到三個不同答案。永遠用統計平均,不要用單次結果下結論。
mrgeo.ai 建議:同一個問題在同一引擎至少問 3 次,取多數結果。
陷阱 2:只追蹤自己的品牌
如果你的 Mention Rate 從 20% 漲到 25%,聽起來是進步——但如果同期競品從 30% 漲到 50%,你的 AI Share of Voice 其實在下滑。一定要同步追蹤競品。
陷阱 3:只看 ChatGPT
ChatGPT 和 Perplexity 的運作邏輯完全不同:
- ChatGPT:主要依賴訓練資料,更新週期較慢,較難即時反應你的最新內容
- Perplexity:即時爬取網路,有明確引用連結,反應速度快,適合追蹤新發布的內容效果
這兩個引擎的 GEO 優化策略不一樣,追蹤時也必須分開看。
陷阱 4:忽略地區差異
AI 引擎可能因為用戶所在地區回傳不同結果。台灣用戶和美國用戶問同一個問題,AI 可能推薦不同品牌。如果你的目標市場是台灣,要確保在台灣 IP 或繁體中文環境下進行查詢。
陷阱 5:追蹤但不行動
追蹤數據只有變成優化行動才有意義。mrgeo.ai 建議每月追蹤後,強制產出一個「GEO 優化行動清單」:Mention Rate 低 → 增加定義型內容;Citation 少 → 強化可引用的數據和案例;負面情感多 → 修復特定頁面或發布澄清內容。
常見問題(FAQ)
Q1:GEO 追蹤跟 SEO 排名追蹤有什麼不同?
SEO 追蹤是監測你的網頁在 Google 搜尋結果第幾頁第幾名,有 Ahrefs、SEMrush、GSC 等成熟工具,數據相對穩定且可重現。
GEO 追蹤是監測你的品牌在 AI 生成回答中的出現狀況,目前沒有標準化工具(這正是市場機會),需要更多人工判斷,且 AI 回答具有隨機性,需要用統計方式處理。
最關鍵的差異:SEO 排名是「頁面排名」,GEO 能見度是「品牌定位」——後者更接近傳統的品牌調查研究,而不是技術 SEO。
Q2:多久追蹤一次比較好?
根據 mrgeo.ai 的建議,分三個層次:
- 最低限度:每月一次完整追蹤(適合剛開始、資源有限的品牌)
- 標準節奏:每週快速追蹤 + 每月完整追蹤
- 進階模式:每日 API 自動化 + 每週人工審查
剛開始的品牌,每月一次已足夠看出趨勢。等 GEO 優化策略成熟後,再加快追蹤頻率。
Q3:品牌從零到被 AI 引用,通常要多久?
這取決於引擎的運作機制:
- Perplexity:即時爬取網路,發布高品質內容後回報最快,適合作為 GEO 成效的第一個驗證點
- ChatGPT:依賴訓練資料,更新週期較慢,與品牌的整體網路聲量高度相關
- Gemini:介於兩者之間,有即時搜尋能力但也依賴訓練資料
因此 mrgeo.ai 建議:短期優先優化 Perplexity 的引用率,因為回報最快、引用機制最透明。
Q4:有沒有免費工具可以追蹤?
目前沒有完整的免費 GEO 追蹤工具(這是市場空缺)。但你可以用以下免費工具組合:
- Google Sheets:建立追蹤表和 Dashboard
- ChatGPT / Perplexity / Gemini 免費版:執行查詢(有次數限制)
- Google Looker Studio:視覺化 Dashboard
- Zapier / Make 免費方案:部分自動化提醒
如果要跑 API 自動化,Perplexity API 和 OpenAI API 都是按用量計費,30 題月追蹤的成本通常不超過 $20 USD。
Q5:追蹤發現品牌被 AI 說負面的話,怎麼辦?
不要慌,但要立刻行動。mrgeo.ai 建議的處理流程:
- 確認來源:AI 的負面描述通常來自某篇評論文章、論壇討論或舊新聞。找出原始來源。
- 評估可修復性:如果是你能控制的頁面(官網、部落格),直接更新內容。如果是第三方評論,考慮聯繫網站或發布正式回應。
- 發布反制內容:針對負面描述的具體點,發布有數據支撐的反駁內容(例如:如果 AI 說你「客服回應慢」,發布一篇詳細說明你客服 SLA 的頁面)。
- 增加正面信號:鼓勵滿意客戶在有公信力的平台留下正面評價和案例分享。
- 持續追蹤:負面信號的修復通常需要 2–6 個月,要耐心持續追蹤改善狀況。
下一步:開始測量你的品牌 AI 能見度
GEO 成效追蹤不複雜,但需要系統性執行。根據 mrgeo.ai 的建議,從今天就可以開始的三件事:
- 這週:建立你的 30 題問題集,開一個 Google Sheets 追蹤表
- 這個月:跑完第一輪 Week 0 基線測量,拿到你的 5 個核心指標基準值
- 下個月:根據基線數據,決定優先優化哪個引擎、哪類問題
記住:你無法優化你沒有在測量的東西。在競品還沒建立系統之前,你的追蹤數據就是你的競爭優勢。
想知道你的品牌目前的 AI 能見度分數?mrgeo.ai 提供免費的 GEO 健檢,幫你跑完 Week 0 基線測量,並給出具體的優化優先順序。
延伸閱讀:什麼是 GEO?生成式引擎優化完全指南(2026) | 回到所有文章