特徵儲存庫是什麼？

Feature Store — 特徵儲存庫的完整解釋

特徵儲存庫是一個集中管理和共享機器學習特徵的平台，確保特徵一致性、可重用性，並簡化特徵工程流程。

容易混淆

特徵儲存庫 vs 資料庫 資料庫主要存原始資料。特徵儲存庫存的是可直接給模型用的特徵，還會管版本和一致性。

特徵儲存庫 vs 資料管線 資料管線負責搬資料和做計算。特徵儲存庫負責把算好的特徵管理起來，方便重用。

記住這句就好

特徵儲存庫管的是「同一個特徵，訓練和上線都要一樣」。

實際案例

信用模型團隊 訓練用的逾期次數、消費頻率和上線取值方式一致，模型才不會線上失真。

推薦系統團隊 多個服務共用同一組使用者特徵，避免每個團隊各算各的，最後結果不一致。

深入了解

它通常會同時支援離線特徵和線上特徵，前者偏訓練、後者偏即時查詢。真正的價值不只是存資料，而是維持特徵定義、計算邏輯和版本的一致性。

情境判斷

Q1：如果同一個特徵在訓練和上線算出不同結果，會發生什麼事？ → 模型表現可能明顯落差，因為它看到的輸入和訓練時不一樣。

Q2：如果只有一個小專案，還需要特徵儲存庫嗎？ → 看情況，小專案不一定非用不可，但只要多人協作或特徵重用變多，就會開始有價值。

常見問題

特徵儲存庫和模型登錄庫是一樣嗎？

不一樣，前者管特徵，後者管模型版本與部署資訊。

線上特徵一定要即時算嗎？

不一定，有些可以預先算好存起來，重點是查詢延遲要夠低。

特徵儲存庫只適合大型公司嗎？

不只，大型團隊最有感，但中型團隊也常因為一致性受益。

它能解決所有訓練問題嗎？

不能，它主要解決特徵一致性，不會自動把資料品質變好。

← 回到特徵儲存庫快查頁

特徵儲存庫是什麼？

容易混淆

記住這句就好

實際案例

深入了解

情境判斷

相關術語

相關術語

常見問題

特徵儲存庫和模型登錄庫是一樣嗎？

線上特徵一定要即時算嗎？

特徵儲存庫只適合大型公司嗎？

它能解決所有訓練問題嗎？

特徵儲存庫 是什麼？

容易混淆

記住這句就好

實際案例

深入了解

情境判斷

相關術語

相關術語

常見問題

特徵儲存庫和模型登錄庫是一樣嗎？

線上特徵一定要即時算嗎？

特徵儲存庫只適合大型公司嗎？

它能解決所有訓練問題嗎？

特徵儲存庫是什麼？