某企業需分析半結構化的系統日誌(JSON格式),以提取關鍵的時序特徵供故障預測模型使用。考量日誌結構複雜且包含巢狀欄位(Nested Fields),下列哪一種策略最有效且實務可行?
iPAS 考題解析
某企業需分析半結構化的系統日誌(JSON格式),以提取關鍵的時序特徵供故障預測模型使用。考量日誌結構複雜且包含巢狀欄位(Nested Fields),下列哪一種策略最有效且實務可行?
- A. 先將JSON資料平化轉成CSV,再對欄位計算統計量(如均值、次數)作為特徵
- B. 使用遞歸神經網路(RNN)直接輸入原始JSON字串進行時序特徵抽取
- C. 設計遞迴函式展開巢狀欄位,並基於時間窗口(Time Window)進行聚合與特徵萃取 ✓ 正確答案
- D. 只保留時間戳記欄位,忽略其他巢狀內容以簡化特徵工程
詳細解析
對於巢狀JSON日誌,使用遞迴函式系統性展開巢狀結構,再以時間窗口進行聚合統計(如異常計數、平均值、最大值),能有效萃取時序特徵且保留完整資訊,是最實務有效的方法。
出題年份:114 難度:★★☆