UD（非結構化資料）是什麼？完整定義與解說

Q: 圖片也算非結構化資料嗎？

算，因為它不是固定欄位的表格格式。

資料處理AI基礎

術語快查

搜尋意圖： 如果你在找「非結構化資料是什麼」或「非結構化資料和相近概念差在哪」，先看這頁的短定義、完整說明與延伸比較。

TL;DR： 非結構化資料是指沒有預定義格式或組織方式的資料，難以直接儲存和分析，例如文字、圖像、音訊和影片。

實用情境： 適合用在閱讀 AI 文章、產品文件或和同事討論時，先用一頁快速對齊概念。

下一步： 先讀完定義，再往下看延伸比較與對應工具，把概念轉成實際應用。

你有沒有看過一堆照片、文章和錄音，根本不像整齊的表格？ 你可以把非結構化資料想成「沒有固定欄位格式的資料」它不像試算表那樣一列一欄整齊，而是文字、圖片、音訊這種原始內容因為形狀不固定，通常要先做特徵萃取或轉換，模型才好處理

你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

容易混淆

非結構化資料 vs 結構化資料 非結構化資料沒有固定欄位結構化資料一眼就能對欄位最關鍵的區別：格式是否規整

非結構化資料 vs 半結構化資料 非結構化資料更自由半結構化資料像 JSON、XML，還有一些標記最關鍵的區別：有沒有部分規則可循

非結構化資料 vs 雜訊資料 非結構化資料不等於髒資料它只是格式自由，不代表沒價值最關鍵的區別：格式和品質是兩件事

記住這句就好

沒有整齊欄位，不代表不能分析，只是要先轉成模型看得懂的形式。

實際案例

客服錄音 錄音先轉文字，再抽特徵或做摘要，才能進一步分析客訴主題

醫療影像 X 光、MRI 和超音波都屬於非結構化資料，通常需要影像模型先處理

算法與應用

| 資料型態 | 文字、影像、音訊最常見 | 都不是整齊表格 | | 前處理 | 通常要轉成向量或標籤 | 模型才能吃 | | 特徵抽取 | 從原始內容抓出可用訊號 | 這步很關鍵 | | 應用場景 | 搜尋、分類、摘要、辨識 | 都很常見 |

情境判斷

Q1（直覺題）： 你有一堆客服錄音，想找出常見問題，這算什麼資料？

通常是非結構化資料，因為它還不是整齊欄位。

Q2（判斷題）： JSON 檔裡有固定欄位，還算非結構化嗎？

通常不算，JSON 比較接近半結構化資料。

常見問題

非結構化資料可以直接拿去訓練嗎？

很多時候不行，通常要先轉成模型能用的表示。

圖片也算非結構化資料嗎？

算，因為它不是固定欄位的表格格式。

它為什麼在 AI 裡這麼重要？

因為真實世界大量資料都長這樣，能不能處理它，常決定系統能不能落地。

容易混淆

記住這句就好

實際案例

算法與應用

情境判斷

常見問題

相關術語

延伸學習

看常見比較

找對應工具

資料來源與參考依據