大(dà)數據采集技術
功能概述 FUNCTIONAL OVERVIEW

大(dà)數據采集技術

大(dà)數據采集技術就(jiù)是(shì)對數據進行ETL操作,通過對數據進行提取、轉換、加載,最終挖掘數據的(de)潛在(zài)價值。ETL,是(shì)英文 Extract-Transform-Load 的(de)縮寫,數據從數據來(lái)源端經過抽取(extract)、轉換(transform)、加載(load)到(dào)目的(de)端,然後進行處理分析的(de)過程。用戶從數據源抽取出(chū)所需的(de)數據,經過數據清洗,最終按照預先定義好的(de)數據模型,将數據加載到(dào)數據倉庫中去,最後對數據倉庫中的(de)數據進行數據分析和(hé / huò)處理。

技術優勢 TECHNICAL ADVANTAGE
  • 來(lái)源廣泛
  • 數據量巨大(dà)
  • 數據類型豐富
  • 分布式數據庫
  • 來(lái)源廣泛
  • 數據量巨大(dà)
  • 數據類型豐富
  • 分布式數據庫
預處理步驟 PRETREATMENT STEPS
數據清洗
去噪聲和(hé / huò)無關數據
數據集成
将多個(gè)數據源中的(de)數據結合起來(lái)存放在(zài)一(yī / yì /yí)個(gè)一(yī / yì /yí)緻的(de)數據存儲中
數據變換
把原始數據轉換成爲(wéi / wèi)适合數據挖掘的(de)形式
數據規約
數據立方體聚集,維度歸約,數據壓縮,數值歸約,離散化和(hé / huò)概念分層等
爲(wéi / wèi)了(le/liǎo)您更好的(de)體驗,請豎屏浏覽。

在(zài)線留言 Feedback