製造業資料倉儲資料探勘分析應用

何謂資料探勘

隨著IT技術的突飛猛進及資料庫管理系統的廣泛應用,伴隨而來的是企業所擁有的資料量亦日漸龐大。因此,各企業開始對這些龐大的資料進行分析得到更多有助於決策的資訊。可惜的是,仍有一半以上的資料當被存入後就靜靜地躺在資料倉儲中未被使用,使得無法發現資料中隱藏的相互關聯,無法去預測未來的發展趨勢。

由於企業所需與科技技術的發展,利用資料庫技術管理資料與運用人工智慧的方法來分析資料,從而挖掘出隱藏在資料背後的知識,已成為目前深受企業關注的議題。其中,資料探勘(Data Mining)便是商業智慧中的一個最為關鍵的環節。「資料探勘」即是在龐大的資料倉儲中進行分析,進而挖掘出有用的資訊、知識、模型或規則的一種專案流程,其運用範圍可說涵蓋各行各業,製造業便是應用最廣泛的產業之一。

資料探勘的流程

「授人魚,不如授人以漁」。由上述可知,資料探勘乃是從龐大資料庫中找尋有用知識,以提供決策的一種專案流程。因此,在獲得「魚(有用知識)」的背後,真正該了解的是「漁(如何運用一個標準流程)」,因此,資料探勘的流程無形中就變得非常的重要。

根據調查發現,在眾多資料探勘的流程中,CRISP-DM流程(如下圖)是目前公認的、較具影響力之資料探勘流程,而IBM SPSS Modeler 便是將CRISP-DM流程概念融入分析過程之中,以獲得更有效率之資料探勘結果。CRISP-DM流程包含:商業理解(Business Understanding)、資料理解(Data Understanding)、資料準備(Data Preparation)、模型建立(Modeling)、模型評估(Evaluation)及計畫部署(Deployment)六大流程。

製造業分析應用

         製造業的生產管理過程中,隨著業務流程和生產系統會產生大量的資料,而相關部門常運用統計分析與資料探勘技術來解決所面臨的問題,製造業生產管理常見的問題包含統計品質管制、機械設備維護預測分析等,而這些問題皆能透過SPSS系列產品獲得有效的解決。

SPSS身為成熟的商業智慧分析工具,在製造業品質管制中的應用功能包括資料管理、統計分析、趨勢研究、製表繪圖等。SPSS對品質管制的統計分析,是在生產、管理的所有階段借助SPSS系列產品,運用統計方法對產品品質所進行的處理和分析過程。分析方法主要包括:資料的收集和處理、品質指標的描述統計和多元統計、編制統計品質控制圖、實驗設計、抽樣驗收、設備維修預測分析等。

1. 品質分析實驗設計

SPSS的變異數分析(ANOVA)主要用於實驗資料的分析,確定哪些因素水準或組合影響產品的品質特性,從而選出最佳機型、流程或配方等。SPSS的變異數分析工具包括單因子變異數分析(ANOVA)、共變數分析(ANCOVA)、多變量變異數分析(MANOVA)。SPSS的正交(Orthogonal)設計功能,則能有效地提高實驗設計的效率

2. 統計品質管制圖分析

SPSS的品質管制圖模組可以對產品的各個品質指標進行監測和控制,即時掌握到生產過程中品質指標的變化,並立即分析或調整生產過程,使生產線正常運作。

3. 分析影響品質指標的因素

SPSS的強大多元統計功能,還能夠分析出影響品質指標的因素。SPSS的迴歸分析主要用於尋找有關品質特性與不同生產因素之間的關係,以作出統計預測或確定最佳作業條件。迴歸分析主要包括線性迴歸、Probit、 Logit、多變量迴歸、Logistic迴歸、非線性和限制的非線性迴歸(NLR和CNLR)等。

在生產過程中的抽樣資料往往帶有時序性,時間序列技術可以分析資料之間的關係(如自身相關)。時間序列技術包括ARIMA、EXSMOOTH、SEASON、SPECTRA、AREG等,它們是分析產品過程的利器。SPSS提供了從產品設計、生產過程分析到產品品質監控和預測的各種相關工具。

4. 預測產品品質和設備運行狀況

在生產過程中的品質指標歷史資料反映了現有生產線的運行狀況,其中隱含了多種原料的內在品質因素和過程的隨機組合模式。在大量且雜亂的數據裡捕捉重要的生產規律,建立預測模型來提高原材料供應管理水準和過程的優化調整,從而能夠在現有品質管制水準上,進一步提高過程的穩定和產品的品質,並使設備運行在更穩定良好的水準上。