基于改進k一均值聚類算法的風機振動分析(2)
作者:石家莊風機 日期:2015-8-11 瀏覽:1112
風機廠石家莊風機廠石家莊風機石家莊市風機廠石家莊風機維修石家莊風機銷售
2.2Hurst分析計算方法英國水利學家Hurst在研究尼羅河水位的漲落問題時發現,大多數自然現象,包括河水水位、溫度、降雨、太陽黑子等,不服從布朗運動及高斯分布的特征,而是遵循一種“有偏隨機游動”。分形布朗運動是一個能反映廣泛的自然物體一些不規則運動性質的分形模型,它的數值變化非常復雜,連續但不可導,是一個非平穩過程,對時間和尺度的變化具有自相似性。大量試驗表明,石家莊風機故障振動信號具有非平穩性,因此可以采用分形布朗運動來描述此信號。近似熵的計算實際上是在衡量維數變化時該時間序列中產生新模式的概率的大小。產生新模式的概率越大,序列就越復雜;因此從理論上講,近似熵能夠表征信號的不規則性(復雜性),振動情況越復雜的信號近似熵越大。
文獻[9]指出,近似熵大致相當于維數變化時新模式出現的對數條件概率的均值,因此近似熵的估計對隨機過程和確定性過程都適用。同時,近似熵具有很好的抗噪、抗野點能力。3改進的k一均值聚類算3.1k-均值算法思想1)任意選取樣本中的k個對象為初始聚類中心;2)對于其他對象,根據其與選定的k個聚類中心的距離(相似度),把它們歸類剄最相似的聚類中,并且重新計算所獲聚類的中心;3)如果聚類最小化的目標函數達到精度要求,則聚類中心不移動,算法終止,否則轉到第2步。法.2k-均值算法的改進由于k一均值算法對于初始聚類中心的選取是隨機的,很容易陷入局部最優值,導致分類誤差,所以需要把局部聚類中心移動到更有利于分類的位置-1?。這里定義變形誤差公式為I—S—NEd(叫,z。)]2(10)其中:.S為某一聚類里所有對象與歐式空間中心的距離平方和;N為屬于這一聚類的對象個數;d(側,z。)為這一聚類中心到歐式空間中心z。的距離。定義△M=AI—AD為聚類中心移動準則,其中:盯為移出聚類中心引起的整體變形誤差增大;AD為插入新的聚類中心引起的變形誤差下降。
△M<0時,聚類中心移動可以是整體的變形誤差減小。1)任意選取樣本中的k個對象為初始聚類中心;2)把訓練樣本中每一個對象歸于距離其最近的聚類中,并重新計算聚類中心;3)如果聚類最小化的目標函數達到精度要求,則聚類中心不移動,轉到第4步;4)根據聚類中心移動準則,若有一個聚類中心可以移到更好的位置來減小整體的變形誤差和,則把它轉到更好的位置,然后轉到步驟2,否則停止。
4試驗結果與分析對試驗中采集到的石家莊風機在不同工況下的振動信號,分別提取其時域信號的峰峰值、混沌特性的Hurst指數以及近似熵數據如表1所示。試驗中,對石家莊風機運行中出現的6種工況,提取300個樣本,每種工況為50個樣本,在每種振動信號中選取30組,共180組作為學習樣本,剩余120組作為測試樣本,使用改進的k一均值聚類算法進行分類,當前后兩次迭代的整體變形誤差小于£時,算法終止。這里取k為6,e為10~,改進前、后的k一均值取聚類算法的一些數據對比見表2。從試驗結果可以看出,由于原始的k一均值聚類算法采用隨機選取聚類中心,很容易陷人局部最小值,所以其平均識別率不高;改進的k一均值聚類算法由于采用了移動局部最優聚類中心的步驟,使其分類性能大大提高,穩定性加強,但是由于其算法的復雜度較初始算法高,所以識別時間較改進前要長一些。
5結 論
1)石家莊風機振動信號的峰峰值、Hurst指數和近似熵很好地反應了石家莊風機振動信號的非平穩性、復雜性,是有效的時域信號識別度量參數。
2)改進的k一均值聚類算法用于模式識別的實現步驟較簡單,不需長時間的訓練過程,克服了隨機選取初始聚類中心導致的局部最小值問題,但是由于其算法復雜度高一些,所以分類時間會長一點。
3)試驗證明,基于時域混合特征與改進的k一均值聚類算法相結合的石家莊風機故障診斷方法是可靠的。必須指出的是,上述試驗是在小樣本情況下得到的,如何提高其在大樣本情況下的分類穩定性和正確率是今后研究的關鍵。