當前,我國新能源產(chǎn)業(yè)正在逐漸推進能源生產(chǎn)和消費方式革命,構建清潔低碳、安全高效的能源體系成為我國經(jīng)濟社會轉型發(fā)展的迫切需要。
“工業(yè)智能技術正在加速風電行業(yè)智能化建設?!比涨?,北京天澤智云科技有限公司技術研發(fā)副總裁金超博士在接受科技日報記者的采訪時表示,風電智能化有三個重要的參考要素。
數(shù)據(jù)來源與質量管理
金超強調(diào),要結合風電領域知識,對數(shù)據(jù)的來源跟質量進行管理,選擇那些對工業(yè)智能建模有作用的數(shù)據(jù),才是最有價值的。
“這不僅僅適用于風電,任何一個做智能化轉型的行業(yè),采用數(shù)據(jù)驅動的方式,最終目的都是要將人的決策過程自動化。也就是說,我們所理解的數(shù)據(jù)驅動的工業(yè)智能,是要將‘以前要靠人去不同的數(shù)據(jù)系統(tǒng)里整合信息、內(nèi)化成知識、最后形成決策’這樣一條鏈路自動化。”金超說。
除了對數(shù)據(jù)的量和來源進行管理之外,對數(shù)據(jù)質量的管理也很重要。金超認為,數(shù)據(jù)的質量,大概可以分為三類問題:第一類是通用的數(shù)據(jù)質量問題,比如奇異值、缺失值、超限值等。第二類是跟行業(yè)相關的,比如有的工況不滿足分析目標,要對工況做修正。第三類是跟建模相關的,如樣本不平衡、標簽缺乏等。
數(shù)據(jù)質量對數(shù)據(jù)驅動的模型效果非常重要,提前獲得足量、高質量、能代表所建模型對象行為的數(shù)據(jù),是保證模型效果的必要條件。但是,在現(xiàn)場獲取的數(shù)據(jù)的質量,通常都達不到理想狀態(tài)。而利用數(shù)據(jù)質量不佳的數(shù)據(jù)訓練得到的模型,效果也不會很好。
金超舉例說:“在做發(fā)電機軸承溫度異常預警功能時,我們并沒有大量的有標簽的歷史數(shù)據(jù)。根據(jù)我們能獲取的軸承溫度、環(huán)境溫度、功率、風速等信號,利用能量守恒建立微分方程,通過估計參數(shù)來建立‘正常行為’模型,再與當下的狀態(tài)做比對,根據(jù)殘差的分布偏移來判斷異常,以此來彌補歷史數(shù)據(jù)標簽的不足。這就是我們通常采用的一個原則‘數(shù)據(jù)不夠,機理來湊’。當融入機理之后,一是不需要大量的訓練數(shù)據(jù),原來一個月的訓練數(shù)據(jù),現(xiàn)在7天就夠了;二是對外部環(huán)境的敏感度有所降低,受工況影響也變??;三是根據(jù)機理設計的被估計參數(shù),讓整個模型的可解釋性也變得更強?!?/p>
模型也需要全生命周期管理
“因此在工業(yè)智能建模的時候,模型的選擇不一定只用數(shù)據(jù)驅動的模型。考慮選擇什么樣的建模方式,應從數(shù)據(jù)和機理兩個角度來考慮?!苯鸪f。
當數(shù)據(jù)比較少,同時對建模對象理解不夠深時,更多依賴于經(jīng)驗或者需要做一些實驗。在數(shù)據(jù)比較少,機理很強時,比如典型旋轉類設備的智能診斷,可以基于機理來做分析,并且基于規(guī)則來做到預警。對于機理比較弱,但是數(shù)據(jù)很多的情況,就可以發(fā)揮數(shù)據(jù)驅動的模型優(yōu)勢,去彌補對機理認知的不足。當數(shù)據(jù)足夠,并且機理也很強時,我們更傾向于去做機理跟數(shù)據(jù)融合的模型,因為往往這樣的模型可解釋性更強,對于外部環(huán)境的變化也更加不敏感。
“通過我們和信通院合作舉辦的工業(yè)大數(shù)據(jù)創(chuàng)新競賽來看,也印證了這樣的思維方式。在第三屆工業(yè)大數(shù)據(jù)創(chuàng)新競賽的化工設備故障程度預測問題,第一名利用了傳統(tǒng)的振動分析,加上LightGBM機器學習,取得了非常高的分數(shù)。我們后來得知,第一名的選手是機械工程背景,對旋轉類設備的分析很在行。但第二名利用GAN這樣的非監(jiān)督式深度學習方法,也達到了類似的效果。第二名采用的思路尤其引起我們的興趣:將振動信號的分析轉化為類圖像問題,利用計算機科學在圖像領域的突破性技術和思想,來解決工業(yè)里面的非圖像數(shù)據(jù)問題。這個提醒我們,在數(shù)據(jù)量足夠的時候,數(shù)據(jù)驅動的方法,是可能彌補一些我們對機理了解的不充分的?!苯鸪f,“無論是哪次競賽,我們發(fā)現(xiàn)與我們的經(jīng)驗一致,機理和數(shù)據(jù)驅動相結合的方式,效果往往都比較好。”
一個模型的誕生就像嬰兒一樣,成長的過程中需要接受教育、做練習題,最終畢業(yè),成人。模型類似,也要通過不斷的跟領域知識磨合和融入,在能夠采集更多樣本的情況下不斷迭代,最終才能形成一個比較成熟的模型。
“因此,我們需要一個基礎設施,能夠對模型的全生命周期進行管理?;谶@樣的理念,我們開發(fā)了一套完整的工業(yè)智能模型研發(fā)平臺,從算法的設計、探索、驗證,以及監(jiān)控和部署,形成一套完整的閉環(huán)。通過這樣的一個工業(yè)智能模型研發(fā)平臺,有效地解決了工業(yè)領域常常談到的‘建模難、用模難、管模難’的問題,極大提升了模型的研發(fā)效率、降低了維護成本?!?金超說。
智能化落地是跨領域跨技術的系統(tǒng)工程
在落地工業(yè)智能的時候,除了數(shù)據(jù)跟模型這兩個要素之外,還有系統(tǒng)工程能力。也就是,如何能夠把分析技術(AT),數(shù)據(jù)技術(DT),平臺技術(PT)以及運維技術(OT)這四類整合起來。
“在DT層,即數(shù)據(jù)技術這一端,要能實現(xiàn)設備的物聯(lián)以及邊緣計算,將孤島系統(tǒng)中的數(shù)據(jù)統(tǒng)一管理。在AT層,需要對模型的建立、管理、部署和服務化都進行全面的管控。最后跟信息系統(tǒng)以及運維系統(tǒng)形成融合。從DT到OT的工業(yè)智能系統(tǒng),模型只是AT層的一小部分。系統(tǒng)建立起來,才是工業(yè)智能服務的開始。從數(shù)據(jù)到業(yè)務的閉環(huán)、不斷積累企業(yè)自己的知識資產(chǎn),才是運營一個工業(yè)智能系統(tǒng)最需要關注的,而非僅僅建模?!苯鸪f。