您的瀏覽器不支持JavaScript,請開啟后繼續

China Heating,Ventilation and Air Conditioning
聯系熱線:010-64693287 / 010-64693285

一種基于時序頻域分解的負荷預測方法研究

  • 作者:
  • 中國暖通空調網
  • 發布時間:
  • 2021-09-07

湖南大學  李毅  彭晉卿  鄒斌  羅正意 

       【摘  要】準確的建筑能耗預測對建筑能源系統的智能高效運行起著至關重要的作用。為了更好地挖掘海量數據中蘊含的有效信息,提高短期負荷預測精度,針對負荷數據時序性和非線性的特點,本研究基于湖南省某辦公樓的能耗數據,旨在提出一種基于專家知識與機器學習算法集成的短期電力負荷預測模型。該模型通過頻域分解方法將原始數據分解為日周期、周周期、低頻分量和高頻分量四個部分。日周期分量具有較強的周期性,可以直接采用差分整合移動平均自回歸模型(ARIMA)進行預測;低頻分量可以用線性回歸進行預測;對于高頻分量采用集成ENN和長短期記憶神經網絡(LSTM)模型進行預測。實驗結果表明,該方法相比其他先進的單一預測模型有效提高了預測準確率。

       【關鍵詞】時序頻域分解;數據采集;負荷預測;均方根誤差

0  引言

       隨著我國經濟的飛速發展和用戶對建筑舒適性要求的提高,建筑用能需求逐年增加。電力作為最重要的二次能源,在能源系統和全球經濟中起著至關重要的作用。對未來短期電力負荷需求的準確預測不僅能為電網運營商和零售商提供即時電力信息,以制定經濟的發電計劃,優化售電策略,而且有助于終端用戶實現智能高效的建筑能源系統運維[1]。另一方面,隨著數字化進程的加快以及通訊技術的發展,智能電網系統對負荷的采集頻率和數據準確性也不斷提升,為負荷特性分析和負荷預測提供了高質量、海量化的數據集,為短期電力負荷的預測提供了數據基礎。

       能耗數據具有時序性和非線性的特點,并且其受需求波動、人員流動等諸多不確定性因素的影響,給建筑能耗的預測帶來了巨大挑戰。然而,由于其顯著的社會和經濟價值,迄今為止,已經提出了許多模型來解決負荷預測問題,這些模型可以分為兩大類:第一類是機器學習分析方法,其中,神經網絡由于其強大的數據處理能力得到了廣泛應用。Park等人[1]證明了人工神經網絡適合在訓練集的負荷和溫度模式數據之間進行插值,以確定未來的負荷模式。然而,他們的模型在人們有特定開始工作的日期,比如周一,誤差較大,因為他們只利用溫度信息。為了解決這個問題,部分研究者在特征中加入了時間信息,根據工作日模式和周末模式分別建立預測模型[2,3]。此外,許多研究人員試圖將人工神經網絡與其他算法相結合來提高模型性能。Singh等人[4]將進化方法與人工神經網絡相結合,并在2018年用一個連續優化實驗框架對模型進行了驗證。雖然人工神經網絡可以有效描述特征之間的非線性關系,但人工神經網絡是一種點到點的映射,缺少對時序數據相關性的考量,需要人為添加時間特征保證預測精度。

       對于時間序列數據的預測,部分研究者提出時間序列分析方法。其中,長短期記憶神經網絡(LSTM)模型作為一種有效的非線性循環神經網絡,由于其能夠保存歷史信息,兼顧數據的時序性和非線性關系,被廣泛應用于能耗預測領域。孫等人提出了在LSTM模型中選擇有效特征的方法用于負荷消耗預測[5]。Nespoli等人[6]探究了不同特征的數據質量對LSTM負荷預測精度的影響。Hossain等人[7]基于天氣數據和時間特征利用LSTM實現單步提前負荷和多步日間滾動范圍預測,并在2020年取得了比其他機器學習模型更好的性能。LSTM網絡模型雖然可以充分反映輸入數據序列時間中的長期歷史過程,但并不能挖掘非連續數據之間的有效信息和潛在關系。同時,專家知識通常僅用于特征工程,并沒有與機器學習算法完全集成。

       為了將專家知識集成至機器學習預測模型,并進一步提高模型預測精度。本研究基于湖南省設計院某辦公建筑的能耗數據,旨在提出一種基于專家知識與機器學習算法集成的短期電力負荷預測模型。該模型通過頻域分解方法將原始數據分解為日周期、周周期、低頻分量和高頻分量四個部分,并分別研究各個分量的特性,采用相應的預測模型,實驗結果表明,該方法相比其他先進的單一預測模型有效提高了預測精度。

1 時序頻域分解理論

       建筑負荷的無序性為建筑能耗的預測帶來了巨大的挑戰。辦公建筑電力負荷的變化主要受人們生產、生活規律的支配呈現出規律性、季節性和周期性等特性以及氣象等眾多相關因素的影響,因此負荷中必然存在隨機變化的分量?;跁r序頻域分解的負荷分解方法以有限傅里葉分解與重構的形式將負荷序列分解為固定周期分量、無固定周期慢變分解和隨機快變分量,部分負荷分量呈現出一定的周期性。 

       對于任意時間序列(t=1,2,···,N),根據頻域分析方法利用傅里葉變換做如下分解:

         

       式中:a0為直流分量,即序列Xt的均值;N為模型所選用歷史負荷的數量;ai表示時域信號中余弦波的成分;bi為時域信號中正弦波的成分。對Xt做傅里葉分解后,得到彼此正交的諧波信號。利用負荷變化周期性的特性,并根據角頻率ωi和系數ai、bi的大小,可將時間序列Xt分解為如下形式:

       X(t)=a0+D(t)+W(t)+L(t)+H(t)          (2)

       考慮到負荷具有時序性和周期性的特點,將負荷序列Xt分解為a0+D(t)代表日周期分量,W(t)代表周周期分量,L(t)代表慢變分量,也稱為低頻分量,可視為一個平穩的時間序列;H(t)是隨機快變分量,也稱為快變分量,主要體現為負荷變化的隨機性。

2  數據采集及處理

       2.1 數據采集

       在本研究中,建筑能耗預測所采用的數據分為兩部分:一是湖南省某辦公樓2017年1月1日至2020年11月30日近四年的能耗數據,采樣周期為1小時。該辦公樓分為南北兩區,每區均有七層。其中,一至三層的空調主機采用地源熱泵機組,另外四層采用風冷熱泵機組。該辦公樓的配電房在高壓側總進線柜與空調機組變壓器側均安裝有智能電表,地源熱泵機組和風冷熱泵機組的數據分別計量,并將逐時能耗數據通過施耐德平臺可視化。氣象參數由湖南省氣象信息中心提供,參數主要包括逐時溫度、濕度、風速、風向和水平太陽輻射強度。數據采集平臺如圖1所示。為了研究方便,本研究僅對風冷熱泵機組的能耗進行預測。


圖1 數據采集平臺示意圖

       2.2 數據預處理

       在數據采集過程中,原始數據會因傳感器故障或者電網臨時斷路等問題存在異常值和缺失值?;谪摵蓴祿哂羞B續性的假設,我們運用滑動窗口方式發現異常值。與窗口中其他點的距離超過給定閾值的數據點被視為異常值,需要將該樣本刪除,然后通過線性插值的方式補全缺失值。處理部分結果如圖2所示。


圖2(a)未經過異常值處理的原始數據    (b)經過異常值處理的數據

       圖 3為根據頻域分解后的四個分量??梢钥闯觯喝罩芷诜至糠植家幝擅黠@,具有較強的周期性,可以直接根據前一日同一時刻的能耗數據運用差分整合移動平均自回歸模型(ARIMA)進行預測。但是由于該辦公建筑負荷沒有周的周期性,故經過頻域分解后周周期分量為0。低頻分量是一條平滑的曲線,可以運用簡單的線性回歸模型預測。高頻分量波動較大,但是比原始負荷序列平緩。本模型的關鍵為高頻分量的預測。本研究采用集成ENN和LSTM的深度學習模型預測高頻分量。

         
圖3 一周能耗的負荷分解分量示意圖

       建筑能耗預測所用的數據特征具有不同的量綱單位,如果不消除特征之間的量綱影響,那么數量級大的輸入變量將主導建模過程,將導致模型預測結果只受單一或部分變量的影響。因此,需要原始數據集進行數據標準化處理。目前常用的數據標準化處理有離差標準化、標準差標準化兩種處理方法,見表1。

表1 數據標準化處理方法比較

       因為建筑能耗數據集特征值的上下限會隨著時間而發生改變,而且數據集的樣本量足夠大,所以本文采用了基于標準差的方法對特征進行標準化處理。

       2.3 特征數據構建

       特征工程構造得到的數據相關性通過Pearson相關系數r實現量化評價,具體表達式如下:

                 (3)

       式中:為數據集的長度;和代表兩組特征向量。

       根據專家知識并觀察負荷曲線,負荷總是在周六和周一出現變動,即工作日和休息日的轉換引起的負荷變動,由于轉換改變了負荷模式并增加了負荷預測的難度,模型在這些日子的預測誤差易于變大。因此,要預測的日期是星期六還是星期一也作為虛擬變量添加到輸入變量中。工作日負荷模式不同于周六、周日和周一負荷模式,并將周一視為特殊數據。因此,選擇星期六和星期一作為描述日歷效應的輸入特征具有明確的物理意義,這是負荷預測問題的一般準則。根據專家知識,初步確定特征向量包括:氣象參數(溫度、濕度、風速、風向和水平太陽輻射強度、直接太陽輻射強度)、歷史負荷和時間相關的特征(月份、星期、年、日期、時間)。

       下圖為根據Pearson相關系數繪制的特征熱力圖:


圖4 特征向量相關系數矩陣熱圖

       從圖中可以看出:建筑能耗與室外溫度、風速、相對濕度、水平太陽輻射強度等氣象參數和月份、星期等時間特征存在較強的相關性。根據陳卓等人[8]的研究發現,當選用歷史負荷為4天時,能耗預測的誤差較小。因此選擇這些參數作為高頻分量的特征向量。

       2.4 評價指標

       為了評估模型的預測性能,參考國家電網有限公司評價負荷預測指標,本研究選用均方根誤差(Root Mean Square Error,RMSE)指標作為性能指標來檢驗和衡量算法模型的精確度和效果。表達式如式所示。

                           (4)

       式中:m為預測的總次數;yt和分別代表t時刻能耗的真實值和預測值。均方根誤差能夠使真實值與預測值在同一量級,更直觀地展示預測模型的總體效果。

3  模型訓練與結果分析

       3.1 模型訓練

       為了充分利用數據,本研究采用四折交叉驗證方法。將數據樣本均分為四折,每次用其中三折作為訓練集,另外一折作為測試集。以保證模型預測的準確性。

       本研究的日周期分量、周周期分量、低頻分量、高頻分量的預測均基于Keras深度學習工具的 Tensorflow 框架,該框架可以實現在Tensorflow、Theano和CNTK之間進行后端切換,提供高層的神經網絡編程接口。

       對于高頻分量的預測采用了EnLSTM網絡模型,它可以處理時間序列數據。在本實驗中,該網絡模型采用一個包含40個神經元的LSTM層和一個包含20個神經元的完全連接層。為了避免模型過擬合,在LSTM層使用了比率為0.3的Dropout,并且在完全連接層和輸出層之間進行批量歸一化。選用ReLu作為激活函數。模型的超參數采用貝葉斯優化算法進行調整,其基本思想是首選一個對目標函數的先驗分布模型,然后利用后續新獲取到的信息,來不斷優化該猜想模型,使模型越來越接近真實的分布。最終確定該模型的超參數如下:

       ENN的尺寸為100,平滑系數為1,其他超參數均采用默認值。

       3.2 預測結果分析

       運用頻域分解方法和基本框架訓練模型,對各個分量進行預測,然后將各部分的預測值相加即可以得到最終的預測結果,本研究選用一周最終的預測值與實際值的對比如圖5所示。從圖中可以看出最終預測結果與實際值接近,并且該模型的均方根誤差為6.75%。


圖5 預測值與真實值對比情況

       本研究對采用相同網絡框架的ARIMA、LSTM、CNN-LSTM、EnLSTM等先進的深度學習模型進行對比,不同預測模型的相對誤差如表2所示。

表2 不同預測模型的相對誤差對比結果

       結果表明,運用基于頻域分解的負荷預測模型可以從波動較大、毫無規律的能耗曲線中分解出具有周期性規律的分量,方便運用機器學習模型進行短期電力負荷的預測,從而使模型精度得以提高。

4  結論

       本研究針對具有不規律的電力負荷,結合專家知識運用時序頻域分解方法將電力負荷分解為具有規律的日周期分量、周周期分量、低頻分量和高頻分量,并針對各個分量的特性采用不同的預測模型進行預測,進而得到具有較高預測精度的短期電力負荷預測模型。對于波動較大的高頻分量,采用一種集成ENN和LSTM的神經網絡模型,充分考慮了負荷序列的時序性和非線性的特點,整體提高了負荷預測精度。

致謝

       本文得到湖南省科技創新計劃湖湘高層次人次項目(2020RC5003)、住房和城鄉建設部2020年科學技術項目計劃(2020-K-165)和湖南省優秀博士后創新人才(2020RC2017)項目的支持,在此表示感謝!

參考文獻

       [1]  Park DC, El-Sharkawi M, Marks R, Atlas L, Damborg M. Electric load forecasting using an artificial neural network. IEEE Trans Power Syst 1991;6(2):442–9
       [2]  Lusis P , Khalilpour KR , Andrew L , Liebman A . Short-term residential load forecasting: impact of calendar effects and forecast granularity. Appl Energy 2017;205:654–69
       [3] 劉洋,許立雄.適用于海量負荷數據分類的高性能反向傳播神經網絡算法[J].電力系統自動 化,2018,42(21):96-103.DOI: 10.7500/AEPS20171215005.
       [4]  Singh P , Dwivedi P . Integration of new evolutionary approach with artificial neural network for solving short term load forecast problem. Appl Energy 2018;217:537–49
       [5]  Sun G, Jiang C, Wang X, Yang X. Short-term building load forecast based on a data- mining feature selection and LSTM-RNN method. IEEE Trans Electr Electron Eng 2020;15(7):1002–10. doi: 10.1002/tee.23144 .
       [6]  Nespoli A , Ogliari E , Pretto S , Gavazzeni M , Vigani S , Paccanelli F . Data quality analysis in day-ahead load forecast by means of LSTM. In: Proceedings of the IEEE international conference on environment and electrical engineering and IEEE industrial and commercial power systems Europe (EEEIC/I&CPS Europe). IEEE; 2020 .
       [7]  Hossain MS , Mahmood H . Short-term load forecasting using an LSTM neural network. In: Proceedings of the IEEE power and energy conference at Illinois (PECI). IEEE; 2020
       [8]  陳卓,孫龍祥.基于深度學習LSTM網絡的短期電力負荷預測方法[J/OL].[2018-01-01].電 子技術.http://www.cnki. com.cn/Article/CJFDTotal-DZJS201801011.htm.

       備注:本文收錄于《建筑環境與能源》2021年4月刊 總第42期(第二十屆全國暖通空調模擬學術年會論文集)。版權歸論文作者所有,任何形式轉載請聯系作者。

美女自卫慰黄网站免费_国产大片91精品免费观看男同_久久www.黄色成人免费不卡_亚洲免费人成在线视频观看