您的瀏覽器不支持JavaScript,請開啟后繼續

China Heating,Ventilation and Air Conditioning
聯系熱線:010-64693287 / 010-64693285

融入人員數據的辦公建筑能耗預測方法研究

  • 作者:
  • 中國暖通空調網
  • 發布時間:
  • 2021-09-01

連會會 , 姬穎 , 牛夢涵
北京工業大學北京市綠色建筑環境與節能技術重點實驗室,北京工業大學城市建設學部

        【摘  要】隨著數據采集、存儲成本的降低和數據挖掘研究的發展,揭示建筑運行能耗特征和節能潛力的預測方法越來越受到關注。本研究采用單連接聚類法對時間變量進行類別劃分,提高模型精度;采用長短期記憶神經網絡(Long Short-term Memory, LSTM)算法,構建了辦公建筑的逐時能耗預測模型,應用于上海市一棟實際辦公建筑,并對比了有無人員數據兩種情況下的模型預測精度;結果表明,加入人員數據的模型預測結果顯著改善,誤差由11.24%降為8.78%。

        【關鍵詞】逐時能耗;人員數據;單連接聚類,LSTM

        【基金編號】國家自然科學基金青年項目(51908006)

1 背景意義

        隨著生活水平的不斷改善和環境問題的日益凸顯,人們對室內環境質量要求越來越高,建筑能耗持續攀升。統計顯示,建筑運行能耗占全國能源消費總量的21.7%[1]。大型公共建筑單位面積能耗達到70-300kWh/m2,是居住建筑的10~20倍[2]。公共建筑節能備受關注,國內外建筑能耗預測研究工作隨之增多[3,4]。對于辦公建筑而言,使用者的數量和活動類型,會影響建筑的內部增益,進而影響系統能源使用的模式。因此,人員參數成為建筑能耗預測的一個重要特征[5]。Zhang和Delzendeh等人的研究表明,能耗的預測值與實際值之間存在很大差異,人員參數是造成這一現象的主要因素[6,7]。趙海湉[8]等人從室內外環境、人員、能耗等數據中提取關鍵特征規律,利用ARIMA模型,對建筑能耗進行預測,得到人員參數對于建筑能耗預測精度提升最為顯著。Ying等人[9]的研究中,人員數量也是能耗預測模型的輸入變量。Wei等人[10]的研究表明,在辦公建筑能耗預測中,人員數量信息有時甚至比氣象信息更重要。本研究對逐時人員數據對辦公建筑能耗預測精度的影響進行定量研究。

        常用預測方法有回歸分析法[11]、時間序列分析法[12]、人工智能方法[13]等?;貧w分析法需要歷史數據樣本量大,建立能耗與各影響因素間的回歸函數,由于影響因素種類多且復雜,往往很難構建出合適的函數,且預測精度受樣本量的影響較大。時間序列法所需數據種類相對要少,計算速度快,容易忽視時間以外的其他因素的影響[14]。以上兩種方法都很難兼顧時序性和非線性的特點。因此,本文選取長短期記憶神經網絡(Long Short-term Memory, LSTM)模型對能耗進行預測,該模型不僅可以像普通神經網絡一樣學習復雜數據之間的非線性規律,還兼具時序性特征,能夠選擇性地保留歷史數據中的有用信息,丟棄無用信息,使得預測結果更加準確、可靠[4]。

        本研究為提高模型的準確性,采用單連接聚類法,分析和確定了辦公建筑能耗預測模型中星期類型的劃分方式;針對目前研究存在的問題,在有無逐時人員數據條件下分別對公共建筑能耗進行預測,并采用皮爾遜相關系數法,探討加入人員變量的預測影響。

2 研究方法

        本研究采用單連接聚類方法,對輸入的時間變量進行類別劃分;分別選取有無人員數據的兩組輸入變量,采用LSTM算法進行模型的建立和驗證,完成能耗預測并對比兩種不同輸入變量下的預測精度。模型建立和驗證基于Python中的Keras和TensorFlow 庫實現。以上海市實際建筑數據為例,應用上述預測模型及分析方法展開研究。

        2.1 預測模型的建立和評價

        2.1.1 預測模型的建立方法

        LSTM最初是由HOCHREITER和SCHMIDHUBER (1997)提出[15],并被GRAVES進行了改良和推廣[16]。在RNN神經網絡(Recurrent Neural Network)設計中引入了自循環,這是LSTM神經網絡核心。同時其相對于RNN而言的一個關鍵的擴展是其自循環的權重不是固定的,可以根據上下文進行改變。此外,還通過門控制此自循環的權重,累計的時間尺度也會動態的發生變化[17]。


圖1 LSTM 神經元典型結構[18]

        圖1(a)所示,在這個神經元典型結構中有3個門結構,分別是輸入門(input gate)、輸出門(output gate)、遺忘門(forget gate)。在LSTM中,第一步通過遺忘門來決定我們會從細胞狀態中丟棄什么信息;第二步在輸入門中確定什么樣的新信息會被放在細胞狀態中;第三步在輸出門中確定要輸出的值。圖1(b),是用來決定什么信息可以通過cell state。這個決定由“forget gate”層通過sigmoid來控制,它會根據上一時刻的輸出和當前輸入來產生一個0到1 的值,來決定是否讓上一時刻學到的信息通過或部分通過。圖1(c),是產生我們需要更新的新信息。這一步包含兩部分,第一個是一個“input gate”層通過sigmoid來決定哪些值用來更新,第二個是一個tanh層用來生成新的候選值,它作為當前層產生的候選值可能會添加到cell state中。圖1(d),把一二步結合起來就是丟掉不需要的信息,添加新信息的過程。圖1(e),是決定模型的輸出,首先是通過sigmoid層來得到一個初始輸出,然后使用tanh將值縮放到-1到1間,再與sigmoid得到的輸出逐對相乘,從而得到模型的輸出[19]。

     

        公式(1)到(6)表示LSTM的全過程,t為時間點;it為輸入門;ft為遺忘門;ot為輸出門;ht為當前時刻神經元內部狀態; Ct為當前時刻外部狀態;xt為當前時刻外部輸入;W為權重矩陣;b為偏差矩陣;tanh、σ為激活層函數。

        2.1.3預測效果的評價方法

        為了評估模型的性能[9],本研究使用了兩個指標來比較結果的準確性:平均相對誤差(MRE-Mean Relative Error)和均方根誤差 (Mean Square Error)。

            

        式中,PA和PF分別為實際能耗值和預測能耗值,N是能耗數據的個數。

        本研究采用在預測分析中使用較為廣泛的均方誤差作為模型擬合結果的判斷依據,平均相對誤差作為各種方法預測效果的判斷根據。

        2.2 變量選取

        能耗以年、月、周、日等不同時間為周期所呈現出來的變化規律是其內在規律;外在規律主要是指溫度、濕度、太陽輻射量等客觀隨機因素對能耗曲線的影響;而人是辦公建筑中能耗消耗的主體,辦公建筑內,設備的功率及人員的工作時間變化對大型公共建筑能耗的影響越來越大。故根據現有的實際數據,設置了九個輸入變量:時間參數——月、日、星期、星期類型、時;氣象參數——溫度、相對濕度、太陽輻射量;人員數據。本研究旨在預測辦公建筑的動態能耗,因此輸出變量為逐時能耗數據。

        2.3 星期類型的劃分

        通過對歷史數據分析,發現日類型因素對能耗變化有重要影響,日類型包括特殊日、周六、周日和工作日等,一般情況下,周末和節假日的能耗明顯不同于工作日的能耗[20]。因此本研究對不同星期類型進行劃分。   

        聚類分析是數據挖掘中的一項重要技術,它能夠快速地分析數據并提取有效信息,將對象分為多個類別或簇,使其在同一個類別中的數據對象之間具有較高的相似度,而不同類別中的數據對象具有很大的差異。用該方法對樣本能耗數據進行分類,不需要提前確定具體的分類標準,可以實現自動分類[21]。該方法原理簡單,計算速度快,分類效果好。因此本研究通過分析歷史日均能耗值,根據數據呈現的特點,采用單鏈接聚類法(最短距離法)對每周進行星期類型劃分,將劃分結果作為模型輸入值,可簡化預測模型。

3 案例研究

        3.1案例介紹

        本研究選取上海市某辦公建筑為案例建筑,建筑面積29000m2,選取該建筑2013年的運行數據和氣象數據作為模型建立與驗證的數據源,包括時間參數;逐時能耗數據;逐時人員數據;室外溫、濕度、輻射等數據。

        3.2 輸入輸出變量的選取

        綜合能耗預測的影響因素和現有的實際數據,設置了2.2中描述的九個輸入變量。為探討人員變量對預測結果的影響,設置兩組不同的輸入變量:一組為時間參數和氣象參數八個輸入變量;另一組為時間參數、氣象參數及人員數據九個變量。本研究旨在預測辦公建筑的動態能耗,因此輸出變量為逐時能耗數據。

        3.3 星期類型的劃分

        從數據源中,選取6月24日-8月18日共8周的逐時能耗數據建立模型,該8周辦公建筑逐時能耗數據如下圖2所示。

        從圖2中看出,能耗具有按天和按周的周期性變化特點。計算得出能耗數據的日均值,將8周的日均值繪制于圖3??梢钥闯鲛k公建筑每周的能耗變化大致呈現出相同的特性,但每周周一到周五的日均能耗不同是因為室外氣溫不同。在6月24日-6月30日,該周室外氣溫在22℃~25℃之間,辦公人員開啟空調數較少,因此這周能耗低于其他周。


圖2 辦公建筑逐時能耗數據                      圖3 辦公建筑能耗日均值

        用單鏈接聚類對日均能耗數據進行聚類分析,應用R軟件進行計算,結果如圖4所示。圖中橫坐標為6月24日-8月18日每日序號,從號碼1至號碼56分別代表8周的56天,由于按照整工作周來選取建立模型所需的數據量,因此號碼對應的星期如圖5所示。


圖4 辦公建筑能耗日均值聚類分析結果                 圖5 號碼對應周與星期

        由圖4可以看出,聚類分析將8周的56天分為兩大類,將第二大類又分成了兩小類。第一大類共有11天,其中有8天為周六;第二大類中的第二小類(右側)共有10天,其中有5天為周日,其余5天為第一周的周一至周五,這是由于第一周的日均能耗受室外溫度影響與其余5天周日的日均能耗在相似的水平;另一類為周一到周五混合。因此將辦公建筑的星期類型分為三類:工作日、周六、周日。該結果也明顯符合圖2和圖3中工作日的能耗較高,周末能耗較低的情形。這是因為辦公建筑功能單一,其能耗產生變化主要是由于建筑內人員的上班時間和活動規律導致的波動,因此其主要功能在工作日使用,周末可能有個別人員需要加班,使用率大大下降。并且周六與周日的能耗特性也不盡相同,可以看出在7-8月的時候周日能耗普遍遠遠大于周六的能耗,又明顯低于工作日的能耗。此外,對同星期類型日而言,能耗特性呈現出較高的相似性。且在6-8月這段時間內無法定節假日,因此本研究只考慮夏季高溫時段的正常日,不考慮節假日情形。因為辦公建筑能耗特性分為工作日、周六、周日三種類型,在建立神經網絡模型時,輸入層輸入值分別定為1、2、3。

        3.4 模型的建立和驗證

        3.4.1預測模型的建立

        LSTM模型的算法實現,如圖6所示。由于各變量之間尺度差別不大,在進行數據預處理時,未對輸入變量進行歸一化處理。


圖6  LSTM預測流程

        3.4.2 無人員變量的LSTM預測結果 

        從2013年辦公建筑數據源中選取6月24日-8月18日共8周的逐時能耗數據和除人員數據以外的8個變量來訓練模型。建立夏季高溫日辦公建筑逐時能耗模型如圖7所示,均方誤差值RMSE為50.43,模型擬合效果好。

        用訓練好的模型對8月19日-9月15日共4周的辦公建筑逐時能耗進行預測,與實測的逐時能耗數據進行對比,驗證能耗預測模型的擬合度,預測效果如圖8所示。


圖7 無人員變量辦公建筑逐時能耗模型擬合結果   圖8 無人員變量辦公建筑逐時能耗模型預測結果

        由圖8可以看出,逐時能耗預測模型的擬合效果較好,其中工作日的擬合曲線精度較高,而周末的預測結果,趨勢上較為接近,但日均能耗波動較大,從而使預測結果有偏差,辦公建筑模擬預測結果的整體平均相對誤差為11.24%。下面進一步分析各星期類型的預測精度。表1為不同星期類型平均預測精度比較。從表1可以看出,LSTM神經網絡預測模型對于不同星期類型的能耗預測結果有較大差異,其中對于類型1工作日的預測精度比較高,可以控制在10%左右。其次為周六,而對周日的預測結果相對誤較大。這是由于辦公建筑,工作日的使用情況比較穩定,而周末,辦公建筑的能耗波動主要取決于加班等人行為因素,并未考慮到本模型的建模當中,因此對于辦公建筑周末的預測結果較差。

表1 辦公建筑不同星期類型平均預測精度比較

        3.4.3 有人員變量的LSTM 預測結果 

        在上述基礎加入人員數據,建立夏季高溫日辦公建筑逐時能耗模型,均方誤差值RMSE為43.24,模型擬合效果提升,如圖9所示。同樣對8月19日-9月15日共4周的辦公建筑逐時能耗進行預測,并與實測的逐時能耗數據進行對比,預測結果如圖所10示。


圖9 有人員變量辦公建筑逐時能耗模型擬合結果    圖10 有人員變量辦公建筑逐時能耗模型預測結果

        由圖10可以看出,在加入人員變量之后,逐時能耗預測模型的擬合效果更好,其中工作日的擬合曲線精度變高,周末的預測結果明顯變好。表2為加入人員數據不同星期型平均預測精度比較,可以看出,在加入人員變量之后,工作日預測模型精度在8.78%左右,整體相對誤差都小于10%。

表2 加入人員變量后不同星期類型平均預測精度比較

        3.5 預測結果對比分析

        為解釋為何加入人員變量后周末預測效果顯著提升,我們把8月19日-9月15日共4周的辦公建筑逐時能耗做時均處理,將逐時人員數據也做時均處理,得到11圖,可以看出,在一天中,工作日時均人員數據與時均能耗數據的分布相似,周六到周日這種相似性減弱。


圖11  能耗和人員數據的時均曲線   

        采用皮爾遜相關系數法,應用SPSS,將不同星期類型的時均人員數據與時均能耗數據做相關性分析,得到表3??梢钥闯?,時均人員數據與時均能耗呈現正相關,且相關性顯著。在工作日1,相關性最顯著;周六2、周日3相關性顯著變弱。說明了辦公建筑時間數據包含了人員數據對能耗預測的影響,由于工作日的使用情況比較穩定,周末人員少且變動不穩定,這種包含關系從工作日到周日依次變弱。      

表3 時均能耗與不同星期類型時均人員數據的相關性分析

        **.在0.05級別(雙尾),相關性顯著; *.在0.01級別(雙尾),相關性顯著。

4 結論

        本研究采用單連接聚類分析的方法,確定了辦公建筑能耗預測模型中星期類型的劃分方式,分為工作日、周六、周日三種類型,提高了能耗預測模型的預測精度。應用長短期記憶神經網絡模型對辦公建筑逐時能耗進行預測,對比分析有無人員變量的預測結果,加入人員變量后,預測結果的相對誤差由11.24%降為8.78%;工作日,相對誤差由10.19%降為8.78%;周六,相對誤差由11.9%降為8.26%;周日,相對誤差由15.81%降為9.29%,加入人員變量后,預測精度明顯變好。將逐時人員數據與逐時能耗數據進行相關性分析,工作日的相關性最顯著,周六、周日相關性變弱。

參考文獻

        [1] 中國建筑節能協會能耗專委會.《中國建筑能耗研究報告(2020)》. 2020.
        [2] 豐艷萍,武涌. 節能運行監管—我國大型公共建筑節能管理的必然選擇[J]. 暖通空調,2007,37(8): 8-12.
        [3] Safa Mjccd,Safa Mahdi,Allen Jeremy. Improving sustainable office building operation by using historical data and linear models to predict energy usage[J]. Sustain able Cities and Society,2017,29:107-117.
        [4] 廖文強, 王江宇, 陳煥新,等.基于長短期記憶神經網絡的暖通空調系統能耗預測[J].制冷技術,2019,39(1):45-50,54.
        [5] M. Ashouri, F. Haghighat, B.C.M. Fung, H. Yoshino. Development of a ranking procedure for energy performance evaluation of buildings based on occupant behavior, Energy Build, 183 (2019) 659-671. 
        [6] Zhang W, Tan S, Lei Y, et al. Life cycle assessment of a single-family residential building in Canada: a case study [J] . Building Simulation, 2014, 7(4) :429-438.
        [7] Delzendeh E, Wu S, Lee A, et al. The impact of occupants' behaviours on building energy analysis: a research review [J]. Renewable and Sustainable Energy Reviews, 2017, 80: 1061-1071.
        [8] 趙海湉, 王需, 林波榮等. 使用需求參數對建筑大數據能耗預測影響規律初探[J]. 建筑節能, 2020,48(07).
        [9] Sun Y, Haghighat F, Fung B C M. A Review of the-State-of-the-Art in Data-driven Approaches for Building Energy Prediction[J]. Energy and Buildings, 2020, 221:110022.
        [10] Y. Wei, et al, Prediction of occupancy level and energy consumption in office building using blind system identification and neural networks, Appl. Energy 240 (2019) 276-294.
        [11] 周璇, 凡祖兵, 劉國強,等. 基于多元非線性回歸法的商場空調負荷預測[J]. 暖通空調, 2018, 048(003):120-125.
        [12] 歐陽前武, 符亞磊, 任中俊. 基于時間序列分析模型的建筑能耗兩級預測關系研究[J]. 建設科技, 2019(14).
        [13] Fekri M N, Patel H, Grolinger K, et al. Deep learning for load forecasting with smart meter data: Online Adaptive Recurrent Neural Network[J]. Applied Energy, 2021, 282.
        [14] 朱蕓蕓. 基于人工神經網絡模型的區域建筑業態配比方法研究[D]. 北京工業大學, 2020.
        [15] HOCHREITER S, SCHMID HUBER J. Long short-term memory[J]. Neural Computation 1997, 9(8):1735-1780.
        [16] GRAVES A. Generating sequences with recurrent neural networks[DB/OL]. https ://arxivorg/abs/1308 0850,2013.
        [17] 周曉旭. 基于層次聚類的LSTM神經網絡模型在江蘇省降水量預測中的應用[D]. 山東大學, 2020.
        [18] 王激華, 仇鈞, 方云輝,等. 基于深度長短期記憶神經網絡的短期負荷預測[J]. 廣東電力, 2020(8).
        [19] http://colah.github.io/posts/2015-08-Understanding-LSTMs/
        [20] 劉晶, 朱鋒峰, 林輝. 基于相似日負荷修正算法的短期負荷預測[J]. 計算機工程與設計, 2010(06):125-128.
        [21] 李沁, 李百戰, 丁勇. 大型辦公建筑照明及插座系統電耗逐時使用率聚類分析[J]. 土木建筑與環境工程, 2014, 036(005):89-94.

        備注:本文收錄于《建筑環境與能源》2021年4月刊 總第42期(第二十屆全國暖通空調模擬學術年會論文集)。版權歸論文作者所有,任何形式轉載請聯系作者。

美女自卫慰黄网站免费_国产大片91精品免费观看男同_久久www.黄色成人免费不卡_亚洲免费人成在线视频观看