直面大數據
不久前,互聯網巨頭馬云在一封內部郵件中提到的,以控制為出發點的IT時代正在走向激活生產力為目的的DT(Data Technology)數據時代。這不僅僅是技術的升級,更是思想意識的巨大變革,大數據應用已經成為各行各業的前沿領域。作為正向能源互聯網轉型的能源電力行業,大數據時代的到來為能源電力行業的發展帶來了新的機遇,有可能產生革命性的影響。
其實,在能源電力行業,數據的分析利用并非新鮮事物,在油氣領域,地面上的作業者對于地下幾千米處的油氣藏的情況只有通過數據分析才能判斷,在鉆探和開采的過程中,也只能通過過程數據來推測井下情況。在電力領域,由于電力“發輸變配用”系統的緊耦合性和生產消費的即時性,電網公司和管理機構也只能通過各項電網運行數據的分析來解讀電網的運行情況。
但過去能源電力行業的傳統數據分析手段的本質還是統計學分析,總是試圖按照分析者過去的經驗來解讀未知并且多變的世界,總希望用盡可能簡單的模型來歸納現實世界中無比復雜的各種現象。這背后的原因,既有過去數據采集、儲存、分析能力不足的原因,也有傳統統計學本身的巨大瑕疵。傳統統計學的本質其實就是基于過去經驗尋找普適規律,但是知道規律并不代表能預見將來。舉個能源電力行業的例子,風電所適用的空氣動力學的物理規律并不復雜,牛頓力學足以解釋。但要計算整個風場的最佳效率,卻是難上加難。
首先,雖然理論上,如果知道每臺風機的準確布局,就能精確計算出每臺風機的最佳效率。但是由于風場的風機數量眾多,每臺風機除了捕獲風能發電外,對附近的氣流還會產生一定影響,每臺風機都會對后面的風機造成影響,之間所有的影響的疊加實在難以預計,理論上的計算是可行的,但實際中并不方便,這就是多個主體相互影響帶來的復雜性。
其次,由于地表特征、熱蒸汽和天氣變化,地表氣流變幻莫測,因此,風不僅是每天在變化,而是每時每刻都在變化。換句話說,風場這個動力系統對于微小的擾動是非常敏感的,這遠比理想狀態復雜得多。類似這樣的系統,就是非線性的混沌系統,原來遵循簡單規律的有序形態,在某種條件下突然偏離預期的規律性而變成了無序的形態。其實整個自然界包括人類社會到處都是非線性系統,但人類總是希望用線性系統來簡單歸納這個非線性的世界,這其實是人類懶惰和無能的表現,也是人類面對無窮的混沌未知一種自我安慰和自我保護的鴕鳥手段。
過去,整個能源電力價值鏈還算比較簡單,可以用簡單的線性系統來近似模擬真實的非線性系統。但是,未來我們要面對的將是一個無比復雜的能源電力行業,到處都是非線性系統。在油氣領域,傳統油氣生產正在轉向各種勘探開采都十分艱難的非傳統油氣,比如頁巖油氣、海上油氣、甲烷水合物、極地油氣等。在電力領域,波動性極強的各種可再生能源正在全球范圍內代替化石能源和核能,能源消費的隨機性也在迅速增加。此外,由于互聯網和信息通信技術的發展,未來電力整條價值鏈上的所有主體都能夠積極參與互動,這和過去自上而下,消費者完全被動接受電力的電力系統完全不一樣,因此數十億主體之間的互相影響將形成一個超級混沌系統。而這種超級混沌系統的復雜性將讓執著于因果的傳統統計學分析手段完全無能為力。更重要的是,拜互聯網所賜,不僅僅是能源電力價值鏈上各環節正在端到端融合,整個世界各行業之間也正在前所未有的快速融合,整個世界將變成一個數千億智能主體互動的超級混沌系統。面對這種混沌,傳統統計學手段已經力不從心,而關注相關性的大數據手段將是解釋和預測的最佳手段。因此,大數據對于能源電力行業來說,不是個可選項,而是一條邁向下一代能源系統必須的道路。
相對于其他行業,能源電力行業的具有其特殊的數據特點。首先,能源電力行業數據類型繁雜,數據維度多。以配電網為例,不僅包括各節點的電壓、電流、頻率、有功和無功功率等,還包括大量的消費者的能源消費數據。此外,采集的數據既有結構化數據,又有非結構化數據。而且非結構化數據越來越多,包括網絡日志、氣象圖片、地理位置信息等,這些多類型的數據對數據的處理能力提出了更高要求。
其次,能源電力行業價值密度低。由于能源電力數據多為常規性數據,一個風力發電機運行的過程中,在連續不間斷的監控過程中,有用數據可能僅有一兩個,價值密度的高低與數據總量的大小成反比。
另外,能源電力行業對數據處理速度要求高。電力行業要求實時的電力電量大平衡和瞬時性,因此巨量的用電數據和巨量的發電數據,必須在非常快的時間內處理完畢,才能確保整個電力系統的安全和高效。