科研進(jìn)展
近日,中國科學(xué)院水生生物研究所畢永紅團隊聯(lián)合德國卡爾斯魯厄工學(xué)院(KIT)研發(fā)出基于大數據挖掘和深度學(xué)習的有害藻類(lèi)水華預警系統。相關(guān)論文以封面文章形式發(fā)表在環(huán)境科學(xué)領(lǐng)域權威期刊Environmental Science & Technology。
該研究致力于創(chuàng )建高時(shí)間分辨率的水柱垂向維度有害藻華(HABs)早期預警系統,內容包括創(chuàng )建大數據平臺、采集高時(shí)空分辨率的水生態(tài)環(huán)境大數據、開(kāi)發(fā)自主學(xué)習并能跨時(shí)間點(diǎn)聚類(lèi)捕獲Chl a動(dòng)態(tài)的先進(jìn)聚類(lèi)算法、設計專(zhuān)門(mén)處理復雜多變量時(shí)間序列的預測模型等。具體工作以太湖為研究水域,構建高頻垂直剖面監測系統(VAMS)進(jìn)行水生態(tài)大數據采集,基于大數據開(kāi)發(fā)了具有深度學(xué)習功能的Bloomformer-2模型,通過(guò)“DeepDPM-光譜聚類(lèi)”和Bloomformer-2模型優(yōu)化建模策略,智能識別水柱分層并進(jìn)行不同水深藻類(lèi)生物量的精確預測,將預測結果與世界衛生組織的“警戒級別框架”有機結合,構建了有害藻類(lèi)水華的預警系統。該系統不僅能及時(shí)預測有害藻華的發(fā)生,還能識別出藻華的主要驅動(dòng)因子,提高了藻華的預測能力以及預測模型的環(huán)境適應性,為藻華預警及其防控提供了新的解決方案。
所開(kāi)發(fā)的Bloomformer-2具有時(shí)空多頭自注意力(MHSA)機制,該機制使用了時(shí)間和空間自注意力層的“查詢(xún)”(query)、“關(guān)鍵詞”(key)和“值”(value)輸出,有效綜合了時(shí)間和空間維度;通過(guò)優(yōu)化該機制,可更好進(jìn)行多變量時(shí)間序列預測(TSF)中的上下文學(xué)習。通過(guò)這種時(shí)空多頭自注意力機制,充分識別和提取各種水生態(tài)環(huán)境參數間的時(shí)空相互關(guān)系,用于Chl a的精確預測。
不同于傳統方法,該模型為特定時(shí)間框架內的每個(gè)變量設置了獨特的上下文優(yōu)先級;利用基于Transformer的編碼器-解碼器架構,處理由歷史和目標數據生成的雙時(shí)空序列,整個(gè)過(guò)程包括并行雙序列輸入、時(shí)空嵌入、時(shí)空注意力和效率優(yōu)化。為了闡明Bloomformer-2性能穩健性,本研究使用了LSTM(long short-term memory)作為比較模型。為了幫助識別和優(yōu)化模型,使其在短期和長(cháng)期預測中都能提供準確預測結果,本研究進(jìn)行了單步預測和多步預測,從而更全面地評估模型在不同時(shí)間尺度上的表現和適用性,為不同預測需求提供支持。
該研究證明了預測模型在單步和多步預測中的優(yōu)越性,能準確識別藻華動(dòng)態(tài)的主要驅動(dòng)因素,為提前采取預防措施提供了依據。此外,該系統利用大數據的5Vs特性,顯著(zhù)提高了數據采集的體積、速度、多樣性以及分析數據的價(jià)值,大幅增強了早期預警系統的性能可靠性。未來(lái),將通過(guò)擴大VAMS監測網(wǎng)絡(luò )和增加傳感器進(jìn)一步提升系統的大數據容量和應用范圍,使其更廣泛地應用于HABs監測和預警中。
圖 ?Bloomformer-2模型的單步預測(A)和多步預測(B)結果及其與LSTM預測結果的比較
德國KIT與水生所聯(lián)合培養博士生錢(qián)儆為論文第一作者,論文通訊作者為水生所畢永紅。
論文連接:https://doi.org/10.1021/acs.est.3c03906