7月28日,「諦聽」地震波大模型在四川成都發(fā)布,該大模型由國(guó)家超級(jí)計(jì)算成都中心、中國(guó)地震局地球物理研究所以及清華大學(xué)聯(lián)合開發(fā),是首個(gè)億級(jí)參數(shù)量的地震波大模型。
成都超算中心運(yùn)營(yíng)管理有限公司董事長(zhǎng)郭黎介紹,2023年9月,國(guó)家超級(jí)計(jì)算成都中心與中國(guó)地震局地球物理研究所合作共建了「地震大模型創(chuàng)新應(yīng)用聯(lián)合實(shí)驗(yàn)室」,與清華大學(xué)、中國(guó)科學(xué)院地質(zhì)與地球物理研究所合作啟動(dòng)了「諦聽」地震波大模型的訓(xùn)練。「諦聽」數(shù)據(jù)集是國(guó)內(nèi)首個(gè),也是目前國(guó)內(nèi)外最大規(guī)模、樣本類型和標(biāo)註最為全面的地震學(xué)專業(yè)AI訓(xùn)練數(shù)據(jù)集之一,半年多時(shí)間裏,實(shí)驗(yàn)室研究人員利用「諦聽」數(shù)據(jù)集獲得了首個(gè)億級(jí)參數(shù)量的地震波大模型。
「長(zhǎng)期來看,地震學(xué)是一門觀測(cè)科學(xué),重大突破往往來自對(duì)觀測(cè)數(shù)據(jù)的深刻理解。」中國(guó)地震局地球物理研究所副所長(zhǎng)陳石介紹,目前,傳統(tǒng)方法和中小模型均無法充分利用百TB、千TB級(jí)別的地震觀測(cè)數(shù)據(jù),而這些數(shù)據(jù)對(duì)地震學(xué)研究有重要意義,只有通過大模型才能深入挖掘。
「『諦聽』大模型依托海量數(shù)據(jù),通過先進(jìn)的人工智能技術(shù),已經(jīng)顯著提升了地震信號(hào)的識(shí)別準(zhǔn)確率和速度。」陳石說。
國(guó)家超算成都中心常務(wù)副主任王建波介紹,「諦聽」地震波大模型對(duì)於突破中小地震波模型性能瓶頸,提高地震大數(shù)據(jù)智能處理能力和信息挖掘水平具有重要意義,國(guó)家超算成都中心正不斷加速人工智能技術(shù)在防災(zāi)減災(zāi)、智慧城市等領(lǐng)域的應(yīng)用與發(fā)展。據(jù)了解,目前「諦聽」地震波大模型已可投入使用,十億參數(shù)量級(jí)的版本預(yù)計(jì)2024年8月完成預(yù)訓(xùn)練。未來,該大模型還可用於礦震監(jiān)測(cè)、城市地下空間結(jié)構(gòu)探測(cè)、海底地震監(jiān)測(cè)等多個(gè)領(lǐng)域。(圖為資料圖)