<th id="hyge7"></th>

      1. <bdo id="hyge7"><tt id="hyge7"><dl id="hyge7"></dl></tt></bdo>

        關(guān)于我們 | English | 網(wǎng)站地圖

        油氣大模型破局需從三方面發(fā)力

        2024-10-21 09:16:21 科技日報   作者: 劉 合  
        在人工智能技術(shù)日新月異的今天,生成式人工智能的代表——ChatGPT的橫空出世,不僅在短時(shí)間內吸引了全世界關(guān)注的目光,更激發(fā)了各行業(yè)對大型預訓練模型的無(wú)限遐想。油氣行業(yè)作為國民經(jīng)濟的支柱之一,同樣期待它能為油氣勘探、開(kāi)發(fā)帶來(lái)新變革。尤其是隨著(zhù)國內油氣資源品質(zhì)逐步劣質(zhì)化,油氣勘探開(kāi)發(fā)難度逐漸加大,亟須運用新技術(shù)提質(zhì)增效。
         
        油氣大模型應用面臨挑戰
         
        數據、算力和算法是大模型發(fā)展的核心要素。其中,數據是大模型應用的基石,算力是大模型應用的保障,算法是大模型應用的工具。由于油氣行業(yè)具有特殊性,在上述三個(gè)層面,油氣大模型開(kāi)發(fā)都面臨著(zhù)諸多挑戰。
         
        在數據方面,油氣大模型應用面臨數據稀缺、復雜和安全性的挑戰。一是油氣行業(yè)的數據涵蓋了地質(zhì)勘探、鉆井、生產(chǎn)和運輸等多個(gè)環(huán)節,每個(gè)環(huán)節的數據采集都伴隨高昂的成本,樣本數量少且獲取非常困難,采集回的數據還具有多解性和不可驗證性的特點(diǎn)。二是油氣行業(yè)的數據類(lèi)型非常多樣化,處理這些不同種類(lèi)、不同版本、不同結構的數據本身就充滿(mǎn)挑戰。三是大模型需要學(xué)習海量數據,但油氣行業(yè)對數據的安全性和保密性有著(zhù)極高的要求,數據不能上傳公有云,且必須防止泄露,因此普遍存在“數據孤島”問(wèn)題。這一現狀使得如何在保障數據安全前提下,整合分散的數據并訓練行業(yè)基礎模型,成為油氣行業(yè)大模型應用的關(guān)鍵難題。
         
        在算力方面,油氣大模型的訓練和優(yōu)化也面臨著(zhù)算力資源不足的挑戰。大模型的訓練和優(yōu)化通常需要巨大的算力資源,這往往伴隨著(zhù)相當高的投入成本。自建算力中心需要巨額資金投入,而租賃算力又存在數據安全和隱私保護的問(wèn)題。目前,國內油氣行業(yè)僅具備有限的微調算力,普遍不具備訓練行業(yè)基礎模型所需的高水平算力。此外,由于各種原因,國內油氣行業(yè)在短期內很難建立起滿(mǎn)足大模型需求的算力資源。這一問(wèn)題進(jìn)一步加劇了算力資源的短缺,使得大模型的應用和發(fā)展受到嚴重制約。
         
        在算法方面,油氣大模型也面臨版權糾紛等挑戰。算法的優(yōu)劣直接影響大模型的實(shí)際應用效果。相較于傳統深度學(xué)習等算法,大模型的技術(shù)門(mén)檻更高,目前的發(fā)展主要依賴(lài)少數高端算法人才推動(dòng)。盡管許多開(kāi)源大模型算法可以作為研發(fā)基礎,但它們可能缺乏必要的技術(shù)支持和安全保障,存在商業(yè)機密泄露的風(fēng)險,且其能力往往不如閉源算法。此外,開(kāi)源算法的版權協(xié)議中存在諸多限制條款,使得基于開(kāi)源算法進(jìn)行研發(fā)時(shí)可能面臨版權糾紛。如果選擇使用閉源算法,則難以實(shí)現核心算法的自主可控。
         
        從數據、算力和算法入手推動(dòng)大模型應用
         
        油氣大模型應用并非坦途,需要在數據、算力和算法等方面破局。
         
        首先,數據之困需破冰。面對數據采集高成本與復雜性并存的挑戰,破解數據之困,要以大模型應用為契機,推動(dòng)數據治理,確保數據的全面性、準確性和時(shí)效性。油氣行業(yè)在大模型方面的核心競爭力是“行業(yè)數據”,要做好“訓練樣本庫”的基本功。油氣企業(yè)必須強化數據全生命周期管理,從數據源頭、數據采集、數據清洗、數據融合和匹配、數據完整性增強、數據標注等環(huán)節嚴格規范,建立高質(zhì)量的訓練樣本庫,提升數據治理能力,為模型提供堅實(shí)的數據基礎。同時(shí),應通過(guò)數據脫敏、數據加密、訪(fǎng)問(wèn)控制和審計、合規性審查等方式加強數據安全和隱私性保護。如設置合適的權限和用戶(hù)角色,限制用戶(hù)對數據庫的訪(fǎng)問(wèn)和操作,保護數據的安全性。還需進(jìn)行數據庫的維護和優(yōu)化工作,包括定期備份、數據清理、性能監控等。在此前提下,構建一批高質(zhì)量開(kāi)源數據集,推動(dòng)油氣大模型研發(fā)生態(tài)建設。
         
        其次,算力建設應靈活。面對資金投入與隱私保護之間平衡的挑戰,破解算力之困,應以油氣大模型為契機,推動(dòng)融合算力建設??刹扇∽赓U與自建相結合的方式,注重智算能力建設的同時(shí),加強數據安全與隱私保護。例如,企業(yè)應根據自身業(yè)務(wù)需求、成本預算和技術(shù)實(shí)力,靈活選擇算力獲取方式。對于常規的計算任務(wù),可通過(guò)租賃公有云資源快速響應;而對于涉及敏感數據或需長(cháng)期穩定運行的任務(wù),則可考慮自建或合作共建數據中心,確保數據安全與算力的可持續供給。在算力設施規劃上,應注重長(cháng)遠,實(shí)現通用計算、智能計算和高性能計算的融合布局,通用計算滿(mǎn)足日常運營(yíng)的基本計算需求,智能計算側重于深度學(xué)習、機器學(xué)習等智能算法的高效執行,高性能計算則針對大規??茖W(xué)計算和復雜模擬,滿(mǎn)足不同場(chǎng)景的需求,顯著(zhù)提高算力資源的利用效率。
         
        此外,算法創(chuàng )新勿盲從。面對大模型訓練周期長(cháng)與迭代速度快的雙重考驗,破解算法之困,應量身定做適合行業(yè)特性的算法模型,避免盲目跟風(fēng)。應理性認識大模型的價(jià)值,優(yōu)先實(shí)施場(chǎng)景模型和數據質(zhì)量?jì)?yōu)良的L2行業(yè)基礎模型,重點(diǎn)應放在微調和適配下游任務(wù)上,避免盲目投入通用基礎模型的研發(fā),確保技術(shù)棧的自主可控。油氣行業(yè)應秉持資源優(yōu)化配置的原則,聚焦油氣主營(yíng)業(yè)務(wù),從投入成本、產(chǎn)出效益、技術(shù)成熟度,以及穩定性、行業(yè)聚焦、核心競爭力等方面慎重考慮。在巖心分析、地震資料處理解釋、測井數據分析等特定領(lǐng)域,大模型能發(fā)揮顯著(zhù)作用,但不可過(guò)度依賴(lài),應明確模型的適用范圍。
         
        為了推動(dòng)大模型技術(shù)的自主可控,還需加強“AI+能源”復合團隊的建設。訓練、應用大模型不能閉門(mén)造車(chē),要打破傳統行業(yè)壁壘,注重聯(lián)合研發(fā)生態(tài)的建設,例如推動(dòng)油氣行業(yè)與互聯(lián)網(wǎng)企業(yè)、高校等的合作,促進(jìn)跨學(xué)科人才整合,形成產(chǎn)學(xué)研用緊密結合的創(chuàng )新體系,為油氣大模型應用構建可持續的人才保障。同時(shí),可通過(guò)項目合作、人才培養、共建研發(fā)平臺等方式加強大模型算法等方面的合作交流,并明確合作目標與分工,以及知識產(chǎn)權分配與管理、數據保密和隱私保護等制度和規范。
         
        大模型必將推動(dòng)油氣行業(yè)新質(zhì)生產(chǎn)力發(fā)展,未來(lái)可期,但道阻且長(cháng)。油氣行業(yè)要充分認識油氣大模型的特殊性,從數據、算力、算法等方面做好工作,穩扎穩打,逐步推進(jìn),讓AI成為推動(dòng)油氣行業(yè)轉型升級的重要驅動(dòng)力。
         
        (作者系中國工程院院士、中國石油勘探開(kāi)發(fā)研究院正高級工程師)



        責任編輯: 江曉蓓

        標簽:油氣大模型

        久久99r66热这里有精品 99久久99久久久精品 久久久亚洲精品不卡 亚洲午夜久久久久精品
        <th id="hyge7"></th>

          1. <bdo id="hyge7"><tt id="hyge7"><dl id="hyge7"></dl></tt></bdo>