隨著新一波AI浪潮的到來,一場全新的、數(shù)字化的轉型升級正在各行各業(yè)上演。對數(shù)字化進程已行至“深水區(qū)”的石油化工行業(yè)而言,如何借這波浪潮向下“深潛”,推動行業(yè)向高質量發(fā)展轉型,成為業(yè)內專家在日前舉行的2024華為全聯(lián)接大會上深入研討的話題。
“我們需要把常規(guī)的化工知識,還有設計規(guī)則、實驗規(guī)律都結合起來,設計制造化工領域的AI大模型?!敝袊茖W院大連化學物理研究所研究員葉茂說。
自2023年ChatGPT面世起,AI大模型技術在全球興起。大模型的能力和應用快速演進,但對于強知識性、重經驗積累的化工行業(yè)來說,依托現(xiàn)有的通用大模型,設計開發(fā)化工垂直領域的AI模型,仍是行業(yè)擁抱AI的重點。
葉茂認為,現(xiàn)有的通用大模型相當于接受完整通識教育的“高中生”,學習能力很強,什么知識都知道一點,但并不太專業(yè)。而通過知識數(shù)據(jù)訓練的專業(yè)模型就相當于化工專業(yè)的“本科生”,對化工知識的運用能力更強,但還不能直接去工廠或者設計院“上崗”,需要更進一步將專業(yè)模型訓練為在垂直領域應用的智能體模型。
據(jù)介紹,目前中國科學院大連化學物理研究所已經和華為合作開發(fā)出了面向化工工藝流程研發(fā)的智能化工大模型1.0版本,基本能夠實現(xiàn)化工知識的快速檢索、反應動力學的自動生成以及工藝流程的制度化設計,未來還將推出包含三級工廠生成和智能中試系統(tǒng)的2.0版本。
“不是每個企業(yè)都要建設大規(guī)模AI算力,也不是每個企業(yè)都要訓練自己的基礎大模型?!比A為副董事長、輪值董事長徐直軍表示,并非所有的應用都要追求“大”。從華為盤古模型在不同行業(yè)的實踐來看,十億參數(shù)模型可以滿足科學計算、預測決策等業(yè)務場景的需求,比如降雨預測、藥物分子優(yōu)化、工藝參數(shù)預測;而百億參數(shù)模型就可以初步滿足面向自然語言處理(NLP)、計算機視覺(CV)、多模態(tài)的需求,比如在特定領域場景的知識問答、代碼生成、安全檢測。而更加復雜的,面向NLP、多模態(tài)的任務如信貸評估、中樞調度、智能投資顧問等,可以用千億參數(shù)模型來完成。”
他指出,AI服務器特別是AI算力集群,對供電、散熱等數(shù)據(jù)中心機房環(huán)境要求極高,且隨著大模型越來越大,AI算力也將走向更大規(guī)模,而且變化節(jié)奏快。隨著AI服務器快速升級換代,數(shù)據(jù)中心機房面臨要么浪費、要么滿足不了需求的困境。同時,訓練出基礎大模型的關鍵是數(shù)據(jù),而準備足夠多的高質量數(shù)據(jù)是很大挑戰(zhàn)。
“企業(yè)應用場景的多樣性,決定了我們必須構建起多模態(tài)、多尺寸的模型,實現(xiàn)場景與模型的最優(yōu)匹配,滿足企業(yè)對大模型經濟性和專業(yè)性的需求?!比A為常務董事、華為云CEO張平安說。
在實際應用中,通用大模型、專業(yè)大模型、垂直領域大模型并非是簡單的遞進關系,而是需要多種模型互相協(xié)作,構成專業(yè)的智能體“團隊”。
中國化工學會副秘書長胡杰認為,化工行業(yè)實現(xiàn)智能化需要多模態(tài)大模型與專業(yè)模型協(xié)同進化,建立復雜系統(tǒng)在垂直領域的大模型。具體來說,首先是基于大數(shù)據(jù)的智能方法,以自動化策略驅動建立虛擬化學實驗室;然后借助知識蒸餾技術,將大模型的能力傳遞給專業(yè)模型;再利用大語言模型獲取多模態(tài)數(shù)據(jù),利用小科學(專業(yè))模型提高精準性,由大數(shù)據(jù)生成多個專業(yè)模型;最后再由專業(yè)模型作為“教師”,幫助大模型快速收斂。
“我們希望未來能夠通過多個智能體的協(xié)同,承擔開發(fā)和設計工程師的部分功能,快速生成數(shù)字化工廠設計,并與現(xiàn)有的工廠數(shù)據(jù)進行功能對比?;蛘?,通過智能體對數(shù)據(jù)的挖掘和分析,將實體工廠變成數(shù)字化的虛擬工廠。”葉茂說。