Top
首頁 > 快訊 >

剛剛,華為重大發(fā)布!

發(fā)布時間:2023-07-07 20:55:50        來源:金融界

“華為的大模型不作詩,只做事”,華為常務董事、華為云CEO張平安在2023年華為開發(fā)者大會上直言。


【資料圖】

7月7日,在華為開發(fā)者大會上,華為正式發(fā)布盤古大模型3.0。與此前發(fā)布的大模型不同,盤古大模型“不為聊天而生”,專注于包括礦山、氣象、金融等不同場景、不同行業(yè)多樣化需求。用張平安的話說就是“我們從來不會將盤古大模型對標ChatGPT”。

今年上半年,國內大模型如雨后春筍般出現(xiàn),令國內AI算力需求陡增在。此次發(fā)布的盤古大模型另一大看點在于底層基于華為昇騰AI算力集群,按照華為方面設想,相較于火遍全球的GPU架構,昇騰AI算力集群希望成為國內AI算力另一極。

不作詩、只做事

“今年上半年,光國內就發(fā)布了86個大模型,這些大模型都有很強對話能力,市場也在疑惑,華為的大模型在哪里?”張平安在開發(fā)者大會上表達出業(yè)內對于華為的疑惑。在這一背景下,華為盤古大模型“千呼萬喚始出來”。只不過,按照華為給予的定位,與其他大模型不同,盤古大模型“不作詩,只做事”。

實際上,華為在2021年就立項盤古大模型,目前在CV大模型、NLP大模型、科學計算大模型等領域都有技術和落地案例。在此次開發(fā)者大會上,華為正式發(fā)布盤古大模型3.0。

據(jù)介紹,本次大會發(fā)布的盤古大模型3.0是一個面向行業(yè)的大模型系列,包括“5+N+X”三層架構。

其中L0層包括自然語言、視覺、多模態(tài)、預測、科學計算五個基礎大模型,提供滿足行業(yè)場景中的多種技能需求,另外華為方面提供100億參數(shù)、380億參數(shù)、710參數(shù)和1000億參數(shù)的系列化基礎大模型,匹配客戶不同場景、不同時延、不同響應速度的行業(yè)多樣化需求。

同時,盤古大模型提供全新能力集,包括NLP大模型的知識問答、文案生成、代碼生成,以及多模態(tài)大模型的圖像生成、圖像理解等能力。

在L1層,是N個行業(yè)大模型,華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓練的行業(yè)通用大模型,包括政務,金融,制造,礦山,氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型的L0和L1層上,為客戶訓練自己的專有大模型。

張平安在會上提及,L0和L1未來將會是盤古大模型規(guī)劃重點。而L2層則是提供更多細化場景的模型,更加專注于政務熱線、網(wǎng)點助手、先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業(yè)應用或特定業(yè)務場景。

不為聊天而生

“盤古大模型出生就不是為聊天而生,我們也從來沒有想過對標ChatGPT,這是與其他大模型最大的不同,”張平安對記者表示。

那么,盤古大模型究竟能用于什么場景?華為在開發(fā)者大會上舉例介紹,在煤礦領域,盤古礦山大模型已經(jīng)在全國8個礦井規(guī)模使用,一個大模型可以覆蓋煤礦的采、掘、機、運、通、洗選等業(yè)務流程下的1000多個細分場景,讓更多的煤礦工人能夠在地面上作業(yè),極大地減少安全事故。

在鐵路領域,盤古鐵路大模型能精準識別現(xiàn)網(wǎng)運行的67種貨車、430多種故障,無故障圖片篩除率高達95%,將列檢員從每日數(shù)百萬張的“圖海”檢測中解放出來。

在氣象領域,盤古氣象大模型是首個精度超過傳統(tǒng)數(shù)值預報方法的AI預測模型,同時預測速度也有大幅提升。原來預測一個臺風未來10天的路徑,需要在3000臺服務器的高性能計算機集群上花費5小時進行仿真。現(xiàn)在基于預訓練的盤古氣象大模型,通過AI推理的方式,研究者只需單臺服務器上單卡配置,10秒內就可以獲得更精確的預測結果。

在制造領域,過去單產(chǎn)線制定器件分配計劃,往往要花費3個小時以上才能做齊1天的生產(chǎn)計劃。盤古制造大模型學習了華為產(chǎn)線上各種器件數(shù)據(jù)、業(yè)務流程及規(guī)則以后,能夠對業(yè)務需求進行準確的意圖理解,并調用天籌AI求解器插件,1分鐘即可做出未來3天的生產(chǎn)計劃。

AI算力另一極

值得注意的是,盤古大模型從芯片、AI框架、AI平臺實現(xiàn)了全棧創(chuàng)新。

“眾所周知,我們不能使用行業(yè)主流的GPU架構,因此我們只能自己搭建框架和平臺,” 張平安在會上表示。據(jù)他介紹,盤古大模型算力基于華為昇騰AI集群,其中核心則是達芬奇架構的昇騰芯片適配神經(jīng)網(wǎng)絡計算。

資料顯示,達芬奇架構是華為自研的面向AI計算特征的全新計算架構,具備高算力、高能效、靈活可裁剪的特性。具體來說,達芬奇架構采用3D Cube針對矩陣運算做加速,大幅提升單位功耗下的AI算力,每個AI Core可以在一個時鐘周期內實現(xiàn)4096個MAC操作,相比傳統(tǒng)的CPU和GPU實現(xiàn)數(shù)量級的提升。

大模型加速迭代趕超的背后,是不容忽視的算力挑戰(zhàn)。大模型研發(fā)高度依賴高端AI芯片、集群及生態(tài),高計算性能、高通信帶寬和大顯存成為大模型訓練必不可少的算力底座。

“現(xiàn)在行業(yè)中面臨的普遍問題是GPU芯片獲取困難,這一領域也存在‘卡脖子’風險,”張平安在會上直言。在他看來,昇騰AI集群方案投入使用,可以解決AI領域高成本問題。

張平安表示,基于昇騰AI集群的模型訓練效率對比GPU架構提升1.1倍。此外,據(jù)他介紹,在大模型訓練過程中經(jīng)常會遇到GPU故障,研發(fā)人員不得不經(jīng)常重啟訓練,時間長代價大。昇騰AI云服務可以提供更長穩(wěn)的AI算力服務,千卡訓練30天長穩(wěn)率達到90%,斷點恢復時長不超過10分鐘。

而且,昇騰云服務除了支持華為的AI框架Mindspore外,還支持Pytorch,Tensorflow等主流AI框架,框架中的90%算子,都可以通過華為的遷移工具從GPU平滑遷移到昇騰。

需要注意的是,就在一天前,此前推出訊飛星火認知大模型的科大訊飛宣布與昇騰AI合作打造通用智能新底座。

科大訊飛方面也表示,訊飛星火認知大模型基于訓練推理一體化設計,實現(xiàn)大模型稀疏化、低精度量化的技術突破,能高效適配昇騰AI,加速大模型的行業(yè)落地應用和迭代;另一方面,以昇騰AI為核心,軟硬件協(xié)同優(yōu)化,構建算力集中、性能優(yōu)越、供給穩(wěn)定、數(shù)據(jù)安全的大模型訓練集群。

記者在開發(fā)者大會上獲悉,目前華為云2000P Flops單集群的昇騰AI云服務已經(jīng)在7日在烏蘭察布和貴安同時上線。張平安在會上對記者表示,面對目前業(yè)界普遍認可的GPU架構,昇騰AI算力集群希望成為AI算力的另一極。

相關新聞

每日必讀

熱點精選

思思99re66在线精品免费观看 | 最新国产在线精品观看| 精品第一国产综合精品蜜芽| 亚洲av午夜精品一区二区三区| 一本一本久久a久久精品综合| 亚洲精品乱码久久久久久蜜桃| 亚洲精品国产高清不卡在线| 国产精品最新国产精品第十页| 久久国产精品国语对白| 国产精品兄妹在线观看麻豆| 久久99精品久久久| 精品爆乳一区二区三区无码av| 亚洲精品无码久久久久APP| 精品久久中文字幕| 午夜精品久久久久久影视777| 香蕉在线精品视频在线观看6| 国产亚洲精品美女久久久| 性色精品视频网站在线观看 | 精品亚洲综合在线第一区| 日韩人妻无码精品一专区| 国产精品美女久久久| 日韩精品一区二区三区中文版| 这里只有精品视频| 99精品国产99久久久久久97| 99re视频精品全部免费| 99re最新在线精品| 免费看一级毛片在线观看精品视频| 久久精品国产精品亚洲艾草网美妙| 国产精品对白交换视频| 国产精品高清一区二区三区不卡| 精品久久久久久亚洲中文字幕| 国产观看精品一区二区三区| 精品久久香蕉国产线看观看亚洲| 1024你懂的国产精品| 精品国产理论在线观看不卡| 精品午夜国产人人福利| 午夜精品在线观看| 精品国产一区二区三区免费看| 国产A√精品区二区三区四区| 久久精品九九热无码免贵| 国自产拍 高清精品|