51久久夜色精品国产麻豆,久久综合国产精品,久久九九有精品国产23

首頁 > 快訊 >

剛剛，華為重大發(fā)布！

發(fā)布時間：2023-07-07 20:55:50 來源：金融界

“華為的大模型不作詩，只做事”，華為常務董事、華為云CEO張平安在2023年華為開發(fā)者大會上直言。

【資料圖】

7月7日，在華為開發(fā)者大會上，華為正式發(fā)布盤古大模型3.0。與此前發(fā)布的大模型不同，盤古大模型“不為聊天而生”，專注于包括礦山、氣象、金融等不同場景、不同行業(yè)多樣化需求。用張平安的話說就是“我們從來不會將盤古大模型對標ChatGPT”。

今年上半年，國內大模型如雨后春筍般出現(xiàn)，令國內AI算力需求陡增在。此次發(fā)布的盤古大模型另一大看點在于底層基于華為昇騰AI算力集群，按照華為方面設想，相較于火遍全球的GPU架構，昇騰AI算力集群希望成為國內AI算力另一極。

不作詩、只做事

“今年上半年，光國內就發(fā)布了86個大模型，這些大模型都有很強對話能力，市場也在疑惑，華為的大模型在哪里？”張平安在開發(fā)者大會上表達出業(yè)內對于華為的疑惑。在這一背景下，華為盤古大模型“千呼萬喚始出來”。只不過，按照華為給予的定位，與其他大模型不同，盤古大模型“不作詩，只做事”。

實際上，華為在2021年就立項盤古大模型，目前在CV大模型、NLP大模型、科學計算大模型等領域都有技術和落地案例。在此次開發(fā)者大會上，華為正式發(fā)布盤古大模型3.0。

據(jù)介紹，本次大會發(fā)布的盤古大模型3.0是一個面向行業(yè)的大模型系列，包括“5+N+X”三層架構。

其中L0層包括自然語言、視覺、多模態(tài)、預測、科學計算五個基礎大模型，提供滿足行業(yè)場景中的多種技能需求，另外華為方面提供100億參數(shù)、380億參數(shù)、710參數(shù)和1000億參數(shù)的系列化基礎大模型，匹配客戶不同場景、不同時延、不同響應速度的行業(yè)多樣化需求。

同時，盤古大模型提供全新能力集，包括NLP大模型的知識問答、文案生成、代碼生成，以及多模態(tài)大模型的圖像生成、圖像理解等能力。

在L1層，是N個行業(yè)大模型，華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓練的行業(yè)通用大模型，包括政務，金融，制造，礦山，氣象等大模型；也可以基于行業(yè)客戶的自有數(shù)據(jù)，在盤古大模型的L0和L1層上，為客戶訓練自己的專有大模型。

張平安在會上提及，L0和L1未來將會是盤古大模型規(guī)劃重點。而L2層則是提供更多細化場景的模型，更加專注于政務熱線、網(wǎng)點助手、先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業(yè)應用或特定業(yè)務場景。

不為聊天而生

“盤古大模型出生就不是為聊天而生，我們也從來沒有想過對標ChatGPT，這是與其他大模型最大的不同，”張平安對記者表示。

那么，盤古大模型究竟能用于什么場景？華為在開發(fā)者大會上舉例介紹，在煤礦領域，盤古礦山大模型已經(jīng)在全國8個礦井規(guī)模使用，一個大模型可以覆蓋煤礦的采、掘、機、運、通、洗選等業(yè)務流程下的1000多個細分場景，讓更多的煤礦工人能夠在地面上作業(yè)，極大地減少安全事故。

在鐵路領域，盤古鐵路大模型能精準識別現(xiàn)網(wǎng)運行的67種貨車、430多種故障，無故障圖片篩除率高達95%，將列檢員從每日數(shù)百萬張的“圖海”檢測中解放出來。

在氣象領域，盤古氣象大模型是首個精度超過傳統(tǒng)數(shù)值預報方法的AI預測模型，同時預測速度也有大幅提升。原來預測一個臺風未來10天的路徑，需要在3000臺服務器的高性能計算機集群上花費5小時進行仿真。現(xiàn)在基于預訓練的盤古氣象大模型，通過AI推理的方式，研究者只需單臺服務器上單卡配置，10秒內就可以獲得更精確的預測結果。

在制造領域，過去單產(chǎn)線制定器件分配計劃，往往要花費3個小時以上才能做齊1天的生產(chǎn)計劃。盤古制造大模型學習了華為產(chǎn)線上各種器件數(shù)據(jù)、業(yè)務流程及規(guī)則以后，能夠對業(yè)務需求進行準確的意圖理解，并調用天籌AI求解器插件，1分鐘即可做出未來3天的生產(chǎn)計劃。

AI算力另一極

值得注意的是，盤古大模型從芯片、AI框架、AI平臺實現(xiàn)了全棧創(chuàng)新。

“眾所周知，我們不能使用行業(yè)主流的GPU架構，因此我們只能自己搭建框架和平臺，” 張平安在會上表示。據(jù)他介紹，盤古大模型算力基于華為昇騰AI集群，其中核心則是達芬奇架構的昇騰芯片適配神經(jīng)網(wǎng)絡計算。

資料顯示，達芬奇架構是華為自研的面向AI計算特征的全新計算架構，具備高算力、高能效、靈活可裁剪的特性。具體來說，達芬奇架構采用3D Cube針對矩陣運算做加速，大幅提升單位功耗下的AI算力，每個AI Core可以在一個時鐘周期內實現(xiàn)4096個MAC操作，相比傳統(tǒng)的CPU和GPU實現(xiàn)數(shù)量級的提升。

大模型加速迭代趕超的背后，是不容忽視的算力挑戰(zhàn)。大模型研發(fā)高度依賴高端AI芯片、集群及生態(tài)，高計算性能、高通信帶寬和大顯存成為大模型訓練必不可少的算力底座。

“現(xiàn)在行業(yè)中面臨的普遍問題是GPU芯片獲取困難，這一領域也存在‘卡脖子’風險，”張平安在會上直言。在他看來，昇騰AI集群方案投入使用，可以解決AI領域高成本問題。

張平安表示，基于昇騰AI集群的模型訓練效率對比GPU架構提升1.1倍。此外，據(jù)他介紹，在大模型訓練過程中經(jīng)常會遇到GPU故障，研發(fā)人員不得不經(jīng)常重啟訓練，時間長代價大。昇騰AI云服務可以提供更長穩(wěn)的AI算力服務，千卡訓練30天長穩(wěn)率達到90%，斷點恢復時長不超過10分鐘。

而且，昇騰云服務除了支持華為的AI框架Mindspore外，還支持Pytorch，Tensorflow等主流AI框架，框架中的90%算子，都可以通過華為的遷移工具從GPU平滑遷移到昇騰。

需要注意的是，就在一天前，此前推出訊飛星火認知大模型的科大訊飛宣布與昇騰AI合作打造通用智能新底座。

科大訊飛方面也表示，訊飛星火認知大模型基于訓練推理一體化設計，實現(xiàn)大模型稀疏化、低精度量化的技術突破，能高效適配昇騰AI，加速大模型的行業(yè)落地應用和迭代；另一方面，以昇騰AI為核心，軟硬件協(xié)同優(yōu)化，構建算力集中、性能優(yōu)越、供給穩(wěn)定、數(shù)據(jù)安全的大模型訓練集群。

記者在開發(fā)者大會上獲悉，目前華為云2000P Flops單集群的昇騰AI云服務已經(jīng)在7日在烏蘭察布和貴安同時上線。張平安在會上對記者表示，面對目前業(yè)界普遍認可的GPU架構，昇騰AI算力集群希望成為AI算力的另一極。

每日必讀

熱點 精選

第二屆全民健身大會武術套路陳式心意混元太

日前，由青海省體育局主辦，青海省...[詳細]

剛剛，華為重大發(fā)布！

相關新聞

每日必讀

熱點 精選

第二屆全民健身大會武術套路陳式心意混元太

出擊！招行信用卡協(xié)助警方重拳打擊金融“黑