伴隨我國超大規模預訓練模型的發展,國內人工智能算力需求持續攀升,人工智能算力中心的建設如火如荼。新形勢迫切需要在此建設過程中不僅考慮將算力中心作為獨立的系統發揮作用,更應形成相互聯接的算力網絡,以滿足網絡化算力聯通調度的需求。
12 月 19 日,“人工智能算力網絡推進聯盟”在 2021 新一代人工智能院士高峰論壇暨啟智開發者大會上成立。12 月 20 日,為了更好地探索智算網絡的建設、實踐、保障和運營,峰會智算網絡分論壇順利召開。
智算網絡分論壇現場,鵬城實驗室與華為、百度、國家超級計算濟南中心、武漢人工智能創新生態中心、中原人工智能計算中心、琴智科技研究院、中科類腦等智算聯盟首批聯盟單位完成了聯盟簽約儀式。
人工智能算力中心作為智能時代的新型公共基礎設施,是發展人工智能產業的基礎資源保障。為發揮其公共基礎設施的作用,就要不僅建得好還要用得好。因此構建能夠支撐人工智能產業持續發展的智算網絡和管理運營機制就變得至關重要。
華為集群計算解決方案架構師崔金帶來題為《人工智能算力網絡調度平臺系統架構》的報告。他認為, 作為一項具有重要意義的新技術,算力網絡的落地節奏會分三個階段:第一階段,實現運營層面的互聯,如提供統一的門戶入口等。第二階段,算力網絡利用作業調度層面的互聯,實現不同計算中心負載和網絡的實時感知與簡單調度。第三階段,跨數據中心并行。系統可以進行細粒度任務調度,大模型并行訓練,安全數據管理,還可以從應用場景支持各類復雜的多樣性運用。
武漢人工智能生態創新中心副總經理蔡維康在現場作《武漢人工智能生態創新中心運營分享》主題報告,主要圍繞武漢人工智能中心的運營模式以及武漢人工智能中心的發展狀況等內容進行分享。他表示,未來武漢人工智能生態創新中心將在產業集聚方面,吸引頭部科研院校及 AI 企業來漢合作,做實產業發展。
國家超級計算濟南中心主任助理、研究員郭猛在題為《超算互聯網的探索與實踐》的報告中指出,超算互聯網不僅僅是網絡的概念,智算網絡更應提供應用服務,以促使開發者、超算和用戶的緊密耦合。打造從超級計算最底層的基礎軟件到中間件、編程工具、應用軟件的全鏈條應用生態。
百度深度學習技術平臺部主任研發架構師、飛槳分布式技術負責人吳志華在《飛槳大規模分布式訓練技術》報告中介紹,分布式訓練技術能夠解決各種場景、各種硬件下多設備的協同訓練問題。百度從產業實踐的角度不斷地進行應用落地的嘗試,做出分布式訓練算力和算法上的極致優化,在實際場景中打磨部署能力以提升用戶的最終體驗,讓深度學習的創新應用更加簡單。
鵬城實驗室開源軟件與平臺研究所副所長、OpenI 技術委員會委員曾煒發表《基于算力網絡的全國開源開放平臺》的報告。他指出,人工智能開源社區的最佳支撐是智能算力網絡,算力網絡本身的發展是全球計算和通信產業結合的基礎。因此他希望各方資源能在軟件、硬件統一的模式為開源、開放提供服務。
在當日圓桌討論中,陳文光、管海兵、王子彥、崔金、蔡維康、郭猛等多位業界大咖齊聚現場,共同探討未來智算網絡建設之路。
管海兵教授從政府角度出發,“工業社會看電力,信息社會看算力。算力對當今社會而言,就像以前的電力和水一樣,是社會最必不可少的、非常重要的公共資源?!彼J為建立算力網絡是符合人類社會數千年來運行規律非常重要的舉措。
王子彥回應“智能算力網絡現狀是什么?”一問。他認為,目前對于國家超算來說,國家做了投入,承擔了相關的電費、運營補貼等費用。計算中心能夠產生相關的科研效益,仍然是它的公共屬性。但如果面向產業的話,地方政府要發展智算網絡的現狀壓力仍然大。
崔金表示,雖然算力的匯聚跟水電網絡有比較大的差別,算力網絡是要把用戶的數據、用戶的算法拿到算力中心來計算,但希望未來智算網絡能夠從體驗和網絡特性上都能做成像水電網絡一樣。
曾煒表示,軟件問題是制約整個網絡體系打通和服務最關鍵的問題。他從開源和標準化的角度,鼓勵不同的企業,甚至是圈子外的人在構建軟件的過程中倡導共享,共同打造開放的軟件棧。
郭猛回顧了網格計算和算力網絡的發展歷史。他認為網格計算是算力網絡必不可少的研究基礎。網格計算的分布式計算概念、作業調度的中間件、安全的解決方案和網格的文件傳輸工具對于構建算力網絡都有非常重要的借鑒意義。
管海兵教授在回答現場提問者時總結,發展算力網絡和發展智算網絡并不矛盾。算力發展的前期階段已經有了成功的實踐,云計算就是一種算力網絡。云計算發展到今天,目前存在最大的問題是云和云之間不能互聯互通,對用戶的水平有一定的要求。因此,只有不斷的實踐,才能走到更大的普及、普惠、甚至普世的層面。
人工智能算力網絡推進聯盟將以“平等自愿、優勢互補、資源共享、合作共贏”為原則,結合國內外人工智能技術和產業發展需求,整合業內資源,加強相互合作,提升人工智能技術、產品研發水平和應用能力,促進人工智能產業健康快速發展,保障國家人工智能技術和產業的安全,推動人工智能技術在社會各領域、傳統產業各領域的廣泛應用。
上一篇:共筑 AI 開源繁榮生態 | 新一代人工智能院士高峰論壇深度學習框架分論壇成功舉辦
下一篇:2021 年全國人工智能大賽正式啟動,396 萬獎金等你報名!