當前位置:首頁 > 資訊 > 社區(qū)動態(tài) >
12 月 19—20 日,由鵬城實驗室和新一代人工智能產業(yè)技術創(chuàng)新戰(zhàn)略聯(lián)盟主辦的“2021 新一代人工智能院士高峰論壇暨啟智開發(fā)者大會”在深圳舉辦,期間,華為技術有限公司承辦的新一代人工智能院士高峰論壇昇騰人工智能應用專場于 20 日成功舉行。
深耕基礎,厚植技術。近年來,華為昇騰以“硬件開放、軟件開源、使能伙伴、發(fā)展人才”16 字方針不斷發(fā)展產業(yè),攜手各行各業(yè)的開發(fā)者們進行賦能升級,助推人工智能的應用落地。本次昇騰人工智能應用專場,華為更是邀請了多位昇騰技術專家,從一線的 AI 應用挑戰(zhàn)出發(fā),與開發(fā)者們研討交流,共創(chuàng)機遇。
會上,華為昇騰生態(tài)首席專家張存燕以行業(yè)的人才培養(yǎng)為切入點,向大家分享了昇騰面向開發(fā)者們的 offering 發(fā)展戰(zhàn)略,以及面向行業(yè)、高校、初創(chuàng)、個人不同類型開發(fā)者的權益和計劃。張存燕介紹到,華為深耕根技術,一直致力于打破算力消耗的鴻溝。在昇騰基礎軟硬件平臺上,昇騰一共打造了技術和商業(yè)兩個生態(tài)。技術生態(tài)為科研機構、高校、企業(yè)、合作伙伴的研發(fā)人員提供技術支撐,加速科研創(chuàng)新;商業(yè)生態(tài)則注重與合作伙伴一起打造面向各行各業(yè)的解決方案,真正讓 AI 走入到千行百業(yè),賦能各個產業(yè)的智能化改造和智能化升級。
在這兩個生態(tài)的帶動下,昇騰希望打造一個人工智能的“黑土地”,合力為每位 AI 開發(fā)者及每個行業(yè)的應用開發(fā)者提供強大引擎,共同繁榮國內人工智能產業(yè)新生態(tài)。
在洶涌的 AI 時代浪潮中,人工智能技術領域無疑面臨著重重困難和挑戰(zhàn)。AI 算力設施昂貴、專業(yè)人才稀缺,整個行業(yè)對計算效率和編程易用性的訴求愈發(fā)強烈。昇騰 CANN 運營總監(jiān)田曉亮便從新計算范式出現(xiàn)、異構計算興起和大集群等行業(yè)新挑戰(zhàn)引導發(fā)問,介紹了 CANN 的基礎架構及其適配場景。自 2018 年 CANN1.0 發(fā)布面世,經過三年發(fā)展,CANN 在技術和生態(tài)上都已經有了長足的進步。在性能方面,CANN5.0 通過軟硬件結合優(yōu)化,充分發(fā)揮了昇騰芯片的算力性能。這主要源自于多項關鍵技術的突破,如自動流水、算子深度融合、自適應梯度切分、智能計算調優(yōu)帶來的更高效的任務角度和切分策略。
在發(fā)展過程中,CANN 還非常注重生態(tài)發(fā)展,通過社區(qū)運作,CANN 不斷創(chuàng)新優(yōu)化,迭代出了新的產業(yè)、新的軟件。回應開發(fā)者訴求、助力解決行業(yè)困境,CANN 未來將持續(xù)在基礎和關鍵技術上進行突破,“只有基礎打得牢、根扎得深,才會有人工智能的繁榮發(fā)展”,田曉亮這樣強調。
近段時間,中文大規(guī)模預訓練語言模型層出不窮,已經成長到僅加載就需要 TB 級內存或顯存的生態(tài)。昇思 MindSpore 架構師 ZOMI 醬就針對 MindSpore 超大模型訓練的一些關鍵技術,進行了一些稍為“硬核”的內容分享。MindSpore 在 2020 年 3 月份開始開源,到現(xiàn)在的 1.5 版本,總下載量已經接近 100 萬。快速部署、靈活調試,現(xiàn)在的 MindSpore 已經能夠支撐像鵬城盤古 NLP、鵬城神農氨基酸序列生成、華為云 NLP 模型、紫東太初多模態(tài)模型這樣的千億大模型。對于大模型面臨的“內存、性能、效率、調優(yōu)”挑戰(zhàn),MindSpore 則分別對應給出了圖算融合、Scale out、集群調優(yōu)等解決方案。
講起核心技術,ZOMI 醬表示,除了通過圖的編譯把多維度并行融合到框架,“多維度混合自動并行”是 MindSpore 做得比較好的地方。現(xiàn)今,MindSpore 自動并行已經實現(xiàn) 5 維的并行方式,實現(xiàn)對超大規(guī)模的分布式訓練及超大規(guī)模中文預訓練模型的探索。
將物理世界中的非結構化數據,如圖片、視頻、音頻通過 AI 模型轉換為特征,是眾多 AI 業(yè)務的核心邏輯。昇騰 MindX 技術專家李明舉在給大家介紹數據檢索的 SDK 時,就用簡單的語言闡釋了普通開發(fā)者如何用 AI 來解決生活中的問題。讓 AI 從學術成果到產業(yè)落地,昇騰 MindX 總結了三座問題大山——算法開發(fā)難、應用開發(fā)難和業(yè)務部署難,而 MindX 的四個組件“ MindX DL”“ MindX Edge”“MindX Zoo”和“MindX SDK”則對應這三座大山給出了解決方案。
“大數據”“區(qū)塊鏈”“元宇宙”,各行各業(yè)的概念正潛移默化地改變著我們的生活,昇騰 MindX SDK mxIndex 更是將目光聚焦在了非結構化數據上。李明舉提到,非結構化數據有著非常多潛在的發(fā)展空間,在推薦系統(tǒng)、數據挖掘等領域都有良好的發(fā)展前景。但同時,機遇與挑戰(zhàn)并存,算法問題常常會演化成更大的工程問題,如何在如此多的技術之下去搭建業(yè)務,mxIndex 在這里給出了答卷。“更快”——帶來更高的 QPS,更大的吞吐量和更大的底庫數據規(guī)模;“更便捷”——昇騰擁有開源中最受歡迎的框架之一,而 mxIndex 在用戶遷移上更是兼具了輕體量與便捷性兩項優(yōu)點;“更友好”——清晰操作、在線交流,在用戶體驗上,mxIndex 擁有簡明的接口定義,豐富詳實的手冊和活躍的社區(qū)支持。對于大規(guī)模特征檢索或聚類的應用場景需求,mxIndex 能夠提供極簡易用、高性能的 API,助力昇騰 AI 處理器賦能各類應用。
邊緣 AI 在如今的工業(yè)互聯(lián)網、智慧園區(qū)等場景已有著越來越多的應用,但同時還存在著諸多挑戰(zhàn),包括軟硬件異構、邊緣資源受損、邊緣數據異構、邊緣小樣本和隱私安全等常見問題。會上,華為云邊緣云創(chuàng)新 Lab 高級工程師普杰從應用的角度,向開發(fā)者們介紹了華為云在邊緣計算尤其是邊云協(xié)同 AI 領域的相關探索。
2018 年,華為云開源了邊緣計算平臺項目 KubeEdge。作為業(yè)界首個云原生的邊緣計算平臺,KubeEdge 通過開放的社區(qū)治理連接云原生和邊緣計算生態(tài),旨在提供應用協(xié)同、資源協(xié)同以及數據協(xié)同和設備協(xié)同的統(tǒng)一標準。
在邊緣計算場景中,AI 應用需要面對個性化的邊緣場景,資源碎片化、數據異構、小樣本、數據隱私等問題急需解決。2020 年底,KubeEdge 社區(qū)成立了特別興趣小組 SIG AI,聚焦邊緣 AI 相關的技術討論、API 定義、參考架構、開源實現(xiàn)等,使能 AI 應用在邊緣更好的運行。
2021 年初,華為云進一步開源了邊云協(xié)同 AI 框架 Sedna,基于 KubeEdge,實現(xiàn)邊與云的協(xié)同推理、增量學習、終身學習、聯(lián)邦學習等核心邊緣 AI 能力,能有效提升模型準確度,降低邊緣資源的消耗,保護數據隱私和安全。
普杰提到,Sedna 不是想做一個 TensorFlow 這樣的框架,而是基于 KubeEdge 提供的邊云協(xié)同的能力,支持現(xiàn)有的 AI 應用無縫地下沉到邊緣,降低邊云協(xié)同 AI 應用的構建和部署成本、提升模型的性能并保護數據隱私。
當天下午,昇騰人工智能應用專場進行了豐富有趣的案例分享和在線實驗。現(xiàn)場由昇騰 CANN 資深技術專家毛紅朝、昇騰 MindX 研發(fā)專家陳航、昇思 MindSpore 資深技術專家 xavier 和昇騰 CANN 資深技術專家鄭佳帶領,為開發(fā)者們帶來了“基于昇騰 CANN 的 AI 應用開發(fā)”、“使用 MindX SDK 開發(fā)智能質檢應用”、“昇思 MindSpore YOLO 案例開發(fā)到部署介紹”和“基于昇騰 CANN 的模型遷移”四場實操課程。
共筑 AI 新高地,共贏智能新未來。伴隨著驚喜有趣的現(xiàn)場抽獎環(huán)節(jié),開發(fā)者們于實踐中全方位感受華為面向“端、邊、云”的全場景 AI 基礎設施方案,在線體驗來自昇騰的全棧 AI 魔力。