作為當前人工智能發展的重要方向,預訓練大模型已成為AI領域的技術新高地。2021年12月8日,鵬城實驗室與百度聯合召開發布會,正式發布雙方共同研發的全球首個知識增強千億大模型——鵬城-百度·文心(模型版本號:ERNIE 3.0 Titan)。該模型參數規模達到2600億,是目前全球最大中文單體模型,在60多項任務上取得最好效果。同時,產業級知識增強大模型“文心”全景圖首次亮相,從技術自主創新和加速產業應用兩方面,推動中國AI發展更進一步。
現場,中國工程院院士、鵬城實驗室主任高文,百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰共同啟動發布儀式。
中國工程院院士、鵬城實驗室主任高文(左),百度首席技術官王海峰聯合發布鵬城-百度·文心
高文院士在致辭中表示,“預訓練模型對整個科學的發展、社會的發展、創新的發展都是非常重要的工具。運用這個工具,可以幫助做很多人工智能的賦能,不局限于某個領域,這對人工智能的發展都是一個福音?!?/p>
王海峰介紹,此次發布的鵬城-百度·文心知識增強大模型從大規模知識和海量數據中融合學習,效率更高,效果更好,具有良好的可解釋性。
值得關注的是,鵬城-百度·文心是全球首個知識增強千億大模型,在機器閱讀理解、文本分類、語義相似度計算等60多項任務取得最好效果,并在30余項小樣本和零樣本任務上刷新基準。為解決大模型應用落地難題,研究團隊還首創了大模型在線蒸餾技術,模型參數壓縮率可達99.98%。壓縮版模型僅保留0.02%參數規模就能與原有模型效果相當,為產業大規模應用打開新窗口。
使用鵬城-百度·文心進行可信、可控文本生成
在鵬城-百度·文心的研發過程中,得益于鵬城實驗室的高性能AI算力系統“鵬城云腦Ⅱ”和飛槳深度學習平臺強強聯手,解決了超大模型訓練的多個公認技術難題,使鵬城-百度·文心訓練效率大幅提升,模型效果更優?!谤i城云腦Ⅱ”是國產自主的首個E級AI算力平臺,曾在多個國際性能測試上獲得冠軍。飛槳是我國首個自主研發的深度學習開源開放平臺,研制了端到端自適應分布式訓練框架,實現多硬件支持,并行效率高達90%,有效支持鵬城-百度·文心千億大模型高效、穩定地訓練。另外,“鵬城云腦II”技術團隊也與華為團隊一同對大模型訓練給予了持續保障。
為促進產學研協“多輪驅動”,鵬城實驗室與百度成立了鵬城-百度自然語言處理聯合實驗室,并以此為依托,實現資源共享、優勢互補,在自然語言處理前沿研究和創新應用方面協同攻關,助力打造國家戰略科技力量。此次聯合發布的鵬城-百度·文心將進一步解決 AI 技術在產業應用中缺乏領域和場景化數據等關鍵難題。本著“開源開放”的理念,該模型相關代碼近期會在OpenI啟智社區開源,依托“鵬城云腦Ⅱ”對外開放模型服務,聯合產學研協各方,充分挖掘AI大模型的賦能能力,助力科技創新,推動產業發展。
上一篇:清華首個虛擬學生華智冰露臉唱歌,小冰公司回應
下一篇:最后一頁