3月25日下午,中國人工智能領(lǐng)軍企業(yè)、新一代人工智能開源開放平臺(tái)OpenI啟智社區(qū)發(fā)起成員單位曠視科技舉辦線上發(fā)布會(huì),正式宣布在OpenI開源新一代AI生產(chǎn)力平臺(tái)Brain++的核心深度學(xué)習(xí)框架曠視天元(MegEngine),成為全球首個(gè)將底層框架開源的人工智能企業(yè)。
天元的前身是曠視內(nèi)部自用的算法訓(xùn)練推理引擎MegEngine,由曠視3名實(shí)習(xí)生在2013年啟動(dòng)研發(fā),并與2014年正式完成上線。這款完全自研的深度學(xué)習(xí)框架支撐了曠視6年以來在國際AI競賽的出色表現(xiàn),以及公司產(chǎn)品和業(yè)務(wù)的落地,目前服務(wù)于曠視研究院1400余名AI開發(fā)者。

圖:曠視聯(lián)合創(chuàng)始人兼CTO唐文斌
發(fā)布會(huì)上,曠視聯(lián)合創(chuàng)始人兼CTO唐文斌正式宣布將MegEngine的代碼開源,并指出這是一套訓(xùn)練推理一體化、動(dòng)靜態(tài)合一的工業(yè)級深度學(xué)習(xí)框架,中文名字叫做天元。

圖:曠視正式宣布開源自研深度學(xué)習(xí)框架天元
降低AI開發(fā)門檻提升算法研發(fā)效率
曠視是全球最早用深度學(xué)習(xí)方法開展人工智能商業(yè)化探索的科技企業(yè),但由于早期AI 開發(fā)工具的匱乏,曠視靠自主研發(fā),從 0 到 1 地解決了算法生產(chǎn)的問題。直播現(xiàn)場,天元開源項(xiàng)目負(fù)責(zé)人、曠視研究院高級技術(shù)總監(jiān)田忠博從開發(fā)經(jīng)驗(yàn)中的幾個(gè)痛點(diǎn)入手,向開發(fā)者介紹了天元的核心優(yōu)勢和特性。
比如傳統(tǒng)深度學(xué)習(xí)研發(fā)中,產(chǎn)品從原型到生產(chǎn)部署往往需要分開設(shè)計(jì)和調(diào)用訓(xùn)練框架和推理框架兩種框架,這就導(dǎo)致模型在訓(xùn)練和推理的轉(zhuǎn)換的過程中出現(xiàn)不明原因的性能或精度損失,需要開發(fā)者手工進(jìn)行優(yōu)化,而算法在計(jì)算平臺(tái)部署的時(shí)候出現(xiàn)各種問題也無法追溯。
天元框架在設(shè)計(jì)之初就避免了這樣的問題,通過訓(xùn)練、推理一體化的機(jī)制省去模型轉(zhuǎn)換的過程,可直接將訓(xùn)練后的模型進(jìn)行推理,并保證跨設(shè)備的模型精度對齊,同時(shí)天元內(nèi)置自動(dòng)模型優(yōu)化、簡化流程,減少因手工操作的機(jī)會(huì),降低出錯(cuò)概率。
除此之外,天元還配置了 Python 和 C++ 接口,支持動(dòng)態(tài)圖、靜態(tài)圖一鍵轉(zhuǎn)換和混合編程,可使用高級編程語言進(jìn)行圖優(yōu)化和圖編譯。在運(yùn)行時(shí)管理環(huán)節(jié),天元具備執(zhí)行流與調(diào)度器,采用動(dòng)態(tài)、靜態(tài)內(nèi)存分配并存的方式,并通過獨(dú)創(chuàng)的自動(dòng)的亞線性內(nèi)存管理優(yōu)化器可以得到更好的內(nèi)存優(yōu)化效果;在底層設(shè)計(jì)上,天元的計(jì)算內(nèi)核不僅兼容主流計(jì)算設(shè)備,且支持多機(jī)多卡和分布式訓(xùn)練。而為了解決模型復(fù)現(xiàn)困難的問題,天元?jiǎng)t支持 PyTorch Module 導(dǎo)入,可針對計(jì)算機(jī)視覺任務(wù)進(jìn)行優(yōu)化。
相比主流的開源深度學(xué)習(xí)框架,天元具有訓(xùn)練推理一體化、動(dòng)靜合一、兼容并包、靈活高效的顯性優(yōu)勢,無論對于深度學(xué)習(xí)”老司機(jī)“,還是剛剛轉(zhuǎn)型AI開發(fā)者的用戶來說都非常友好,極大程度上降低了深度學(xué)習(xí)的門檻,提升了算法訓(xùn)練和部署的效率。
國產(chǎn)深度學(xué)習(xí)框架開源勢在必行
對于開發(fā)者來說,開源最大的意義在于技術(shù)共享和共建的成就感。20世紀(jì)末期,Linux 系統(tǒng)為中國開發(fā)者打開了通往開源”集市“的大門,開源軟件為國產(chǎn)操作系統(tǒng)和國產(chǎn)軟件平臺(tái)的從 0 到 1 開辟了基礎(chǔ),同時(shí)中國的開發(fā)者們也為國際的開源社區(qū)做出了大量的貢獻(xiàn)。開源社區(qū)的發(fā)展壯大和成果共享,促使很多企業(yè)實(shí)現(xiàn)了快速的成長,同時(shí)也觸發(fā)了技術(shù)的加速迭代,和大批信息技術(shù)人才的涌現(xiàn)。
近年來,人工智能、大數(shù)據(jù)、云計(jì)算、移動(dòng)互聯(lián)、物聯(lián)網(wǎng)等領(lǐng)域呈現(xiàn)多點(diǎn)聯(lián)動(dòng)的集群式創(chuàng)新態(tài)勢,不僅使以感知和智能計(jì)算為核心的弱人工智能出現(xiàn)規(guī)模化應(yīng)用的態(tài)勢,同時(shí)也推動(dòng)深度學(xué)習(xí)、計(jì)算機(jī)視覺等技術(shù)加速演進(jìn),顛覆性變革的人工智能新理論、新技術(shù)和新方法日新月異。因此,開源、開放國產(chǎn)自主可控的人工智能深度學(xué)習(xí),也將成為各主體提升創(chuàng)新效率的基礎(chǔ)。

圖:天元開源項(xiàng)目負(fù)責(zé)人、曠視研究院高級技術(shù)總監(jiān)田忠博
自2017年,人工智能首次被寫入全國政府工作報(bào)告以來,我國在人工智能相關(guān)的重大計(jì)劃方面已經(jīng)有非常詳細(xì)的布局,并相繼有了不少重大成果,但在一些關(guān)鍵領(lǐng)域仍有一些短板。中國工程院院士、鵬城實(shí)驗(yàn)室主任、新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟(AITISA)理事長高文曾指出,基礎(chǔ)理論和原創(chuàng)算法、高端芯片和計(jì)算設(shè)備、開源開放平臺(tái)和核心人才是中國人工智能需要攻堅(jiān)的方向。
為促進(jìn)人工智能領(lǐng)域的協(xié)同創(chuàng)新,構(gòu)建開源開放的技術(shù)鏈、創(chuàng)新鏈和生態(tài)鏈、推動(dòng)人工智能產(chǎn)業(yè)健康快速發(fā)展及廣泛應(yīng)用,新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟組織產(chǎn)學(xué)研用通力協(xié)作,構(gòu)建了共享開源軟件、開源硬件、開放數(shù)據(jù)的新一代人工智能開源開放平臺(tái)——OpenI啟智平臺(tái)。平臺(tái)成立至今,基于鵬城云腦等重大基礎(chǔ)建設(shè)工程及AITISA聯(lián)盟一體兩翼的工作部署,匯聚了鵬城實(shí)驗(yàn)室、北京智源人工智能研究院、北京大學(xué)、國防科技大學(xué)、北航等頂尖科研院校及華為、百度、微眾銀行、曠視、商湯科技、小米、京東等人工智能領(lǐng)域領(lǐng)軍企業(yè),培育并發(fā)布了OpenI章魚、OpenI珊瑚、啟智Trustie、啟智DL深度學(xué)習(xí)框架/RL強(qiáng)化學(xué)習(xí)框架、OpenI縱橫、OpenI海參、OpenI海藻等多個(gè)開源項(xiàng)目。
曠視作為OpenI啟智平臺(tái)發(fā)起單位之一,也是國家科技部授予的十五個(gè)人工智能開放創(chuàng)新平臺(tái)之 “圖像感知國家新一代人工智能開放創(chuàng)新平臺(tái)”。近日,OpenI技術(shù)委員會(huì)正式通過曠視Brian++.天元進(jìn)入OpenI啟智社區(qū)的開源項(xiàng)目孵化管道。目前,曠視已在OpenI啟智社區(qū)和GitHub 上同步發(fā)布了天元 Alpha 版的35萬行源代碼,開發(fā)者也可以通過天元官方網(wǎng)站的在線深度學(xué)習(xí)工具免費(fèi)調(diào)用算力、獲取最新數(shù)據(jù)集和訓(xùn)練腳本,進(jìn)行簡單訓(xùn)練和試用。曠視為天元的開發(fā)者還準(zhǔn)備了全球頂尖算法預(yù)訓(xùn)練模型的模型中心ModelHub,支持開發(fā)者開箱即用。

圖:天元Alpha版的35萬行代碼已發(fā)布于 OpenI 和 GitHub
對于天元框架開源后的發(fā)展規(guī)劃,曠視透露將在技術(shù)貢獻(xiàn)者的幫助下,于6月份推出 Beta 版本。“也許下一代天元并不是由曠視的研發(fā)團(tuán)隊(duì)做出來的,而是與你一起共創(chuàng)出來。我們希望能夠吸引到一些優(yōu)秀的技術(shù)人員來給我們更好的建議,一起貢獻(xiàn)代碼、共建更好的深度學(xué)習(xí)框架。”唐文斌表示。
開源不僅是開發(fā)者們共享技術(shù)成果的方式,更是推進(jìn)技術(shù)產(chǎn)業(yè)化的催化劑。此次曠視能夠把公司最核心的底層技術(shù)與全球開發(fā)者共享,體現(xiàn)了中國科技企業(yè)的責(zé)任與擔(dān)當(dāng)。未來,讓我們一起期待曠視天元的表現(xiàn),也期待此次開源能真正地激發(fā)市場的創(chuàng)造力,讓傳統(tǒng)產(chǎn)業(yè)和中小企業(yè)都能用上深度學(xué)習(xí)和人工智能技術(shù),加速人工智能產(chǎn)業(yè)落地。
相關(guān)鏈接:
相關(guān)鏈接:
曠世AI生產(chǎn)力平臺(tái)Brain++官網(wǎng):
https://brainpp.megvii.com/
天元MegEngine官網(wǎng):
https://megengine.org.cn/
OpenI項(xiàng)目地址:https://www.www.cfcf666.com/html/2020/Framework_0325/18.html
GitHub:https://github.com/MegEngine
鵬城匯智:https://code.ihub.org.cn/projects/1189