國際賽事“收割機”再戰權威 :PaddlePaddle 助力百度大腦視覺團隊獲MOT榜單第一

5月7日,在國際權威的多目標追蹤挑戰(Multiple Object Tracking Challenge,MOT)的 MOT16 榜單上,百度視覺技術團隊超越平安科技、商湯科技、上海交大等眾多實力強勁的團隊,獲得榜單世界第一的好成績。 MOTA 指標顯著提升,超越第二名1.8個點;其中 MOTA 為誤檢、漏檢、ID 交換三個指標綜合平均值。

 

2019年上半年,百度視覺技術團隊已分別在 CVPR 2019活體、ICME 2019人臉 Keypoint、Widerface 等賽事獲得第一。此次 MOT 比賽是百度視覺技術團隊又一次奪冠,是在實踐“領先且實用的 AI 視覺技術”,同時是視頻新領域的又一次突破。

 

MOT 16 評測集排名,百度位居榜首

 

Multiple Object Tracking Challenge 是國際多目標跟蹤領域最權威的測評平臺,由阿德萊德大學、蘇黎世聯邦理工學院以及達姆施塔特工業大學聯合創辦,是世界各大 AI 研究機構必爭之地。

 

該平臺針對多行人對象在復雜場景下的運動軌跡,來評測算法同時進行檢測及追蹤的性能,目前主要包含 MOT15、MOT16、MOT17 三個評測集,其中 MOT16 允許參賽隊自定義檢測器,并對目標檢測、特征提取及追蹤等多模塊的綜合效果進行測評,因此更具有挑戰性和實用性。

 

此次,百度視覺技術團隊正是在 MOT16 評測集中勇奪桂冠,超越來自平安科技、商湯科技、海康威視、騰訊優圖、NEC 北美研究院、上海交大、斯坦福大學等多支實力強勁的世界知名公司團隊高校,技術實力不容小覷。

 

在檢測、重識別、多目標追蹤等相關算法上,百度視覺技術團隊做了諸多創新和改進。

 

檢測部分,基于百度自主研發的開源深度學習平臺 PaddlePaddle,選擇更強大的分類底座網絡并使用多尺度特征提取、改善物體模板以提升對微小目標的召回能力、并利用級聯網絡結構對目標框進行更精細的回歸;行人重識別部分,采用自研的基于多樣例注意力方法,能夠進一步挖掘樣本在“困難區域”的細粒度特征,從而提高相似樣本在特征空間的可區分性;追蹤部分,采用基于行人重識別的序列特征相似度模型進行目標軌跡匹配、并利用時空特征來降低密集多目標跟蹤的軌跡交換問題。

 

除此之外,深度學習平臺 PaddlePaddle 也是視覺技術團隊披荊斬棘的利器之一。PaddlePaddle 是集深度學習核心框架、工具組件和服務平臺為一體的技術領先、功能完備的開源深度學習平臺,而且 PaddlePaddle 在視覺技術上有深厚的積累,官方已開源覆蓋分類、檢測、語義分割、OCR、GAN、人體關鍵點檢測等類別,基于真實業務場景驗證的優質模型。

 

上個月,PaddlePaddle 聯合視覺技術團隊重磅發布了視頻識別工具集,覆蓋主流實用的序列建模算法與端到端視頻識別模型,可一鍵式任務啟動,公開數據集下載、數據預處理、模型訓練、模型 inference 一步到位。后續將會擴展以解決視頻理解、視頻編輯、視頻生成等一系列視頻理解任務。

 

 

PaddlePaddle 還對深度學習模型訓練中顯存占用及數據處理速度進行專項優化。以語義分割 Deeplabv3+ 為例,針對顯存消耗分析與解決、冗余前向計算、GPU CPU 內存交換、使用16位浮點數等等,讓開發者可在相同的計算設備上訓練更大的模型,還可以在消費級別顯卡上完成訓練。

 

在數據處理上,優化分布式 IO,增加遠程文件系統流式讀取能力。GPU 多機多卡同步訓練通過增加稀疏通信能力提升帶寬不敏感訓練能力,在低配網絡帶寬網絡環境下,例如10 G 網絡下,同步訓練可提速10倍。

 

另外 PaddlePaddle 對單機多設備及多機分布式訓練支持也非常友好,相對于單設備訓練,用戶幾乎不用對模型進行任何修改,可以低成本的實現單機多 CPU/GPU 訓練;而對于多機分布式訓練,也只需要簡單的配置即可,使得用戶能方便地從模型構建快速過渡到多種環境下的模型運行。

 

從實際應用角度,多目標追蹤是視頻理解和分析領域的核心技術之一。近年來,隨著人工智能技術的不斷落地,多目標追蹤在城市安防、客流分析、智慧零售、文體直播等多項重要應用場景(尤其是 AI to B 場景)發揮出日益重要的作用。

 

基于對多目標追蹤技術的重視,百度視覺技術團隊已在此方向積累百萬量級的檢測、重識別、追蹤訓練數據;多項相關開放服務,如人體檢測、人體追蹤、人體屬性識別、靜態/動態人流統計等,已構成完整的 B 端人體分析服務矩陣。對內支持百度智能云、自動駕駛等業務;并通過百度大腦 AI 開放平臺對外開放,服務各行各業。

 

未來,百度視覺技術團隊會繼續推進多目標追蹤領域的創新性工作,并爭取在更多實際應用場景實現落地。

 

視覺技術是百度大腦核心技術能力之一,其領先國際的技術優勢為開發者帶來了更多創新的機會。此次在 MOT 測評中的奪冠,是百度大腦技術實力的有力證明,也為百度人工智能“巨樹”再添碩果。百度視覺技術團隊不僅獲得多項國際賽事的第一名,還在 CVPR、ICCV、ECCV、AAAI 等多項計算機視覺頂會上發表文章。

 

百度大腦是百度 AI 技術多年積累和業務實踐的集大成,除了視覺技術領跑國際,在深度學習領域也頻頻發力。一站式深度學習開發平臺 AI Studio 更送出1億元免費算力,為普通開發者破除算力桎梏。

 

未來,百度大腦將持續秉持 AI 普惠的價值理念,一面在產業實踐中不斷打磨,超越自我勇攀高峰,一面高瞻遠矚、開山辟路,為開發者建立完善的 AI 生態環境,以技術改變生活、服務社會,為推動人類的文明與發展貢獻自己的 AI 之力。

來源 | 百度AI

上一篇:9大核心特性全新發布,百度大腦智能對話引擎“吹響號角”
下一篇:鵬城實驗室支持開發的開源桌面操作系統OPENTHOS通過專家鑒定

主站蜘蛛池模板: 国产精品爽爽ⅴa在线观看| 两个人看的www免费视频中文| 美女航空一级毛片在线播放| 日本黄色小视频在线观看| 在线视频中文字幕| 交换交换乱杂烩系列yy| acg里番全彩| 老司机成人影院| 成年免费A级毛片免费看无码| 国产AV无码专区亚洲AV琪琪 | 黄大片在线观看| 欧美福利在线播放| 国产精品自在欧美一区| 免费中日高清无专码有限公司| а√天堂资源官网在线资源| 韩国伦理电影我妻子的秘密| 日本欧美中文字幕| 四虎成年永久免费网站| 一男一女的一级毛片| 色综合久久天天综合| 日韩大片在线永久免费观看网站 | 福利在线小视频| 天堂va视频一区二区| 亚洲欧洲国产精品久久| 亚洲香蕉在线观看| 日韩一级片免费| 国产激情视频在线| 亚洲欧美成人一区二区在线电影 | 日本三级在线观看中文字| 四虎永久在线精品影院| jizzjizzjizz中国| 欧美特黄a级高清免费大片| 国产精品v欧美精品v日韩精品| 久久精品国产99久久久| 日本xxxxbbbb| 日本videos18高清hd下| 免费观看呢日本天堂视频| 91精品啪在线观看国产91九色 | 2021免费日韩视频网| 日韩精品极品视频在线观看免费 | 日本精品啪啪一区二区三区|