資訊

智源人工智能算法大賽開鑼，百萬獎(jiǎng)金激勵(lì) AI 算法創(chuàng)新

2019-09-10 15:28:44

智源人工智能算法大賽現(xiàn)已正式啟動(dòng)！本次比賽由北京智源人工智能研究院主辦，清華大學(xué)、北京大學(xué)、中科院計(jì)算所、曠視、知乎等協(xié)辦，總獎(jiǎng)金超過 100 萬元，旨在以全球領(lǐng)先的科研數(shù)據(jù)集與算法競(jìng)賽為平臺(tái)，選拔培育人工智能創(chuàng)新人才。

北京智源人工智能研究院（Beijing Academy of Artificial Intelligence，BAAI）是落實(shí)“北京智源行動(dòng)計(jì)劃”的重要舉措，在科技部和北京市委市政府的指導(dǎo)和支持下，由北京市科委和海淀區(qū)政府推動(dòng)成立，是依托北京大學(xué)、清華大學(xué)、中國(guó)科學(xué)院、百度、小米、字節(jié)跳動(dòng)、美團(tuán)點(diǎn)評(píng)、曠視科技等北京人工智能領(lǐng)域優(yōu)勢(shì)單位共建的新型研發(fā)機(jī)構(gòu)。在 2018 年 11 月 14 日舉行的 2018 中國(guó)（北京）跨國(guó)技術(shù)轉(zhuǎn)移大會(huì)開幕式上，智源研究院正式揭牌。

本次智源人工智能算法大賽有兩個(gè)重要的目的，一是通過發(fā)布數(shù)據(jù)集和數(shù)據(jù)競(jìng)賽的方式，推動(dòng)基礎(chǔ)研究的進(jìn)展。特別是可以讓計(jì)算機(jī)領(lǐng)域的學(xué)者參與到其他學(xué)科的基礎(chǔ)科學(xué)研究中；二是可以通過比賽篩選、鍛煉相關(guān)領(lǐng)域的人才。

北京智源人工智能研究院院長(zhǎng)、北京大學(xué)教授黃鐵軍介紹：智源的中心任務(wù)是在北京建成全球最優(yōu)的人工智能創(chuàng)新生態(tài)，核心是選拔培育人工智能頂尖人才和發(fā)展?jié)摿Υ蟮那嗄陮W(xué)術(shù)英才。研究院副院長(zhǎng)劉江也表示：“我們希望不拘一格來支持人工智能真正的標(biāo)志性突破，即使是本科生，如果真的是好苗子，我們也一定支持。”而人工智能大賽就是發(fā)現(xiàn)有潛力的年輕學(xué)者的重要途徑。

2019 智源算法大賽將包括 10 道賽題，覆蓋機(jī)器視覺、自然語言處理、推薦系統(tǒng)等機(jī)器學(xué)習(xí)領(lǐng)域，也將覆蓋粒子物理學(xué)、神經(jīng)生物學(xué)、藥物化學(xué)、工業(yè)制造等基礎(chǔ)或應(yīng)用學(xué)科。比賽的數(shù)據(jù)來自全球頂尖企業(yè)和研究實(shí)驗(yàn)室，代表了最前沿的學(xué)科方向。

首批發(fā)布的兩個(gè)賽題分別來自知乎和中科院計(jì)算所。

第一彈：專家識(shí)別

?? 任務(wù)描述

比賽將提供知乎上的問題、話題、用戶畫像和用戶回答記錄等數(shù)據(jù)。希望選手可以預(yù)測(cè)某個(gè)專家是否會(huì)接受某個(gè)用戶就某個(gè)問題向他發(fā)出的回答邀請(qǐng)。

為了協(xié)助選手更好地搭建模型，本次比賽提供了 10 萬個(gè)話題數(shù)據(jù)、180 萬個(gè)問題和 475 萬個(gè)回答數(shù)據(jù)、190 萬個(gè)脫敏的用戶畫像和回答記錄數(shù)據(jù)，以及 1000 萬條邀請(qǐng)數(shù)據(jù)。

?? 數(shù)據(jù)集

比賽將提供知乎的問題信息、用戶畫像、用戶回答記錄，以及用戶接受邀請(qǐng)的記錄，要求選手預(yù)測(cè)這個(gè)用戶是否會(huì)接受某個(gè)新問題的邀請(qǐng)。

1. 問題信息。包括<問題id、問題創(chuàng)建時(shí)間、問題的話題、問題的文本、問題的描述等>；
2. 用戶的回答。包括<回答id、問題id、作者id、回答的文本、回答時(shí)間、點(diǎn)贊數(shù)、收藏?cái)?shù)、感謝數(shù)、評(píng)論數(shù)>等；
3. 用戶人畫像數(shù)據(jù)。包括<用戶id、性別、活躍頻次、關(guān)注話題、長(zhǎng)期興趣、鹽值>等；
4. <topic、token(詞)、單字 64維embedding> 數(shù)據(jù)；
5. 最近一月的邀請(qǐng)數(shù)據(jù)包括<問題id、用戶id、邀請(qǐng)時(shí)間、是否回答>。。

第二彈：虛假新聞識(shí)別

?? 任務(wù)描述

為應(yīng)對(duì)當(dāng)前虛假新聞泛濫的現(xiàn)狀，將虛假新聞帶來的危害最小化，我們?cè)O(shè)立此賽題以促進(jìn)對(duì)虛假新聞自動(dòng)化檢測(cè)方法的研究。針對(duì)虛假新聞的特點(diǎn)，我們?cè)O(shè)立了三個(gè)子任務(wù)：

Task 1：虛假新聞文本檢測(cè)：文本是新聞信息的主要載體，對(duì)新聞文本的研究有助于虛假新聞的有效識(shí)別。具體任務(wù)為：給定一個(gè)新聞事件的文本，判定該事件屬于真實(shí)新聞還是虛假新聞。

Task 2：虛假新聞圖片檢測(cè)：虛假新聞圖片是指虛假新聞中的配圖。在虛假新聞中，新聞配圖往往也包含著豐富的信息，有助于虛假新聞的判別。具體任務(wù)為：給定一張圖片，要求參賽者判斷該圖片是虛假新聞圖片還是真實(shí)新聞圖片。

Task 3：虛假新聞多模態(tài)檢測(cè)：隨著多媒體技術(shù)的發(fā)展，新聞當(dāng)中通常都包含著文本與圖片等多模態(tài)信息，不同模態(tài)之間既存在著增強(qiáng)關(guān)系，同時(shí)也包含著互補(bǔ)信息。如何充分利用多模態(tài)信息進(jìn)行虛假新聞檢測(cè)仍是一項(xiàng)具有挑戰(zhàn)的工作，為此，我們?cè)O(shè)立虛假新聞多模態(tài)檢測(cè)子任務(wù)以促進(jìn)該領(lǐng)域研究。具體任務(wù)為：給定一條新聞的多模態(tài)內(nèi)容，包括文本、配圖、用戶特征等，要求參賽者判斷該新聞屬于虛假新聞還是真實(shí)新聞。

?? 參考論文清單

為便于參賽選手了解已有方法，主辦方整理了參考論文清單：

• Jin Z, Cao J, Zhang Y, et al. Newsverification by exploiting conflicting social viewpoints in microblogs. AAAI2016.

• Jin, Z., Cao, J., Zhang, Y., Zhou, J.,& Tian, Q. Novel visual and statistical image features for microblogs newsverification. TMM, 19(3).

• Jin, Z., Cao, J., Guo, H., Zhang, Y.,& Luo, J. Multimodal fusion with recurrent neural networks for rumordetection on microblogs. MM 2017.

• Guo H, Cao J, Zhang Y, et al. Rumordetection with hierarchical social attention network. CIKM 2018.

• Qi P, Cao J, Yang T, et al. ExploitingMulti-domain Visual Information for Fake News Detection. ICDM 2019.

• Guo C, Cao J, Zhang X, et al.Exploiting Emotions for Fake News Detection on Social Media. arXiv:1903.01728.

除了首批發(fā)布的數(shù)據(jù)外，其余 8 道賽題將于未來兩個(gè)月內(nèi)陸續(xù)發(fā)布。北京智源人工智能研究院副院長(zhǎng)、清華大學(xué)計(jì)算機(jī)系教授唐杰表示：“本次智源的數(shù)據(jù)算法大賽，一方面促進(jìn)了數(shù)據(jù)共享，提升數(shù)據(jù)使用效率，另一方面以賽代訓(xùn)，提升了廣大學(xué)生和工程人員的技術(shù)水平，很有意義。”

人工智能正以前所未有的速度改變這個(gè)世界，也在改變我們探索自然，連接彼此，生產(chǎn)內(nèi)容，制造產(chǎn)品的方式。業(yè)內(nèi)人士普遍認(rèn)為，依托北京智源人工智能研究院強(qiáng)大的科研實(shí)力和數(shù)據(jù)開放計(jì)劃，2019 智源人工智能算法大賽將成為促進(jìn)學(xué)科交叉，推動(dòng)算法進(jìn)展，發(fā)掘潛力人才的重要活動(dòng)。

來源 | BAAI

啟智社區(qū)，確實(shí)給力

資訊

智源人工智能算法大賽開鑼，百萬獎(jiǎng)金激勵(lì) AI 算法創(chuàng)新