清華大學(xué)人工智能研究院成立智能信息獲取研究中心,進一步促進產(chǎn)學(xué)合作!
2019 年 6 月 19 日,清華大學(xué)人工智能研究院智能信息獲取研究中心成立儀式暨學(xué)術(shù)交流會在信息科學(xué)技術(shù)大樓多功能廳舉行。這是繼知識智能研究中心、聽覺智能研究中心、基礎(chǔ)理論研究中心、智能機器人研究中心、智能人機交互研究中心之后成立的第六個研究中心。清華大學(xué)副校長、人工智能研究院管委會主任尤政院士,人工智能研究院院長張鈸院士出席成立儀式并共同為中心揭牌,并為智能信息獲取研究中心主任計算機系馬少平教授頒發(fā)了聘書。
尤政院士與張鈸院士共同為智能信息獲取研究中心揭牌
尤政院士與張鈸院士致辭
成立儀式在人工智能研究院常務(wù)副院長孫茂松教授的主持下,首先請清華大學(xué)副校長、人工智能研究院管委會主任尤政院士與人工智能研究院院長張鈸院士為清華大學(xué)人工智能研究院智能信息獲取研究中心的成立致辭。
尤政院士在致辭中指出,在當(dāng)前信息爆炸時代,人類有限的認知能力和近乎無限的海量信息之間矛盾日益顯著。智能信息獲取研究旨在實現(xiàn)人與信息的高效匹配,在這一領(lǐng)域的技術(shù)突破和應(yīng)用已經(jīng)也必將繼續(xù)對社會發(fā)展和大眾生活產(chǎn)生巨大影響。希望智能信息獲取研究中心更好地集中優(yōu)勢力量,以智能信息處理研究為切入點,取得一批具有重大影響的原創(chuàng)成果,培養(yǎng)一批人工智能領(lǐng)域的優(yōu)秀人才,帶動對人工智能的深入研究與應(yīng)用,更好地服務(wù)于國家和清華的人工智能發(fā)展戰(zhàn)略。
尤政院士致辭
張鈸院士代表清華大學(xué)人工智能研究院致辭。他表示,當(dāng)今社會的信息獲取,尤其是從互聯(lián)網(wǎng)上進行信息獲取,幾乎成為了每個人生活與工作不可或缺的部分。信息獲取研究中心團隊近 20 年中在相關(guān)研究領(lǐng)域已經(jīng)取得了顯著成績,但也還有很多待研究解決的新問題等待著我們?nèi)タ朔0l(fā)展人工智能的理論與技術(shù)是極其艱難的,并非一朝一夕能夠完成,希望研究中心繼續(xù)努力,為國家與社會做出更大的貢獻。
張鈸院士致辭
致辭結(jié)束后,尤政院士與張鈸院士在大家的熱烈掌聲之下,共同為智能信息獲取研究中心揭牌。然后向智能信息獲取研究中心主任計算機系馬少平教授頒發(fā)了聘書,同時聘請新加坡國立大學(xué)蔡達成教授與加拿大蒙特利爾大學(xué)聶建云教授作為學(xué)術(shù)顧問。
全面揭曉智能信息獲取研究中心
緊接啟動儀式之后,智能信息獲取研究中心主任馬少平教授向我們介紹了中心的各方面情況,包括關(guān)注領(lǐng)域、研究內(nèi)容以及人員構(gòu)成。馬教授表示,智能信息獲取研究中心旨在研究如何智能地幫助人們更簡單和高效地獲得、分析和處理信息:
3 個關(guān)注重點
- 開展相關(guān)理論研究:結(jié)合認知心理學(xué)、經(jīng)濟學(xué)等相關(guān)領(lǐng)域,探究人類信息獲取行為的內(nèi)在規(guī)律,研究支持智能信息獲取、處理和分析的基礎(chǔ)理論和方法;
- 構(gòu)建數(shù)據(jù)計算平臺:建設(shè)包含互聯(lián)網(wǎng)數(shù)據(jù)、用戶行為數(shù)據(jù)的數(shù)據(jù)平臺和支持智能檢索、個性化推薦、智能問答、對話系統(tǒng)的智能計算平臺;
- 促進學(xué)術(shù)交流合作:舉辦開放的、國際化的與人工智能和信息獲取相關(guān)學(xué)術(shù)活動,增進學(xué)術(shù)交流;普及智能信息獲取和處理分析技術(shù),促進產(chǎn)學(xué)合作。
主要研究內(nèi)容
- 智能信息檢索:理解用戶背后多樣化信息需求來幫助用戶快速有效地訪問和利用海量互聯(lián)網(wǎng)信息;
- 個性化推薦與用戶建模:挖掘用戶屬性、興趣偏好,主動為每個用戶對信息進行智能過濾和推薦,解決信息過載的問題;
- 智能問答和智能對話系統(tǒng):得用戶能夠通過問答、對話等更自然的方式與信息系統(tǒng)進行交互;
- 用戶行為分析與挖掘:通過對海量用戶在線行為信息進行收集、處理和挖掘,利用其中蘊含的豐富群體智慧信息開展用戶行為分析,形成信息閉環(huán),不斷提升智能信息獲取系統(tǒng)的性能。
馬少平教授介紹智能信息獲取研究中心情況
6 個代表性成果
- 基于用戶的搜索引擎新能評價及滿意度分析:如何在存在諸多偏置的環(huán)境下對搜索引擎的性能進行有效和準(zhǔn)確的評價是一個挑戰(zhàn)性的問題,中心基于收益與代價因素,設(shè)計二者融合的用戶滿意度研究體系與用戶停止評價策略。相關(guān)研究獲得了頂級國際會議 SIGIR2017 的最佳學(xué)生論文獎。
- 針對互聯(lián)網(wǎng)搜索的深度點擊模型與異質(zhì)結(jié)果排序:搜索結(jié)果頁中豐富多樣的多模態(tài)結(jié)果(文本、圖像、視頻、新聞、百科知識……)使得傳統(tǒng)基于文本相似度的排序方式面臨極大挑戰(zhàn),中心基于文本、視覺以及結(jié)構(gòu)等多種類型的信息,對異質(zhì)結(jié)果進行重排序。相關(guān)研究論文在重要國際會議 CIKM 2018 上獲得全面最佳論文獎。
- 個性化推薦中的用戶行為和滿意度研究:用戶的行為被廣泛應(yīng)用于推薦系統(tǒng)的訓(xùn)練和評價中,但其與用戶實際偏好和滿意度之間存在差異。針對該問題,中心設(shè)計了深入的用戶實驗并結(jié)合大規(guī)模真實日志分析,全面探究了行為、偏好和滿意度之間的關(guān)系,并引入質(zhì)量和用戶負向體驗的效應(yīng),改善了隱式反饋的構(gòu)建和在線評價指標(biāo),提出了質(zhì)量和負向體驗的識別模型。相關(guān)研究論文發(fā)表在 SIGIR 2018,WWW 2019,SIGIR 2019 等頂級會議上。
- 可解釋的推薦算法研究及應(yīng)用:推薦結(jié)果的可解釋性一直是推薦領(lǐng)域重點關(guān)注的研究內(nèi)容。針對這一課題,一方面,中心嘗試從用戶的主觀偏好來解釋推薦結(jié)果,利用用戶的歷史評論和社交關(guān)系等信息給出推薦解釋;另一方面,中心還從知識圖譜中挖掘除了商品間的關(guān)系信息,嘗試?yán)眠@些客觀的商品互補/互斥關(guān)系來進行推薦的解釋。相關(guān)研究論文發(fā)表在 WSDM 2015,CIKM 2018,WWW 2018,WWW 2019 等頂級國際會議上。
- 常識知識驅(qū)動的開放領(lǐng)域?qū)υ捝桑撼WR只是在許多自然語言處理任務(wù)中起到了至關(guān)重要的作用。此項工作中,我們提出了一種全新的開放領(lǐng)域?qū)υ捝赡P停瑏碚故敬笠?guī)模的常識知識如何促進自然語言的理解與生成。這是將大規(guī)模常識知識引入對話生成任務(wù)的首次嘗試。與其他獨立利用知識庫三元組或?qū)嶓w的模型不同,中心提出了圖注意力模型,將知識圖譜的信息結(jié)構(gòu)化地作為一個整體進行表示。相關(guān)研究論文在頂級國際會議 IJCAI 2018 上獲杰出論文獎。
- 情緒化聊天機器人:情緒智能是人類智能行為的重要特征。在對話系統(tǒng)中感知情緒和表達情緒對于提高對話系統(tǒng)的一致性和交互性十分重要。中心提出了情緒化對話內(nèi)容生成模型,首次在大規(guī)模神經(jīng)對話生成模型中考慮了情感因素,并采取情緒狀態(tài)嵌入、內(nèi)部記憶、外部記憶等技術(shù)控制文本中的情感表達。論文發(fā)表在 AAAI 2018。
之后,馬教授還向我們介紹了研究中心開放的數(shù)據(jù)集,包括互聯(lián)網(wǎng)語料,搜索數(shù)據(jù),專業(yè)領(lǐng)域,輸入法語料四方面的資源,可供學(xué)界和業(yè)界研究使用。
五大學(xué)術(shù)專場報告
隨后,學(xué)術(shù)研討交流會進入學(xué)術(shù)專場報告環(huán)節(jié)。首先由來自加拿大蒙特利爾大學(xué)的聶建云教授帶來了題為
「Representation learning in information retrieval – What to represent」的特邀報告。聶建云教授以信息檢索領(lǐng)域中文檔和查詢詞的表示學(xué)習(xí)為切入點,深入探討了傳統(tǒng)的內(nèi)容匹配和基于神經(jīng)網(wǎng)絡(luò)的內(nèi)容表示兩種檢索思路的優(yōu)劣與結(jié)合方式,指出兩類特征對于檢索來說同樣重要。此外,聶教授還特別指出,研究數(shù)據(jù)、匹配信息的融合方式以及知識的應(yīng)用方式在信息檢索研究中仍然是巨大挑戰(zhàn),期待研究中心在相關(guān)領(lǐng)域取得更大突破。

聶建云教授報告
接著由清華大學(xué)張敏副教授圍繞「個性化推薦中的可解釋性與公平性」展開報告。張敏副教授介紹了團隊在特征、評論、商品三個層次上,將用戶產(chǎn)生內(nèi)容及基于知識圖譜的規(guī)則推理學(xué)習(xí)與推薦算法相融合,開展的可解釋性推薦方法研究成果;同時還介紹了在推薦公平性方面,團隊在深入理解用戶行為、改進推薦算法和改善評價指標(biāo)方面的研究工作。她指出,可解釋性和公平性是當(dāng)前信息檢索、特別是個性化推薦領(lǐng)域的研究重點和熱點;而提出可解釋性和公平性是兩個緊密關(guān)聯(lián)的具有挑戰(zhàn)性的問題。這也呼吁更多研究者們一起加入到相關(guān)研究中來,以提升用戶對推薦內(nèi)容的滿意度。
張敏副教授報告
然后是清華大學(xué)劉奕群副教授做了題為「群體智能支撐的互聯(lián)網(wǎng)搜索技術(shù)」的報告。在報告中,劉奕群副教授首先強調(diào)了搜索對信息化社會和信息安全具有重要的意義,并簡要回顧了研究團隊在利用群體智能改進互聯(lián)網(wǎng)搜索技術(shù)方面取得的一系列進展。隨后,劉奕群副教授介紹了團隊在用戶行為指導(dǎo)的機器閱讀模型和相關(guān)性計算兩方面最新研究成果,闡述了通過分析人類認知行為,改進計算模型的新研究范式。
劉奕群副教授報告
來自業(yè)界的搜狗公司副總裁許靜芳博士也帶來了相關(guān)主題的報告——「問答—精準(zhǔn)信息的智能獲取方式」。在報告中,許靜芳博士先簡單介紹了對信息獲取方式的演化歷程,指出隨著交互方式和用戶習(xí)慣的變化,問答引擎在為用戶帶來精準(zhǔn)信息方面扮演著越來越重要的角色。因此,問題的表達、答案的連接和答案的生成是問答研究中面臨的主要挑戰(zhàn)。針對這些挑戰(zhàn),許靜芳博士也向我們介紹了當(dāng)前相關(guān)的研究進展,同時也期待能與研究中心在相關(guān)方向取得更多研究成果。
許靜芳博士報告
最后一個學(xué)術(shù)報告由清華大學(xué)黃民烈副教授針對「對話系統(tǒng)中的強語義、弱語義」做了探討。黃民烈副教授介紹了在智能對話場景下,強語義信息與弱語義信息在相關(guān)研究中的優(yōu)劣和應(yīng)用情況,并展示了當(dāng)前課題組通過結(jié)合知識圖譜信息、神經(jīng)計算等手段在應(yīng)對這些挑戰(zhàn)的研究進展與成果。他指出,語義問題、一致性問題和交互性問題是現(xiàn)在對話機器人研究領(lǐng)域的主要挑戰(zhàn)。
黃民烈副教授報告
本次會議出席嘉賓還有華宇元典公司總經(jīng)理鄒劭坤、首席技術(shù)官李東海等。大會結(jié)束時,馬少平教授對于學(xué)界和業(yè)界同仁的積極參與表示了感謝,并表示智能信息獲取研究中心今后將整合多學(xué)科交叉的優(yōu)勢力量,深入開展相關(guān)研究,以促進清華和國家信息獲取和人工智能研究與發(fā)展為宗旨,打造一個具有廣泛影響力的學(xué)術(shù)研究平臺與學(xué)術(shù)交流中心。
智能信息獲取研究中心成立儀式合影
來源 | 雷鋒網(wǎng)
作者 | 楊鯉萍