?
 
作者:許悅 來源:中國科學報 發布時間:2020/12/2 11:33:27
選擇字號:
論文“太長不想讀”怎么辦?
自動生成一句話摘要的人工智能新軟件問世

 1306455472.jpg

論文太長不想讀怎么辦?一個軟件就可以搞定。

據《自然》報道,一位科學搜索引擎的創造者推出了一款軟件,可自動為研究論文概括生成一句話摘要,他們說,這有助于科學家更快地瀏覽論文。

這個免費工具被創建它的團隊稱為TLDRs(“太長,沒讀過”的縮寫),已于日前在科學搜索引擎“語義學者”上投入使用。“語義學者”是美國艾倫人工智能研究所(AI2)創建的搜索引擎。

AI2語義學者小組管理者Dan Weld表示,目前,TLDR軟件只用于語義學者所涵蓋的1000萬篇計算機科學論文,軟件經過微調后——預計在12月左右,其他學科的論文應該也能通過該軟件自動生成一句話摘要。

初步測試表明,與查看標題和普通論文摘要相比,TLDR軟件能夠幫助讀者更快對搜索結果進行排序,尤其是在手機上。“人們似乎真的很喜歡這個工具。”Weld說。

Weld創造TLDR軟件的靈感來源于同事在推特上分享的一些標記文章的簡短句子。與其他語言生成軟件一樣,該工具采用基于大量文本的深層神經網絡學習。研究團隊創建了數萬篇與標題匹配的研究論文,這樣網絡就可以學會生成簡潔的句子。然后,研究人員對該軟件進行微調,訓練一個新的數據集,將論文和摘要匹配起來,這些數據集由幾千篇計算機科學論文組成,其中一些論文的摘要由論文作者撰寫,另一些論文摘要則由本科生撰寫。該團隊已經收集了一些培訓實例,以提高該軟件在其他16個研究領域的性能,其中生物醫學可能是第一位的。

一份描述TLDR軟件的論文4月1日在預印本平臺arXiv上首次發布,并在11月接受同行評審后發表。研究人員已經免費提供了代碼,還有一個可以使用該軟件的演示網站,任何人都可以試用這個工具。

“我預測這種工具在不久的將來會成為學術搜索的標準功能。事實上,考慮到需求,我很驚訝過了這么久才將其投入實際應用。”華盛頓大學信息科學家Jevin West說,他應《自然》的要求對該工具進行了測試。“這個工具并不完美,但絕對是朝著正確方向邁出的一步。”

 
版權聲明:凡本網注明“來源:中國科學報、科學網、科學新聞雜志”的所有作品,網站轉載,請在正文上方注明來源和作者,且不得對內容作實質性改動;微信公眾號、頭條號等新媒體平臺,轉載請聯系授權。郵箱:shouquan@stimes.cn。
 
 打印  發E-mail給: 
    
 
相關新聞 相關論文
?
圖片新聞
肥胖削弱抗癌防御系統 “糖衣”告訴細胞何時造血
火星像個夾心蛋糕 “玻璃碎片”是如何在細胞內形成的
>>更多
 
一周新聞排行 一周新聞評論排行
 
編輯部推薦博文
 
国产成人精品日本亚洲_国产高清在线a视频大全_国产肥熟女视频一区二区