機器閱讀理解 (算法與實踐)

朱晨光

買這商品的人也買了...

商品描述

微軟高級研究員撰寫,剖析機器閱讀理解支撐技術、模型架構、前沿算法、模型SDNet源碼與落地應用。
全書分為三篇,共8章內容。
基礎篇(第1~3章),介紹機器閱讀理解的基礎知識和關鍵支撐技術,涵蓋機器閱讀理解任務的定義,
閱讀理解模型中常用的自然語言處理技術和深度學習網絡模塊,
例如如何讓計算機表示文章和問題、做多項選擇題及生成回答等。
架構篇(第4~6章),介紹解決各類機器閱讀理解任務的基本模型架構和前沿算法,
並剖析對機器閱讀理解研究有著重要影響的預訓練模型(如BERT和GPT)。
實戰篇(第7~8章),包括筆者在2018年獲得CoQA對話閱讀理解競賽第一名時所用的模型SDNet的代碼解讀,
機器閱讀理解在各種工業界應用中的具體落地過程和挑戰,以及筆者對於機器閱讀理解未來發展方向的思考。

作者簡介

朱晨光

微軟公司自然語言處理高級研究員、斯坦福大學計算機系博士。
負責自然語言處理研究與開發、對話機器人的語義理解、機器閱讀理解研究等,
精通人工智能、深度學習與自然語言處理,尤其擅長機器閱讀理解、文本總結、對話處理等方向。
帶領團隊負責客服對話機器人的語義理解與分析,進行機器閱讀理解研究,
在斯坦福大學舉辦的SQuAD 1.0機器閱讀理解競賽中獲得全球名,
在CoQA對話閱讀理解競賽中成績超過人類水平並獲得名。
在人工智能和自然語言處理會議ICLR、ACL、EMNLP、NAACL、ICLR中發表多篇文章。

目錄大綱

目錄
序一
序二
前言
第一篇基礎篇
第1章機器閱讀理解與關鍵支撐技術
1.1機器閱讀理解任務
1.1.1機器閱讀理解模型
1.1.2機器閱讀理解的應用
1.2自然語言處理
1.2.1研究現狀
1.2 .2仍需解決的問題
1.3深度學習
1.3.1深度學習的特點
1.3.2深度學習的成果
1.4機器閱讀理解任務的測評方式
1.4.1機器閱讀理解的答案形式
1.4.2自由回答式答案評分標準ROUGE
1.5機器閱讀理解數據集
1.5.1單段落式數據集
1.5.2多段落式數據集
1.5.3文本庫式數據集
1.6機器閱讀理解數據的生成
1.6.1數據集的生成
1.6.2標準答案的生成
1.6.3如何設計高質量的數據集
1.7本章小結

第2章自然語言處理基礎
2.1文本分詞
2.1.1中文分詞
2.1.2英文分詞
2.1.3字節對編碼BPE
2.2語言處理的基石:詞向量
2.2.1詞的向量化
2.2.2 Word2vec詞向量
2.3命名實體和詞性標註
2.3.1命名實體識別
2.3.2詞性標註
2.4語言模型
2.4.1 N元模型
2.4.2語言模型的評測
2.5本章小結

第3章自然語言處理中的深度學習
3.1從詞向量到文本向量
3.1.1利用RNN的最終狀態
3.1.2利用CNN和池化
3.1.3利用含參加權和
3.2讓計算機做選擇題:自然語言理解
3.2.1網絡模型
3.2.2實戰:文本分類
3.3讓計算機寫文章:自然語言生成
3.3.1網絡模型
3.3.2實戰:生成文本
3.3.3集束搜索
3.4讓計算機專心致志:注意力機制
3.4.1注意力機制的計算
3.4.2實戰:利用內積函數計算注意力
3.4.3序列到序列模型
3.5本章小結

第二篇架構篇
第三篇實戰篇