自然語言處理與醫療文本的知識抽取

劉永彬歐陽純萍

預覽內頁

出版商: 人民郵電
出版日期: 2023-10-01
定價: $539
售價: 8.5 折 $458
語言: 簡體中文
頁數: 192
ISBN: 7115612277
ISBN-13: 9787115612274
相關分類: Text-mining

立即出貨

買這商品的人也買了...

~~$580~~ $458

深度學習｜生命科學應用 (Deep Learning for the Life Sciences)
~~$480~~ $408

從 AI 到智慧醫療
~~$1,068~~ $1,015

高速數字接口與光電測試
~~$774~~ $735

TensorFlow 2.x 高級電腦視覺
$356

邊緣計算理論與系統實踐：基於 CNCF KubeEdge 的實現
~~$480~~ $379

圖解 AI 人工智慧
$792

分佈式機器學習 — 系統、工程與實戰
$417

擴散模型從原理到實戰
~~$468~~ $445

測試系統構建技術 — 基於 C++ 和 Qt 的框架軟件
~~$560~~ $442

從 AI 到生成式 AI：40個零程式的實作體驗，培養新世代人工智慧素養
~~$480~~ $379

AI 醫療革命：GPT-4 與未來
$469

多模態深度學習技術基礎
~~$680~~ $537

可觀測性工程｜達成卓越營運 (Observability Engineering: Achieving Production Excellence)
~~$720~~ $569

Hugging Face 模型及資料大公開 - 利用 BERT 建立全中文 NLP 應用
~~$720~~ $569

GPT 就是這麼來的 - 最新自然語言處理技術詳解
$570

多模態大模型：技術原理與實戰
~~$480~~ $379

完全圖解人工智慧：零基礎也OK！從NLP、圖像辨識到生成模型，現代人必修的53堂AI課
~~$880~~ $660

跟 NVIDIA 學深度學習！從基本神經網路到 ......、GPT、BERT...，紮穩機器視覺與大型語言模型 (LLM) 的建模基礎
~~$980~~ $774

新範式來臨 - 用 PyTorch 了解 LLM 開發微調 ChatGLM 全過程
$888

農林機械控制系統軟件功能安全標準解析與實踐
~~$580~~ $458

前端開發測試入門｜現在知道也還不遲的自動化測試策略必備知識
~~$880~~ $695

LLM 走進你的電腦 - 自己動手開發大型語言模型應用
~~$468~~ $445

臨床診療人工智能 — 可解釋、可通用的臨床決策支持系統
~~$654~~ $621

智慧汽車電子與軟件：開發方法、系統整合、流程系統與專案管理
~~$474~~ $450

UML 2.5基礎、建模與設計實踐

商品描述

　　本書主要介紹自然語言處理技術在醫療信息領域尤其是電子病歷文本中的應用。本書首先對一些基礎知識和技術做了介紹，然後給出相關技術在醫療信息領域的應用案例。本書還介紹了知識抽取的一些前沿技術與實踐。

　　本書內容分為四大部分：基礎知識、知識抽取、醫療電子病歷研究與實踐，以及前沿技術與實踐。

　　第一部分包括第1～3章，主要介紹自然語言處理的基礎知識、技術發展路線、相關任務以及詞表示模型等。

　　第二部分包括第4～9章，主要介紹知識抽取的相關任務和技術，其中包括實體識別、關系抽取、領域自適應、多模態、小樣本和實體與關系聯合抽取等。

　　第三部分包括第10～12章，主要介紹自然語言處理技術在醫療文本領域的應用，其中包括電子病歷實體關系分類體系、ICD（International Classification of Diseases，國際疾病分類）編碼、電子病歷事件元素抽取等。

　　第四部分包括第13～15章，主要介紹知識抽取的一些前沿技術及應用，如因果關系發現、小樣本知識抽取及其在醫療知識抽取中的應用等。

　　本書可作為高校相關專業師生的學慣用書和培訓機構的教材，以及希望深入研究自然語言處理算法的電腦工程師的參考書，也可作為對人工智能、深度學習和自然語言處理感興趣的初學者與希望把人工智能應用到醫療領域的研究者學慣用書。

作者簡介

劉永彬，博士、副教授，中國電腦學會-自然語言處理專業委員會執行委員，中國中文信息學會-語言與知識計算專業委員會委員，中國中文信息學會-自然語言生成與智能寫作專業委員會委員，中國人工智能學會-青年工作委員會委員，中國人工智能學會-教育工作委員會委員；主要研究信息抽取、知識圖譜構建，以及在醫療大數據、科學大數據和企業智能化信息服務等領域的應用；國際期刊Data Intelligence （MIT出版社）編委；多個CCF推薦國際會議PC（ACL，EMNLP，COLING，CIKM，NLPCC）；多個國際期刊審稿人；參與IEEE國際標準《知識圖譜架構》和國家標準《信息技術人工智能知識圖譜技術框架》的制定。

歐陽純萍，博士，教授，中文信息學會-語言與知識計算專業委員會委員，湖南省普通高校青年骨乾教師，湖南省大學電腦教學指導委員會委員。湖南省線下、線上優質本科課程、課程思政示範課程負責人，湖南省研究生精品思政課程負責人。曾獲湖南省高等教育教學成果一等獎，湖南省教育教學改革發展優秀成果二等獎，湖南省電腦學會高等教育教學成果二等獎，中國電子學會電子信息科學技術三等獎。研究方向為網絡表示學習和知識圖譜及其在醫藥關系發現和疾病診療預測等領域的應用研究。參與IEEE國際標準《知識圖譜架構》和國家標準《信息技術人工智能知識圖譜技術框架》的制定。

目錄大綱

目　錄　　

第一部分　基礎知識

第 1章　自然語言處理技術　2

1.1　自然語言處理概述　2

1.2　數據標註任務　3

1.2.1　數據標註之中文分詞　3

1.2.2　數據標註之詞性標註　4

1.3　詞表示學習任務　5

1.3.1　詞表示方法的類型　5

1.3.2　詳解詞的分佈式表示　6

1.3.3　詞嵌入　7

1.4　實體識別任務　9

1.5　關系抽取任務　10

1.6　事件抽取任務　12

1.7　預訓練模型　14

1.8　小樣本學習　16

1.9　領域自適應　18

1.10　多模態任務　20

1.11　對話任務　23

1.11.1　生成式對話　23

1.11.2　任務導向型對話　24

1.12　本書結構　26

　參考文獻　26

第 2章　從統計機器學習模型到神經網絡模型　28

2.1　統計機器學習方法的三要素　28

2.2　隱馬爾可夫模型　28

2.3　支持向量機　30

2.4　條件隨機場　34

2.5　前饋神經網絡　37

2.6　反饋神經網絡　42

2.6.1　循環神經網絡　42

2.6.2　遞歸神經網絡　43

2.6.3　Hopfield神經網絡　44

2.6.4　長短期記憶網絡　45

2.7　註意力模型　47

2.7.1　註意力　47

2.7.2　Encoder-Decoder框架　47

2.7.3　軟註意力　49

2.7.4　硬註意力　50

2.7.5　自註意力　51

2.8　Transformer模型　53

2.9　圖神經網絡模型　55

　參考文獻　57

第3章　詞表示學習　59

3.1　分佈假設與分佈式表示　59

3.2　詞向量模型CBOW　60

3.3　詞向量模型Skip-Gram　61

　參考文獻　62

第二部分　知識抽取

第4章　實體識別　64

4.1　基於捲積神經網絡的實體識別　64

4.2　基於循環神經網絡的實體識別　67

4.3　基於Transformer的實體識別模型　70

　參考文獻　72

第5章　關系抽取　73

5.1　基於註意力的關系抽取模型　73

5.2　基於集成學習的關系抽取模型　76

5.3　基於預訓練的關系抽取模型　78

5.4　基於Transformer的關系抽取模型　81

5.5　基於GCN的關系抽取模型　82

　參考文獻　84

第6章　領域自適應　86

6.1　DAN模型　86

6.2　DANN模型　87

6.3　DSN模型　90

　參考文獻　92

第7章　多模態任務　93

7.1　多模態數據　93

7.2　多模態融合技術　95

7.3　多模態融合技術面臨的挑戰　98

　參考文獻　99

第8章　小樣本學習　100

8.1　數據增強　100

8.2　遠程監督　102

8.3　元學習　103

　參考文獻　106

第9章　實體與關系聯合抽取　107

9.1　參數共享模式　108

9.2　新標註策略模式　110

9.3　關系重疊問題　111

　參考文獻　112

第三部分　醫療電子病歷研究與實踐

第 10章　電子病歷研究背景　114

10.1　電子病歷概述　114

10.2　電子病歷文本類型　115

10.3　電子病歷實體分類體系　115

10.4　電子病歷實體關系分類體系　116

10.5　電子病歷隱私實體分類體系　117

10.6　ICD編碼　118

10.7　電子病歷ICD自動編碼實踐　119

10.8　電子病歷實體識別實踐　122

　參考文獻　131

第 11章　電子病歷的事件抽取　132

11.1　電子病歷中的事件　132

11.2　電子病歷事件觸發詞識別　133

11.3　電子病歷事件觸發詞抽取實踐　134

11.3.1　文本預處理　134

11.3.2　引入依存句法特徵的動態多池化模型　136

11.3.3　動態多池化捲積神經網絡　138

11.3.4　實驗結果分析　140

11.4　電子病歷事件元素抽取　141

11.4.1　電子病歷事件元素角色類別的定義　141

11.4.2　電子病歷事件元素抽取實踐　142

11.4.3　句子編碼　142

11.4.4　混合句法特徵的圖神經網絡　144

　參考文獻　146

第 12章　醫療對話摘要生成　147

12.1　基於情景記憶網絡的編碼標記模型　148

12.1.1　情景記憶網絡　149

12.1.2　基於情景記憶網絡的分層標記模型　150

12.1.3　實驗　151

12.2　醫療對話摘要的未來　155

　參考文獻　155

第四部分　前沿技術與實踐

第 13章　因果推斷技術　158

13.1　電子病歷中的因果關系　158

13.2　因果方法　158

13.2.1　因果推斷　158

13.2.2　將因果關系發現與不同研究方向結合　160

13.2.3　將因果關系發現應用於不同領域　161

13.2.4　典型的因果推斷技術　161

13.3　電子病歷中的因果推斷技術　165

　參考文獻　166

第 14章　小樣本學習實體識別實踐　167

14.1　問題定義　167

14.2　方法　169

14.2.1　原型網絡　169

14.2.2　字符感知　170

14.2.3　句子感知　171

14.2.4　聯合學習策略　172

14.3　實驗　172

14.3.1　數據集　172

14.3.2　超參數設置　173

14.3.3　基線模型　173

14.3.4　整體實驗結果　174

14.3.5　收斂速度驗證　174

14.3.6　消融研究　176

14.3.7　整體實驗結果　177

14.3.8　錯誤指標分析　179

　參考文獻　180

第 15章　小樣本實體關系抽取實踐　181

15.1　問題定義　182

15.2　方法　182

15.2.1　原型網絡　183

15.2.2　特徵級註意力　184

15.2.3　深度集成策略　185

15.2.4　微調策略　185

15.3　實驗　186

15.3.1　數據集　186

15.3.2　超參數設置　186

15.3.3　基線模型　187

15.3.4　整體實驗結果　187

15.3.5　交叉驗證　189

15.3.6　消融研究　190

參考文獻　192