摘要
目標:本研究目的在於建置護理紀錄語料庫與辭典,並評估語音辨識應用於護理紀錄時之可行性。方法:本研究捨棄傳統的紙本資料,直接向台灣中部某護理紀錄全面電子化之醫學中心申請護理紀錄電子檔做為訓練語料;收集自2007 年7月至2008年5月間之護理紀錄,包括7個加護單位及5個一般病房。本研究使用中央研究院之中文斷詞系統與未知詞擷取系統做為工具,分為三個階段進行研究:第一階段為建置護理紀錄語料庫,第二階段為建置護理紀錄辭典,第三階段分別建立兩組語言模型並計算其混淆度做為第一、二階段之評值。結果:共得到1,000,000筆之護理紀錄語料庫與974個詞的護理紀錄辭典,語言模型之語言混淆度相對差異值約為15.541%。結論:本研究所建置之護理紀錄辭典對語音辨識的影響屬於值得注意的成果。
貢獻的翻譯標題 | Building a Routine Nursing Records Corpus, Lexicon andIts Application in the Speech Recognition |
---|---|
原文 | ???core.languages.zh_TW??? |
頁(從 - 到) | 25-35 |
期刊 | 醫療資訊雜誌 |
卷 | 20 |
發行號 | 2 |
DOIs | |
出版狀態 | Published - 6月 2011 |
Keywords
- 護理紀錄語料庫
- 護理紀錄辭典
- 語言模型
- 語音辨識