西文自動摘要軟件的開發(fā).doc
約36頁DOC格式手機打開展開
西文自動摘要軟件的開發(fā),western autosummary software development1.2萬字 36頁 原創(chuàng)作品,已通過查重系統(tǒng)目錄第一章 緒 論71.1 課題背景與意義71.2 國內(nèi)外研究現(xiàn)狀81.3 主要研究內(nèi)容與特點81.4 論文的組織結(jié)構(gòu)9第二章 系統(tǒng)開發(fā)工具及關(guān)鍵技術(shù)92.1eclipse工...
內(nèi)容介紹
此文檔由會員 馬甲線女神 發(fā)布
西文自動摘要軟件的開發(fā)
Western AutoSummary software development
1.2萬字 36頁 原創(chuàng)作品,已通過查重系統(tǒng)
目 錄
第一章 緒 論 7
1.1 課題背景與意義 7
1.2 國內(nèi)外研究現(xiàn)狀 8
1.3 主要研究內(nèi)容與特點 8
1.4 論文的組織結(jié)構(gòu) 9
第二章 系統(tǒng)開發(fā)工具及關(guān)鍵技術(shù) 9
2.1 Eclipse工具 9
2.2 java語言 10
2.3 Ik分詞器 10
2.4 TF-IDF算法 10
第三章 可行性分析 11
3.1 社會可行性 11
3.2 經(jīng)濟(jì)可行性 11
3.3 技術(shù)可行性 12
第四章 軟件需求分析 12
4.1 開發(fā)背景 12
4.2 設(shè)計目標(biāo)與原則 12
4.3 性能需求分析 13
4.4 技術(shù)難點 14
第五章 軟件設(shè)計 14
5.1 設(shè)計思想 14
5.2 模塊設(shè)計 14
5.2.1 預(yù)處理模塊 15
5.2.2 分詞模塊 15
5.2.3 統(tǒng)計模塊 15
5.2.4 提取摘要模塊 16
5.2.5 輸出摘要模塊 17
第六章 軟件實現(xiàn) 17
6.1 西文自動摘要軟件流程 17
6.2 各功能模塊實現(xiàn) 17
6.2.1 預(yù)處理模塊 19
6.2.2 分詞模塊 22
6.2.3 統(tǒng)計模塊 24
6.2.4 提取摘要模塊 27
6.2.5 輸出摘要模塊 29
第七章 總結(jié)與展望 33
7.1 論文完成情況 33
7.2 以后要做的工作 33
致謝 34
參考文獻(xiàn) 35
摘 要 自動摘要是計算機語言學(xué)和情報科學(xué)共同關(guān)注的課題其本質(zhì)是信息的挖掘和信息的濃縮。從理論上講對自動摘要的研究將有助于探討人類理解、概括自然語言文本并從中獲取知識的認(rèn)識模型。自動摘要被認(rèn)為是計算機實現(xiàn)自然語言理解的重要標(biāo)志之一。從應(yīng)用角度講在文獻(xiàn)電子化和工nternet迅速發(fā)展的今天自動摘要軟件的使用將大幅度降低編制摘要的成本縮短文摘的出版周期為人們廉價、迅速和準(zhǔn)確地獲得所需要的信息提供方便。本文設(shè)計的西文自動摘要軟件采用自動摘錄原文中句子方法它將文本視為句子的線性序列將句子視為詞的線性序列。然后通過計算句子的權(quán)值對原文中的所有句子按權(quán)值高低降序排列權(quán)值最高的若干句子被確定為文摘句然后將所有文摘句按照它們在原文中的出現(xiàn)順序輸出。系統(tǒng)基于Eclipse平臺開發(fā)實現(xiàn)。該系統(tǒng)直接在計算機上進(jìn)行文章摘要的自動生成要實現(xiàn)的功能就是給定一個文檔后經(jīng)過統(tǒng)計分析給出文檔的摘要句并依照原文順序依次輸出。系統(tǒng)力求摘要句抓住原文的核心內(nèi)容語句連貫不遺漏題。
關(guān)鍵詞:自動摘要 線性序列 權(quán)值 文摘句
Western AutoSummary software development
1.2萬字 36頁 原創(chuàng)作品,已通過查重系統(tǒng)
目 錄
第一章 緒 論 7
1.1 課題背景與意義 7
1.2 國內(nèi)外研究現(xiàn)狀 8
1.3 主要研究內(nèi)容與特點 8
1.4 論文的組織結(jié)構(gòu) 9
第二章 系統(tǒng)開發(fā)工具及關(guān)鍵技術(shù) 9
2.1 Eclipse工具 9
2.2 java語言 10
2.3 Ik分詞器 10
2.4 TF-IDF算法 10
第三章 可行性分析 11
3.1 社會可行性 11
3.2 經(jīng)濟(jì)可行性 11
3.3 技術(shù)可行性 12
第四章 軟件需求分析 12
4.1 開發(fā)背景 12
4.2 設(shè)計目標(biāo)與原則 12
4.3 性能需求分析 13
4.4 技術(shù)難點 14
第五章 軟件設(shè)計 14
5.1 設(shè)計思想 14
5.2 模塊設(shè)計 14
5.2.1 預(yù)處理模塊 15
5.2.2 分詞模塊 15
5.2.3 統(tǒng)計模塊 15
5.2.4 提取摘要模塊 16
5.2.5 輸出摘要模塊 17
第六章 軟件實現(xiàn) 17
6.1 西文自動摘要軟件流程 17
6.2 各功能模塊實現(xiàn) 17
6.2.1 預(yù)處理模塊 19
6.2.2 分詞模塊 22
6.2.3 統(tǒng)計模塊 24
6.2.4 提取摘要模塊 27
6.2.5 輸出摘要模塊 29
第七章 總結(jié)與展望 33
7.1 論文完成情況 33
7.2 以后要做的工作 33
致謝 34
參考文獻(xiàn) 35
摘 要 自動摘要是計算機語言學(xué)和情報科學(xué)共同關(guān)注的課題其本質(zhì)是信息的挖掘和信息的濃縮。從理論上講對自動摘要的研究將有助于探討人類理解、概括自然語言文本并從中獲取知識的認(rèn)識模型。自動摘要被認(rèn)為是計算機實現(xiàn)自然語言理解的重要標(biāo)志之一。從應(yīng)用角度講在文獻(xiàn)電子化和工nternet迅速發(fā)展的今天自動摘要軟件的使用將大幅度降低編制摘要的成本縮短文摘的出版周期為人們廉價、迅速和準(zhǔn)確地獲得所需要的信息提供方便。本文設(shè)計的西文自動摘要軟件采用自動摘錄原文中句子方法它將文本視為句子的線性序列將句子視為詞的線性序列。然后通過計算句子的權(quán)值對原文中的所有句子按權(quán)值高低降序排列權(quán)值最高的若干句子被確定為文摘句然后將所有文摘句按照它們在原文中的出現(xiàn)順序輸出。系統(tǒng)基于Eclipse平臺開發(fā)實現(xiàn)。該系統(tǒng)直接在計算機上進(jìn)行文章摘要的自動生成要實現(xiàn)的功能就是給定一個文檔后經(jīng)過統(tǒng)計分析給出文檔的摘要句并依照原文順序依次輸出。系統(tǒng)力求摘要句抓住原文的核心內(nèi)容語句連貫不遺漏題。
關(guān)鍵詞:自動摘要 線性序列 權(quán)值 文摘句