面向水利元數(shù)據(jù)的動態(tài)分面搜索引擎設計.doc
約70頁DOC格式手機打開展開
面向水利元數(shù)據(jù)的動態(tài)分面搜索引擎設計, 2.86萬字70頁 原創(chuàng)作品,通過查重系統(tǒng) 摘要傳統(tǒng)的水利數(shù)據(jù)檢索以關鍵字搜索為主。但是水利行業(yè)隨著信息化的發(fā)展,各級部門都積累了大量的數(shù)據(jù),由于各部門采集手段、采集時間、處理方式的不同導致水利數(shù)據(jù)呈現(xiàn)異構的特征。用戶需要在短時間內(nèi)從海量的異構水利元數(shù)據(jù)中查找出自己所需要的數(shù)據(jù),已...
內(nèi)容介紹
此文檔由會員 第二波打卡 發(fā)布
面向水利元數(shù)據(jù)的動態(tài)分面搜索引擎設計
2.86萬字 70頁 原創(chuàng)作品,通過查重系統(tǒng)
摘要
傳統(tǒng)的水利數(shù)據(jù)檢索以關鍵字搜索為主。但是水利行業(yè)隨著信息化的發(fā)展,各級部門都積累了大量的數(shù)據(jù),由于各部門采集手段、采集時間、處理方式的不同導致水利數(shù)據(jù)呈現(xiàn)異構的特征。用戶需要在短時間內(nèi)從海量的異構水利元數(shù)據(jù)中查找出自己所需要的數(shù)據(jù),已經(jīng)不是簡單的關鍵字檢索所所能夠滿足的。在大多數(shù)情況下,用戶對被搜索的水利對象沒有預先地認識,而海量的搜索結(jié)果可能會淹沒用戶。分面搜索是利用物體的多維度屬性,將搜索結(jié)果進行聚類,它能夠使用戶快速地熟悉被搜索對象的關鍵屬性,并能夠引導用戶對搜索結(jié)果進行篩選。它的出現(xiàn)解決了傳統(tǒng)搜索方法的不足,并為大量數(shù)據(jù)的信息檢索奠定了基礎。
如何將最有意義的分面推薦給用戶是本文研究的重點內(nèi)容。傳統(tǒng)的分面推薦方法主要依據(jù)覆蓋率、分布熵、相關性。本文提出了利用保持率來推薦分面,通過保持率衡量分面值和分面之間的相關性,將保持率和覆蓋率相結(jié)合設計出一個公式來計算分面得分的分值,根據(jù)分值的大小推薦分面。
本文利用自行設計的算法,開發(fā)了一個面向水利元數(shù)據(jù)的動態(tài)分面搜索引擎。該搜索引擎能夠通過關鍵字準確地檢索出相關水利對象,并為用戶推薦合適的分面。通過采集長江水利委員會數(shù)據(jù)資源的元數(shù)據(jù)建立資源目錄,對本文所設計的系統(tǒng)進行實驗分析。
關鍵詞:水利數(shù)據(jù);分面搜索;關鍵字搜索;分面推薦;覆蓋率;相關性;分布熵;保持率
2.86萬字 70頁 原創(chuàng)作品,通過查重系統(tǒng)
摘要
傳統(tǒng)的水利數(shù)據(jù)檢索以關鍵字搜索為主。但是水利行業(yè)隨著信息化的發(fā)展,各級部門都積累了大量的數(shù)據(jù),由于各部門采集手段、采集時間、處理方式的不同導致水利數(shù)據(jù)呈現(xiàn)異構的特征。用戶需要在短時間內(nèi)從海量的異構水利元數(shù)據(jù)中查找出自己所需要的數(shù)據(jù),已經(jīng)不是簡單的關鍵字檢索所所能夠滿足的。在大多數(shù)情況下,用戶對被搜索的水利對象沒有預先地認識,而海量的搜索結(jié)果可能會淹沒用戶。分面搜索是利用物體的多維度屬性,將搜索結(jié)果進行聚類,它能夠使用戶快速地熟悉被搜索對象的關鍵屬性,并能夠引導用戶對搜索結(jié)果進行篩選。它的出現(xiàn)解決了傳統(tǒng)搜索方法的不足,并為大量數(shù)據(jù)的信息檢索奠定了基礎。
如何將最有意義的分面推薦給用戶是本文研究的重點內(nèi)容。傳統(tǒng)的分面推薦方法主要依據(jù)覆蓋率、分布熵、相關性。本文提出了利用保持率來推薦分面,通過保持率衡量分面值和分面之間的相關性,將保持率和覆蓋率相結(jié)合設計出一個公式來計算分面得分的分值,根據(jù)分值的大小推薦分面。
本文利用自行設計的算法,開發(fā)了一個面向水利元數(shù)據(jù)的動態(tài)分面搜索引擎。該搜索引擎能夠通過關鍵字準確地檢索出相關水利對象,并為用戶推薦合適的分面。通過采集長江水利委員會數(shù)據(jù)資源的元數(shù)據(jù)建立資源目錄,對本文所設計的系統(tǒng)進行實驗分析。
關鍵詞:水利數(shù)據(jù);分面搜索;關鍵字搜索;分面推薦;覆蓋率;相關性;分布熵;保持率