數(shù)據(jù)挖掘技術(shù)概論.doc
約8頁(yè)DOC格式手機(jī)打開(kāi)展開(kāi)
數(shù)據(jù)挖掘技術(shù)概論,頁(yè)數(shù):8字?jǐn)?shù):9004摘要: 本文簡(jiǎn)潔的論述了數(shù)據(jù)挖掘產(chǎn)生的時(shí)代背景,研究現(xiàn)狀,基本術(shù)語(yǔ),及目前的應(yīng)用情況關(guān)鍵字:數(shù)據(jù)挖掘,數(shù)據(jù)倉(cāng)庫(kù),時(shí)代背景近十幾年來(lái),人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,無(wú)數(shù)個(gè)數(shù)據(jù)庫(kù)被用于商業(yè)管理、政府辦公、科學(xué)研究和工程開(kāi)發(fā)等,這一勢(shì)頭仍將持續(xù)發(fā)展下去。...
內(nèi)容介紹
此文檔由會(huì)員 usactu 發(fā)布
數(shù)據(jù)挖掘技術(shù)概論
頁(yè)數(shù):8 字?jǐn)?shù):9004
數(shù)據(jù)挖掘技術(shù)概論
摘要: 本文簡(jiǎn)潔的論述了數(shù)據(jù)挖掘產(chǎn)生的時(shí)代背景,研究現(xiàn)狀,基本術(shù)語(yǔ),及目前的應(yīng)用情況
關(guān)鍵字:數(shù)據(jù)挖掘,數(shù)據(jù)倉(cāng)庫(kù),
時(shí)代背景
近十幾年來(lái),人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,無(wú)數(shù)個(gè)數(shù)據(jù)庫(kù)被用于商業(yè)管理、政府辦公、科學(xué)研究和工程開(kāi)發(fā)等,這一勢(shì)頭仍將持續(xù)發(fā)展下去。于是,一個(gè)新的挑戰(zhàn)被提了出來(lái):在這被稱(chēng)之為信息爆炸的時(shí)代,信息過(guò)量幾乎成為人人需要面對(duì)的問(wèn)題。如何才能不被信息的汪洋大海所淹沒(méi),從中及時(shí)發(fā)現(xiàn)有用的知識(shí),提高信息利用率呢要想使數(shù)據(jù)真正成為一個(gè)公司的資源,只有充分利用它為公司自身的業(yè)務(wù)決策和戰(zhàn)略發(fā)展服務(wù)才行,否則大量的數(shù)據(jù)可能成為包袱,甚至成為垃圾。因此,面對(duì)"人們被數(shù)據(jù)淹沒(méi),人們卻饑餓于知識(shí)"的挑戰(zhàn),數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)(DMKD)技術(shù)應(yīng)運(yùn)而生,并得以蓬勃發(fā)展,越來(lái)越顯示出其強(qiáng)大的生命力。
傳統(tǒng)的數(shù)據(jù)庫(kù)技術(shù)是以單一的數(shù)據(jù)資源,即數(shù)據(jù)庫(kù)為中心,進(jìn)行事務(wù)處理、批處理、決策分析等各種數(shù)據(jù)處理工作,主要的劃分為兩大類(lèi):操作型處理和分析型處理(或信息型處理)。 操作型處理也叫事務(wù)處理,是指對(duì)數(shù)據(jù)庫(kù)聯(lián)機(jī)的日常操作,通常是對(duì)一個(gè)或一組紀(jì)錄的查詢(xún)和修改,主要為企業(yè)的特定應(yīng)用服務(wù)的,注重響應(yīng)時(shí)間,數(shù)據(jù)的安全性和完整性;分析型處理則用于管理人員的決策分析,經(jīng)常要訪問(wèn)大量的歷史數(shù)據(jù)。而傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)優(yōu)于企業(yè)的日常事務(wù)處理工作,而難于實(shí)現(xiàn)對(duì)數(shù)據(jù)分析處理要求,已經(jīng)無(wú)法滿(mǎn)足數(shù)據(jù)處理多樣化的要求。操作型處理和分析型處理的分離成為必然。近年來(lái),隨著數(shù)據(jù)庫(kù)技術(shù)的應(yīng)用和發(fā)展,人們嘗試對(duì)DB中的數(shù)據(jù)進(jìn)行再加工,形成一個(gè)綜合的,面向分析的環(huán)境,以更好支持決策分析,從而形成了數(shù)據(jù)倉(cāng)庫(kù)技術(shù)
數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。還有很多和這一術(shù)語(yǔ)相近似的術(shù)語(yǔ),如從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)知識(shí)(KDD)、數(shù)據(jù)分析、數(shù)據(jù)融合(Data Fusion)以及決策支持等。人們把原始數(shù)據(jù)看作是形成知識(shí)的源泉,就像從礦石中采礦一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識(shí)的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,
頁(yè)數(shù):8 字?jǐn)?shù):9004
數(shù)據(jù)挖掘技術(shù)概論
摘要: 本文簡(jiǎn)潔的論述了數(shù)據(jù)挖掘產(chǎn)生的時(shí)代背景,研究現(xiàn)狀,基本術(shù)語(yǔ),及目前的應(yīng)用情況
關(guān)鍵字:數(shù)據(jù)挖掘,數(shù)據(jù)倉(cāng)庫(kù),
時(shí)代背景
近十幾年來(lái),人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,無(wú)數(shù)個(gè)數(shù)據(jù)庫(kù)被用于商業(yè)管理、政府辦公、科學(xué)研究和工程開(kāi)發(fā)等,這一勢(shì)頭仍將持續(xù)發(fā)展下去。于是,一個(gè)新的挑戰(zhàn)被提了出來(lái):在這被稱(chēng)之為信息爆炸的時(shí)代,信息過(guò)量幾乎成為人人需要面對(duì)的問(wèn)題。如何才能不被信息的汪洋大海所淹沒(méi),從中及時(shí)發(fā)現(xiàn)有用的知識(shí),提高信息利用率呢要想使數(shù)據(jù)真正成為一個(gè)公司的資源,只有充分利用它為公司自身的業(yè)務(wù)決策和戰(zhàn)略發(fā)展服務(wù)才行,否則大量的數(shù)據(jù)可能成為包袱,甚至成為垃圾。因此,面對(duì)"人們被數(shù)據(jù)淹沒(méi),人們卻饑餓于知識(shí)"的挑戰(zhàn),數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)(DMKD)技術(shù)應(yīng)運(yùn)而生,并得以蓬勃發(fā)展,越來(lái)越顯示出其強(qiáng)大的生命力。
傳統(tǒng)的數(shù)據(jù)庫(kù)技術(shù)是以單一的數(shù)據(jù)資源,即數(shù)據(jù)庫(kù)為中心,進(jìn)行事務(wù)處理、批處理、決策分析等各種數(shù)據(jù)處理工作,主要的劃分為兩大類(lèi):操作型處理和分析型處理(或信息型處理)。 操作型處理也叫事務(wù)處理,是指對(duì)數(shù)據(jù)庫(kù)聯(lián)機(jī)的日常操作,通常是對(duì)一個(gè)或一組紀(jì)錄的查詢(xún)和修改,主要為企業(yè)的特定應(yīng)用服務(wù)的,注重響應(yīng)時(shí)間,數(shù)據(jù)的安全性和完整性;分析型處理則用于管理人員的決策分析,經(jīng)常要訪問(wèn)大量的歷史數(shù)據(jù)。而傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)優(yōu)于企業(yè)的日常事務(wù)處理工作,而難于實(shí)現(xiàn)對(duì)數(shù)據(jù)分析處理要求,已經(jīng)無(wú)法滿(mǎn)足數(shù)據(jù)處理多樣化的要求。操作型處理和分析型處理的分離成為必然。近年來(lái),隨著數(shù)據(jù)庫(kù)技術(shù)的應(yīng)用和發(fā)展,人們嘗試對(duì)DB中的數(shù)據(jù)進(jìn)行再加工,形成一個(gè)綜合的,面向分析的環(huán)境,以更好支持決策分析,從而形成了數(shù)據(jù)倉(cāng)庫(kù)技術(shù)
數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。還有很多和這一術(shù)語(yǔ)相近似的術(shù)語(yǔ),如從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)知識(shí)(KDD)、數(shù)據(jù)分析、數(shù)據(jù)融合(Data Fusion)以及決策支持等。人們把原始數(shù)據(jù)看作是形成知識(shí)的源泉,就像從礦石中采礦一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識(shí)的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,
TA們正在看...
- 污水廠操作人員培訓(xùn)教材基礎(chǔ)知識(shí).doc
- 污水處理中氨氮超標(biāo)的幾種原因及解決辦法.pdf
- 污水處理廠危險(xiǎn)源辨識(shí)風(fēng)險(xiǎn)評(píng)價(jià)和控制措施表.pdf
- 污水處理廠基礎(chǔ)知識(shí)培訓(xùn)內(nèi)容.doc
- 污水處理廠常見(jiàn)問(wèn)題的解決方案.doc
- 污水處理廠惡臭環(huán)境影響評(píng)價(jià).pdf
- 污水處理廠污泥資源化利用生產(chǎn)有機(jī)肥分析終稿.doc
- 污水處理發(fā)展簡(jiǎn)史.pdf
- 污水處理培訓(xùn)資料.pdf
- 污水處理實(shí)驗(yàn)室設(shè)備和標(biāo)準(zhǔn).pdf