亚洲免费人人妻人人,cao78在线视频,福建一级毛片,91精品视频免费观看,高清另类图片操逼,日本特黄特色大片免费看,超碰欧美人人澡曰曰澡夜夜泛

<label id="ebw3w"></label>

<style id="ebw3w"></style>

<span id="ebw3w"><small id="ebw3w"><rt id="ebw3w"></rt></small></span>

<rt id="ebw3w"><small id="ebw3w"><legend id="ebw3w"></legend></small></rt>

論文范文

優(yōu)文網(wǎng)>畢業(yè)論文>論文范文> 多層次技術(shù)的XML數(shù)據(jù)挖掘研究論文

我要投稿投訴建議

多層次技術(shù)的XML數(shù)據(jù)挖掘研究論文

時(shí)間：2023-05-02 06:07:53 論文范文我要投稿

相關(guān)推薦

多層次技術(shù)的XML數(shù)據(jù)挖掘研究論文

　　摘要：隨著互聯(lián)網(wǎng)的廣泛使用，Web的數(shù)據(jù)挖掘技術(shù)成為現(xiàn)階段數(shù)據(jù)挖掘技術(shù)研究的重點(diǎn)，但由于其數(shù)據(jù)挖掘控制的復(fù)雜，對(duì)人們的數(shù)據(jù)挖掘和使用帶來(lái)了困難。而XML數(shù)據(jù)挖掘的出現(xiàn)彌補(bǔ)了Web數(shù)據(jù)挖掘的缺陷，為其帶來(lái)了方便。

多層次技術(shù)的XML數(shù)據(jù)挖掘研究論文

　　關(guān)鍵詞：多層次技術(shù)；XML數(shù)據(jù)挖掘；Web數(shù)據(jù)挖掘；研究

　　0引言

　　數(shù)據(jù)挖掘就是從大量的信息數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)律性內(nèi)容，進(jìn)而對(duì)數(shù)據(jù)應(yīng)用的質(zhì)量問(wèn)題進(jìn)行解決，實(shí)現(xiàn)對(duì)數(shù)據(jù)的充分利用。在互聯(lián)網(wǎng)發(fā)展支持下的數(shù)據(jù)挖掘技術(shù)得到了快速的發(fā)展，特別是以結(jié)構(gòu)化數(shù)據(jù)為主的數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘技術(shù)被廣泛地應(yīng)用到各個(gè)領(lǐng)域，并獲得了好的效果。但這種結(jié)構(gòu)化的數(shù)據(jù)挖掘技術(shù)無(wú)法對(duì)Web數(shù)據(jù)挖掘的特性進(jìn)行處理，Web上的HTML文檔格式也不規(guī)范，導(dǎo)致沒(méi)有充分挖掘和利用有價(jià)值的知識(shí)。由此，如何優(yōu)化傳統(tǒng)數(shù)據(jù)挖掘技術(shù)，實(shí)現(xiàn)其和Web的結(jié)合成為數(shù)據(jù)挖掘技術(shù)研究領(lǐng)域關(guān)注的熱點(diǎn)。而XML的出現(xiàn)，彌補(bǔ)了Web的不足，成為現(xiàn)階段互聯(lián)網(wǎng)數(shù)據(jù)組織和交換的標(biāo)準(zhǔn)，并逐漸出現(xiàn)在Web上。文章對(duì)基于多層次技術(shù)的XML數(shù)據(jù)挖掘進(jìn)行研究。

　　1Web數(shù)據(jù)挖掘的難點(diǎn)

　　第一，異構(gòu)數(shù)據(jù)庫(kù)的環(huán)境。因特網(wǎng)上的信息可以說(shuō)就是一種數(shù)據(jù)路，具有大量的數(shù)據(jù)資源，每個(gè)站點(diǎn)的數(shù)據(jù)源都是異構(gòu)的，因此，每個(gè)站點(diǎn)之間的信息和組織結(jié)構(gòu)不一樣，形成了一種異構(gòu)數(shù)據(jù)庫(kù)環(huán)境。想要獲得和利用這些數(shù)據(jù)資源需要進(jìn)行數(shù)據(jù)挖掘，這種數(shù)據(jù)挖掘需要對(duì)站點(diǎn)的異構(gòu)數(shù)據(jù)集成進(jìn)行研究，同時(shí)還要對(duì)因特網(wǎng)上的數(shù)據(jù)查詢問(wèn)題進(jìn)行解決。第二，半結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)。傳統(tǒng)的數(shù)據(jù)庫(kù)具有數(shù)據(jù)模型，能夠通過(guò)這種模型來(lái)對(duì)特定的數(shù)據(jù)進(jìn)行描述。但因特網(wǎng)上的數(shù)據(jù)較為復(fù)雜，沒(méi)有統(tǒng)一的模型讓人進(jìn)行描述，且自身具有獨(dú)立性、動(dòng)態(tài)性的特點(diǎn)，存在自述層次，因而是一種半結(jié)構(gòu)化數(shù)據(jù)。

　　2XML數(shù)據(jù)挖掘技術(shù)

　　2.1XML技術(shù)概述

　　XML是由萬(wàn)維網(wǎng)協(xié)會(huì)設(shè)計(jì)的一種中介標(biāo)示性語(yǔ)言，主要被應(yīng)用在Web中。XML類似于HTML，主要被設(shè)計(jì)用來(lái)描述數(shù)據(jù)的語(yǔ)言，為數(shù)據(jù)挖掘提供了一種獨(dú)立的運(yùn)行程序，能夠?qū)崿F(xiàn)對(duì)數(shù)據(jù)的共享，并利用計(jì)算機(jī)通訊將信息傳遞到多個(gè)領(lǐng)域。

　　2.2XML和HTML的比較

　　HTML是Web的重要技術(shù)要素之一，簡(jiǎn)單易學(xué)，被很多計(jì)算機(jī)專業(yè)人員應(yīng)用于創(chuàng)建自己的、具有超文本特定的多媒體主頁(yè)，能夠?qū)崿F(xiàn)網(wǎng)絡(luò)和普通人的聯(lián)系，創(chuàng)造出豐富的網(wǎng)頁(yè)。但其在因特網(wǎng)的應(yīng)用存在以下幾點(diǎn)缺陷：第一，只是對(duì)信息的顯示方式進(jìn)行描述，沒(méi)有對(duì)信息內(nèi)容本身進(jìn)行描述；第二，需要因特網(wǎng)服務(wù)器幫其處理任務(wù)工作，加重了網(wǎng)絡(luò)的負(fù)擔(dān)，降低了網(wǎng)絡(luò)運(yùn)行的效率。根據(jù)上文對(duì)XML技術(shù)的概述，可以看出，XML不是一種單純的標(biāo)記語(yǔ)言，而是一種定義語(yǔ)言，能夠根據(jù)需要設(shè)定不同的標(biāo)記語(yǔ)言，突破了HTML固定標(biāo)記的限制，能夠更好地推動(dòng)Web的發(fā)展。

　　3基于XML數(shù)據(jù)挖掘框架設(shè)計(jì)

　　3.1設(shè)計(jì)的特點(diǎn)

　　第一，具有自然、性能良好、個(gè)性化設(shè)計(jì)的系統(tǒng)用戶界面；第二，主要應(yīng)用元搜索引擎頁(yè)面。這種頁(yè)面設(shè)計(jì)的主要思想是首先對(duì)用戶的查詢請(qǐng)求進(jìn)行預(yù)處理，之后向各個(gè)搜索引擎發(fā)送查詢的請(qǐng)求，最后，在經(jīng)過(guò)處理之后向用戶反饋檢索結(jié)果。第三，Web頁(yè)面的設(shè)計(jì)充分應(yīng)用了HITS的算法。第四，利用XML技術(shù)對(duì)檢索的數(shù)據(jù)進(jìn)行預(yù)處理。主要表現(xiàn)為將數(shù)據(jù)庫(kù)中的所有文檔形式轉(zhuǎn)化為XML文檔形式，之后在數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用下實(shí)現(xiàn)各種文檔的集成。

　　3.2系統(tǒng)設(shè)計(jì)的結(jié)構(gòu)

　　XML數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu)主要包含用戶界面模塊、數(shù)據(jù)預(yù)處理模塊和數(shù)據(jù)挖掘模塊。第一，用戶界面模塊主要作為用戶和系統(tǒng)交接的端口存在，用戶通過(guò)這個(gè)界面來(lái)實(shí)現(xiàn)對(duì)數(shù)據(jù)挖掘系統(tǒng)的使用。在這個(gè)模塊中，用戶能夠在對(duì)數(shù)據(jù)挖掘之前設(shè)定挖掘的參數(shù)，之后提出請(qǐng)求、對(duì)挖掘成果分析，實(shí)現(xiàn)個(gè)性化的數(shù)據(jù)挖掘。第二，數(shù)據(jù)預(yù)處理模塊主要是指在對(duì)數(shù)據(jù)檢索之后，應(yīng)用XML技術(shù)對(duì)檢索的數(shù)據(jù)進(jìn)行預(yù)處理。第三，數(shù)據(jù)挖掘模塊主要是對(duì)數(shù)據(jù)預(yù)處理后的模塊信息進(jìn)行挖掘，并將成果展示給用戶。

　　4基于XML技術(shù)的Web數(shù)據(jù)挖掘

　　4.1數(shù)據(jù)挖掘方案的選取

　　基于XML技術(shù)的Web數(shù)據(jù)挖掘主要分為內(nèi)容上的挖掘和形式上的挖掘兩種，其中，內(nèi)容挖掘主要是針對(duì)文檔標(biāo)記的開(kāi)始和結(jié)束之間的文本部分，即對(duì)標(biāo)記值的一種挖掘。具體的內(nèi)容挖掘方案主要有三種：第一，利用專門(mén)的XML數(shù)據(jù)、半結(jié)構(gòu)數(shù)據(jù)開(kāi)發(fā)查詢的語(yǔ)言，充分開(kāi)發(fā)其查詢功能，并將這種語(yǔ)言滲透在應(yīng)用程序中，從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的有限挖掘。這種挖掘方案能夠?qū)ML技術(shù)和數(shù)據(jù)挖掘技術(shù)進(jìn)行有效的結(jié)合，且具有操作簡(jiǎn)單的特點(diǎn)。第二，實(shí)現(xiàn)對(duì)XML文檔數(shù)據(jù)的結(jié)構(gòu)化處理。在處理之后將其映射到現(xiàn)有的關(guān)系對(duì)象模型中，從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的挖掘。第三，將XML文檔視為一種文本，采用傳統(tǒng)的數(shù)據(jù)挖局處理技術(shù)對(duì)數(shù)據(jù)進(jìn)行挖掘。

　　4.2XML技術(shù)數(shù)據(jù)挖掘?qū)崿F(xiàn)

　　XML技術(shù)的挖掘?qū)崿F(xiàn)主要利用XQuery實(shí)現(xiàn)關(guān)聯(lián)挖掘來(lái)進(jìn)行數(shù)據(jù)挖掘，且不需要對(duì)其文檔進(jìn)行預(yù)處理和挖掘后處理，具有操作簡(jiǎn)單的優(yōu)勢(shì)。主要采用兩種方式來(lái)執(zhí)行XQuery。第一，使用XhiveNodeIf對(duì)象的executeXQuery進(jìn)行語(yǔ)句的執(zhí)行，使得集合的每個(gè)元素都是對(duì)應(yīng)的對(duì)象，并將對(duì)象轉(zhuǎn)換成DOM的節(jié)點(diǎn)來(lái)進(jìn)行數(shù)據(jù)的挖掘。第二，利用XhiveXQueryQueryIf對(duì)象調(diào)用execute進(jìn)行語(yǔ)句的執(zhí)行。在這個(gè)過(guò)程中會(huì)涉及對(duì)外部參數(shù)的使用。

　　5結(jié)語(yǔ)

　　XML數(shù)據(jù)挖掘能夠有效解決因特網(wǎng)數(shù)據(jù)挖掘難的問(wèn)題，實(shí)現(xiàn)數(shù)據(jù)挖掘的簡(jiǎn)單化操作。XML數(shù)據(jù)挖掘?qū)⒉煌Y(jié)構(gòu)、不容易兼容的數(shù)據(jù)進(jìn)行結(jié)合，并利用自身的靈活性和延展性將各種應(yīng)用軟件中的數(shù)據(jù)進(jìn)行不同描述，從而方便因特網(wǎng)中數(shù)據(jù)的收集和記錄。同時(shí)，基于XML數(shù)據(jù)是自我描述性的，不需要內(nèi)部的描述處理就能實(shí)現(xiàn)數(shù)據(jù)的交換，為其對(duì)數(shù)據(jù)的處理和應(yīng)用提供了便利的支持。因此，技術(shù)XML技術(shù)的數(shù)據(jù)挖掘成為當(dāng)今因特網(wǎng)數(shù)據(jù)挖掘的研究重點(diǎn)，需要有關(guān)人員引起足夠的重視，進(jìn)而不斷促進(jìn)該技術(shù)對(duì)數(shù)據(jù)挖掘的應(yīng)用。

　　參考文獻(xiàn)：

　　[1]盧珊.基于XML技術(shù)的Web數(shù)據(jù)自動(dòng)挖掘新方法[J].信息技術(shù)與信息化,2014,12:141-143

　　[2]王雅軒,頊聰.基于XML的Web數(shù)據(jù)挖掘模型的設(shè)計(jì)研究[J].電子技術(shù)與軟件工程,2015,03:213-214

　　[3]周曉梅,王潛平,蘇琳.基于XML的Web數(shù)據(jù)挖掘模型的設(shè)計(jì)[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,02:272-274+277

　　[4]唐明燈.基于數(shù)據(jù)庫(kù)技術(shù)的數(shù)據(jù)挖掘分析與研究[J].信息與電腦(理論版),2010,02:138-139

【多層次技術(shù)的XML數(shù)據(jù)挖掘研究論文】相關(guān)文章：

數(shù)據(jù)挖掘論文04-29

數(shù)據(jù)挖掘技術(shù)在遼河水文預(yù)報(bào)中的研究04-30

數(shù)據(jù)挖掘技術(shù)在遼河水文預(yù)報(bào)中的研究04-30

網(wǎng)絡(luò)營(yíng)銷中數(shù)據(jù)挖掘技術(shù)的應(yīng)用論文11-27

數(shù)據(jù)挖掘技術(shù)在企業(yè)決策系統(tǒng)中的應(yīng)用研究04-26

數(shù)據(jù)挖掘技術(shù)在軟件工程的運(yùn)用工程論文04-27

軟件工程數(shù)據(jù)挖掘開(kāi)發(fā)測(cè)試技術(shù)論文04-27

數(shù)據(jù)挖掘論文[范例15篇]07-29

基于XML的產(chǎn)品主模型技術(shù)研究04-29

數(shù)據(jù)挖掘中抽樣技術(shù)的應(yīng)用04-29

最新文章

<span id="ox6ef"></span>

<rt id="ox6ef"><delect id="ox6ef"><legend id="ox6ef"></legend></delect></rt>

<li id="ox6ef"></li>

<ruby id="ox6ef"><dl id="ox6ef"></dl></ruby>

<label id="ox6ef"></label>