- 相關(guān)推薦
非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)與圖書(shū)館多媒體信息資源的組織利用
【內(nèi)容提要】針對(duì)傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)在處理非結(jié)構(gòu)化多媒體WEB信息中所存在的問(wèn)題,結(jié)合圖書(shū)館多媒體數(shù)據(jù)庫(kù)的特點(diǎn)及特定技術(shù)要求,介紹了非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)的技術(shù)特點(diǎn)及其在組織與利用館藏多媒體信息資源中的作用。【摘 要 題】信息資源建設(shè)
.
【關(guān) 鍵 詞】非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)/多媒體/信息資源/組織利用/關(guān)系數(shù)據(jù)庫(kù)
【 正 文】
1 非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)簡(jiǎn)介
非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù),是指其字段長(zhǎng)度可變,并且每個(gè)字段的記錄又可以由可重復(fù)或不可重復(fù)的子字段構(gòu)成的基于INTERNET、INTRANET的數(shù)據(jù)庫(kù),用它不僅可以處理結(jié)構(gòu)化數(shù)據(jù)(如數(shù)字、符號(hào)等信息)而且更適合處理非結(jié)構(gòu)化數(shù)據(jù)(全文文本、圖象、聲音、影視、超媒體等信息)并在互聯(lián)網(wǎng)上發(fā)布。非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)主要是針對(duì)非結(jié)構(gòu)化數(shù)據(jù)而產(chǎn)生的,與以往流行的關(guān)系數(shù)據(jù)庫(kù)相比,其最大區(qū)別在于它突破了關(guān)系數(shù)據(jù)庫(kù)結(jié)構(gòu)定義不易改變和數(shù)據(jù)定長(zhǎng)的限制,支持重復(fù)字段、子字段以及變長(zhǎng)字段并實(shí)現(xiàn)了對(duì)變長(zhǎng)數(shù)據(jù)和重復(fù)字段進(jìn)行處理和數(shù)據(jù)項(xiàng)的變長(zhǎng)存儲(chǔ)管理,在處理連續(xù)信息(包括全文信息)和非結(jié)構(gòu)化信息(包括各種多媒體信息)中有著傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)所無(wú)法比擬的優(yōu)勢(shì)。
2 圖書(shū)館多媒體信息資源的特點(diǎn)及組織利用中的技術(shù)要求
2.1 圖書(shū)館多媒體信息的數(shù)據(jù)量非常大,象館藏影視資料和各種多媒體教育(www.xfhttp.com-雪風(fēng)網(wǎng)絡(luò)xfhttp教育網(wǎng))資料,其動(dòng)態(tài)圖象信號(hào),每秒可達(dá)數(shù)兆字節(jié),一段幾分鐘的MP3音樂(lè)也有幾兆字節(jié),即使經(jīng)過(guò)壓縮、也十分巨大。如何對(duì)多媒體海量數(shù)據(jù)進(jìn)行有效地組織、存儲(chǔ)并構(gòu)成WEB數(shù)據(jù)庫(kù)提供給用戶(hù)網(wǎng)上使用,技術(shù)要求很高。
2.2 館藏多媒體信息的數(shù)據(jù)類(lèi)型很多,包括各種圖文數(shù)據(jù)、聲音數(shù)據(jù)、影視數(shù)據(jù)、超媒體數(shù)據(jù)、多種格式的隨書(shū)光盤(pán)等等,其數(shù)據(jù)長(zhǎng)度不固定,結(jié)構(gòu)上的差異大,使得處理這些數(shù)據(jù)十分困難,要求數(shù)據(jù)庫(kù)既能夠處理可變長(zhǎng)度字段又能夠處理可重復(fù)的子字段。
2.3 多媒體信息處理在時(shí)間上要求很高,多媒體信息中的聲音和動(dòng)態(tài)圖像對(duì)時(shí)間特別敏感,在使用這些信息時(shí),必須保證其時(shí)間上的要求,否則將會(huì)使這些信息失真甚至變得毫無(wú)意義。
2.4 開(kāi)發(fā)利用館藏多媒體信息資源經(jīng)常要多種信息集成描述,比如某種多媒體,既有圖像,又有聲音,還有文字說(shuō)明,這樣就會(huì)改變傳統(tǒng)的數(shù)據(jù)庫(kù)操作形式和數(shù)據(jù)庫(kù)接口,尤其對(duì)圖文并茂的數(shù)據(jù)庫(kù)的建立和查詢(xún),需要統(tǒng)一語(yǔ)義描述。
基于多媒體信息資源的上述特點(diǎn),要想使館藏豐富的多媒體信息資源得到充分利用,滿(mǎn)足信息用戶(hù)不斷增長(zhǎng)的信息需求,對(duì)多媒體信息處理提出了不同于普通信息處理技術(shù)的新要求:
。1) 多媒體數(shù)據(jù)庫(kù)元數(shù)據(jù)存儲(chǔ)技術(shù)要求
我們知道音頻、圖象、視頻等多媒體信息數(shù)據(jù)是非結(jié)構(gòu)化的,它們不能用簡(jiǎn)單的數(shù)字解析式表示,多媒體數(shù)據(jù)庫(kù)必須取得基于這些媒體對(duì)象內(nèi)容及信息特征的解釋?zhuān)拍芡瓿纱鎯?chǔ)及應(yīng)用,這些解釋就稱(chēng)為元數(shù)據(jù),通過(guò)對(duì)元數(shù)據(jù)的歸類(lèi)、整理、實(shí)現(xiàn)標(biāo)準(zhǔn)化的存儲(chǔ)是多媒體信息資源組織利用的關(guān)鍵。多媒體數(shù)據(jù)庫(kù)元數(shù)據(jù)存儲(chǔ)技術(shù)要求包括:文本元數(shù)據(jù)的存取,語(yǔ)音元數(shù)據(jù)的存取,圖象元數(shù)據(jù)的存取,視頻元數(shù)據(jù)的存取等方面的技術(shù)要求。
。2) 多媒體數(shù)據(jù)庫(kù)結(jié)構(gòu)字段設(shè)計(jì)與數(shù)據(jù)記錄處理方面的要求
a.允許可變長(zhǎng)字段、可重復(fù)字段、子字段和MARC字段。
b.數(shù)據(jù)庫(kù)記錄的數(shù)目與記錄長(zhǎng)度,字段數(shù)目與字段長(zhǎng)度,字段可重復(fù)次數(shù)不應(yīng)受到限制。
c.允許建立可以快速存取的倒排文件和多媒體、多語(yǔ)言記錄表。
d.數(shù)據(jù)庫(kù)可自動(dòng)接受和產(chǎn)生MARC和ISO2709記錄格式的文件,并且滿(mǎn)足對(duì)MEDADATA數(shù)據(jù)模式的支持功能。
。3) 基于WEB的多媒體信息檢索與信息發(fā)布的技術(shù)要求
隨著用戶(hù)對(duì)于信息需求的大量增加,以及對(duì)于多媒體信息的實(shí)效性要求,基于WEB的數(shù)據(jù)庫(kù)信息存儲(chǔ)的檢索越來(lái)越傾向于多媒體全文信息檢索的查詢(xún)語(yǔ)言,并且對(duì)于檢索結(jié)果的需求也側(cè)重于多媒體全文信息的獲取。與此同時(shí),WEB數(shù)據(jù)庫(kù)的信息發(fā)布形式開(kāi)始更多地過(guò)渡到通過(guò)網(wǎng)絡(luò)瀏覽器以
[1] [2] [3]
【非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)與圖書(shū)館多媒體信息資源的組織利用】相關(guān)文章:
試論高校圖書(shū)館的網(wǎng)絡(luò)信息資源的收集、整理與組織05-02
農(nóng)業(yè)信息資源開(kāi)發(fā)利用04-28
檔案信息資源的開(kāi)發(fā)利用04-28
利用Lotus系統(tǒng)開(kāi)發(fā)Web應(yīng)用04-27
因特網(wǎng)上的農(nóng)業(yè)信息資源與檢索利用04-30
利用多媒體輔助地理教學(xué)04-28
基于語(yǔ)義Web的知識(shí)組織方法與應(yīng)用04-29
利用MAPGIS數(shù)據(jù)庫(kù)統(tǒng)計(jì)土地利用現(xiàn)狀的實(shí)現(xiàn)04-29