- 相關(guān)推薦
面向大數(shù)據(jù)基于知識(shí)的決策信息需求動(dòng)態(tài)生成方式論文
引言
在軍事、公安、交通、銀行、通信等大型企業(yè)機(jī)構(gòu)中,通常都有一套用于企業(yè)決策制定的數(shù)據(jù)系統(tǒng),其中的數(shù)據(jù)通常都經(jīng)過(guò)了良好的組織、嚴(yán)格的定義和規(guī)范的表達(dá)。因而當(dāng)決策者產(chǎn)生信息需求時(shí),相應(yīng)的信息服務(wù)能夠自動(dòng)地從相應(yīng)地?cái)?shù)據(jù)來(lái)源處獲取信息,并提供給決策者。這是一種 “固定信息服務(wù)模式”,即在用戶(hù)的信息需求和對(duì)應(yīng)的信息來(lái)源之間存在某種固定的映射關(guān)系,需要時(shí)即可從固定來(lái)源處直接 “取”信息。這種模式在過(guò)去工作得很好。
大數(shù)據(jù)時(shí)代的到來(lái)引起了學(xué)術(shù)界、工業(yè)界乃至政府的廣泛關(guān)注。大型企業(yè)紛紛轉(zhuǎn)向互聯(lián)網(wǎng)上的大數(shù)據(jù),希望能夠從中挖掘到有價(jià)值的信息用于制定更加高明的企業(yè)決策。然而,大數(shù)據(jù)環(huán)境下,信息來(lái)源多樣、種類(lèi)繁多、內(nèi)容冗余、表達(dá)異構(gòu),決策者在產(chǎn)生信息需求時(shí)通常無(wú)法預(yù)知提供相應(yīng)信息的來(lái)源位置,只能到大數(shù)據(jù)環(huán)境中去 “找”信息。因此,固定信息服務(wù)模式在大數(shù)據(jù)環(huán)境下幾無(wú)用武之地,取而代之的是一種動(dòng)態(tài)信息服務(wù)模式———搜索。使用搜索的前提是對(duì)信息需求進(jìn)行建模,描述信息需求的特征。常用的信息需求建模語(yǔ)言有搜索關(guān)鍵詞、數(shù)據(jù)庫(kù)查詢(xún)語(yǔ)言、實(shí)時(shí)信息訂閱請(qǐng)求等。然而,面對(duì)大數(shù)據(jù)環(huán)境精確建立信息需求模型殊非易事,用戶(hù)需要耗費(fèi)大量的時(shí)間在信息需求的表達(dá)上,包括仔細(xì)斟酌關(guān)鍵詞以避免跨領(lǐng)域的歧義,估計(jì)信息的可能來(lái)源類(lèi)型,從而決定使用哪種需求建模語(yǔ)言 (事實(shí)上,在結(jié)構(gòu)化數(shù)據(jù)庫(kù)、非結(jié)構(gòu)化網(wǎng)頁(yè)和實(shí)時(shí)信息系統(tǒng)之間存在嚴(yán)重的內(nèi)容交疊,很多情況下難以確定所需信息的來(lái)源類(lèi)型)。信息需求表達(dá)不準(zhǔn)確的結(jié)果就是要不斷地修改。所有這些工作嚴(yán)重分散了決策者的精力,從而導(dǎo)致決策效率低下。
針對(duì)上述問(wèn)題,一種直接的解決思路是將信息需求表達(dá)的過(guò)程做成自動(dòng)化的,而實(shí)現(xiàn)這種自動(dòng)化的前提是基于一種新型的領(lǐng)域知識(shí)。通過(guò)研究發(fā)現(xiàn),當(dāng)企業(yè)決策者在制定同一類(lèi)決策時(shí),他們所需的信息不論在內(nèi)容上、粒度上,還是范圍上都存在較高的相似性,也就是說(shuō),在決策事務(wù)類(lèi)型和用戶(hù)信息需求之間很可能存在某種潛在的關(guān)聯(lián)關(guān)系,而這種關(guān)聯(lián)關(guān)系就是前面所述的領(lǐng)域知識(shí);谠撛硖岢隽艘环N方法,發(fā)掘決策事務(wù)與信息需求間的潛在關(guān)聯(lián)關(guān)系并固化為知識(shí),進(jìn)而依據(jù)該知識(shí)及動(dòng)態(tài)感知到的用戶(hù)當(dāng)前決策事務(wù)類(lèi)型和要素,自動(dòng)地生成信息需求,將大數(shù)據(jù)環(huán)境中符合需求的信息自動(dòng)地提供給決策者。實(shí)驗(yàn)結(jié)果表明,該方法能有效減少?zèng)Q策者的信息需求表達(dá)耗時(shí),能夠保證一定的準(zhǔn)確度,提高決策效率。
1相關(guān)研究
在互聯(lián)網(wǎng)搜索領(lǐng)域,有很多幫助用戶(hù)完善需求表達(dá)的方法,如關(guān)鍵詞生成 (keyword generation)和查詢(xún)推薦(query recommendation)等。其中運(yùn)用的知識(shí)包括用戶(hù)搜索記錄的分析、詞匯關(guān)聯(lián)關(guān)系等。這些方法在基于知識(shí)優(yōu)化用戶(hù)搜索需求表達(dá)的同時(shí),也為搜索引擎廣告的植入提供了便利,在巨大商業(yè)利益的驅(qū)動(dòng)下發(fā)展得很快。然而,所有這些方法都需要用戶(hù)輸入初始的關(guān)鍵詞,作為優(yōu)化和推薦的依據(jù)。而在本文提出的方法中,信息需求是根據(jù)動(dòng)態(tài)感知到的用戶(hù)決策事務(wù)自動(dòng)生成的,無(wú)需輸入任何初始關(guān)鍵詞。在基于知識(shí)的方法應(yīng)用上,谷歌和IBM 走在了世界前列。其中,谷歌的知識(shí)圖譜能夠依據(jù)領(lǐng)域知識(shí)結(jié)構(gòu),根據(jù)用戶(hù)的輸入定位到結(jié)構(gòu)上相關(guān)聯(lián)的一組知識(shí)片段;而IBM 的沃森機(jī)器人能理解用戶(hù)使用自然語(yǔ)言表述的問(wèn)題,并從一套龐大的知識(shí)庫(kù)中快速、準(zhǔn)確地定位到正確答案。其中大量運(yùn)用了從詞典、百科全書(shū)、新聞報(bào)刊等公共渠道中獲得的通用型知識(shí) (常識(shí))。眾所周知,領(lǐng)域內(nèi)的問(wèn)題比普適性問(wèn)題更容易解決,利用領(lǐng)域知識(shí)提升領(lǐng)域系統(tǒng)能力效果會(huì)更好。例如在一些決策支持系統(tǒng)中,領(lǐng)域知識(shí)的應(yīng)用很好地提升了一些算法的性能。然而,在運(yùn)用領(lǐng)域知識(shí)處理面向大數(shù)據(jù)的決策信息需求生成方面,尚未發(fā)現(xiàn)相關(guān)研究成果。其實(shí)企業(yè)決策系統(tǒng)中的用戶(hù)信息需求帶有明顯的領(lǐng)域特征,與其處理的決策事務(wù)有很大的關(guān)聯(lián)性。利用這種關(guān)聯(lián)性能夠根據(jù)用戶(hù)的決策事物準(zhǔn)確估計(jì)并自動(dòng)生成信息需求表達(dá)。本文基于的就是這種理念。
2信息需求建模語(yǔ)言
如上文所述,要從大數(shù)據(jù)環(huán)境中獲得決策所需的信息,首先要對(duì)信息需求進(jìn)行建模。因此需要一種強(qiáng)大的建模語(yǔ)言,能夠描述所需信息的各方面期望特征,包括內(nèi)容特征、范圍限定、時(shí)效性限定、載體類(lèi)型限定、優(yōu)先來(lái)源限定、排序方式限定等。另一方面,該建模語(yǔ)言應(yīng)當(dāng)足夠精確,能夠描述信息需求的語(yǔ)義內(nèi)涵,從而避免發(fā)布出去的信息需求被各類(lèi)信息來(lái)源錯(cuò)誤地理解和轉(zhuǎn)換。
作為建議,設(shè)計(jì)了一種信息需求建模語(yǔ)言 TIRML(taskinfo-reqmodelinglanguage)。其語(yǔ)法規(guī)范見(jiàn)表1,包含7個(gè)主要部分。表便人工閱讀理解。USER、OPERATION、MISSION 從3個(gè)維度定義決策事務(wù)類(lèi)型。USER用于描述決策者的角色類(lèi)型,如指揮員,參謀等。OPERATION用于描述用戶(hù)當(dāng)前的決策作業(yè)類(lèi)型,如態(tài)勢(shì)分析、任務(wù)規(guī)劃等。MISSION用于描述用戶(hù)當(dāng)前受領(lǐng)的任務(wù)類(lèi)型,如襲擊某機(jī)場(chǎng),組織某救援行動(dòng)等。不同用戶(hù)角色類(lèi)型、決策作業(yè)類(lèi)型、受領(lǐng)任務(wù)類(lèi)型對(duì)應(yīng)的信息需求有較大的區(qū)別。SELECT和 WHERE字段沿襲于SQL語(yǔ)言。不同的是將其后面所跟的數(shù)據(jù)表字段改為了 “主體-屬性”的描述形式。邏輯上一個(gè)主體可以有一個(gè)或多個(gè)屬性,SELECT后面跟的是一個(gè)主體的未知屬性,WHERE后面跟的是其已知屬性,用于限定主體類(lèi)型!爸黧w-屬性”的形式賦予SE-LECT和 WHERE 以一種淺層的語(yǔ)義表達(dá)能力,其相比SPARQL的語(yǔ)義表達(dá)能力較弱,但適用面更廣,不一定是純?nèi)M形式的數(shù)據(jù)。在關(guān)系數(shù)據(jù)庫(kù)中,可以將表格的一行當(dāng)作一個(gè)主體,一列當(dāng)作一個(gè)屬性。在 P/S (發(fā)布/訂閱)系統(tǒng)中,訂閱請(qǐng)求中包含了主體的已知屬性,返回的報(bào)文中包含了其未知屬性。在非結(jié)構(gòu)化文本中,主體和屬性隱藏在文字中,例如 “北京是中國(guó)的首都”變?yōu)槿问郊礊椤?lt;中國(guó),首都,北京>”。因此, “主體-屬性”在各類(lèi)信息組織形式中都有對(duì)應(yīng)的解釋?zhuān)梢酝ㄟ^(guò)各種方法被轉(zhuǎn)換成相應(yīng)地搜索/查詢(xún)/訂閱請(qǐng)求格式,并保持語(yǔ)義不變。
有些時(shí)候決策者對(duì)所需信息有較為傾向的信息來(lái)源,例如信任等級(jí)較高的來(lái)源、更加穩(wěn)定、更容易訪(fǎng)問(wèn)的來(lái)源等。用戶(hù)可以將這些優(yōu)先來(lái)源列在FROM 字段之后,以縮小搜索范圍,提高搜索精度。每個(gè)信息都有其載體類(lèi)型,如文本、圖像、視頻、音頻、數(shù)據(jù)庫(kù)、格式化消息等,可以用 MEDIATYPE進(jìn)行限定。WHEN字段用于描述對(duì)所需信息的時(shí)效性要求,分持續(xù)性和一次性?xún)煞N。持續(xù)性需求表示在一個(gè)時(shí)間段內(nèi)需要持續(xù)的更新。可以用 START、END 來(lái)描述這個(gè)時(shí)間段,用PERIOD和REPEAT分別描述針對(duì)實(shí)時(shí)信息的更新時(shí)間間隔和對(duì)非實(shí)時(shí)信息的定期搜索查新時(shí)間間隔。一次性需求表示當(dāng)?shù)谝粋(gè)搜索結(jié)果返回時(shí)該需求就失效了。分別用EARLIEST和LATEST來(lái)描述所需信息的最后更新時(shí)間的范圍。REALTIME則用來(lái)表示所需信息是實(shí)時(shí)信息還是非實(shí)時(shí)信息。ORDERBY字段用于描述對(duì)搜索結(jié)果的排序要求?梢允褂 “|-”連接符來(lái)表達(dá)綜合排序的要求。例如 “相關(guān)度|-來(lái)源信任等級(jí)”表示先按相關(guān)度排序,當(dāng)兩條結(jié)果的相關(guān)度相等時(shí)再按來(lái)源信任等級(jí)排序。
3信息需求
生成方法不像人們?nèi)粘g覽互聯(lián)網(wǎng)那樣隨意,企業(yè)決策者的信息需求有一定規(guī)律性,與其正在處理的決策事務(wù)是相對(duì)應(yīng)的。分析決策者的信息查詢(xún)操作記錄不難發(fā)現(xiàn),同一類(lèi)用戶(hù)在處理同一類(lèi)決策事務(wù)時(shí)所需的信息類(lèi)型是基本相同的,只是根據(jù)涉及到不同對(duì)象及時(shí)空上下文時(shí)會(huì)有細(xì)微差別。以軍事領(lǐng)域?yàn)槔笓]員在針對(duì)某個(gè)目標(biāo)制定打擊方案時(shí),通常要了解目標(biāo)的防御能力及運(yùn)動(dòng)狀態(tài)等信息,只是具體的目標(biāo)和打擊時(shí)間、地域不同而已。如圖1所示,在用戶(hù)決策事務(wù)類(lèi)型與信息需求之間存在某種潛在的關(guān)聯(lián)映射關(guān)系,目前還是一個(gè)黑盒子,有待開(kāi)發(fā)基于上述原理,對(duì)企業(yè)領(lǐng)域中的用戶(hù)決策事務(wù)分門(mén)別類(lèi),然后將每一類(lèi)事務(wù)所需信息類(lèi)型寫(xiě)成一個(gè)模板 (稱(chēng)為“事信映射模板”),對(duì)其中變化的因素留出空來(lái),待遇到實(shí)際事務(wù)時(shí),選調(diào)相應(yīng)的模板并根據(jù)實(shí)際變量數(shù)值填空,從而生成實(shí)際的信息需求,進(jìn)而根據(jù)領(lǐng)域術(shù)語(yǔ)的表達(dá)方式,對(duì)需求進(jìn)行準(zhǔn)確描述,以上便是本方法的核心思想。方法如圖2所示,分為準(zhǔn)備和使用兩個(gè)階段。接下來(lái)從領(lǐng)域知識(shí)構(gòu)建、用戶(hù)決策事務(wù)感知、信息需求生成、需求語(yǔ)義描述、需求發(fā)布管理5個(gè)方面展開(kāi)說(shuō)明。3.1 領(lǐng)域知識(shí)構(gòu)建(1)區(qū)分領(lǐng)域內(nèi)的用戶(hù)決策事務(wù)類(lèi)型。區(qū)分的依據(jù)是兩類(lèi)事務(wù)所需信息之間的差別無(wú)法用變量表示。例如打擊敵方目標(biāo)和防御敵方進(jìn)攻所需信息類(lèi)型截然不同,而打擊兩個(gè)同類(lèi)目標(biāo)所需信息的差別則可以體現(xiàn)為一個(gè)變量。變量的粗細(xì)粒度可以靈活把握(3)建立事信映射模板庫(kù),將用戶(hù)決策事務(wù)類(lèi)型與所需信息類(lèi)型之間的映射關(guān)系寫(xiě)成模板。發(fā)掘事信映射關(guān)系的方法有兩種:一是依據(jù)經(jīng)驗(yàn),即邀請(qǐng)領(lǐng)域?qū)<,尤其是長(zhǎng)期從事某類(lèi)決策事務(wù)的用戶(hù),根據(jù)經(jīng)驗(yàn)列出處理每類(lèi)事務(wù)所需的信息類(lèi)型;二是通過(guò)學(xué)習(xí),即對(duì)用戶(hù)決策過(guò)程進(jìn)行記錄,包括其每次執(zhí)行的決策事務(wù)要素和相應(yīng)的信息查詢(xún)操作,通過(guò)自動(dòng)挖掘與人工分析相結(jié)合的方式,學(xué)習(xí)可能的事信映射關(guān)系。對(duì)于模板的編寫(xiě)語(yǔ)法規(guī)范這里并不做限定,可以參考TIRML語(yǔ)法規(guī)范,一種能夠?yàn)楦黝?lèi)信息資源解析轉(zhuǎn)換的統(tǒng)一需求描述語(yǔ)言。
一個(gè)例子如圖3所示。(4)建立關(guān)于領(lǐng)域術(shù)語(yǔ)的本體知識(shí)。眾所周知,領(lǐng)域術(shù)語(yǔ)可用來(lái)規(guī)范領(lǐng)域內(nèi)的信息表達(dá),使得領(lǐng)域內(nèi)的用戶(hù)或系統(tǒng)能夠在語(yǔ)義一致的基礎(chǔ)上進(jìn)行交流。本體是對(duì)領(lǐng)域術(shù)語(yǔ)的概念和關(guān)系的嚴(yán)格定義,通過(guò)RDF、OWL等本體語(yǔ)言可描述為機(jī)器能夠理解的形式。因此,建議定義企業(yè)領(lǐng)本體,并采用本體中的術(shù)語(yǔ)來(lái)描述事信映射模板,以便用戶(hù)端描述的需求能夠?yàn)橘Y源端正確理解。
然而,用戶(hù)端和資源端往往不在同一個(gè)領(lǐng)域,所采用的領(lǐng)域本體也很難統(tǒng)一。可以借助于本體匹配技術(shù),實(shí)現(xiàn)不同領(lǐng)域本體之間的關(guān)聯(lián)映射。企業(yè)可以利用已有的本體匹配工具建立本領(lǐng)域和其它相關(guān)領(lǐng)域本體之間的映射關(guān)系。事信映射模板、領(lǐng)域本體及本體映射關(guān)系是本方法中用到的領(lǐng)域知識(shí)。接下來(lái)將詳細(xì)介紹如何使用這些知識(shí)來(lái)實(shí)現(xiàn)決策信息需求的自動(dòng)生成。3.2 用戶(hù)決策事務(wù)感知用戶(hù)端程序要實(shí)現(xiàn)對(duì)上述用戶(hù)決策事務(wù)要素的感知功能。具體的,包括以下幾類(lèi):感知用戶(hù)身份:可以通過(guò)用戶(hù)登錄操作識(shí)別用戶(hù)身份,判別用戶(hù)類(lèi)型,為 UserType賦值;感知作業(yè)過(guò)程:監(jiān)聽(tīng)用戶(hù)界面操作,包括切換作業(yè)界面、使用作業(yè)工具、操作作業(yè)對(duì)象等。預(yù)先定義這些操作對(duì)應(yīng)的作業(yè)類(lèi)型碼,根據(jù)實(shí)際監(jiān)聽(tīng)到的操作對(duì) Operation-Type和 ObjectType賦值;感知背景任務(wù)/事件:背景任務(wù)/事件通常會(huì)通過(guò)某種方式導(dǎo)入到?jīng)Q策作業(yè)軟件中,例如在軍事領(lǐng)域可以是作戰(zhàn)任務(wù)文書(shū)的形式,其中說(shuō)明了任務(wù)的執(zhí)行者、行為和行為目標(biāo)對(duì)象,可以解析其數(shù)值并賦給 ActorType、ActionType和TargetType;感知實(shí)體和時(shí)空上下文變化:實(shí)時(shí)采集決策中涉及的各類(lèi)實(shí)體對(duì)象標(biāo)識(shí)、地理區(qū)域標(biāo)識(shí),以及時(shí)間信息,用于為模板中設(shè)定的各種變量賦值。由于具體的感知功能實(shí)現(xiàn)方法與具體應(yīng)用相關(guān),這里不做限定,只要能夠?qū)崟r(shí)采集上述信息即可。3.3 信息需求生成將實(shí)時(shí)感知到的用戶(hù)決策事務(wù)要素與事信映射模板的標(biāo)識(shí)進(jìn)行匹配。由于模板標(biāo)識(shí)是全局唯一的,不會(huì)出現(xiàn)同時(shí)匹配上多個(gè)模板的情況。
另一方面,如果在模板設(shè)計(jì)時(shí)全面考慮了所有可能的要素取值組合,也不會(huì)出現(xiàn)匹配不上任何一個(gè)模板的情況。匹配上的模板選調(diào)出來(lái),將感知到的實(shí)體、時(shí)空上下文等信息的取值賦給模板中的變量,即模板填空。當(dāng)模板中所有的留空都被填滿(mǎn)時(shí),一個(gè)實(shí)際信息需求的模型就建立出來(lái)了。3.4 需求語(yǔ)義描述此時(shí)生成的信息需求可以直接提交給信息資源,轉(zhuǎn)換成各類(lèi)信息資源支持的查詢(xún)語(yǔ)法。但為了獲得精準(zhǔn)地信息反饋,還要依據(jù)領(lǐng)域本體對(duì)需求的語(yǔ)義進(jìn)行準(zhǔn)確描述。在TIRML的語(yǔ)法中,支持 “主體-屬性”形式的語(yǔ)義描述,即將每一條信息需求描述為對(duì)某個(gè)主體的某個(gè)屬性值的需求,而其中的主體和屬性都是在相關(guān)本體中定義過(guò)的,通過(guò)名字空間保證標(biāo)識(shí)的唯一性,如 “wp:林肯”;谇懊娼⒌念I(lǐng)域本體之間的映射關(guān)系,能夠保證跨領(lǐng)域的信息資源對(duì)其內(nèi)在含義的一致理解,從而在解析轉(zhuǎn)換時(shí)不改變、不減損信息需求的語(yǔ)義內(nèi)涵。例如,“林肯 (航母)”不會(huì)被錯(cuò)誤的理解為 “林肯 (汽車(chē))”或 “林肯 (總統(tǒng))”。
在實(shí)際使用過(guò)程中經(jīng)常出現(xiàn)這樣的情況,即在編寫(xiě)模板時(shí),所設(shè)變量的粒度較粗,取值范圍較寬,導(dǎo)致 “主體-屬性”的描述難以細(xì)化。例如 “飛機(jī)-對(duì)地打擊能力”是一個(gè)較為寬泛的概念,不能直接用于查詢(xún)或搜索,需要轉(zhuǎn)換成更具體的屬性。但根據(jù)機(jī)型不同,對(duì)地打擊能力可以細(xì)化為不同的屬性參數(shù),如對(duì)轟炸機(jī)細(xì)化為 “空地導(dǎo)彈射程范圍”,對(duì)直升機(jī)則細(xì)化為 “機(jī)槍掃射最大頻率”等。總之,當(dāng)主體作為變量而其取值可以是多類(lèi)對(duì)象時(shí),屬性本身也是不確定的。解決方法定義如圖5所示的領(lǐng)域本體。這樣,當(dāng) “飛機(jī)”的實(shí)際取值為 “轟炸機(jī)”時(shí),“對(duì)地打擊能力”屬性就會(huì)自動(dòng)轉(zhuǎn)變?yōu)?“空地導(dǎo)彈射程范圍”,對(duì) “直升機(jī)”則自動(dòng)轉(zhuǎn)變?yōu)?“機(jī)槍掃射最大頻率”。
4實(shí)現(xiàn)
為了驗(yàn)證上述方法的可行性和有效性,選取軍事領(lǐng)域中的典型應(yīng)用背景開(kāi)展了軟件實(shí)現(xiàn)工作。(1)對(duì)防空作戰(zhàn)應(yīng)用領(lǐng)域中的用戶(hù)決策事務(wù)進(jìn)行了分類(lèi),將決策作業(yè)過(guò)程分為搜集情況判斷、航路規(guī)劃、打擊進(jìn)入方向分析、打擊行動(dòng)監(jiān)控、戰(zhàn)后總結(jié)評(píng)估5類(lèi)事務(wù),將背景任務(wù)/事件分為航空兵攔截?cái)硻C(jī)、防空火力攔截?cái)硻C(jī)、航空兵打擊敵方基地、航空兵打擊敵方航母編隊(duì)等11類(lèi)事務(wù),通過(guò)兩兩組合構(gòu)成了55類(lèi)用戶(hù)決策事務(wù),并分別編寫(xiě)事信映射模板,建立了模板庫(kù)。其中,模板內(nèi)容的填寫(xiě)遵循了TIRML規(guī)范,依據(jù)的是領(lǐng)域?qū)<业慕?jīng)驗(yàn),涉及到實(shí)時(shí)戰(zhàn)場(chǎng)動(dòng)態(tài)、非實(shí)時(shí)戰(zhàn)場(chǎng)環(huán)境、結(jié)構(gòu)化裝備數(shù)據(jù)、非結(jié)構(gòu)化情報(bào)數(shù)據(jù)等各種類(lèi)型的信息需求。
對(duì)領(lǐng)域中的術(shù)語(yǔ)建立了包含共計(jì)84個(gè)概念,28個(gè)關(guān)系,約2000個(gè)實(shí)例的4套相互異構(gòu)的領(lǐng)域本體,并利用本體匹配方法 Falcon-AO[15]建立了映射關(guān)系。其中定義了25條實(shí)體共指關(guān)系和10條屬性共指關(guān)系。(2)對(duì)現(xiàn)有的防空作戰(zhàn)指揮軟件進(jìn)行了改進(jìn),加入了包括用戶(hù)登錄身份識(shí)別、文書(shū)導(dǎo)入解析處理、階段轉(zhuǎn)進(jìn)操作監(jiān)控、行動(dòng)更替變化監(jiān)聽(tīng)、作業(yè)工具操作監(jiān)控、圖上軍標(biāo)操作監(jiān)控、系統(tǒng)時(shí)間采集、區(qū)域選定操作監(jiān)控等功能在內(nèi)的用戶(hù)決策事務(wù)感知模塊,實(shí)現(xiàn)了對(duì)用戶(hù)決策事務(wù)要素的動(dòng)態(tài)采集和賦值。(3)在企業(yè)決策系統(tǒng)服務(wù)器上設(shè)計(jì)開(kāi)發(fā)了需求生成和過(guò)程管理等功能模塊,實(shí)現(xiàn)了從感知用戶(hù)決策事務(wù)到生成信息需求模型的全過(guò)程,如圖6所示實(shí)驗(yàn)為了驗(yàn)證方法的可行性和有效性開(kāi)展了實(shí)驗(yàn)。針對(duì)55類(lèi)用戶(hù)決策事務(wù)中的每一個(gè)實(shí)例,請(qǐng)一名決策者手工輸入信息需求表達(dá)式,并與自動(dòng)生成的需求表達(dá)式進(jìn)行比較,一方面比較完成需求建模的耗時(shí),另一方面通過(guò)搜集的信息結(jié)果比較需求表達(dá)的準(zhǔn)確度。能力”信息依據(jù)領(lǐng)域本體被細(xì)化為 “最大機(jī)動(dòng)過(guò)載”、 “最大飛行速度”、“最大爬升角度”3個(gè)屬性,“F-18”的共指標(biāo)識(shí) “大黃蜂”也得到了擴(kuò)展。通過(guò)該實(shí)例不難發(fā)現(xiàn),即便 “戰(zhàn)斗機(jī)機(jī)動(dòng)能力”這樣一條簡(jiǎn)單的信息需求,都需要很長(zhǎng)的篇幅去精確描述。
這樣的工作如果手工完成,需要耗費(fèi)相當(dāng)多的時(shí)間和精力。而基于預(yù)先構(gòu)建的領(lǐng)域知識(shí),機(jī)器能夠在極短的時(shí)間內(nèi)完成上述工作。更大的好處在于,需求生成的自動(dòng)化,帶動(dòng)了信息服務(wù)的整體自動(dòng)化,即伴隨著用戶(hù)的決策作業(yè)過(guò)程,系統(tǒng)后臺(tái)會(huì)適時(shí)自動(dòng)地搜集適當(dāng)?shù)男畔⑻峁┙o決策者,因而更加便于將決策者的注意力集中在處理決策問(wèn)題本身上。5.2信息需求建模準(zhǔn)確度通過(guò)比較自動(dòng)生成的和手工建立的需求模型,不難發(fā)現(xiàn),自動(dòng)生成的需求表達(dá)式往往比較復(fù)雜,因?yàn)樵谀0逯性O(shè)定了很多限定條件,并基于領(lǐng)域本體自動(dòng)進(jìn)行了共指標(biāo)識(shí)擴(kuò)展,表達(dá)式中包含的信息量比較大。相比之下,不論經(jīng)驗(yàn)多么豐富的決策者,要在短時(shí)間內(nèi)全面考慮各種因素是很難的,要根據(jù)搜索結(jié)果反復(fù)修正表達(dá)式才能達(dá)到同等復(fù)雜度。不過(guò),就搜索結(jié)果而言,自動(dòng)的方法在結(jié)果的查全、查準(zhǔn)率上并沒(méi)有非常顯著的提升。通過(guò)分析認(rèn)為,主要原因在于目前建立的領(lǐng)域知識(shí)還不夠成熟,尤其是不夠精細(xì),對(duì)一些信息需求的細(xì)節(jié)刻畫(huà)不夠精密,相比人工描述還顯得 “笨拙”。而且,實(shí)驗(yàn)中也發(fā)現(xiàn),一些決策者的個(gè)性化求在自動(dòng)生成的表達(dá)式中沒(méi)有體現(xiàn)。這是因?yàn)轭I(lǐng)域知識(shí)是依據(jù)大眾共識(shí)建立的,不包含個(gè)性化的成分,因此生成的需求往往不能十分貼切地滿(mǎn)足每個(gè)用戶(hù)的個(gè)性化需求。針對(duì)上述問(wèn)題,在系統(tǒng)實(shí)現(xiàn)中增加了一道確認(rèn)機(jī)制:自動(dòng)生成的信息需求可以選擇要求經(jīng)過(guò)用戶(hù)確認(rèn),之后再發(fā)布出去。
這樣,用戶(hù)可以通過(guò)修改自動(dòng)生成的表達(dá)式來(lái)保證其準(zhǔn)確地反映了自己的真實(shí)需求。而另一方面,機(jī)器記錄下用戶(hù)的每一次修改操作,挖掘分析其中的規(guī)律,以促進(jìn)領(lǐng)域知識(shí)的不斷完善。雖然上述機(jī)制在某種程度上增加了人工參與的工作量,但相對(duì)于純手工方式仍然具有優(yōu)勢(shì)。而且隨著領(lǐng)域知識(shí)的不斷完善,手工修改的工作量會(huì)逐漸減少,優(yōu)勢(shì)的體現(xiàn)會(huì)更加明顯。6 結(jié)束語(yǔ)大數(shù)據(jù)改變了企業(yè)決策系統(tǒng)中的信息服務(wù)模式,但也為用戶(hù)獲取決策信息帶來(lái)了困難。為了獲得精確的結(jié)果,用戶(hù)需要花費(fèi)大量時(shí)間和精力在信息需求的表達(dá)上。應(yīng)用領(lǐng)域知識(shí)能夠有效解決這個(gè)問(wèn)題。
提出了一種主動(dòng)感知用戶(hù)決策事務(wù),依據(jù)領(lǐng)域知識(shí)自動(dòng)生成精準(zhǔn)的信息需求語(yǔ)義描述的方法,能夠有效減少用戶(hù)消耗在信息需求表達(dá)上的時(shí)間和精力。但生成信息需求內(nèi)容和時(shí)機(jī)的準(zhǔn)確性取決于領(lǐng)域知識(shí)的完備性,因此使用該方法的主要難度在于領(lǐng)域知識(shí)的構(gòu)建,是一個(gè)需要長(zhǎng)期積累和反復(fù)驗(yàn)證的過(guò)程。下一步的研究工作將重點(diǎn)針對(duì)領(lǐng)域知識(shí)的構(gòu)建展開(kāi)。事信映射模板是領(lǐng)域知識(shí)的一種初級(jí)表現(xiàn)形式,在用戶(hù)決策事務(wù)和信息需求之間的映射是有規(guī)律可循的。下一步擬通過(guò)實(shí)驗(yàn)數(shù)據(jù)分析挖掘這種規(guī)律,建立事信映射規(guī)則,以取代目前的事信映射模板,目的是提高領(lǐng)域知識(shí)的表達(dá)和應(yīng)用能力。
【面向大數(shù)據(jù)基于知識(shí)的決策信息需求動(dòng)態(tài)生成方式論文】相關(guān)文章:
數(shù)學(xué)知識(shí)在課堂上的動(dòng)態(tài)生成論文05-02
一種基于數(shù)據(jù)挖掘技術(shù)的決策信息模型04-30
基于數(shù)據(jù)挖掘的學(xué)生成績(jī)預(yù)警模型研究論文05-02
基于動(dòng)態(tài)規(guī)劃的企業(yè)投資決策模型04-28
基于模糊神經(jīng)網(wǎng)的決策樹(shù)生成04-28
基于用戶(hù)信息需求的圖書(shū)館館員知識(shí)服務(wù)04-28