前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇信息資源服務范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
信息資源云服務是通過云計算將分布式的信息資源進行資源整合、信息分析、數據挖掘等一系列操作后,為用戶提供滿足其信息需求的一種云端服務模式。信息資源云服務的客體是信息資源,主體則為云用戶,在信息資源云服務體系中,大部分信息資源都存儲在云端,因此,信息安全成為一個不得不考慮的問題,而這一問題牽涉信息資源云服務體系的各個方面,要想解決信息資源云服務的安全就必須結合通過云計算構建信息資源的流程及方法。信息資源云服務體系主要涉及資源層、用戶層、服務層三個核心層次。
1.資源層與安全風險資源層是信息資源云服務體系的基礎,旨在為用戶提供滿足需求的豐富的信息資源,主要通過終端輸入和網絡爬蟲的方式采集信息資源后進行存儲,建立資源池并生成信息索引。終端輸入是信息資源供給方將本地的信息資源數字化后上傳到云端服務器,而在數據傳輸過程中或許會面臨遭遇網絡攻擊與重要信息資源被截取的可能,即信息資源傳輸風險,從而造成巨大的損失。資源層采集信息資源的另一種方式是網絡爬蟲,即網絡爬蟲是一種按照一定的規則自動抓取萬維網資源的程序或者腳本,能在抓取一個或若干個初始網頁的URL和網頁內容的同時通過數據庫比對、自然語言理解、交叉語言檢索、數據挖掘等技術進行提取并建立自身的數據庫。信息資源云服務的目的之一在于共享,但為保持各個信息資源供給方自身的優勢,又有必要保留其特色信息資源,并且只能通過接口的方式訪問,而網絡爬蟲的肆意抓取將會導致諸多信息資源供給方面臨信息資源訪問權的風險。另外,云存儲風險是存在于資源層中的較大問題,云端數據的丟失將使整個信息資源云服務體系失去作用,例如,微軟提供SIDEKICK服務曾中斷了一個星期,導致用戶不能訪問自己的郵箱、日歷還有其他個人數據,并且微軟最后也承認這些數據無法恢復。因此,信息資源云服務中數據的完整性、可用性、保密性是開展云服務的基礎。
2.用戶層與安全風險信息資源云服務體系中資源池的構建不僅取決于云端信息資源的儲備,也涵蓋用戶這一層面。在整個信息資源云服務體系中,云用戶的信息需求直接影響信息資源的構建方向,云用戶的個性化特征將指引服務模式的創新,因此,用戶與信息資源云系統的交互在服務體系中擔當著不可估量的角色。兩者之間的交互具體體現在用戶根據自身的信息需求向信息資源云系統請求服務和信息資源云系統分析用戶信息行為兩個方面。第一個方面,用戶在請求服務前必須登入自己的云端賬戶以獲取自己所需的信息資源。信息資源云服務的構建中用戶分為普通用戶和管理員用戶,不同的用戶擁有的權限必須有所區別。在信息資源云系統針對不同用戶提供服務時,許多信息資源都要經過二次加工后才能滿足用戶的需求,而這類加工操作則必須由信息資源云系統的管理員才能完成,因此,權限的設定在服務中尤為重要,否則將引發管理權限風險。第二個方面,為了提供更好的個性化服務,信息資源云系統需要對用戶的信息行為蹤跡進行收集和分析,通過數據挖掘等技術發現用戶的隱性需求,這也是云計算中普遍使用的一種方法。用戶的個人信息行為屬于用戶隱私的范疇,因此云計算提供的服務與用戶隱私間存在著持久的矛盾,對用戶個人信息行為的分析是云計算提供更好服務的前提,但此舉實際上又侵犯用戶個人隱私。對于普通用戶而言,用戶隱私保護也是信息資源云服務的構建中迫切需要解決的問題。
3.服務層與安全風險信息資源云服務層為用戶提供信息資源的檢索、個性化定制、推送、云管理等信息資源云服務。信息資源云服務體系中使用的是公共云、私有云和混合云三種模式。信息資源公共云是第三方提供商為信息資源用戶提供的能夠使用的云;信息資源私有云是為一個信息資源用戶單獨使用而構建的,提供對數據、安全性和服務質量的最有效控制(這里的用戶通常是信息資源方);而信息資源混合云則是兩種云的混合,具備兩者的基礎特征。在信息資源云服務中,三種云之間的訪問應是無縫連接的,能夠同步完成信息資源的檢索、個性化定制、推送等操作,要實現這些功能,必須擁有信息資源云管理的統一標準。輕量目錄訪問協議(LightweightDire-ctoryAccessProtocol,LDAP)是一個用來目錄信息到許多不同資源的協議,能夠構建一個這樣的通用平臺。LDAP通過TLS(安全傳輸層協議)和SASL(簡單認證和安全層)來保證信息傳輸的安全性,但最近在拉斯維加斯舉辦的黑帽大會上,安全研究人員AngeloPrado、NealHarris與YoelGluck披露了一種名為BREACH(超文本自適應壓縮瀏覽器勘測與滲透)的新技術,該技術能夠獲取來自SSL/TLS加密網絡流量的敏感信息,并且三位研究人員聲稱,BREACH技術能給采用加密機制、算法的大部分TLS/SSL帶來巨大威脅。由此可見,數據的安全傳輸在信息資源云服務層中是一個很大的問題。所以,信息安全問題在信息資源云服務體系中主要體現為:信息資源傳輸風險、資源訪問權的風險、云存儲風險、管理權限風險、用戶隱私保護問題、數據的安全傳輸等幾方面,歸類后,安全問題可劃分為信息資源過程管理和用戶管理兩大模塊。
二、信息資源云服務中信息安全技術的應用
1.信息資源過程管理與信息安全技術信息資源過程管理包括信息采集、信息組織加工、信息存儲與檢索、信息服務四大子過程。在對信息資源進行云管理之前,可根據重要性對本地數字化的信息資源和網絡爬蟲抓取的信息資源劃分為一般信息資源、重要信息資源和信息資源。一般信息資源的目的在于分享,其重要性往往較低,在信息資源安全問題的管理上,可采用HTTP(超文本傳輸協議)或HTTPS(安全超文本傳輸協議,采用完全套接字層SSL作為HTTP應用層的子層)的方式直接進行傳輸,以保證其使用效率,改善用戶體驗。重要信息資源旨在為擁有更高信息需求的用戶提供服務,包括許多經過數據挖掘、信息分析和多次加工后的信息資源,這些資源也是增強用戶對信息資源云服務粘合度的重要原因之一,因此有必要對這類信息資源進行進一步的加密,實現技術為可在信息資源云服務器上部署云端加解密模塊。本地的重要信息資源數字化后,經過數字水印技術和AES(AdvancedEncryptionStandard,高級加密標準)算法加密后,通過VPN技術在公網上封裝出一個數據通訊隧道,上傳到云服務器,而網絡爬蟲抓取的信息資源則直接通過云端加密模塊進行加密后保存。由于通過VPN技術訪問信息資源的速度會降低不少,并且許多VPN技術受網絡環境及使用平臺影響的復雜程度也不盡相同,因此會導致用戶的使用效率受到影響。在保證信息資源安全性的前提下,為了盡可能地提高使用效率,可采用SSLVPN協議。SSLVPN結合了SSL和VPN兩者的優點,SSL處于網絡結構體系的傳輸層和應用層之間,因此SSLVPN幾乎支持所有的WEB瀏覽器,這也意味著用戶不需要為了獲取SSLVPN的支持而安裝第三方軟件,符合云計算開發的初衷。用戶通過SSLVPN協議訪問重要的信息資源不僅不受平臺的限制,而且能極大地提高使用效率。信息資源理論上并不適合保存在云服務器上,其資源池的建立是為了解決部分用戶因地域限制等因素而無法及時獲取自己所需的那些保密性較高的信息資源。為保證這類信息資源的安全,可使用多重技術,即用戶將訪問保密信息資源的請求經數據通訊隧道發送給信息資源的另一服務器,由該服務器將請求轉發給原始服務器,并最后得到所需的信息資源,這樣做的目的是為了隱藏用戶的目的及信息資源請求的來源,最大限度地保證這些保密信息不被竊取。信息資源能夠保證使用的前提是其完整性,為了避免由于物理因素、網絡安全風險、人為因素等引起的數據丟失、信息更改的現象,應適時采用云備份與磁盤備份相結合的方式對信息資源進行數據備份。
2.用戶管理與信息安全技術用戶的管理主要涉及用戶權限管理和用戶隱私保護。根據用戶層對用戶的分類,不同權限的用戶擁有不同的訪問權,在用戶權限管理上應用的信息安全技術為信息確認技術和網絡控制技術。信息確認技術的核心為涵蓋消息確認、身份確認和數字簽名的信息確認系統,對于需要一般信息資源的用戶通常可采用靜態密碼的方式來確認身份,訪問重要信息資源的用戶則必須開通動態密碼服務來獲取身份的確認,而針對那些與信息資源有關的用戶可根據實際情況采用生物識別技術。同時對普通用戶和管理員而言,兩者也不能出現超越限制權限的行為,否則會引起信息資源云服務的隱性風險,因此云服務器有必要通過網絡控制技術來規范其行為,最典型的即為防火墻技術,通過該技術既能夠允許獲得授權的外部人員訪問云服務器,又能夠識別和抵制非授權者的訪問。實際上,現有的防火墻技術并不能完全保證信息資源的安全,也存在被黑客突破的可能性,一旦突破,信息資源將完全呈現出來,同時外部用戶的身份認證技術也無法解決這一問題,為此需要對信息資源本身的文件操作制定相應的規則,而這一技術就是主動防御系統(Host-basedIntrusionPreven-tionSystem,HIPS)。HIPS不僅能夠限制用戶的行為,也能保護用戶隱私。HIPS包括應用程序防御體系、注冊表防御體系和文件防御體系,通過定制合適的規則可實現對運行程序、注冊表和文件讀寫操作的控制,在一定程度上可防止用戶訪問權限外的信息資源,同時也能保證用戶的行為不被云服務器肆意跟蹤。以上幾種信息安全技術的綜合應用將使用戶管理更趨科學化、合理化。
三、結束語
本文從政務信息資源整合的需求出發,首先對信息資源整合的國內外發展情況以及相關的技術進行綜述,并對政府組織結構和政務信息資源等特點分別進行建模分析,在此基礎上,基于 WebServiCes思想和目錄結構重載了政務環境下目錄服務的概念,構筑了異構政務信息資源目錄服務模型。在該模型框架體系中,主要分為三大主要子模型,一是政務目錄服務資源信息模型、二是資源互動雙方通信模型的建立、第三,也是尤為重要的一部分即政務信息資源目錄服務中心模型的構筑。
在建模過程中,首先對模型總體架構及層次結構進行研究闡述,構筑信息子模型和通信子模型并利用WSDL以及SOAP等協議給出其實現機制。文章著重探討了注冊過程子模型,核心研究了目錄服務中心的構建策略,主要包括基于緩存和排隊機制的服務中心注冊策略研究,利用并行注冊方式緩解目錄服務中心大規模信息資源注冊壓力問題;基于元數據的信息資源存儲策略研究,利用元數據映射將注冊資源映射為適于政務領域資源表述方式及目錄服務中心的存儲形式;采用適用于中國國情和政府組織結構的資源分類標準,設計目錄服務中心注冊資源目錄體系結構,并采用個性化目錄描述器設計資源目錄展現策略;最終對模型查詢處理策略進行了研究,并利用多種手段對其優化處理,形成了一套完整的目錄服務中心模型構筑策略的研究。
政務信息資源目錄服務模型的構筑研究及其在政務領域信息資源整合中的應用,可以輕松實現異地異構政務信息、資源透明共享、交換與集成,并且通過合理目錄體系結構的設計及導航,分布環境一F孤立復雜資源得以關聯,無序的資源得以有序化,為使用者提供“一站式”信息資源查找和定位服務,使用戶得以以最短路徑尋找到需要的信息,實現分布式異構多元信息源有效的整合。本文的研究為政府海量信自、資源整合的進一步研究提供了參考,對實現政務信息資源增值,促進資源發現、共享與利用效率具有理論價值和現實意義。
關鍵詞:電子政務;信息、資源整合;
緒論
十六大指出:“信息化是我國加快實觀工業化和現代化的必然選擇。堅持信息化帶動工業化,以工業化促進信息化”。政府作為國家信息化的先行者與實踐著,己把電子政務作為政府工作和國家信息化建設的重要戰略,并力圖通過電子政務的建設與應用來帶動相關產業群體的建設與發展,促進整個國民經濟的發展、提高現代化管理水平、政府行政效率以及工作的透明度等。政務信息資源作為電子政務建設的基石與核心,產生于政府行政過程中并直接影響政府施政的準確性與高效性。
資料表明,政務信息占社會總信息量80%以上,這些信息資源作為國家發展的戰略資源,受到各級政府、企事業單位乃至全社會的關注。從地位上看,它在一個國家政治、經濟、科技、軍事、文化領域中具有重要的戰略意義;從作用看,它是政府部門、企業單位、公眾個人社會經濟活動以及信息內容產業發展普遍需要、不可或缺的重要資源。電子政務的有效運行,也必須以這些海量的數據和信息為基礎。
1.1問題的提出
政府辦公自動化、行政審批、決策支持等電子政務業務,都以數據和信息的存儲、交換、共享為基礎。因此,有效管理、合理開發和利用政務信息資源對促進政府職能轉變、提高行政效率、增強監管和服務能力、推動全社會信息化持續健康發展有重要意義。為在施政過程中獲得最有力信息資源支持,并能夠最大限度的管理利用現有信息資源,
我國各級政府加大力度建設電子政務應用系統,這些系統局部提升了政府工作效率,但是仍舊不能夠滿足政府跨部門及與全社會業務協同的需要。信息資源開發利用的發展極不平衡,存在急待解決的問題:
(l)政府部門信息獨占性嚴重。電子政務建設至今,雖然信息資源服務范圍發生變化,但資源的開發和管理還以政府為主體,據統計,政府控制著國內約80%的信息資源,而電子政務推行的“十二”金工程更是進一步確立了政府部門對信息資源的高占有率和權威性。并且,由于政府對國家管理的特殊性和長久以來形成的封閉思維觀念,導致真正開放且流動的信息資源不能夠滿足市場和社會發展的需要。
(2)政務信息資源查找困難。一方面由于海量信息資源無序而雜亂的分布在政務資源網絡中,缺乏統一的管理;另一方面政務信息資源廣泛存在于分布式環境中,資源擁有部之間缺乏有效的共享機制與協同技術,導致信息需求者難以發現既存資源。
(3)政府各部門間信息資源難以相容。一方面由于政府部門各自為政,政務信息資源缺乏統一采集標準,數據類型、格式與存儲方式差異嚴重,導致部門間信息資源不一致、政務信息資源目錄服務模型研究不完整;另一方面政務信息資源多方采集、重復采集現象普遍,數據不能同步更新,造成部門間信息資源不一致。
(4)政務系統難以互聯互通。一方面由于缺乏統一規劃,各政務系統分散建設,缺乏交互接口,導致系統難以兼容,信息資源難以共享信息孤島現象嚴重;另一方面系統構建技術多樣化,難于實現系統間互聯互通。這些全部直接影響信息資源的管理利用,使信息資源的價值不能夠充分發揮,導致政府業務不能進行順暢、高效的銜接,行政效率低下。
為了解決上述問題、提高政府工作效率,充分利用政府以及社會中的信息資源,必須提供有效的技術手段整合現有的信息資源,提高政府部門對信息資源的共享水平和利用效率。
【關鍵字】 SOA 信息資源 資源服務 一體化管理一、建設背景
福建煙草經過多年信息化建設,形成一套結構合理、內容完善的應用系統體系,有效支撐企業各項業務應用,也由此產生了一定量級、多個類別、各類主題的信息資源群。由于以往信息化建設缺乏對信息資源體系統一規劃,企業信息資源存在架構不明晰、標準不一致,管理不規范,分類不合理,應用不深入等問題,導致企業信息資源利用存在“找不到,不會用,用不好”的問題,制約信息資源價值的充分發揮。
“十二五”以來,全行業高度重視信息資源建設工作, 把提升資源共享利用水平作為信息化建設的出發點和落腳點。國家局 “CT155”發展規劃明確指出:要高度重視信息資源的深度開發利用,努力實現集成整合、協同共享,真正發揮各類信息資源的綜合價值,充分體現信息化效能,支撐決策科學化,構建面向行業的信息資源共享服務體系。福建煙草“十三五”信息化規劃要求:做好信息資源規劃,統籌信息資源開發利用,加強資源信息化管理,實現信息資源的標準化、平臺化、服務化。
面對現狀,根據國家局、省局相關要求,我們研究并開發 “福建煙草信息資源服務平臺”,為福建煙草實現對企業信息資源的一體化管理提供信息化支撐,有效解決信息資源管理混亂、冗余建設、重復開發、交互不便、共享困難的問題。
二、系統組成
2.1系統架構
信息資源服務平臺按系統架構分為企業資源層、服務交換層、管理平臺層和服務使用層。
企業資源層:按照資源結構特征,將企業信息資源分為標準、數據、指標、報表和應用組件五大類。其中,標準資源是指各類管理標準和技術標準。數據資源是指由信息系統產生的、可供共享使用的企業經營數據;指標是對企業經營數據的加工結果,反映企業各類運行情況;報表資源是數據面向業務應用的表格化展示;組件資源是應用系統中可供共享使用的功能單元。
服務交換層:交換服務層主要是企業服務總線,為數據交換提供了一個互聯互通、可移植性和安全性的標準接口,是實現服務交互的基礎。
管理平臺層:管理平臺實現信息資源邏輯層面的匯聚和分類,輔助解決信息資源的“進、退、管、用”的問題,提供信息、綜合檢索、資料下載等功能,方便用戶更好地了解和使用各類信息資源。
服務使用層:主要是使用信息資源的各類用戶,比如開發商、集成商、資源管理用戶和普通用戶等。不同的用戶有不同的系統使用權限和規范。
2.2系統流程
資源建設階段:包括資源發現、資源開發、資源測試三個環節。資源發現是指在新建或改造系統中,從資源共享的角度出發,確定信息系統中可提煉的共享資源。資源開發是指按照規范化、標準化的要求進行共享資源的提煉和服務化封裝。資源開發完成后,進行功能性和標準性測試,確保符合平臺的集成要求。
資源管理階段:包括資源、對接管理、運行監控和資源維護四個環節。資源是指共享信息資源經過測試后,注冊并到平臺中。對接管理是指對各項服務接口進行集中管理,進行接口啟用和停用等。運行監控是指對資源服務的服務質量進行監控。資源維護是指根據運行情況對信息資源進行更新維護。
資源服務階段:包括資源申請、資源使用和資源評價三個環節。資源申請是由資源使用者通過規范化的流程向管理部門提出資源使用申請。資源使用是指通過平臺進行資源使用。資源評價是指服務使用者反饋使用過程中存在的問題。
三、技術實現
3.1資源標準化
通過配套文件《信息共享用集成規范》來約束信息資源的建設、管理及應用過程,實現對信息資源建、管、用的標準化管理。
建設標準化:針對正在或即將建設的信息系統,規定其必須遵循已制定的信息分類編碼標準、數據元標準、主數據標準、信息交換標準等信息化標準,保證新產生的信息資源在編碼方式、數據結構、接口參數等方面同現有資源保持一致;針對已建信息系統產生的,經研究認定需要納入平臺進行統一管理的信息資源,通過代碼轉換、數據清洗等方式對資源進行加工處理。
管理標準化:首先,做好信息資源分類管理。將信息資源分為標準、數據、指標、報表、應用五大類,通過資源描述、資源內容、使用規范三方面描述信息資源結構,使信息資源能夠準確定位,便捷使用。其次,做好信息資源的生命周期管理。對 “進、退、管、用”核心環節進行標準化流程管理。
應用標準化:為充分發揮信息資源的綜合價值,避免信息資源的重復開發和冗余建設,通過下發制度文件,對信息資源實行強制使用。已集成、的信息資源,新建系統應通過資源調用集成現有資源,原則上不得重復開發和單獨建設。在申請使用信息資源前,應通過服務平臺掌握目前信息資源現狀,根據資源現狀做好需求分析工作,明確資源調用清單、方式和頻次,并提交使用申請。
3.2資源服務化
平臺采用基于SOA的平臺架構,其集成的資源通過服務化封裝,以WebService的方式通過企業服務總線向服務使用者提供各類信息資源服務。平臺了一系列規范指導信息資源的服務化,主要包括:
服務消息規范:對服務調用和反饋信息的消息格式進行嚴格約定,服務消息要求按照XML格式進行傳輸,并明確出包頭和包體的具體封裝格式,確保平臺能按照預定格式進行解析。
服務接口規范:在資源開發時,開發者需遵循 “建設標準化”要求開發相應的Web服務接口。服務接口描述如下:
服務對接規范:主要包括服務使用申請、服務交易令牌、服務報文封裝、API調用方式、解析服務報文、服 務聯調測試。
3.3資源平臺化
信息:在平臺上最新的信息資源建設、應用和監控信息,讓使用者能夠及時了解信息資源建設動態,被使用情況和運行質量反饋等信息。
集成展示:按目錄化的要求,在管理后臺,根據福建煙草信息資源整體框架做好信息資源的目錄管理,在展示前臺,根據資源目錄向使用者提供分類別、分主題、結構化的信息資源清單。
綜合檢索:提供按類別、主題、關鍵字等多維度綜合檢索功能,并實現資源內容的快速定位,使用者能方便、快捷地找出自己想要的信息資源。
資料下載:平臺不單管理信息資源的內容,還包括資源描述和資源使用規范,使用者可對這些材料以文件的形式進行打包下載,以指導信息資源的實際應用。
使用申請:借鑒“商品購物車”的模式,使用者可以瀏覽并將各類資源加入“資源購物車”,進行資源的統一使用申請。平臺能夠根據資源條目、用戶信息自動生成格式化的申請審批文件,以便使用者向信息管理部門申請使用資源。
運行監控:信息資源以服務的方式提供給信息相關方使用,資源使用者和管理者可通過平臺掌握資源服務運行情況,如請求時間、報錯信息、傳輸數據量等。
四、應用效果
1)加強資源共享,降低系統開發成本。通過信息資源的標準化、服務化和平臺化,服務平臺為信息資源共享提供了規范、高效、便捷的渠道,有效預防信息資源重復、冗余建設,降低信息系統的開發成本。自上線以來,平臺充分利用企業現有信息資源向統一門戶、ISO系統、電子監察系統、專賣內管系統等11個應用系統累計提供標準服務243項,數據服務140項,指標服務89項,報表服務47項,應用服務23項,為各個應用系統在接口對接方面縮短1/2以上的時間,降低接口集成的開發成本1/4以上。
2)強化資源整合,提高資源效益產出。基于信息資源的標準化,通過服務平臺實現了信息資源的高效整合和集中展示,滿足了企業跨地域、跨業務、跨系統的集成整合需求以及數據關聯分析需求,充分發揮了信息資源的綜合價值。解決專賣和營銷系統間的8項集成需求,營銷和物流系統間的12項集成需求,人力與相關業務系統間33項集成需求,充分發揮了信息資源的整合價值,提高了資源的效益產出。
3)促M標準落地,支撐一體化平臺建設。通過服務平臺,實現標準和宣貫,有效促進企業信息資源標準體系建設和落地,從而為企業一體化平臺建設提供強有力支撐。目前,在平臺上項目管理、網絡基礎設施、運行維護、信息安全、數據中心等五大類信息管理標準共23項;各類信息資源標準1164個,其中數據元標準1023個、信息分類編碼標準123個,主數據模型標準18個。平臺為用戶了解標準、獲取標準、反饋信息提供了便捷渠道,有效推動了企業信息標準化的建設。
參 考 文 獻
[1]張春芳,孟杰; 基于SOA架構的內蒙古煙草應用集成平臺研究與實現; 內蒙古農業大學學報:自然科學版》 ;2013
1基于個性化服務的信息資源整合問題的提出
1.1個性化信息服務對信息資源整合的要求
以用戶為中心的個性化信息服務模式,是指為了方便用戶利用其各種數字化資源,充分利用各種智能化技術對不同類型、不同特點的數字化資源進行整合,實現信息資源、信息技術、信息內容的集成,使目前信息資源組織系統的公共用戶界面變得簡單、友好,并且使用戶能利用同一檢索表達式或檢索詞對各種數字化資源進行同步檢索,實現同一主題信息資源的一步到位的檢索與查詢。同時,還可以根據某些用戶特定的信息需求定制具有個性化特點的用戶界面來提供符合其特定需求的具有個性化特點的信息和信息服務。
個性化的信息服務是以信息資源整合和信息服務集成系統的建立為基礎的,如果沒有完備的資源整合體系作后盾,無縫的、貼切的、高效的、主動的、一站式的信息服務模式則是無法實現的。
個性化信息需求及服務要求信息資源必須進行整合。
由于目前的信息資源組織體系并沒有將其提供的各種信息資源整合為一個整體,只是簡單地將各種商用數據資源和非商用數據資源連接到機構網站上提供信息服務。所以,目前絕大多數信息資源組織體系給用戶提供的用戶界面是一個既相當復雜又不考慮不同用戶信息需求差異的公共用戶界面。用戶使用不同的資源往往需要使用不同的檢索軟件并需要對路徑及其它一些參數進行必要的設置,這樣就大大增加了用戶檢索和利用數字化信息資源的麻煩。[1]
目前信息資源組織體系中各種數字化資源的非整體化狀態,致使其用戶界面復雜單一,檢索方式迥然不同。即使專業檢索人員要查檢有關某一主題的信息資源,也是一件相當麻煩和復雜的事情,更何況絕大多數用戶并不了解各種檢索技術、各種數字化資源的結構特點,且信息需求各異。所以,把信息資源組織體系諸要素有機地鏈接成一個整體,使得一般用戶在一個簡單、友好的公共用戶界面上,利用一個檢索表達式或檢索詞,能得到面向主題的“一步到位”的信息服務,是信息資源組織發展的必然趨勢。建立以用戶為中心的集成信息服務與個性化定制服務相結合的用戶服務模式,是信息資源組織體系滿足信息用戶多元化、多層次、個性化信息需求,改進數字化資源的利用率,提高服務質量的必由之路。[2]
1.2基于個性化服務的信息資源整合
信息資源整合是一種信息資源優化組合的存在狀態,是依據一定的需要,對各個相對獨立的資源系統中的數據內容、功能結構及其互動關系進行類聚和重組,重新結合為一個新的有機整體,形成一個效能更好、效率更高的新的信息資源體系。信息資源的整合程度直接關系到信息資源能否被高效吸收與利用。
整合是連接現代信息資源組織與傳統信息資源組織的橋梁。傳統信息機構已建立起大量的電子化、網絡化的書目數據庫系統,指引讀者使用圖書館館藏。最著名的書目數據庫是OCLC的WorldCat數據庫[3],該數據庫集合了全世界3萬多個圖書館的4000萬條書目記錄。這些用MARC格式保存的書目記錄自然應該成為信息資源組織體系的一部分。由于數字化信息只是人類信息的一部分,傳統方式組織的書目信息也將日益增長。所以要將數字化信息與非數字化信息有機地聯系起來,組成一個廣泛的、有序的和完整的信息組織體系。由于傳統書目信息和數字信息資源的組織,在技術和標準等方面有較大的差別,怎樣建立起這兩種信息組織之間的對應關系,也是信息資源組織研究的課題。[4]
基于個性化服務的信息門戶將數據庫、數據倉庫和文檔中的信息轉變成可利用的信息,并把這些信息傳送到用戶面前。通過集成化的方法把原有應用系統通過一個核心組件服務器(即應用服務器的服務之一)集成在一起,能夠獲取其他應用系統中的相關數據和消息,所有獨立的、分散的應用系統通過事件、消息和數據的相關性集成為一個有機整體。由于分布、異構的信息系統將是數字信息環境的主流形態,因此整合檢索和整合瀏覽是網絡環境下信息服務的迫切要求。目前雖有多方面的探索,但仍處于初步發展階段。而互操作性又涉及系統的、語法的、結構的和語義的4方面的問題。我們不可能奢望已存信息系統以及即將建立的信息系統全部實現標準化。我們只能最大限度地追求接口標準化,實現跨主題信息網關檢索,從而為用戶提供高質量的信息檢索服務。[5]
信息資源整合應立足于信息資源系統結構性優化整合。系統的結構性是指系統中各要素之間所形成的某種關系,是系統有機聯系的反映。相同的要素具有不同的結構形式時,系統就會產生不同的功能和效果。
信息資源系統的結構整合包括橫向和縱向結構整合。橫向結構指的是信息資源專業學科上的相互關聯性,橫向整合即對不同的數據庫中相同學科專業的信息資源進行優化整合。縱向結構指信息資源在空間上的相互關聯性,縱向整合即是將不同學科專業的信息資源整合為具有多維立體網狀結構的有機知識整體。
結構是功能的基礎,結構決定功能。要發揮信息資源系統的整體功能,必須合理地整合結構,構建有效發揮功能的信息資源體系結構。[6]
基于個性化服務的信息資源整合方式優勢有:首先,能夠整合多種渠道多種媒體的數字信息,不僅包括文字、還包括圖像、音頻、視頻等不同載體、不同介質的數字信息。其次,能夠實現不同類型、不同級次(一次和二次)資源間的鏈接,建立其圖書、期刊、會議、機構、人物等科學研究所需核心資源和相關資源間的整合與鏈接關系。第三,能夠保持知識體系的整體性和關聯性,通過知識因子的有序化和知識關聯的網狀化,溝通相互隔絕的學科領域,使之成為相互滲透、相互作用的有機體,發揮科學知識的整體功能。第四,能夠形成具有新的組織結構和功能的資源系統。這種整合不是簡單的集合和鏈接,而是剔除冗余、重復和劣質信息,形成一個獲取便捷、利用率高的新的信息資源體系。[7]
理想的信息資源整合把各種信息資源透明地、無縫地鏈接在一起,讓用戶十分方便地使用這些資源而感覺不到他的每一步操作所調用的可能是不同的資源。
在個性化知識組織門戶中,經過信息資源的整合,提供統一的檢索界面,用戶的信息利用將會變得非常便利,這也是數字資源開發、組織和管理所追求的一個重要的目標。
2個性化知識門戶中信息資源整合的構想
在個性化知識門戶中,信息資源的整合與系統組織形式有:建立開放資源系統、信息資源的整合導航、信息資源的無縫鏈接與動態重組。
2.1建立開放資源系統
從技術角度,個性化知識門戶采用開放結構,開放地集成各種分布、異構和多樣化信息資源和服務系統,動態構建滿足各種用戶群或業務流程需要的虛擬信息服務機制。
之所以采用開放體系,是因為用戶面臨的是一個分布的信息環境,需要充分利用各種現有和未來的、自建或引進或鏈接的、采用各種技術平臺和數據模式的資源與服務系統,無論這些系統分布在什么地方。為了支持用戶在分布環境中搜尋、獲取和利用信息,個性化知識門戶需要能夠對分布和多樣化的資源和服務系統進行搜尋、調用和集成,支持互操作和整合處理以及相應的集成管理,形成邏輯的集成服務。而這一切,又要在信息技術和用戶需要不斷發展、信息資源組織技術和體系結構不斷變化的情況下建立,因此必須在按照一個邏輯體系來構建相應的資源與服務體系的同時,爭取適應新的技術與機制(包括新的資源與服務類型)的發展。[8]
開放資源系統建設的目標是:制定信息資源系統和服務系統的開放描述、開放數據接口和開放服務接口規范,建立對資源系統數據進行系統化定制加工和個性化組織的政策機制和權益管理機制,建立對服務系統功能與流程進行系統化集成和個性化重組的政策機制和權益管理機制,支持第三方(包括市場力量)按照規則開發、組織和提供個性化知識化特色服務。
2.2信息資源的整合導航
信息資源整合強調導航能力,因為信息資源組織體系提供的信息,不管是專業性的還是綜合性的,如果不提供導航能力,用戶就像是在大海中迷路的船只一樣。導航的途徑是多種多樣的,既有基于資源類型的導航,也有基于知識分類體系的導航,同時也可以按照字順瀏覽等。美國國家教育圖書館上,就按照資源的提供網站,向用戶提供導航,讓人一目了然。OhioLink提供了按主題瀏覽、資源類型、首字母來提供導航功能。[9]
筆者認為,隨著數字化進程的加快,信息資源數量將會越來越多,在基于個性化服務的信息資源組織系統中,全面收集信息資源的相關信息,提供包含刊名、URL、數據庫來源、ISSN、學科分類、主題詞、資源類型、出版機構、使用權限、刊物被著名檢索系統收錄情況、刊物通信地址、刊物簡介等在內的導航服務十分必要。同時應重視對引進數據庫資源的開發研究工作,建立基于信息資源共享的信息機構聯機電子資源檢索平臺,并提供各信息機構的虛擬館藏信息,以便開展電子資源的文獻傳遞服務。
中國科學院國家科學數字圖書館為支持科研用戶方便有效地搜尋、發現和選擇利用各種數字信息資源和其它信息資源,建立多個分布的學科信息門戶網站,提供權威和可靠的學科信息導航,整合學科信息資源與服務系統,將學科信息資源與服務整合到用戶桌面。[10]
2.3信息資源的鏈接與動態重組
在信息資源組織系統中,普遍存在著信息資源分散組織的現狀。如不同格式的電子文檔、多媒體文件無法實現統一管理和查詢;基于關系數據庫建立的業務系統無法高效地完成內容全文檢索和主題檢索;自建數據庫和引進的數據庫系統由于來源、所用管理系統的不一,各數據庫信息資源之間無法實現統一維護管理,資源與資源之間缺乏按照知識主題的整合,各個分散的資源之間缺乏有機聯系,不同信息資源無法實現集中、統一地上網并實現檢索界面、檢索方法的統一。
所謂信息鏈接與動態重組,指在已建立的信息資源體系基礎上,將有關信息內容鏈接起來形成新的信息鏈或信息集合,從而實現信息的重組。[11]這種鏈接重組重要不依靠作者事先建立的鏈接,而是專門建立相應的鏈接機制,有意識地根據用戶的特定需要和信息內容內在關系來進行面向用戶的信息組織,可以看成是用戶界面層的信息組織機制。
在基于個性化服務的信息資源組織系統中,要實現信息資源的無縫鏈接,即通過統一界面方便快捷地檢索到信息資源組織體系內的所有分布式異構資源,實現統一檢索界面、統一檢索平臺、統一用戶認證。
在系統內實現對這些多源異構數據的統一管理;為異構、分布式資源提供統一的權限管理機制和安全機制;對多源異構數據的統一和檢索;在統一管理和統一檢索的基礎上為用戶提供個性化服務。
使用MARC格式對網絡學術數據庫的電子資源進行整合,將“實體資源”與“虛擬資源”融于一體,建立基于OPAC的一站式檢索,提供“一站式”(One-stopShopping)信息服務。
2.3.1信息鏈接與動態重組的形式
信息鏈接具有多樣化的形式,如:
(1)知識性鏈接。主要是信息內容與相關的知識組織體系鏈接,包括與詞匯表、敘詞表、分類表等的鏈接,通過建立鏈接可解釋有關信息內容、按知識組織體系顯示及組合信息內容,或進一步支持利用知識組織體系的映射。
(2)參考文獻鏈接。主要指文摘索引與它們所標引的文獻之間的鏈接,
目前已成為各個文摘索引和全文期刊出版系統的標準功能之一,并逐步走向跨出版商跨系統的、可本地控制的開放式鏈接機制。
(3)引用網絡鏈接。主要鏈接引用目標文獻的文獻、被目標文獻引用的文獻、同被引文獻、引文耦合文獻等。這類系統往往融合參考文獻鏈接功能,但能進一步通過引文關系來鏈接相關文獻,還可對引用鏈接實行動態更新,從而形成一個以文獻為中心的不斷更新的相關信息集合。[12]
(4)語義鏈接。主要是利用語義網絡和概念集等,將信息內容與那些雖然沒有直接語言關系或引文關系,但有一定邏輯聯系的信息內容連接起來,例如關于某一疾病的文獻與那些和該疾病有并發關系的其他疾病的文獻鏈接起來。語義鏈接需要知識組織體系和推理的支持,往往體現為虛擬的動態的鏈接。
(5)重組性鏈接。其重點不在具體文獻的檢索,而是對一批信息內容按照特定體系重新組織,而這個體系可能是動態定義和個性化的,例如個性化資源系統,按不同分類體系或同一分類體系的不同層面組織資源體系,按主題分類組織檢索結果。[13]
2.3.2信息鏈接與動態重組的模式
在個性化信息資源組織體系中,需要對信息資源進行鏈接與動態重組,其方式有淺入深依次為:書目管理系統OPAC與數字資源的整合、通過聯合檢索達到一定程度的整合、建立統一元數據庫通過整合檢索達到更高層次的整合。
(1)書目管理系統OPAC與數字資源的整合。書目管理系統OPAC與數字資源的整合有兩種方法:第一種方法是通過元數據融合達到統一檢索的目的,第二種方法是通過建立關聯達到相互調用的目的。(2)通過聯合檢索達到一定程度整合目的。它的實現有兩種方法:一是通過執行Z39.50協議,聚合不同平臺上的異構OPAC數據庫,建立書目整合檢索系統。如上海地區圖書館所采用的“Webpac檢索系統”的“多數據庫檢索”,可在統一檢索界面上通過著者、題名、主題、關鍵詞、標書號等途徑,檢索上海交通大學圖書館、華東師范大學圖書館、復旦大學圖書館、上海圖書館的OPAC書目信息,不需要在各個圖書館不同的OPAC界面間來回切換。二是利用數據商提供的MARC數據,根據圖書館制定的數字資源著錄標準,將數字資源導入OPAC,形成實體和虛擬館藏的書目整合檢索系統。
(3)建立統一元數據庫通過整合檢索達到更高層次的整合。通過支持分布的數字信息系統間的互操作、無縫交換和共享信息資源與服務,構建一個邏輯的集成信息服務機制,并按數字資源的邏輯關系組織成立體網狀、相互聯系的知識資源系統。如中國試驗型數字式圖書館,它的數字圖書館應用系統是進行數字化建設及整合各類數字資源的基礎平臺,實現資源的深層標引和分布式資源庫的跨庫鏈接。
3基于個性化服務的信息資源整合展望
信息資源整合與重組是個性化服務發展和信息資源多樣性發展的產物。隨著數字資源的迅猛發展和個性化服務的普遍實施,可供利用的信息資源層出不窮,資源整合與重組勢在必行。但由于數據庫集成開發商為了維護自己的利益,在制作數據資源的過程中往往對數據庫進行了種種限制,如對數據庫進行加密,使一般人難以讀懂和理解其數據格式;同時還存在版權問題,這給信息資源整合與重組帶來了一定的限制。目前,對資源整合與重組的探討還處于萌芽狀態,還是一個有待于探討的領域。本文在個性化服務的信息資源組織中初步探討了其資源整合與重組問題,其實現還有待于信息資源組織領域和數據庫開發商的共同努力。
厘定思路,加強領導與規劃
檔案信息化建設必須堅持以檔案信息資源為核心,以信息資源共享為目的,所以網絡這個新生事物一經出現,便吸引了浙江檔案部門的視線。借助因特網這個"第四大媒體",可以打破原來的邊界束縛,讓檔案信息資源在無限寬廣的領域得到共享,以此創建檔案工作開放、積極、務實、人文的新窗口。
思路甫定,全省各地就緊鑼密鼓地開始了籌劃實施工作。經過前期的試點摸索,2002年8月,全省召開檔案互聯網站建設會議,對網站建設進行全面動員。會議要求各地以積極的態度、嚴格的制度、嚴謹的作風搞好網站建設,明確布置了各地的工作任務,組織各市檔案局(館)技術骨干進行網頁制作培訓。省檔案局在做好引導工作的同時,積極向基層輸送技術服務與咨詢,幫助下面解決技術上的困難。
在實施過程中,針對各地網站建設的不同進度,省檔案局不定期地信息通報,肯定建設速度與效果都較好的單位,督促、鞭策建設進度較慢的單位,以便保質保量地完成全省的預期目標。
獨辟蹊徑,開創檔案網站建設的全新模式
浙江省檔案館嘗試探索建立網站主要是依托電腦公司的技術力量,搭建了"浙江檔案網",并于2001年7月正式接入Internet。"浙江檔案網"的開通,受到了社會的普遍歡迎。截至2002年6月,網站的訪問量達兩萬多人次。但是在網站運行中也暴露出不少問題,如開發成本較高、安全與維護的技術難度較大、與電腦公司的溝通比較困難等。省檔案館是全省檔案網站建設的先行者,同時也是實驗者,所以他們在工作中暴露出來的問題,給全省的網絡規劃與運作提供了借鑒與思考。
財力物力捉襟見肘,信息技術人員鳳毛麟角,這似乎是檔案部門的行業特征。為了找到適合檔案部門特色的互聯網站建設道路,解決束縛網站建設的人財物問題、技術準入問題、安全維護問題,實現輕輕松松建網、平平安安運行,作為全省的檔案行政管理部門,省檔案局煞費苦心,動了不少腦筋,經過多方探索與方案論證,終于找到了一條快速、便捷地構建全省檔案網絡的解決之道---"數字浙江"。
"數字浙江",是浙江省信息化重點工程項目,它為全省各地85%以上的機關單位提供了自助網站應用平臺。這種自助式網站應用平臺,可以讓用戶無技術障礙地建立網站,并輕松實現維護。每年只要繳付低廉的租金,就可獲得充足的網絡空間。這種低門檻的進入方式,使困擾檔案部門已久的許多困難都能迎刃而解。
在全省的互聯網建設會議上,省檔案局要求各地以"數字浙江"為平臺構建網站。已有網站的,也可以掛在"數字浙江"上,并且第一年租費全部由省局支付。這種簡單、創新的運作模式,大大激勵了基層檔案部門的工作積極性,原先的畏難情緒也因此煙消云散。檔案網站開始在浙江大地如雨后春筍般涌現出來。
鞏固成績,逐步實現從量的擴張到質的提高
截至目前,全省95個檔案局(館)中,已有94個檔案局(館)建立網站,其中除了8家單位保留原有的自建網站外,其余的網站都是依靠"數字浙江"網絡平臺創建的。
一個覆蓋全省的檔案網絡體系已初具規模。
現在,只要通過省檔案局(館)的門戶網站,就能搜索到全省各市、縣檔案局(館)的信息,而且還能查到國內外主要檔案網站的信息。從2002年11月起,省檔案局無密信息和文件,都開始網上傳輸。
今后一個階段,全省檔案網站建設將調整工作重點,實現從量的擴張向質的提高的轉變,這需要有大量內容充實網站,需要重點開發檔案網站的核心功能,即要建設好開放檔案信息查詢與電子檔案政務等欄目,積極拓展網站的輔助功能,讓網上用戶有檔案資料可查,有檔案工作信息可看,有歷史知識可汲取,有檔案文化可品茗,避免讓他們成為匆匆過客,以此集聚檔案網站的人氣。2003年9月,全省組織優秀檔案網站評比活動,推進各地檔案網站質量與效益的提高。