前言:本站為你精心整理了大數據企業檔案信息資源整合淺析范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
“大數據”這一名詞伴隨著龐大數據群自20世紀90年代悄然出現后,逐漸聲名大噪。隨著云計算、物聯網等技術的產生和發展,隨著各種信息發布、信息存儲和信息傳播方式的興起,全球的數據都在以前所未有的速度飛速增加和積累。凡此,無不給檔案事業的信息資源累積、整合與利用帶來巨大的影響,進而對全世界經濟社會發展產生轟動效應。
一、大數據時代的到來
(一)大數據概念與含義大數據,或稱巨量數據、海量數據、大資料,指的是所涉及的數據量規模巨大到無法通過人工,在合理時間內達到截取、管理、處理、并整理成為人類所能解讀的信息。
(二)大數據與檔案的關系
1.檔案大數據是大數據的有效組成部分。隨著大數據時代的來臨,大數據已經幾乎滲透到了全球各個領域,檔案領域的大數據也隨之逐漸蓬勃發展起來,檔案的來源更廣、數據更新、平臺更多、技術更過硬,使得檔案大數據的數據量和數據類型都呈直線上升的增長趨勢。2.檔案大數據的價值一般高于整體大數據的水平。檔案的性質就決定了檔案領域的大數據價值勢必高于其他領域大數據的價值。檔案是一種原始記錄,檔案工作有其深厚的理論和實踐基礎,因此檔案領域的大數據在系統性、完整性和準確性方面將更具價值優勢。3.檔案大數據的有效利用將高于其他數據。檔案工作長久以來的最根本目的就是為了提供利用,大眾對檔案已經形成一種利用習慣。而檔案的價值高于普通數據,使得檔案大數據的利用價值也將高于普通數據。檔案涉及的行業領域十分廣泛,從政府公文到公司賬目,從建筑圖紙到獲獎證書,從專利證明到照片視頻,檔案數據的利用延伸到了工作生活的多個方面,這也是其他數據所無法比擬的。
海量的數據充斥世界,如何將這些信息迅速轉化為可利用的信息資源,無異于掌握了一把能打開另一個世界的鑰匙,越來越多的政府、企業,正逐步意識到這隱藏在數據山脈中的金礦。檔案管理需要從簡單的數據收集、整理、存儲,轉變為檔案信息資源的有機整合、加工,從而形成高價值的可利用信息資源。
(一)擴展檔案范圍,記錄即檔案
大數據時代,記錄即檔案,檔案不應該再局限于事件結束后經過整理歸檔的文件,信息化環境下,很多記錄一旦形成,就應該成為可供利用的檔案。
(二)從數據庫到大數據的飛躍
大數據的出現勢必會顛覆以往數據管理的模式,傳統數據庫的處理規模較小,大數據難以通過數據庫來進行處理;大數據環境下的檔案類型將日新月異,傳統數據庫中的檔案類型單一,往往集中于某幾類檔案;數據庫中的檔案僅僅作為檔案本身而存在,大數據則是一種可以被利用的資源,與其他資源的可聯性較強;傳統數據庫的擴展性較差,而大數據則需要能夠適應數據增加速度的新數據庫。建立能夠適應檔案大數據的新數據庫,是企業檔案信息資源整合的前提。
(三)數據挖掘和數據挖掘的應用
數據挖掘是在探討用以解析大數據的方法。大數據時代的檔案信息冗雜、價值高低不一,利用起來尤其不便,許多低價值甚至沒有價值的檔案與重要價值的檔案摻雜在一起,難以從中分辨,這就需要數據挖掘,去粗取精、去冗分類,從中提取高價值的檔案,整合低價值的檔案,最終獲得更高的效益。檔案的價值不再僅僅局限于表面,大數據的關鍵在于其潛在價值,檔案工作不僅僅局限于收集保存,還需要挖掘數據的潛在價值,激活隱性信息。數據的重要價值在于其使用,而不再是數據本身。檔案也不再是越多越好,有量又有質才是今后的發展趨勢。只要擁有良好的數字資源基礎,計算機快速處理海量的不同類型信息的能力就能夠高效地挖掘出檔案信息資源的潛在價值。
(四)注重檔案數據的前端控制
除了擴大收集范圍、建立新型數據庫、數據挖掘以外,還要做好檔案數據的前端控制,以確保檔案管理工作的規范,從源頭上做好檔案信息資源整合的準備。企業的辦公系統、財務系統、合同管理系統、PDM系統等,以及各項業務流程,都應該將檔案管理工作融入其中,做好文件的前端控制。
(五)應該將大數據融入到數字檔案館建設中去
目前多數企業都在進行或完成數字檔案館建設,大數據以及大數據技術都應該有選擇地與數字檔案館建設相結合,為下一步建設智慧型檔案館做好基礎。
三、企業檔案信息資源的利用
(一)海量數據的查詢能力是檔案利用
首先需要解決的問題隨著信息技術的進步、數據庫技術的發展,計算機輔助檔案管理使檔案管理變得更為快捷和方便。但是在大數據時代,檔案數量急劇增長,傳統檔案數據庫的性能難以支撐其快速增長的數量。在進行檔案查詢時,往往需要的信息會被埋沒在大量不需要的數據中,并且檢索性能急劇下降,甚至無法響應。因此,如何在大量的檔案中快速而準確地找到所需的信息,是檔案提供利用要解決的首要問題。其中,基于音視頻的檢索、基于語義的檢索和檔案智能輔助分類都是檔案大數據目前急需的檢索技術。
(二)信息載體、信息技術、檔案設備等的先進性和智能性直接決定檔案信息資源的利用效果
大數據時代的來臨,各種新媒介新載體新領域的檔案不斷涌現,同時技術更新換代越來越頻繁,不僅使整個社會走向智能化,檔案工作也需要走向智能化,用智能化的技術手段為用戶提供定制的利用服務,提高收集、存儲、管理、分析和分享大量數據最先進的核心技術水平,并根據不同的用戶需求,提供不同的利用途徑和數據信息,以達到最滿意的利用效果。
(三)提高檔案部門在信息資源利用中的指導作用,提升檔案部門的研究能力
檔案部門需要轉變過去的服務方式,主動去了解本單位用戶的需求,根據不同需求,對海量的檔案信息資源進行分析、歸納和整理,找到數據之間的關聯,進行相關性分析,注重質量,加強特色開發,從而提高檔案的利用質量和利用水平,讓數據的價值得到良好的體現。
(四)通過宣傳提高檔案信息資源各種利用形式的知名度
時下,多數用戶對檔案信息資源的利用方式都比較單一,對于最新最先進的利用手段掌握得比較滯后,檔案部門對檔案利用手段和利用形式的宣傳不夠到位,讓很多最先進的技術手段形同虛設。因此,在企業中提高檔案信息資源利用形式,才能讓檔案的利用工作真真正正地發揮作用。不言而喻,大數據時代以高調而不可逆的姿態降臨,與檔案領域擦出絢爛的火花,既有沖撞又有助益,更有利于促進檔案事業快速發展。是大數據為檔案界帶來了前所未有的發展機遇,檔案信息資源的整合與利用為大數據展示了廣闊的發展空間,我想這就是本文試論的最滿意的結論。
作者:麥迪 閆潤中 齊宏遠 單位:中國航空工業集團公司 西安航空計算技術研究所