前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇數據分析設計范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
關鍵詞:商務平臺;數據分析;電子商務
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2015)30-0211-02
隨著電子商務的發展,越來越多的實體商戶轉向網絡虛擬網店,“淘寶網”的店鋪數呈指數增長;消費者也越來越疲于花大量時間在海量的信息中尋找自己需要的商品[1]。由此衍生出以團購為生存方式的電子商務平臺,如“折800”、“一淘網”等依賴于“淘寶網”的團購網站。這些團購網站經過通過“淘寶網”從中獲取折扣商品[2]。但折扣的商品有質量質疑,團購網站需要重視上線商品的質量數據問題,對網站上線商品進行售后監控,優勝劣汰。商務平臺商品數據分析系統基于此開發。
1 商務平臺商品數據分析
商務平臺商品數據分析系統集數據獲取、數據統計和分析,系統設計有如下考慮[3-4]:
1)商品ID號:根據上線商品的ID號直接獲取商品的評論,并對評論進行等級評定;
2)評論平均分:計算評論平均分,據此可判斷商品是否合格;
3)評論分分布:計算評論的合格數及其比例。
等級評定時是多個操作人員同時對同一商品數據進行評論操作,評論評分定級是人工進行的,操作人員的主觀對商品評論操作有一定影響。因此需要將所有操作人員的評論評分數據進行統計對比分析,以控制整個評定的有效性。
2 系統設計
本系統根據MVC的三層框架,利用JSP技術制作動態網頁,通過JDBC技術訪問數據庫,使用JSP作為服務器端應用程序處理客戶端的請求并在Web服務器中進行業務邏輯處理并返回客戶端請求的結果。在JSP里嵌套HTML以及CSS對WEB頁面進行設計,引入Bootstrap封裝的樣式,達到系統數據呈現的設計要求[5-6]。
頁面數據呈現與后臺數據交互是整個系統的核心,對數據進行歸納計算和整理并呈現到用戶界面上。用戶只需獲取到公司平臺上線商品的ID號就可以通過系統抓取商品評論數據;同時對數據進行整理分析得到評論平均分、評論分數比例等數據;同時可以系統整理分析出整體上線商品的整體趨勢,通過餅狀圖直觀地看出商品的品質分布。
2.1 系統功能結構設計
商務平臺商品數據分析系統分為三個模塊,八個基本功能,分別是管理員登陸、用戶登陸、用戶注冊、商品評論抓取評分、商品評論數據的統計和分析、用戶管理和修改密碼等,根據分析,本系統的功能結構圖如圖1所示。
1)管理員登陸:管理員輸入用戶名和密碼,數據經由UI Servlet傳遞給Controller Servlet,再到數據庫中驗證身份,將結果返回給JSP,成功登陸就可進入系統,不成功則重新輸入。用戶名只可能是字母,密碼字母和數字皆可。管理員是系統指定的,不可以注冊。
2)用戶登錄:普通用戶輸入用戶名和密碼,數據經由UI Servlet傳遞給Controller Servlet,再到數據庫中驗證身份,將結果返回給JSP,成功登陸就可進入系統,不成功則重新輸入。用戶名只可能是6-20位字母,密碼是6-15位字母和數字組合皆可。若沒有賬號,可以在用戶登錄JSP頁面點擊注冊,通過UI Servlet跳轉到注冊頁面。
3)用戶注冊:用戶注冊需要輸入Email、用戶名、密碼等信息,Email有格式判斷,必須輸入正確的格式,用戶名必須是6-20位字母,密碼是6-15位的字母數字組合皆可。輸入正確后可以成功申請新用戶,隨后跳轉到普通用戶登錄界面登錄系統。
4)商品評論抓取評分:普通用戶與管理員皆可操作,在輸入框中輸入商品的id號,點擊查詢,就可獲取到“淘寶網”中商品的前一百條評論,并且按照評論時間順序進行呈現。其后的評分框,按照規定只能輸入1-5的數值,同時點擊保存,數據就會存入數據庫中。
5)商品評論數據統計:此功能方便普通用戶清楚的跟蹤自己的工作進度,對于管理員可以掌控平臺上線商品的商品質量,會顯示出該操作人員所操作的所有商品的平均分、合格率,可以看出該操作人員操作的商品評分狀態詳情。
6)商品評論數據分析:此功能為管理者觀察網站整體上線商品的質量分布,點擊查詢,會統計所有使用系統的普通用戶操作過的所有商品數的評論數據。如此管理者可以通過這些數據對網站上線商品進行調整。以操作人為條件,區分每個人的操作數據,可以控制一定的主觀誤差,還有整體的上線商品的趨勢。普通用戶可以看出自己的主觀意見和其他用戶的差別。
7)用戶管理:管理員可以對普通用戶進行增加和刪除,用戶管理界面對普通用戶不可見。管理員有權限重置普通用戶的密碼。
8)修改密碼:管理員和普通用戶都可以自行更改密碼。
2.2 系統數據庫設計
數據庫能夠對商務平臺商品數據分析系統的后臺數據進行添加、刪除、查詢,修改。本系統采用MySQL數據庫設計,分別是用戶信息表、評論評分信息表、商品數據分析表和商品數據統計表。用戶信息表主要保存管理員和普通用戶的登錄信息:用戶的用戶名、密碼、級別還有Email。評論評分信息表主要保存評論內容、評論的時間、評論評分、商品id、操作人員、商品名稱等。商品數據分析表主要保存操作人員、操作商品總數、平均四分以上的商品總數及其比例、合格率大于80%的商品總數及其占比、合格率大于60%的商品總數及其占比、不合格商品總數及其占比等內容。商品數據統計表主要保存商品id、操作人員、商品名稱、評論平均分、評論合格率、評論不合格率等信息。其設計分別見表1-表4。
3 結束語
互聯網電子商務企業需要處理大量的數據。商務平臺商品數據分析系統基于JAVA語言和MVC設計思想,在My Eclipse的開發環境開發,完成了淘寶商品評論數據基于商品ID號抓取、評論五等級評分、針對不同操作人員評分的合格率、平均分4分以上商品總數、合格率大于一定比例的商品總數等數據統計和分析以及用戶管理等功能;商務平臺商品數據分析系統前臺利用Bootstrap框架和BUI框架進行開發,將后臺功能進行呈現。系統操作簡單,界面簡潔、美觀交互速度快,有效降低了商品數據分析的繁瑣度提高效率。
參考文獻:
[1] 謝恩宏, 石宇良. 我國城市電子商務發展特點和趨勢[J]. 電子商務, 2010(10): 13-15.
[2] 許小平. 大學生網上開店品牌建設研究[J]. 中國電子商務, 2012(8): 26-29.
[3] 崔志剛. 基于電商網站商品評論數據的用戶情感分析[D]. 北京: 北京交通大學, 2014.
[4] 馬廣松, 方宇, 徐輝. 心電網絡信息系統的設計及應用[J]. 中國醫療設備, 2009(7): 55-56.
關鍵詞: 數據分析課程 翻轉課堂 教學設計
數據作為信息的主要載體,在當今“大數據時代”背景下扮演著重要的角色。對數據的分析和利用已經成為每個行業重要的生產因素,并廣泛應用于各行業和領域。數據分析就是用適當的統計方法對收集的資料進行詳細的研究,提取有用的信息并形成結論,以求最大化地開發數據資料的功能與發揮數據的作用。在我校,數據分析課程是信息與計算科學系的必修課程,對提高學生的建模能力及數據分析水平有重要的作用。
數據分析課程的特點就是要求學生具備較高的理論基礎水平、綜合應用及動手能力,還需要學生掌握必要的分析解釋能力。將理論與實際案例結合,發揮學生的主觀能動性,增加學生的動手實踐和分析解釋環節,是數據分析教學中必須遵循的原則。而翻轉課堂正是通過對知識傳授和知識內化兩個環節的顛倒,實現學生對授課內容的理解和對知識點的內化,也就是理論結合實踐的過程。因此本文針對數據分析課程特點和存在的問題,結合翻轉課堂的教學理念,對數據分析課程各個教學環節進行設計研究,以期促進數據分析教學,使之更好地為專業素質的培養提供服務。
一、數據分析教學存在的問題
1.理論教學
數據分析課程的理論與方法內容豐富,涉及面廣,應用范圍大。在理論教學中,學生學習理解掌握理論基礎具有一定的難度。如對各分析方法的理解掌握,必須建立在良好的數學基礎上,綜合運用所學數學知識才可以理解各種數據分析的理論分析原理。同時學生還需要理解掌握各分析方法理論的內在聯系,并把握其不斷發展的趨勢,才能真正掌握數據分析的理論與方法。我校現在的數據分析課程教學理論課程授課方式單一,傳統教學方式使學生只能對課程方法理論淺嘗輒止,無法深入了解,綜合運用。同時單一的課堂授課模式無法對學生的掌握程度進行有效的評價和檢測。
2.實踐教學
數據分析課程對學生的動手能力要求很高。學生在理解掌握各種分析方法的理論基礎上,需要掌握一定的統計軟件的使用方法,如SPSS,MATLAB。這需要將理論方法,如復雜的公式,與實際軟件使用相結合。實驗教學中,要求學生有較高的計算機編程能力,然后結合數據分析的理論方法,對數據進行分析,并應用于實踐。現階段我校數據分析課程中,學生實踐課時偏少,而且傳統授課模式讓學生的學習處于被動狀態。實踐教學中只能根據老師和教材的指導,對課本上的例題程序進行練習,極大地限制學習廣度和深度,且無法有效地將本課程與實際生活與應用聯系起來,從而挫傷學生學習和動手的積極性。
3.學生能力培養
數據分析課程對學生能力的培養體現在綜合運用能力和對結果的分析解釋能力。理論課程傳統的填鴨式教學,和實踐課程拘泥于教材的例題程序的現狀,將數據計算與數據分析分割開來,勢必會限制學生綜合運用能力和分析解釋能力的發展,影響學生學習興趣和課程教學效果。
二、翻轉課堂教學理念
翻轉課堂起源于美國林地公園高中,兩位化學老師通過讓學生在家觀看視頻,課堂進行練習的方式,完全顛覆傳統教學模式。翻轉課堂將傳統教學模式中知識傳授和知識內化兩個階段顛倒過來。與傳統授課模式不同的是,知識傳授不再是完全由課堂中教師的講解完成,而是通過信息技術的輔助在課前或課后等業余時間完成,同時知識的內化不再是單一的由課后作業或者練習完成,而是通過在課堂中進行疑難解答、項目式學習、合作學習等方式進行。因此,對翻轉課堂教學方法的實際有效利用可以將大學生學習時間最大化,并培養學生的自學能力、自我約束能力及分工合作能力。
在數據分析課程教學中,學生可以利用課余時間,結合教師提供的數據分析每一模塊的課前學習材料,實現對數據分析課程基本方法和理論的了解,這樣很好地利用學生的課余時間,培養學生的自學和約束能力。而對所學數據分析方法的具體應用、深入理解及綜合分析等方面,學生可以通過課堂的各種活動和學習方式,以及和教師的及時溝通,和同學的合作交流等方式,在知識內化這一環節獲得比傳統課堂更好的學習效果。
三、翻轉課堂在數據分析教學中的應用設計
近些年國內外很多對翻轉課堂教學的研究,形成針對各個學科和地區的教學模式。如RobertKarplus提出的“探索-解釋-應用”三階段學習周期,RamseyMusallam提出的“探索-翻轉-應用”模式,國內南京大學張金磊等人提出的由課前學習和課堂學習組成的翻轉課堂教學模式等。
針對數據分析課程學科特點和本校學生基礎水平及實際情況,本研究提出數據分析翻轉課堂的教學流程:
課前――概念探索教學視頻平臺交流
課中――問題解決(經驗交流,教師講解)測試反饋項目創建協作學習及匯報
課后――平臺交流,作業反饋
在課前教學環節中,概念探索是根據數據分析課程的學科特點設計的,由于學生初次接觸數據分析,對很多基本概念及意義沒有深入了解,意識不到社會意義和實踐意義,在這一環節中學生可以通過教師給出的簡單具體的實例演示,再加上信息豐富的網站、視頻及博客等手段在教學交流平臺上闡述自己對所學概念的理解,相互交流,以此實現對概念的初步正確理解。如對聚類分析的理解,學生可以概念探索這一過程中通過具體實例演示和對各種信息的閱讀,了解到聚類分析作為數學工具的基本思想和在現實生活中的重要意義。
教學視頻主要是微視頻和幻燈片。對于教學視頻的觀看,要求學生針對自己的數學學習基礎有選擇地觀看。教學視頻中主要針對本單元學習內容進行講解,同時還會提供與本單元學習相關的數學基礎理論的教學內容。這種數學基礎與數據分析內容相結合的教學材料可以讓數學基礎不完善的學生更有效地理解本單元的知識。在視頻或者課前學習資料的制作中,需要結合每一章節的實際,主題突出,簡短生動,而且有效。如在聚類這一章節中,對于各種聚類方法的介紹可以結合具體的實例,如與生活密切相關的人均家庭收入問題等,通過不同方法展示對比,從而做到對每一聚類方法的理解和融會貫通。同時需要介紹相關的Matlab編程方法,讓學生結合理論和實際,通過編程過程實現對理論知識的理解和應用。
課前學習中,反饋是比較重要的一部分。教師可以通過平臺交流得到課前理論學習的反饋信息,同時可以通過在線學習簡單的作業練習,由此獲得課前學習的反饋。
課堂教學仍然是很重要的一環。課堂上教師首先組織學生面對面交流,解決并了解課前學習中遇到的問題,對普遍性問題做詳細解答。然后經過簡單的例題讓學生編程實現,并進行相應的解釋,由此測試學生的學習效果。這樣教師可以更好地掌握學生對每一章節數據分析理論的學習效果,以及學生對理論的應用構建能力。在保證學生對概念和理論的學習后,教師可以提供項目創建的基本信息和參考實例,如數學建模題目等。學生分組合作交流,選擇自己感興趣的問題成立合作組,結合本章節內容分析解決問題,尋找合適的數據處理方法,應用相關軟件編程實現自己的想法,將理論應用于實踐,并進行有效的分析,學生的問題解決過程和討論過程可以在課下進行。在學生充分準備后,課堂上進行分組匯報,并進行自評和互評,實現學生對理論的應用和相互學習。
本章節教學內容結束后,教師組織學生在教學平臺交流,并展示自己的作業和反思內容,鞏固對本章節內容的理解。
四、教學設計效果分析
1.符合大學生學習特點
大學生作為已經獨立的學習個體,擁有獨立的學習和思考能力,同時具備獨立學習時間和空間,而傳統教學方式無法充分發展學生的獨立學習能力,讓學生的課余學習漫無目的,松散自由,無法充分利用課余時間。翻轉課堂在數據分析課程教學中的應用讓學生在課余時間的學習有的放矢,通過學習交流平臺還可以相互交流督促,培養學生良好的獨立學習和探索學習的習慣。
對于思想上已經獨立的大學生來講,個性化學習更符合學生的行為習慣和思想意識。在數據分析課程的學習中,學生可以根據自己的基礎、學習習慣及自己的喜好等自由選擇學習的材料、時間和方式,互不打擾,又可以相互交流。如對概念和理論的理解,學生可以通過網絡資料,也可以選擇圖書館的書籍,觀看教學材料等方式進行,每位學生理解的深度和廣度可能會有所不同,通過相互交流和共同知識構建和應用又可以相互彌補。這樣的教學和學習方式極大地滿足了不同學生對知識的需求,避免一刀切式教育,可以充分發揮學生的學習潛力。
2.增強學習效果
通過初步的教學實驗,接受翻轉課堂數據分析課程的學生無論在理論知識理解還是實踐應用上都有明顯提高。相對于傳統課堂中的學生,在數據分析課程結束后,翻轉課堂中的學生可以較好地闡述相關理論,通過Matlab軟件編程實現對理論的應用,并給出合理的解釋。通過測試對比可以看出,翻轉課堂中的學生理論基礎更加扎實,編程能力有很大提高。在翻轉課堂試行后,學生在數學建模大賽中成績有明顯進步。
3.改善教學氛圍
在數據分析翻轉課堂中,學生學習積極性有很大提高。首先學生已經通過概念的探索階段對所要學習的知識有初步了解和認識,能夠較好地意識到所學知識的社會意義,增強學習興趣和信心。其次,學習方式多樣化,學生可以充分利用自己喜歡的現代信息設備,將手機、平板及電腦等學生喜愛的現代化信息設備變成學習的工具。避免學生與教師之間對手機等工具的對弈,改善學生將手機等單純作為娛樂工具的現象。此外,學生在交流平臺上的發言、總結和展示不僅樂意給學生帶來成就感,而且可以激發其他學生的學習動力,形成你追我趕的學習氛圍。
通過將翻轉課堂理念初步運用于數據分析課堂,發現這一理念的運用可以有效解決目前數據分析課程教學中存在的一些問題,將理論教學與實踐教學密切聯系起來,并有效調動學生的學習積極性,取得較好的教學效果。在這一過程中,我們發現翻轉課堂理念的實施不能拘泥于形式,需要根據具體問題和課程需要進行相應的調整。同時翻轉課堂中需要教師付出更多精力進行探索,如更合適的教學資料和課堂活動設計。總之,翻轉課堂理念的實施帶來的不僅是教學形式的變化,更是對教師工作分工和角色的改變。
參考文獻:
[1]宋艷玲,孟昭鵬,閆雅娟.從認知負荷視角探究翻轉課堂[J].遠程教育雜志,2014,(1):105-112.
[2]汪曉東,張晨婧仔.“翻轉課堂”在大學教學中的應用研究[J].現代教育技術,2013,(8):11-15.
[3]張金磊.“翻轉課堂”教學模式的關鍵因素探析[J].中國遠程教育,2013,(10):59-64.
[4]周學剛.淺談“數據分析”課程的教學[J].中國電力教育,2011,(7):110-111.
[5]竇建軍.數據分析課程教學中的幾點體會[J].徐州教育學院學報,2008,(3):146-147.
關鍵詞:質量管理,統計分析,船舶設計
中圖分類號:U673.2 文獻標識碼:A
Data Analysis Method of Quality Control Applied for Ship Design Project
LI Lanjuan
( Guangzhou Marine Engineering Corporation, Guangzhou 510250 )
Abstract:Statistic and analysis for drawings which are censored by CCS with a new data analysis method of quality control. It can reflect technique level of each profession clearly, then we can adjust to achieve the aim of improve design according to requires.
Key words: Quality control; Data analysis; Ship design
1概述
在船舶設計項目質量管理中,對設計圖紙的差錯率進行統計分析非常重要,不僅可以總結經驗,還可以找出設計環節中的薄弱之處,進而有針對性地采取改進措施,降低圖紙差錯率和圖紙修改率,最終達到提高設計質量的目的。本文將一種全新的質量管理數據分析方法應用到船舶設計項目中,對某船送中國船級社(CCS)廣州審圖中心的各專業圖樣文件進行了統計和分析。首先對CCS審圖意見類別及其導致修改的原因進行統計,然后對統計結果進行分析,最后針對產生原因采取相應的改進措施。
2專業審圖意見類別和原因分析
對各專業分別進行統計和分析,有利于了解各專業本身技術力量的實際情況,以便專業負責人做出適時的調整,對薄弱之處加以改進和提高。根據CCS的審圖意見類別,對某船各專業的圖樣文件進行統計,然后根據CCS提出的意見進行原因分析。
為了方便分析,設置下列不同的代碼,表示不同的審圖意見類別和原因分析含義。
(1)審圖意見類別代碼含義:
A-認可無意見;
AC-認可有意見;
N-備查無意見;
NC-備查有意見;
TS-轉送現場驗船師審核;
RS-不予批準,需修改后重新送審。
(2)原因分析代碼含義:
B1-設計方案欠妥;
B2-設計接口不協調;
B3-不符合現行有效的規范、法規要求;
B4-標識不明或有誤;
B5-其它。
下面對輪機專業進行舉例說明:
該專業的意見類別統計見表1,原因分析統計見表2。
表1輪機專業CCS審圖意見類別統計表
表2輪機專業原因分析統計表
由表1可清楚地看出某船輪機專業圖樣文件的退審意見分布情況。其它專業也分別如此進行歸類和統計,便能了解本專業圖樣文件的退審意見分布情況,并且還可將各專業的退審情況進行比較。
由表2可清楚地看出某船輪機專業圖樣文件的差錯分布較為集中在B3 (不符合現行有效的規范、法規要求),其次是B1(設計方案欠妥),說明輪機專業在這兩方面需采取措施加以改進。其它專業也分別如此歸類和統計,這樣就能清楚地了解各專業自身的薄弱環節在何處,從而可采取相應的措施來改進和提高。
3全船審圖意見類別和原因分析
為了使分析具有全局性,對各專業之間進行比較之后,需對全船進行統計和分析,這樣有利于找出整體中的薄弱環節在何處。某船全船圖樣文件的CCS審圖意見類別統計見表3;原因分析統計見表4。
表3全船CCS審圖意見類別數據統計表
表4全船原因分析統計表
由表3可清楚地看出各個專業退審圖樣文件的總體情況。由表4可看出各個專業圖樣文件的退審意見主要集中在B3(不符合現行有效的規范、法規要求),說明在這一環節所有專業均比較薄弱,特別是電氣專業,因此需專門針對這一環節制定改進措施。
通過對全船的退審圖樣文件進行統計和分析后,使項目負責人能清楚地掌握各專業的實際工作情況與整個項目組中的薄弱環節所在,以便采取改進措施,從全局出發對各專業的技術力量進行調整,進而提高產品項目設計質量。
4結論
在船舶設計項目中采用這種全新的質量管理數據分析方法,不僅能清晰地反映出各專業本身的優劣勢,還能反映出各個專業之間技術力量的強弱差別。這樣不但讓專業負責人能了解本專業的問題所在,并采取相應的改進措施,同時也能讓項目負責人掌控全局,根據需要對各專業進行協調,從而提高產品項目的質量,降低圖樣文件的差錯率。
作者簡介:李蘭娟(1979-),女,工程師。從事項目管理與質量管理工作。
收稿日期:2013-07-05
國際動態
日本獲得6艘靈便型散貨船訂單
近日,Sesoda公司表示,通過其子公司及合資公司(JV)訂造了2艘34000DWT型及4艘38000DWT型散貨船。相關散貨船的新造船價分別為“每艘2500萬美元以下”及“最高2600萬美元”水平。
這些新造船將在日本Namura(名村)造船、Imabari(今治)造船以及匿名的其他日本造船廠進行建造,安排在2016-2018年交付。
南日本造船獲4艘甲醇運輸船訂單
關鍵詞:試驗數據分析 SPC 設計
中圖分類號:TP274.2 文獻標識碼:A 文章編號:1007-9416(2016)11-0142-01
南京中車浦鎮海泰制動設備有限公司是主要從事鐵路客車、動車組、城市軌道交通設備制動系統及其零部件和試驗裝置的研發、設計、制造、銷售、修理、租賃及技術咨詢、試驗檢測和技術服務的高新技術公司。公司現有數十臺各類非標設備用于產品的出廠試驗,每臺設備的試驗類型、試驗參數規格以及試驗報告都不相同。
試驗數據分析系統的目的就是需要將這些非標設備的試驗數據進行集中統一上傳存儲,并提供統一的查詢以及分析,使管理者或相關人員能迅速知曉產品性能參數,通過對試驗數據的分析,了解產品的生產過程的結果,實時監控產品試驗過程,對階段性產品試驗數據進行SPC分析。科學的區分出生產過程中產品質量的隨機波動與異常波動,從而對生產過程的異常趨勢提出預警,以便生產管理人員及時采取措施,消除異常,恢復過程的穩定,從而達到提高和控制質量的目的。
1 系統整體設計
系統整體框架結構包括三個部分:基于C/S的試驗臺應用配置系統 + 數據上傳適配器中間件 + 基于B/S的試驗臺數據分析系統,如圖1所示。
C/S的應用配置系統完成對不同類型試驗臺的應用配置,配置內容包括試驗臺的試驗子項內容定義;試驗子項的存儲結構定義;試驗子項的數據字典定義;試驗子項的規格值定義;試驗臺試驗報告單的報表格式及數據源定義。
數據上傳適配器接口基于配置數據庫中的配置實現將不同類型的試驗臺試驗數據進行上傳并存儲。
B/S試驗臺數據分析系統基于配置數據庫的配置,實現對不同類型的試驗臺試驗數據進行顯示以及分析。
2 數據上傳接口設計
在試驗過程中,每完成一個試驗項目,則將當前試驗項目的試驗結果信息和參數信息通過調用Web Service接口上傳并轉儲至服務器中的數據庫中(如果遇到服務器故障的情況下數據本地保存)。
本地試驗數據上傳采用windows消息隊列方式。原理如圖2所示。
3 試驗數據報表顯示設計
由于試驗數據分析系統需要顯示不同試驗平臺下的試驗數據報表。在設計中需要根據不同類型的試驗臺定義報表顯示模版,定義模版中的數據源,最后將模版和數據源進行綁定并進行顯示。設計結構如圖3所示。
基于XML定義報表模版對應的數據源。XML文檔格式設計如下:
4 結語
本文提出了多樣性試驗平臺數據上傳、集中存儲、分析以及報表顯示的設計解決方案,并對整體系統的構架做了詳細的設計及實現,現系統正在穩定運行中。系統運行SPC分析圖如圖4所示。
關鍵詞:電子政務;數據庫;數據挖掘
中圖分類號:TP399 文獻標識碼:A 文章編號:1674-7712 (2012) 18-0014-01
2005年國家信息化領導小組第五次會議通過的《國家信息化發展戰略(2006—2020年)》,提出緊緊圍繞提高治國理政能力,推行電子政務。在此背景下,國家各級科技部門紛紛建立了具有各自特點的管理信息系統(MIS)、辦公自動化系統(OA)以及科技政務網站等。隨著這些網站、系統的運行,各級科技系統逐漸累積了大量的數字科技數據,如何應對數據保存、管理以及運用等日益成為科技部門關心的問題,建設基于數據挖掘的科技電子政務數據庫將成為問題解決的關鍵。
一、建設科技電子政務數據庫的必要性
在《國家信息化發展戰略(2006—2020年)》的指引下,截止筆者調查,以全國副省級城市為例,哈爾濱、長春、沈陽、大連、濟南、青島、南京、杭州、寧波、廈門、廣州、深圳、武漢、成都、西安等十五個副省級城市都已建立起比較完整的科技信息服務體系,內容既涵蓋了科技法規、科技政策宣傳、科技工作報道等新聞類信息、也包括了科技計劃申報、科技成果申報以及相關的管理信息系統和科技統計、專利成果等信息系統,這些系統的建立為科技部門信息化管理和服務帶來了顯著的社會效益。建設科技電子政務數據庫,一方面數據庫可實現對科技數據的安全保存和管理;一方面引入數據挖掘技術可實現科技數據的分析和深層次利用,勢必推動科技電子政務朝著更加有效的保存和利用科技數據的方向發展。
二、科技電子政務數據庫系統構建
(一)科技電子政務數據庫系統的構建思路
科技數據來源與應用的復雜性為數據庫的規劃設計增加了難度,在系統規劃設計中涉及到的內容是不斷變化的,需求也在不斷增加,需要一種動態適應的方法來支持復雜應用環境下的系統規劃設計。在科技電子政務數據庫建設規劃中首先應分清整體與局部的關系,可按照:系統構思——系統分析——整體規劃——局部規劃——建設實施——運行維護——升級的整體系統建設流程,從方案的醞釀到系統投入使用的完整的系統應用流程,層層推進,層層細化,并不斷反饋修訂原方案,最終形成整體規劃方案。
(二)科技電子政務數據庫系統的建設內容
科技系統的電子政務源數據主要涉及系統報表數據、匯總生成數據、分析結果數據以及各業務機關之間的辦公數據。這些源數據的類型即包括各個企業的申報、審批信息,同時也包括各種社會、公眾信息,因此在分類上存在較大的復雜性;同時在分布上受當前科技部門分工影響,科技數據的保存較為分散,一次性的整合利用即存在多部門協調合問題,也不利于源數據的管理。因此建議對科技源數據先實現分別建庫,再進行跨庫整合;例如:可分別建設高新技術企業和產品數據庫、科技成果數據庫、科技計劃項目數據庫、大型儀器設備數據庫、科技查新數據庫等,再通過建設統一信息服務平臺實現綜合利用。
三、科技電子政務數據庫系統的功能設計
(一)數據采集
一個系統能提供科學客觀的決策支持功能,數據的客觀性、科學性是基礎條件,因此數據的采集對于基于數據挖掘的科技電子政務數據庫建設有著基礎性作用。有效的數據采集方式應具備以下特點:①滿足系統對于數據的需要;②符合下級數據源的填報習慣,最大限度地減少下級部門的工作量;③能有效地對數據進行校驗,保障數據的質量;④滿足采集標準不斷變化的需要;⑤傳輸量較小,減輕網絡負載。⑥能提供多種采集渠道,滿足不同類型數據上傳。特別強調項目申報審批與工作的流程化定制,科技電子政務主要涉及各類的申報審批工作,當前的科技政務申報審批系統,多設計簡單、功能單一,大量源數據的保存和分析再利用都只能脫離已有系統、依賴人工處理。因此建議充分考慮用戶需求和使用習慣,應用web service技術和B/C架構等技術設計良好的流程性數據采集系統,就能在完成申報審批政務的同時自動形成數據洼地和信息鏈,匯集起真實有效的源數據,即減少源數據的二次收集和重復勞動,又便于數據分析和挖掘工作的開展。
(二)數據應用
數據的分析與應用是一個數據庫的核心功能,只有全面豐富的匯總數據,科學深入的分析結果,才能使數據庫的決策支持功能發揮的更加科學和全面,才能讓科技部門和公眾通過數據庫得到有價值的、能夠輔助決策的信息。數據挖掘的維度應從多個角度設計,如時間、空間、項目專業類型等,數據挖掘的生成的信息產品可緊貼科技部門的管理工作。以建設高新技術產業數據庫為例,可根據源數據,分析提取生成高新技術企業人力、財力、物力、科研狀況等方面的橫向或縱向匯總或比較信息,形成深度數據挖掘的信息產品。所形成的信息產品還應該呈現出豐富的表現形式,如:表格、結構圖、柱形圖、條形圖、餅圖、圓環圖、折線圖等,使信息產品即直觀生動又便于利用。信息產品的外觀設計要求和諧美觀、對比鮮明、使用設計上要求方便簡潔、注重用戶體驗。
四、結語
科技電子政務數據庫的建設任重道遠,在建設過程中可能會面臨一些困難,筆者認為主要來自兩方面:一是現行科技行政管理體制對數據共享的障礙。科技部門的分割管理使得科技系統各個部門自成體系,形成了從上到下的彼此隔絕的垂直管理體系。各部門的數據信息從行政管理上進行隔離,數據共享的行政阻力大于技術阻力;二是科技信息安全保密問題的障礙。由于科技數據庫多涉及政務資料、企業稅收、財務等信息,因此對業務處理數據應給予非常高的安全性設計,避免因信息泄漏、災難等因素造成的損失和工作失誤。
參考文獻: