1000部丰满熟女富婆视频,托着奶头喂男人吃奶,厨房挺进朋友人妻,成 人 免费 黄 色 网站无毒下载

首頁 > 文章中心 > 正文

網絡信息資源數據挖掘類型和應用

前言:本站為你精心整理了網絡信息資源數據挖掘類型和應用范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。

網絡信息資源數據挖掘類型和應用

隨著Internet的飛速發展,網絡信息資源急劇增長,網絡信息過載問題日益突出,人們越來越多地關注如何開發和利用這些資源。然而,目前中英文搜索引擎均存在查準率、查全率不高的現象,這種現狀無法適應用戶對高質量的網絡信息服務的需求;同時,電子商務以及各種網絡信息服務迅速興起,原有的網絡信息處理與組織技術無法趕上這樣的發展趨勢。網絡信息挖掘就是在這樣的環境下應運而生,并迅速成為網絡信息檢索、信息服務領域的熱點之一。

網絡信息的數據挖掘不僅包括對網頁內容本身的挖掘,也包括其鏈接模式,以及用戶訪問、存取、瀏覽、、操作等操作行為、訪問行為所產生的信息的挖掘。有效地研究、挖掘、利用網絡信息可以增強網站的吸引力,有的放矢地吸引用戶群,更有效地利用網絡資源。

一、網絡信息資源及其特點

網絡信息資源是指放置在英特網上能滿足人們信息需求的信息集合。網絡信息資源極其豐富,包羅萬象,其內容涉及農業、生物、化學、數學、天文學、航天、氣象、地理、計算機、醫療和保險、歷史、法律、音樂和電影等幾乎所有專業領域,是知識、信息的巨大集合,是人類的資源寶庫。網絡信息資源是一種新型數字化資源,與傳統文獻相比有較大的差別。網絡信息資源具有一下特點:

1、數量大,類型多傳播范圍廣。網絡信息類型多樣,有文本、數據、圖像、圖形、聲頻、視頻信息、多媒體信息等;內容既有高質量的信息,也有有害信息和虛假信息,有個人信息也有在政府信息。最為特殊的是各種非正式信息被廣泛生產與傳播。

2、網絡信息資源沒有統一的管理機制,信息安全缺乏保障。黑客攻擊、計算機病毒和色情泛濫成為網絡的三大痼疾。為防止有害信息耗費了大量的社會資源。

3、網絡信息資源分布零亂無序,信息更新快,壽命短,管理相對困難。信息自由,來源廣泛,內容混雜,質量不一,控制也比較困難。

4、以網站為信息活動的單位,以網頁為信息和收集的單元。

5、信息利用水平取決于網站軟硬件的技術水平和服務能力,網絡信息提供方式是以網站為基點并可在網站間靈活鏈接的信息服務網。

6、網絡創造了多層次的信息交流模式,全面反應了社會生活的各個領域,形成了百科全書式的知識網絡和傳播功能。

二、數據挖掘的語言

數據挖掘語言有助于數據挖掘系統平臺的標準化,推動數據挖掘應用的發展。數據挖掘語言根據功能和側重點的不同,可分為三種類型:數據挖掘查詢語言、數據挖掘建模語言、通用數據挖掘語言。

(一)數據挖掘查詢語言DMQL

數據挖掘查詢語言DMQL由數據挖掘原語組成。數據挖掘原語用來定義一個數據挖掘任務,通過查詢的方式實現與數據挖掘系統通信,獲得所需信息。數據挖掘查詢語言DMQL主要有五種基本的數據挖掘原語定義:任務相關數據原語、被挖掘的知識的種類原語、背景知識原語、興趣度測量原語、被發現模式的表示和可視化原語。DMQL是基于這五種數據挖掘原語設計的查詢式語言,類似于SQL語言的語法,因此很容易與SQL關系查詢語言集成,很容易從關系數據庫中挖掘知識信息。MSQL是另一個數據挖掘查詢語言,由Imielinski和Virmani提出。它使用了類似于SQL的語法和SQL原語,為了規范規則產生和規則選擇,提出了被稱作GetRule和SelctRule的原語。

(二)數據挖掘建模語言PMML

數據挖掘建模語言PMML全稱預言模型標記語言(PredictiveModelMarkupLanguage),是對數據挖掘模型進行描述和定義的語言,使數據挖掘系統在模型定義和描述方面有法可依,各種數據挖掘系統可以共享模型,又可以在應用程序系統中間嵌套數據挖掘模型,不需要獨自開發,就能使數據挖掘達到深度挖掘的目的。預言模型標記語言PMML是一種基于XML的數據挖掘建模語言,利用XML描述和存儲數據挖掘模型,使用標準的XML解析器對PMML解析,可以得到預計的輸入和輸出數據類型。PMML2.0主要由:標題(header)、數據字典(datadictionary)、數據流(dataflow)、挖掘模型(miningschema)、數據轉換(DerivedValues、Statistics、Taxonomy、Normalization)、預言模型(TreeModel、NaiveBayes、GeneralRegression、RegressionModel、Sequences、GeneralStructure、AsscocationRules、NeuralNetwork、CenterandDistributionbasedClustering)、模型組合定義(ensemblesofmodels)、選擇和聯合模型和模型組合的規則(rulesforselectingandcombiningmodelsandensemblesofmodels)、異常處理的規則(rulesforexceptionhandling)等九個部分組成。對于復雜的數據挖掘任務,由多個數據源和數據挖掘模塊,需要在各個模塊之間交換結果,預言模型標記語言PMML的主要組成部分擁有這種靈活的模型交換能力和數據格式轉換能力,并實現模型與數據和工具部分分離。因PMML是基于XML的數據挖掘建模語言,適合部分學習、元學習、分布式學習的數據挖掘應用程序。

(三)通用數據挖掘語言OLEDBforDM

通用數據挖掘語言OLEDBforDM是2000年3月微軟公司推出的一個數據挖掘語言,目的是為數據挖掘行業提供一個業界標準。OLEDBforDM綜合了數據挖掘查詢語言DMQL和數據挖掘建模語言PMML的特點,既能定義模型,又能作為查詢語言與數據挖掘系統通信,進行交互的和特殊的數據挖掘,實現了數據與模型真正分離。OLEDBforDM是一種基于SQL預言的協議,擴充了SQL語言語法,可以輕松地與關系型數據庫集成,可以將不同的數據挖掘算法嵌入數據挖掘應用程序。OLEDBforDM為了更接近關系型數據庫結構,定義了幾個重要的概念。

數據挖掘模型(DataMiningModel,DMM):DMM像數據庫中的關系表,但是它包含了一些特殊的列,這些列被數據挖掘中的數據訓練和預言制定使用。DMM既可以用來創建預言模型,又可以產生預言。標準的關系表用來存儲原始數據而DMM存儲被數據挖掘算法發現的模式,對于從事WEB挖掘的開發人員,DMM所有的結構和內容都可以用XML字符串表示。

預言聯接操作(PredicationJoinOperation):預言聯接操作類似于SQL語言中的連接操作,在一個訓練好的數據挖掘模型和輸入數據源之間映射一個連接查詢,將能得到符合需求的預言結果。這個預言結果通過OLEDB的行集合或者ADO記錄集(recordset)發送到消費者應用程序內。OLEDBforDM模式行集合(SchemaRowsets):OLEDBforDM模式行集合用于特殊目的模式行集合允許消費者應用發現臨界的信息,例如:可利用的挖掘服務、挖掘模型、挖掘列和模型內容等。

三、網絡信息挖掘的類型

根據挖掘的對象不同,網絡信息挖掘一般可分為三類:網絡內容挖掘(Webcontentmining)、網絡結構挖掘(Webconstructmining)和網絡用法挖掘(Webusagemining)。

(一)網絡內容挖掘

網絡內容挖掘是指從網絡的內容/、掘內容挖掘語言。的關系表用來存儲原始數據,據挖掘任務,數據/文檔中發現有用信息的過程。網絡信息資源類型眾多,目前WWW信息資源已經成為網絡信息資源的主體,Internet出現之前的Gopher、FTP、Usenet資源逐漸隱藏到WWW形式之后,但這些資源仍可以通過Web進行訪問。然而除了大量的人們可以直接從網上抓取、建立索引、實現檢索服務的資源之外,一些網絡信息是“隱藏”著的數據,如由用戶的提問而動態生成的結果,或是存放在DBMS(數據庫管理系統)中的數據,或是那些私人數據,它們無法被索引,從而無法提供對它們有效的檢索方式。以上是從網絡信息源的角度探討,若從資源形式看,網絡信息內容是由文本、圖像、音頻、視頻、元數據等等形式的數據組成的,因而我們所說的網絡內容挖掘將是一種多媒體數據挖掘形式。

(二)網絡結構挖掘

網絡結構挖掘是從WWW的組織結構、Web文檔結構及其鏈接關系中推導知識。主要是針對Web潛在的鏈接結構,通過網頁鏈接找到隱藏在頁面之后的鏈接結構模型。網絡結構挖掘的目的是發現Web和頁面的結構及其蘊含在這些結構中的有用模式,對頁面及其鏈接進行分類和聚類,由此獲得有關不同網頁間相似度及關聯度的信息,有助于用戶找到相關主題的權威站點,并且可以通過瀏覽權威網站企業可以了解本行業的最新動態信息,了解一些著名的大型企業的發展動態。還可以發現Web文檔自身的結構,這種結構用于用戶的瀏覽,也利于對網頁進行比較和系統化。

(三)網絡用法挖掘

通過網絡用法挖掘,可以了解用戶的網絡行為數據所具有的意義。網絡內容挖掘、網絡結構挖掘的對象是網上的原始數據,而網絡用法挖掘則不同于前兩者,它面對的是在用戶和網絡交互的過程中抽取出來的第二手數據。這些數據包括:網絡服務器訪問記錄、服務器日志記錄、瀏覽器日志記錄、用戶簡介、注冊信息、用戶對話或交易信息、用戶提問式等。

四、網絡信息的數據挖掘的應用

隨著Internet的迅速發展和不斷的普及應用,網絡信息資源越來越豐富,如何分析和利用這些海量的數據是當前比較突出的一個問題。網絡信息挖掘在實際工作中具有重要的實踐意義和廣闊的應用前景。

通過網絡信息挖掘,可以收集政治、經濟、政策、科技、競爭對手、供求、客戶等有關的信息,分析和處理這些信息,并根據分析結果找出經營管理過程中出現的各種問題,有利于改善管理的效率和效果。網絡信息挖掘可以應用在許多方面,例如:

1、科學研究。隨著先進的科學數據收集工具的使用,如觀測衛星、遙感器、生物信息技術等,所涉及的數據量非常大,傳統的數據分析工具無能為力,網絡數據挖掘作為一種強大的智能型自動數據分析工具得以廣泛應用。

2、市場營銷。利用網絡數據挖掘技術通過對用戶數據進行分析,可以得到關于顧客購買取向和興趣的信息,從而為商業決策提供可靠的依據。

3、金融投資。由于金融投資的風險很大,在進行投資決策是,更需要對各種投資方向的數據進行分析。數據挖掘可以通過對已有數據的處理,找到數據對象之間的關系,然后利用學習得到的模式進行合理的預測。

4、產品制造。數據挖掘對產品數據的分析,有助于對改進產品質量提出有針對性的建議,或提出信息的更高效的控制模式,從而為制造廠家帶來更多的回報。

5、教學管理。如遠程教育中的網絡資源發現,分析教學網站的結構組織是否符合學生學習和教師教學的規律、教學評價等。教學評價的技術水平是衡量一個國家教育發展水平的重要尺度。傳統的定性與定量教學評價存在許多問題。將數據與挖掘這種新的數據分析技術應用于教學評價之中,可以提高教些評價技術水平,使之更好地為教學服務。

6、Internet或其他通信網絡管理等的應用。

下面主要介紹網絡信息挖掘在電子商務、網絡廣告和競爭情報中的應用。

(一)網絡信息挖掘在電子商務中的應用

1、網絡信息挖掘在電子商務中應用的必要性

電子商務是指個人或企業通過國際互聯網絡,采用數字化方式進行商務數據交換和開展商務業務活動。電子商務過程中產生了大量的數據,數據挖掘是對這些數據進行分析的有效方法。由于Web的易用性、實用性,它很快占據了網絡信息主導地位,目前已經成為使用最為廣泛、最有前途的信息傳播技術。電子商務中產生的數據有其自身的特點,把數據挖掘技術與電子商務進行有機結合,選用適合電子商務數據的挖掘方法,可以提供數據挖掘的效率,讓數據挖掘更好地為電子商務服務。電子商務是以網絡技術和Web數據庫技術為支持的,其中,Web數據庫技術是電子商務的核心技術,Web數據庫的發展成為新的熱點和難題。Web數據庫能將數據庫技術與Web技術很好地融合在一起,是數據庫系統成為Web的重要有機組成部分,能夠實現數據庫與網絡技術的無縫有機結合。客戶是數據挖掘研究的對象之一,它能發現客戶的共性和個性、必然和偶然、獨立和關聯、現實和預測等知識。通過這些知識可以對客戶的消費行為如客戶消費的心理、能力、動機、需求等作出比較客觀的統計和準確的分析,為電子商務的管理者提供決策依據。電子商務組織管理者必須通過訪問網絡最新和最準確的信息,對產品、客戶、合作伙伴和進程做出明智的決策,從而贏得競爭優勢。

近年來,電子商務站在企業商貿領域占據著越來越多的市場份額,網絡信息挖掘主要用于商品的市場定位和消費分析,以輔助制定市場策略,還可以用來分析購物模式,預測銷售行情等。

2、網絡信息挖掘在電子商務中的主要應用

(1)針對不同客戶提供個性化的產品

銷售商可以獲知訪問者的個人愛好更加充分地了解客戶的需要,根據各個細節市場,甚至是每一個顧客的獨特需求提供個性化的產品,有利于提高客戶的滿意度。為了使網絡信息挖掘技術更好地應用,商家必須記錄訪問者的特征及條款特征。當訪問者訪問某網站時,有關訪問者的數據便會逐漸積累起來。

(2)發現潛在客戶

對一個電子商務網站來說,了解、關注在冊客戶全體是非常重要的,但從眾多的訪問者中發現潛在客戶群體也同樣非常關鍵。如果發現某些客戶為潛在客戶群體,就可以對這類客戶實施一定的策略,使他們盡快成為在冊客戶群體。在對客戶訪問記錄的挖掘中,利于分類技術可以在網絡上找到潛在客戶。先對已經存在的訪問者進行分類,一般分為三種:新來訪者、偶然來訪者和常客。對于新來訪者,通過分類發現,識別出這個客戶與已經分類的老客戶的一些公共屬性,從而對這個新客戶進行正確的歸類。然后根據歸類判斷,決定是否要把這個新來訪者作為潛在的客戶來對待。

(3)挽留老顧客

二八定律表明企業80%的業務收入來自于20%的客戶,而向新客戶進行推銷的花費要6倍于向現有的客戶進行推銷的花費。通過Web數據挖掘,可發現什么樣的顧客群在網站上購買了什么商品,哪些是網站的忠誠客戶,以便對其進行個性化營銷和人性化關懷。

(4)延長客戶的駐留時間

為了使客戶在自己的網站上駐留更長的時間,就應該了解客戶的瀏覽行為,知道客戶的興趣及需求所在,動態地調整Web頁面,以滿足客戶的需要。通過對客戶訪問信息的挖掘,就能知道客戶的瀏覽行為,從而了解客戶的興趣及需求,并根據需求動態地向客戶推薦頁面,提供特有的一些商品信息和廣告,以使客戶能繼續保持訪問站點的興趣。

(5)改進站點設計

站點上頁面內容的安排就如超級市場中物品在貨架上的擺設一樣,把具有一定支持度和信任度的相關聯的物品擺放在一起有助于銷售,利用關聯規則發現可以針對客戶動態調整站點的結構,使客戶訪問的有關聯的文件間的鏈接能夠比較直接,讓客戶更容易訪問到想訪問的頁面。網站如果具有這樣的便利性,就能給客戶留下較好的印象,增加了下次訪問的幾率。對Web站點鏈接結構的優化可從兩方面來考慮:一是通過對Web日志的挖掘,發現用戶訪問頁面的相關性,從而在密切聯系的網頁之間增加鏈接,方便用戶的使用。二是通過對Web日志挖掘,發現用戶的期望位置。如果在期望位置的訪問頻率高于對實際位置的訪問頻率,可考慮在期望位置和實際位置之間建立鏈接,從而實現對Web站點的優化。

(6)電子商務推薦系統

推薦系統就向客戶推薦商品或提供信息來引導客戶購買什么商品。推薦系統可以根據其他客戶的信息或此客戶的信息,模擬銷售人員幫助客戶完成購買過程,為客戶提供個性化服務。推薦的形式包括向客戶推薦商品,提供個性化的商品信息等。推薦系統具有如下作用:(1)將瀏覽者轉變為購買者。有時人們只是看看網站的內容而沒有購買的意思。推薦系統可以幫客戶找到他們感興趣的、愿意買的商品。(2)增加交叉銷售。基于用戶已經購買的商品,推薦客戶購買一些相關的商品。(3)建立忠誠度。客戶往往愿意到那些最能滿足自己需求的網站購物。

3、實例:顧客行為模式分析

由于數據挖掘技術一般不是在線創建模型,因此首先要將諸如會員基本信息、會員在線消費文檔、會員在線行為文檔\服務器認證日志等所有的相關數據從服務器上下載下來,并按照以下步驟處理這些數據。

(1)數據聚合與過濾

在這一步中,從不同的文檔聚集所有數據匯成一組基本數據記錄,在聚集的處理過程中,這些信息中有錯誤和漏掉的部分都需要得到修正。例如在信息提取的過程中,遇到購買為零時會導致空白,因此需填充缺省值來處理空白。然后將與該模式無關緊要的欄消去。例如,消去顧客的ID欄,因為它自始至終對于顧客行為模式沒有任何作用。

(2)數據整合

預處理過的數據才可被挖掘工具進行整合。要注意數據挖掘工具只能處理數字,因此文字數據就要提前處理轉化出來。不同的數據挖掘工具可能采用不同的挖掘技術,如有的可利用遺傳算法,有的則可采用神經網絡技術等等。因此,得出的結論也可能會因為數據整合的方法不同而有差別。以下是兩個實例,表4-1是提取和過濾過的會員數據,表4-2是分析的顧客行為模式。

表4-1會員數據

NO.

性別

職業

年齡

IP

停留時間(分)

購物時間(年)

消費總計

購買的產品

1

2

3

4

5

student

IT

student

clerk

doctor

22

35

24

28

32

12.23

33.27

23.46

52.12

40.06

34

58

24

82

40

3

6

2

5

4

566

340

454

531

480

A

B

C

A

D

表4-2顧客行為模式

依據購物的時間

依據消費總計

依據購買的商品

Ifuser’ssexisfemaleanduser’soccupationisstudent

Thenthisuser’sformerpurchasestimeis3

Ifuser’ssexismaleanduser’soccupationisITprofessionalanduser’sIPis33.27

Thenthisuser’sformerpurchasesis6

(二)網絡信息挖掘在網絡廣告分析中的應用

網絡廣告是指在Internet站點上的,數字化格式的各種經營性廣告。網絡廣告一般是指多媒體廣告,能將文字、圖像和聲音有機的組合在一起,傳遞多種感官的信息,讓顧客如身臨其境,感受商品或服務。這種圖、文、聲、像相結合的廣告形式,將大大增強網絡廣告的實效。

對于網站來說,它必須意識到一個成功的網絡廣告不僅僅找到一個業主,為它放上一個超鏈接這么簡單,要想讓廣告主看到成效、增加宣傳費,除了網站要完善自身建設,擴大用戶群外,還應主動向廣告主提供用戶信息,由于點擊廣告的用戶基本上是對此產品有興趣的潛在顧客,因此,廣告主也愿意付出較高的費用。網站要想長期大量的而擁有廣告主的投資,利用數據文件技術為廣告主提供細致周到的服務至關重要。數據挖掘技術在商業領域的成功應用,文件算法的日趨成熟,都為網站提供這種服務創造了條件。

網絡信息挖掘技術主要分為三個階段:數據準備、挖掘操作、結果表達。就數據準備而言,網絡廣告主所需的數據主要來自兩個方面:一方面是用戶的背景信息,這部分信息主要來自于用戶的登記表;而另一部分數據主要來自于用戶的點擊流,這部分信息主要來自于用戶的行為表現。人們在訪問某網站的同時,便提供了個人對網站內容的反饋信息:點擊了哪一個鏈接,在哪里瀏覽時間最多,用了哪個搜索項、總體瀏覽時間、個人姓名和住址等。所有這些信息都被保存在一個數據庫中,生成大量的記錄文件和登記表,利用這些數據進行分析、挖掘,充分了解用戶的喜好、購買模式,不僅可以使網站設計出滿足不同用戶群體需要的個性化網頁,增加競爭力,而且可以為廣告主提出行之有效的廣告方案,實現商家渴望的個性化市場營銷。在數據準備階段一定要保證數據的質量和時效性,這是數據挖掘成功與否的關鍵。不同的問題需要用不同的方法去解決,即使對于同一個問題,也肯定有多種算法。目前有很多廠商正在開發專門用于網站挖掘的軟件,可以根據網絡用戶瀏覽廣告時留下的個人信息,利用基于數據挖掘的概率知識庫和模糊知識庫,對信息進行概率分析,通過對廣告訪問者潛在的信息特征進行模糊劃分,判斷哪些網絡用戶是本產品的真正客戶,而不是一般性的瀏覽訪問者,從而為廠家組織生產和商家營銷計劃提供科學的決策信息。

利用網絡數據挖掘,廣告主可以通過網站提供的用戶信息,有的放矢地發送廣告。可見網絡公司在已有的條件下,加大數據分析力度,無論是對自身發展還是個廣告主的宣傳都是有利策略。當然,數據挖掘技術并不能包治百病,要想獲得最佳的網絡廣告效果,不僅與網絡廣告投放的位置,所選網站的日常瀏覽量,廣告自身的視覺效果等密切相關,還有許多其他的影響因素。而且,就數據挖掘而言,也不應把它看得過分神秘,認為只要有了一個數據挖掘工具,就能自動挖掘初所需要的信息,能更好地進行企業、商業運作,這是認識上的誤區。其實,要想真正做好數據挖掘,工具只是其中的一個方面,同時還需要對企業、企業業務的深入了解和數據分析經驗。無論是企業還是網站要想在未來的市場中具有競爭力,必須有些數據挖掘方面的專家,專門從事數據分析和數據挖掘工作。在同其他部門協調,才能做到量身定做廣告。

(三)網絡信息挖掘在競爭情報工作中的應用

1、網絡信息挖掘在競爭情報工作中的作用

競爭情報是指通過合法手段收集和分析商業競爭中有關商業行為的優勢、劣勢和機會的信息。互聯網為競爭情報工作提供了豐富的信息資源,但是沒有一個很好的網絡信息挖掘工具很難獲取其中有價值的信息。隨著商業競爭的日益激烈,各個企業都紛紛建立了自己的競爭情報系統,以提高自身的競爭力。尤其是在網絡環境下,誰忽視了網絡信息資源的開發與利用誰就已經失去了領先的機會。在企業競爭情報工作中有兩個重要方面,就是獲取競爭對手和客戶的信息。隨著互聯網在企業中應用的不斷深入,從網上可挖掘的企業信息越來越多,涉及的內容也越來越廣泛。從網絡信息挖掘技術的實現流程來看,網絡信息挖掘不僅僅是像網絡信息檢索那樣只是把符合查詢要求的記錄返回給用戶,這樣得到的結果集不僅數量龐大,而且包括很多不相關信息。正如前面所提到的,網絡信息挖掘不僅能夠從WWW的大量的數據中發現信息,而且它還能發現權威站點、有重要價值的“隱藏”信息,并且能夠監視和預測用戶的訪問習慣,這對于企業開展競爭情報工作是非常重要的。

2、網絡信息挖掘在競爭情報搜集和處理中的應用

隨著互聯網在企業中應用的不斷深入,從網上可挖掘的企業信息越來越多,涉及的內容也越來越廣泛。通過網絡信息的數據挖掘可以從大量完整、彼此關系不明確的敏感信息中找出隱含的和事先未知的有用信息,揭示數據內在的復雜性,幫助情報人員進行深層次的分析,獲得更多的、更有價值的競爭情報。

(1)充分獲取、開發和利用競爭對手和客戶的信息

網絡信息挖掘不僅能夠從Web的大量的數據中發現信息,而且能夠發現權威站點、有重要價值的“隱藏”信息,并且能夠監視和預測用戶的訪問習慣、購買行為,發現顧客購買模式趨勢。

(2)挖掘Web日志記錄來發現用戶訪問Web頁面的模式

通過分析和研究Web日志記錄中的規律,可以識別電子商務潛在客戶,增強對最終用戶的互聯網信息服務的質量,并改進Web服務器的性能。

(3)網絡信息挖掘在反競爭情報子系統中的應用

反競爭情報子系統是企業競爭情報活動的重要組成部分,忽視競爭對手的競爭情報活動,低估競爭對手搜集競爭情報的能力勢必導致企業失去已有的競爭優勢。Web站點是企業與外界進行交流的窗口,同時也是競爭對手獲取競爭情報的一個重要信息源,因此,對它進行監控是企業了解競爭對手的競爭情報的重要途徑。在競爭情報計算機系統中,可以充分利用Web挖掘技術,通過運用分析訪問者的Ip地址、客戶端所屬域、訪問路徑分析等Web監控技術、統計敏感信息訪問率等方法實現對競爭對手的防范,以達到識別競爭對手保護企業敏感信息的目的。

結論

網絡信息挖掘是網絡信息處理領域中的一項新技術,是指在大量訓練樣本的基礎上,得到數據對象間的內在特性,并以此為依據在網絡資源中進行有目的的信息提取。網絡信息挖掘是數據挖掘技術在網絡信息處理中的一個重要應用,也是一項嶄新的研究課題。隨著Internet的迅速發展和不斷的普及應用,網絡信息資源越來越豐富,如何分析和利用這些海量的數據是當前比較突出的一個問題。網絡信息挖掘在實際工作中具有重要的實踐意義和廣闊的應用前景。

參考文獻.

[1]馮艷.數據挖掘技術在電子商務上的應用[J].湖南商學院學報.2002,19(2):125-126.

[2]郝先臣.數據挖掘工具和應用中的問題[J].東北大學學報.2001,22(2):183-186.

[3]董慧等.網絡信息資源開發及利用[M].武漢:武漢大學出版社,2001:116-187.

[4]王娜.網絡信息資源挖掘研究概述[J].圖書館學刊.2007(1):123-124.

[5]南京航空航天大學圖書館.網絡信息采集與應用[M].北京:清華大學出版社,2005:86-88.

[6]李村合.網絡信息挖掘技術及其應用研究[J].情報科學.2002,20(11):1212-1214.

[7]宋瑞祺.Web文本數據挖掘關鍵技術及其在網絡檢索中的應用[J].山西財經大學學報.2007,10(1):95-96.

[8]陳萍麗.Web挖掘及其在競爭情報系統的應用[J].情報科學.2003,21(9):998-1001.

[9]陳敏.數據采掘與信息資源的開發利用[J].現代圖書情報技術.2001(2):27-34.

[10]張燕.淺談網絡信息挖掘[J].情報探索.2000(4):34-36.

[11]徐寶文,張衛豐.數據挖掘技術在Web預取中的應用研究[J].計算機學報.2001,24(4):430-436.

[12]黃曉斌.網絡信息挖掘[M].北京:電子工業出版社,2007:159-213.

[13]姜東琳.網絡信息挖掘技術及應用[J].計算機技術.2005(3):52-58.

[14]柯平,高潔.信息管理概論[M].北京:科學出版社,2002:60-62.

[15]JiaweiHan,MichelineKambr.DataMining:ConceptsandTechniques[M].北京:高等教育出版社,2001:107-246.

[16]YimingMa.WebforDataMining[J].SIGKDDExplorations.2000,2(1):16-23.

主站蜘蛛池模板: 沐川县| 水富县| 梧州市| 阳朔县| 纳雍县| 双城市| 丁青县| 石景山区| 留坝县| 静海县| 沅江市| 绥阳县| 广灵县| 塔河县| 肥西县| 宁德市| 亳州市| 南城县| 霍邱县| 临猗县| 长治县| 拉孜县| 巴青县| 灵武市| 大宁县| 柘城县| 淮安市| 侯马市| 凤山县| 偃师市| 朔州市| 申扎县| 潍坊市| 抚顺市| 宁夏| 巨野县| 仙游县| 绍兴市| 报价| 那曲县| 朝阳市|