數(shù)據(jù)分析設(shè)計范文

時間:2023-05-04 13:16:29

導(dǎo)語:如何才能寫好一篇數(shù)據(jù)分析設(shè)計,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

數(shù)據(jù)分析設(shè)計

篇1

關(guān)鍵詞:習(xí)題設(shè)計;發(fā)展 ;數(shù)據(jù)分析觀念

【中圖分類號】G 【文獻(xiàn)標(biāo)識碼】B 【文章編號】1008-1216(2016)12C-0029-02

簡單的數(shù)據(jù)統(tǒng)計重在讓學(xué)生經(jīng)歷數(shù)據(jù)的收集、整理和分析過程,掌握一些簡單的數(shù)據(jù)處理技能,感受數(shù)據(jù)蘊含著的信息,培養(yǎng)初步的數(shù)據(jù)分析觀念。在課堂教學(xué)中,這一核心知識受到教師的足夠重視,然而我們的課堂時間有限,僅僅依靠教材提供的有限的統(tǒng)計活動還不足以發(fā)展學(xué)生的數(shù)據(jù)分析觀念。如果能夠依托統(tǒng)計教學(xué)的核心,靈活設(shè)計習(xí)題,從不同側(cè)重點進(jìn)行有針對性的訓(xùn)練,有意識地讓學(xué)生運用數(shù)據(jù)分析解決問題,將能發(fā)展學(xué)生的數(shù)據(jù)分析觀念,使習(xí)題成為教材的有益補充。

一、豐富統(tǒng)計素材,主動收集整理數(shù)據(jù)

培養(yǎng)數(shù)據(jù)分析觀念的首要方面是引導(dǎo)學(xué)生有意識地從數(shù)據(jù)的角度思考有關(guān)問題,就是遇到有關(guān)問題時能夠想到通過設(shè)計簡單的數(shù)據(jù)收集計劃收集所需數(shù)據(jù),解決所求問題,從而體會到數(shù)據(jù)是有用的,數(shù)據(jù)中蘊含著我們想要的信息。教師在進(jìn)行練習(xí)設(shè)計時,要考慮不同年齡學(xué)生生活經(jīng)驗和認(rèn)知水平的差異,賦予習(xí)題鮮活的背景,激勵學(xué)生主動收集整理數(shù)據(jù)。

在學(xué)習(xí)了簡單的統(tǒng)計圖表之后,我設(shè)計如下統(tǒng)計練習(xí):

夏天到了,吃冰激凌成為很多孩子的愛好,學(xué)校門前的張老板想通過一個調(diào)查來了解哪種口味的冰激凌在我們學(xué)校最流行。

(1)小組討論:要完成這項任務(wù),你們需要做哪些工作?請在下面的表格中,圈出需要的選項。

1 確定調(diào)查時間,設(shè)計調(diào)查用的統(tǒng)計表。

2 以小組為單位,每班隨機抽取15名學(xué)生,對他們最喜歡的冰激凌進(jìn)行調(diào)查統(tǒng)計。

3 以小組為單位,對我校學(xué)生的年齡進(jìn)行調(diào)查統(tǒng)計。

4 匯總統(tǒng)計表,繪制條形統(tǒng)計圖。

(2)小組合理分工,展開調(diào)查統(tǒng)計。

(3)根據(jù)分析結(jié)果給張老板提出一些建議。對愛吃冰激凌的同學(xué)又會提出什么建議?

吃冰激凌是孩子們的最愛,與學(xué)生的生活密切相關(guān),很容易引起他們的共鳴。學(xué)生意識到要想幫張老板解決這一問題,調(diào)查收集數(shù)據(jù)是必需的,有用的,激發(fā)學(xué)生熱情投身學(xué)習(xí)活動。真實的統(tǒng)計數(shù)據(jù),會幫助張老板解決現(xiàn)實的問題。而對愛吃冰激凌的同學(xué)提建議,又有意識地對學(xué)生進(jìn)行健康常識教育。由扶到放的習(xí)題設(shè)計,幫助學(xué)生逐步提高開展實際調(diào)查的能力。

二、精心設(shè)計問題提高分析數(shù)據(jù)信息能力

從不同角度分析數(shù)據(jù),以便從數(shù)據(jù)中獲得盡可能多的信息,并發(fā)現(xiàn)蘊含其中的一些規(guī)律,是數(shù)據(jù)分析觀念的基本內(nèi)涵之一。練習(xí)中通過精心設(shè)計問題串,引導(dǎo)學(xué)生從不同角度理解和分析數(shù)據(jù)信息,感受數(shù)據(jù)分析方法的多樣性,并為發(fā)現(xiàn)和提出更有意義的問題提供機會。

小明家每兩個月交一次水費,每次用水的噸數(shù)如下表:

月份 1~2月 3~4月 5~6月 7~8月 9~10月 11~12月

用水量(噸) 8 5 6 16 7 6

根據(jù)上表回答以下問題:

(1)從上表中知道,用水量最多的是哪兩個月份?最少呢?分別占全年總用水量的百分之幾?

(2)全年平均每個月用水多少噸?

(3)根據(jù)生活常識,你能解釋一下為什么7~8月份的用水量最多嗎?

(4)如果想說明7~8月份的用水量比全年的1/4還多,選( )統(tǒng)計圖表示最容易使人明白。

本題中前兩題從一組數(shù)據(jù)的極值入手,大致了解數(shù)據(jù)的分布范圍,對于家庭用水量有個初步了解。然后通過計算解決其中一個月份與全年之間的關(guān)系,并通過平均數(shù)分析用水情況,對于出現(xiàn)的極端情況,嘗試?yán)蒙畛WR進(jìn)行解釋,使學(xué)生體會極端數(shù)據(jù)出現(xiàn)的原因,最后通過選擇統(tǒng)計圖,加深對各種統(tǒng)計圖的特征的把握,進(jìn)一步增強學(xué)生根據(jù)解決問題需要靈活選擇統(tǒng)計圖分析數(shù)據(jù)的能力。

三、連貫使用數(shù)據(jù)提高收集整理數(shù)據(jù)意識

對于同樣的數(shù)據(jù),由于背景和目標(biāo)不同可以有多種分析的方法,需要根據(jù)問題背景選擇合適的方法。每年學(xué)校都會組織學(xué)生進(jìn)行體檢,我將學(xué)生的身高情況及時收集,保存。在解決“ 鐵道部門規(guī)定,兒童身高在120厘米以下乘火車免票,120~150厘米之間享受半價。我們班有多少人乘火車可以享受免票?有多少人需要購買全價票?”這一習(xí)題時,我組織學(xué)生討論并形成一些可行的收集學(xué)生身高的方法,將最近學(xué)生體檢的身高數(shù)據(jù)及時呈現(xiàn)在大屏幕上,學(xué)生感到非常驚訝,感到老師真是個有心人,根據(jù)提供的數(shù)據(jù)學(xué)生很快列表整理信息,順利解決問題,老師這種收集和整理重要數(shù)據(jù)的習(xí)慣,使學(xué)生也受到潛移默化的影響。這時,我進(jìn)一步追問,看到這些身高的數(shù)據(jù),它們還能幫助我們解決什么問題。學(xué)生想到可以了解自己身高在班級處于什么情況,學(xué)校可以根據(jù)身高給我們定做課桌椅,可以定做校服……這時我又呈現(xiàn),定做校服時大號、中號、小號和特號相關(guān)的身高要求,然后讓學(xué)生根據(jù)需要重新對剛才的數(shù)據(jù)進(jìn)行分組整理。通過變換問題情境,使學(xué)生體驗到同一數(shù)據(jù)由于要解決的問題不同,整理、分析的方法往往會不同。

到了五年級學(xué)習(xí)了折線統(tǒng)計圖,我再一次將學(xué)生身高情況呈現(xiàn)給學(xué)生,不同的是這次我將每個同學(xué)1~5年級的身高情況都呈現(xiàn)出來,學(xué)生感到非常興奮,“你能將自己這5年的身高情況繪制成折線統(tǒng)計圖嗎?”,學(xué)生繪制非常用心,在組內(nèi)交流近5年身高增長情況時更是積極主動,分析得頭頭是道。這時我又引導(dǎo)學(xué)生根據(jù)自己身高增長情況對六年級的身高進(jìn)行預(yù)測,并學(xué)習(xí)老師,做一個“數(shù)據(jù)收藏家”,記住自己的身高,到時看看自己預(yù)測得準(zhǔn)不準(zhǔn)。

等到六年級復(fù)習(xí)時,我再次呈現(xiàn),學(xué)生將六年來的身高增長情況繪制完整,并檢驗自己的預(yù)測,同時對自己15歲時的身高情況再次進(jìn)行預(yù)測,此時,給學(xué)生增加了我市近年來男、女生平均身高增長統(tǒng)計圖,發(fā)現(xiàn)男女生13~15歲身高增長的一些規(guī)律,很多同學(xué)又調(diào)整了預(yù)測。同樣的身高數(shù)據(jù)由于解決的問題不同,分析方法大不相同,對數(shù)據(jù)進(jìn)行橫向及縱向的比較,會使我們的判斷和預(yù)測更準(zhǔn)一些。

四、巧設(shè)矛盾沖突促進(jìn)動手實驗?zāi)芰μ嵘?/p>

游戲是激發(fā)學(xué)生主動參與統(tǒng)計活動的很好方式,在游戲?qū)嶒灮顒又型ㄟ^數(shù)據(jù)體會概率事件的隨機性,在教學(xué)可能性時,我設(shè)計這樣一題:

小明和小軍兩人玩游戲,袋子里放有2個和1個,每次任意從中摸出兩個圖形,摸完后放回,如果摸到的兩個圖形能拼成平行四邊形為小明贏,如果能拼成小房子圖形,則是小軍贏。你認(rèn)為這樣的游戲公平嗎?同桌的同學(xué)玩一玩,看看拼成哪種圖形的人贏的次數(shù)多?想想為什么?

游戲中的三個圖形中有兩個是相同的,任意從中摸兩個,結(jié)果只有2種情況,學(xué)生很容易認(rèn)為游戲是公平的,實際上兩種情況出現(xiàn)的可能性大小不同,極易引發(fā)學(xué)生爭辯,促使學(xué)生主動通過實驗活動求證結(jié)論。動手實驗正是學(xué)生體會隨機現(xiàn)象的最佳路徑,通過學(xué)生的實驗,認(rèn)識到游戲的設(shè)計是不公平的,與原有猜測產(chǎn)生沖突,學(xué)生急于一探究竟,發(fā)現(xiàn)小軍贏的可能性會大一些。當(dāng)然,游戲試驗中,也會出現(xiàn)拼成平行四邊形的次數(shù)等于或超過小軍的現(xiàn)象,這一非常規(guī)情形的出現(xiàn)也是體會隨機現(xiàn)象的重要資源,使學(xué)生深刻體會小軍贏的可能性大一些,游戲是不公平的,但是小軍不會一定贏,更有利于學(xué)生感悟隨機現(xiàn)象的特點。

五、適度綜合運用,全面感受分析數(shù)據(jù)的意義

統(tǒng)計與概率的內(nèi)容和其他數(shù)學(xué)領(lǐng)域的內(nèi)容有著緊密的聯(lián)系。這部分課程的教學(xué),應(yīng)為發(fā)展和運用比、分?jǐn)?shù)、百分?jǐn)?shù)、度量、圖像等概念提供活動背景,為培養(yǎng)學(xué)生綜合運用知識解決問題能力提供機會。

王阿姨在汽車銷售公司上班,工資由基本工資和銷售獎金組成,即每銷售1輛汽車給予一定數(shù)量的獎金。下表顯示王阿姨今年3~6月份銷售汽車的輛數(shù)與工資情況:

銷售汽車輛數(shù) 8 10 11 12

月工資(元) 3000 3300 3450 3600

根據(jù)上表提供的信息你能算出王阿姨的基本工資是多少,每銷售1輛汽車的獎金是多少元嗎?

本題緊密聯(lián)系社會生活實際問題,學(xué)生需要在認(rèn)真理解題意的基礎(chǔ)上,借助計算分析題中的數(shù)量關(guān)系,發(fā)現(xiàn)不同信息之間的聯(lián)系,從而得出正確的計算方法,提升學(xué)生數(shù)據(jù)分析能力,在綜合解決問題的過程中全面感受分析數(shù)據(jù)的意義。

篇2

關(guān)鍵詞:數(shù)據(jù)分析;數(shù)據(jù)挖掘;大數(shù)據(jù);云計算

0引言

商業(yè)銀行作為經(jīng)營信用、貨幣的企業(yè),面向的客戶是幾乎全方位的,同時銀行業(yè)的競爭也是異常殘酷的[1]。從網(wǎng)點、ATM、POS、網(wǎng)銀、手機銀行乃至其他網(wǎng)絡(luò)信息等各類渠道數(shù)據(jù)信息中,挖掘、分析出有效的數(shù)據(jù),可以增加營銷效率、加快產(chǎn)品創(chuàng)新,快人一步擴大業(yè)務(wù)發(fā)展空間和市場份額[2]。大數(shù)據(jù)可以使商業(yè)銀行決策由經(jīng)驗依賴到數(shù)據(jù)依賴的轉(zhuǎn)變,實時、深入地把握業(yè)務(wù)和市場動態(tài),從而更加科學(xué)、有效地決策,讓商業(yè)銀行能夠穩(wěn)健、可持續(xù)發(fā)展[3]。大數(shù)據(jù)的挖掘、分析可以有效地提高商業(yè)銀行精細(xì)化管理水平,在風(fēng)險控制、成本核算、資本管理、績效考核等各個方面發(fā)揮出巨大作用,讓經(jīng)營管理能力大幅提升,更理性、更高效、更精確[4]。

1大數(shù)據(jù)技術(shù)

1.1HadoopMapReduce技術(shù)

Hadoop是一種分布式系統(tǒng)的平臺,通過它可以很輕松地搭建一個高效、高質(zhì)量的分布系統(tǒng)[5]。Hadoop的最核心的設(shè)計思想:MapReduce是Hadoop的核心組件之一,Hadoop主要包括2部分:一是分布式文件系統(tǒng)HDFS,HDFS為海量的數(shù)據(jù)提供了存儲;二是分布式計算框MapReduce,為海量的數(shù)據(jù)提供了計算。MapReduce是大規(guī)模數(shù)據(jù)計算的利器,Map和Reduce是它的主要思想,Map負(fù)責(zé)將數(shù)據(jù)打散,Reduce負(fù)責(zé)對數(shù)據(jù)進(jìn)行聚集。Hadoop采用并行工作模式,同時維護(hù)多個工作數(shù)據(jù)副本,確保失敗的節(jié)點能夠重新分布處理,具有可靠、高效、可伸縮、低成本的優(yōu)點。

1.2NOSQL數(shù)據(jù)庫技術(shù)

NOSQL(NotOnlySQL)數(shù)據(jù)庫是指非關(guān)系數(shù)據(jù)庫。這是相對于傳統(tǒng)關(guān)系數(shù)據(jù)庫提出的概念,隨著Web2.0網(wǎng)站的興起,數(shù)據(jù)量越來越大,傳統(tǒng)關(guān)系型數(shù)據(jù)在處理大數(shù)據(jù)、實時讀寫以及多表聯(lián)查已經(jīng)越來越力不從心,而NOSQL以鍵值對存儲,機構(gòu)不固定,每個元組可以根據(jù)需要增加、減少鍵值對,減少了時間和空間的開銷,同時NOSQL可以處理大數(shù)據(jù),能夠良好地運行在廉價的PC服務(wù)器機器上,便于擴展[7]。

1.3內(nèi)存分析技術(shù)

內(nèi)存分析(In-memoryAnalytics)技術(shù)是在內(nèi)存中直接獲取分析數(shù)據(jù)。隨著64位操作系統(tǒng)的普及,系統(tǒng)可用內(nèi)存大幅度提升,同時由于工藝不斷成熟,內(nèi)存容量不斷,價格不斷下降。由于內(nèi)存容量暴增,人們開始直接將數(shù)據(jù)預(yù)讀到內(nèi)存中,對內(nèi)存中的數(shù)據(jù)進(jìn)行分析加工,而不用如傳統(tǒng)的那樣將數(shù)據(jù)反復(fù)不斷地讀入內(nèi)存、寫入磁盤,從而極大地提升了數(shù)據(jù)分析效率。

2商業(yè)銀行數(shù)據(jù)應(yīng)用現(xiàn)狀

目前,商業(yè)銀行對于大數(shù)據(jù)的挖掘還處于起步階段,沒有一個在設(shè)計之初就目標(biāo)明確的定位于大數(shù)據(jù)挖掘、分析的系統(tǒng)[8]?,F(xiàn)有的幾個與數(shù)據(jù)挖掘相關(guān)的管理信息系統(tǒng)有PCRM系統(tǒng)(個人優(yōu)質(zhì)客戶系統(tǒng))、RPTS系統(tǒng)(綜合報表系統(tǒng))、GDP系統(tǒng)(基礎(chǔ)數(shù)據(jù)平臺系統(tǒng))等,這些系統(tǒng)在設(shè)計之初就具有先天的局限性,它們僅僅是針對某個或者某幾個業(yè)務(wù)部門的應(yīng)用開發(fā)的,遠(yuǎn)遠(yuǎn)還談不上大數(shù)據(jù)分析。同時這些系統(tǒng)由于沒有統(tǒng)一的規(guī)劃設(shè)計,物理架構(gòu)大致相同,一些重要數(shù)據(jù),如定期、活期主檔及明細(xì)表全部重復(fù)加工,造成人力、財力的浪費,效率較低[9]。在上面提到的幾個管理信息系統(tǒng)中,GDP系統(tǒng)是相對比較典型的應(yīng)用,現(xiàn)在對GDP系統(tǒng)物理架構(gòu)和邏輯架構(gòu)進(jìn)行分析。如圖1所示的GDP物理架構(gòu)圖,采用成熟的3層B/S架構(gòu),2臺乃至多臺PC服務(wù)器部署WEB前置服務(wù),做表示層;由1臺小型機部署應(yīng)用服務(wù)程序,做邏輯層;1臺小型機上運行數(shù)據(jù)庫系統(tǒng),做數(shù)據(jù)訪問層。數(shù)據(jù)庫由控制庫和日終庫組成,其中控制庫使用SYBASEASE庫,將不同的處理任務(wù)劃分成一個個的作業(yè)鏈,作業(yè)鏈中包含不同的作業(yè),通過對作業(yè)和作業(yè)鏈調(diào)度次序進(jìn)行控制;日終庫采用SYBASEIQ庫,對日終數(shù)據(jù)進(jìn)行高效處理。控制庫與日終庫可在同一臺小型機上。2臺PC服務(wù)器使用IBMWebSphere部署高可用集群,提供WEB服務(wù),包含作業(yè)調(diào)度服務(wù)和前臺展示。

3構(gòu)建商業(yè)銀行數(shù)據(jù)分析

系統(tǒng)模型商業(yè)銀行作為傳統(tǒng)金融企業(yè),與新興的互聯(lián)網(wǎng)企業(yè)不同之處在于:行內(nèi)的數(shù)據(jù)中含有許多機密、隱私的信息,同時無論媒體還是客戶都關(guān)心銀行數(shù)據(jù)的安全性。在數(shù)據(jù)挖掘、分析包括使用的時候,效率與安全的選擇需要慎重考量。為了避免資源的浪費,本文在設(shè)計模型前,必須對現(xiàn)有數(shù)據(jù)進(jìn)行詳盡分析,剔除重復(fù)、無效的數(shù)據(jù),將有效數(shù)據(jù)進(jìn)行分類。商業(yè)銀行數(shù)據(jù)應(yīng)用中大致可以分為2種類型:一類是高可靠數(shù)據(jù),以數(shù)據(jù)的準(zhǔn)確性為主,需要提供給統(tǒng)計部門、核算部門及監(jiān)管部門,對于這類數(shù)據(jù)我們必須在使用前進(jìn)行數(shù)據(jù)清洗、篩選后,才能夠真正使用;另一類則不需要很精確,只需要一個大致數(shù)量級或者一個大的方向,主要供決策層、管理經(jīng)營層及產(chǎn)品研發(fā)、營銷等部門使用,對于這類數(shù)據(jù)其實才是真正符合現(xiàn)今大數(shù)據(jù)的概念,無需對數(shù)據(jù)進(jìn)行清洗,可以直接進(jìn)行挖掘。針對側(cè)重于安全可靠和快速高效這2種不同的需求,以及結(jié)合商業(yè)銀行現(xiàn)有技術(shù)發(fā)展,本文設(shè)計出下面2種模型。

3.1高可靠模型

基于商業(yè)銀行對數(shù)據(jù)的精度要求較高,在設(shè)計模型時首先考慮的是數(shù)據(jù)的完整性和安全性,其次才考慮效率等其他的問題。因此,本文對現(xiàn)有成熟和完備的商業(yè)銀行GDP系統(tǒng)3層架構(gòu)和業(yè)務(wù)定位深入分析的基礎(chǔ)上,進(jìn)行了一些改進(jìn),克服現(xiàn)有GDP系統(tǒng)3層結(jié)構(gòu)的不足。

3.2高效率模型

對于商業(yè)銀行精度要求不高,但是非常具有時效性和海量的數(shù)據(jù),不需要考慮數(shù)據(jù)的完整性、安全性。為此,本文使用一些互聯(lián)網(wǎng)的新技術(shù)以及開源的軟件,拋棄原有3層架構(gòu),引入大數(shù)據(jù)挖掘新技術(shù),實現(xiàn)大數(shù)據(jù)的挖掘需求。

4數(shù)據(jù)分析

當(dāng)將海量的數(shù)據(jù)挖掘出來后,怎樣使用這些數(shù)據(jù)?投入這么多人力、物力當(dāng)然是希望它能帶來更多的收益,怎樣將數(shù)據(jù)變成收益?這就需要對數(shù)據(jù)進(jìn)行分析,結(jié)合自身以及行業(yè)的現(xiàn)狀進(jìn)行分析。在傳統(tǒng)的數(shù)據(jù)中,以少量的數(shù)據(jù)為依據(jù),以數(shù)據(jù)的準(zhǔn)確性為目標(biāo)進(jìn)行的統(tǒng)計工作,其實這樣的統(tǒng)計是有偏差和片面的。而大數(shù)據(jù)則以海量數(shù)據(jù)為依托,強調(diào)數(shù)據(jù)的完整性、綜合性和復(fù)雜性,通過答題輪廓,捕捉發(fā)展脈絡(luò),確定未來發(fā)展方向。從決策層出發(fā),大數(shù)據(jù)可以為我們更快地找出未來銀行的發(fā)展方向,最大限度地避免在決策方向上出現(xiàn)偏差。一直以來商業(yè)銀行的決策是由個人或小團隊進(jìn)行的,但是在這些決策中往往有很多依靠過往的經(jīng)驗、主管判斷的,這就帶來決策缺少扎實的依據(jù),很多決策適合一些地方,但在另外一些地方卻未必很適合。特別是現(xiàn)在科技發(fā)展日新月異,對傳統(tǒng)銀行業(yè)帶來了巨大的沖擊,原來的很多經(jīng)驗不但不能帶來幫助,甚至?xí)萍s決策層的思維,決策遠(yuǎn)遠(yuǎn)滿足不了前瞻性、有效性和針對性的要求。

而大數(shù)據(jù)的分析則可以更準(zhǔn)確、更快捷地幫助決策層把握脈絡(luò),從而做出具有前瞻性、及時的、精準(zhǔn)的決策。從管理執(zhí)行層來看,通過大數(shù)據(jù)的分析可以更快捷地推出精品產(chǎn)品,更有效地營銷客戶,更高效的使用行內(nèi)各種資源,提高管理能力,創(chuàng)造更多利潤。通過大數(shù)據(jù)的分析,管理層能夠分析出哪些產(chǎn)品受哪些客戶的喜好,分析各類客戶都有什么需求,可以根據(jù)這些有針對性地開發(fā)一些受客戶歡迎的產(chǎn)品??梢詫σ恍└哔|(zhì)量的VIP客戶進(jìn)行分析,對他們的資金利用進(jìn)行跟蹤,盡量將資金鏈鎖定在行內(nèi),利用資金空閑時段進(jìn)行中間業(yè)務(wù)的營銷,可以對這些客戶在貸款的利率上進(jìn)行一定幅度的優(yōu)惠等等??梢詫鶎有?、網(wǎng)點人員效率進(jìn)行分析、優(yōu)化,對行內(nèi)的電子設(shè)備,如ATM、POS機等進(jìn)行分析,在使用量龐大的地方可以加大投放,收回一些效率低下的設(shè)備等等。從監(jiān)管層來看,通過大數(shù)據(jù)的分析可以更加直觀、有效地對商業(yè)銀行的合規(guī)經(jīng)營做出監(jiān)管??梢詮拇髷?shù)據(jù)中對各地的經(jīng)營、營銷費用、采購招標(biāo)等需要進(jìn)行監(jiān)管的地方進(jìn)行分析,一旦發(fā)現(xiàn)某個地方有異常情況,就可以進(jìn)行重點關(guān)注、重點監(jiān)管,而不是像以前那樣無差別的監(jiān)管,或者靠經(jīng)驗去進(jìn)行監(jiān)管,從而能夠更快、更有效地進(jìn)行監(jiān)管,提前去發(fā)現(xiàn)問題,制止問題事件的擴大,為商業(yè)銀行減少損失,更有效保障商業(yè)銀行的利益。

5結(jié)語

大數(shù)據(jù)在商業(yè)銀行決策、生產(chǎn)運行和經(jīng)營管理中越來越重要,構(gòu)建商業(yè)銀行自身的大數(shù)據(jù)挖掘、分析系統(tǒng)已經(jīng)迫在眉睫了,如何構(gòu)建大數(shù)據(jù)分析系統(tǒng)、利用分析系統(tǒng)實現(xiàn)數(shù)據(jù)到價值、利潤的轉(zhuǎn)化,這需要不斷的研究。本文通過深入分析商業(yè)銀行的數(shù)據(jù)分析現(xiàn)狀,總結(jié)其數(shù)據(jù)分析的優(yōu)、缺點。并針對側(cè)重于安全可靠和快速高效2種不同需求,以及結(jié)合商業(yè)銀行現(xiàn)有技術(shù)發(fā)展,設(shè)計了商業(yè)銀行數(shù)據(jù)分析系統(tǒng),使商業(yè)銀行從珍貴數(shù)據(jù)中分析、挖掘?qū)ζ鋺?zhàn)略發(fā)展和業(yè)務(wù)經(jīng)營有巨大推動作用的信息。

參考文獻(xiàn):

[1]薛良飛.云計算在新型信息化系統(tǒng)中的綜合研究[D].濟南:山東大學(xué),2013.

[2]李斌,黃治國,彭星.利率市場化會降低城市商業(yè)銀行投融資水平嗎?——基于中國24家城市商業(yè)銀行數(shù)據(jù)的實證研究[J].中南財經(jīng)政法大學(xué)學(xué)報,2015(1):40-47.

[3]方先明,蘇曉珺,孫利.我國商業(yè)銀行競爭力水平研究——基于2010—2012年16家上市商業(yè)銀行數(shù)據(jù)的分析[J].中央財經(jīng)大學(xué)學(xué)報,2014(3):31-38.

[4]劉曉茜.云計算數(shù)據(jù)中心結(jié)構(gòu)及其調(diào)度機制研究[D].北京:中國科學(xué)技術(shù)大學(xué),2011.[5]陸嘉恒.Hadoop實戰(zhàn)[M].北京:機械工業(yè)出版社,2012.

[6]張世明,徐和祥,錢冬明,等.云架構(gòu)模式下“網(wǎng)絡(luò)學(xué)習(xí)空間人人通”體系探析[J].華東師范大學(xué)學(xué)報(自然科學(xué)版),2014(2):30-39.

[7]江務(wù)學(xué),張璟,王志明.云計算及其架構(gòu)模式[J].遼寧工程技術(shù)大學(xué)學(xué)報(自然科學(xué)版),2011(4):575-579.

[8]韓浩.大數(shù)據(jù)技術(shù)在商業(yè)銀行中的運用探討[M].蘇州:蘇州大學(xué),2014.

篇3

一、突出數(shù)據(jù)分析的意義

統(tǒng)計是研究“數(shù)據(jù)”的,“數(shù)據(jù)”和我們平時說的“數(shù)”不同,數(shù)據(jù)是有實際背景的。數(shù)據(jù)包括數(shù),又不僅僅指數(shù)。史寧中教授指出,數(shù)據(jù)是信息的載體,這個載體包括數(shù),也包括言語、信號、圖像,凡是能夠承載事物信息的東西,都構(gòu)成數(shù)據(jù)。

人們進(jìn)行統(tǒng)計活動都是有目的的,并不是為了統(tǒng)計而統(tǒng)計。通過對統(tǒng)計數(shù)據(jù)進(jìn)行分析,幫助人們進(jìn)行判斷、預(yù)測或決策,從而讓人們體會到數(shù)據(jù)中蘊含的信息,這就是數(shù)據(jù)分析的意義。

這節(jié)課中,教師精心安排與現(xiàn)實生活聯(lián)系緊密的統(tǒng)計內(nèi)容,呈現(xiàn)豐富的背景,讓學(xué)生充分感受“數(shù)據(jù)”是說明問題的有力“證據(jù)”,充分感受數(shù)據(jù)分析不僅是有意思的,更是有意義的。

課堂教學(xué)伊始,教師沒有平鋪直敘,而是組織學(xué)生將對春季降水量的感受和經(jīng)驗與數(shù)學(xué)中的問題聯(lián)系起來,從“春雨貴如油”“好雨知時節(jié)”引出他們對兩張折線統(tǒng)計圖的辨析。“春雨貴如油”,這是針對北方的春季降雨而言的,春天降水量不大,雨水顯得很珍貴;而對于南方來說,春天的降水量要比北方大一些。學(xué)生利用經(jīng)驗想象數(shù)據(jù),繼而出示兩張圖,學(xué)生很自然地將表格中的圖像等數(shù)據(jù)進(jìn)行對比分析,即用數(shù)據(jù)來闡釋經(jīng)驗,做出判斷。

呈現(xiàn)6~18歲男女生平均身高統(tǒng)計圖,貼近學(xué)生的生活,幫助學(xué)生發(fā)現(xiàn)數(shù)據(jù)中蘊含的信息,從數(shù)據(jù)角度了解學(xué)生時期身高變化的特點,有生活味又有數(shù)學(xué)味。通過對常州、悉尼各月平均氣溫統(tǒng)計圖的分析,了解南半球、北半球的氣溫情況,判斷暑假去澳大利亞旅游帶什么樣的衣服,問題既是現(xiàn)實的又是有趣的。學(xué)生提供建議,必須用數(shù)據(jù)“說話”。對不銹鋼保溫杯和陶瓷保溫杯的保溫效果做出判斷,根據(jù)數(shù)據(jù)進(jìn)行分析,判斷是科學(xué)的、有說服力的。

全課呈現(xiàn)了不同的統(tǒng)計內(nèi)容,有“大事”,有“小事”,但每一次的分析,都緊扣數(shù)據(jù),感受數(shù)據(jù)分析的意義,體現(xiàn)統(tǒng)計活動的價值,從而激發(fā)學(xué)生學(xué)習(xí)統(tǒng)計知識的興趣,發(fā)展他們的數(shù)據(jù)分析觀念。

二、注重數(shù)據(jù)分析的方法

傳統(tǒng)數(shù)學(xué)主要根據(jù)假設(shè)和規(guī)定的原則進(jìn)行計算或推理,而數(shù)據(jù)分析的方法,卻主要采用歸納來推理。著名數(shù)理統(tǒng)計學(xué)家陳希孺先生認(rèn)為,統(tǒng)計方法是一種歸納性質(zhì)的方法,統(tǒng)計推斷是一種歸納推斷。統(tǒng)計學(xué)的研究方法是基于歸納,而傳統(tǒng)數(shù)學(xué)是基于演繹。我們要認(rèn)識到,歸納推理得出的結(jié)論具有隨機性,與代數(shù)、幾何等通過演繹推理得到的結(jié)論不同。結(jié)論的隨機性,并不說明數(shù)據(jù)分析的方法有問題,而這正是通過數(shù)據(jù)分析方法得到的統(tǒng)計結(jié)果的特性。

在這節(jié)課中,教師設(shè)計的統(tǒng)計內(nèi)容,在由數(shù)據(jù)分析方法得到某些結(jié)論時,注意體現(xiàn)數(shù)據(jù)分析方法的特性。

如,我國男女生平均身高的統(tǒng)計圖,這里呈現(xiàn)的數(shù)據(jù)是根據(jù)樣本推斷出來的,體現(xiàn)了局部推斷整體的數(shù)據(jù)分析方法。把上課班級具體的學(xué)生身高與之對照,會有“出入”,教師在學(xué)生出現(xiàn)疑義時要給予適度引導(dǎo):即從總的方面看有其規(guī)律性,但要承認(rèn)例外個案的存在。

再如,暑假去澳大利亞旅游問題,教師首先呈現(xiàn)2002年常州、悉尼各月平均氣溫統(tǒng)計圖,從中引導(dǎo)學(xué)生發(fā)現(xiàn):悉尼的氣溫變化趨勢和常州正好相反。教師追問:是因為2002年特別冷嗎?再出示從1858年到2002年這145年間悉尼市各月平均氣溫統(tǒng)計圖,學(xué)生在對照比較2002年與這145年的數(shù)據(jù)的過程中,深切體會到了“歸納”的思想,并認(rèn)識到:對今年的氣溫情況做出預(yù)測,僅看去年的情況,是有一定的隨機性和偶然性的,因為每年收集到的數(shù)據(jù)可能是不同的,所以要將過去的情況綜合起來看。天氣預(yù)報,在一定程度上就是基于對過去積累的氣象數(shù)據(jù)的分析研讀,發(fā)現(xiàn)數(shù)據(jù)中隱藏的規(guī)律,從而預(yù)測將來的天氣變化情況。這里,學(xué)生對“歸納”的體驗特別深刻,正是源自教師的精心設(shè)計。

又如,北京奧運會的舉辦時間,在考慮天氣因素時,呈現(xiàn)2003、2004、2005、2006年8月份的降水量統(tǒng)計圖,在數(shù)據(jù)的基礎(chǔ)上形成預(yù)測與推論,讓學(xué)生體會到數(shù)據(jù)分析的預(yù)測和決策作用。呈現(xiàn)第25~30屆奧運會中國和美國獲得金牌情況的統(tǒng)計表,通過分析近6屆奧運會上中國與美國所獲得金牌的數(shù)量,預(yù)測下一屆奧運會上中國可能獲得的金牌數(shù)量,這也很好地體現(xiàn)了數(shù)據(jù)分析方法的特性。即,不能簡單地從中國前幾屆奧運會金牌數(shù)量總體呈上升趨勢,就斷定下一屆奧運會金牌數(shù)還會上升。

從這節(jié)課的教學(xué)中,可以看到教師對數(shù)據(jù)分析方法準(zhǔn)確而深刻的認(rèn)識,進(jìn)而在教學(xué)過程中精妙表達(dá)與清晰傳遞。統(tǒng)計教學(xué)“教什么”,是值得我們深入研究的。

三、經(jīng)歷數(shù)據(jù)分析的過程

數(shù)據(jù)分析觀念,是一種需要在親身經(jīng)歷的過程中培養(yǎng)出來的對一組數(shù)據(jù)的“領(lǐng)悟”,是由一組數(shù)據(jù)所想到的、所推測到的以及在此基礎(chǔ)上對于統(tǒng)計獨特的思維方法和應(yīng)用價值的認(rèn)識。經(jīng)歷數(shù)據(jù)分析的過程,要圍繞“數(shù)據(jù)”做文章,遇到問題“想數(shù)據(jù)”,分析問題“用數(shù)據(jù)”,讓學(xué)生在看數(shù)據(jù)時有需求、有目的、有過程、有體會。

哪幅圖是北京各月降水量統(tǒng)計圖?哪幅圖是常州各月降水量統(tǒng)計圖?學(xué)生并不是盲目地猜測,而是依據(jù)對俗語“春雨貴如油”“好雨知時節(jié)”的理解,并調(diào)度自己的經(jīng)驗,將春季的降水量與其他季節(jié)的降水量進(jìn)行比較,把兩張降水量統(tǒng)計圖聯(lián)系起來觀察。由此,引導(dǎo)學(xué)生對兩幅單式折線統(tǒng)計圖的數(shù)據(jù)進(jìn)行辨別、分析。辨別的過程,也就是對表格中的數(shù)據(jù)進(jìn)行分析的過程。教師又通過呈現(xiàn)一連串的需要對單式折線統(tǒng)計圖中的數(shù)據(jù)進(jìn)行分析比較才能作答的問題,讓學(xué)生在感到麻煩、困難的過程中體會到單式折線統(tǒng)計圖的不足,他們會聯(lián)系單式條形統(tǒng)計圖與復(fù)式條形統(tǒng)計圖的學(xué)習(xí)經(jīng)歷尋思“合并”單式折線統(tǒng)計圖。這也就產(chǎn)生了學(xué)習(xí)復(fù)式折線統(tǒng)計圖的需求,促進(jìn)學(xué)生主動領(lǐng)悟復(fù)式折線統(tǒng)計圖的特點,明確其使用的情境。

在分析6~12歲男女生平均身高統(tǒng)計圖的基礎(chǔ)上,讓學(xué)生預(yù)測12歲之后男女生身高變化的情況。這里,教師關(guān)注的是讓學(xué)生體會并理解后面的兩條“折線”發(fā)生怎樣的變化,需要再調(diào)查數(shù)據(jù)、分析數(shù)據(jù)才能做出判斷。之后,對兩條“折線”的比較與解讀充分體現(xiàn)了復(fù)式折線統(tǒng)計圖的特點,讓學(xué)生體悟到數(shù)據(jù)有助于分析問題。

買哪一種保溫杯,教師提出問題:不銹鋼保溫杯和陶瓷保溫杯,哪一種保溫效果好一些?教師先讓學(xué)生聯(lián)系自己的“經(jīng)驗”說一說,繼而出示有關(guān)數(shù)據(jù)的統(tǒng)計表。在此基礎(chǔ)上,呈現(xiàn)復(fù)式折線統(tǒng)計圖,讓學(xué)生更直觀地“看出”哪種保溫杯保溫效果更好。

不同的統(tǒng)計對象,教師一次又一次讓學(xué)生面臨具體的問題,通過問題引領(lǐng),運用數(shù)據(jù)去分析、解釋?!皵?shù)據(jù)”是學(xué)生發(fā)現(xiàn)、提出、分析、解決問題的好伙伴。數(shù)據(jù)分析觀念,是在與數(shù)據(jù)接觸的過程中培養(yǎng)出來的。

這節(jié)課,加強了對圖、表的分析解讀,適當(dāng)?shù)擞嘘P(guān)統(tǒng)計圖、表的制作,但也不是不要制作。在合并北京、常州各月降水量的統(tǒng)計圖時,教師完整地演示復(fù)式折線統(tǒng)計圖的制作過程,以第一幅圖為標(biāo)準(zhǔn),再描點、注數(shù)、連線,并在學(xué)生對圖例、線條表示方法、統(tǒng)計圖的名稱等方面提出修改建議的過程中完善了他們對復(fù)式折線統(tǒng)計圖的認(rèn)識。而在呈現(xiàn)12~18歲男女生平均身高統(tǒng)計表之后,教師放手讓學(xué)生根據(jù)統(tǒng)計表制作統(tǒng)計圖。我們要認(rèn)識到,制作統(tǒng)計圖表,是整個統(tǒng)計活動的中間環(huán)節(jié),是作為工具為最終的判斷、預(yù)測、決策服務(wù)的。適當(dāng)?shù)漠媹D,有助于學(xué)生認(rèn)識圖,讀懂?dāng)?shù)據(jù)表達(dá)的信息。制作圖表的過程,也是認(rèn)識數(shù)據(jù)的過程。

我們已經(jīng)形成這樣的認(rèn)識:統(tǒng)計教學(xué)應(yīng)引導(dǎo)學(xué)生經(jīng)歷完整的收集、整理、描述和分析數(shù)據(jù)的過程,發(fā)展數(shù)據(jù)分析觀念。我們還要辯證地認(rèn)識到:讓學(xué)生經(jīng)歷統(tǒng)計活動的全過程,并不是每一次統(tǒng)計活動都要讓學(xué)生經(jīng)歷全過程,在統(tǒng)計知識與方法的學(xué)習(xí)過程中,我們可以組織學(xué)生有側(cè)重地參與統(tǒng)計活動的某一個片段。如果在學(xué)習(xí)統(tǒng)計的過程中,都是讓學(xué)生經(jīng)歷統(tǒng)計的全過程,并在其中的每一個環(huán)節(jié)平均著力,那教學(xué)也就變得牽強附會、形而上學(xué)。

篇4

關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;現(xiàn)代百貨業(yè);顧客細(xì)分

隨著零售業(yè)信息技術(shù)的發(fā)展,如何有效地利用商場信息化帶來的數(shù)據(jù)成為企業(yè)生存與發(fā)展新的利潤增長點,這是現(xiàn)代百貨業(yè)不得不考慮的問題。華地國際揚州萬家福商城通過建立以客戶為中心的管理信息系統(tǒng),分析會員數(shù)據(jù)的同時可以指導(dǎo)營銷,幫助挖掘顧客消費行為和規(guī)律, 設(shè)計出更加符合顧客需要的商品和服務(wù),在近二十年的系統(tǒng)使用過程中,智能客戶關(guān)系管理系統(tǒng)得到不斷完善,真正做到實現(xiàn)顧客細(xì)分,精準(zhǔn)營銷,極大地增強了企業(yè)自身的競爭力。

一、萬家福會員卡決策支持系統(tǒng)的設(shè)計思路

1.確定目標(biāo)(理解業(yè)務(wù)):這是系統(tǒng)模型構(gòu)建的關(guān)鍵一步,將現(xiàn)實問題轉(zhuǎn)化為數(shù)據(jù)挖掘的算法,以會員消費數(shù)據(jù)為基礎(chǔ),最終實現(xiàn)顧客細(xì)分,從而達(dá)到有針對性對顧客一對一營銷的目的。

2.關(guān)于數(shù)據(jù):包括數(shù)據(jù)準(zhǔn)備和數(shù)據(jù)理解。數(shù)據(jù)挖掘的前提是要求數(shù)據(jù)是真實的、大量的、有效的。在確定了目標(biāo)之后,選擇符合條件的大量數(shù)據(jù),對數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)的選擇、整理、清理、異常值的處理、標(biāo)準(zhǔn)化處理過程等。

3.建立顧客細(xì)分模型:在研究零售業(yè)顧客細(xì)分模型及方法的基礎(chǔ)上,總結(jié)出適合萬家福商城比較理想的模式,主要功能是實現(xiàn)顧客細(xì)分,同時對顧客的細(xì)分結(jié)果進(jìn)行分析,并提出相應(yīng)的營銷策略。

4.擴展功能:在實現(xiàn)顧客細(xì)分的基礎(chǔ)上,進(jìn)行深層次展望,有針對性地制定營銷策略,為決策提供支持。

二、萬家福會員卡決策支持系統(tǒng)的實踐研究

1.會員資料庫基礎(chǔ)架構(gòu)設(shè)計

⑴會員卡的靜態(tài)數(shù)據(jù), 如年齡、性別、職業(yè)、單位郵編、單位地址、手機號碼、興趣愛好、家庭成員等。

⑵會員卡的消費信息,如購物時間、購買品類、金額、頻率等。

⑶會員卡的基礎(chǔ)信息定義,包括卡種、卡類型、保管地點、年齡段、地區(qū)、職業(yè)等。

2.會員決策支持系統(tǒng)及大數(shù)據(jù)分析

在會員決策系統(tǒng)的大力支持下,管理層可以根據(jù)需要對按照不同的屬性劃分的會員卡進(jìn)行分析,比如通過對卡的類型 ,持卡人的性別、年齡和居住地可以掌握顧客結(jié)構(gòu)及有關(guān)變化的趨勢數(shù)據(jù),分析顧客的消費行為、尋找新的消費模式等等。

3.根據(jù)決策分析支持系統(tǒng)實施會員營銷,發(fā)展、鎖定會員

要想實施精準(zhǔn)營銷,關(guān)鍵在于目標(biāo)顧客的篩選,品牌的顧客具備有哪些特征?顧客的購物行為特征是怎樣的?等等,會員決策支持系統(tǒng)有對會員數(shù)據(jù)強大的智能分析功能,管理者可以通過系統(tǒng)平臺進(jìn)行判斷、分類,從顧客購買的產(chǎn)品特征判定顧客的消費意識、性別、年齡、購物偏好、行為習(xí)慣、家庭情況等,并通過對顧客連續(xù)的購買記錄進(jìn)行分析并修正原有的判斷。不同品類間的促銷組合也可以用來做精準(zhǔn)營銷,通過會員決策支持系統(tǒng)的會員深度分析模塊,可以對品類的關(guān)聯(lián)度分析,當(dāng)某個區(qū)域的商品出現(xiàn)滯銷,但又苦于找不到目標(biāo)群體時,那么就可以通過商品組合做捆綁銷售,而這種商品組合經(jīng)過系統(tǒng)的分析為開展?fàn)I銷活動提供了精準(zhǔn)的數(shù)據(jù),向顧客傳達(dá)準(zhǔn)確有效的營銷信息。

4.深度分析及挖掘會員消費行為數(shù)據(jù),案例解析

通過決策分析支持系統(tǒng)的查詢和統(tǒng)計分析,我們的目標(biāo)客戶以白領(lǐng)和中產(chǎn)企業(yè)家為主,這部分群體具有明顯的營銷特點:收入較高且穩(wěn)定、品牌粘性強,對價格不會敏感。維持和提升這部分客戶的品牌忠誠度對上本的發(fā)展至關(guān)重要。

第一步,進(jìn)行消費引導(dǎo)。借助短信功能平臺首先向會員進(jìn)行生日營銷,告知當(dāng)天購物享雙倍積分并有禮品贈送。經(jīng)過一段時間的短信發(fā)送,生日來店的會員明顯增多,參與人數(shù)由開始的1、2個到后來的十多個至二十幾個,逐漸增多。

第二步,開展有效的營銷活動。比如,積分營銷,分分禮,禮紛紛。會員持卡消費獲得積分獎勵,積分累計到一定分?jǐn)?shù)將可獲贈禮品。

同時,借助決策分析支持系統(tǒng)提供的強大會員篩選器,幫助客服部門多角度準(zhǔn)確篩選營銷群體,進(jìn)行時點會員營銷。系統(tǒng)提供刷卡贈送、消費實時贈送、累積后贈送等多種促銷方式,以電子優(yōu)惠券、短信的形式精準(zhǔn)發(fā)送到會員手中。

三、結(jié)語

總體而言,基于數(shù)據(jù)挖掘技術(shù)的會員卡決策分析支持系統(tǒng)可以對零售業(yè)顧客群進(jìn)行合理的細(xì)分,建立顧客細(xì)分模型,有針對性地對目標(biāo)顧客進(jìn)行一對一營銷,有助于提高營銷活動的針對性和有效性,有助于客戶關(guān)系管理的良好實施。隨著信息化的繼續(xù)發(fā)展,必將在數(shù)據(jù)處理及資源整合,為企業(yè)提供決策支持等方面,發(fā)揮更大的作用。

參考文獻(xiàn):

[1](美)Michael J A Berry , Gordon SLinoff.數(shù)據(jù)挖掘技術(shù):市場營銷、銷售與客戶關(guān)系管理領(lǐng)域應(yīng)用[M].機械工業(yè)出版社,2011.

[2]利.數(shù)據(jù)挖掘與商業(yè)智能完全解決方案[M].北京:電子工業(yè)出版社,2011.

[3]趙濤.商場經(jīng)營管理:理論、案例、制度、實務(wù)――商業(yè)現(xiàn)代化與基礎(chǔ)管理叢書[M].北京工業(yè)大學(xué)出版社,2009.

篇5

關(guān)鍵詞 海洋環(huán)境;環(huán)境監(jiān)測;數(shù)據(jù)庫設(shè)計

中圖分類號:P71 文獻(xiàn)標(biāo)識碼:A 文章編號:1671—7597(2013)021-065-01

當(dāng)今海洋資源被我們廣泛所利用,隨之而來的是海洋的污染及其一系列的環(huán)境問題,為了可持續(xù)發(fā)展,我們必須對海洋環(huán)境的現(xiàn)狀進(jìn)行有效的監(jiān)測管理,才能更好的保護(hù)海洋資源環(huán)境。海洋環(huán)境監(jiān)測是海洋環(huán)境保護(hù)的“哨兵”和“耳目”,是關(guān)系到海洋環(huán)境保護(hù)事業(yè)健康發(fā)展的前提和基礎(chǔ),是防止和消除海洋環(huán)境污染,減少損害的重要手段。隨著我國對個海洋區(qū)域維權(quán)的開展,漁業(yè),石油等生產(chǎn)活動的不斷擴大,長期的,實時的檢測海洋環(huán)境數(shù)據(jù),合理的統(tǒng)計數(shù)據(jù)分析,將為我國開展可持續(xù)發(fā)展戰(zhàn)略,解決海洋污染,保護(hù)生態(tài)環(huán)境等活動提供可靠有效地數(shù)據(jù)基礎(chǔ),為海洋區(qū)域的災(zāi)害預(yù)防,解讀海洋水文氣象變化,監(jiān)測氣象服務(wù)提供重要的依據(jù)。

1 系統(tǒng)組成及數(shù)據(jù)庫設(shè)計

1.1 海洋環(huán)境監(jiān)測系統(tǒng)組成

海洋環(huán)境檢測系統(tǒng)主要由海洋環(huán)境監(jiān)測站、數(shù)據(jù)中心、業(yè)務(wù)應(yīng)用平臺三部分組成。安裝在海洋沿岸及其附屬平臺上的海洋環(huán)境監(jiān)測站,包含一系列數(shù)據(jù)采集、接收、保存的計算機終端,可以實時檢測海洋環(huán)境觀測數(shù)據(jù),這些計算機終端通過海洋岸站與區(qū)域中心之間的數(shù)據(jù)專線或者無線傳輸網(wǎng)絡(luò)將數(shù)據(jù)發(fā)送至中心數(shù)據(jù)庫。經(jīng)過業(yè)務(wù)應(yīng)用系統(tǒng)的處理,不同用戶可以通過web瀏覽器交互查詢調(diào)閱單個或多個、實時的或歷史的監(jiān)測資料以及統(tǒng)計數(shù)據(jù),業(yè)務(wù)平臺管理人員還可以通過基礎(chǔ)應(yīng)用平臺對設(shè)備進(jìn)行監(jiān)控,對業(yè)務(wù)型用戶進(jìn)行授權(quán)管理。

1.2 數(shù)據(jù)庫選型

海洋環(huán)境監(jiān)測系統(tǒng)以數(shù)據(jù)服務(wù)和數(shù)據(jù)分析為主要業(yè)務(wù),因此合理高效的數(shù)據(jù)庫設(shè)計是系統(tǒng)建設(shè)成功的關(guān)鍵之一。穩(wěn)定,高效,二次開發(fā)友好,安全是超大數(shù)據(jù)量數(shù)據(jù)庫選型的關(guān)鍵點。

中心數(shù)據(jù)庫擬采用Oracle數(shù)據(jù)庫。Oracle數(shù)據(jù)庫屬于關(guān)系型數(shù)據(jù)庫,能在所有主流平臺上運行,并完全支持所有的工業(yè)標(biāo)準(zhǔn),采用完全開放策略,并提供了基于角色(ROLE)分工的安全保密管理,在數(shù)據(jù)庫管理功能、完整性檢查、安全性、一致性方面都有良好的表現(xiàn)。Oracle提供了與第三代高級語言的接口軟件PRO*系列,能在C,C++等主語言中嵌入SQL語句及過程化(PL/SQL)語句,對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行操縱,加上它有許多優(yōu)秀的前臺開發(fā)工具如 POWER BUILD、SQL*FORMS、VISIA BASIC 等,可以快速開發(fā)生成基于客戶端PC 平臺的應(yīng)用程序,并具有良好的移植性。

Oracle提供了新的分布式數(shù)據(jù)庫能力,可通過網(wǎng)絡(luò)較方便地讀寫遠(yuǎn)端數(shù)據(jù)庫里的數(shù)據(jù),并有對稱復(fù)制的技術(shù)。能夠有效應(yīng)對災(zāi)難,快速恢復(fù)生產(chǎn)能力。

1.3 數(shù)據(jù)庫模塊劃分

海洋環(huán)境檢測系統(tǒng)主要包括以下幾個模塊:用戶模塊,權(quán)限管理模塊,系統(tǒng)設(shè)置模塊,日志模塊,數(shù)據(jù)檢測模塊和預(yù)警通知模塊。

1.4 數(shù)據(jù)庫表設(shè)計

1.4.1 數(shù)據(jù)檢測模塊

數(shù)據(jù)監(jiān)測模塊為海洋環(huán)境監(jiān)測系統(tǒng)的核心模塊,存儲了該系統(tǒng)核心的數(shù)據(jù),是系統(tǒng)業(yè)務(wù)的基石。本模塊主要包括實時數(shù)據(jù)表,日記錄表,其相關(guān)聯(lián)的表包括監(jiān)測站信息表,監(jiān)測要素信息表,監(jiān)測項目表等,各表關(guān)系及詳細(xì)信息。

1.4.2 系統(tǒng)設(shè)置模塊

系統(tǒng)設(shè)置模塊主要用來設(shè)定系統(tǒng)運行時的基礎(chǔ)數(shù)據(jù),包括站點信息表,監(jiān)測設(shè)置表,系統(tǒng)參數(shù)設(shè)置表等。站點信息表保存各區(qū)域中監(jiān)測站的序號,地理位置,檢測項目,風(fēng)速風(fēng)向儀高度等資料數(shù)據(jù),每個監(jiān)測站可監(jiān)測多個項目。監(jiān)測設(shè)置表保存各站點監(jiān)測的個性化設(shè)置,如監(jiān)測人員,維修人員,監(jiān)測時段等等。系統(tǒng)參數(shù)設(shè)置表保存整個海洋環(huán)境監(jiān)測系統(tǒng)的參數(shù),如訪問時間,最大使用內(nèi)存,最大連接數(shù),日志文件大小等。

1.4.3 日志模塊

日志模塊用來記錄系統(tǒng)運行狀況,包括各監(jiān)測站點運行日志和業(yè)務(wù)系統(tǒng)運行日志兩個部分。監(jiān)測站點日志包括站點運行日志表和站點維護(hù)信息表,其中站點日志表主要記錄站點運行狀態(tài),如站點實際開始監(jiān)測時間,實際結(jié)束監(jiān)測時間,運行狀況,終端良好率等,站點維護(hù)信息表主要記錄站點維護(hù)信息,如維護(hù)人員,維護(hù)時間,維護(hù)內(nèi)容,維護(hù)費用等。業(yè)務(wù)系統(tǒng)日志包括Web應(yīng)用服務(wù)器日志和系統(tǒng)運行錯誤日志。前者可以通過配置Web應(yīng)用服務(wù)器自身日志模塊來實現(xiàn),無需將能大量日志記錄保存到數(shù)據(jù)庫中。后者即系統(tǒng)運行錯誤表主要記錄系統(tǒng)運行發(fā)生的錯誤信息,錯誤堆棧,錯誤時間等,為系統(tǒng)維護(hù)人員排除錯誤提供決策信息。該表信息簡單,不再詳述。

1.4.4 預(yù)警通知模塊

預(yù)警通知模塊用來對需要通知用戶或者管理員的業(yè)務(wù)邏輯進(jìn)行監(jiān)控,促進(jìn)用戶在合理的時間完成各項任務(wù),并可以對可能發(fā)生的不良情況提前預(yù)料和反饋。

基于上述流程,該模塊包括通知表,預(yù)警規(guī)則表,郵件表。其中通知表和郵件表用來保存發(fā)送到用戶的通知或郵件,而這相對簡單,不再詳述。

預(yù)警表主要字段包括rule_id,rule_name,rule_desc,rule_type,interval_date,weekend_include_flag,status,start_date,weekend_include_flag,status,start_date,end_date,WHO。

1.4.5 用戶管理模塊

用戶管理模塊主要記錄所用系統(tǒng)的使用用戶信息。該模塊包括用戶信息表,系統(tǒng)部門表和用戶部門分配表,表間關(guān)系和表詳細(xì)信息

2 結(jié)束語

海洋環(huán)境監(jiān)測數(shù)據(jù)庫及WEB 應(yīng)用平臺設(shè)計界面友好明了、操作簡單通用、數(shù)據(jù)全面豐富、特別是動態(tài)潮汐、風(fēng)況等要素演變曲線,能極大方便預(yù)報員的日常預(yù)報及工程設(shè)計管理人員使用,不但可以拓寬資料的應(yīng)用范圍,而且能實現(xiàn)多站數(shù)據(jù)集中,多單位共享,滿足了用戶的不同需求,在海洋環(huán)境預(yù)報,及防災(zāi)減災(zāi)等方面可以發(fā)揮重要作用。

篇6

[關(guān)鍵詞]多維分析;故障預(yù)測;大數(shù)據(jù);油氣生產(chǎn)設(shè)備

[DOI]10.13939/ki.zgsc.2017.12.243

1 引 言

油氣生產(chǎn)行業(yè)所采用的各類數(shù)字化設(shè)備較多,隨著行業(yè)的競爭加劇,如何減少設(shè)備故障引起的停產(chǎn)時間,如何優(yōu)化采購降低設(shè)備故障率,如何提前對故障做出預(yù)測以提前應(yīng)對,是石油企業(yè)所亟須思考和解決的問題。

隨著工業(yè)自動化技術(shù)、物聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)技術(shù)在油氣生產(chǎn)行業(yè)的開始應(yīng)用,為解決上述問題提供了全新的思路。運用大數(shù)據(jù)技術(shù),可高速有效分析多維度的設(shè)備實時運行數(shù)據(jù),并結(jié)合其他靜態(tài)和動態(tài)信息,對設(shè)備的故障進(jìn)行分析和預(yù)測,分析結(jié)果為生產(chǎn)、經(jīng)營和QHSE服務(wù),實現(xiàn)技術(shù)手段和管理模式的革新,實現(xiàn)科學(xué)決策、卓越運營與安全生產(chǎn),最終達(dá)到可持續(xù)的業(yè)務(wù)增長。例如茂名石化探索如何在不改變已知原料屬性下,實現(xiàn)在重整裝置上提高汽油收率最高和汽油辛烷值最高的生產(chǎn)目標(biāo)。為解決這個問題,采用大數(shù)據(jù)分析技術(shù),收集了重整裝置近三年的MES、HSE、實時數(shù)據(jù)庫、腐蝕數(shù)據(jù)、ITCC、機泵監(jiān)測數(shù)據(jù)、氣象信息等數(shù)據(jù),通過Hadoop建模,對重整原料歷史數(shù)據(jù)進(jìn)行主成分聚類分析,形成了典型的原料操作樣本庫,并據(jù)此快速確定每種原料類別下的最優(yōu)操作方案。技術(shù)人員對近4600個批次的石油原料進(jìn)行了分析建模,組成了操作樣本庫。通過該方法計算優(yōu)化工藝操作參數(shù),可使汽油收率從89.88%提高到90.10%,是大數(shù)據(jù)在油氣生產(chǎn)行業(yè)應(yīng)用的成功例子。

本文擬通過將油氣生產(chǎn)設(shè)備故障數(shù)據(jù)、配套物聯(lián)網(wǎng)采集的工況數(shù)據(jù)、維修保養(yǎng)記錄數(shù)據(jù)及工業(yè)自動化數(shù)據(jù)組合應(yīng)用于設(shè)備故障大數(shù)據(jù)分析,實現(xiàn)對設(shè)備的綜合故障率分析與故障預(yù)測,從而為設(shè)備采購的最高性價比提供數(shù)據(jù)支撐,也為預(yù)防性維修維護(hù)提供決策支持,提升生產(chǎn)運行的安全性和企業(yè)經(jīng)營效益。

2 大數(shù)據(jù)分析技術(shù)的運用

油氣生產(chǎn)行業(yè)設(shè)備數(shù)據(jù)數(shù)量大,并發(fā)處理要求較高,對數(shù)據(jù)存儲、處理、分析的巨大壓力,要解決海量數(shù)據(jù)處理的問題就需要引入大數(shù)據(jù)技術(shù)。

Hadoop是目前最流行和功能最強大的一個軟件計算平臺,可以很容易地開發(fā)和運行處理油氣生產(chǎn)過程中的海量數(shù)據(jù)的分析模型。其核心部分主要包括―HDFS(Hadoop Distributed File System)和基于MapReduce機制的并行算法實現(xiàn)。Hadoop提供的分布式文件系統(tǒng)HDFS是建立在大型集群上可靠存儲大數(shù)據(jù)集的文件系統(tǒng),具有強容錯性、流式數(shù)據(jù)訪問與大數(shù)據(jù)集、硬件和操作系統(tǒng)的異構(gòu)性的優(yōu)勢。而MapReduce是一種簡化的分布式程序設(shè)計模型,用于處理和生成大量數(shù)據(jù)集。通過該模型,程序自動分布到一個由普通機器組成的超大機群上并發(fā)執(zhí)行。MapReduce通過把對數(shù)據(jù)集的大規(guī)模操作分發(fā)給網(wǎng)絡(luò)上的每個節(jié)點來實現(xiàn)可靠性,每個節(jié)點會周期性地把完成的工作和狀態(tài)信息返回給主節(jié)點,實現(xiàn)大數(shù)據(jù)的并發(fā)處理。

Hadoop的上述優(yōu)點尤其適合于油氣生產(chǎn)行業(yè)的海量數(shù)據(jù)分析應(yīng)用。

3 設(shè)備故障率多維分析

設(shè)備故障率是評估設(shè)備性能優(yōu)劣的一個重要指標(biāo)。顧名思義,是設(shè)備故障運行與正常運行的比率。通過統(tǒng)計的方法可以計算特定個體、特定型號、特定類型或特定廠商的設(shè)備的故障信息,對設(shè)備時間質(zhì)量進(jìn)行評估和橫縱向?qū)Ρ取?/p>

在油氣生產(chǎn)中,設(shè)備的故障記錄信息是故障率分析的依據(jù),但因為實際運行中各個井站、礦區(qū)的運行情況不同也影響了設(shè)備發(fā)生故障的情況,因此還需要引入配套物聯(lián)網(wǎng)采集的工況數(shù)據(jù),以及日常的維修保養(yǎng)情況記錄數(shù)據(jù),將這些信息進(jìn)行進(jìn)一步組合,在Hadoop大數(shù)據(jù)分析中建模挖掘,得出更精確的設(shè)備綜合故障率結(jié)果。

本文采用的多維故障率分析,基于3個大類的數(shù)據(jù):

(1)設(shè)備故障信息:包括設(shè)備廠商信息、設(shè)備類型、設(shè)備型號、設(shè)備壽命、運行時間、故障類型、故障次數(shù)、故障時長、故障恢復(fù)時長等;

(2)物聯(lián)網(wǎng)采集的工況數(shù)據(jù):油氣生產(chǎn)設(shè)備產(chǎn)量、流量、振動、位移,以及運行環(huán)境溫度、濕度、處理物質(zhì)腐蝕性等;

(3)維修保養(yǎng)記錄數(shù)據(jù):保養(yǎng)級別、保養(yǎng)時間、更換配件比、維修時間、維修級別等數(shù)據(jù)。

在Hadoop中,根據(jù)3類數(shù)據(jù)的權(quán)重、優(yōu)先級,以及每個數(shù)據(jù)項的占比等,進(jìn)行大數(shù)據(jù)分析建模。進(jìn)而將各個維度的數(shù)據(jù)輸入到Hadoop的MapReduce框架中,在計算模型中進(jìn)行分析計算,最后得到分析結(jié)果。多維分析過程如圖1所示。

如上表所示,基于大數(shù)據(jù)分析的油氣生產(chǎn)設(shè)備故障分析統(tǒng)計過程是從油饃產(chǎn)中產(chǎn)生的多維數(shù)據(jù)(故障相關(guān)、設(shè)備相關(guān)、環(huán)境相關(guān)、操作相關(guān))中獲取在任意時間間隔內(nèi)的某項故障相關(guān)的統(tǒng)計結(jié)果。其統(tǒng)計數(shù)據(jù)源是多維數(shù)據(jù)按一定規(guī)則的組合,同時獲得相應(yīng)的不同維度的統(tǒng)計結(jié)果。

下面以例子說明分析全過程。

向MapReduce庫輸入單個設(shè)備編號參數(shù)、時間區(qū)段參數(shù),向Job Tracker提交統(tǒng)計任務(wù),MapReduce庫將設(shè)備故障記錄庫中的數(shù)據(jù)分為m個分塊。Map Tracker讀取分塊中的設(shè)備故障記錄,作為map函數(shù)輸入,map函數(shù)按設(shè)備編號和時間區(qū)段參數(shù),將該分塊內(nèi)符合條件的設(shè)備故障記錄統(tǒng)計出來,結(jié)果保存在中間鍵值對中。Reduce Tracker讀取所有Map Tracker產(chǎn)生的中間鍵值對,將其歸并為一組統(tǒng)計記錄,從而得到單位時間內(nèi)指定設(shè)備的故障率,或指定時間范圍內(nèi)該設(shè)備故障次數(shù)變化趨勢等信息。

進(jìn)一步,當(dāng)輸入?yún)?shù)為設(shè)備型號、時間區(qū)段時,Map Tracker調(diào)用map函數(shù),將分塊文件中的屬于該設(shè)備型號的所有設(shè)備列出,結(jié)果保存為中間鍵值對,作為下一級MapReduce過程的map函數(shù)輸入,在下一級的MapReduce過程中,再使用上例中的過程,過濾不同編號設(shè)備在指定時間段內(nèi)的故障記錄并歸并出相關(guān)統(tǒng)計信息。整個過程如圖2所示。

多維分析數(shù)據(jù)來源正是應(yīng)用上述MapReduce過程或多次MapReduce過程的迭代,得到最終分析結(jié)果。多維數(shù)據(jù)的故障率分析方法,解決了傳統(tǒng)單一數(shù)據(jù)對比未考慮實際運行環(huán)境、運行負(fù)荷、日常維護(hù)頻度等方面的因素,通過組合計算達(dá)到分析結(jié)果更全面完整的目的,為設(shè)備管理、設(shè)備采購、巡檢維修等日常管理工作提供更準(zhǔn)確的決策輔助。

4 設(shè)備故障預(yù)測分析

獲得設(shè)備綜合故障率結(jié)果后,可進(jìn)一步實現(xiàn)設(shè)備的故障預(yù)測。對于井口裝置、閥門等控制設(shè)備的常規(guī)維護(hù)手段多為定期檢修或故障后維修,存在“過修”和“失修”現(xiàn)象,造成生產(chǎn)設(shè)備損耗和停產(chǎn)減產(chǎn)風(fēng)險。通過設(shè)備的故障預(yù)測預(yù)警,在設(shè)備正常運轉(zhuǎn)條件下,能夠分析出潛在故障及原因、實現(xiàn)預(yù)知性維修,將能有效減少維修成本、降低非計劃停工風(fēng)險。

對設(shè)備的故障預(yù)測預(yù)警,通過現(xiàn)場數(shù)據(jù)采集數(shù)據(jù)傳輸HDFS的數(shù)據(jù)存儲對運行狀態(tài)與故障模型進(jìn)行并行計算大數(shù)據(jù)分析設(shè)備的故障預(yù)測幾個步驟實現(xiàn),如圖3所示。

通過現(xiàn)場的各類傳感器,將重點設(shè)備的關(guān)鍵參數(shù)進(jìn)行實時采集和傳輸,通過RTU或者DCS等設(shè)備,傳輸?shù)紿adoop的HDFS分布式文件系統(tǒng)中,按照流文件格式進(jìn)行存儲。

設(shè)計MapReduce的設(shè)備故障預(yù)測模型,將幾個采集上來的維度數(shù)據(jù)進(jìn)行并行計算分析,分析算法可以Java程序方式實現(xiàn)基本的Map函數(shù)和Reduce函數(shù)。

(1)MapReduce庫先把預(yù)測算法程序的輸入文件劃分為M份(M為用戶定義),每一份通常有16MB到64MB;然后使用fork將用戶進(jìn)程拷貝到集群內(nèi)其他機器上。

(2)被分配了Map作業(yè)的Task Tracker,開始讀取對應(yīng)分片的輸入數(shù)據(jù),包括此重點設(shè)備的振動、位移、溫度等各個維度的數(shù)據(jù)。

(3)接著進(jìn)行Reduce作業(yè)。

(4)當(dāng)所有的Map和Reduce作業(yè)都完成了,MapReduce函數(shù)調(diào)用返回預(yù)測模型程序的代碼。

通過以上方式,實時獲取設(shè)備的振動、溫度、壓力、流量等數(shù)據(jù),同時將數(shù)據(jù)輸入到Hadoop故障預(yù)測模型進(jìn)行實時分析比對,一旦比對類似,則可預(yù)測故障的近似發(fā)生時間,從而合理安排預(yù)防性維護(hù),從而保證了設(shè)備維護(hù)更有針對性。

5 結(jié) 論

本文通過將與油氣生產(chǎn)設(shè)備故障相關(guān)的工況數(shù)據(jù)、故障數(shù)據(jù)、維修保養(yǎng)等操作數(shù)據(jù),作為多維數(shù)據(jù)源進(jìn)行組合,輸入到Hadoop大數(shù)據(jù)分析模型中,利用Hadoop的并行處理優(yōu)勢解決油氣生產(chǎn)設(shè)備運行環(huán)境復(fù)雜、實時數(shù)據(jù)量大、影響因素眾多的故障分析難點,為設(shè)備的優(yōu)化采購提供依據(jù);同時將故障分析結(jié)果進(jìn)一步導(dǎo)入到故障預(yù)測中,也為預(yù)防性維修維護(hù)提供決策參考,提升油氣生產(chǎn)運行安全和綜合運營效益。

參考文獻(xiàn):

[1]趙慶周,李勇,田世明.基于智能配電網(wǎng)大數(shù)據(jù)分析的狀態(tài)監(jiān)測與故障處理方法[J].電網(wǎng)技術(shù),2016(3):774-780.

[2]檀朝|,陳見成,劉志海.大數(shù)據(jù)挖掘技術(shù)在石油工程的應(yīng)用前景展望[J].中國石油和化工,2015(1):49-51.

[3]李金諾.淺談石油行業(yè)大數(shù)據(jù)的發(fā)展趨勢[J].價值工程,2013(29):172-174.

篇7

關(guān)鍵詞:Web網(wǎng)絡(luò);大數(shù)據(jù)分類;系統(tǒng);設(shè)計

中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2017)17-0216-02

我國當(dāng)前,已經(jīng)有與Web網(wǎng)絡(luò)大數(shù)據(jù)分類的很多方法研究相繼出現(xiàn),絕大多數(shù)學(xué)者也取得了一定的成效。但是基于Web網(wǎng)絡(luò)的大數(shù)據(jù)分類法,此種方法在使用過程中采用了由上到下的方法,分類樹形信息較為混亂,此種數(shù)據(jù)作為選擇的樣本節(jié)點,在通過決策樹進(jìn)行決策時,就可以根據(jù)相應(yīng)的計算規(guī)律進(jìn)行節(jié)點截取。決策樹的歸類方法在具體的使用過程中具備著操作較為簡便、計算程度較輕的優(yōu)點,但是數(shù)據(jù)拓展效果較差,并且很容易在使用過程中受到噪音的干擾。因此隨之提出了有關(guān)網(wǎng)絡(luò)大數(shù)據(jù)處理的方法,即為利用迭代法對數(shù)據(jù)庫的信息進(jìn)行全部的獲取,在搜集項集的過程中支持?jǐn)?shù)集的定閾值,根據(jù)頻繁獲取的定閾值來獲取用戶所采用的最小置信度。此種方法在使用過程中受到了一定條件的約束,消耗了相對較多的資源。在此種方法之后,提出了基于在對網(wǎng)絡(luò)大數(shù)據(jù)進(jìn)行計算分類的過程中能夠阿金數(shù)據(jù)進(jìn)行樣本處理,經(jīng)由高緯度的空間對其進(jìn)行轉(zhuǎn)換,雖然此種方法能夠?qū)⒌途暥鹊木€性計算問題轉(zhuǎn)換為高緯度的線性計算問題,但是在實際的運用過程中卻由于數(shù)據(jù)的種類受到了一定的限制,分類效果不夠優(yōu)化。通過對上述多種網(wǎng)絡(luò)大數(shù)據(jù)分類的方法進(jìn)行優(yōu)弊端的分析,進(jìn)而設(shè)計出了一種新型的Web網(wǎng)絡(luò)大數(shù)據(jù)分析系統(tǒng),此種系統(tǒng)能夠在使用過程中采用軟件和計算機硬件兩者相結(jié)合的方式,對數(shù)據(jù)進(jìn)行分析總結(jié)。經(jīng)過試驗證實,此種系統(tǒng)的應(yīng)用在使用過程中具備了相對較高的網(wǎng)絡(luò)大數(shù)據(jù)分類性能。

1基于Web網(wǎng)絡(luò)大數(shù)據(jù)分類系統(tǒng)的設(shè)計總體結(jié)構(gòu)

在對Web網(wǎng)絡(luò)大數(shù)據(jù)進(jìn)行分類時,如果只是對大數(shù)據(jù)進(jìn)行分類工作可能會在此過程中消耗一定程度的技術(shù)資源,與此同時對數(shù)據(jù)進(jìn)行分類處理所用的時間也很長,因此不能即時的對網(wǎng)絡(luò)大數(shù)據(jù)進(jìn)行分類。但是如果只是通過借助計算機硬件設(shè)施對大數(shù)據(jù)進(jìn)行分類,那么就需要更多的資源配置,從而加大了成本的投入,在配置和管制上也就不太方便了。但是為了能夠使得計算機軟件發(fā)揮它的功能性特點,從而完成Web網(wǎng)絡(luò)大數(shù)據(jù)的劃分,讓軟件處理功能與計算機的硬件特點形成對Web網(wǎng)絡(luò)大數(shù)據(jù)分類系統(tǒng)設(shè)計(系統(tǒng)設(shè)計結(jié)構(gòu)圖如圖1所示)。

首先如圖所示通過系統(tǒng)的處理器以及軟件部分對Web網(wǎng)絡(luò)大數(shù)據(jù)進(jìn)行數(shù)據(jù)采集,經(jīng)由Web網(wǎng)絡(luò)的處理器對所采集的數(shù)據(jù)進(jìn)行處理之后,然后經(jīng)計算機的硬件設(shè)施對處理后的數(shù)據(jù)進(jìn)行存儲,在對Web網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行處理的過程中通過軟件處理過程的數(shù)據(jù),實現(xiàn)了系統(tǒng)性的數(shù)據(jù)處理功能,最終經(jīng)由處理之后,將數(shù)據(jù)傳輸至存儲板塊,對數(shù)據(jù)進(jìn)行存儲,從而完成了一系列的系統(tǒng)性Web網(wǎng)絡(luò)大數(shù)據(jù)分類,供系統(tǒng)管理者對數(shù)據(jù)進(jìn)行下一步的處理。

2基于Web網(wǎng)絡(luò)大數(shù)據(jù)分類系統(tǒng)的若干硬件設(shè)計

2.1 Web數(shù)據(jù)采集器

經(jīng)過圖一所示,要想完成Web網(wǎng)絡(luò)大數(shù)據(jù)的系統(tǒng)分析,重點就在于用何種材質(zhì)的數(shù)據(jù)采集器完成對數(shù)據(jù)的采集過程。在通常情況下通過計算機的網(wǎng)絡(luò)接口處安裝計算機的數(shù)據(jù)采集器硬件設(shè)施,從而通過數(shù)據(jù)采集器向計算機發(fā)送采集到的相關(guān)數(shù)據(jù)。數(shù)據(jù)采集器的硬件設(shè)施(如圖2所示)。

由上圖可知,數(shù)據(jù)采集器的電源模塊會經(jīng)由單片機產(chǎn)生電壓,經(jīng)由REGIN發(fā)送到單片機的電壓調(diào)節(jié)器上,從而給單片機提供系統(tǒng)所需的電壓。與此同時使得系統(tǒng)運行所產(chǎn)生的電壓通過系統(tǒng)的輸送程序從而對3v期間進(jìn)行運用。Web網(wǎng)絡(luò)中的被預(yù)測信號經(jīng)由系統(tǒng)的相應(yīng)調(diào)節(jié)之后,使用該單片機將設(shè)備上的期間進(jìn)行轉(zhuǎn)化,從而經(jīng)由轉(zhuǎn)換之后獲取相應(yīng)的數(shù)據(jù),就完成了對Web網(wǎng)絡(luò)的數(shù)據(jù)采集過程。在運行這一系統(tǒng)過程中對數(shù)據(jù)的采集如果數(shù)值過大,那么就需要在該系統(tǒng)的運行過程中考慮多方面的因素,比如對數(shù)據(jù)采集的選取過程,數(shù)據(jù)采集器運行過程中進(jìn)行的電壓轉(zhuǎn)換等,眾多因素都能夠?qū)?shù)據(jù)采集器的功能性軟件產(chǎn)生一定的影響。

2.2 Web網(wǎng)絡(luò)處理器

Web網(wǎng)絡(luò)處理器也是在對Web網(wǎng)絡(luò)大數(shù)據(jù)進(jìn)行分類的系統(tǒng)中硬件設(shè)施中重要的一個組成部分,網(wǎng)絡(luò)處理器主要應(yīng)用于該系統(tǒng)中對經(jīng)由上部信息處理之后的大數(shù)據(jù)進(jìn)行分類的程序。Web網(wǎng)絡(luò)處理器通常對此硬件設(shè)備選用的過程中,使用INTEL公司出產(chǎn)的產(chǎn)品,對此硬件進(jìn)行設(shè)計的時候,應(yīng)該選用綜合性較強并且能夠高效率的對數(shù)據(jù)進(jìn)行處理的設(shè)備。Web網(wǎng)絡(luò)網(wǎng)絡(luò)處理器結(jié)構(gòu)圖(如圖3所示)。

經(jīng)過上圖所示可以得知Web網(wǎng)絡(luò)處理器的整個系統(tǒng)運行,是將信息進(jìn)行采集之后對其進(jìn)行處理,這個程序是可以進(jìn)行代碼編程的,而編程所得程序的實用性就在于此種程序?qū)⒉杉臄?shù)據(jù)進(jìn)行了存儲,并且將數(shù)據(jù)進(jìn)行了分類,從而納入了處理器的程序之中。運用Web網(wǎng)絡(luò)處理器對數(shù)據(jù)進(jìn)行分類處理,得出的Web網(wǎng)絡(luò)數(shù)據(jù)結(jié)果經(jīng)由系統(tǒng)的數(shù)據(jù)控制以及與外部硬件存儲設(shè)備相連接,從而將處理過后的數(shù)據(jù)發(fā)送至存儲系統(tǒng)進(jìn)行保存。

3基于Web網(wǎng)絡(luò)大數(shù)據(jù)分類系統(tǒng)的軟件設(shè)計

3.1 Web網(wǎng)絡(luò)大數(shù)據(jù)采集程序

為了對Web網(wǎng)絡(luò)大數(shù)據(jù)進(jìn)行數(shù)據(jù)的處理過程,讓數(shù)據(jù)采集器能夠?qū)eb網(wǎng)絡(luò)大數(shù)據(jù)完成全部的采集過程,則需要對數(shù)據(jù)的采集源頭進(jìn)行代碼設(shè)計。通過代碼的鏈接從而獲取相應(yīng)的網(wǎng)頁處理。為了在過程中保證數(shù)據(jù)的處理完整性,通過編碼的形式對其進(jìn)行調(diào)整。圖4為單片機與AT45DB081的硬件原理圖。

3.2 Web網(wǎng)絡(luò)大數(shù)據(jù)分類程序

為了對Web網(wǎng)絡(luò)大數(shù)據(jù)進(jìn)行合理的分類,需要在設(shè)計過程中對其進(jìn)行相關(guān)數(shù)據(jù)信息的處理程序?qū)崿F(xiàn)。那么在對Web進(jìn)行信息分類的過程中,也就是根據(jù)數(shù)據(jù)的情況進(jìn)行歸屬分類,從而實現(xiàn)相關(guān)代碼如圖5所示。

3.3 Web網(wǎng)絡(luò)大數(shù)據(jù)分類程序的改進(jìn)

對數(shù)據(jù)進(jìn)行分類過程中,Web網(wǎng)絡(luò)大數(shù)據(jù)的分類實效性是整個數(shù)據(jù)分類過程的重要部分,那么為了保障數(shù)據(jù)的分類時效性,也就是在第一時間對使用者進(jìn)行數(shù)據(jù)分析,提升系統(tǒng)的操作效率,保障Web網(wǎng)絡(luò)網(wǎng)絡(luò)大數(shù)據(jù)分類程序的系統(tǒng)效率,從而對其進(jìn)行代碼改進(jìn),實現(xiàn)Web網(wǎng)絡(luò)網(wǎng)絡(luò)大數(shù)據(jù)的具體分析。

篇8

關(guān)鍵詞:大比例尺基礎(chǔ);地理信息;數(shù)據(jù)庫

Abstract: as an important part of the infrastructure, digital city construction in large scale basis to improve the digital city's basic geographic information database construction, enhance the level of social management and public service. Large scale is based on the analysis of fundamental geographic information database construction, on the basis of the whole process to find out in the construction of the key points, and by strengthening the integrity of data, preparing work, promote the automation of processing multiple aspects, such as perfect the construction of database, and to summarize, to find effective and practical method of database construction.

Key words: large scale basis; Geographic information; The database

中圖分類號:P208文獻(xiàn)標(biāo)識碼:A文章編號:2095-2104(2013)

現(xiàn)在我國很多城市都在實行數(shù)字城市建設(shè),按照各個部門提供的信息編制對應(yīng)的地理信息系統(tǒng)?;A(chǔ)的地理信息就是把城市不同元素各種地理信息歸集到一塊,成為數(shù)字信息的載體,它具有涉及范圍寬廣、面向全社會、共享性強、公益性高的特點,是數(shù)字城市建設(shè)的核心內(nèi)容,維持系統(tǒng)運行的先決條件。信息源的數(shù)目和質(zhì)量決定著國家信息系統(tǒng)運用技術(shù)的深度,而大比例尺基礎(chǔ)的地理信息正是重要的數(shù)據(jù)信息源,按其制定的地形圖能達(dá)到城市不同專項地理信息系統(tǒng)使用的要求,因此要求基礎(chǔ)地理空間數(shù)據(jù)具有更高的精準(zhǔn)性和及時性。

一、地理數(shù)據(jù)的準(zhǔn)備工作

原有的大比例尺基礎(chǔ)地形圖在制定過程中,應(yīng)按照現(xiàn)有的國家制圖規(guī)定的制度,對每種地形的元素在比例尺不相同如1:500和1:1000的情況下設(shè)定符號、種類級別大體保持統(tǒng)一,而很多城市在建立自己的地理信息數(shù)據(jù)庫的時候在大比例尺基礎(chǔ)地形圖上加入不少國家制圖所規(guī)定條款外的數(shù)據(jù)信息,例如某棟大樓的高度、特殊建筑的標(biāo)志、公交站點等便于人們識路。此類數(shù)據(jù)信息的來源要根據(jù)人們在實際生活中的要求進(jìn)行詳細(xì)的收集,并保證數(shù)據(jù)的準(zhǔn)確性。盡管這類城市地理數(shù)據(jù)信息并未以國家制圖規(guī)定內(nèi)容提及,但是我們在完善城市地理信息數(shù)據(jù)庫的時候并不能忽略這些信息,盡可能做到在制定的地形圖上對這些地理信息進(jìn)行妥善保留,以增加城市地理信息數(shù)據(jù)庫的內(nèi)在使用價值。

在建設(shè)大比例尺基礎(chǔ)的地理信息數(shù)據(jù)庫的同時,也要增加對有關(guān)數(shù)據(jù)地理產(chǎn)品規(guī)章制度要求的建設(shè),但是由于我國某些城市地理信息的特殊性,其建設(shè)過程較為緩慢,因此想要達(dá)到保持地理基礎(chǔ)數(shù)據(jù)信息的一致性,滿足城市基礎(chǔ)地理信息建設(shè)與數(shù)據(jù)之間輪流使用的要求等目的,就先對有關(guān)數(shù)據(jù)的結(jié)構(gòu)及表格進(jìn)行籌劃工作。要嚴(yán)格按照國家的相關(guān)要求找到對數(shù)據(jù)進(jìn)行分類的方法。因為數(shù)據(jù)庫地形圖對比例尺不同的情況下相同的地理要素在地理圖形的表達(dá)上有通過點、線、面不同形式來表達(dá)的方式,所以我們要對其加以區(qū)分,如可采用在地形圖國家相關(guān)規(guī)定標(biāo)準(zhǔn)編碼數(shù)字后面根據(jù)不同的表達(dá)方式加上對應(yīng)尾數(shù)。除此之外,還要設(shè)定具體的不同數(shù)據(jù)類型對地形要素進(jìn)行描述,對地理信息數(shù)據(jù)表的每個內(nèi)容和有關(guān)說明進(jìn)行分析確立,建立明細(xì)的地理信息數(shù)據(jù)庫。為了方便數(shù)據(jù)庫的自動建設(shè),要把各種比例尺下地理信息與相關(guān)數(shù)據(jù)表格相互聯(lián)系起來,顧及到所用的地理信息軟件平臺以及最后地理信息數(shù)據(jù)庫結(jié)果的數(shù)據(jù)表達(dá)格式,如果要在不同的地理信息處理平臺之間進(jìn)行數(shù)據(jù)交換,就應(yīng)該做好數(shù)據(jù)接口預(yù)先措施。

二、數(shù)據(jù)執(zhí)行的自動化

在建設(shè)大比例尺基礎(chǔ)的地理信息數(shù)據(jù)庫的時候,可應(yīng)用計算機系統(tǒng)對地理要素的選擇、整理、轉(zhuǎn)換等設(shè)定一些程序自動化進(jìn)行處理,并提前制定相關(guān)因數(shù)來達(dá)到目的。進(jìn)行選擇地形要素時,一要按照建設(shè)時的實際情況制定一些列網(wǎng)格對數(shù)據(jù)進(jìn)行過濾選擇,按城市地理信息的相關(guān)特點對地形要素篩選,以比例尺從1:500向1:2000轉(zhuǎn)換的情況為例,可在地形圖上舍去下水道、管道以及其附帶內(nèi)容等相關(guān)地形要素,因為這些內(nèi)容在1:2000地形圖上可不予體現(xiàn)。二是要按照城市地理空間對地形圖相關(guān)一部分要素篩選處理,根據(jù)有關(guān)數(shù)據(jù)庫建設(shè)的標(biāo)準(zhǔn),對地理要素進(jìn)行選擇,一般包含面狀地理要素的大小以及線型要素的長短,還是上面的例子,分別確定不同比例下衛(wèi)生間、地下通道、綠化植物、大型工廠設(shè)施、天橋、立交橋等地形要素面積的選擇??蓪⒚娣e較小的地形要素用不按地圖比例的簡單易懂的點狀符號來表示,像汽車加油站、寺廟、雷達(dá)監(jiān)控室、變壓器、通風(fēng)設(shè)備、亭臺樓閣、走廊、鐘樓等等,在這些地理要素的關(guān)鍵部位要用點狀圖形來說明;江河等線型水系、柵欄、層次低的單線道路等等線型地理要素可按照所規(guī)定的長度進(jìn)行選擇。三要設(shè)定相關(guān)規(guī)定對地理信息要素較為密集的位置在地形圖上進(jìn)行取舍,例如市區(qū)繁華地段、旗桿點、交通發(fā)達(dá)點等。

在建設(shè)大比例尺基礎(chǔ)的地理信息數(shù)據(jù)庫的時候,對地理信息要素進(jìn)行整合處理,可將不用區(qū)別的地理信息要素在數(shù)據(jù)庫中進(jìn)行整合,不需要其他形式的處理。以1:2000的比例尺向1:10000轉(zhuǎn)換時,將柵欄、鐵絲網(wǎng)以及籬笆進(jìn)行整合。

三、建立數(shù)據(jù)庫的過程

在建設(shè)大比例尺基礎(chǔ)的地理信息數(shù)據(jù)庫的時候,先要對所建數(shù)據(jù)庫的城市進(jìn)行地理調(diào)查研究,做出相應(yīng)地形數(shù)據(jù)的整理分析。不少城市缺少大比例尺基礎(chǔ)地形的數(shù)據(jù),對建設(shè)數(shù)據(jù)庫的目的性不強。所以要想建設(shè)好數(shù)字城市,相關(guān)工作人士應(yīng)按照其地理信息數(shù)據(jù)形成情況做好研究,在滿足國家相關(guān)制度、區(qū)域標(biāo)準(zhǔn)和本行業(yè)有關(guān)規(guī)定的基礎(chǔ)上,設(shè)立一套數(shù)據(jù)體系,按照預(yù)先方案對數(shù)據(jù)庫圖層、結(jié)構(gòu)、文件等進(jìn)行規(guī)劃,確保數(shù)據(jù)庫的質(zhì)量,完成大比例尺基礎(chǔ)的地理信息數(shù)據(jù)庫基本建設(shè)。其建設(shè)流程如下:對已有的數(shù)據(jù)分析研究制定數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范整理相關(guān)數(shù)據(jù)檢測數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)入庫交換數(shù)據(jù)共享數(shù)據(jù)應(yīng)用數(shù)據(jù)。

(一)研究數(shù)據(jù)

由于現(xiàn)有的城市大比例基礎(chǔ)地理信息數(shù)據(jù)具有存在年限的不同、搜集來源、格式多種化、質(zhì)量不統(tǒng)一、管理不集中等現(xiàn)象,因此在這些數(shù)據(jù)入庫之間,要經(jīng)過詳細(xì)的分析研究、整理。

(二)標(biāo)準(zhǔn)的設(shè)立

其關(guān)鍵部分就是數(shù)據(jù)庫的規(guī)劃,對整理數(shù)據(jù)的有關(guān)要求、數(shù)據(jù)保存的措施以及以后數(shù)據(jù)應(yīng)用有著重要的影響。因此在設(shè)定相關(guān)數(shù)據(jù)庫的標(biāo)準(zhǔn)時,要按照國家、區(qū)域、行業(yè)的相關(guān)說明和規(guī)定進(jìn)行操作。

(三)數(shù)據(jù)的整合

不但要進(jìn)行原有數(shù)據(jù)的處理,還要對收集后的數(shù)據(jù)按照標(biāo)準(zhǔn)進(jìn)行有效的處理措施。

(四)數(shù)據(jù)的檢測

對整理后的數(shù)據(jù)進(jìn)行加測,如果存在缺陷,就應(yīng)該重新進(jìn)行檢測。主要有地理圖形的檢測和數(shù)據(jù)屬性方面的檢測。其中存在的難點是由數(shù)據(jù)量巨大,對于為細(xì)小的問題認(rèn)為難以及時發(fā)現(xiàn),可采用人工與相關(guān)專業(yè)檢測軟件配合來對數(shù)據(jù)進(jìn)行檢測。

(五)數(shù)據(jù)經(jīng)轉(zhuǎn)換后進(jìn)庫

經(jīng)過整理與檢測的數(shù)據(jù)并不能直接入庫,還需用相關(guān)工具進(jìn)行格式上面的轉(zhuǎn)換,保持轉(zhuǎn)換前后地理信息在各個方面數(shù)據(jù)一一對應(yīng),并沒有地理圖形和數(shù)據(jù)屬性方面的差異。

四、建立完成的數(shù)據(jù)庫應(yīng)具有特點

(一)實用性:能夠滿足用戶的需要,便于使用、管理和維護(hù)。

(二)適用性:系統(tǒng)的結(jié)構(gòu)能夠滿足各種類型用戶的需要,運作方便、靈活,方便對數(shù)據(jù)進(jìn)行更新。

(三)標(biāo)準(zhǔn)化:數(shù)據(jù)庫的內(nèi)容、數(shù)據(jù)分類、格式編碼、相關(guān)精度等方面應(yīng)采用國家所規(guī)定的標(biāo)準(zhǔn)、行業(yè)的相關(guān)規(guī)定、地方的有關(guān)制度。

(四)擴充性:數(shù)據(jù)編碼、應(yīng)用范圍以及軟硬件設(shè)施可進(jìn)行擴從,以適應(yīng)未來技術(shù)水平的更新。

(五)領(lǐng)先性:應(yīng)用先進(jìn)的技術(shù)、方法、設(shè)備等,提升數(shù)據(jù)庫的技術(shù)水平;最大程度地節(jié)約資金。

(六)開放與共享性:促使基礎(chǔ)地理信息數(shù)據(jù)庫能夠成為綜合性地理信息資源。

五、加強建設(shè)過程中質(zhì)量

數(shù)據(jù)庫相關(guān)產(chǎn)品的質(zhì)量方面控制難于數(shù)字線劃圖方面的質(zhì)量控制,因此在建設(shè)大比例尺基礎(chǔ)的地理信息數(shù)據(jù)庫的時候應(yīng)制定先進(jìn)有效的質(zhì)量控制措施來保證數(shù)據(jù)庫的建設(shè)質(zhì)量,對地理信息數(shù)據(jù)作出數(shù)據(jù)精度、數(shù)據(jù)屬性、地理圖形統(tǒng)一性、良好的數(shù)據(jù)完備性進(jìn)行控制,主要有檢測數(shù)據(jù)的完整程度;檢查地形圖圖層中的空地物類;確保數(shù)據(jù)庫沒有遺漏要素。對建設(shè)設(shè)計方案進(jìn)行檢測,檢測結(jié)果數(shù)據(jù)和相關(guān)規(guī)范。無效數(shù)據(jù)排除,在數(shù)據(jù)庫建設(shè)過程會產(chǎn)生一小部分無效的或者重復(fù)的數(shù)據(jù),需及時進(jìn)行排查。

六、結(jié)論

基于以上分析論述,為加強城市宏觀管理以及規(guī)劃的需求,建設(shè)數(shù)字城市可以通過建設(shè)大比例尺基礎(chǔ)的地理信息數(shù)據(jù)庫來實現(xiàn)。隨著比例尺的進(jìn)一步加大,地形圖所覆蓋的信息更為廣泛,其應(yīng)用范圍也會進(jìn)一步擴展,如衛(wèi)星運行圖片、航空飛行軌跡等等。因此,對于城市地理信息數(shù)據(jù)庫的建設(shè),應(yīng)作為城市建設(shè)基礎(chǔ)設(shè)施的重要內(nèi)容之一。

參考文獻(xiàn):

[1]葉海波,吳遇文.大比例尺基礎(chǔ)地形數(shù)據(jù)的建庫與應(yīng)用[J].測繪,2012(4)

篇9

關(guān)鍵詞:多元智能算法;智能處理技術(shù);神經(jīng)元網(wǎng)絡(luò)技術(shù);差分嵌入編程技術(shù);數(shù)據(jù)挖掘技術(shù)

中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2012)29-6996-04

“三流的企業(yè)賣產(chǎn)品,二流的企業(yè)賣技術(shù),一流的企業(yè)賣標(biāo)準(zhǔn)”,這句話形象地概括出了標(biāo)準(zhǔn)在企業(yè)競爭中的決定性作用。放眼當(dāng)今世界,凡是標(biāo)準(zhǔn)領(lǐng)先的企業(yè),無一不在該行業(yè)中居于主導(dǎo)地位,決定著行業(yè)的進(jìn)入壁壘或者發(fā)展趨向。企業(yè)標(biāo)準(zhǔn)信息的存貯、處理及應(yīng)用已越來越廣泛?!岸嘣髽I(yè)標(biāo)準(zhǔn)數(shù)據(jù)處理分析編寫系統(tǒng)的開發(fā)設(shè)計”企業(yè)標(biāo)準(zhǔn)編寫系統(tǒng)能更進(jìn)一步對各類標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行綜合分析與優(yōu)化處理研究應(yīng)用。本系統(tǒng)是基本于woindows操作下的具有三層架構(gòu)的應(yīng)用程序,具有開放的用戶層、應(yīng)用層、數(shù)據(jù)層,并為設(shè)計、開發(fā)、集成和部署軟件平臺應(yīng)用提供基于組件的方法。系統(tǒng)應(yīng)用又與access數(shù)據(jù)庫、word系統(tǒng)、其它出版系統(tǒng)等構(gòu)成多元化集成系統(tǒng)平臺,它具有應(yīng)用程序調(diào)度與管理功能、系統(tǒng)安全管理功能、資源程序分配管理、功能業(yè)務(wù)流程制訂與管理功能、流程追蹤與記憶管理功能、數(shù)據(jù)挖掘功能、多架構(gòu)平臺集成算法先進(jìn)等功能。這是一套集管理技術(shù)、格式化文檔處理、多項算法技術(shù)、海量級數(shù)據(jù)處理技術(shù)于一體的應(yīng)用開發(fā)系統(tǒng)。在石油生產(chǎn)科研中必將起到積極的作用和得到廣泛的應(yīng)用,也必將創(chuàng)造更大的經(jīng)濟效益和社會效益。

1 數(shù)據(jù)處理算法研究

隨著人工智能科學(xué)的深入發(fā)展,對智能控制的研究已演變成多元層次、樹層次與子層次遞階控制的模式。有學(xué)者將遺傳算法與人工神經(jīng)元網(wǎng)絡(luò)算法結(jié)合,分別提出了“基于人工神經(jīng)元網(wǎng)絡(luò)的遺傳算子自學(xué)習(xí)”和“基于權(quán)值進(jìn)化的人工神經(jīng)元網(wǎng)絡(luò)”的思想體系。也有學(xué)者對遺傳算法、人工神經(jīng)元網(wǎng)絡(luò)算法和免疫算法三者的集成進(jìn)行了研究。其主要的思想是對外界環(huán)境學(xué)習(xí)、自適應(yīng)功能由人工神經(jīng)元網(wǎng)絡(luò)算法完成,算法參數(shù)的調(diào)節(jié)、升級功能由遺傳算法完成,算法對環(huán)境適應(yīng)性的評價由免疫算法完成。智能算法的多元化意味著算法復(fù)雜度的上升,同時也意味著編程難度和軟件潛在故障率的上升。是否采用多元智能算法及如何采用多元智能算法,需要根據(jù)系統(tǒng)性能要求和設(shè)計精度進(jìn)行相關(guān)的評估。

1.1 多元算法的研究

多元算法已經(jīng)成為當(dāng)前數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)處理中重要的方法之一,而求解多元算法模型的關(guān)鍵問題是如何確定回歸系數(shù)和模糊測度。針對以往使用遺傳算法確定回歸系數(shù)和模糊測度時間復(fù)雜度高和收斂速度較慢的問題,使用一種高效的搜索算法——粒子群算法求解基于廣義Choquet-積分的多元非線性回歸模型,分別在人工數(shù)據(jù)和真實數(shù)據(jù)上進(jìn)行實驗,對粒子群算法和遺傳算法進(jìn)行比較.結(jié)果表明,用粒子群算法求解該模型不僅比遺傳算法收斂速度快,而且還能搜索到比遺傳算法更優(yōu)的解。

1.2 數(shù)據(jù)流工程正則算法的研究

數(shù)據(jù)流工程正則算法的研究以形式化的方法研究數(shù)據(jù)流分析的基本原理,給出了數(shù)據(jù)流表達(dá)式的概念。并在此概念的基礎(chǔ)上,研制出一個數(shù)據(jù)流異常的數(shù)據(jù)流分析算法。算法要求通用性強,運用本算法不難開發(fā)出相應(yīng)的程序,根據(jù)標(biāo)準(zhǔn)工程的特點研發(fā)“正則集的代數(shù)”算法并形成表達(dá)式,進(jìn)而完成編寫代碼。

正則集的代數(shù)”算法格式如/abc/,其中位于“/”定界符之間的部分就是將要在目標(biāo)對象中進(jìn)行匹配的模式。用戶只要把希望查找匹配對象的模式內(nèi)容放入“/”定界符之間即可。為了能夠使用戶更加靈活的定制模式內(nèi)容,正則表達(dá)式提供了專門的“元字符”。所謂元字符就是指那些在正則表達(dá)式中具有特殊意義的專用字符,可以用來規(guī)定其前導(dǎo)字符(即位于元字符前面的字符)在目標(biāo)對象中的出現(xiàn)模式。

較為常用的元字符包括: “+”, “*”,以及 “?”。其中,“+”元字符規(guī)定其前導(dǎo)字符必須在目標(biāo)對象中連續(xù)出現(xiàn)一次或多次,“*”元字符規(guī)定其前導(dǎo)字符必須在目標(biāo)對象中出現(xiàn)零次或連續(xù)多次,而“?”元字符規(guī)定其前導(dǎo)對象必須在目標(biāo)對象中連續(xù)出現(xiàn)零次或一次。這也是項目的創(chuàng)新點。

1.3 標(biāo)準(zhǔn)工程算法

主要研制出符合標(biāo)準(zhǔn)化GB/T 1.1-2009要求的工程算法及20多個重點子算法。如:GB/T 321 優(yōu)先數(shù)和優(yōu)先數(shù)系及ISO 圖形算法。通過國標(biāo)規(guī)定,建立數(shù)據(jù)庫,然后通過數(shù)據(jù)挖掘技術(shù)方法建立研究算法,然后依數(shù)據(jù)分析技術(shù)建立數(shù)據(jù)模型,最后完成算法代碼。標(biāo)準(zhǔn)工程用到的數(shù)據(jù)挖掘技術(shù)算法(data mining)是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中提取隱含在其中的、事先不知道的、但又是潛在有用的信息和知識的過程。嵌入式線性算法技術(shù)主要用在數(shù)據(jù)處理、解釋、結(jié)果呈現(xiàn)上面。

2 建立多元企業(yè)標(biāo)準(zhǔn)數(shù)據(jù)處理分析編寫系統(tǒng)的開發(fā)設(shè)計

2.2系統(tǒng)的安全設(shè)計

本集成系統(tǒng)平臺具有功能完善的信息交換式管理界面(如圖1所示),安全的系統(tǒng)嵌入式接口和強壯的用戶管理,整個軟件系統(tǒng)是一個完整的統(tǒng)一整體平臺,密不可分。使用加強的MD5口令算法加密,各模塊之間緊密集成與子程間具有防拷貝功能。

2.3系統(tǒng)的功能設(shè)計

3 結(jié)束語

“多元企業(yè)標(biāo)準(zhǔn)數(shù)據(jù)處理分析編寫系統(tǒng)的開發(fā)設(shè)計”的軟件設(shè)計規(guī)范, 操作簡單靈活, 適應(yīng)性強, 易學(xué)易用。它是由系統(tǒng)平臺管理模塊、數(shù)據(jù)庫管理模塊、標(biāo)準(zhǔn)編寫起草模塊、標(biāo)準(zhǔn)編寫修改模塊、標(biāo)準(zhǔn)編寫標(biāo)準(zhǔn)生成模塊、與word集成模塊、Windows API控制模塊、數(shù)據(jù)導(dǎo)出模塊、數(shù)據(jù)導(dǎo)入模塊、內(nèi)存優(yōu)化管理模塊及眾多算法模塊有機地集成在一起而成的綜合系統(tǒng)。它具有程序設(shè)計算法的創(chuàng)新性及國際軟件編程的先進(jìn)理念,軟件投入使用可減輕企業(yè)標(biāo)準(zhǔn)制定者的疲勞強度及軟件學(xué)習(xí)的效率,提高企業(yè)標(biāo)準(zhǔn)編寫質(zhì)量及標(biāo)準(zhǔn)制定的工作效率。軟件的推廣使用,得到了企業(yè)標(biāo)準(zhǔn)制定人員的良好應(yīng)用與用戶好評,在石油行業(yè)企業(yè)標(biāo)準(zhǔn)制定中,獲得良好的工作效率、經(jīng)濟效益和社會效益,為整個石油行業(yè)生產(chǎn)質(zhì)量節(jié)能工作做出貢獻(xiàn)。

參考文獻(xiàn):

[1] 馬有志.鉆井多元數(shù)據(jù)分析處理系統(tǒng)的開發(fā)設(shè)計[J].計算機應(yīng)用研究,2008(25):2005.

篇10

關(guān)鍵詞:教學(xué)設(shè)計前端分析;數(shù)據(jù)挖掘;綜合集成方法論;BP神經(jīng)網(wǎng)絡(luò);層次聚類

中圖分類號:G40-057 文獻(xiàn)標(biāo)識碼:A 文章編號:1673-8454(2011)21-0084-04

教學(xué)設(shè)計對于教學(xué)工作科學(xué)化,提高學(xué)習(xí)者分析問題、解決問題的能力和培養(yǎng)科學(xué)思維能力與科學(xué)態(tài)度,促進(jìn)教育技術(shù)的實踐與理論的發(fā)展和適應(yīng)信息社會發(fā)展的需求等方面都有著重要的意義和價值。前端分析,是教學(xué)設(shè)計的第一步,它是教學(xué)設(shè)計過程的基礎(chǔ),有助于理順問題與方法、目的與手段的關(guān)系,其設(shè)計的好壞直接影響到后面的一系列工作。在不同的教學(xué)設(shè)計過程模式中,前端分析的內(nèi)容略有不同,但主要包括:學(xué)習(xí)任務(wù)、學(xué)習(xí)需要、學(xué)習(xí)者特征和學(xué)習(xí)環(huán)境等。鑒于本文的研究主要定位于學(xué)科課程范圍,學(xué)習(xí)需要和學(xué)習(xí)任務(wù)由學(xué)校學(xué)科專業(yè)所規(guī)定,學(xué)習(xí)環(huán)境一般在具體的情境中由授課教師掌握控制,又由于學(xué)習(xí)者是教學(xué)活動的主體,教學(xué)設(shè)計的一切活動都是為了學(xué)習(xí)者的學(xué),學(xué)生之間存在著共性,也存在著差異,本文只對學(xué)習(xí)者特征做主要研究。對學(xué)生進(jìn)行分析的目的是了解影響學(xué)生學(xué)習(xí)的認(rèn)知能力、學(xué)習(xí)風(fēng)格、學(xué)習(xí)動機。通過對學(xué)習(xí)者三個方面特征的研究,使得教師更好地把握學(xué)習(xí)者的情況,從而達(dá)到更好地實現(xiàn)因材施教、因風(fēng)格施教的口的。

為了有利于后續(xù)教學(xué)設(shè)計自動化的探索,本文基于綜合集成(Meta-synthesis)方法論,即將專家的知識與經(jīng)驗、統(tǒng)計數(shù)據(jù)和信息資料,以及計算機技術(shù)三者有機動態(tài)地結(jié)合起來,構(gòu)成一個高度智能化的人機交互系統(tǒng),把數(shù)據(jù)挖掘技術(shù)應(yīng)用于數(shù)字化后的教學(xué)設(shè)計前端分析中,列舉出實驗過程,并對實驗結(jié)果進(jìn)行分析。

一、理論基礎(chǔ)

1.數(shù)據(jù)挖掘技術(shù)概述

數(shù)據(jù)挖掘(Data Mining,DM)是從大量的、不規(guī)則的、含有噪音的數(shù)據(jù)集中識別出有效的、新穎的、潛在有用的,以及最終可被人理解和利用的模式的高級處理過程。它包含神經(jīng)網(wǎng)絡(luò)、聚類、粗糙集、遺傳算法、決策樹、關(guān)聯(lián)規(guī)則等多種技術(shù)。它被廣泛應(yīng)用于各個領(lǐng)域,包括金融業(yè)、零售業(yè)、電信業(yè)及其他科技應(yīng)用領(lǐng)域。

2.BP神經(jīng)網(wǎng)絡(luò)方法

BP神經(jīng)網(wǎng)絡(luò)(誤差反向傳播網(wǎng)絡(luò))是目前使用最廣泛、發(fā)展最成熟的一種經(jīng)典的神經(jīng)網(wǎng)絡(luò)模型,它是一種監(jiān)督學(xué)習(xí)型數(shù)據(jù)挖掘方法。BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),主要特點是輸入信號前向傳遞,誤差反向傳遞,并且在這個過程中不斷修改權(quán)值直到達(dá)到目標(biāo)值。網(wǎng)絡(luò)包括:輸入層,隱層和輸出層。其網(wǎng)絡(luò)模型如圖1所示:

其中,X1,X2……Xn是輸入信號。YI,Y2……Yn是輸出信號。Wij,wjk代表權(quán)值。輸入層輸入信號,輸出層輸出處理結(jié)果信號,隱層處理信號,在處理的過程中,根據(jù)來自輸出層的反饋信號,權(quán)值不斷被調(diào)整,當(dāng)輸出層誤差減小到預(yù)定值時,學(xué)習(xí)結(jié)束。可以說,BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的實質(zhì)就是權(quán)值的改變。

3.聚類分析方法

聚類分析是一種無監(jiān)督學(xué)習(xí)型數(shù)據(jù)挖掘方法,其實質(zhì)是建立一利,分類方法,它能夠?qū)⒁慌鷺颖緮?shù)據(jù)按照他們在性質(zhì)上的親密程度在沒有先驗知識的情況下自動進(jìn)行分類。層次聚類是聚類分析中的一種方法,它是根據(jù)樣本間的親疏程度,將最相似的樣本結(jié)合在一起,以逐次聚合的方式分類,白:到最后所有的樣水成一類。

根據(jù)聚類過程的不同,層次聚類法可分為方向相反的兩大類:分解法(自頂向下)和凝聚法(自底向上)。本研究采用的是凝聚法,其基本思想是:(1)假定N個樣本各自成一類,計算類間距(等于各樣本之間的距離);(2)選擇距離最近的兩類并成一個新類:(3)計算新類與其他類問的距離;(4)重復(fù)第2步和第3步,這樣每次縮小一類,直到所有樣本都成一類為上。

二、學(xué)習(xí)者特征測量方法

學(xué)習(xí)者特征主要包括認(rèn)知能力、學(xué)習(xí)風(fēng)格、學(xué)習(xí)動機三個方面。

美國著名教育心理學(xué)家布魯姆(B.S.Bloom)的“教育目標(biāo)分類”理論把教學(xué)目標(biāo)分為認(rèn)知、情感和動作技能三個目標(biāo)領(lǐng)域,其中認(rèn)知能力的目標(biāo)按智力活動的復(fù)雜程度由低級到高級又可劃分為六個等級:(1)認(rèn)記――記憶或重復(fù)以前呈現(xiàn)過的信息的能力,也就是知識保持能力;(2)理解――用自己的語言來解釋所獲得的信息的能力;(3)應(yīng)用――將知識(概念、原理或定律)應(yīng)用于新情況的能力;(4)分析――把復(fù)雜的知識分解為若干個彼此相關(guān)的組成部分的能力;(5)綜合――將有關(guān)的知識元素綜合起來形成新知識塊或新模式的能力:(6)評價――根據(jù)已有知識或給定的標(biāo)準(zhǔn)對事物作出評價和鑒定的能力。根據(jù)認(rèn)知能力的評估與測量方法的不同,可以把學(xué)生認(rèn)知能力值測量方法分為兩種:“小組評估法”和“逐步逼近法?!毖芯渴歉鶕?jù)“小組評估法”來設(shè)計量表測試學(xué)生認(rèn)知能力的。

學(xué)習(xí)動機是指直接推動學(xué)生進(jìn)行學(xué)習(xí)的一種內(nèi)部動力,是激勵和指引學(xué)生進(jìn)行學(xué)習(xí)的一種需要,本文學(xué)習(xí)動機測量是根據(jù)王迎、彭華茂、黃榮懷等在《遠(yuǎn)程學(xué)習(xí)者學(xué)習(xí)動機測量工具的編制與應(yīng)用》一文中提出的“遠(yuǎn)程學(xué)習(xí)者學(xué)習(xí)動機問卷”測量的,該問卷是根據(jù)奧蘇貝爾的學(xué)習(xí)動機分類理論從三個動機維度,即認(rèn)知內(nèi)驅(qū)力、自我提高內(nèi)驅(qū)力和附屬內(nèi)驅(qū)力來制定的一種測驗學(xué)生學(xué)習(xí)動機類型和強度的表格:奧蘇貝爾將學(xué)習(xí)動機劃分為三個方面:即認(rèn)知內(nèi)驅(qū)力(cognitive drive)、自我提高內(nèi)驅(qū)力(ego-enhancement drive)以及附屬內(nèi)驅(qū)力(affiliative drive),認(rèn)知內(nèi)驅(qū)力是一種要求了解和理解的需要,要求掌握知識的需要,以及系統(tǒng)地闡述問題并解決問題的需要,這是一種內(nèi)部動機;自我提高內(nèi)驅(qū)力是個體因自己的勝任能力或工作能力而贏得相應(yīng)地位的需要,這是一種外部動機:附屬內(nèi)驅(qū)力:是個體為了保持長者(家長、教師等)的贊許:或認(rèn)可而表現(xiàn)出來的把學(xué)習(xí)或工作做好的一種需要,也是一種外部動機。

學(xué)習(xí)風(fēng)格(Learmng Stvte)的概念是由美國學(xué)者Herbert Thelen于1954年首次提出,在今天的教育和技能培訓(xùn)領(lǐng)域中,學(xué)習(xí)風(fēng)格一詞已是研究者最廣泛使用的概念之一,學(xué)習(xí)風(fēng)格理論已成為當(dāng)今教育心理學(xué)一個新的領(lǐng)域。學(xué)習(xí)風(fēng)格是學(xué)習(xí)者持續(xù)一貫的帶有個性特征的學(xué)習(xí)方式,是學(xué)習(xí)策略和學(xué)習(xí)傾向的總和。其測定方法主要有測驗法、行為觀察法、行為評定法和作品分析法。其中,測驗法是最主要的方法。學(xué)習(xí)風(fēng)格的測量在手段上可以分為圖式和量表兩種形式。大多數(shù)研究者采用量表方式來測定學(xué)習(xí)風(fēng)格。學(xué)習(xí)風(fēng)格的測量工具可以分為七種二場獨立一場依存類型測量工具、榮格個性

類型測量工具、感知覺類型測量工具、社會互動類型測量工具、多元智能類型測量工具、基于經(jīng)驗的學(xué)習(xí)風(fēng)格測量量表、基于三維模型的學(xué)習(xí)風(fēng)格測量量表。所羅門學(xué)習(xí)風(fēng)格量表屬于多元智能類型測量工具。多元智力理論是由加德納提出的,但他并未開發(fā)測量工具。所羅門學(xué)習(xí)風(fēng)格量表(也稱Felder-Si/verman量表)是由Feldel和Soloman于1997年開發(fā)的一種用來測量學(xué)生學(xué)習(xí)風(fēng)格類型的量表,是教育領(lǐng)域比較有權(quán)威的學(xué)習(xí)風(fēng)格量表。所羅門(Barbara A.Soloman)從信息加工感知、輸入、理解四個方面將學(xué)習(xí)風(fēng)格分為4個組對8種類型,它們是:活躍型與沉思型、感悟型與直覺型、視覺型與言語型、序列型與綜合型,比較全面地反映了學(xué)習(xí)者的學(xué)習(xí)風(fēng)格,且具有很強的操作性,可以較好地進(jìn)行學(xué)習(xí)風(fēng)格的調(diào)試。因此,本文中學(xué)習(xí)風(fēng)格測量選用“所羅門學(xué)習(xí)風(fēng)格量表”測量。

三、調(diào)查問卷結(jié)果

本研究的調(diào)查對象是云南大學(xué)2008屆職業(yè)與繼續(xù)教育學(xué)院市場營銷和財會專業(yè)現(xiàn)代教育技術(shù)學(xué)課程的89名本科生的認(rèn)知能力、學(xué)習(xí)動機和學(xué)習(xí)風(fēng)格。調(diào)查問卷共89份,經(jīng)篩選整理后,有效問卷為89份?表1、2、3為問卷處理后的部分?jǐn)?shù)據(jù)。

四、層次聚類方法分類

利用SPSS軟件,用層次聚類分析法對上述問卷數(shù)據(jù)進(jìn)行聚類得到分類結(jié)果,然后把結(jié)果反饋給被調(diào)查者,再由被調(diào)查者和專家對結(jié)果進(jìn)行核實、探討,取得共識,接下來對可疑或不合理的數(shù)據(jù)進(jìn)行相應(yīng)的調(diào)整,如此反復(fù)修改,最后形成用于接下來的實驗研究中的學(xué)生特征分類結(jié)果。其中,把認(rèn)知能力分為較強和一般兩類,學(xué)習(xí)動機分為較強、中等和較弱三類。

學(xué)習(xí)風(fēng)格的測量結(jié)果可以直接用于描述學(xué)習(xí)者,故不做進(jìn)一步研究。

五、認(rèn)知能力數(shù)據(jù)分析預(yù)測

1.BP網(wǎng)絡(luò)設(shè)計

首先,需要獲得網(wǎng)絡(luò)的輸入和目標(biāo)樣本。根據(jù)上面得到的學(xué)生特征分類結(jié)果,選取其中30組作為訓(xùn)練樣本、樣本被分為較強組和一般組。

接下來確定網(wǎng)絡(luò)結(jié)構(gòu),根據(jù)Kohnogorov定理,采用一個Nx(2N+I)xM的3層BP網(wǎng)絡(luò)作為狀態(tài)分類器。其中,N表示輸入特征向量的分量數(shù),M表示輸出狀態(tài)類別總數(shù)。對于本例,N=6。為了簡化網(wǎng)絡(luò),用(1,1)表示較強狀態(tài),(1,0)表示一般狀態(tài)。這樣一來,就可以在網(wǎng)絡(luò)中只設(shè)計兩個輸入神經(jīng)元表示這兩種狀態(tài)類別。由此可得,該BP網(wǎng)絡(luò)結(jié)構(gòu)為:輸入層有6個神經(jīng)元,中間層有13個神經(jīng)元,輸出層有2個神經(jīng)元。按照一般的設(shè)計方案,中間層神經(jīng)元的傳遞函數(shù)為s型正切函數(shù),輸出層神經(jīng)元的傳遞函數(shù)為S型對數(shù)函數(shù),是因為該函數(shù)為0-1麗數(shù)(后面我們必須將樣本數(shù)據(jù)歸一化到0-1內(nèi)),正好滿足狀態(tài)類別的輸出要求。

令P表示網(wǎng)絡(luò)的輸入樣本向量,T表示網(wǎng)絡(luò)的目標(biāo)向量,由上表可得

P=[81 82 69 78 65 46、69 68 65 72 72 53,79 92 56 67 78 61、

79 60 62 69 81 60 82 85 70 82 80 62 66 g4 69 63 85 59,

80 90 75 78 79 51,90 93 63 88 77 59

69 78 60 76 83 57,……]

T=[1 1 1 1 1 1 1 1,1 1 1 1,1 1 1 1 1 1,1 1 1 1,1 1,1 1 1 1 1 1

1 0 1 n 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 10

利用如下代碼建立一個符合以上要求的BP網(wǎng)絡(luò)。網(wǎng)絡(luò)的訓(xùn)練函數(shù)為trainhn,學(xué)習(xí)函數(shù)取默認(rèn)值learngdm,性能函數(shù)取默認(rèn)值mse。其中麗數(shù)mlnnaax設(shè)定了輸入向量元素的閾值范圍。

net=newff(minmax(P),[13,2],{tansig','logsig”),’trainlml;

2.網(wǎng)絡(luò)訓(xùn)練

net=train(net,P,T)

訓(xùn)練結(jié)果為:

TRAINLM,Epoch 0/50,MSE 0 730893/0.001,Gra-dient 1.60962/le-010

TRAINLM,Epoch 7/50,MSE 0.000444178/0.001,Gradient 0.0902879/le-010

TRAINLM,Performance goa]met,

可見,經(jīng)過7次訓(xùn)練后,網(wǎng)絡(luò)誤差達(dá)到了設(shè)定的最小值,結(jié)果如圖2所示。

3.網(wǎng)絡(luò)測試與運用

網(wǎng)絡(luò)測試的目的是為了確定網(wǎng)絡(luò)是甭滿足實際應(yīng)用的需求。選取7組“較強”狀態(tài)數(shù)據(jù)和3組“一般”狀態(tài)數(shù)據(jù)作為測試數(shù)據(jù)。利用上面設(shè)計的網(wǎng)絡(luò),判別它們分別屬于哪一種狀態(tài)。運行結(jié)果如圖3所示:

由此可見,前7組數(shù)據(jù)預(yù)測其為“較強”狀態(tài),后3組數(shù)據(jù)預(yù)測其為“一般”狀態(tài),這與實際情況相符合,說明所設(shè)計的網(wǎng)絡(luò)是合理的,可以投入運用。

六、學(xué)習(xí)動機數(shù)據(jù)分析預(yù)測

學(xué)習(xí)動機在BP網(wǎng)絡(luò)設(shè)計、網(wǎng)絡(luò)訓(xùn)練、網(wǎng)絡(luò)測試與應(yīng)用上的方法與認(rèn)知能力相似,故不再贅述。在此只給出網(wǎng)絡(luò)的目標(biāo)樣本訓(xùn)練的結(jié)果圖(圖4)、測試樣本(表4)和測試結(jié)果(圖5)。

目標(biāo)樣本為:

由此可見,前2組數(shù)據(jù)預(yù)測其為“較強”狀態(tài),第3組數(shù)據(jù)預(yù)測其為“中等”狀態(tài),第4組不能判斷其狀態(tài)情況,第5組數(shù)據(jù)預(yù)測其為“中等”狀態(tài),第6組數(shù)據(jù)預(yù)測其為“較弱”狀態(tài),其中,第1、2、3、6組數(shù)據(jù)預(yù)測結(jié)果與實際相符合,第4、5組預(yù)測結(jié)果與實際情況不符合,故神經(jīng)網(wǎng)絡(luò)預(yù)測成功率為66.7%,基本可以使用。

七、小結(jié)

教學(xué)設(shè)計前端分析是一個復(fù)雜的問題,本文以從定性到定量綜合集成方法為主,在大量實驗數(shù)據(jù)的基礎(chǔ)上,選用數(shù)據(jù)挖掘技術(shù)中的BP神經(jīng)網(wǎng)絡(luò)和層次聚類分析對教學(xué)設(shè)計前端分析中的認(rèn)知能力和學(xué)習(xí)動機做了研究,系統(tǒng)預(yù)測成功率較高,這對于進(jìn)一步開展后續(xù)的教學(xué)設(shè)計研究及實現(xiàn)教學(xué)設(shè)計自動化的研究起著很好的鋪墊作用。

參考文獻(xiàn):

[1]于景元,涂元季從定性到定量綜合集成方法――案例研究U]系統(tǒng)工程理論與實踐,2002(5):2.

[2]陳文偉,陳晟知識工程與知識管理[M].北京:清華大學(xué)出版社,2010:165.

[3]韓力群人工神經(jīng)網(wǎng)絡(luò)教程[M].北京北京郵電大學(xué)出版社,2006:59-64.

[4]楊曉明SPSS在教育統(tǒng)計中的應(yīng)用[M].北京:高等教育出版社,2004:247.

[5]瞿俊,基于重疊度的層次聚類算法研究及其應(yīng)用[D].福建:廈門大學(xué),2007.

[6]羅伯特?M?加涅學(xué)習(xí)的條件[M].北京:人民教育出版社,1985.

[7]張正蘭,張明,蔡紹稷建造認(rèn)知型學(xué)生模型的研究[J].南京師大學(xué)報(自然科學(xué)版),1997,20(1):2-4.

[8]陳琦,劉孺德當(dāng)代教育心理學(xué)[M].北京:北京師范大學(xué)出版社,1997:120.

[9]王迎,彭華茂,黃榮懷遠(yuǎn)程學(xué)習(xí)者學(xué)習(xí)動機測量工具的編制與應(yīng)用U1開放教育研究,2006,12(5):1-4

[10]李淑霞成功遠(yuǎn)程學(xué)習(xí)者研究綜述[J].成功(教育),2007.

[11]陳晶,李玉斌,劉家勛.網(wǎng)絡(luò)遠(yuǎn)程學(xué)習(xí)者特征分析方法初探[J].現(xiàn)代遠(yuǎn)程教育研究,2006(5).

[12]龍雪梅WBI設(shè)計中的學(xué)習(xí)風(fēng)格分析[J].西南師范大學(xué)學(xué)報,2001(8):480-483.

[13]陳麗遠(yuǎn)程教育學(xué)基礎(chǔ)[M].北京:高等教育出版社,2004(7).