數(shù)據(jù)挖掘課程實踐教學探索
時間:2022-10-10 10:57:41
導語:數(shù)據(jù)挖掘課程實踐教學探索一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:在大數(shù)據(jù)背景下,需要培養(yǎng)適應時展需要的具有較強實踐能力的應用型數(shù)據(jù)分析挖掘人才。文章以信息與計算科學專業(yè)為例,探索改革數(shù)據(jù)挖掘課程的實踐教學內(nèi)容和方式等,著重培養(yǎng)學生數(shù)據(jù)分析和挖掘的實踐能力,并為完善實踐教學提出了建議。
關鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;實踐教學
隨著大數(shù)據(jù)時代的到來,大數(shù)據(jù)的分析和挖掘越來越被各個領域所重視。在《中國大數(shù)據(jù)發(fā)展調(diào)查報告(2018年)》中指出,“2017年中國大數(shù)據(jù)產(chǎn)業(yè)總體規(guī)模為4700億元人民幣,同比增長30%;2017年大數(shù)據(jù)核心產(chǎn)業(yè)規(guī)模236億元人民幣,增速達到40.5%,預計2018-2020年增速將保持在30%以上”,具報告指出接近2/3的企業(yè)已經(jīng)成立了相關的數(shù)據(jù)分析部門,近40%的企業(yè)已經(jīng)應用了大數(shù)據(jù)??梢钥闯龃髷?shù)據(jù)的技術與應用已經(jīng)深入到我們的社會生活中。隨著大數(shù)據(jù)技術在各行業(yè)的應用,對大數(shù)據(jù)技術人才的需求也增長迅速,大數(shù)據(jù)方向的職業(yè)前景普遍看好,然而掌握大數(shù)據(jù)分析和挖掘技術的人才稀缺,因此培養(yǎng)有應用能力、創(chuàng)新精神的合格的大數(shù)據(jù)分析和挖掘人才成為緊迫的問題。
一、大數(shù)據(jù)時代下對數(shù)據(jù)挖掘人才培養(yǎng)的特點
(一)多學科交叉。數(shù)據(jù)挖掘是一門多學科交叉的課程,涉及到的學科有:數(shù)學、統(tǒng)計學、計算機科學。需要學生掌握統(tǒng)計分析的理論和方法、數(shù)學建模和計算機編程的能力、數(shù)據(jù)的收集、存儲和處理的能力。大部分的企業(yè)要求至少熟練掌握一種編程語言,如Java,C++,Python或R語言;至少掌握一種數(shù)據(jù)庫技術,如MySql、Oracle、SQLServer等。由于大數(shù)據(jù)時代數(shù)據(jù)挖掘是多學科、多種應用技術的融合,因此給人才培養(yǎng)提出了新的要求,如何將各學科和技術有機的融合到課程中,如何讓學生將各學科的內(nèi)容應用到數(shù)據(jù)挖掘的理論和實踐當中。(二)大數(shù)據(jù)時代需要應用型人才。大數(shù)據(jù)相關技術目前正處在落地應用的重要階段,與大數(shù)據(jù)研發(fā)初期需要大量的中高端人才不同,在落地應用階段則需要大量的應用型人才,這些應用型人才需要把大數(shù)據(jù)技術落地到廣大的傳統(tǒng)行業(yè)中。大數(shù)據(jù)人才培養(yǎng)需要有真實的大數(shù)據(jù)環(huán)境,在高校的傳統(tǒng)培養(yǎng)模式下,人才培養(yǎng)過程缺少在真實的大數(shù)據(jù)環(huán)境下的實踐,這正是當前大數(shù)據(jù)人才培養(yǎng)缺少的環(huán)節(jié)。(三)大數(shù)據(jù)教育要結合行業(yè)特征。未來隨著大數(shù)據(jù)與傳統(tǒng)行業(yè)的結合不斷深入,大數(shù)據(jù)教育將進一步結合具體的行業(yè)特征,優(yōu)秀的數(shù)據(jù)分析人才不僅要有扎實的理論基礎,還要熟悉相關行業(yè)和相關業(yè)務的需求。而目前,高校培養(yǎng)的學生以理論教學為主,注重課堂教學,在工程實踐方面非常缺乏,缺少相關的工程項目經(jīng)驗。而具備行業(yè)背景知識的大數(shù)據(jù)人才將受到企業(yè)的歡迎,因為行業(yè)知識將是大數(shù)據(jù)落地應用的重要環(huán)節(jié)。(四)教學模式需要改變。大數(shù)據(jù)時代的數(shù)據(jù)分析與挖掘需要學生具有強的動手能力,對數(shù)據(jù)的整理分析能力,對數(shù)據(jù)挖掘問題的分析能力,數(shù)據(jù)挖掘建模的能力,模型評價和應用的能力,這些能力的培養(yǎng)都離不開實踐教學,而現(xiàn)在主要采用的教學模式還是以課堂和教師為中心的教學模式,無法調(diào)動學生的學習積極性,無法促進學生自主學習能力的培養(yǎng)。如何將理論學習和實踐學習有機的融合在一起,而不是教學過程中兩個分開的部分,需要在教學改革中進一步的想辦法解決。
二、數(shù)據(jù)挖掘實踐教學探索
大數(shù)據(jù)時代的數(shù)據(jù)挖掘,在人才培養(yǎng)方面,應該以培養(yǎng)學生掌握應用數(shù)據(jù)挖掘算法解決真實數(shù)據(jù)分析任務為主,強調(diào)在課程建設中,重視數(shù)據(jù)挖掘實踐教學,以實踐教學帶動理論教學,通過引入實際問題,將學生直接代入到真實的數(shù)據(jù)挖掘分析任務中,激發(fā)學生的學習興趣。(一)教學計劃。數(shù)據(jù)挖掘不僅實踐性強,而且還是一門多個學科交叉的課程。開設該課程之前需要開設的課程有:高等數(shù)學、概率論與數(shù)理統(tǒng)計、多元統(tǒng)計學、數(shù)據(jù)庫原理、數(shù)據(jù)結構、編程語言(C++或Java或Python)等課程。我院開設的數(shù)據(jù)挖掘課程,總課時68課時,理論課學時34學時,實驗課學時34學時,所有課程全部安排在機房上課。為了調(diào)動學生的學習動力和學習積極性,促進學生自主學習和協(xié)作學習,本課程采用混合教學方式,基于超星泛雅網(wǎng)絡教學平臺和手機學習通(APP)實現(xiàn)混合教學方式。課程的開展主要分二個部分:一,設置課前學習任務單,需要學生在課前完成觀看知識點視頻,章節(jié)測試和網(wǎng)上討論的內(nèi)容;二,翻轉課堂,在課堂教學過程中,主要完成知識的內(nèi)化和對算法分析和評價內(nèi)容,采用小組討論,課堂練習,實驗報告,小組展示,提問等方式。最后提交一份實驗報告,實驗報告中布置一份真實的數(shù)據(jù)挖掘問題。需要學生通過所學的數(shù)據(jù)挖掘算法給出具體的求解過程,按數(shù)據(jù)挖掘的基本流程完成一個真實問題的數(shù)據(jù)挖掘過程。教學章節(jié)安排如表1。(二)建設網(wǎng)上教學資源,充分利用信息化教學手段。利用“互聯(lián)網(wǎng)+”的教學方式,建設網(wǎng)上教學資源,采用混合學習的方式,在線教學平臺,提供豐富的教學資源,如:教學視頻、課程講義、章節(jié)測試、拓展資料、答疑討論等。由于數(shù)據(jù)挖掘實踐主要應用python語言,而學生普遍對python語言不是很熟悉,但前期課程中已經(jīng)開設了Java或C++編程語言設計的課程,學生已經(jīng)有了一定程序設計基礎,因此很適合通過在線學習的方式快速了解和掌握python語言的基礎語法。因此課程的第一章python基礎語法和第二章pandas數(shù)據(jù)分析,開展網(wǎng)上教學的方式,將python基礎語法和pandas庫的教學視頻放在網(wǎng)絡課程中,方便學生用課下時間,自己安排時間學習,而且可以反復觀看。而且通過網(wǎng)上討論和答疑及時發(fā)現(xiàn)學生學習中遇到的問題和不足,接下來在課堂教學過程進行補充。(三)采用小組協(xié)作學習和項目式學習的教學模式。由于采用了混合學習的教學方式,以學生為中心,課堂上可以給學生充分的師生互動和生生互動時間,完成學生對知識的內(nèi)化過程,而此過程主要采用的小組協(xié)作學習的實踐教學方式。在課堂實驗過程中,一般由3名學生組成一個學習小組,由教師提出具體問題和要求,通過小組討論、互相協(xié)作共同完成實驗內(nèi)容,最后將討論結果提交到網(wǎng)絡教學平臺,部分小組進行成果展示和問題答疑。每章設置由真實問題背景的數(shù)據(jù)挖掘問題,采用項目式學習的教學模式,教師提出實驗的問題和挖掘目標要求,由學生根據(jù)實驗問題和目標,安裝數(shù)據(jù)挖掘的基本過程進行實驗,包括:數(shù)據(jù)收集,數(shù)據(jù)探索,數(shù)據(jù)預處理,模型的建立和訓練,結果分析等,讓學生每次實驗都完成一次小型的數(shù)據(jù)挖掘任務,強化數(shù)據(jù)挖掘各個步驟的工作和要求。在實驗過程中可以通過網(wǎng)絡教學平臺進行交流和答疑。(四)通過實踐教學促進算法理論的學習數(shù)據(jù)挖掘的算法理論非常豐富,而往往學生對于枯燥難懂的理論知識望而卻步,因此我們采用在具體的案例分析和實踐中設計一些問題,由這些問題引導學生進一步探究算法的理論,并對各種算法進行評價。由于在實踐中遇到了問題,所以使學生自覺的去對算法理論進行更深入的學習和研究,同時有利于培養(yǎng)學生的創(chuàng)新思維和解決問題的能力。如在講授決策樹算法時,大部分學生關注決策樹的生成過程,如ID3算法的步驟、數(shù)據(jù)集信息熵的計算、屬性的信息增益的計算等,而往往忽視算法對數(shù)據(jù)類型的要求,對算法的一些細節(jié)沒有注意。因此設計了一個“銀行產(chǎn)品營銷”案例,有部分學生沒有關注數(shù)據(jù)類型的問題,直接使用余額(balance)這個連續(xù)屬性進行建模,得到了一顆奇怪的決策樹。然后展開小組討論,引導學生在建立決策樹模型中如何處理連續(xù)變量。通過具體的案例實踐,在問題中的分析、解決過程中,熟悉和掌握算法,培養(yǎng)了學生在實踐中分析、解決問題的能力。(五)考核評價的探索傳統(tǒng)的課程考核方式以期末考試和平均成績?yōu)橹?,然而一張試卷無法體現(xiàn)學生掌握和應用知識的水平,更無法體現(xiàn)是否掌握了分析和解決問題的能力。因此我們改變傳統(tǒng)的課程考核方式,首先針對數(shù)據(jù)挖掘課程的特點,采用期末課程設計的方式,要求將本學期學習的數(shù)據(jù)挖掘算法(如,knn,決策樹,支持向量機,聚類分析,關聯(lián)規(guī)則分析等算法)應用到某個領域,對該領域的某個問題進行數(shù)據(jù)分析和挖掘。數(shù)據(jù)可以是公開的數(shù)據(jù)集,也可以是網(wǎng)上自己爬取的數(shù)據(jù)等。要求所選問題有實際應用的背景,有具體的分析步驟和算法程序,以數(shù)據(jù)挖掘分析報告的形式提交作品。其次將課程成績分為三個主要部分:期末課程設計占總成績40%;每次是實驗報告成績占總成績的30%;網(wǎng)上學習和課堂討論與展示占總成績的30%。在成績的組成中,實踐教學成績的比例占了70%,突出考核學生實際應用數(shù)據(jù)挖掘算法的能力、解決實際問題的能力,改變傳統(tǒng)的一張卷子評價學生的方式,讓考核能夠真正體現(xiàn)學生實際應用能力??己朔绞降霓D變,也帶動了學生學習重心的轉變,學生開始重視每次實驗報告的完成,這樣將傳統(tǒng)的一次考核,變成了在平時多次的考核。使學生把功夫下在平時,而不是只是期末考試前幾天才用心學習。
三、教學效果和反思
對信息與計算科學專業(yè)一個學期的實踐教學改革來看,通過學期末的問卷調(diào)查得到了一些反饋情況,課程總體滿意率達91%;有81%的學生認同“課程開展的實踐教學讓我的自學能力有所提升;”在哪些教學資源和方式對你學習幫助較大中85%學生選擇了“完成實驗報告”,80%的學生選擇了網(wǎng)絡視頻和章節(jié)測試的內(nèi)容。問卷結果顯示學生對本次實踐教學的改革比較適應,提高了他們應用知識的能力。部分同學利用課余時間參加數(shù)據(jù)挖掘競賽,如kaggle,DataCase,“泰迪杯”等,并取得了多項一等獎。但是在教學過程中也反應出了一些問題。如學生普遍對Python語言掌握的情況不好,在課程初期學生反應實驗難度過大,希望能夠講解更多python語言編程的內(nèi)容。在實踐教學過程中,有部分學生基礎不好,自主學習能力不足,實踐內(nèi)容對其難度過大,而出現(xiàn)學習倦怠情況,還有學生過于依賴小組或其他同學沒有充分的調(diào)動學習積極性。因此在接下來的教學中,我們將繼續(xù)探索更適合的實踐教學方案,為學生提供更加個性化的教學實踐資源,使不同基礎和特點的學生都能夠積極參與到實踐教學中。
四、結束語
數(shù)據(jù)挖掘課程內(nèi)容豐富、涉及的學科多、發(fā)展更新快,要求學生有較高的應用能力,因此傳統(tǒng)的教學方式無法滿足要求。在數(shù)據(jù)挖掘實踐教學方面,為了適應大數(shù)據(jù)時代對應用型數(shù)據(jù)分析和挖掘人才的需求,本文基于混合學習,項目學習,小組學習等實踐教學方式,讓學生在具體的實際問題的分析和解決中學習,通過不同方式的實踐教學,使學生能夠更好的掌握基礎理論知識,并能將理論與實踐緊密聯(lián)系起來,提高解決實際數(shù)據(jù)挖掘問題的能力。
參考文獻:
[1]姚力,朱龍飛,崔晨.大數(shù)據(jù)時代數(shù)據(jù)科學課程建設與人才培養(yǎng)的探索[M].計算機時代,2018(11):87-93.
[2]JiaweiHan,MichelineKamber,JianPei,等.數(shù)據(jù)挖掘概念與技術(第3版)[M].機械工業(yè)出版社,2012.
[3]施達,楊晉浩,張志強.數(shù)據(jù)工程類本科人才培養(yǎng)體系的探索與實踐[J].成都大學學報(社會科學版),2017(1):112-117.
[4]譚磊.大數(shù)據(jù)挖掘[M].電子工業(yè)出版社,2013.[5]張燕.大數(shù)據(jù)背景下的數(shù)據(jù)挖掘課程教學新思考[J].計算機時代,2014(4):59-61.
[6]王青梅,趙革.國內(nèi)外案例教學法研究綜述[J].寧波大學學報(教育科學版),2009,31(4):7-11.
作者:劉波 蔡燕斯 鐘少丹 單位:韓山師范學院