數(shù)據(jù)挖掘在計算機網(wǎng)絡(luò)病毒的應用
時間:2022-02-20 10:30:25
導語:數(shù)據(jù)挖掘在計算機網(wǎng)絡(luò)病毒的應用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:在互聯(lián)網(wǎng)時代下,人們的生活、生產(chǎn)方式都出現(xiàn)了很大改變。雖然,計算機網(wǎng)絡(luò)能夠為人們提供大量的信息使用,但其也有著很多安全問題的存在。最為突出的就是網(wǎng)絡(luò)病毒威脅,一旦受到網(wǎng)絡(luò)病毒攻擊,就可能導致人們的重要信息被泄露,出現(xiàn)經(jīng)濟上不可逆的損失。因此,本文重點論述了計算機網(wǎng)絡(luò)病毒防范中數(shù)據(jù)挖掘技術(shù)的相關(guān)運用,僅供參考。
關(guān)鍵詞:計算機網(wǎng)絡(luò);病毒防范;數(shù)據(jù)挖掘技術(shù)
網(wǎng)絡(luò)病毒是一種計算機網(wǎng)絡(luò)中的可執(zhí)行代碼,這類代碼一方面通常是由人進行編寫而成的,有著編寫者的主觀意識表達;另外一方面,則是系統(tǒng)代碼。網(wǎng)絡(luò)病毒通過對主機的感染之后,再借助互聯(lián)網(wǎng)進行全面?zhèn)鞑ィ瑥亩鴮ζ渌嬎銠C甚至是整個網(wǎng)絡(luò)進行惡意攻擊。計算機網(wǎng)絡(luò)受到病毒入侵之后,其中的信息可能會被盜取,進而造成不可預計的經(jīng)濟損失。但由于計算機網(wǎng)絡(luò)所具有的開放性,在受到病毒攻擊后,控制難度大,倘若防范不夠及時,那么網(wǎng)絡(luò)病毒往往會形成大范圍傳播的趨勢,并導致網(wǎng)絡(luò)系統(tǒng)全面失控以及癱瘓,并給企業(yè)、個人,甚至是國家形成巨大影響。正因如此,計算機網(wǎng)絡(luò)系統(tǒng)的安全,已經(jīng)被上升到國家發(fā)展的高度。唯有在一個安全的網(wǎng)絡(luò)環(huán)境下,廣大用戶才可以對網(wǎng)絡(luò)進行更好的應用與體驗。因此,研究計算機網(wǎng)絡(luò)病毒防范技術(shù)具有一定的現(xiàn)實意義。
1網(wǎng)絡(luò)病毒的特點分析
結(jié)合當前現(xiàn)有的相關(guān)文獻資料,網(wǎng)絡(luò)病毒主要有如下特點:(1)針對性最早時候的網(wǎng)絡(luò)病毒較為固化,其目的只是為了干擾程序員編寫程序,但當前的網(wǎng)絡(luò)病毒目的愈加多元,且功能性也更強[1]。同時,隨著病毒開發(fā)技術(shù)的日益提升,關(guān)于網(wǎng)絡(luò)病毒的設(shè)計和開發(fā)的目的性也愈加明確,入侵和攻擊呈現(xiàn)出更多攻擊性。(2)多樣性即便網(wǎng)絡(luò)病毒開發(fā)和構(gòu)成都不復雜,但其僅用幾個程序指令,就能夠衍生出其他的一些病毒。同時,當前很多程序員都有著較高水平,很容易就編寫出一些病毒程序。此外,病毒繁殖速度快,且有著很多種類,這些都使其危害性增加。(3)多元化網(wǎng)絡(luò)病毒傳播方式十分多元化,尤其是網(wǎng)絡(luò)病毒技術(shù)的不斷提高,這種多元化更為明顯。比如,我們?nèi)粘K龅降南到y(tǒng)漏洞,病毒程序通過識別存在漏洞的主機,就能夠同時入侵并控制住對方。同時,病毒能夠針對性的掃描文件夾,并持續(xù)復制更多的病毒對網(wǎng)絡(luò)系統(tǒng)展開入侵。
2相關(guān)概念以及基本構(gòu)成內(nèi)容概述
2.1關(guān)于數(shù)據(jù)挖掘技術(shù)的概念解析。數(shù)據(jù)挖掘技術(shù)具體是采用算法搜索隱藏在大量數(shù)據(jù)中的未知的,并且具有價值的知識與信息的過程。它涉及許多知識,主要有模糊識別、機器學習、情報檢索、統(tǒng)計學、計算機技術(shù)等。在進行挖掘的時候,則分為了數(shù)據(jù)準備、找尋數(shù)據(jù)規(guī)律、表示數(shù)據(jù)規(guī)律這三個步驟。在確定數(shù)據(jù)挖掘后,就會啟動相關(guān)引擎,對需要挖掘的數(shù)據(jù)進行搜索,將其中數(shù)據(jù)的規(guī)律找出[2]。完整的數(shù)據(jù)挖掘包含了許多工作,數(shù)據(jù)的預處理是重點所在,其中主要包含了數(shù)據(jù)的凈化、鏈接數(shù)據(jù)表、變量整合、格式轉(zhuǎn)換等。唯有將數(shù)據(jù)的預處理工作做好,才可為后續(xù)分析數(shù)據(jù)奠定良好基礎(chǔ)。2.2基本構(gòu)成內(nèi)容概述。數(shù)據(jù)挖掘技術(shù)具體由這些內(nèi)容構(gòu)成,具體如下:(1)數(shù)據(jù)源模塊以抓包為基礎(chǔ)的數(shù)據(jù)源模塊,主要是依托網(wǎng)絡(luò)來獲取相關(guān)數(shù)據(jù)包。通常來講,在數(shù)據(jù)源模塊之中有著初始的網(wǎng)絡(luò)數(shù)據(jù)包,即:數(shù)據(jù)庫信息結(jié)構(gòu)。在抓包程序的支持下,能夠不斷虎丘對應的數(shù)據(jù)包,以此為基礎(chǔ),再將數(shù)據(jù)朝著對應的處理模塊進行有效傳輸。(2)預處理模塊在數(shù)據(jù)源模塊的支持下,可將數(shù)據(jù)成功傳輸?shù)筋A處理模塊之中,然后可以對模塊進行預處理。這個過程也可以被理解成為對數(shù)據(jù)進行初始挖掘,具體是通過分析與變換,預處理模塊能夠?qū)⒅暗臄?shù)據(jù)轉(zhuǎn)為有著識別性特點的可處理數(shù)據(jù),進而促進后續(xù)數(shù)據(jù)處理的有序進行。再將數(shù)據(jù)進行預處理之后,有利于全面提升有關(guān)數(shù)據(jù)的分析效率與質(zhì)量,從而對數(shù)據(jù)進行更好的處理。(3)規(guī)則庫模塊該模塊的具體作用是將對應的規(guī)則集進行存儲。在計算機受到網(wǎng)絡(luò)病毒攻擊的時候,通過數(shù)據(jù)挖掘、聚類分析、特征的識別,就可以實現(xiàn)這些規(guī)則集的獲取。在數(shù)據(jù)挖掘的時候,通過對規(guī)則集所記錄的計算機網(wǎng)絡(luò)病毒信息的記錄,就可以有效分析網(wǎng)絡(luò)之中所潛在的病毒,進而實現(xiàn)病毒的有效防范[3]。同時,規(guī)則庫模塊還可針對計算機網(wǎng)絡(luò)病毒進行鑒別。在未標記的數(shù)據(jù)集中運用聚類分析,將數(shù)據(jù)集分為多組數(shù)據(jù),通過各數(shù)據(jù)間存在的差異度,鑒定計算機網(wǎng)絡(luò)病毒。(4)數(shù)據(jù)挖掘模塊。數(shù)據(jù)挖掘模塊,是將相關(guān)數(shù)據(jù)通過運用數(shù)據(jù)挖掘的計算方法進行整合,使之成為事件庫,然后再分析這一事件庫中的數(shù)據(jù)信息,并向決策模塊傳輸最終的分析數(shù)據(jù),做進一步處理。(5)決策模塊。將規(guī)則庫中的相關(guān)規(guī)則和數(shù)據(jù)挖掘的最終結(jié)果進行匹配,是決策模塊的主要作用。倘若經(jīng)過數(shù)據(jù)挖掘之后所得出的結(jié)果與規(guī)則模塊相互匹配,那么就意味著蠕蟲病毒已經(jīng)入侵到數(shù)據(jù)包之中。倘若結(jié)果與規(guī)則模塊未匹配,那么預防模塊通常會有對應的提示,意味著數(shù)據(jù)包之中可能存在的蠕蟲病毒是未知病毒,并在規(guī)則庫中記錄下這一網(wǎng)絡(luò)病毒。
3數(shù)據(jù)挖掘技術(shù)在計算機網(wǎng)絡(luò)病毒防范中的具體運用
(1)分類規(guī)則之所以分類,就是為了把數(shù)據(jù)分門別類,然后利用統(tǒng)計學、機器學習等方法,分類建立模型。(2)關(guān)聯(lián)分析關(guān)聯(lián)分析,主要目的是為了將數(shù)據(jù)庫中存在的關(guān)聯(lián)網(wǎng)找出來,在兩個及以上的變量值中,若有一定的規(guī)律性存在,則表明這些數(shù)據(jù)之間有可能一定的關(guān)聯(lián)關(guān)系存在。借助關(guān)聯(lián)網(wǎng),就可以將整個數(shù)據(jù)庫中的關(guān)系挖掘出來,進而更好將病毒抓到。(3)聚類規(guī)則所謂聚類的規(guī)則,就是先分解與分組不同的數(shù)據(jù)包,進行分組的時候需要將特征相似的數(shù)據(jù)分在一起。借助聚類,可以實現(xiàn)數(shù)據(jù)不同特征的識別,從而將不同數(shù)據(jù)的屬性關(guān)系、分布模式更好呈現(xiàn)出來。(4)異類分析異類分析又被稱之為孤立點分析,其具體作用是對數(shù)據(jù)庫之中所存在的明顯差異進行深入分析,例如,數(shù)據(jù)之間存在巨大的差異,或者是非常突出的異常現(xiàn)象,總之與標準數(shù)據(jù)有很大的出入。而異類分析則主要分析這些內(nèi)容,即:依托孤立點對異常數(shù)據(jù)進行查找以分析,進而將孤立點中的非常規(guī)性結(jié)果找出。在對孤立點進行分析的時候,往往可以挖掘出一些相對于常規(guī)數(shù)據(jù)更加重要的一些數(shù)據(jù),有利于提升計算機網(wǎng)絡(luò)病毒防護的整體能力[4]。(5)序列分析通過序列分析,能夠?qū)㈦S機數(shù)據(jù)中存在的某些病毒數(shù)據(jù)排列規(guī)律找出來,并進行序列模型地構(gòu)建,通過使用數(shù)據(jù)挖掘算法,將出現(xiàn)頻繁的數(shù)據(jù)找出,對其關(guān)聯(lián)性進行分析,以判斷其屬不屬于病毒數(shù)據(jù)序列。實際上,序列分析規(guī)則,就是統(tǒng)計方法的一種。
4提高數(shù)據(jù)挖掘技術(shù)運用成效的建議
一方面,要深入開展數(shù)據(jù)挖掘技術(shù)的理論研究。為了更好加強計算機網(wǎng)絡(luò)病毒的防御力度,就應加強數(shù)據(jù)挖掘技術(shù)的理論研究。要知道任何實踐應用,都離不開理論的有效支撐,數(shù)據(jù)挖掘技術(shù)也是如此,想要最大程度地發(fā)揮數(shù)據(jù)挖掘技術(shù)的應用價值,就應從多個方面進行優(yōu)化。深入開展數(shù)據(jù)挖掘技術(shù)的理論研究,相關(guān)專家學者,就應重視對先進技術(shù)理論的借鑒,不斷進行改進、完善。并且,要加強學術(shù)界和實業(yè)界之間的溝通交流,重視理論和實際的有機結(jié)合,進而形成理論指導實踐的發(fā)展形勢,如此才可實現(xiàn)良性的循環(huán)。另外,要加大力度研究數(shù)據(jù)挖掘技術(shù)和網(wǎng)絡(luò)病毒防范之間的關(guān)系,同時,重視相應病毒防御體系的開發(fā)。另一方面,重視管理軟件廠商的良性發(fā)展。軟件廠商的發(fā)展情況如何,將會直接關(guān)系到數(shù)據(jù)挖掘技術(shù)應用質(zhì)量的提升??陀^而言,國內(nèi)數(shù)據(jù)挖掘技術(shù)的開發(fā)和研發(fā),仍有較長一段路要走,需要進一步加強,當前仍處在初級階段。因此,為了穩(wěn)步促進我國軟件廠商的良好發(fā)展,要積極鼓勵國內(nèi)的軟件廠商加快行業(yè)交流機制的建立,更多對數(shù)據(jù)挖掘技術(shù)的應用經(jīng)驗進行交流。
5結(jié)語
總而言之,在互聯(lián)網(wǎng)時代下,計算機網(wǎng)絡(luò)已經(jīng)深入到人們的生活、生產(chǎn),但網(wǎng)絡(luò)病毒的存在,嚴重影響著人們的正常使用,可能會引發(fā)商業(yè)機密和個人私密信息的泄露等。對此,就需要不斷加強對計算機網(wǎng)絡(luò)病毒的防范、抑制,而通過將數(shù)據(jù)挖掘技術(shù)運用到計算機網(wǎng)絡(luò)病毒防范中,則能使病毒的防范質(zhì)量得以整體提升。所以,對當下的計算機網(wǎng)絡(luò)病毒防范而言,對數(shù)據(jù)挖掘技術(shù)的相關(guān)運用展開探索、總結(jié),有著較強現(xiàn)實意義。希望通過本次對數(shù)據(jù)挖掘技術(shù)的研究分析,能夠為實際問題的解決起到一定積極作用。
參考文獻:
[1]白潔仙.淺析計算機網(wǎng)絡(luò)病毒來源與防范措施[J].江蘇科技信息,2018(24):80-82.
[2]黃慶生.計算機數(shù)據(jù)挖掘技術(shù)的開發(fā)及其應用探究[J].科學技術(shù)創(chuàng)新,2018(11):71-72.
[3]崔科昱.加強計算機網(wǎng)絡(luò)安全防御的策略分析[J].通訊世界,2019,26(03):99-100.
[4]孫福利.大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)與應用[J].電子技術(shù)與軟件工程,2018,123(01):180.
作者:孟祥智 單位:蘭州職業(yè)技術(shù)學院