大數(shù)據(jù)知識管理與服務(wù)平臺建設(shè)研究
時間:2022-09-23 10:04:30
導(dǎo)語:大數(shù)據(jù)知識管理與服務(wù)平臺建設(shè)研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:信息科技發(fā)展水平是國家的核心競爭力,建設(shè)以知識服務(wù)為目標(biāo)的科技資源已成為國家軟實力的重要標(biāo)志。本文以中國科協(xié)數(shù)據(jù)中心的大數(shù)據(jù)為支撐,圍繞計算機科學(xué)與人工智能領(lǐng)域的前沿方向、研究機構(gòu)、高端人才、科技成果等科技管理與服務(wù)要素展開討論,提出了構(gòu)建大規(guī)模實體要素之間的知識網(wǎng)絡(luò)圖譜,形成立體全景科技態(tài)勢感知服務(wù)能力,為宏觀科技管理與決策提供支持服務(wù)的具體設(shè)想。
關(guān)鍵詞:大數(shù)據(jù);知識管理與服務(wù);平臺
1背景綜述
信息科技發(fā)展水平是國家的核心競爭力,建設(shè)以知識服務(wù)為目標(biāo)的科技資源已成為國家軟實力的重要標(biāo)志。當(dāng)今世界,各國科技資源在影響區(qū)域決策、引導(dǎo)社會輿論、服務(wù)公共事務(wù)、體現(xiàn)國家軟實力等方面發(fā)揮著重要作用。高端科技資源建設(shè),不僅是國家進行宏觀決策的有力支撐,也是推進國家治理體系和治理能力現(xiàn)代化的重要內(nèi)容,加快以計算機科學(xué)與人工智能為代表的科技領(lǐng)域知識管理與服務(wù)能力建設(shè),是科技強國的緊迫需求。在產(chǎn)業(yè)數(shù)字化發(fā)展的背景下,國家大力支持大數(shù)據(jù)融合應(yīng)用在產(chǎn)業(yè)創(chuàng)新發(fā)展中發(fā)揮更大作用。我國國家發(fā)展和改革委員會于2020年12月23日的《關(guān)于加快構(gòu)建全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系的指導(dǎo)意見》中提出,要加強全國一體化大數(shù)據(jù)中心頂層設(shè)計,以形成行業(yè)數(shù)據(jù)大腦、城市數(shù)據(jù)大腦為發(fā)展目標(biāo),利用政務(wù)大數(shù)據(jù)、工業(yè)大數(shù)據(jù)、城市大數(shù)據(jù)、大數(shù)據(jù)公共服務(wù)、行業(yè)數(shù)字轉(zhuǎn)型五點措施深化大數(shù)據(jù)融合應(yīng)用創(chuàng)新,提升政務(wù)大數(shù)據(jù)綜合治理能力,加強大數(shù)據(jù)公共服務(wù)支撐,推動行業(yè)數(shù)字化轉(zhuǎn)型升級,推進工業(yè)大數(shù)據(jù)平臺建設(shè),加快城市大數(shù)據(jù)創(chuàng)新應(yīng)用[1]。中國科學(xué)技術(shù)協(xié)會(以下簡稱“中國科協(xié)”或者“科協(xié)”)是中國科學(xué)技術(shù)工作者的群眾組織,是中國共產(chǎn)黨領(lǐng)導(dǎo)下的人民團體,是黨和政府聯(lián)系科學(xué)技術(shù)工作者的橋梁和紐帶,是國家推動科學(xué)技術(shù)事業(yè)發(fā)展的重要力量。匯聚科協(xié)系統(tǒng)數(shù)據(jù)資源的科協(xié)數(shù)據(jù)中心是“智慧科協(xié)”建設(shè)的核心和基石,是驅(qū)動“三駕馬車”高速發(fā)展的重要支撐[2]。匯聚科協(xié)內(nèi)外部數(shù)據(jù),尤其是外部數(shù)據(jù),引領(lǐng)數(shù)據(jù)資源的有效治理和共享融合,開展以數(shù)據(jù)的深度挖掘與融合應(yīng)用為特征的智能化應(yīng)用,打造科技行業(yè)動態(tài)感知、互聯(lián)、智能的“智慧科協(xié)”,是中國科協(xié)信息化建設(shè)的重要內(nèi)容。中國科協(xié)信息中心于2018年年初啟動了中國科協(xié)數(shù)據(jù)中心建設(shè),目前已建成集數(shù)據(jù)采集、存儲、加工分析和展示等功能于一體的數(shù)據(jù)中心技術(shù)平臺,匯聚了中國科協(xié)、全國學(xué)會和地方科協(xié)各組織節(jié)點的數(shù)據(jù)資源,一定程度上解決了數(shù)據(jù)分散、數(shù)據(jù)標(biāo)準(zhǔn)不一致、數(shù)據(jù)共享互通難等問題。本平臺的建設(shè)是在此基礎(chǔ)上,圍繞計算機科學(xué)與人工智能領(lǐng)域的前沿方向、研究機構(gòu)、高端人才、科技成果等科技管理與服務(wù)要素,構(gòu)建大規(guī)模實體要素之間的知識網(wǎng)絡(luò)圖譜,形成立體全景科技態(tài)勢感知服務(wù)能力。
2建設(shè)目標(biāo)
大數(shù)據(jù)知識管理與服務(wù)平臺的建設(shè)目標(biāo)是依托中國科協(xié)學(xué)科門類齊全、領(lǐng)域交叉充分、智力資源密集的獨特優(yōu)勢,聚焦科技領(lǐng)域,堅持問題導(dǎo)向,以全球視野動態(tài)匯聚、融合關(guān)聯(lián)中國科協(xié)內(nèi)外資源,構(gòu)建面向全球科技領(lǐng)域的覆蓋面廣、權(quán)威性高、實時性強的科技大數(shù)據(jù)資源池,形成“科技領(lǐng)域—專家人才—科研成果”的科技資源知識圖譜,建成“研究興趣/學(xué)術(shù)影響/研究方向”等立體、多維、高精度的專家畫像標(biāo)簽體系,建成計算機科學(xué)與人工智能科技領(lǐng)域研究熱點、趨勢、人才態(tài)勢感知服務(wù),利用復(fù)雜網(wǎng)絡(luò)關(guān)系分析、機器學(xué)習(xí)等挖掘技術(shù),為宏觀科技管理與決策提供支持服務(wù)。
3設(shè)計思路與主要功能
平臺的設(shè)計思路是圍繞建設(shè)智慧科協(xié)大數(shù)據(jù)知識管理與服務(wù)平臺的總體目標(biāo),以計算機科學(xué)、人工智能兩個重點領(lǐng)域為需求牽引,建設(shè)可擴展的科技資源網(wǎng)絡(luò)關(guān)系圖譜、面向領(lǐng)域的科技態(tài)勢感知等服務(wù)。平臺總體設(shè)計架構(gòu)如圖1所示。平臺的主要功能包括大數(shù)據(jù)知識管理與服務(wù)平臺、計算機科學(xué)與人工智能科技資源池、科技資源知識圖譜處理與融合和科技態(tài)勢感知服務(wù)四個方面。
3.1大數(shù)據(jù)知識管理與服務(wù)平臺
大數(shù)據(jù)知識管理與服務(wù)平臺主要基于已有數(shù)據(jù)基礎(chǔ)和技術(shù)基礎(chǔ),快速開發(fā)、定制計算機科學(xué)與人工智能大數(shù)據(jù)知識管理與服務(wù)平臺(以下簡稱“平臺”),針對科協(xié)實際需求,重點面向計算機科學(xué)與人工智能科學(xué)兩個典型的學(xué)科,實現(xiàn)包括知識查詢、合作分析、網(wǎng)絡(luò)挖掘、熱點趨勢等功能的定制性研發(fā)。3.1.1知識查詢知識查詢包括人才查詢、機構(gòu)查詢、學(xué)會查詢和成果查詢四大類。其中成果查詢又分為國內(nèi)期刊查詢、國內(nèi)論文查詢、國際論文查詢、專利查詢四大類。針對查詢的人才、機構(gòu)、學(xué)會、期刊、國內(nèi)論文、國際論文,點擊對應(yīng)的檢索結(jié)果會提供對應(yīng)的人才畫像、機構(gòu)畫像、學(xué)會畫像、期刊詳情、國內(nèi)論文詳情、國際論文詳情等信息。3.1.2合作分析合作分析是指在科技網(wǎng)絡(luò)圖譜中,以指定兩個實體作為輸入,通過一些指標(biāo)要素包括成果—論文、成果—標(biāo)準(zhǔn)、成果—專利、成果—獎勵合作情況進行科技實體之間合作關(guān)系的網(wǎng)絡(luò)分析,從而可以獲得兩個指定實體間的合作分析圖譜。3.1.3網(wǎng)絡(luò)挖掘網(wǎng)絡(luò)挖掘是指通過查詢發(fā)現(xiàn)指定科技人才之間或指定科技機構(gòu)之間基于知識網(wǎng)絡(luò)的直接關(guān)聯(lián)網(wǎng)絡(luò)信息,并用可視化網(wǎng)絡(luò)圖譜形式展示出來。在查詢中,首先指定科技人才的姓名或科技機構(gòu)的名稱,同時指定查詢條件,如時間范圍等,查詢當(dāng)前指定科技實體與其他同類科技實體及相關(guān)各類成果,組成科技實體與各類成果的網(wǎng)絡(luò)圖譜。網(wǎng)絡(luò)圖譜中科技人才、科技機構(gòu)、科技文獻等都可鏈接到該實體知識主頁。3.1.4熱點趨勢科技文獻代表著科學(xué)研究的最新前沿,科技文獻中的關(guān)鍵詞在一定程度上可以反映一段時間內(nèi)科技發(fā)展的熱點方向。在不同學(xué)科領(lǐng)域內(nèi),學(xué)術(shù)研究熱點狀況與熱點發(fā)展趨勢都是科技人員、科研管理部門普遍關(guān)注的焦點。因此,研究指定學(xué)科領(lǐng)域內(nèi)的研究熱點趨勢,分析指定熱詞的歷史研究趨勢,并對未來某段時間某一領(lǐng)域的研究熱點進行預(yù)測,對科學(xué)研究及科技管理具有非常重要的參考價值。
3.2計算機科學(xué)與人工智能科技資源池
計算機科學(xué)與人工智能科技資源池(以下簡稱“資源池”)是平臺所有數(shù)據(jù)資源的綜合集成,是查詢、統(tǒng)計、關(guān)聯(lián)、圖譜及可視化等各類功能的數(shù)據(jù)基石。資源池實現(xiàn)了各來源科技數(shù)據(jù)資源的導(dǎo)入和集成管理。資源池支持中國科協(xié)現(xiàn)有業(yè)務(wù)數(shù)據(jù)資源導(dǎo)入并支持開放數(shù)據(jù)的獲取。主要導(dǎo)入的科協(xié)數(shù)據(jù)包括學(xué)會基本信息、學(xué)會LOGO圖片數(shù)據(jù)、學(xué)會人員數(shù)據(jù)、青科獎及青年女科學(xué)家等各類人才數(shù)據(jù)。資源池中的資源種類覆蓋計算機科學(xué)與人工智能領(lǐng)域中高端人才基本信息、科技組織(企業(yè)組織、研究機構(gòu)、學(xué)會等)、研究成果(論文、專利、標(biāo)準(zhǔn)、專著)等信息。其中,中高端人才覆蓋中國科學(xué)院院士、中國工程院院士、杰青、優(yōu)青、青年女科學(xué)家、中科院“百人計劃”等。
3.3科技資源知識圖譜處理與融合
科技資源知識圖譜處理與融合以科技人才、科技成果、組織機構(gòu)為核心,結(jié)合基于規(guī)則的方法和人工智能方法,實現(xiàn)數(shù)據(jù)的高效消歧與融合,構(gòu)建基于科技大數(shù)據(jù)的多維統(tǒng)計數(shù)據(jù)倉庫,建成面向科技服務(wù)的知識圖譜。
3.4科技態(tài)勢感知服務(wù)
基于統(tǒng)一的邏輯數(shù)據(jù)視圖,面向科技領(lǐng)域發(fā)展態(tài)勢,梳理態(tài)勢感知決策支持的指標(biāo)體系,研究能夠反映高端科技態(tài)勢感知的模型,如高端人才合作網(wǎng)絡(luò)圖譜、研究熱點分析、科研專家畫像、影響力分析等。運用大數(shù)據(jù)、可視化等技術(shù)構(gòu)建動態(tài)的態(tài)勢感知決策支持系統(tǒng),從而更客觀、更科學(xué)地反映領(lǐng)域的發(fā)展態(tài)勢與水平,為科技管理與服務(wù)提供輔助決策??萍紤B(tài)勢感知服務(wù)以高端科技知識服務(wù)為核心,建立機構(gòu)、人才、成果等的態(tài)勢感知服務(wù),為計算機科學(xué)相關(guān)領(lǐng)域的研究者及科技管理者提供更全面的領(lǐng)域知識和更具針對性的學(xué)科領(lǐng)域和合作者信息,為科技人員與科技管理者提供很好的信息獲取服務(wù)和幫助。建立科技態(tài)勢感知算法庫,以大數(shù)據(jù)中心建成的數(shù)據(jù)倉庫為數(shù)據(jù)來源,利用其提供的多維數(shù)據(jù)統(tǒng)計結(jié)果和面向科技服務(wù)的知識圖譜進行分析輸入,以對科技態(tài)勢感知的決策支持指標(biāo)進行分析。
4總結(jié)
為進一步強化“智慧科協(xié)”建設(shè)示范落地工作,發(fā)揮第二引擎的支撐作用,中國科協(xié)信息中心結(jié)合我國大數(shù)據(jù)、人工智能、新能源、區(qū)塊鏈等新一代信息技術(shù)的發(fā)展動態(tài),聚焦中國科協(xié)、全國學(xué)會核心業(yè)務(wù)需求的痛點,依據(jù)“盤活數(shù)據(jù)資產(chǎn)、發(fā)揮數(shù)據(jù)效能,科學(xué)性、可行性、創(chuàng)新性、前瞻性相結(jié)合”的原則,統(tǒng)籌開展了大數(shù)據(jù)知識管理與服務(wù)平臺建設(shè)工作,嘗試在科技人才精準(zhǔn)服務(wù)、科技人才成長規(guī)律以及科技人才區(qū)域流動等方面提供大數(shù)據(jù)決策支撐服務(wù)。截至2020年年底,平臺站在全球人才制高點,從全球、全國兩個視角匯聚各類實體數(shù)據(jù)資源,共設(shè)計了數(shù)據(jù)實體14大類,數(shù)據(jù)資源池實體數(shù)據(jù)總量超過1.7億;以人、機構(gòu)、成果為紐帶和數(shù)據(jù)組織核心,對所有類型實體數(shù)據(jù)資源進行全面融合,形成融會貫通的大規(guī)模關(guān)系網(wǎng)絡(luò),并基于此實現(xiàn)了多類深層知識分析挖掘,系統(tǒng)邊(關(guān)系)數(shù)據(jù)量超過17億。在一定程度上,實現(xiàn)了科協(xié)現(xiàn)有業(yè)務(wù)數(shù)據(jù)資源與互聯(lián)網(wǎng)數(shù)據(jù)資源的消歧與融合,在資源共享、業(yè)務(wù)協(xié)同、決策支持等方面取得了一定效果。數(shù)據(jù)作為生產(chǎn)要素的屬性表明,其未來必將走向市場。數(shù)據(jù)應(yīng)用范圍將從傳統(tǒng)的組織內(nèi)部應(yīng)用為主,發(fā)展為支撐內(nèi)部和服務(wù)外部并重,數(shù)據(jù)資產(chǎn)應(yīng)用和服務(wù)范圍的擴大,將成為組織戰(zhàn)略發(fā)展的一部分。今后一段時期,組織能否樹立數(shù)據(jù)作為生產(chǎn)要素的戰(zhàn)略意識,挖掘和利用數(shù)據(jù)價值、盤活數(shù)據(jù)資源,實現(xiàn)數(shù)據(jù)資產(chǎn)保值到增值,決定了組織能否邁出生產(chǎn)要素到生產(chǎn)力轉(zhuǎn)化的重要一步。
參考文獻:
[1]杜小勇,盧衛(wèi),張峰.大數(shù)據(jù)管理系統(tǒng)的歷史、現(xiàn)狀與未來[J].軟件學(xué)報,2019,30(1):127-141.
[2]馮新翎,何勝,熊太純,等.“科學(xué)知識圖譜”與“Google知識圖譜”比較分析:基于知識管理理論視角[J].情報雜志,2017,36(1):149-153.
作者:李森 單位:中國科協(xié)信息中心