數(shù)據(jù)價值開發(fā)的校園大數(shù)據(jù)生態(tài)治理研究

時間:2022-06-02 11:28:36

導語:數(shù)據(jù)價值開發(fā)的校園大數(shù)據(jù)生態(tài)治理研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)價值開發(fā)的校園大數(shù)據(jù)生態(tài)治理研究

摘要:挖掘與提升數(shù)據(jù)價值是智慧校園發(fā)展的原動力。智慧校園建設已步入深水區(qū),各高校均已累積了相當數(shù)量的數(shù)據(jù)資產(chǎn)。梳理數(shù)據(jù)資產(chǎn)各要素之間的關系,幫助高校完善數(shù)據(jù)治理生態(tài),可以提升數(shù)據(jù)資產(chǎn)的價值。通過校園大數(shù)據(jù)生態(tài)治理要素研究,構建大數(shù)據(jù)智慧服務平臺,為實現(xiàn)高校數(shù)字化轉(zhuǎn)型、建設高質(zhì)量發(fā)展的智慧校園提供理論支持和決策參考。

關鍵詞:大數(shù)據(jù);數(shù)據(jù)治理;數(shù)據(jù)資產(chǎn);數(shù)據(jù)價值

高校智慧校園經(jīng)過多年建設逐漸步入深水區(qū),由起步階段的煙囪式系統(tǒng)建設、提升階段的集成式系統(tǒng)建設,邁入以校園大數(shù)據(jù)為核心的“智能+”系統(tǒng)建設階段。這個過程所依托的新技術層出不窮,無線定位、人臉識別、態(tài)勢感知、行為分析、深度學習等技術的應用為學校積累了大量不同類型的數(shù)據(jù)。但是,目前校園大數(shù)據(jù)從采集產(chǎn)生,到匯聚清洗,再到存儲查詢,最后到挖掘與應用的整個過程中,最深層次的矛盾是對數(shù)據(jù)的認識、管理、運用的方式和能力與數(shù)字化發(fā)展的要求不匹配,缺乏系統(tǒng)、有效的治理,使得校園大數(shù)據(jù)蘊藏著的巨大價值難以得到體現(xiàn)。因此,亟須深化數(shù)據(jù)治理,釋放數(shù)據(jù)效能,助推學校真正實現(xiàn)數(shù)字化轉(zhuǎn)型。

一、智慧校園數(shù)據(jù)治理現(xiàn)狀

數(shù)據(jù)治理是推動高校治理體系和治理能力現(xiàn)代化的有效抓手。在教育信息化加速發(fā)展的新形勢下,營造安全的環(huán)境,通過數(shù)據(jù)治理實現(xiàn)數(shù)據(jù)的高效利用并提升數(shù)據(jù)價值,已成為教育現(xiàn)代化的底層邏輯和學校高速發(fā)展的動力引擎。

(一)治理依據(jù)

數(shù)據(jù)治理是推動學校治理體系和治理能力現(xiàn)代化的必然要求,是“互聯(lián)網(wǎng)+”教育深度融合的必然要求。要通過有序匯聚高質(zhì)量數(shù)據(jù),最大化釋放數(shù)據(jù)價值,實現(xiàn)治理體系和治理能力現(xiàn)代化,構建系統(tǒng)完備、科學規(guī)范、運行有效的制度體系。數(shù)據(jù)作為智慧校園的基礎,是一種新型的生產(chǎn)要素。2021年,教育部發(fā)布了《高等學校數(shù)字校園建設規(guī)范(試行)》和《職業(yè)院校數(shù)字校園規(guī)范》,均提到“教育信息化過程中產(chǎn)生、使用和積累的各種結構化、半結構化和非結構化數(shù)據(jù)統(tǒng)稱為信息資源”,信息資源在高校數(shù)字校園建設中起到關鍵作用。高校在數(shù)字校園建設中應將信息資源建設放在關鍵位置,逐步形成內(nèi)容完善、數(shù)據(jù)準確、組織有序、廣泛關聯(lián)、更新及時、安全可靠、服務優(yōu)質(zhì)的全域信息資源庫,為學校、師生以及社會公眾提供優(yōu)質(zhì)信息服務。

(二)治理方向

《中國教育現(xiàn)代化2035》提出“統(tǒng)籌建設一體化智能化教學、管理與服務平臺”目標,要求我們在智慧校園建設過程中進一步革新理念、統(tǒng)一認識、放眼未來、大膽創(chuàng)新,將云計算、人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)等高新技術與教育教學深度融合,讓信息技術真正有效融入學校發(fā)展的每個環(huán)節(jié),為學校業(yè)務管理、教學創(chuàng)新跨越式發(fā)展提供信息化深度支撐,實現(xiàn)“持續(xù)的創(chuàng)新”“智慧的場景”“智慧的數(shù)據(jù)”“智慧的教學”等一體化的智慧校園發(fā)展目標。數(shù)據(jù)驅(qū)動和基于數(shù)據(jù)的創(chuàng)新是教育信息化2.0的主要特征,特別是在抗擊新冠肺炎疫情期間,學校管理層面需要掌握更多精準的數(shù)據(jù)來決策。智慧校園建設正逐漸由需求驅(qū)動向數(shù)據(jù)驅(qū)動轉(zhuǎn)變。目前,許多高校都在探索適合發(fā)展現(xiàn)狀的數(shù)據(jù)治理之路:一是依靠數(shù)據(jù)血緣關系,在學校層面開展多維度、深層次的數(shù)據(jù)治理。數(shù)據(jù)血緣能夠確認數(shù)據(jù)的來源、數(shù)據(jù)的加工方式、映射關系以及數(shù)據(jù)出口,適合業(yè)務流程類的數(shù)據(jù)治理。二是依靠數(shù)據(jù)標準動態(tài)更新,實現(xiàn)數(shù)據(jù)循環(huán)優(yōu)化,適合由上往下推動的校園數(shù)據(jù)治理過程,但容易忽視內(nèi)部的治理需求。

二、校園大數(shù)據(jù)生態(tài)治理體系構建

(一)總體思路

“校園大數(shù)據(jù)生態(tài)治理”是面向教育信息化進程中校園大數(shù)據(jù)治理的內(nèi)生需求,基于智能定位、無線傳感網(wǎng)絡通信、人臉識別、深度學習、分布式存儲、安全認證、智能分析與決策等新一代信息技術的綜合應用研究。該研究方向是物聯(lián)網(wǎng)、大數(shù)據(jù)、機器學習、數(shù)據(jù)安全、人工智能等新一代信息技術的綜合應用領域,對支撐學校教育教學,促進師生發(fā)展,提升學校內(nèi)部治理能力,促進校企合作,深化產(chǎn)教融合,加快學校數(shù)字化轉(zhuǎn)型具有重要意義。在校園大數(shù)據(jù)治理的數(shù)據(jù)價值管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全管理、數(shù)據(jù)架構管理等四個工作領域的基礎上,搭建以元數(shù)據(jù)管理體系為基礎、標準體系為核心、流程體系為關鍵、價值體系為重點、安全體系為保障的數(shù)據(jù)治理框架,創(chuàng)建眾籌群智、共生自洽、有機協(xié)調(diào)的數(shù)據(jù)生態(tài)治理環(huán)境,挖掘數(shù)據(jù)價值,提高教育服務的參與度和透明度,提高教育決策的科學性與預見性;以提升校園大數(shù)據(jù)價值為宗旨,以校園大數(shù)據(jù)安全技術與數(shù)據(jù)血緣關系的研究為切入點,完善設計數(shù)據(jù)安全與數(shù)據(jù)標準的動態(tài)更新機制,研究校園數(shù)據(jù)全量覆蓋與全量共享技術,構建自動化、可視化、分布式、生態(tài)化的智能數(shù)據(jù)池,服務校園數(shù)據(jù)的開放及開發(fā),建立校園數(shù)據(jù)智慧服務平臺,實現(xiàn)數(shù)據(jù)共享、價值提升、應用升級。

(二)主要研究內(nèi)容

1.以元數(shù)據(jù)模型為基礎研究動態(tài)更新機制大數(shù)據(jù)融合了計算機、云計算、互聯(lián)網(wǎng)等新興產(chǎn)業(yè)技術,以數(shù)據(jù)為基礎,圍繞大數(shù)據(jù)的采集、整理、挖掘、處理分析等活動,各數(shù)據(jù)主體交互協(xié)作,通過數(shù)據(jù)流動的串聯(lián)形成了類似于生物生態(tài)鏈條的大數(shù)據(jù)生態(tài)鏈。以元數(shù)據(jù)模型為基礎,研究數(shù)據(jù)間的安全技術與血緣關系,從以業(yè)務為核心向以數(shù)據(jù)為核心轉(zhuǎn)變,制訂校園大數(shù)據(jù)發(fā)展規(guī)劃與標準。從業(yè)務數(shù)據(jù)化的角度,全面梳理學校系統(tǒng)數(shù)據(jù)流、業(yè)務流程和部門UC矩陣,建設一套符合職業(yè)院校實際的信息標準體系,保證信息在采集、處理、交換、傳輸?shù)倪^程中有統(tǒng)一、科學、規(guī)范的分類和描述,確保大數(shù)據(jù)治理體系的建設、使用、管理及維護規(guī)范有序,并且形成校園數(shù)據(jù)標準、校園數(shù)據(jù)模型、校園數(shù)據(jù)資產(chǎn)、校園數(shù)據(jù)服務和校園數(shù)據(jù)管理等方面的制度性文件。2.采用數(shù)據(jù)同步框架DataX設計智能數(shù)據(jù)池基于數(shù)據(jù)同步框架DataX,實現(xiàn)結構化、半結構化和非結構化等不同類型校園數(shù)據(jù)的共享與交換,采用分布式數(shù)據(jù)采集實現(xiàn)海量數(shù)據(jù)實時處理,實現(xiàn)異構數(shù)據(jù)源的數(shù)據(jù)同步……這些研究工作將使數(shù)據(jù)同步任務變得簡單可控。設計可彈性擴充的Hive數(shù)倉,采用高容量的分布式存儲來承載治理完成后的海量數(shù)據(jù)。實現(xiàn)數(shù)據(jù)治理與管理過程自動化,自動發(fā)現(xiàn)數(shù)據(jù)流向與依賴關系,自動識別元數(shù)據(jù),自動創(chuàng)建數(shù)據(jù)的約束規(guī)則。同時,還考慮采用小型數(shù)據(jù)倉庫和數(shù)據(jù)集市,設計分布式關系型數(shù)據(jù)庫TiDB,提供高性能、低延時的數(shù)據(jù)分析,最終形成校園高質(zhì)量的智能數(shù)據(jù)池。3.以Spark數(shù)據(jù)挖掘分析技術設計智慧服務平臺校園大數(shù)據(jù)生態(tài)治理形成的高質(zhì)量數(shù)據(jù)資產(chǎn),需要實際應用才能體現(xiàn)價值,因此可采用數(shù)據(jù)接口、數(shù)據(jù)推送、數(shù)據(jù)直連、數(shù)據(jù)下載等方式對外部用戶開放、提供服務,實現(xiàn)共享。對于校園多個業(yè)務系統(tǒng)產(chǎn)生的大量多維度過程化和結果性數(shù)據(jù),應基于Spark搭建數(shù)據(jù)挖掘分析平臺來實現(xiàn)可視化編輯頁面,降低數(shù)據(jù)挖掘門檻,如通過拖拽式流程設計和MLlib內(nèi)置算法庫,快速實現(xiàn)各類數(shù)據(jù)挖掘應用。可通過平臺數(shù)據(jù)挖掘建模,滿足不同用戶、不同場景的分析需求,幫助用戶參與業(yè)務數(shù)據(jù)價值挖掘,高效輔助和驅(qū)動高校業(yè)務決策。另外,還可以利用數(shù)據(jù)挖掘分析平臺開發(fā)“學生學業(yè)預警”“校情駕駛艙”“數(shù)據(jù)資產(chǎn)利用”“運營分析報表”等數(shù)據(jù)應用模塊,幫助高校管理者進行科學決策,實現(xiàn)全面精準化的管理。

(三)數(shù)據(jù)價值提升

數(shù)據(jù)智慧化能夠?qū)⒏咝?nèi)部數(shù)據(jù)資源變?yōu)楹诵母偁幜?zhàn)略中的重要資產(chǎn),而科學有效的數(shù)據(jù)治理體系則是保障戰(zhàn)略資產(chǎn)形成的重要條件。以元數(shù)據(jù)管理體系為基礎、標準體系為核心、流程體系為關鍵、價值體系為重點、安全體系為保障的數(shù)據(jù)治理框架,其創(chuàng)新點在于研究并構建業(yè)務應用與數(shù)據(jù)治理的內(nèi)在循環(huán),以及治理后的數(shù)據(jù)衍生新興應用、業(yè)務分析指導和業(yè)務應用改進的外部循環(huán)。通過不斷雙循環(huán)迭代,逐漸提升數(shù)據(jù)質(zhì)量,最終營造良性、可持續(xù)的校園大數(shù)據(jù)治理生態(tài)環(huán)境。1.基于Flink的大數(shù)據(jù)實時分析校園業(yè)務系統(tǒng)的復雜性和多樣化使得數(shù)據(jù)實效性要求變高,針對大數(shù)據(jù)的實時分析愈顯重要。Flink作為新一代分布式計算引擎,為實時流數(shù)據(jù)分析和批量數(shù)據(jù)處理提供了統(tǒng)一的編程模型和執(zhí)行引擎,研究并優(yōu)化Flink的多表連接作業(yè),可提高生產(chǎn)數(shù)據(jù)的采集和分析效率,從而解決不同數(shù)據(jù)源的差異性所帶來的問題,為數(shù)據(jù)治理提供支撐。2.基于DAG模型的分布式任務調(diào)度研究遵照有向無環(huán)的DAG構建任務配置,實現(xiàn)任務無縫漂移、順序觸發(fā),完成精準、實時、穩(wěn)定、高效的多任務調(diào)度,以及任務的切分和編排。任務調(diào)度中心通過進行分布式部署,讓每個節(jié)點根據(jù)consistency-hash算法進行任務分配,確保計算與存儲資源越多、定時任務越多、各個任務聯(lián)系越緊密的情況下,任務正常進行。

三、校園數(shù)據(jù)安全保障措施

可采用Kerberos協(xié)議來實現(xiàn)大數(shù)據(jù)平臺的身份認證;采用基于角色訪問控制(RBAC)模型來實現(xiàn)大數(shù)據(jù)平臺的訪問控制功能;應用DES、RSA等加密算法進行身份認證、訪問控制、數(shù)據(jù)傳輸以及數(shù)據(jù)存儲。打造校園大數(shù)據(jù)治理全過程、全周期的安全體系,圍繞活動的主體,為使用者提供可靠的認證、授權、訪問與審計功能,實現(xiàn)對非敏感數(shù)據(jù)、敏感數(shù)據(jù)脫敏、隱私數(shù)據(jù)保護工作的運營管理??傊?,數(shù)據(jù)治理工作對高校數(shù)據(jù)規(guī)范化建設至關重要,其本質(zhì)上屬于高校數(shù)據(jù)開發(fā)和利用的基礎性工作。通過構建全域數(shù)據(jù)中心建設與數(shù)據(jù)生態(tài)治理體系,打破傳統(tǒng)的“存、管、治、用”數(shù)據(jù)資產(chǎn)管理桎梏,能夠有效整合數(shù)據(jù)資產(chǎn),全面提升數(shù)據(jù)利用率,完成數(shù)據(jù)在價值流里的有效循環(huán),達到不斷挖掘數(shù)據(jù)價值、全面提升學校綜合競爭力的目的。

參考文獻:

[1]吳紹波,余維新,王琳,等.大數(shù)據(jù)生態(tài)鏈的數(shù)據(jù)整合模型構建與運作研究[J].決策咨詢,2022(1):23-27.

[2]邵家勇.智慧校園視域下高等教育數(shù)據(jù)生態(tài)治理體系研究[J].華東科技,2022(1):133-135.

[3]秦新國,薛雅.高校教育數(shù)據(jù)治理框架與生態(tài)體系建設研究———以南京審計大學為例[J].高教論壇,2022(2):23-28.

作者:姜建峰 單位:江蘇經(jīng)貿(mào)職業(yè)技術學院