2020年,我國數(shù)字經(jīng)濟(jì)規(guī)模達(dá)到39.2萬億元,占GDP比重為38.6%,目前位居于世界第二,其增速是GDP的三倍以上。
這一組數(shù)據(jù)來自于中國信息研究院發(fā)布的《中國數(shù)字經(jīng)濟(jì)發(fā)展白皮書(2021)》。按前述所言,可毫不夸張地說,數(shù)字經(jīng)濟(jì)時代已然到來,成經(jīng)濟(jì)增長的主要動力。
不過,數(shù)字經(jīng)濟(jì)要想行穩(wěn)致遠(yuǎn),核心前提是維護(hù)好安全這一“基石”。畢竟虛擬數(shù)字世界不斷擴(kuò)張之時,現(xiàn)實(shí)生活中存在著泄露個人隱私的風(fēng)險。
且于9月1月實(shí)施的《數(shù)據(jù)安全法》中明確,“鼓勵數(shù)據(jù)要依法合理有效利用,保障數(shù)據(jù)依法有序自由流動,促進(jìn)以數(shù)據(jù)為關(guān)鍵要素的數(shù)字經(jīng)濟(jì)發(fā)展?!?/p>
而在科技賦能金融數(shù)字化轉(zhuǎn)型過程中,金融機(jī)構(gòu)如何在保護(hù)個人隱私的前提下推動數(shù)據(jù)間協(xié)作?這成為擺在行業(yè)面前的一道坎。
值得一提的是,對于解決“數(shù)據(jù)孤島”的難題,在行業(yè)普遍認(rèn)知中,聯(lián)邦學(xué)習(xí)技術(shù)成為有力的“武器”。
挖掘“跨域”數(shù)據(jù)價值
近些年,越來越多的企業(yè)意識到數(shù)據(jù)分析的重要性。在大數(shù)據(jù)“喂養(yǎng)”下,人工智能得以快速發(fā)展。換言之,深度學(xué)習(xí)的代表——人工智能之所以應(yīng)用到各行各業(yè),離不開數(shù)據(jù)支持。
不過,企業(yè)若不想囿于私域數(shù)據(jù),被限制在“一隅”,且又要滿足數(shù)據(jù)合規(guī)問題的話,需要采用聯(lián)邦學(xué)習(xí)技術(shù),方能挖掘“跨域”數(shù)據(jù)價值。
而所謂的“聯(lián)邦學(xué)習(xí)”是一種分布式機(jī)器學(xué)習(xí)技術(shù),在不交換數(shù)據(jù)樣本的情況下,在多個分散的邊緣設(shè)備和服務(wù)器上訓(xùn)練算法,以達(dá)到在數(shù)據(jù)“可用不可見”的基礎(chǔ)上進(jìn)行安全聯(lián)合建模。
簡單來說,聯(lián)邦學(xué)習(xí)具有眾籌和協(xié)作之意,搭建的系統(tǒng)具有聚合功能,其在推動數(shù)據(jù)融合,解決“數(shù)據(jù)孤島”難題上,釋放更多數(shù)據(jù)動能。
于企業(yè)而言,除私域數(shù)據(jù)之外,其還可將多維度的外域數(shù)據(jù)作為參考,并以此為基礎(chǔ)做出更為準(zhǔn)確的決策。
且目前,聯(lián)邦學(xué)習(xí)已在醫(yī)療、金融、物聯(lián)網(wǎng)等領(lǐng)域有所應(yīng)用。
其中,醫(yī)療行業(yè)中,國內(nèi)三甲醫(yī)院保存的醫(yī)療數(shù)據(jù)量非??捎^,可涉及隱私問題,科技公司想要直接采集多家醫(yī)院的數(shù)據(jù)用于訓(xùn)練并不現(xiàn)實(shí)。而聯(lián)邦學(xué)習(xí)解決人們最為關(guān)心的隱私安全問題,醫(yī)療機(jī)構(gòu)也才能放心將醫(yī)療數(shù)據(jù)用于AI訓(xùn)練,突破了隱私的圍城。
另外,聯(lián)邦學(xué)習(xí)已在金融行業(yè)中一些關(guān)鍵領(lǐng)域上取得了進(jìn)展,聯(lián)合反洗錢建模、聯(lián)合信貸風(fēng)控建模、聯(lián)合權(quán)益定價建模、聯(lián)合客戶價值建模等。
提升金融機(jī)構(gòu)運(yùn)營、風(fēng)控效率
以薩摩耶?dāng)?shù)科為例,作為與眾多流量方、金融機(jī)構(gòu)有著業(yè)務(wù)往來的公司,其充分利用自身與合作方優(yōu)勢,可對獲客、運(yùn)營、風(fēng)控等效果提升有顯著幫助。
基于業(yè)界的開源聯(lián)邦學(xué)習(xí)框架Fate,薩摩耶?dāng)?shù)科構(gòu)建起了聯(lián)邦學(xué)習(xí) 平臺。該平臺上各個參與方信息保留在本地,不泄露隱私也不違反法規(guī)。且在聯(lián)邦學(xué)習(xí)的體系下,各個參與者的身份和地位相同,建模效果與將整個數(shù)據(jù)集中放在一起的建模效果相同。
此外,該平臺將聯(lián)邦學(xué)習(xí)集成到了薩摩耶?dāng)?shù)科AI平臺,可以更容易地實(shí)現(xiàn)聯(lián)邦模型的訓(xùn)練、上線以及模型管理等功能,使聯(lián)邦學(xué)習(xí)更簡單易用。兩者結(jié)合后還獲得了可視化聯(lián)邦拖拽建模、模型管理及模型監(jiān)控。
具體來講,薩摩耶?dāng)?shù)科AI平臺統(tǒng)一了從特征工程、算法建模、模型訓(xùn)練、模型評估、模型發(fā)布等全流程,實(shí)現(xiàn)界面配置,便于模型的統(tǒng)一管理和維護(hù),節(jié)省模型從訓(xùn)練到發(fā)布的上線周期。同時,參考了業(yè)界主流AI平臺設(shè)計思想,用組件化開發(fā)實(shí)現(xiàn)各個業(yè)務(wù)功能流程,做到自定義可配置可擴(kuò)展,同時也用Kubernetes實(shí)現(xiàn)容器化彈性快速部署。
且薩摩耶?dāng)?shù)科的AI平臺還具有私有化、開放性、組件化的算法庫、代碼和組件相互轉(zhuǎn)換、進(jìn)行自定義預(yù)處理、靈活定制不同模型的監(jiān)控指標(biāo)、支持Spark、TensorFlow等分布式框架、自動機(jī)器學(xué)習(xí)功能(AutoML)、跨平臺(Windows、Linux)使用、線上線下統(tǒng)一特征管理等亮點(diǎn)。
值得一提的是,開源版聯(lián)邦學(xué)習(xí)Fate提供了豐富的縱向與橫向開源算法及優(yōu)秀的調(diào)度Fate_Flow,可在易用性上給用戶造成很大的影響,即使用者在使用開源版幾個月后仍不能熟悉和快速地使用Fate進(jìn)行聯(lián)合建模。
而聯(lián)邦學(xué)習(xí)算法集成到薩摩耶?dāng)?shù)科AI平臺主要從兩個方面入手:一是改進(jìn)Fate易用性,從上傳數(shù)據(jù)、訓(xùn)練模型到在線預(yù)測上線模型三大主要階段,通過簡單前端操作一鍵執(zhí)行,并且對訓(xùn)練模型這個主要的模塊進(jìn)行前端拖拽建模,在線預(yù)測模塊進(jìn)行一鍵發(fā)布、停止、跑批等功能,并和薩摩耶?dāng)?shù)科AI平臺保持一致。
聯(lián)邦學(xué)習(xí)集成到薩摩耶?dāng)?shù)科AI平臺的第二階段,將開發(fā)自動建模平臺AUTOMAN算法聯(lián)邦化,目前Fate聯(lián)邦學(xué)習(xí)的算法是一些常用算法組件,相比AUTOMAN在風(fēng)控建模方面的算法還是相對較少,后面將部分AUTOMAN算法進(jìn)行聯(lián)邦化,并集成到AI平臺。
據(jù)了解,薩摩耶?dāng)?shù)科旗下的AUTOMAN自動建模平臺是將人工智能應(yīng)用在模型設(shè)計領(lǐng)域,使模型開發(fā)周期減少60%-80%,最短可在1周內(nèi)完成千萬級樣本建模任務(wù),極大地縮短原始樣本與經(jīng)營決策的距離,實(shí)現(xiàn)整體降本增效。
未來,薩摩耶?dāng)?shù)科聯(lián)邦學(xué)習(xí) 平臺將實(shí)現(xiàn)AUTOMAN自動建模平臺的聯(lián)邦化,以此提供更加豐富的模型。同時,結(jié)合使用聯(lián)邦學(xué)習(xí)商業(yè)版FDN技術(shù)支持軟件,提供更多模型維度,使得模型準(zhǔn)確度大幅提升。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。