1. Internet的發展歷史
1968年
1968年,參議員Ted·Kennedy(特德.肯尼迪)聽說BBN贏得了ARPA協定作為內部消息處理器(IMP),特德.肯尼迪向BBN發送賀電祝賀他們在贏得「內部消息處理器」協議中表現出的精神。
1978年
1978年,UUCP(UNIX和UNIX拷貝協議)在貝爾實驗室被提出來,1979年,在UUCP的基礎上新聞組網路系統發展起來。新聞組(集中某一主題的討論組)緊跟著發展起來,它為在全世界范圍內交換信息提供了一個新的方法。
然而,新聞組並不認為是互聯網的一部分,因為它並不共享TCP/IP協議,它連接著遍布世界的UNIX系統,並且很多互聯網站點都充分地利用新聞組。新聞組是網路世界發展中的非常重大的一部分。
第一個檢索互聯網的成就是在1989年發明出來,是由PeterDeutsch和他的全體成員在Montreal的McGillUniversity創造的,他們為FTP站點建立了一個檔案,後來命名為Archie。
這個軟體能周期性地到達所有開放的文件下載站點,列出他們的文件並且建立一個可以檢索的軟體索引。檢索Archie命令是UNIX命令,所以只有利用UNIX知識才能充分利用他的性能。
McFill大學,擁有第一個Archie的大學,發現每天從美國到加拿大的通訊中有一半的通信量訪問Archie。學校關心的是管理程序能否支持這么大的通訊流量,因此只好關閉外部的訪問。幸運的是當時有很多很多的Archie可以利用。
BrewsterKahle,當時是在ThinkingMachines(智能計算機)發明了WAIS(廣域網信息服務),能夠檢索一個資料庫下所有文件和允許文件檢索。根據復雜程度和性能情況不同有很多版本,但最簡單的可以讓網上的任何人可以利用。
在它的高峰期,智能計算機公司維護著在全世界范圍內能被WAIS檢索的超過600個資料庫的線索。包括所有的在新聞組里的常見問題文件和所有的正在開發中的用於網路標準的論文文檔等等。和Archie一樣,它的介面並不是很直觀,所以要想很好的利用它也得花費很大的工夫。
1989年
1989年,在普及互聯網應用的歷史上又一個重大的事件發生了。TimBerners和其他在歐洲粒子物理實驗室的人----這些人在歐洲粒子物理研究所非常出名,提出了一個分類互聯網信息的協議。
這個協議,1991年後稱為WWW(World Wide Web),基於超文本協議――在一個文字中嵌入另一段文字的-連接的系統,當你閱讀這些頁面的時候,你可以隨時用他們選擇一段文字鏈接。雖然它出現在gopher之前,但發展十分緩慢。
由於最開始互聯網是由政府部門投資建設的,所以它最初只是限於研究部門、學校和政府部門使用。除了以直接服務於研究部門和學校的商業應用之外,其它的商業行為是不允許的。
90年代初,當獨立的商業網路開始發展起來,這種局面才被打破。這使得從一個商業站點發送信息到另一個商業站點而不經過政府資助的網路中樞成為可能。
1991年
1991年,第一個連接互聯網的友好介面在Minnesota大學被開發出來。當時學校只是想開發一個簡單的菜單系統可以通過區域網訪問學校校園網上的文件和信息。緊跟著大型主機的信徒和支持客戶-伺服器體系結構的擁護者們的爭論開始了。
開始時大型主機系統的追隨者占據了上風,但自從客戶-伺服器體系結構的倡導者宣稱他們可以很快建立起一個原型系統之後,他們不得不承認失敗。客戶-伺服器體系結構的倡導者們很快作了一個先進的示範系統,這個示範系統叫做Gopher。
這個Gopher被證明是非常好用的,之後的幾年裡全世界范圍內出現10000多個Gopher。它不需要UNIX和計算機體系結構的知識。
在一個Gopher里,你只需要敲入一個數字選擇你想要的菜單選項即可。今天你可以用theUofMinnesotagopher選擇全世界范圍內的所有Gopher系統。
當University of Nevada(內華達州立大學)的Reno創造了VERONICA(通過Gopher使用的一種自動檢索服務),Gopher的可用性大大加強了。
它被稱為VeryEasyRodent-的首字母簡稱。遍布世界的gopher像網一樣搜集網路連接和索引。
它如此的受歡迎,以致很難連接上他們,但盡管如此,為了減輕負荷大量的VERONICA被開發出來。
類似的單用戶的索引軟體也被開發出來,稱做JUGHEAD().
Archie的發明人PeterDeutsch,一直堅持Archie是Archier的簡稱。當VERONICA和JUGHEAD出現的時候,表示出非常的厭惡。
(1)nsd網路共享擴展閱讀
互聯網受歡迎的根本原因在於它的成本低,優點如下:
1、互聯網能夠不受空間限制來進行信息交換
2、信息交換具有時域性(更新速度快)
3、交換信息具有互動性(人與人,人與信息之間可以互動交流)
4、信息交換的使用成本低(通過信息交換,代替實物交換)
5、信息交換的發展趨向於個性化(容易滿足每個人的個性化需求)
6、使用者眾多
7、有價值的信息被資源整合,信息儲存量大、高效、快速
8、信息交換能以多種形式存在(視頻、圖片、文字等等)
2. 如何將手機改造成為nas
其實用ARM安卓低功耗方案搞NAS咱前年吧開始有整NAS私有雲的念頭的時候就想過,但是最後還是放棄了,原因很簡單,第一是性能,第二是系統。
安卓平台上幾乎沒有 SMB 伺服器端NAS方案的原因:
Windows 平台上的 SMB 實現(服務端和客戶端)硬編碼了它的埠號 137-139 (基於 NetBIOS )或 445,使用非標準的埠提供 SMB 共享正常是無法被 Windows 找到的,所以為了適配 Windows 以及一眾其他 SMB 客戶端,必須使用這些標准埠號。 而在安卓上,必須擁有 root 許可權才可以開啟(監聽)小於 1024 的埠
監聽小於 1024 埠需要 root 許可權是從 Linux 一脈相承的
linux 更多時候是用於當伺服器,並且還是多人多賬戶同時使用的. 為了避免某個低級別的用戶監聽埠而導致某些基礎功能服務不能使用, linux 要求必須是管理員才能監聽 1024 以內的埠。而安卓的使用者只有一個普通用戶, 管理員用戶 和 root 用戶都是默認關閉,不允許用戶擁有管理員許可權,所以安卓全系基本就GG了,除非能ROOT。所以安卓陣營就是改,也得先ROOT或者刷LINUX開發系統,這倒是顯得IOS干這種活更容易些可惜IOS不開放文件管理權。
同樣的解釋適用於為什麼安卓端沒有 smtp 伺服器,Pop 伺服器
當然非標埠又不是不能用。使用 NsdManager 廣播一下協議和埠,一樣可以在 Windows 上鏈接。(不過我並不懂怎麼做上述操作
曾經有一個功能比較完善的 SMB 伺服器和客戶端(安卓),叫 LAN drive。當然,同樣的,它在未 root 的設備上只能使用 1024 及以上埠。所以對於 Windows 來說,要充當一個客戶端去連接它,必須進行埠轉換。為此這軟體還專門寫了一篇教程,洋洋灑灑一大段都是為 Windows 能連上它( PS. MAC 和 Linux 可自定義埠)搞功能轉換。所以正常安卓舊手機改NAS沒有物理限制但是實際上要 root 才可以用這就打翻一大堆小白了(包括我也不願意為了改NAS特意折騰ROOT)
此外一般咱以圖吧圖釘的角度來看的話都是做內網伺服器,外網環境基本還是依靠網盤或者直接拔NAS的移動硬碟解決了。不然NAS外網訪問還要買內網穿透或者申請公網IP,而且安全性也堪憂,外網網速不能保證的前提下直接把NAS掛的移動硬碟都拉走是最穩妥的方案。
安卓端是有支持網路共享的軟體的,比如上圖這個就是一個,軟體幾乎沒有體積(小於1M)在手機上安裝之後開啟服務就可以搞DLNA分享(要求手機不能鎖屏不然訪問會失敗)
WINDOWS網路是可以直接找到設備
需要安裝驅動
然而DLNA這個協議我們並不知道怎麼用來搞NAS,WIN下反正連文件目錄都摸不到
所以我們還是決定繼續搞SMB(SAMBA),用這個Servers_ultimate_pro
其可運行超過70種協議的60類伺服器。包括CVS, DC Hub, DHCP, UPnP, D
3. 區塊鏈聯邦學習是什麼
為什麼說區塊鏈融合隱私計算是必然趨勢?從更大的版圖視角來看,要構建全面的隱私保護和治理體系,不僅需要融合區塊鏈、人工智慧、大數據、隱私計算等多種技術,還需要結合法律法規、監管治理等諸多策略。
在數字化社會中,大家對於數據生產要素有著更為強烈的需求,無論是用戶服務、業務營銷都需要使用大量的數據,尤其是在分布式協作的業務模式中,各方都希望數據能順暢地流通,並合理地體現數據價值。但與之相悖的是,數據孤島仍然存在,數據的粗放式使用仍待解決。
與此同時,合法合規成為大勢所趨。不論是在國內還是國際上,與個人信息保護、數據安全相關的法律法規一一出台,都對個人信息保護和數據安全等方面提出了更為嚴格的要求。這意味著,要確保數據的安全,也要尊重個人的隱私權益;在數據全生命周期上,要求實現全面規范,達成合規地流通。
以用戶為中心,在安全隱私前提下交換數據,並提供優質合規的服務,是數字化社會建設的趨勢,需要在技術、業務模式、治理體繫上做出更多的創新。在分布式系統里引入隱私計算、發展合規的數據交易所等舉措,都體現出這種創新精神。
在隱私計算領域,區塊鏈、聯邦學習和安全多方計算已然成為三大關鍵核心技術,而且這三大技術之間互有側重,也有許多重合和聯系。
其中,從區塊鏈的角度出發,我們可以看到,一方面,區塊鏈上的數據需要採用隱私演算法來保護;另一方面,區塊鏈也可以成為隱私計算協作里的底座和樞紐:採用區塊鏈技術去記錄、追溯多方協作中的數據集、演算法模型、計算過程,並對最終結果進行評估和共識,持續優化協作效率。
此前幾年,我們在區塊鏈領域里探索應用落地時,常常是用區塊鏈為業務場景構建「分布式賬本」。合規的應用都會對用戶和商戶進行KYC(KnowYourClient),其中也存在不少待通過隱私計算等創新解法來解答的問題。
例如,身份信息是否可以向全聯盟鏈公布?在交易時,交易里的金額、相關方是否明文公開?每個人擁有的資產,是否可以被隨意查詢?人們的業務行為,是否會在未授權的情況下被濫用?
例如,在消費場景的積分卡券業務中,商家和商家之間通常不希望過多地暴露自己的經營狀況,比如有多少用戶開卡、充值,以及每天的流水等;個人用戶也不希望自己的消費行為被公開審視。
於是,在隱私問題尚未能徹底解決之前,我們通常採用的辦法是,引入核心權威機構參與共識和維護全賬本,而其他參與者則分層分片,以不同許可權的角色參與。但這樣,在一定程度上增加了系統的復雜性,影響了用戶體驗,同時,給區塊鏈應用的規模化和普及化帶來了挑戰。
目前,區塊鏈也普遍用於政務領域,比如在智慧城市管理以及各種民生應用中,為大家提供「一網通辦」的良好體驗,這就需要多領域、多地域、多部門的通力協作。我們可以看到,政務應用覆蓋面廣,角色眾多,數據存在多級別的敏感性和重要性。
區塊鏈可以作為分布式協作的底座,通過數據目錄、數據湖等方式,構建數據流轉的樞紐,同時引入隱私計算和全面的治理規則,界定數據的邊界,使數據在「不出庫」的同時,依舊可以實現身份認證、隱匿查詢、模型構建等能力。
從更大的版圖視角來看,要構建全面的隱私保護和治理體系,不僅需要融合區塊鏈、人工智慧、大數據、隱私計算等多種技術,還需要結合法律法規、監管治理等諸多策略。
區塊鏈隱私保護的場景豐富、角色眾多,流程多樣、數據立體,我們可以用「雙循環」機製做進一步分析。
首先,我們從用戶端出發,尊重用戶對數據的知情權和控制權,把重要的數據交給用戶管理。
比如,驗證身份的「四要素」中,用戶的身份憑據和聯系方式通常來自政府和運營商這些權威機構,當用戶和某一個業務場景產生聯系時,他們並不需要提供全部的明文信息,只需要選擇性披露一些可驗證的憑據,用以代替明文。
基於分布式驗證機制即可實現多場景的驗身,證明自己的合法身份,此時業務提供方即使未獲得更多明文數據,但也不能拒絕服務。這就從根源上降低乃至杜絕了用戶關鍵隱私的泄露風險。
其次,在業務方,依舊可以採用諸如聯邦學習、安全多方計算等技術,對用戶已經授權的、合規採集的業務數據進行處理。
在用戶知情同意的前提下,在B端實現與合作夥伴之間的協同計算,數據不出庫,隱私不泄露,但實現諸如風控、營銷、廣告等對業務運營有重要價值的事務。最終實現業務效果的提升,在給業務方帶來效益的同時,也為用戶提供更優質的服務,或者權益上的回報。其整個價值體系是閉環的,合規的,可持續的。
例如物聯網和區塊鏈,在採集端,就需要給設備分配身份和標識,同時演算法上要做到去標識,防泄露;在用戶端,不但要提供個性化的服務,還要做到防止不必要的畫像,在做到可驗證用戶身份和資質的同時,又不能無端地追蹤用戶行為軌跡;最終,在提供優質服務、安全存儲用戶數據的時候,又要尊重用戶的意願,包括注銷退出的要求。
如此的「雙循環體系」,可能不止是在技術上要求設備、APP、後台服務進行迭代的重構,同時其商業模式、運營治理觀念等層面可能也會產生許多革新。整個鏈條會非常的長,需要做的工作也非常多,覆蓋晶元、硬體、網路、軟體、雲平台等廣袤的產業鏈。
目前來看,並沒有哪一個「包打天下」的單一技術,可以滿足「全鏈路」、「雙循環」的要求。那麼我們不妨把場景拆細一點,列舉得全面一些,組合一些技術和方案,先解決某個場景里的痛點問題。
事實上,我們在和眾多產業應用開發者交流時,他們更期望聚焦於具體的、迫在眉睫的問題,得到有針對性、可著手實施的解決方案,比如轉賬時隱匿金額、排名時不透露分數、投票時不泄露身份、KYC流程時不泄露視頻等等。
特定場景下的問題常常可以基於隱私計算的某一個演算法或一些演算法的組合,針對性的去應對。我們可以日拱一卒,解決一個又一個的場景化問題,對之前可能有紕漏的事情亡羊補牢,對可預見的剛性需求引入新技術新思路,創新性地去實現。這樣就逐步把數據安全的籬笆一點點紮起來,最終築就數據安全的長城。
分布式協作中,許多場景是跨機構的、跨網路的,無論是區塊鏈還是隱私計算,都會遇到要和其他合作方、其他平台互通的要求。我們看到信通院的相關工作組正在討論多項互聯互通規范,核心框架是要做到「節點互通」、「資源互通」、「演算法互通」。
節點互通要求網路和協議等基礎要素能互通。資源互通強調的是對資源的發布存儲、定址使用、治理審計(含刪除數據、下線服務等),在這個層面上,大家都實現相對一致的視圖,提供通用的介面。演算法的互通則是非常細致和場景化的,每一種演算法都有自己的特點,其密碼學基礎、運算規則、協作流程都會不一樣,反過來對資源的管理資質和節點網路的拓撲,都會提出更多的要求。
在互通基礎上還有「自洽性」、「安全性」、「正確性」等要求,而且隨著領域的發展,不斷增加更多功能的「擴展性」也非常重要。之前,可能大家是在埋頭苦幹,積累技術和經驗,以後在落地時,則需要更注重介面和規范,開放心態,大家一起溝通共建,通過開源開放的方式尋求共識和共贏。
總結一下,關於隱私計算發展的幾個思考:
第三,實現標准化和普及化,以推動新技術和新理念的規模化落地。比如相關的行業標准、評測體系,這對幫助從業者理清發展道路、達成行業要求大有裨益。
區塊鏈發展這么多年,除了技術本身,其實最難的是「怎麼解釋清楚啥是區塊鏈」。希望在科普推廣方面,方興未艾的隱私計算能有更多的新思路,實現更好的效果。
回顧區塊鏈和隱私計算的熱潮,我們看到產業和社會在呼喚數據安全和隱私保護,行業也已經有了不少可用的研究成果,得到了一定的認可。展望可見的未來,我們將更加開放、務實,聚焦用戶和場景,探索規范的、規模化的、可持續的應用之路。
同盾的知識聯邦和其他廠提的聯邦學習有哪些顯著不同?同盾的知識聯邦是一個統一的安全多方應用框架,它支持安全多方查詢、安全多方計算、安全多方學習、安全多方推理等多種聯邦應用。知識聯邦在借鑒一些相關技術的同時,也具備一定的獨創性,尤其是在認知層和知識層聯邦都是自主創新的。知識聯邦與其它技術領域,如聯邦學習、區塊鏈、隱私計算、安全多方計算等,都有著緊密的關系。
五大賽道、八位專家,銀行局中人眼裡的AI江湖誰說大象不能跳舞?
2020於全體銀行而言,是一場無預告的終極考驗,一輪最直觀的金融科技對決。疫情讓網點流量驟降到接近於0,全方位挑戰銀行線上服務水平,檢驗那些連年增加的科技投入,有多少真正變作數字化、智能化的一點一滴。
踏進2021,銀行們迎來周密復盤、整裝待發的最好時間節點。
在過去這一年,銀行更努力地擺脫大象轉身的刻板印象,告別以往被各路創新推著走的窘況,試圖在金融科技和數字新基建的浪潮里承擔更主動、開放的角色,以輕快敏捷的步伐持續向前。
沒有一家銀行不想擁抱AI,沒有人願意錯過數智化轉型的未來。在梳理數十家銀行AI全布局,以及「銀行業AI生態雲峰會」多位嘉賓的分享過程中,我們逐漸發現銀行業AI的那些挑戰和困境,那些艱險之處同樣是機遇所在。
數據安全與隱私保護
銀行業AI,首先被AI本身正面臨的數據困境,和日漸收緊的數據監管尺度攔住。
在技術維度不斷向前奮進的同時,銀行必然要思考的一個議題是:業務創新與隱私保護如何兼顧?
雷鋒網AI金融評論主辦的《聯邦學習系列公開課》曾對這一問題展開過系統深入的探討。第一節課上,微眾銀行首席人工智慧官楊強就直接點明:「人工智慧的力量來自於大數據,但在實際運用過程中碰到更多的都是小數據。」
平安科技副總工程師王健宗也在課上指出,「傳統的AI技術必須從海量的數據中學習或者挖掘一些相關的特徵,利用數學理論,去擬合一個數學模型,找到輸入和輸出的對應關系,比如深度學習中訓練網路的權重和偏置,模型效果與數據量級、質量、以及數據的真實性等有著密切的關系。」
一個典型例子就是銀行信貸風控:現在大部分AI應用都由數據驅動,信貸風控更需要大量數據訓練,但大額貸款風控的案例又非常少。「要是來做深度學習模型,只用少量這種大額貸款的樣本遠遠不夠。」楊強解釋。
小數據需要「聚沙成塔」,同時又面臨侵犯隱私的可能。為此,網路安全與數據合規領域的立法進入了快車道,濫用數據和爬蟲也受到過嚴厲整治。
雖然目前《數據安全法》還只是處於草案的狀態,但是草案明確提出要關注數據本身的使用,需要在保護公民組織、相關權益的前提下,促進數據為關鍵要素的經濟發展。
數據被稱作是新時代的油田,但銀行該怎樣通過AI摸索出更高效、更合規的開采工具?
在「銀行業AI生態雲峰會」第一場演講中,微眾銀行區塊鏈安全科學家嚴強博士就對銀行必備的數據安全與隱私保護思維,進行了深入討論。他指出:
在數字經濟時代下,銀行業AI發展必須要尊重「數據孤島」作為數據產業的原生態,隱私保護技術則是打破數據價值融合「零和博弈」的關鍵,需要打通隱私數據協同生產的「雙循環」。
而區塊鏈是承載數據信任和價值的最佳技術,對於隱私計算和AI應用中常見的數據品質等難題,都可以通過區塊鏈進行互補或提升效果。
聯邦學習、TEE可信計算、安全多方計算等多個AI技術路線也正嘗試落地於銀行的核心業務場景。
AI金融評論了解到,除了微眾銀行,江蘇銀行2020年也已開展聯邦學習方向的探索,他們與騰訊安全團隊合作,基於聯邦學習技術對智能化信用卡經營進行聯合開發和方案部署,在聯邦學習技術支持下進行金融風控模型訓練。
銀行資料庫
以「數據」為線,銀行前中後台的升級軌跡清晰可見。
如果說前些年的銀行科技,討論度更集中在前台智能化應用,那麼如今中後台建設開始更多地來到聚光燈下,討論它們為銀行數字化轉型呈現的價值和意義。
這當中的一個重要模塊,就是銀行資料庫的改造升級。
我們曾經報道,Oracle自進入中國市場以來,在銀行資料庫市場,一直具有壓倒性優勢,也是許多銀行的采購首選。
由於長期使用Oracle,不少銀行形成較嚴重的路徑依賴。平安銀行分布式資料庫技術負責人李中原也曾向AI金融評論表示,系統遷移和重新建設需要大量成本,從單機變為多機群體,故障發生的故障發生的概率和維護成本都會加大,對整體系統運維將是巨大挑戰。(詳見《銀行業「求變」之日,國產資料庫「破局」之時》)
但隨著銀行業務創新需求愈發復雜,傳統資料庫在技術邊界、成本、可控性方面越來越不相匹配;采購資料庫的來源單一也讓銀行陷入非常被動的處境。
而雲計算的出現,讓Oracle在資料庫市場接近壟斷的地位有所動搖,各大互聯網雲廠商殺入戰場。
騰訊雲副總裁李綱就表示,雲化資料庫勝在成本低、易擴容兩大特點,任意一台X86的PC伺服器就可以運行,理論上也有著無限的橫向擴展能力,這都是Oracle等傳統資料庫難以企及的優點。
中國數千家銀行由此獲得更多選擇餘地,開始從集中式資料庫遷移到分布式資料庫,一場事關「大機下移」的漫長征途就此展開。
這場變革已有先行者,例如張家港行在2019年就將其核心業務系統放在了騰訊雲TDSQL資料庫上,傳統銀行首次為核心系統選用國產分布式資料庫;2020年,平安銀行信用卡的核心系統也完成切換投產,新核心系統同樣採用了國產資料庫。
在「銀行業AI生態雲峰會」上,騰訊雲資料庫TDSQL首席架構師張文就深入分享了張家港行和平安銀行這兩個典型的資料庫遷移轉型案例。
以平安銀行為例,其體量之大,意味著應用改造更具挑戰性。張文解釋道,為了配合此次改造,應用引入了微服務架構對應用進行了拆分和解耦。對賬號的分布進行了單元化劃分,以DSU為一個邏輯單元,單個DSU包含200萬個客戶信息,單個DSU同時處理聯機和賬務兩種業務。
但國產分布式資料庫也同樣還在成長當中,張文也指出了目前金融級分布式資料庫面臨一系列挑戰點,除了有可伸縮、可擴展的能力,更要解決高可用性、數據強一致性,同時探索更具性價比的性能成本,以及為金融機構打造更易上手的、更產品化的成熟解決方案。
中台建設
「中台建設」這個熱門關鍵詞,不再是互聯網公司的專屬。銀行也不例外,甚至更需要中台。
銀行這樣的大型機構,架構極其復雜,還有跨部門多團隊的協作,海量數據日積月累之下如同年久失修的危樓,更需要及時、持續的治理。
在看來,銀行擁有大量的數據、技術和人才,資源卻往往「各行其是」,部門之間沒有配合意識、獨立造煙囪;技術流於表面,無法鏈接、深入,這造成了銀行資源的大量浪費。
中台的體系化建設和順利運轉,才能將這龐大體系中的「死結」一一梳開。
建設銀行監事長王永慶就曾指出:中台建設是商業銀行數字化經營轉型的關鍵環節,認為商業銀行數字化轉型的必然歸宿是生態化、場景化。
盡管商業銀行在多年經營過程中沉澱了一定的競爭優勢,形成了各具特色的內部生態系統,但目前仍是封閉的、高冷的,還無法滿足數字經濟對開放式生態化經營可交互、高黏性、有體感、無邊界的要求。
因此,建行也已在數據中台先行一步,其落地上概括為5U(U是統一的意思),包括統一的模型管理、統一的數據服務、統一的數據視圖,統一的數據規范以及統一的數據管理。
為求輕松支撐億級用戶,實現高時效、高並發場景化經營,招商銀行近兩年也在中台和技術生態體系的建設上持續發力。去年年底發布的招商銀行App9.0,迭代需求點超過1800項,「10+N」數字化中台建設就占據了相當的比重。
如何構建金融機構需要的數據中台?
在「銀行業AI生態雲峰會」上,360數科首席科學家張家興就用「三通三快」概括了數據中台的標准:
金融機構面對著海量用戶、復雜業務,一個優秀的數據中台,必須是達到多業務打通,內外數據互通和用戶關系連通,同時還要做到數據的實時處理快、使用快、需求響應快。
他進一步強調,數據與AI融合得非常緊密,如果數據中台和AI中台各自建設,兩者之間將不可避免地存在割裂的現象。
基於此,360數科也推出了自己的數據AI融合中台,將最上層數據平台,到中間數據服務支撐的平台服務,再到整個數據資產的管理,到最下面整個數據技術架構的設計都進行調整,並且將自身沉澱的AI能力嵌入其中。
張家興也在雲峰會的演講上透露,360數科研發了一項聯邦學習技術——分割式神經網路,通過神經網路在高維空間,Embedding不可逆的特性,使得不同參與的數據合作方只需要傳遞Embedding向量,見不到原始數據,但最終可以使模型產生目標效果。
銀行信貸智能風控
而在過去一年裡,銀行信貸風險管理,仍然是最引人關注的方向之一。
關注度一方面來自於,受疫情影響而劇增的貸款逾期和壞賬風險,如何藉助技術手段「端穩這碗水」,把握好信貸支持尺度,成為銀行、消金公司和風控技術服務商們的開年大考。(詳見《信貸戰「疫」:一場給風控的開年大考》)
而另一方面,2020年下半年起,針對金融科技或是互聯網金融的監管「紅線」逐漸清晰。例如《商業銀行互聯網貸款管理暫行辦法》,其中就明確提出了對商業銀行的風險管控要求,和對合作機構的管理規范。
盡管結合AI、大數據的智能風控在銀行科技應用中不再新鮮,但這並不意味著智能風控已經足夠成熟——數據資源壁壘、自有數據累積、數據特徵提煉、演算法模型提升,被認為是大數據風控目前所面臨四大困境。
某商業銀行負責人就曾表示,在模型建設和模型應用過程中普遍存在數據質量問題,包括外部數據的造假(黑產欺詐)和內部數據的濫用等,在模型迭代方面,很多銀行只追求迭代的速度和頻次,而忽略了最終效果。
前網路金融CRO、融慧金科CEO王勁進一步指出,數據規范和治理體系不健全,數據質量差且缺失率高,技術能力不足,復合型科技人才匱乏等因素都是銀行等金融機構無法做好模型的重要原因。
王勁曾在有著「風控黃埔軍校」之稱的美國運通工作17年,負責過全球各國各類產品相關的700餘個模型提供政策制度和獨立監控。在雲峰會上,他也結合自身二十餘年風控經驗,剖析了金融風險管理中的那些理念誤區。
「很多人並不是特別理解,風險管理永遠是一個尋找平衡點的科學。」王勁認為,風險管理平衡有著這樣的核心三問:
他也解析了銀行等持牌金融機構做好風險管理平衡的核心要素,談到風險管理最重要的就是對數據的把控,「金融公司成立之初就要思考數據的生命周期。首先要從對業務產品和客戶的選擇當中,決定需要什麼樣的數據。」
數據戰略是一個相對長期的落地過程,機構首先要立下數據選擇的原則和條件:要考慮的不只是數據的合規性、穩定性和覆蓋率,更要考慮數據的新鮮度、時效性和時間跨度。
從模型建設的角度出發,王勁指出,一個卓越的風控模型應當具備辨別力、精準度、穩定性、復雜度和可解釋性五大要素,「原材料」數據、模型架構和演算法的選擇,衍生變數的出現,對模型的監控和迭代,以及對y的定義和樣本的篩選,無一不影響模型的「鍛造」。
在他看來,銀行等金融機構如果能在身份識別和控制、數據安全管理、風險模型管理,和自動化監控體系方面,做到高效完善,將會是非常理想的一種狀態。
RPA與內部流程優化
還有一個關鍵詞,在各家銀行年報中出現頻率越來越高,那就是RPA(機器人流程自動化)。此前AI金融評論也曾舉辦《RPA+AI系列公開課》,邀請到五位頭部RPA廠商高管分享RPA與金融碰撞出的火花。
RPA的定義,很容易聯想到2012年左右的「流程銀行」轉型潮。當時的流程銀行,意為通過重新構造銀行的業務流程、組織流程、管理流程以及文化理念,改造傳統的銀行模式,形成以流程為核心的全新銀行經營管理體系。
如今銀行的轉型之戰,全方位升級為「數字化轉型」,內部流程的優化改造在AI和機器人技術的加持下持續推進,RPA也迅速成為銀行數字化轉型不可缺席的一把「武器」。
達觀數據聯合創始人紀傳俊在「銀行業AI生態雲峰會」上指出,RPA+AI為銀行帶來的價值,最明顯的就是減少人工作業、降低人工失誤,提升業務流程效率,同時也提高風險的預警和監控能力。
AI金融評論注意到,已有多家國有大行將RPA投產到實際業務中。
以工商銀行為例,RPA在工行的應用覆蓋了前台操作、中台流轉和後台支撐等多個業務場景,在同業率先投產企業級機器人流程自動化(RPA)平台並推廣應用,全行累計46家總分行機構運用RPA落地實施120個場景。
建設銀行同樣也引入了RPA,建立國內首個企業級RPA管理運營平台,敏捷研發業務應用場景100個,實現人工環節自動化、風險環節機控化。
農業銀行方面則透露,農行目前還處於技術平台建設階段,之後將以信用卡業務、財務業務等為試點落地RPA需求。其實施策略,是建設全行統一的RPA技術平台,面向總分行各部門輸出RPA服務。
中國銀行在2017年底,旗下公司中銀國際就已有RPA的概念驗證,團隊成功投產20個機器人,分別在不同崗位執行超過30個涉及不同業務流程的自動化處理工作,也與RPA廠商達觀數據展開了合作。
紀傳俊也在雲峰會上分享了目前AI+RPA在銀行各大典型場景的落地:
例如智慧信貸,面向的是整個銀行最核心的流程——信貸流程,分為貸前、貸中、貸後三大階段。其中涉及數據查詢、數據處理、財務報表、銀行流水等專業環節,需要完成基礎信息的錄入、盡調報告的審核,而這些環節中的大量重復勞動,可以基於AI、OCR、NLP等技術自動化完成。
區塊鏈是什麼意思?區塊鏈是分布式數據存儲、點對點傳輸、共識機制、加密演算法等計算機技術的新型應用模式。所謂共識機制是區塊鏈系統中實現不同節點之間建立信任、獲取權益的數學演算法。
1、狹義來講,區塊鏈是一種按照時間順序將數據區塊以順序相連的方式組合成的一種鏈式數據結構,並以密碼學方式保證的不可篡改和不可偽造的分布式賬本。
2、廣義來講,區塊鏈技術是利用塊鏈式數據結構來驗證與存儲數據、利用分布式節點共識演算法來生成和更新數據、利用密碼學的方式保證數據傳輸和訪問的安全、利用由自動化腳本代碼組成的智能合約來編程和操作數據的一種全新的分布式基礎架構與計算方式。
(3)nsd網路共享擴展閱讀:
1、2008年由中本聰第一次提出了區塊鏈的概念,在隨後的幾年中,成為了電子貨幣比特幣的核心組成部分:作為所有交易的公共賬簿。
2、到2014年,「區塊鏈2.0」成為一個關於去中心化區塊鏈資料庫的術語。對這個第二代可編程區塊鏈,經濟學家們認為它的成就是「它是一種編程語言,可以允許用戶寫出更精密和智能的協議,因此,當利潤達到一定程度的時候,就能夠從完成的貨運訂單或者共享證書的分紅中獲得收益」。
3、在2016年,俄羅斯聯邦中央證券所(NSD)宣布了一個基於區塊鏈技術的試點項目。許多在音樂產業中具有監管權的機構開始利用區塊鏈技術建立測試模型,用來徵收版稅和世界范圍內的版權管理。
4、區塊鏈的時間戳服務和存在證明,第一個區塊鏈產生的時間和當時正發生的事件被永久性的保留了下來。
5、比特幣公司BTCC於2015年推出了一項服務「千年之鏈」即區塊鏈刻字服務,就是採用的以上原理。用戶可以將通過這項服務將文字刻在區塊鏈上,永久保存。