6 月 7 日,華為全球智慧金融峰會 2023 在上海順利舉行,華為云數據庫服務產品部總經理蘇光牛帶來了《華為云分布式數據庫 GaussDB,做金融數字化的堅實數據底座》的主題分享,為大家介紹了華為云 GaussDB 的商業進展和技術創新能力。
以下是演講實錄:
尊敬的各位領導、各位來賓,大家下午好!非常感謝大家蒞臨本次峰會,今天,我主要給大家分享下 GaussDB 的商業進展以及產品能力升級方面的最新情況。
1、華為云 GaussDB 正在從金融覆蓋到更多行業
從 2019 年開始,我們在華為內部通過持續的錘煉,推出了融合多項技術的自主創新的 GaussDB 數據庫,而且陸續完成了華為公司內部核心系統的替代,這里面包括三個方面。
第一個是我們在終端云上實現了 6PB 數據的全面替代和上線,分布式節點有 6 千個節點的規模,資源利用率提升了 30%。
第二個是在 ERP 的替換中,我們替換了 600 多套的業務庫,經歷了十倍流量的突發流量考驗,業務效率得到了 10 倍的提升,實現了零故障、零時延和零調賬。這里簡單給大家普及一下,華為公司的訂單系統的特點,每到一個月的月末,每到一個季度的結束以及每年結束的時候,它的流量是平時流量 5-10 倍。所以華為公司在 ERP 上線的時候,我們是經歷了 20 倍流量的測試和壓測才能上線。
第三個就是我們的運營商設備,累計發貨也有 30 多萬套。
從我們的收入結構也可以發現,GaussDB 從最初的金融行業已經覆蓋到更多的關基行業,非金融的占比提升了一倍,越來越多的客戶選擇 GaussDB 作為其數字化轉型的伙伴。
2.在豐富的實踐場景中打磨成熟
我們知道,數據庫是一個全場景的軟件,所以場景實際上是數據庫的磨刀石。下面,我將進一步解讀剛才講的這幾個業務和后面要講的金融業務對數據庫的磨煉是極其重要的。
華為的 MetaERP 系統,是一個典型的重度的使用傳統商業數據庫的場景,也是制造業里面非常典型的一個應用的代表,在華為公司,ERP 是我們的生產系統,它支撐了華為每年數千億訂單,170 多個國家的訂單發貨。從華為自身業務連續性的視角看,華為的 ERP 替換,相當于長征途中的強渡大渡河。作為全球數據庫應用場景最復雜的 ERP 系統之一,華為的 MetaERP 面臨幾個挑戰:第一個就是有近 7 億行的 SQL 腳本需要改造;第二個我剛也提到了,業務高峰期業務流量可能達到 5-10 倍,在實際上線前,我們做了 20 倍流量的壓測;第三個就是大表的改造,有最大 160 億行大表,超過 100 億行的表就有十幾個,這些大表的遷移都非常具有挑戰性。那如何解決呢?
第一個,對于 SQL 腳本的替換,我們的 UGO 工具實現了近 100%的自動化結構遷移。今天,我們去替換數據庫,如果還投入幾十個人去改造一個應用實現替換的話,是不可以維系的。第二個,就是數據遷移,我們是在 35 個小時內,實現了 3200 億行數據的遷移。也就是說,今天大家已經不用擔心數據遷移的一致性和完備性問題了。
另外,我們通過智能代價估計、高效索引并發控制等算法順利地通過了業務歷史最大峰值 20 倍流量的壓測。
這里也給大家講一個小故事,在 ERP 切換成功后,華為成都的一個操作人員,第一次運行資產核算任務,只用了 3 分鐘。但是之前這個操作人員的歷史經驗都需要 2 個多小時。所以他認為這次可能是運行失敗了,按照操作的規范立即預警。經過實際確認,結果是準確的,是一個“美麗的誤會”。
而華為終端云服務,這個代表著新興的一類生于云、長于云的云原生企業的典型應用,它的主要挑戰是什么呢?首先是成本問題,如何提升資源利用率,特別是在海量的數據和分布式的情況下,大量的部署節點帶來的成本問題以及傳統的機房轉換到云上的成本挑戰;其次是海量業務帶來的大量的分布式的訴求,需要有非常強的擴展性,和彈性伸縮能力;最后是數據多樣化,因為其中既有關系型數據,也有非關系型數據。
GaussDB 原生的分布式架構,使負載更加均衡,已經上線的最大單集群節點數超過了 200 個,并且支持多種生態,實現了資源利用率和運營效率的大幅度提升。
還有就是對數據庫要求最高的金融核心系統,幾乎所有的金融 CIO 或 CTO 都知道遷移并不好做,金融行業大量的應用都重度依賴傳統數據庫的接口,存在大量的不確定性,客戶都希望有一套可量化的、逐步推進執行的方案。
從芯片、服務器、存儲、網絡到數據庫、操作系統,GaussDB 是當前國內唯一能夠做到軟硬協同、全棧自主創新的國產品牌,高度兼容傳統數據庫的語法,有一站式的數據加應用平滑遷移方案,使得遷移變得更簡單。同時基于多數派協議的原生分布式架構,更大幅提升了系統的可用性。
3.面向更深入、更廣泛的場景,我們思考如何更好地滿足客戶訴求
隨著 GaussDB 的成熟,未來 GaussDB 將向兩個方向發展。第一是做深做透金融行業,一次性解決金融客戶數字化轉型和可持續發展的雙重訴求;第二是從金融走向政務、能源、交通等更多關鍵信息基礎設施行業,這也是我們一個新的使命。
在做深做透金融上,我們發現客戶以前只關注接口的適配性,現在開始逐步重視替換后應用的可用性、穩定性。大家都知道,主機的可靠性大部分來自硬件,而沒有了這種專用硬件的加持,如何通過軟硬件協同保障大機整體可用性指標就非常重要了。金融核心業務不同于互聯網追求性能峰值的極限,更需要的是一個確定的不抖動的性能,讓每一筆交易的時延都可控。最后,在客戶從幾個應用替換到幾百個應用替換的落地過程中,如何把遷移做成可量化的實施過程,是擺在每個金融 CIO 眼前最大的挑戰。
近些年,關基行業的數據規模也越來越大,由于科技力量薄弱,技術人員投入相對較少,就需要數據庫簡單易用,最好能直接復用在金融行業已經實踐成熟的技術來降低總體擁有成本,實現快速推進。
4.GaussDB 始終以安全可信、高質量為首要目標
為了滿足更多場景的客戶訴求,今天我們發布了新一代的分布式數據庫 GaussDB,具備五高兩易的全面能力。下來我就其中的一些關鍵的新能力跟大家做一下解讀和分享。
在講具體的產品能力升級變化之前,我想先給大家分享下 GaussDB 沒變的東西,那就是我們對安全可信、高質量的追求。
從產品定義、代碼實現、開源治理到運營運維等各個環節,GaussDB 基于華為軟件工程全棧可信框架,實現了從結果可信到過程可信,做到了包括開發 GaussDB 軟件的整個工具鏈在內的真正的自主創新。
同時,我們構建起了一個 9 層的測試防護網,通過全鏈路的深度交互測試平臺減少低概率、復雜交互類的問題,當前已有 20 萬測試用例消減了大部分基本問題,今年我們還會繼續增加到 80 萬,還構建了 10 多個金融客戶場景化的防護網,消減了金融場景化的問題,實現真正的高質量。
5.聚焦客戶業務痛點,GaussDB 產品關鍵能力全新升級
在產品能力升級上,我想大家最關心的還是可用性。我們的 GaussDB 新版本支持了 Paxos 一致性協議,更好地提升了 RTO,高負載業務下 DN 故障倒換可以穩定在 10 秒以內;去年我們跟工商銀行聯創推出了國內首個雙集群強一致的方案,實現了集群級故障完全隔離 RPO=0,雙 AZ 雙活;今年我們又進一步支持了雙集群的邏輯復制,以及全新的應用無損透明切換方案,做到應用大版本升級完全不停機,主備倒換應用微感知,真正實現大機業務 7*24 小時不間斷。
在性能上,GaussDB 存儲引擎可以實現業務長時間頻繁更新下依然保持系統高性能,同時不抖動。這得益于 GaussDB 和招行的聯創,我們重構了底層的整個存儲引擎,采用的是原地更新的模式,它和常見的基于不斷追加的這種引擎最大的區別是,傳統的模式在底層垃圾的回收和內存做數據化的時候會有非常大的抖動。經過實測,我們在大壓力的情況下,性能的抖動依然可以控制在 3%,同時存儲空間的利用率提升了 17%。
在智能化上,對 DBA 來說,最頭疼的就是在系統出現亞健康狀態的時候,如何能夠快速感知到問題,及時地進行識別和分析,方便進一步操作。作為國內首個 AI-Native 數據庫,GaussDB 提供從應用開發到運維階段全流程的數據庫智能化體驗,有全新的 SQL Audit 工具,在開發驗證階段就完成 SQL 自動審核,減少亞健康出現的情況,一旦出現亞健康狀態,GaussDB 可以快速感知到問題,識別出實時慢 SQL,并進一步通過慢 SQL 的耗時點分析,自動診斷出是否處于被阻塞狀態,以便運維人員進行判斷查殺。在一些嚴重過載的情況下,我們還有過載熔斷能力可以自動 kill 過載會話,避免因個別慢 SQL 拖住整個系統。還有 DBMind 的慢 SQL 根因分析、索引推薦、異常檢測等多種運維功能也讓 DBA 更加得心應手。
除了上面講的這些硬核技術外,對于客戶關注的性價比、平滑遷移,GaussDB 的新版本也做了大量的工作。首先是海量數據帶來的存儲資源壓力。壓縮是一個辦法,但簡單的高壓縮比并不是我們追求的目標,我們更關注的是如何讓業務盡量無感地使用壓縮,并且性能不會有大幅降低,最好控制在 5%,甚至更低的性能影響,這才是真正有用的壓縮。我們既能夠降低資源的使用,對應用的侵入性更小。
其次,新版本還將支持內核多租戶的能力,幫助用戶可以快速在不同的租戶資源上進行遷移,讓應用使用更加靈活,資源利用率更高。
最后,GaussDB 有一站式的遷移解決方案,讓原本不確定的遷移工作變成一個確定性的事情。第一個就是我們的 UGO,可以對現有系統的所有應用進行掃描和評估,告訴我們哪些能夠兼容,哪些不能兼容,以及如何進行改造,現在我們已經做到 95%的自動化。第二個就是 DRS,可以實現在線零中斷遷移,并且通過數據比對保證數據零丟失。第三個是流量回放,和 UGO 配合,可以真實地抓取源數據庫上的流量,在新數據庫上進行回放,避免大家現在普遍遇到的覆蓋不全的問題。我認為,只有通過上述工程化可落地的方案,才能真正地實現國產數據庫的規模替換。
數據庫的發展,除了產品的創新,更離不開產學研用的通力合作。金融客戶是數據庫的重要出發點和落腳點,為 GaussDB 的發展起到了關鍵的作用。我們希望更多的金融客戶能夠開放自己更多的典型業務場景,基于分布式架構,來設計自己的多地多中心方案,形成最佳實踐,加速推進行業數字化轉型。我的分享就到這里,再次感謝在座的各位,謝謝大家!
審核編輯黃宇
-
數字化
+關注
關注
8文章
8774瀏覽量
61885 -
華為云
+關注
關注
3文章
2588瀏覽量
17473
發布評論請先 登錄
相關推薦
評論