上周末系統變更,配合DBA在IBM小型機上升級DB2的數據庫版本,貌似很平常的一件事,但是心里卻起了波瀾。
外面的世界早就變了樣,而我們卻依然在DB2這條路上慣性前行。
1977年,硅谷一個30多歲的男人,憑借IBM的一個“失誤”,成功開發了世界上使用最廣泛,最成功的關系型數據庫產品,就是后來的Oracle。到了1995年,IBM才發布了其關系型數據庫產品,DB2。
而我,直到2003年,才開始學習DB2,起步晚不說,還是個冷門。一轉眼,在這條路走了十多年,為什么不換條路呢?
數字化轉型的新基建
今天,像Oracle、DB2這樣的傳統關系型數據庫已經風光了30多年,至于未來,他們應該還會存在,但是我們看到的是,越來越多的應用場景被新產品和新技術替代。
目前,大多數NoSQL都是面向特定任務而設計出來的,這讓我們有了更多的選擇,如果一味的只用關系型數據庫,可能會適得其反。
鍵值,列式,文檔和圖,四種NoSQL就像是四大名捕,各個身懷絕技。尤其是圖數據庫,這兩年特別火。根據Garnter的研究分析,未來幾年,圖數據庫將會以100%的速度增長。
最近在看任澤平等人合著的《新基建》,書中提到凡是符合未來新時代經濟社會發展需要的基礎設施都叫“新基建”。
相對于傳統的關系型數據庫,新型的圖數據庫就像是數據中心里的“新基建”,可以從數據挖掘的視角,去審視和發現大數據中存在的有價值的關系。
什么是圖數據庫?
我們今天所說的圖(Graph),是圖論的主要研究對象,是由若干頂點(Vertices)和邊(Edges)組成的,用來存儲實體的相關屬性以及它們之間的關系信息。
圖實際上是一個很古老的概念,最早出現在瑞士數學家歐拉的學術論文中,試圖解決一個叫“哥尼斯堡七橋”的問題。
隨著社交、電商、零售等行業的迅猛發展,這些行業逐漸形成了一張張基于大數據的關系網,如何發現關系,利用關系是亟需解決的問題。
而在面對復雜復雜關系的處理上,圖是最佳的解決方案。利用圖表現對象與對象之間的關系,在圖上運用數學算法求解就可以有效解決鏈接爆炸的問題,降低復雜性,簡化查詢。
說起圖應用的案例,其實很多,最著名的就是Google的PageRank算法,再比如Linkedin用圖管理社交關系,實現好友推薦,Amazon用圖實現實時的商品推薦,商業銀行用圖做風控、實現反欺詐和反洗錢。
虎虎生威的TigerGraph
說起圖數據庫,不得不提大名鼎鼎的Neo4j,尤其是其Cypher查詢語言,讓人有種耳目一新的感覺。
不過由于Neo4j社區版的功能有限,影響了其適用范圍。目前開源軟件社區中還有其他幾個競品,DGraph和JanusGraph,這二者都原生支持分布式,但是不支持SQL。另外一個重要的特征是,DGraph支持原生存儲,而JanusGraph需要借助外部存儲系統,導致其運維成本非常高。
后來,朋友向我推薦了一個第三代圖數據庫(Graph 3.0)的新產品,TigerGraph,與其技術人員交流后,發現產品確實有過人之處。
總結一下我對TigerGraph學習和理解:
支持原生圖存儲,使得空間占用更少,相比傳統關系型數據庫在容量上平均減少50%。
支持并行計算的分布式部署,高效并行加載數據,支持數據分片,利于橫向擴展。
支持HTAP混合交易負載,可以很好的處理數十億的實體和數千億的關系,實現亞秒級的查詢響應和更多跳的深度鏈接分析。
提供GSQL的專用查詢語言和GraphStudio可視化開發套件。不過TigerGrpah的GSQL與Neo4j的Cypher語法有一定的差別,目前二者正在制定新一代的GQL,專門用于圖數據庫查詢。
當然,TigerGraph還有很多特性,比如支持用戶可擴展的圖算法庫等,唯一美中不足的地方,TigerGraph是一款閉源軟件。
關于圖的一些思考
雖然圖數據庫在國內互聯網行業應用較多,但是在金融保險領域的案例其實還很少。我司早期嘗試利用圖數據庫技術實現了家族營銷的業務創新。
組織是人的組織,組織內部的關系也很重要。今天看到網上有文章講保險代理人的模式,從傳統的金字塔開始向前端小團隊、后端大平臺的方向發展,利用平臺賦能扁平靈活的小組織。關于營銷組織中的痛點,是不是也可以通過圖計算進行優化,提升代理人隊伍的管理效率呢?
另一方面,在我自己專業的業務連續性管理方面,也是很好的圖計算應用場景,但是從建模到落地實施,估計也是長路漫漫。目前市面上的產品,好像也沒聽到過哪家是基于圖的方式研發的。
早期我們看到的MySQL對與Oracle的替代,使用的是分庫分表,讀寫分離的套路,其實不過是一個維度上的兩個點在競爭,但當你升到更高的維度,用圖的方式重構數據時,就不再是彎道超車,屌絲逆襲了,而是變道超車,決勝千里。
目前的很多創新,都是在外圍展開的,對于真正核心的應用改造,無論在應用場景,還是理念上都有所欠缺。都知道創新這條路不好走,但如果是戰略性的,就要敢于投入,畢竟一旦成功,收益遠大于支出。
夢想總是要有的,萬一實現了呢。
DBA這碗飯還能吃多久
在一些有規模的公司里,DBA大概分成兩類。一類面向運維的,主要負責穩定運行、性能調優等;另一類,面向應用開發,主要是業務建模。
在Oracle最新的19C中,已經開始講自動駕駛“Self-Driven”的概念了,試圖通過人工智能完成數據庫自治。
從前,Oracle數據庫除了專業的模型設計外,還提供大量的可配置參數,給了傳統DBA很大的操作空間,而現在,隨著數據庫產品自身越來越智能,DBA可操作的余地變少了,價值越來越低,就算遇上難纏的性能問題,也可以通過閃存這樣硬件幫忙把坑填了,而且速度還杠杠的,絕對比DBA優化好使。
另一方面,自動化運維平臺也越來越普及,很多工作,在頁面上點點按鈕就搞定了,復雜的實施工作都被平臺屏蔽掉了。就好像那句話, 離開了平臺,你還是DBA,但有了平臺,你就是操作員。
沒有崗位是一成不變的,隨著像圖數據庫這樣的新技術的出現,讓一些傳統架構下的復雜事務,變得簡單高效,性能甚至是百倍的提升。而分布式,多副本的集群技術,也讓原來的可用性和性能問題也逐漸弱化,DBA們也差不多是時候考慮轉轉型了。
寫在最后
當年,董事長提過新三大件,“買房、買車、買保險”。
房子,最重要的是什么?位置、位置、位置
汽車,最重要的是什么?安全、安全、安全
保險、最重要的是什么?保障、保障、保障
今天,你看看賣房的中介,從鏈家的VR視頻看房,到基于行業圖譜的貝殼找房,各個都是科技賦能的高手。
但是,對于保險公司,最重要的是,隊伍!隊伍!隊伍!
董事長說我們是一家偉大的銷售公司,科技賦能業務。當我們把各個渠道的代理人、客戶和產品等這些實體和關系,借助圖數據庫技術,充分發揮計算優勢,進行深度的鏈接分析時,就是科技賦能隊伍,從而打造出一支高效能的、武裝精良的特種部隊。
如果把傳統的關系型數據表比作Excel,那么Graph就可以被比作PPT。兩樣技能肯定都是需要的,但是如果用來展現,你說哪個好?當然是,有圖有真相。
DBA從來都不是我職業的全部,但我依然選擇做一個隱形的DBA。
責任編輯:lq
-
數據庫
+關注
關注
7文章
3845瀏覽量
64626 -
數字化
+關注
關注
8文章
8846瀏覽量
62091 -
新基建
+關注
關注
4文章
811瀏覽量
23400
原文標題:Hello,圖數據庫!再見,DBA!
文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論