變更數據捕獲 (CDC) 廣義上定義為跟蹤數據庫中的變更。跟蹤更改的目的多種多樣。嵌入式數據庫系統中的 CDC 可以通過幾種不同的方式實現,這些方式有時對應用程序是不可見的,也可以通過這些方式實現應用程序用于數據共享、響應事件和增量備份。
在嵌入式數據庫中實現CDC的第一個(也可能是最明顯的)是實現事務的ACID屬性的一部分:原子性,一致性,隔離性和持久性。將事務成功應用于數據庫會將該數據庫從一個一致狀態移動到一個新的一致狀態。相反,不成功將事務應用于數據庫必須將數據庫返回到在成功應用事務之前存在的一致狀態。為了滿足這些要求,數據庫管理系統必須跟蹤更改。實現細節因數據庫系統而異,甚至在數據庫系統系列中,從純內存中數據庫、持久內存中數據庫以及部分或完全持久數據庫(混合數據庫)也有所不同。
對于純內存數據庫,沒有記錄更改的事務日志。因此,在事務處于活動狀態時,更改或更改記錄的前映像都需要保存在緩沖區中,以便在事務中止時可以將數據庫還原到其事務前狀態。
對于具有持久性的內存中數據庫,所有更改也會追加到存儲在持久性媒體上的事務日志中,該事務日志可在崩潰后重播以進行恢復。
對于持久性(基于磁盤的)數據庫,還利用事務日志記錄來優化性能和支持從崩潰中恢復。在這種情況下,可以提供兩種形式的事務日志記錄:撤消日志記錄和預寫日志記錄 (WAL)。WAL 如上一段所述。撤消日志記錄將已更改記錄的前映像寫入事務日志文件。在發生崩潰時,UNDO 日志信息用于回滾不完整的事務(即將數據庫返回到上一個一致狀態)。
CDC在某些數據庫系統中的另一個內部用途是通過MVCC(多版本并發控制)實現樂觀并發控制。樂觀并發控制意味著應用程序不必獲取鎖,這也意味著應用程序永遠不必等待另一個應用程序持有的鎖。這要求數據庫系統知道兩個應用程序是否同時嘗試修改同一個數據庫對象。這是通過跟蹤提交事務時檢查的版本號來完成的(因此稱為多版本并發控制)。如果對象的版本在應用程序獲取對象副本和應用程序想要提交對該對象的更改之間發生了更改,則意味著另一個應用程序首先修改了基礎對象,必須中止并重試此事務。MVCC 背后的理論是,這種沖突很少見,并且偶爾重試比總是必須獲取鎖并可能使用這些鎖阻止其他應用程序更有效。
CDC 還用于需要“五個 9”可用性(即 99.999% 正常運行時間)的系統的高可用性 (HA) 實施中。HA 由不同的數據庫供應商以不同的方式實現:實時事務復制、SQL 語句復制、日志文件轉發等。有所謂的 1-safe(又名惰性、異步)和 2-safe(又名 eager、同步)實現。例如,實時事務復制可以是 1 安全或 2 安全(在eXtremeDB 中,我們將其稱為時間識別兩階段提交);日志轉發本質上是 1 安全的。
CDC 可在嵌入式數據庫和/或第三方系統中用于可在應用程序中使用的其他目的:開放復制、觸發器/事件通知和增量備份。
一些嵌入式數據庫系統實現復制,例如,支持高可用性和/或數據庫集群。此類系統使得在同一數據庫系統的兩個或多個實例之間復制數據或事務變得容易,但是當需要從嵌入式數據庫復制到任何其他目標時,它們不是解決方案。有第三方產品試圖填補這一空白,例如Actian DataConnect和Oracle Golden Gate。或者通過自定義提取-轉換-加載 (ETL) 解決方案,該解決方案可能對源和/或目標數據庫中的更改敏感。
觸發器和事件通知方案是變更數據捕獲的典型用例。畢竟,觸發器是在指定表的 INSERT、UPDATE 或 DELETE 語句執行時觸發的。換句話說,數據已經改變,觸發器捕獲了該變化,以便周圍系統以某種方式采取行動。
嵌入式數據庫系統中變更數據捕獲的最后一個重要目的是實現增量備份設施。增量備份方案必須知道在上次完整快照或上次增量備份之間數據庫中發生的增量更改。
結論
變更數據捕獲是任何數據庫管理系統的核心。它有助于實現并發性和持久性、復制、觸發器/事件通知以及備份和還原的 ACID 屬性。
審核編輯:郭婷
-
嵌入式
+關注
關注
5087文章
19145瀏覽量
306134 -
數據庫
+關注
關注
7文章
3826瀏覽量
64509 -
觸發器
+關注
關注
14文章
2000瀏覽量
61222
發布評論請先 登錄
相關推薦
評論