規范在整個后端執行也有大半年的時間,對于整個團隊在開發階段就減少不恰當的建表語句、錯誤 SQL、錯誤的索引有積極的意義,故分享出來給大家參考。
下邊分為建表規約、SQL 規約、索引規約三個部分,每部分的每一條都有強制、建議兩個級別,大家在參考時,根據自己公司的情況來權衡。
建表規約
【強制】:①存儲引擎必須使用 InnoDB
解讀:InnoDB 支持事物、行級鎖、并發性能更好,CPU 及內存緩存頁優化使得資源利用率更高。
【強制】:②每張表必須設置一個主鍵 ID,且這個主鍵 ID 使用自增主鍵(在滿足需要的情況下盡量短),除非在分庫分表環境下
解讀:由于 InnoDB 組織數據的方式決定了需要有一個主鍵,而且若是這個主鍵 ID 是單調遞增的可以有效提高插入的性能,避免過多的頁分裂、減少表碎片提高空間的使用率。
而在分庫分表環境下,則需要統一來分配各個表中的主鍵值,從而避免整個邏輯表中主鍵重復。
【強制】:③必須使用 utf8mb4 字符集
解讀:在 MySQL 中的 UTF-8 并非“真正的 UTF-8”,而 utf8mb4”才是真正的“UTF-8”。
【強制】:④數據庫表、表字段必須加入中文注釋
解讀:大家都別懶。
【強制】:⑤庫名、表名、字段名均小寫,下劃線風格,不超過 32 個字符,必須見名知意,禁止拼音英文混用
解讀:約定。
【強制】:⑥單表列數目必須小于 30,若超過則應該考慮將表拆分
解讀:單表列數太多使得 MySQL 服務器處理 InnoDB 返回數據之間的映射成本太高。
【強制】:⑦禁止使用外鍵,如果有外鍵完整性約束,需要應用程序控制
解讀:外鍵會導致表與表之間耦合,UPDATE 與 DELETE 操作都會涉及相關聯的表,十分影響 SQL 的性能,甚至會造成死鎖。
【強制】:⑧必須把字段定義為 NOT NULL 并且提供默認值
解讀:
NULL 的列使索引/索引統計/值比較都更加復雜,對 MySQL 來說更難優化。
NULL 這種類型 MySQL 內部需要進行特殊處理,增加數據庫處理記錄的復雜性;同等條件下,表中有較多空字段的時候,數據庫的處理性能會降低很多。
NULL 值需要更多的存儲空,無論是表還是索引中每行中的 NULL 的列都需要額外的空間來標識。
【強制】:⑨禁用保留字,如 DESC、RANGE、MARCH 等
解讀:請參考 MySQL 官方保留字。
【強制】:⑩如果存儲的字符串長度幾乎相等,使用 CHAR 定長字符串類型
解讀:能夠減少空間碎片,節省存儲空間。
【建議】:?在一些場景下,考慮使用 TIMESTAMP 代替 DATETIME
解讀:
這兩種類型的都能表達"yyyy-MM-dd HHss"格式的時間,TIMESTAMP 只需要占用 4 個字節的長度,可以存儲的范圍為(1970-2038)年,在各個時區,所展示的時間是不一樣的。
而 DATETIME 類型占用 8 個字節,對時區不敏感,可以存儲的范圍為(1001-9999)年。
【建議】:?當心自動生成的 Schema,建議所有的 Schema 手動編寫
解讀:對于一些數據庫客戶端不要太過信任。
SQL 規約
【建議】:①為了充分利用緩存,不允許使用自定義函數、存儲函數、用戶變量
解讀:如果查詢中包含任何用戶自定義函數、存儲函數、用戶變量、臨時表、MySQL 庫中的系統表,其查詢結果都不會被緩存。
比如函數 NOW() 或者 CURRENT_DATE() 會因為不同的查詢時間,返回不同的查詢結果。
【強制】:②在查詢中指定所需的列,而不是直接使用“ *”返回所有的列 解讀:
讀取不需要的列會增加 CPU、IO、NET 消耗。
不能有效的利用覆蓋索引。
【強制】:③不允許使用屬性隱式轉換
解讀:假設我們在手機號列上添加了索引,然后執行下面的 SQL 會發生什么?
explain SELECT user_name FROM parent WHERE phone=13812345678;很明顯就是索引不生效,會全表掃描。
【建議】:④在 WHERE 條件的屬性上使用函數或者表達式
解讀:MySQL 無法自動解析這種表達式,無法使用到索引。 【強制】:⑤禁止使用外鍵與級聯,一切外鍵概念必須在應用層解決
解讀:外鍵與級聯更新適用于單機低并發,不適合分布式、高并發集群;級聯更新是強阻塞,存在數據庫更新風暴的風險;外鍵影響數據庫的插入速度。
【建議】:⑥應盡量避免在 WHERE 子句中使用 or 作為連接條件
解讀:根據情況可以選擇使用 UNION ALL 來代替 OR。 【強制】:⑦不允許使用 % 開頭的模糊查詢
解讀:根據索引的最左前綴原理,%開頭的模糊查詢無法使用索引,可以使用 ES 來做檢索。
索引規約
【建議】:①避免在更新比較頻繁、區分度不高的列上單獨建立索引
解讀:區分度不高的列單獨創建索引的優化效果很小,但是較為頻繁的更新則會讓索引的維護成本更高。 【強制】:②JOIN 的表不允許超過五個。需要 JOIN 的字段,數據類型必須絕對一致; 多表關聯查詢時,保證被關聯的字段需要有索引
解讀:太多表的 JOIN 會讓 MySQL 的優化器更難權衡出一個“最佳”的執行計劃(可能性為表數量的階乘),同時要注意關聯字段的類型、長度、字符編碼等等是否一致。 【強制】:③在一個聯合索引中,若第一列索引區分度等于 1,那么則不需要建立聯合索引
解讀:索引通過第一列就能夠完全定位的數據,所以聯合索引的后邊部分是不需要的。 【強制】:④建立聯合索引時,必須將區分度更高的字段放在左邊
解讀:區分度更高的列放在左邊,能夠在一開始就有效的過濾掉無用數據。提高索引的效率,相應我們在 Mapper 中編寫 SQL 的 WHERE 條件中有多個條件時,需要先看看當前表是否有現成的聯合索引直接使用,注意各個條件的順序盡量和索引的順序一致。 【建議】:⑤利用覆蓋索引來進行查詢操作,避免回表
解讀:覆蓋查詢即是查詢只需要通過索引即可拿到所需 DATA,而不再需要再次回表查詢,所以效率相對很高。
我們在使用 EXPLAIN 的結果,extra 列會出現:"using index"。這里也要強調一下不要使用“SELECT * ”,否則幾乎不可能使用到覆蓋索引。
【建議】:⑥在較長 VARCHAR 字段,例如 VARCHAR(100) 上建立索引時,應指定索引長度,沒必要對全字段建立索引,根據實際文本區分度決定索引長度即可
解讀:索引的長度與區分度是一對矛盾體,一般對字符串類型數據,若長度為 20 的索引,區分度會高達 90% 以上,則可以考慮創建長度例為 20 的索引,而非全字段索引。
例如可以使用 SELECT COUNT(DISTINCT LEFT(lesson_code, 20))/COUNT(*) FROM lesson;來確定 lesson_code 字段字符長度為 20 時文本區分度。
【建議】:⑦如果有 ORDER BY 的場景,請注意利用索引的有序性
ORDER BY 最后的字段是聯合索引的一部分,并且放在索引組合順序的最后,避免出現 file_sort 的情況,影響查詢性能。
解讀:
假設有查詢條件為 WHERE a=? and b=? ORDER BY c;存在索引:a_b_c,則此時可以利用索引排序。
反例:在查詢條件中包含了范圍查詢,那么索引有序性無法利用,如:WHERE a>10 ORDER BY b;索引 a_b 無法排序。
【建議】:⑧在 Where 中索引的列不能某個表達式的一部分,也不能是函數的參數
解讀:即是某列上已經添加了索引,但是若此列成為表達式的一部分、或者是函數的參數,MySQL 無法將此列單獨解析出來,索引也不會生效。 【建議】:⑨我們在 Where 條件中使用范圍查詢時,索引最多用于一個范圍條件,超過一個則后邊的不走索引
解讀:MySQL 能夠使用多個范圍條件里邊的最左邊的第一個范圍查詢,但是后邊的范圍查詢則無法使用。 【建議】:⑩在多個表進行外連接時,表之間的關聯字段類型必須完全一致
解讀:當兩個表進行 Join 時,字段類型若沒有完全一致,則加索引也不會生效,這里的完全一致包括但不限于字段類型、字段長度、字符集、Collection 等等。
參考資料:
《High.Performance.MySQL.3rd.Edition》
《阿里巴巴java開發手冊》
責任編輯:xj
原文標題:CTO 要我把這份 MySQL 規范貼在工位上!
文章出處:【微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。
-
數據庫
+關注
關注
7文章
3841瀏覽量
64544 -
MySQL
+關注
關注
1文章
821瀏覽量
26651
原文標題:CTO 要我把這份 MySQL 規范貼在工位上!
文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論