大家也許開發過高并發的系統或者秒殺程序,但肯定都有接觸過,像電商平臺的秒殺、搶購等活動,還有12306春運搶票。
互聯網公司,做一些有獎活動,而且數量有限,獎品給力,如果是先到先得的策略,那就類似秒殺系統了。
這類系統最大的問題就是活動周期短,瞬間流量大(高并發),很少人可以成功下單,絕大多數人都是很遺憾。所以從運營體驗上,沒有成功下單的人,心里肯定是不好受的,如果這時候,因為技術、網絡問題,影響用戶體驗,那就更是罵聲一片。
這里,就來講一講技術在這種情況下,會發生和要做的事。
下面是基本的概念的建立。
第一:高并發
技術要做的事,一方面優化程序,讓程序性能最優,單次請求時間能從50ms優化到25ms,那就可以在一秒鐘內成功響應翻倍的請求了。
另一方面就是增加服務器,用更大的集群來處理用戶請求,設計好一個可靠且靈活擴充的分布式方案就更加重要了。
第二:時間短
火熱的秒殺活動,真的是一秒鐘以內就會把商品搶購一空,而大部分用戶的感受是,提交訂單的過程卻要等待好幾秒、甚至十幾秒,更糟糕的當然是請求報錯。
那么一個好的秒殺體驗,當然希望盡可能減少用戶等待時間,準確的提示用戶當前是否還有商品庫存。而這些,也是需要有優秀的程序設計來保證的。
第三:系統容量預估
系統設計的時候,都需要有一個容量預估,那就是要提前計算好,我們設計的系統,要承載多大的數量級。
假如線上前端服務器規格是8核16G內存的服務器,而提交訂單的處理程序耗時100ms,那么可以簡單計算一下:
每秒可以處理的訂單請求數=1000ms/100ms*8=80qps
上面這個結果,對于秒殺系統來說,肯定是非常不理想的。
如果能將處理程序耗時優化后,降低到10ms,那么就可以達到800qps。
如果我們可以把程序繼續優化,能快速區分開有庫存和無庫存處理,那么無庫存時處理就有可能做到1ms甚至更低的耗時。這樣無庫存時就能有更好的性能,上萬的qps也是可以達到的。
上面的預估,都是針對單機,那么簡單的增加前端服務器,是不是就能有更好的并發處理量呢?
肯定沒這么簡單,因為數據庫、緩存系統甚至機房網絡帶寬都會成為瓶頸。
于是就要有一個更好的分布式方案。
第四:好的分布式方案
一個好的分布式方案,首先當然是穩定可靠,不要出亂子,然后就是方便擴充,最好的效果當然是增加一臺服務器,并發處理量可以1:1線性增長。
比如:單機qps是1k,那么10臺服務器可以做到1w,100臺可以做到10w每秒。
要做到這樣的線性增長效果,就要杜絕出現瓶頸,否則還是會代價太大。
拒絕假的分布式尤其重要,比如:前端服務器是可以獨立存在的,但是都依賴集中的一個數據庫或者緩存系統,那最后,一定是集中的那個數據庫或者緩存系統受不了,同樣無法做到一個好的分布式。
第五:關注系統的瓶頸
大家先有幾個基本的共識,系統的處理速度
程序內數據讀寫 > redis > mysql > 磁盤
單機網絡請求 > 局域網內請求 > 跨機房請求
我們優化程序的時候,盡量用最快的方式,盡量用最簡短的邏輯。
用redis替代mysql來保存訂單處理中依賴的數據,用程序中的提交的數據代替從redis中二次獲取數據,比如:商品庫存信息,用戶訂單信息。
邏輯處理中,把速度快且提前中斷的邏輯放在最前面,比如:驗證登錄,驗證問答。
我們做分布式方案的時候,盡量把資源調用放在最近的地方。
前端服務器依賴的數據盡量就在局域網內,如果能在單機都有讀的redis服務當然更好,程序維護數據響應會復雜些。
不要出現跨機房網絡請求,不要出現跨機房網絡請求,不要出現跨機房網絡請求,重要的事情說三遍。
第六:什么語言更適合這類系統
課程中用的是PHP語言,開發這類系統也是沒問題的。
當然,像是用golang, ngx_lua可能在高并發和性能方面會更有優勢。
如果使用java、.net當然也是可以的,作為一個系統,語言只是工具,更好的設計和優化,才能達到最終想要的效果。
有了上面的基本概念,我們接下來再來看看,具體運行時,會出現什么狀況。
下面是一些具體的問題:
問題1:庫存超賣
只有10個庫存,但是一秒鐘有1k個訂單,怎么能不超賣呢?
核心思想就是保證庫存遞減是原子性操作,10--返回9,9--返回8,8--返回7。
而不能是讀取出來庫存10,10-1=9再更新回去。因為這個讀取和更新是并發執行的,很可能就會有1k個訂單都成功了,而庫存實際只有10。
那么,怎么保證原子性操作呢?
1 數據庫:
update product set left_num=left_num-1 where left_num>0;
這里用到的是left_num=left_num-1,如果left_num>0才能執行成功,數據庫查詢、更新的時候有用到鎖,是可以保證更新操作的原子性的。
數據庫性能較差,不建議使用。
2 分布式鎖
用redis來做一個分布式鎖,reids->setnx('lock', 1) 設置一個鎖,程序執行完成再del這個鎖。
鎖定的過程,不利于并發執行,大家都在等待鎖解開,不建議使用。
3 消息隊列
將訂單請求全部放入消息隊列,然后另外一個后臺程序一個個處理隊列中的訂單請求。
并發不受影響,但是用戶等待的時間較長,進入隊列的訂單也會很多,體驗上并不好,也不建議使用。
4 redis遞減
通過 redis->incrby('product', -1) 得到遞減之后的庫存數。
性能方面很好,同時體驗上也很好,在PHP秒殺課程中,優化后就是用的這種方法,而沒有使用上述其他方法,大家應該也能對比了解啦。
問題2:集群怎么來規劃
前端服務器因為沒有相互間關聯,集群的數量不受影響。
redis的性能可以達到每秒幾萬次響應,所以一個集群的規模,也就是redis服務可以承載的數量。
比如:一臺前端服務器是1~2k的qps(有庫存時),那么10臺+1臺redis就可以是一個獨立的集群,可以支撐1~2w每秒訂單量。
10個上述的集群就可以做到一秒鐘處理10w~20w的有效訂單。
如果秒殺活動的庫存量在1w以內,預計參與的人數在百萬左右,那么有一個集群也就可以搞定。
如果秒殺參與的人數超過千萬,那么就要用到不止一個集群了。
問題3:多個集群的數據怎么保持一致性
不要做多集群的數據同步,而是用散列,每個集群的數據是獨立存在的。
假設,有10個商品,每個商品有1w庫存,規劃用10個集群,那么每個集群有10個商品,每個商品是1k庫存。
每個集群只需要負責把自己的庫存賣掉即可,至于說,會不會有用戶知道有10個集群,然后每個集群都去搶。
這種情況就不要用程序來處理了,利用運營規則,活動結束后匯總訂單的時候再去處理就好了。
如果擔心散列的不合理,比如:某個集群用戶訪問量特別少,那么可以引入一個中控服務,來監控各個集群的庫存,然后再做平衡。
問題4:機器人搶購怎么辦:
沒什么太好的辦法,類似DDOS攻擊,只能是讓自身更強大才是王道。
運營策略上,可以嚴格控制用戶注冊,必須登錄,提交訂單的時候引入圖像驗證碼,問答,交互式驗證等。
上面的內容不知道大家還會有什么疑問,可以給我留言。
具體的關于高并發、秒殺的實戰內容,在課程中也有詳細的講解,這里用文字的形式提煉整理出來,希望能更好的幫助大家理解,謝謝~
-
服務器
+關注
關注
12文章
9256瀏覽量
85755 -
數據庫
+關注
關注
7文章
3841瀏覽量
64545
原文標題:關于高并發和秒殺系統,你知道的和不知道的一些事
文章出處:【微信號:C_Expert,微信公眾號:C語言專家集中營】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論