在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深入理解Linux傳統的System Call I/O

GReq_mcu168 ? 來源:CSDN博客 ? 作者:范桂颶 ? 2021-11-19 09:52 ? 次閱讀

傳統的 System Call I/O

Linux 系統中,傳統的訪問方式是通過 write() 和 read() 兩個系統調用實現的,通過 read() 函數讀取文件到到緩存區中,然后通過 write() 方法把緩存中的數據輸出到網絡端口

read(file_fd, tmp_buf, len);write(socket_fd, tmp_buf, len);

下圖分別對應傳統 I/O 操作的數據讀寫流程,整個過程涉及 2 次 CPU 拷貝、2 次 DMA 拷貝,總共 4 次拷貝,以及 4 次上下文切換。

CPU 拷貝:

由 CPU 直接處理數據的傳送,數據拷貝時會一直占用 CPU 的資源。

DMA 拷貝:

由 CPU 向DMA磁盤控制器下達指令,讓 DMA 控制器來處理數據的傳送,數據傳送完畢再把信息反饋給 CPU,從而減輕了 CPU 資源的占有率。

上下文切換:

當用戶程序向內核發起系統調用時,CPU 將用戶進程從用戶態切換到內核態;

當系統調用返回時,CPU 將用戶進程從內核態切換回用戶態。

讀操作

當應用程序執行 read 系統調用讀取一塊數據的時候,如果這塊數據已經存在于用戶進程的頁內存中,就直接從內存中讀取數據。

如果數據不存在,則先將數據從磁盤加載數據到內核空間的讀緩存(Read Buffer)中,再從讀緩存拷貝到用戶進程的頁內存中。

read(file_fd, tmp_buf, len);

基于傳統的 I/O 讀取方式,read 系統調用會觸發 2 次上下文切換,1 次 DMA 拷貝和 1 次 CPU 拷貝。

發起數據讀取的流程如下:

用戶進程通過 read() 函數向 Kernel 發起 System Call,上下文從 user space 切換為 kernel space。

CPU 利用 DMA 控制器將數據從主存或硬盤拷貝到 kernel space 的讀緩沖區(Read Buffer)。

CPU 將讀緩沖區(Read Buffer)中的數據拷貝到 user space 的用戶緩沖區(User Buffer)。

上下文從 kernel space 切換回用戶態(User Space),read 調用執行返回。

寫操作

當應用程序準備好數據,執行 write 系統調用發送網絡數據時,先將數據從用戶空間的頁緩存拷貝到內核空間的網絡緩沖區(Socket Buffer)中,然后再將寫緩存中的數據拷貝到網卡設備完成數據發送。

write(socket_fd, tmp_buf, len);

基于傳統的 I/O 寫入方式,write() 系統調用會觸發 2 次上下文切換,1 次 CPU 拷貝和 1 次 DMA 拷貝。

用戶程序發送網絡數據的流程如下:

用戶進程通過 write() 函數向 kernel 發起 System Call,上下文從 user space 切換為 kernel space。

CPU 將用戶緩沖區(User Buffer)中的數據拷貝到 kernel space 的網絡緩沖區(Socket Buffer)。

CPU 利用 DMA 控制器將數據從網絡緩沖區(Socket Buffer)拷貝到 NIC 進行數據傳輸。

上下文從 kernel space 切換回 user space,write 系統調用執行返回。

網絡 I/O

磁盤 I/O

高性能優化的 I/O

零拷貝技術。

多路復用技術。

頁緩存(PageCache)技術。

其中,頁緩存(PageCache)是操作系統對文件的緩存,用來減少對磁盤的 I/O 操作,以頁為單位的,內容就是磁盤上的物理塊,頁緩存能幫助程序對文件進行順序讀寫的速度幾乎接近于內存的讀寫速度,主要原因就是由于 OS 使用 PageCache 機制對讀寫訪問操作進行了性能優化。

頁緩存讀取策略:當進程發起一個讀操作 (比如,進程發起一個 read() 系統調用),它首先會檢查需要的數據是否在頁緩存中:

如果在,則放棄訪問磁盤,而直接從頁緩存中讀取。

如果不在,則內核調度塊 I/O 操作從磁盤去讀取數據,并讀入緊隨其后的少數幾個頁面(不少于一個頁面,通常是三個頁面),然后將數據放入頁緩存中。

頁緩存寫策略:當進程發起 write 系統調用寫數據到文件中,先寫到頁緩存,然后方法返回。此時數據還沒有真正的保存到文件中去,Linux 僅僅將頁緩存中的這一頁數據標記為 “臟”,并且被加入到臟頁鏈表中。

然后,由 flusher 回寫線程周期性將臟頁鏈表中的頁寫到磁盤,讓磁盤中的數據和內存中保持一致,最后清理“臟”標識。在以下三種情況下,臟頁會被寫回磁盤:

空閑內存低于一個特定閾值。

臟頁在內存中駐留超過一個特定的閾值時。

當用戶進程調用 sync() 和 fsync() 系統調用時。

存儲設備的 I/O 棧

從系統調用的接口再往下,Linux 下的 IO 棧致大致有三個層次:

文件系統層,以 write 為例,內核拷貝了 write 參數指定的用戶態數據到文件系統 Cache 中,并適時向下層同步。

塊層,管理塊設備的 IO 隊列,對 IO 請求進行合并、排序(還記得操作系統課程學習過的 IO 調度算法嗎?

)。

設備層,通過 DMA 與內存直接交互,完成數據和具體設備之間的交互。

結合這個圖,想想 Linux 系統編程里用到的 Buffered IO、mmap、Direct IO,這些機制怎么和 Linux I/O 棧聯系起來呢?上面的圖有點復雜,我畫一幅簡圖,把這些機制所在的位置添加進去:

f0bcdbac-43ac-11ec-b939-dac502259ad0.png

Linux IO系統

這下一目了然了吧?傳統的 Buffered IO 使用 read 讀取文件的過程什么樣的?假設要去讀一個冷文件(Cache 中不存在),open 打開文件內核后建立了一系列的數據結構,接下來調用 read,到達文件系統這一層,發現 Page Cache 中不存在該位置的磁盤映射,然后創建相應的 Page Cache 并和相關的扇區關聯。然后請求繼續到達塊設備層,在 IO 隊列里排隊,接受一系列的調度后到達設備驅動層,此時一般使用 DMA 方式讀取相應的磁盤扇區到 Cache 中,然后 read 拷貝數據到用戶提供的用戶態 buffer 中去(read 的參數指出的)。

整個過程有幾次拷貝?從磁盤到 Page Cache 算第一次的話,從 Page Cache 到用戶態 buffer 就是第二次了。而 mmap 做了什么?mmap 直接把 Page Cache 映射到了用戶態的地址空間里了,所以 mmap 的方式讀文件是沒有第二次拷貝過程的。

那 Direct IO 做了什么?這個機制更狠,直接讓用戶態和塊 IO 層對接,直接放棄 Page Cache,從磁盤直接和用戶態拷貝數據。好處是什么?寫操作直接映射進程的buffer到磁盤扇區,以 DMA 的方式傳輸數據,減少了原本需要到 Page Cache 層的一次拷貝,提升了寫的效率。對于讀而言,第一次肯定也是快于傳統的方式的,但是之后的讀就不如傳統方式了(當然也可以在用戶態自己做 Cache,有些商用數據庫就是這么做的)。

除了傳統的 Buffered IO 可以比較自由的用偏移+長度的方式讀寫文件之外,mmap 和 Direct IO 均有數據按頁對齊的要求,Direct IO 還限制讀寫必須是底層存儲設備塊大小的整數倍(甚至 Linux 2.4 還要求是文件系統邏輯塊的整數倍)。所以接口越來越底層,換來表面上的效率提升的背后,需要在應用程序這一層做更多的事情。所以想用好這些高級特性,除了深刻理解其背后的機制之外,也要在系統設計上下一番功夫。

I/O Buffering

f121afa0-43ac-11ec-b939-dac502259ad0.png

如圖,當程序調用各類文件操作函數后,用戶數據(User Data)到達磁盤(Disk)的流程如圖所示。

圖中描述了 Linux 下文件操作函數的層級關系和內存緩存層的存在位置。中間的黑色實線是用戶態和內核態的分界線。

從上往下分析這張圖:

1. 首先是 C 語言 stdio 庫定義的相關文件操作函數,這些都是用戶態實現的跨平臺封裝函數。stdio 中實現的文件操作函數有自己的 stdio buffer,這是在用戶態實現的緩存。此處使用緩存的原因很簡單 — 系統調用總是昂貴的。如果用戶代碼以較小的 size 不斷的讀或寫文件的話,stdio 庫將多次的讀或者寫操作通過 buffer 進行聚合是可以提高程序運行效率的。stdio 庫同時也支持 fflush 函數來主動的刷新 buffer,主動的調用底層的系統調用立即更新 buffer 里的數據。特別地,setbuf 函數可以對 stdio 庫的用戶態 buffer 進行設置,甚至取消 buffer 的使用。

2. 系統調用的 read/write 和真實的磁盤讀寫之間也存在一層 buffer,這里用術語 Kernel buffer cache 來指代這一層緩存。在 Linux 下,文件的緩存習慣性的稱之為 Page Cache,而更低一級的設備的緩存稱之為 Buffer Cache。這兩個概念很容易混淆,這里簡單的介紹下概念上的區別:Page Cache 用于緩存文件的內容,和文件系統比較相關。文件的內容需要映射到實際的物理磁盤,這種映射關系由文件系統來完成;Buffer Cache 用于緩存存儲設備塊(比如磁盤扇區)的數據,而不關心是否有文件系統的存在(文件系統的元數據緩存在 Buffer Cache 中)。

作者:范桂颶原文:https://is-cloud.blog.csdn.net/article/details/105897963

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10878

    瀏覽量

    212169
  • Linux
    +關注

    關注

    87

    文章

    11319

    瀏覽量

    209832
  • 網絡
    +關注

    關注

    14

    文章

    7580

    瀏覽量

    88933

原文標題:深入理解 Linux的 I/O 系統

文章出處:【微信號:mcu168,微信公眾號:硬件攻城獅】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    深入探討Linux系統中的動態鏈接庫機制

    異常或崩潰。為深入理解動態鏈接機制及其工作原理,我重溫了《程序員的自我修養》,并通過實踐演示與反匯編分析,了解了動態鏈接的過程。 本文將深入探討Linux系統中的動態鏈接庫機制,這其中包括但不限于全局符號介入(Global Sy
    的頭像 發表于 12-18 10:06 ?133次閱讀
    <b class='flag-5'>深入</b>探討<b class='flag-5'>Linux</b>系統中的動態鏈接庫機制

    深入理解C語言:循環語句的應用與優化技巧

    能讓你的代碼更加簡潔明了,還能顯著提升程序執行效率。本文將詳細介紹C語言中的三種常見循環結構——while循環、for循環和do...while循環,帶你深入理解
    的頭像 發表于 12-07 01:11 ?194次閱讀
    <b class='flag-5'>深入理解</b>C語言:循環語句的應用與優化技巧

    深入理解 Llama 3 的架構設計

    最新的自然語言處理(NLP)技術和深度學習算法,旨在提供更加自然、流暢和智能的對話體驗。 1. 核心組件 Llama 3的架構設計可以分為以下幾個核心組件: 1.1 預處理模塊 預處理模塊負責將原始文本數據轉換為模型可以理解的格式。這包括文本清洗
    的頭像 發表于 10-27 14:41 ?577次閱讀

    直接I/O

    電子發燒友網站提供《直接I/O庫.pdf》資料免費下載
    發表于 10-14 10:55 ?0次下載
    直接<b class='flag-5'>I</b>/<b class='flag-5'>O</b>庫

    物聯網中常見的I/O擴展電路設計方案_IIC I/O擴展芯片

    物聯網系統中為什么要使用 IIC I/O擴展芯片 ??在物聯網系統中使用IIC(也稱為I2C)I/O擴展芯片的原因主要可以歸結為以下幾點:
    的頭像 發表于 09-24 11:29 ?546次閱讀
    物聯網中常見的<b class='flag-5'>I</b>/<b class='flag-5'>O</b>擴展電路設計方案_IIC <b class='flag-5'>I</b>/<b class='flag-5'>O</b>擴展芯片

    深入理解FPD-link III ADAS解串器HUB產品

    電子發燒友網站提供《深入理解FPD-link III ADAS解串器HUB產品.pdf》資料免費下載
    發表于 09-06 09:58 ?1次下載
    <b class='flag-5'>深入理解</b>FPD-link III ADAS解串器HUB產品

    深入理解Camera的整體五層架構

    Linux為視頻采集設備制定了標準的V4L2接口,并在內核中實現了其基礎框架V4L2 Core。用戶空間進程可以通過V4L2接口調用相關設備功能,而不用考慮其實現細節。
    的頭像 發表于 04-25 14:41 ?1637次閱讀
    <b class='flag-5'>深入理解</b>Camera的整體五層架構

    深入理解FFmpeg閱讀體驗》FFmpeg攝像頭測試

    FFmpeg錄制視頻使用如下cmd: ffmpeg -f video4linux2 -s 320x240 -i /dev/video8 /tmp/cam_video.avi 看看CPU占用率。 將視頻拷貝出來,因為錄制的時候分辨率沒設置很高,所以將就看看,能看出是啥電
    發表于 04-17 19:06

    深入理解FFmpeg閱讀體驗》

    : ./configure --host=aarch64-linux --prefix=/home/x264 --enable-shared --disable-asm --enable-static
    發表于 04-16 22:54

    深入理解 Sora 的技術原理

    將去除噪音后的結果數據,利用視頻解碼器進行解碼,將低維潛在空間數據還原成原始視頻數據,這里可以實現不同分辨率的視頻解碼。
    的頭像 發表于 04-05 09:19 ?1974次閱讀
    <b class='flag-5'>深入理解</b> Sora 的技術原理

    深入理解 FPGA 的基礎結構

    轉載地址:https://zhuanlan.zhihu.com/p/506828648 文章很詳細的介紹了FPGA的基礎結構,能更直觀的理解內部結構原理。對深入學習很有幫助。 以下是正文: 這一段
    發表于 04-03 17:39

    深入理解Linux網絡協議

    網絡分層解決了網絡復雜的問題,在網絡中傳輸數據中,我們對不同設備之間的傳輸數據的格式,需要定義一個數據標準,所以就有了網絡協議。
    發表于 04-01 14:20 ?378次閱讀
    <b class='flag-5'>深入理解</b><b class='flag-5'>Linux</b>網絡協議

    FANUC外部I/O點數不夠用了怎么辦?可以擴展I/O點數嗎?

    FANUC外部I/O點數不夠用了怎么辦?可以擴展I/O點數嗎? 擴展FANUC的外部I/O點數是
    的頭像 發表于 02-18 15:21 ?1971次閱讀

    恒訊科技帶大家深入理解:WebSocket服務器的工作原理

    WebSocket是一種在單個TCP連接上進行全雙工通信的通信協議。它的設計目標是在Web瀏覽器和服務器之間提供低延遲、高效的雙向通信。下面是深入理解WebSocket服務器工作原理的一些關鍵概念
    的頭像 發表于 01-29 16:48 ?496次閱讀

    深入理解光耦模擬隔離放大電路的技術奧秘

    深入理解光耦模擬隔離放大電路的技術奧秘 ?編輯 ▲ 圖1 仿真原理圖二、原理分析 之所以這個電路圖看起來容易讓人感到困惑,實際上就是這個仿真電路中,錯誤的使用了這樣的光電三極管來表示HCNR201
    發表于 01-10 10:12
    主站蜘蛛池模板: 大象焦伊人久久综合网色视| 午夜影皖| 国产成人一级片| 午夜看片在线| 一级黄视频| 欧美精品亚洲网站| 成人夜夜| 婷婷网址| 天天综合网色| 5151四虎永久在线精品免费| 成人黄性视频| 天天影视网天天影网| 色综合色综合色综合色综合| 免费一级特黄特色大片 | 国产精品天天看大片特色视频| 国产牛牛| hd性欧美| 99热久久久久久久免费观看| 亚洲高清免费| 日本免费一区二区视频| 能看毛片的网址| 免费无毒片在线观看| 国产在线综合网| xxxxx69日本老师hd| 男女草逼视频| 五月婷婷久| 欧美日剧在线免费| 日本片免费观看一区二区| 六月婷婷在线视频| 99se亚洲综合色区| 狠狠摸狠狠操| 成人午夜网址| 日本口工全彩无遮拦漫画大| 午夜想想爱午夜剧场| 人人看人人添人人爽| 拍拍拍拍拍拍拍无挡大全免费| 赛罗奥特曼银河帝国普通话免费版| 羞羞爱爱| 四虎国产精品视频免费看| 四虎影院成人| 韩国激情啪啪|