計(jì)算機(jī)如何執(zhí)行你寫的代碼?知乎上有人提問(wèn):電腦怎樣執(zhí)行編程語(yǔ)言的?
很多剛剛?cè)肟拥男“卓赡軐?duì)此完全沒(méi)有概念,或者模模糊糊知道個(gè)大概,我們寫下的一行行代碼,計(jì)算機(jī)到底是如何在執(zhí)行的呢?
我們以x86架構(gòu)的CPU為研究對(duì)象,從一個(gè)例子出發(fā),來(lái)嘗試解答這個(gè)問(wèn)題。
1、高級(jí)語(yǔ)言為了方便編程,偉大的計(jì)算機(jī)先驅(qū)們發(fā)明了一個(gè)又一個(gè)的編程語(yǔ)言,使得我們可以用人類最容易理解的語(yǔ)法規(guī)則去告訴計(jì)算機(jī)完成我們想要的功能。
int sum = a + b;
一句簡(jiǎn)單的不能再簡(jiǎn)單的C語(yǔ)言語(yǔ)句。
但即便是如此簡(jiǎn)單,聰明絕頂?shù)挠?jì)算機(jī)卻還是看不懂:這是弄啥捏?
這時(shí)候就需要一個(gè)翻譯,負(fù)責(zé)把人類編寫的高級(jí)語(yǔ)言“翻譯”成計(jì)算機(jī)能看得懂的東西,這個(gè)翻譯就是編譯器。
2、編譯鏈接上面的高級(jí)語(yǔ)言語(yǔ)句經(jīng)過(guò)編譯器編譯鏈接后,生成了一個(gè)目標(biāo)運(yùn)行平臺(tái)為x86架構(gòu)的可執(zhí)行程序exe/elf,使用反編譯工具IDA進(jìn)行分析,可以看到這行代碼編譯后的樣子是這樣的:
mov eax, a : 將變量a的值存入eax寄存器中
add eax, b : 把變量b的值和eax寄存器的值相加,并將結(jié)果保存在eax寄存器中
mov sum, eax : 將計(jì)算結(jié)果從eax寄存器寫入sum變量
看到了嗎,就像把大象關(guān)進(jìn)冰箱需要分三步,計(jì)算機(jī)完成程序員的一條加法語(yǔ)句,也分了三步:取出被加數(shù)、加上加數(shù)、寫入結(jié)果。
3、機(jī)器指令上面的匯編指令只是為了人類理解方便的助記符,計(jì)算機(jī)同樣也不認(rèn)識(shí)這玩意,那幾條指令在內(nèi)存中實(shí)際上是這樣的一串?dāng)?shù)據(jù):
十六進(jìn)制:
8B 45 EC 03 45 E0 89 45 F8
十六進(jìn)制是為了書寫方便,計(jì)算機(jī)真正能看到的只有二進(jìn)制的比特流:
10001011 01000101 11101100 00000011 01000101 11100000 10001001 01000101 11111000
接下來(lái),計(jì)算機(jī)要做的事情就是識(shí)別這些二進(jìn)制流都是什么意思,轉(zhuǎn)換成一條條的指令來(lái)執(zhí)行。
在開(kāi)始執(zhí)行之前,先來(lái)了解一下指令格式。
4、指令格式x86架構(gòu)CPU指令集中的指令格式如下:
主要有六個(gè)部分:
[非必需] 指令前綴:我們經(jīng)常用到的原子操作指令前面有一個(gè)lock前綴,就屬于指令前綴。
[必需] 操作碼:指令最核心的部分,標(biāo)識(shí)這條指令是什么功能。
[非必需] ModR/M:內(nèi)存/寄存器操作數(shù)字節(jié)
[非必需] SIB:索引尋址描述字節(jié)
[非必需] Displacement:常數(shù)偏移字節(jié)/半字/字
[非必需] Immediate:立即數(shù)字節(jié)/半字/字
需要注意的是,并不是每一條指令都包含上面的所有部分,許多指令只包含其中一部分字段。
根據(jù)操作碼的長(zhǎng)度不同,指令分為單字節(jié)操作碼指令、雙字節(jié)操作碼指令、三字節(jié)操作碼指令。
5、執(zhí)行指令計(jì)算機(jī)中真正負(fù)責(zé)指令執(zhí)行的核心部件是中央處理器CPU,在CPU中有一個(gè)指令寄存器IP,全稱是Instruction Pointer,在32位下,它叫EIP,在64位下它叫RIP。
下面開(kāi)始執(zhí)行:
指令寄存器EIP指向了第一條指令,開(kāi)始讀取第一個(gè)字節(jié):10001011,也就是0x8B。
開(kāi)始指令譯碼,翻譯出這是一條什么指令。
下面是x86架構(gòu)的CPU指令操作碼表:
CPU中的指令譯碼模塊拿到手一看,呀,不是指令前綴,是個(gè)單字節(jié)操作碼的mov指令,要往eax寄存器里面塞數(shù)據(jù),數(shù)據(jù)從哪來(lái)呢?
再往后一看,0x45,再來(lái)譯碼:
好家伙,原來(lái)是根據(jù)ebp寄存器的值+一個(gè)8位的偏移來(lái)讀取數(shù)據(jù)。
再往后讀取一個(gè)字節(jié),就是偏移值:EC。
現(xiàn)在第一條指令就譯碼出來(lái)了:將ebp+0xEC位置處的4個(gè)字節(jié)的數(shù)據(jù)取出來(lái),放到eax寄存器中。,這就是這一條指令要干的事情。
同時(shí)CPU還得出了另一個(gè)信息:這一條指令長(zhǎng)度是3個(gè)字節(jié),下一條指令的起始地址是在3個(gè)字節(jié)之后,隨后,指令寄存器EIP向后撥動(dòng),指向下一條指令的地址:$+3。
指令譯碼完成之后,開(kāi)始來(lái)正式執(zhí)行它。
執(zhí)行完一條以后,又來(lái)到指令寄存器EIP指向的地方,隨后再次指令譯碼、執(zhí)行,不斷重復(fù)這個(gè)過(guò)程,依次執(zhí)行每一條指令。
這其實(shí)就是CPU工作最基本的原理。
拓展上面描述的過(guò)程是CPU在硬件電路層面完成的,但這種設(shè)計(jì)思想在軟件領(lǐng)域也同樣適用。
大家如果去研究Java虛擬機(jī)JVM和Python的解釋器源代碼時(shí),也會(huì)發(fā)現(xiàn)有相似之處:JVM和解釋器通過(guò)定義一套自己的“指令集”,然后它們的編譯器使用這套指令集將Java和Python代碼編譯成對(duì)應(yīng)的程序。
運(yùn)行的時(shí)候也類似,虛擬機(jī)或者解釋器不斷識(shí)別每一條指令,譯碼、執(zhí)行,和CPU執(zhí)行指令的過(guò)程頗有幾分相似。
C/C++語(yǔ)言編譯的程序,最后是直接編譯成了CPU的指令,所以跨平臺(tái)能力差,如果換到ARM架構(gòu)平臺(tái),原來(lái)的程序?qū)o(wú)法執(zhí)行,需要重新編譯成新的平臺(tái)的程序。
而Java、Python這類語(yǔ)言,是自己在軟件層面的指令集,因?yàn)槠渥陨硪呀?jīng)開(kāi)發(fā)了針對(duì)不同CPU平臺(tái)的虛擬機(jī)、解釋器,所以這些語(yǔ)言編寫的程序移植性好,真正做到一次編寫,到處運(yùn)行。
總結(jié)我們使用高級(jí)語(yǔ)言C、C++編寫的程序代碼,經(jīng)過(guò)編譯器的編譯鏈接,最終變成CPU可以理解的機(jī)器指令,隨后CPU在執(zhí)行時(shí)通過(guò)不斷的譯碼、執(zhí)行,最終實(shí)現(xiàn)高級(jí)語(yǔ)言所描述的功能。
現(xiàn)在你知道你用編程語(yǔ)言寫下的程序是如何跑起來(lái)的了嗎?
責(zé)任編輯:haq
-
cpu
+關(guān)注
關(guān)注
68文章
10901瀏覽量
212681 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7534瀏覽量
88453 -
C語(yǔ)言
+關(guān)注
關(guān)注
180文章
7614瀏覽量
137432
原文標(biāo)題:一行代碼,揭開(kāi)CPU執(zhí)行原理!
文章出處:【微信號(hào):gh_c472c2199c88,微信公眾號(hào):嵌入式微處理器】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論