要跟上示例,您將需要一個基于ARM的實驗環境。如果你沒有ARM設備(如Raspberry Pi),你可以按照本教程在虛擬機中使用QEMU和Raspberry Pi發行版來建立自己的實驗環境。如果你不熟悉用GDB進行的基本調試,你可以在本教程中獲得基本知識。在本教程中,重點是ARM 32位,例子是在ARMv6上編譯的。
為什么是ARM?
本教程一般是為那些想學習ARM匯編基礎知識的人準備的。您可能已經注意到,ARM處理器在您周圍隨處可見。當我環顧四周時,我可以數出家里采用ARM處理器的設備遠遠多于Intel處理器。這包括手機、路由器,更別忘了最近似乎銷量爆棚的物聯網設備。也就是說,ARM處理器已經成為世界上最廣泛的CPU內核之一。
盡管ARM匯編語言可能是廣泛使用的最簡單的匯編語言。那么,為什么沒有更多的人關注ARM呢?也許是因為涉及英特爾開發的學習資源比涉及 ARM 的多。在這里的系列教程中,我們將重點介紹ARM匯編基礎知識。
ARM處理器與 英特爾處理器
英特爾和ARM之間有許多不同之處,但主要區別在于指令集。英特爾是一個CISC(復雜指令集計算)處理器,它的指令集更大、功能更豐富,并允許許多復雜指令訪問內存。因此,它有更多的操作、尋址模式,但比ARM更少的寄存器。CISC處理器主要用于普通PC、工作站和服務器。
ARM是一種RISC(精簡指令集計算)處理器,因此它有一個簡化的指令集(100條指令或更少),并且比CISC有更多的通用寄存器。與英特爾不同,ARM使用僅對寄存器進行操作的指令,并使用加載/存儲內存模型進行內存訪問,這意味著只有加載/存儲指令可以訪問內存。這意味著在ARM上增加一個特定內存地址的32位數值需要三種指令(加載、增加和存儲),首先將特定地址的數值加載到寄存器中,在寄存器中增加數值,然后從寄存器中存儲到內存中。
減少指令集有其優點和缺點。其中一個優點是指令可以更快執行,可能會有更高的速度(RISC系統通過減少每個指令的時鐘周期來縮短執行時間)。缺點是,較少的指令意味著要更加強調用有限的指令有效地編寫軟件。同樣需要注意的是,ARM有兩種模式,ARM模式和拇指模式。拇指指令可以是2字節或4字節(在第3部分:ARM指令集中有更多介紹)。
ARM和x86之間的更多區別是:
在ARM中,大多數指令可用于條件執行。
Intel x86 和 x86-64 系列處理器使用 little-endian 格式
ARM 體系結構在版本 3 之前是 little-endian。從那時起,ARM處理器變成了BI-endian,并具有允許切換endianness的設置。
不僅Intel和ARM之間存在差異,而且不同的ARM版本本身也存在差異。本系列教程旨在盡可能地保持通用性,以便您對ARM的工作原理有一個大致的了解。一旦您了解了基本原理,就很容易了解您所選擇的目標ARM版本的細微差別。本教程中的例子是在32位ARMv6(Raspberry Pi 1)上創建的,因此,解釋與這個確切的版本有關。
不同的ARM版本的命名也可能令人困惑:
編寫匯編
我們首先需要了解匯編語言編程的基礎知識,這需要在開始之前有一些背景知識。
您不需要知道匯編語言的每一個小細節,但其中一些細節對于理解大局是必需的。
本系列教程將涵蓋基礎知識。如果你想了解更多,你可以訪問本章末尾列出的鏈接。
那么,究竟什么是匯編語言?匯編語言只是機器碼之上的一個薄薄的語法層,機器碼由指令組成,以二進制表示法(機器碼)進行編碼,也就是我們的計算機所能理解的。那么,為什么我們不直接寫機器碼呢?嗯,這將是一個痛苦的過程。出于這個原因,我們要寫匯編,即ARM匯編,這對人類來說更容易理解。我們的計算機本身不能運行匯編代碼,因為它需要機器代碼。我們將使用的將匯編代碼組裝成機器代碼的工具是GNU Binutils項目中的GNU Assembler,其名稱為as,可用于具有*.s擴展名的源文件。
一旦你寫好了擴展名為*.s的匯編文件,你就需要用as來組裝它,并用ld來鏈接它。
揭開匯編的面紗
讓我們從最底層開始,一路往上走到匯編語言。在最底層,我們的電路上有我們的電信號。信號的形成是通過將電壓切換到兩個級別中的一個,例如0伏("關閉")或5伏("開啟")。因為僅僅通過觀察,我們不容易知道電路的電壓是多少,所以我們選擇用直觀的數字0和1來書寫電壓的開/關模式,這不僅是為了表示信號的缺失或存在,而且也是因為0和1是二進制系統的數字。然后我們將0和1的序列分組,形成機器碼指令,這是計算機處理器最小的工作單元。下面是一個機器語言指令的例子。
1110 0001 1010 0000 0010 0000 0000 0001
到目前為止還不錯,但我們無法記住這些模式(0和1)中的每一個意味著什么。出于這個原因,我們使用所謂的助記符、縮寫來幫助我們記住這些二進制模式,每個機器碼指令都有一個名字。這些記憶法通常由三個字母組成,但這并不是必須的。我們可以用這些助記符作為指令寫一個程序。這個程序被稱為匯編語言程序,而用于表示計算機機器碼的一組助記符被稱為該計算機的匯編語言。因此,匯編語言是人類用來為計算機編程的最低級別。一條指令的操作數排在助記符之后。下面是一個例子。
MOV R2, R1
現在我們知道,匯編程序是由稱為助記符的文本信息組成的,我們需要將其轉換為機器碼。如上所述,就ARM匯編而言,GNU Binutils項目為我們提供了一個名為as的工具。使用像as這樣的匯編器將(ARM)匯編語言轉換為(ARM)機器代碼的過程稱為匯編。
綜上所述,我們了解到計算機能夠理解(響應)電壓(信號)的存在或不存在,并且我們可以用0和1(比特)的序列來表示多個信號。我們可以使用機器代碼(信號序列)使計算機以某種定義明確的方式做出反應。因為我們無法記住所有這些序列的含義,所以我們給它們以縮寫--助記符,并使用它們來表示指令。這套助記符是計算機的匯編語言,我們使用一個稱為匯編程序的程序將代碼從助記符表示轉換為計算機可讀的機器代碼,就像編譯器對高級語言的作用一樣。
-
ARM
+關注
關注
134文章
9143瀏覽量
368335 -
cpu
+關注
關注
68文章
10892瀏覽量
212463 -
路由器
+關注
關注
22文章
3740瀏覽量
114172 -
匯編
+關注
關注
2文章
214瀏覽量
25963
發布評論請先 登錄
相關推薦
評論