關于Banana Pi BPI-M7
Banana Pi BPI-M7 采用Rockchip RK3588,板載8/16/32G RAM內存和 64/128G eMMC存儲,支持無線wifi6和藍牙5.2。2x2.5G網絡端口,1個HDMIout標準 輸出口,2x USB3.0,2xTYPE-C,2x MIPI CSI接口和1x MIPI DSI接口,1x M.2 KEY M接口,40 PIN GPIO,迷你尺寸僅92x62mm
香蕉派BPI-M7采用睿芯最新旗艦RK3588八核64位處理器,最高頻率為2.4GHz, 6 TOPS NPU,最高內存為32GB。
Banana Pi BPI-M7開源硬件開發板
RKLLM 簡介
RKLLM 軟件堆棧可以幫助用戶快速將 AI 模型部署到 Rockchip 芯片上。 整體框架如下:
1.1 RKLLM 工具鏈介紹?
RKLLM-Toolkit 功能介紹?
RKLLM-Toolkit 是為用戶提供在計算機上進行大語言模型的量化、轉換的開發套件。通過該 工具提供的 Python 接口可以便捷地完成以下功能:
- 模型轉換:支持將 Hugging Face 格式的大語言模型(Large Language Model, LLM)轉換為 RKLLM 模型,目前支持的模型包括 LLaMA、Qwen/Qwen2、Phi2 等,轉換后的 RKLLM 模型能 夠在 Rockchip NPU 平臺上加載使用。
- 量化功能:支持將浮點模型量化為定點模型,目前支持的量化類型包括 w4a16 和 w8a8。
RKLLM Runtime 功能介紹?
RKLLM Runtime 主 要 負 責 加 載 RKLLM-Toolkit 轉換得到的 RKLLM 模型,并在 RK3576/RK3588 板端通過調用 NPU 驅動在 Rockchip NPU 上實現 RKLLM 模型的推理。在推理 RKLLM 模型時,用戶可以自行定義 RKLLM 模型的推理參數設置,定義不同的文本生成方式, 并通過預先定義的回調函數不斷獲得模型的推理結果。
1.2 RKLLM 開發流程介紹?
RKLLM 的整體開發步驟主要分為 2 個部分:模型轉換和板端部署運行。
- 模型轉換: 在這一階段,用戶提供的 Hugging Face 格式的大語言模型將會被轉換為 RKLLM 格式, 以便在 Rockchip NPU 平臺上進行高效的推理。這一步驟包括:
- a. 獲取原始模型:獲取 Hugging Face 格式的大語言模型;或是自行訓練得到的大語言模 型,要求模型保存的結構與 Hugging Face 平臺上的模型結構一致。
- b. 模型加載:通過 rkllm.load_huggingface()函數加載原始模型。
- c. 模型量化配置:通過 rkllm.build() 函數構建 RKLLM 模型,在構建過程中可選擇是否 進行模型量化來提高模型部署在硬件上的性能,以及選擇不同的優化等級和量化類型。
- d. 模型導出:通過 rkllm.export_rkllm() 函數將 RKLLM 模型導出為一個.rkllm 格式文件, 用于后續的部署。
- 板端部署運行: 這個階段涵蓋了模型的實際部署和運行。它通常包括以下步驟:
- a. 模型初始化:加載 RKLLM 模型到 Rockchip NPU 平臺,進行相應的模型參數設置來 定義所需的文本生成方式,并提前定義用于接受實時推理結果的回調函數,進行推理前準備。
- b. 模型推理:執行推理操作,將輸入數據傳遞給模型并運行模型推理,用戶可以通過預 先定義的回調函數不斷獲取推理結果。
- c. 模型釋放:在完成推理流程后,釋放模型資源,以便其他任務繼續使用 NPU 的計算 資源。 這兩個步驟構成了完整的 RKLLM 開發流程,確保大語言模型能夠成功轉換、調試,并最終 在 Rockchip NPU 上實現高效部署。
1.3 適用的硬件平臺?
本文檔適用的硬件平臺主要包括:RK3576、RK3588
2. 開發環境準備?
在發布的 RKLLM 工具鏈壓縮文件中,包含了 RKLLM-Toolkit 的 whl 安裝包、RKLLM Runtime 庫的相關文件以及參考示例代碼,具體的文件夾結構如下:
doc
└──Rockchip_RKLLM_SDK_CN.pdf # RKLLM SDK 說明文檔
rkllm-runtime
├──example
│ └── src
│ └── main.cpp
│ └── build-android.sh
│ └── build-linux.sh
│ └── CMakeLists.txt
│ └── Readme.md
├──runtime
│ └── Android
│ └── librkllm_api
│ └──arm64-v8a
│ └── librkllmrt.so # RKLLM Runtime 庫
│ └──include
│ └── rkllm.h # Runtime 頭文件
│ └── Linux
│ └── librkllm_api
│ └──aarch64
│ └── librkllmrt.so
│ └──include
│ └── rkllm.h
rkllm-toolkit
├──examples
│ └── huggingface
│ └── test.py
├──packages
│ └── md5sum.txt
│ └── rkllm_toolkit-1.0.0-cp38-cp38-linux_x86_64.whl
rknpu-driver
└──rknpu_driver_0.9.6_20240322.tar.bz2
在本章中將會對 RKLLM-Toolkit 工具及 RKLLM Runtime 的安裝進行詳細的介紹,具體的使 用方法請參考第 3 章中的使用說明。
2.1 RKLLM-Toolkit 安裝?
本節主要說明如何通過 pip 方式來安裝 RKLLM-Toolkit,用戶可以參考以下的具體流程說明 完成 RKLLM-Toolkit 工具鏈的安裝。
通過 pip 方式安裝?
安裝 miniforge3 工具?
為防止系統對多個不同版本的 Python 環境的需求,建議使用 miniforge3 管理 Python 環境。 檢查是否安裝 miniforge3 和 conda 版本信息,若已安裝則可省略此小節步驟。
conda -V
# 提示 conda: command not found 則表示未安裝 conda
# 提示 例如版本 conda 23.9.0
下載 miniforge3 安裝包
wget -c https://mirrors.bfsu.edu.cn/github-release/condaforge/miniforge/LatestRelease/Miniforge3-Linux-x86_64.sh
安裝 miniforge3
chmod 777 Miniforge3-Linux-x86_64.sh
bash Miniforge3-Linux-x86_64.sh
創建 RKLLM-Toolkit Conda 環境?
進入 Conda base 環境
source ~/miniforge3/bin/activate # miniforge3 為安裝目錄
# (base) xxx@xxx-pc:~$
創建一個 Python3.8 版本(建議版本)名為 RKLLM-Toolkit 的 Conda 環境
conda create -n RKLLM-Toolkit python=3.8
進入 RKLLM-Toolkit Conda 環境
conda activate RKLLM-Toolkit
# (RKLLM-Toolkit) xxx@xxx-pc:~$
安裝 RKLLM-Toolkit?
在 RKLLM-Toolkit Conda 環境下使用 pip 工具直接安裝所提供的工具鏈 whl 包,在安裝過程 中,安裝工具會自動下載 RKLLM-Toolkit 工具所需要的相關依賴包。
pip3 install rkllm_toolkit-1.0.0-cp38-cp38-linux_x86_64.whl
若執行以下命令沒有報錯,則安裝成功。
python
from rkllm.api import RKLLM
2.2 RKLLM Runtime 庫的使用?
在所公開的的 RKLLM 工具鏈文件中,包括包含 RKLLM Runtime 的全部文件:
- lib/librkllmrt.so: 適用于 RK3576/RK3588 板端調用進行 RKLLM 模型部署推理的 RKLLM Runtime 庫;
- include/rkllm_api.h: 與 librkllmrt.so 函數庫相對應的頭文件,其中包含相關結構體及 函數定義的說明; 在通過 RKLLM 工具鏈構建 RK3576/RK3588 板端的部署推理代碼時,需要注意對以上頭文 件及函數庫的鏈接,從而保證編譯的正確性。當代碼在 RK3576/RK3588 板端實際運行的過程中, 同樣需要確保以上函數庫文件成功推送至板端,并通過以下環境變量設置完成函數庫的聲明:
ulimit -Sn 50000
export LD_LIBRARY_PATH=./lib
./llm_demo qwen.rkllm
2.3 RKLLM Runtime 的編譯要求?
在使用 RKLLM Runtime 的過程中,需要注意 gcc 編譯器的版本問題。推薦使用交叉編譯工具 gcc-arm-10.2-2020.11-x86_64-aarch64-none-linux-gnu;具體的下載路徑為:GCC_10.2 交叉編譯工 具下載地址。
請注意,交叉編譯工具往往向下兼容而無法向上兼容,因此不要使用 10.2 以下的版本。
若是選擇使用 Android 平臺,需要進行 Android 可執行文件的編譯,推薦使用 Android NDK 工具進行交叉編譯,下載路徑為:Android_NDK 交叉編譯工具下載地址,推薦使用 r18b 版本。
具體的編譯方式也可以參考 RKLLM-Toolkit 工具鏈文件中的 example/build_demo.sh。
2.4 芯片內核更新 由于當前公開的固件內核驅動版本不支持 RKLLM 工具,因此需要更新內核。rknpu 驅動包支持兩 個主要內核版本:kernel-5.10 和 kernel-6.1。對于 kernel-5.10,建議使用具體版本號 5.10.198,repo: GitHub - rockchip-linux/kernel at develop-5.10;對于 kernel-6.1,建議使用具體版本號 6.1.57。可在 內核根目錄下的 Makefile 中確認具體版本號。 更新步驟如下: a. 下載壓縮包 rknpu_driver_0.9.6_20240322.tar.bz2。 b. 解壓該壓縮包,將其中的 rknpu 驅動代碼覆蓋到當前內核代碼目錄。 c. 重新編譯內核。 d. 將新編譯的內核燒錄到設備中。
Banana P BPI-M7開發板:https://docs.banana-pi.org/zh/BPI-M7/BananaPi_BPI-M7
審核編輯 黃宇
-
人工智能
+關注
關注
1791文章
47266瀏覽量
238435 -
開發板
+關注
關注
25文章
5047瀏覽量
97440 -
RK3588
+關注
關注
6文章
329瀏覽量
4333 -
AI大模型
+關注
關注
0文章
315瀏覽量
308
發布評論請先 登錄
相關推薦
評論