不知道大家平時編程過程中使用動態鏈接庫的情況多不多,如果一個程序引用了無數個動態鏈接庫,那就有可能引入符號沖突的問題,問題如下:
想象中
實際上
下面,我們嘗試解決它。
最開始介紹下g++基本命令參數:
g++-c
先來看一段代碼:
#include
再定義一個簡單的main.cc程序:
#include
編譯這兩個文件,并分別打包成靜態庫:
g++ -c work.cc -o work.oar rc libwork.a work.og++ -c main.cc -o main.oar rc libmain.a main.o
現在將這兩個靜態庫鏈接成一個可執行文件,注意鏈接器如果發現當前庫中使用了沒有被定義的符號,它只會向后查找,因此最低級別沒有其它依賴的庫應該放在最右邊,如果出現了符號沖突問題,鏈接器會使用最左邊的符號。
如果這樣進行鏈接:
$ g++ -s -L. -o main.exe -lwork -lmain./libmain.a(main.o): In function `main':main.cc undefined reference to `DoThing()'collect2: error: ld returned 1 exit status
鏈接失敗,因為main庫里的DoThing符號沒有被定義,鏈接器向后查找,沒有找到對應的符號定義,這里更改下鏈接庫的順序:
g++-s-L.-omain.exe-lmain-lwork$./main.exestartworkfinished
鏈接成功。
現在寫一個簡單的容易產生符號沖突的文件conflict.cc:
#include
編譯并打包成靜態庫:
g++-cconflict.cc-oconflict.oar rc libconflict.a conflict.o
如果按這樣的順序鏈接成一個可執行程序:
$g++-s-L.-omain.exe-lmain-lwork-lconflict$./main.exestartworkfinished
如果稍微更改一下鏈接的順序:
$g++-s-L.-omain.exe-lmain-lconflict-lwork$ ./main.exestartconflictfinished
這里發現順序的不同導致了程序輸出內容不同,究其原因就是那潛在的符號沖突。
現在再試試動態庫,先介紹如何使用動態庫:
$rmlibconflict.a$g++-sharedconflict.o-olibconflict.so$g++-s-L.-omain.exe-lmain-lconflict$LD_LIBRARY_PATH=../main.exestartconflictfinished
現在再引用一個中間層在動態鏈接庫中調用conflict的文件layer.cc
#include
并把layer和conflict打包成一個動態鏈接庫:
$g++-clayer.cc-olayer.o$ g++ -shared layer.o conflict.o -o libconflict.so
然后更新main.c程序,main里面調用layer,layer里調用conflict:
#include
編譯鏈接執行:
$g++-cmain.cc-omain.o$arrclibmain.amain.o$g++-s-L.-omain.exe-lmain-lconflict$LD_LIBRARY_PATH=../main.exestartlayerconflictfinished
正常輸出,沒啥問題,現在再把之前的work.cc也塞到main.cc中,觀察下沖突:
#include
把work.o和main.o打包成一個庫,之后和conflict鏈接成一個可執行程序,運行:
$g++-cmain.cc-omain.o$arrclibmain.amain.owork.o$g++-s-L.-omain.exe-lmain-lconflict$LD_LIBRARY_PATH=../main.exestartworklayerworkfinished
這里輸出了兩個work,正常情況下第二個work應該輸出conflict,怎么解決呢?
可以考慮使用-fvisibility=hidden來隱藏內部的符號,鏈接庫內部使用的符號把它隱藏掉,不讓它被導出,外部也不會改變它的調用路徑。
先使用nm看一下libconflict.so里面的符號:
$nm-CDlibconflict.sow_ITM_deregisterTMCloneTablew_ITM_registerTMCloneTable000000000000065aTDoLayer()0000000000000672TDoThing()0000000000201030B__bss_startw__cxa_finalizew__gmon_start__0000000000201030D_edata0000000000201038B_end0000000000000688T_fini0000000000000528T_init U puts
如果把符號隱藏掉:
$g++-fvisibility=hidden-clayer.cc-olayer.o$g++-fvisibility=hidden-cconflict.cc-oconflict.o$g++-sharedlayer.oconflict.o-olibconflict.so再使用nm看一下libconflict.so里面的符號:$nm-CDlibconflict.sow_ITM_deregisterTMCloneTablew_ITM_registerTMCloneTable0000000000201028B__bss_startw__cxa_finalizew__gmon_start__0000000000201028D_edata0000000000201030B_end0000000000000618T_fini00000000000004c0T_init U puts
這樣的話main函數肯定不能調用DoLayer啦,因為DoLayer符號沒有暴露出來:
$g++-s-L.-omain.exe-lmain-lconflict./libmain.a(main.o):Infunction`main':main.ccundefinedreferenceto`DoLayer()'collect2: error: ld returned 1 exit statu
那怎么暴露出來特定符號呢,直接看代碼,改動了layer.cc:
#include
再編譯鏈接運行看看結果:
$g++-fvisibility=hidden-clayer.cxx-olayer.o$g++-sharedlayer.oconflict.o-olibconflict.so$g++-s-L.-omain.exe-lmain-lconflict$LD_LIBRARY_PATH=../main.exestartworklayerconflictfinished
發現已經是我們期待的結果啦,符號沖突的問題因此被解決。
是不是感覺很麻煩,難道每個要暴露的符號都要加上__attribute__這種修飾嗎,這里其實可以寫一個export文件,告訴編譯器要導出的所有符號有哪些。
export.txt {global:*DoLayer*;local:*;};g++ -Wl,--version-script=export.txt -s -shared layer.o conflict.o -o libconflict.so
但這種方式只有在gcc中才可以被使用,我在clang中嘗試使用但是失敗啦,所以為了兼容性不建議使用這種方式,還是消停的使用__attribute__來解決符號沖突問題吧。
Tips
通過隱藏符號可以減小可執行程序的大小,還可以解決符號沖突問題,但有個缺點,因為隱藏了符號,線上程序運行時如果出現crash,通過堆棧信息我們看不到具體函數調用路徑,給定位問題帶來了困難。所以,是否需要使用這種辦法,還應根據實際情況具體抉擇。
原文標題:原來編譯鏈接還有這么多套路……
文章出處:【微信公眾號:嵌入式ARM】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
嵌入式
+關注
關注
5089文章
19165瀏覽量
306694 -
編程
+關注
關注
88文章
3634瀏覽量
93883
原文標題:原來編譯鏈接還有這么多套路……
文章出處:【微信號:gh_c472c2199c88,微信公眾號:嵌入式微處理器】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論