strace 命令是一種強(qiáng)大的工具,它能夠顯示所有由用戶空間程序發(fā)出的系統(tǒng)調(diào)用。
strace 顯示這些調(diào)用的參數(shù)并返回符號(hào)形式的值。strace 從內(nèi)核接收信息,而且不需要以任何特殊的方式來(lái)構(gòu)建內(nèi)核。
下面記錄幾個(gè)常用 option .
1 -f -F選項(xiàng)告訴strace同時(shí)跟蹤fork和vfork出來(lái)的進(jìn)程
2 -o xxx.txt 輸出到某個(gè)文件。
3 -e execve 只記錄 execve 這類系統(tǒng)調(diào)用
—————————————————
進(jìn)程無(wú)法啟動(dòng),軟件運(yùn)行速度突然變慢,程序的”SegmentFault”等等都是讓每個(gè)Unix系統(tǒng)用戶頭痛的問題,
本文通過三個(gè)實(shí)際案例演示如何使用truss、strace和ltrace這三個(gè)常用的調(diào)試工具來(lái)快速診斷軟件的”疑難雜癥”。
truss和strace用來(lái)跟蹤一個(gè)進(jìn)程的系統(tǒng)調(diào)用或信號(hào)產(chǎn)生的情況,而 ltrace用來(lái)跟蹤進(jìn)程調(diào)用庫(kù)函數(shù)的情況。truss是早期為System V R4開發(fā)的調(diào)試程序,包括Aix、FreeBSD在內(nèi)的大部分Unix系統(tǒng)都自帶了這個(gè)工具;
而strace最初是為SunOS系統(tǒng)編寫的,ltrace最早出現(xiàn)在GNU/DebianLinux中。
這兩個(gè)工具現(xiàn)在也已被移植到了大部分Unix系統(tǒng)中,大多數(shù)Linux發(fā)行版都自帶了strace和ltrace,而FreeBSD也可通過Ports安裝它們。
你不僅可以從命令行調(diào)試一個(gè)新開始的程序,也可以把truss、strace或ltrace綁定到一個(gè)已有的PID上來(lái)調(diào)試一個(gè)正在運(yùn)行的程序。三個(gè)調(diào)試工具的基本使用方法大體相同,下面僅介紹三者共有,而且是最常用的三個(gè)命令行參數(shù):
-f :除了跟蹤當(dāng)前進(jìn)程外,還跟蹤其子進(jìn)程。
-o file :將輸出信息寫到文件file中,而不是顯示到標(biāo)準(zhǔn)錯(cuò)誤輸出(stderr)。
-p pid :綁定到一個(gè)由pid對(duì)應(yīng)的正在運(yùn)行的進(jìn)程。此參數(shù)常用來(lái)調(diào)試后臺(tái)進(jìn)程。
使用上述三個(gè)參數(shù)基本上就可以完成大多數(shù)調(diào)試任務(wù)了,下面舉幾個(gè)命令行例子:
truss -o ls.truss ls -al: 跟蹤ls -al的運(yùn)行,將輸出信息寫到文件/tmp/ls.truss中。
strace -f -o vim.strace vim: 跟蹤vim及其子進(jìn)程的運(yùn)行,將輸出信息寫到文件vim.strace。
ltrace -p 234: 跟蹤一個(gè)pid為234的已經(jīng)在運(yùn)行的進(jìn)程。
三個(gè)調(diào)試工具的輸出結(jié)果格式也很相似,以strace為例:
brk(0) = 0×8062aa8
brk(0×8063000) = 0×8063000
mmap2(NULL, 4096, PROT_READ, MAP_PRIVATE, 3, 0×92f) = 0×40016000
每一行都是一條系統(tǒng)調(diào)用,等號(hào)左邊是系統(tǒng)調(diào)用的函數(shù)名及其參數(shù),右邊是該調(diào)用的返回值。 truss、strace和ltrace的工作原理大同小異,都是使用ptrace系統(tǒng)調(diào)用跟蹤調(diào)試運(yùn)行中的進(jìn)程,詳細(xì)原理不在本文討論范圍內(nèi),有興趣可以參考它們的源代碼。
舉兩個(gè)實(shí)例演示如何利用這三個(gè)調(diào)試工具診斷軟件的”疑難雜癥”:
案例一:運(yùn)行clint出現(xiàn)Segment Fault錯(cuò)誤
操作系統(tǒng):FreeBSD-5.2.1-release
clint是一個(gè)C++靜態(tài)源代碼分析工具,通過Ports安裝好之后,運(yùn)行:
# clint foo.cpp
Segmentation fault (core dumped)
在Unix系統(tǒng)中遇見”Segmentation Fault”就像在MS Windows中彈出”非法操作”對(duì)話框一樣令人討厭。OK,我們用truss給clint”把把脈”:
# truss -f -o clint.truss clint
Segmentation fault (core dumped)
# tail clint.truss
739: read(0×6,0×806f000,0×1000) = 4096 (0×1000)
739: fstat(6,0xbfbfe4d0) = 0 (0×0)
739: fcntl(0×6,0×3,0×0) = 4 (0×4)
739: fcntl(0×6,0×4,0×0) = 0 (0×0)
739: close(6) = 0 (0×0)
739: stat(”/root/.clint/plugins”,0xbfbfe680) ERR#2 ‘No such file or directory’
SIGNAL 11
SIGNAL 11
Process stopped because of: 16
process exit, rval = 139
我們用truss跟蹤clint的系統(tǒng)調(diào)用執(zhí)行情況,并把結(jié)果輸出到文件clint.truss,然后用tail查看最后幾行。
注意看clint執(zhí)行的最后一條系統(tǒng)調(diào)用(倒數(shù)第五行):stat(”/root/.clint/plugins”,0xbfbfe680) ERR#2 ‘No such file or directory’,問題就出在這里:clint找不到目錄”/root/.clint/plugins”,從而引發(fā)了段錯(cuò)誤。怎樣解決?很簡(jiǎn)單: mkdir -p /root/.clint/plugins,不過這次運(yùn)行clint還是會(huì)”Segmentation Fault”9。繼續(xù)用truss跟蹤,發(fā)現(xiàn)clint還需要這個(gè)目錄”/root/.clint/plugins/python”,建好這個(gè)目錄后 clint終于能夠正常運(yùn)行了。
案例二:vim啟動(dòng)速度明顯變慢
操作系統(tǒng):FreeBSD-5.2.1-release