Interactions between fork, stdio buffers and exit

TLPI一書在說明fork()、stdio buffers以及exit()之間的關係時，舉了一個有趣的例子，大家先看看下面的程式碼與執行結果：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

int main(void)
{
        printf("Hello\n");
        write(STDOUT_FILENO, "world\n", 6);

        if (fork() == -1) {
                write(STDERR_FILENO, "fork err\n", 9);
                exit(EXIT_FAILURE);
        }

        exit(EXIT_SUCCESS);
}

執行看看：

[mars@dream sys_call]$ ./fork_puzzle
Hello
world

看起來沒有什麼奇怪，但如果是下面這樣的執行結果，你還覺得理所當然嗎？ :-)

[mars@dream sys_call]$ ./fork_puzzle > log
[mars@dream sys_call]$ cat log
world
Hello
Hello

乍看之下，奇怪的事情發生了：world比Hello先印出來，而且Hello還印了兩遍。然而，熟悉C stdlib的實作方式與UNIX的fork()語意後，就很容易解釋這個現象了，思路如下：

因為write()只是system call的C wrapper，所以呼叫時會立即執行，預設I/O模型會在執行完畢後才返回。
printf()為了避免頻繁呼叫write()，會有一塊user space的buffer來存放多道printf()裡的字串內容，在輸出為標準輸出時，預設採用line-buffered，在輸出為檔案時，則為block-buffered。
當fork()執行後，child會有parent幾乎相等同的一份memory image copy，因此複製了printf()的unflushed string buffer。
於是，當導出到檔案時，printf()在block buffer尚未滿前不會輸出，因此造成write()先輸出，然後執行fork()後child也會有一份"Hello\n"，並在exit()時被強制輸出。

解決方式有好幾種，可以在每次printf()後都用fflush()，或儘量不要混用printf()與write()。

我們可以看到，這個例子反應的其實就是現實軟體開發的縮影，為了效能，printf()引進了新機制，卻也在某種情況下引起新問題。有趣的是，只要我們能讓好處多於壞處，那麼引進的改善就是有效的，但也必須時時刻刻記住可能的抽象洩漏會在何時回踢我們一腳。 :-)

留言

mars2012年3月7日下午1:20
類似的概念也可用來解釋下面的小謎題，有興趣的朋友可以確認一下自己對UNIX programming的理解是否足夠~ :-)

[mars@dream sys_call]$ cat exec_puzzle.c
#include <stdio.h>
#include <unistd.h>

int main(void)
{
printf("Hello\n");
execlp("sleep", "sleep", "0", NULL);
}
[mars@dream sys_call]$ ./exec_puzzle
Hello
[mars@dream sys_call]$ ./exec_puzzle > log
[mars@dream sys_call]$ cat log
回覆刪除
回覆

新增留言

軟體學徒forever

搜尋此網誌

Interactions between fork, stdio buffers and exit

標籤

留言

張貼留言

這個網誌中的熱門文章

誰在呼叫我？不同的backtrace實作說明好文章

淺讀Linux root file system初始化流程

kernel panic之後怎麼辦？