跳到主要內容

Interactions between fork, stdio buffers and exit

TLPI一書在說明fork()、stdio buffers以及exit()之間的關係時,舉了一個有趣的例子,大家先看看下面的程式碼與執行結果:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

int main(void)
{
        printf("Hello\n");
        write(STDOUT_FILENO, "world\n", 6);

        if (fork() == -1) {
                write(STDERR_FILENO, "fork err\n", 9);
                exit(EXIT_FAILURE);
        }

        exit(EXIT_SUCCESS);
}

執行看看:

[mars@dream sys_call]$ ./fork_puzzle
Hello
world

看起來沒有什麼奇怪,但如果是下面這樣的執行結果,你還覺得理所當然嗎? :-)

[mars@dream sys_call]$ ./fork_puzzle > log
[mars@dream sys_call]$ cat log
world
Hello
Hello

乍看之下,奇怪的事情發生了:world比Hello先印出來,而且Hello還印了兩遍。然而,熟悉C stdlib的實作方式與UNIX的fork()語意後,就很容易解釋這個現象了,思路如下:
  1. 因為write()只是system call的C wrapper,所以呼叫時會立即執行,預設I/O模型會在執行完畢後才返回。
  2. printf()為了避免頻繁呼叫write(),會有一塊user space的buffer來存放多道printf()裡的字串內容,在輸出為標準輸出時,預設採用line-buffered,在輸出為檔案時,則為block-buffered。
  3. 當fork()執行後,child會有parent幾乎相等同的一份memory image copy,因此複製了printf()的unflushed string buffer。
  4. 於是,當導出到檔案時,printf()在block buffer尚未滿前不會輸出,因此造成write()先輸出,然後執行fork()後child也會有一份"Hello\n",並在exit()時被強制輸出。
解決方式有好幾種,可以在每次printf()後都用fflush(),或儘量不要混用printf()與write()。

我們可以看到,這個例子反應的其實就是現實軟體開發的縮影,為了效能,printf()引進了新機制,卻也在某種情況下引起新問題。有趣的是,只要我們能讓好處多於壞處,那麼引進的改善就是有效的,但也必須時時刻刻記住可能的抽象洩漏會在何時回踢我們一腳。 :-)

留言

  1. 類似的概念也可用來解釋下面的小謎題,有興趣的朋友可以確認一下自己對UNIX programming的理解是否足夠~ :-)

    [mars@dream sys_call]$ cat exec_puzzle.c
    #include <stdio.h>
    #include <unistd.h>

    int main(void)
    {
    printf("Hello\n");
    execlp("sleep", "sleep", "0", NULL);
    }
    [mars@dream sys_call]$ ./exec_puzzle
    Hello
    [mars@dream sys_call]$ ./exec_puzzle > log
    [mars@dream sys_call]$ cat log

    回覆刪除

張貼留言