引用計數(shù)基本知識

每個php變量存在一個叫"zval"的變量容器中。一個zval變量容器,除了包含變量的類型和值,還包括兩個字節(jié)的額外信息。第一個是"is_ref",是個bool值,用來標識這個變量是否是屬于引用集合(reference set)。通過這個字節(jié),php引擎才能把普通變量和引用變量區(qū)分開來,由于php允許用戶通過使用&來使用自定義引用,zval變量容器中還有一個內(nèi)部引用計數(shù)機制,來優(yōu)化內(nèi)存使用。第二個額外字節(jié)是"refcount",用以表示指向這個zval變量容器的變量(也稱符號即symbol)個數(shù)。所有的符號存在一個符號表中,其中每個符號都有作用域(scope),那些主腳本(比如:通過瀏覽器請求的的腳本)和每個函數(shù)或者方法也都有作用域。

當一個變量被賦常量值時,就會生成一個zval變量容器,如下例這樣:

示例 #1 生成一個新的zval容器

<?php
$a 
"new string";
?>

在上例中,新的變量a,是在當前作用域中生成的。并且生成了類型為 string 和值為new string的變量容器。在額外的兩個字節(jié)信息中,"is_ref"被默認設置為 false,因為沒有任何自定義的引用生成。"refcount" 被設定為 1,因為這里只有一個變量使用這個變量容器. 注意到當"refcount"的值是1時,"is_ref"的值總是false. 如果你已經(jīng)安裝了? Xdebug,你能通過調用函數(shù) xdebug_debug_zval()顯示"refcount"和"is_ref"的值。

示例 #2 顯示zval信息

<?php
xdebug_debug_zval
('a');
?>

以上例程會輸出:

a: (refcount=1, is_ref=0)='new string'

把一個變量賦值給另一變量將增加引用次數(shù)(refcount).

示例 #3 增加一個zval的引用計數(shù)

<?php
$a 
"new string";
$b $a;
xdebug_debug_zval'a' );
?>

以上例程會輸出:

a: (refcount=2, is_ref=0)='new string'

這時,引用次數(shù)是2,因為同一個變量容器被變量 a 和變量 b關聯(lián).當沒必要時,php不會去復制已生成的變量容器。變量容器在”refcount“變成0時就被銷毀. 當任何關聯(lián)到某個變量容器的變量離開它的作用域(比如:函數(shù)執(zhí)行結束),或者對變量調用了函數(shù) unset()時,”refcount“就會減1,下面的例子就能說明:

示例 #4 減少引用計數(shù)

<?php
$a 
"new string";
$c $b $a;
xdebug_debug_zval'a' );
unset( 
$b$c );
xdebug_debug_zval'a' );
?>

以上例程會輸出:

a: (refcount=3, is_ref=0)='new string'
a: (refcount=1, is_ref=0)='new string'

如果我們現(xiàn)在執(zhí)行 unset($a);,包含類型和值的這個變量容器就會從內(nèi)存中刪除。

復合類型(Compound Types)

當考慮像 arrayobject這樣的復合類型時,事情就稍微有點復雜. 與 標量(scalar)類型的值不同,arrayobject類型的變量把它們的成員或屬性存在自己的符號表中。這意味著下面的例子將生成三個zval變量容器。

示例 #5 Creating a array zval

<?php
$a 
= array( 'meaning' => 'life''number' => 42 );
xdebug_debug_zval'a' );
?>

以上例程的輸出類似于:

a: (refcount=1, is_ref=0)=array (
   'meaning' => (refcount=1, is_ref=0)='life',
   'number' => (refcount=1, is_ref=0)=42
)

圖示:

一個簡單數(shù)組的zval

這三個zval變量容器是: a,meaningnumber。增加和減少”refcount”的規(guī)則和上面提到的一樣. 下面, 我們在數(shù)組中再添加一個元素,并且把它的值設為數(shù)組中已存在元素的值:

示例 #6 添加一個已經(jīng)存在的元素到數(shù)組中

<?php
$a 
= array( 'meaning' => 'life''number' => 42 );
$a['life'] = $a['meaning'];
xdebug_debug_zval'a' );
?>

以上例程的輸出類似于:

a: (refcount=1, is_ref=0)=array (
   'meaning' => (refcount=2, is_ref=0)='life',
   'number' => (refcount=1, is_ref=0)=42,
   'life' => (refcount=2, is_ref=0)='life'
)

圖示:

帶有引用的簡單數(shù)組的zval

從以上的xdebug輸出信息,我們看到原有的數(shù)組元素和新添加的數(shù)組元素關聯(lián)到同一個"refcount"2的zval變量容器. 盡管 Xdebug的輸出顯示兩個值為'life'的 zval 變量容器,其實是同一個。 函數(shù)xdebug_debug_zval()不顯示這個信息,但是你能通過顯示內(nèi)存指針信息來看到。

刪除數(shù)組中的一個元素,就是類似于從作用域中刪除一個變量. 刪除后,數(shù)組中的這個元素所在的容器的“refcount”值減少,同樣,當“refcount”為0時,這個變量容器就從內(nèi)存中被刪除,下面又一個例子可以說明:

示例 #7 從數(shù)組中刪除一個元素

<?php
$a 
= array( 'meaning' => 'life''number' => 42 );
$a['life'] = $a['meaning'];
unset( 
$a['meaning'], $a['number'] );
xdebug_debug_zval'a' );
?>

以上例程的輸出類似于:

a: (refcount=1, is_ref=0)=array (
   'life' => (refcount=1, is_ref=0)='life'
)

現(xiàn)在,當我們添加一個數(shù)組本身作為這個數(shù)組的元素時,事情就變得有趣,下個例子將說明這個。例中我們加入了引用操作符,否則php將生成一個復制。

示例 #8 把數(shù)組作為一個元素添加到自己

<?php
$a 
= array( 'one' );
$a[] =& $a;
xdebug_debug_zval'a' );
?>

以上例程的輸出類似于:

a: (refcount=2, is_ref=1)=array (
   0 => (refcount=1, is_ref=0)='one',
   1 => (refcount=2, is_ref=1)=...
)

圖示:

自引用(curcular reference,自己是自己的一個元素)的數(shù)組的zval

能看到數(shù)組變量 (a) 同時也是這個數(shù)組的第二個元素(1) 指向的變量容器中“refcount”為 2。上面的輸出結果中的"..."說明發(fā)生了遞歸操作, 顯然在這種情況下意味著"..."指向原始數(shù)組。

跟剛剛一樣,對一個變量調用unset,將刪除這個符號,且它指向的變量容器中的引用次數(shù)也減1。所以,如果我們在執(zhí)行完上面的代碼后,對變量$a調用unset, 那么變量 $a 和數(shù)組元素 "1" 所指向的變量容器的引用次數(shù)減1, 從"2"變成"1". 下例可以說明:

示例 #9 Unsetting $a

(refcount=1, is_ref=1)=array (
   0 => (refcount=1, is_ref=0)='one',
   1 => (refcount=1, is_ref=1)=...
)

圖示:

Zvals after removal of array with a circular reference demonstrating the memory leak

清理變量容器的問題(Cleanup Problems)

盡管不再有某個作用域中的任何符號指向這個結構(就是變量容器),由于數(shù)組元素“1”仍然指向數(shù)組本身,所以這個容器不能被清除 。因為沒有另外的符號指向它,用戶沒有辦法清除這個結構,結果就會導致內(nèi)存泄漏。慶幸的是,php將在腳本執(zhí)行結束時清除這個數(shù)據(jù)結構,但是在php清除之前,將耗費不少內(nèi)存。如果你要實現(xiàn)分析算法,或者要做其他像一個子元素指向它的父元素這樣的事情,這種情況就會經(jīng)常發(fā)生。當然,同樣的情況也會發(fā)生在對象上,實際上對象更有可能出現(xiàn)這種情況,因為對象總是隱式的被引用。

如果上面的情況發(fā)生僅僅一兩次倒沒什么,但是如果出現(xiàn)幾千次,甚至幾十萬次的內(nèi)存泄漏,這顯然是個大問題。這樣的問題往往發(fā)生在長時間運行的腳本中,比如請求基本上不會結束的守護進程(deamons)或者單元測試中的大的套件(sets)中。后者的例子:在給巨大的eZ(一個知名的PHP Library) 組件庫的模板組件做單元測試時,就可能會出現(xiàn)問題。有時測試可能需要耗用2GB的內(nèi)存,而測試服務器很可能沒有這么大的內(nèi)存。