PHP ·

PHP类型转换相关的一个Bug

 

PHP为了避免数字索引和数字字符串索引(注1)的混乱, 引入了zend_symtable_*系列函数, 并应用于数组中.

这样一来, 数字字符串索引也就会被当作数字索引, 然而总是有一些情况, 是PHP的维护者没有想到的…

比如, 类型转换时刻:

鉴于很多朋友好心的提示, 使用json_deocde的第二个参数就可以直接得到数组.
我说明下, 如下的代码是我有意而为之, 并不是为了json_decode, 而是为了构造一个"有问题"的数组.

在PHP5.2.*下(json version 1.2.1):

data = array(
    123 => 'laruence',
);value = json_encode(data);obj   = json_decode(value);arr   = (array)obj;
var_dump(arr);

神仙提供了如下的更简单的构造方法:

$obj=new stdClass;
$obj->{'123'} = "laruence";
$arr = (array)$obj;
var_dump($arr);

此时, 问题就出现了, 上面得到的输出是:

array(1) {
  ["123"]=>
  string(8) "laruence"
}

现在,你郁闷吧, 因为数组键是字符串, 而通过正常渠道访问的时候, PHP都会自动把数字字符串转换成数字, 所以:

print_r(arr[123]);
//PHP Notice:  Undefined offset:  123 in ***
print_r(arr["123"]);
//PHP Notice:  Undefined offset:  123 in ***
var_dump(array_key_exists("123", $arr));
//bool(false)

我已经报了Bug, 不过PHP本身也不保证类型转换的一致性, 所以PHP维护者最后认为是不是Bug都无所谓了, 大家平时注意即可:http://bugs.php.net/bug.php?id=51915

注1

本文中所说的字符串数字和之前的文章PHP字符串比较中所说的numeric string有一点不同, 在zend_symtable_*系列函数中, 只会吧/^-?[^0][0-9]*$/这样的字符串认为是数字字符串. 相关核心逻辑如下:

#define HANDLE_NUMERIC(key, length, func) {
    register char *tmp=key;
    if (*tmp=='-') {
        tmp++;
    }
    if ((*tmp>='0' && *tmp<='9')) do {
        char *end=key+length-1;
        long idx;
        if (*tmp++=='0' && length>2) {
            break;
        }
        while (tmp<end) {
            if (!(*tmp>='0' && *tmp<='9')) {
                break;
            }
            tmp++;
        }
        if (tmp==end && *tmp=='0') {
            if (*key=='-') {
                idx = strtol(key, NULL, 10);
                if (idx!=LONG_MIN) {
                    return func;
                }
            } else {
                idx = strtol(key, NULL, 10);
                if (idx!=LONG_MAX) {
                    return func;
                }
            }
        }
    } while (0);
}

PS:我这里只有5.2.8, 5.2.11俩个版本, 各位读者如果有其他版本的PHP, 帮忙测试下是否在你的版本下也存在这个问题. 谢谢

另: 谢谢远豪提供这个问题, 原问题是和Memcached相关的.

参与评论