目录
1 过滤器
PHP
过滤器用于验证和过滤来自非安全来源的数据,比如用户的输入。
1.1 简介
PHP
过滤器用于验证和过滤来自非安全来源的数据。
测试、验证和过滤用户输入或自定义数据是任何 Web
应用程序的重要组成部分。
PHP
的过滤器扩展的设计目的是使数据过滤更轻松快捷。
使用过滤器原因:
几乎所有的
Web
应用程序都依赖外部的输入。这些数据通常来自用户或其他应用程序(比如 web 服务)。通过使用过滤器,能够确保应用程序获得正确的输入类型
应该始终对外部数据进行过滤,输入过滤是最重要的应用程序安全课题之一。
那么什么是外部数据:
- 来自表单的输入数据
- Cookies
- Web services data
- 服务器变量
- 数据库查询结果
1.2 函数和过滤器
1.2.1 方法说明
如需过滤变量,请使用下面的过滤器函数之一:
filter_var($variable [, $filter = FILTER_DEFAULT [, $options ]])
:通过一个指定的过滤器来过滤单一的变量,函数用于获取一个变量并对其进行过滤$variable
:要过滤的变量。$filter
:要使用的过滤器类型。默认为FILTER_DEFAULT
,这实际上不会进行任何过滤。$options
:(可选)指定过滤器选项
filter_var_array(参数同上)
:通过相同的或不同的过滤器来过滤多个变量filter_input($type , $variable_name [, $filter = FILTER_DEFAULT [, $options ]])
:获取一个输入变量,并对它进行过滤,用于从外部输入源(如GET、POST、COOKIE、ENV、SERVER
等)获取一个变量并对其进行过滤。这个函数通常用于处理通过HTTP
请求发送的数据$type
:指定输入类型。例如,INPUT_GET、INPUT_POST、INPUT_COOKIE
等。$variable_name
:要获取的变量的名称。$filter
:要使用的过滤器类型。默认为 FILTER_DEFAULT。$options
:(可选)指定过滤器选项
filter_input_array()
:获取多个输入变量,并通过相同的或不同的过滤器对它们进行过滤
1.2.2 filter_var示例
在下面的实例中,我们用 filter_var() 函数验证了一个整数:
<?php
$int = 123;
if(!filter_var($int, FILTER_VALIDATE_INT))
{
echo("不是一个合法的整数");
}
else
{
echo("是个合法的整数");
}
?>
上面的代码使用了 FILTER_VALIDATE_INT
过滤器来过滤变量。
Validating 和 Sanitizing
两种过滤器:
Validating
过滤器:
用于验证用户输入
严格的格式规则(比如 URL 或 E-Mail 验证)
如果成功则返回预期的类型,如果失败则返回 FALSESanitizing
过滤器:
用于允许或禁止字符串中指定的字符
无数据格式规则
始终返回字符串
选项和标志用于向指定的过滤器添加额外的过滤选项。
不同的过滤器有不同的选项和标志。
在下面的实例中,我们用 filter_var()
和 min_range
以及 max_range
选项验证了一个整数:
<?php
$var=300;
$int_options = array(
"options"=>array
(
"min_range"=>0,
"max_range"=>256
)
);
if(!filter_var($var, FILTER_VALIDATE_INT, $int_options))
{
echo("不是一个合法的整数");
}
else
{
echo("是个合法的整数");
}
?>
就像上面的代码一样,选项必须放入一个名为 options
的相关数组中。如果使用标志,则不需在数组内。
1.2.3 filter_input示例
用 filter_input()
函数过滤输入的数据。在下面的实例中,输入变量 "email" 被传到 PHP 页面:
<?php
if(!filter_has_var(INPUT_GET, "email"))
{
echo("没有 email 参数");
}
else
{
if (!filter_input(INPUT_GET, "email", FILTER_VALIDATE_EMAIL))
{
echo "不是一个合法的 E-Mail";
}
else
{
echo "是一个合法的 E-Mail";
}
}
?>
1.2.4 filter_var_array和filter_input_array示例
表单通常由多个输入字段组成。为了避免对 filter_var 或 filter_input
函数重复调用,我们可以使用 filter_var_array 或 the filter_input_array
函数。
在本例中,我们使用 filter_input_array() 函数来过滤三个 GET 变量。接收到的 GET 变量是一个名字、一个年龄以及一个 e-mail 地址:
<?php
$filters = array
(
"name" => array
(
"filter"=>FILTER_SANITIZE_STRING
),
"age" => array
(
"filter"=>FILTER_VALIDATE_INT,
"options"=>array
(
"min_range"=>1,
"max_range"=>120
)
),
"email"=> FILTER_VALIDATE_EMAIL
);
$result = filter_input_array(INPUT_GET, $filters);
if (!$result["age"])
{
echo("年龄必须在 1 到 120 之间。<br>");
}
elseif(!$result["email"])
{
echo("E-Mail 不合法<br>");
}
else
{
echo("输入正确");
}
?>
实例解释:
- 上面的实例有三个通过 "GET" 方法传送的输入变量 (name、age 和 email):
- 设置一个数组,其中包含了输入变量的名称和用于指定的输入变量的过滤器
- 调用
filter_input_array()
函数,参数包括 GET 输入变量及刚才设置的数组
检测$result
变量中的 "age" 和 "email" 变量是否有非法的输入。(如果存在非法输入,在使用filter_input_array()
函数之后,输入变量为 FALSE。)
filter_input_array()
函数的第二个参数可以是数组或单一过滤器的 ID。
如果该参数是单一过滤器的 ID,那么这个指定的过滤器会过滤输入数组中所有的值。
如果该参数是一个数组,那么此数组必须遵循下面的规则:
- 必须是一个
关联数组
,其中包含的输入变量是数组的键(比如 "age" 输入变量) - 此数组的值必须是
过滤器的 ID
,或者是规定了过滤器、标志和选项的数组
1.3 自定义过滤器
通过使用 FILTER_CALLBACK
过滤器,可以调用自定义的函数,把它作为一个过滤器来使用。这样,就拥有了数据过滤的完全控制权。
可以创建自己的自定义函数,也可以使用已存在的 PHP
函数。
将准备用到的过滤器的函数,按指定选项
的规定方法进行规定。在关联数组中,带有名称 options
。
在下面的实例中,使用了一个自定义的函数把所有 _
转换为 .
:
<?php
function convertSpace($string)
{
return str_replace("_", ".", $string);
}
$string = "www_baidu_com!";
echo filter_var($string, FILTER_CALLBACK,array("options"=>"convertSpace"));
?>
实例解释,上面的实例把所有 "_" 转换成 "." :
- 创建一个把 "_" 替换为 "." 的函数
- 调用
filter_var()
函数,它的参数是FILTER_CALLBACK
过滤器以及包含函数的数组
1.4 PHP Filter函数
函数 | 描述 |
---|---|
filter_has_var() | 检查是否存在指定输入类型的变量 |
filter_id() | 返回指定过滤器的 ID 号 |
filter_input() | 从脚本外部获取输入,并进行过滤 |
filter_input_array() | 从脚本外部获取多项输入,并进行过滤 |
filter_list() | 返回包含所有得到支持的过滤器的一个数组 |
filter_var_array() | 获取多个变量,并进行过滤 |
filter_var() | 获取一个变量,并进行过滤 |
过滤器名称
ID 名称 | 描述 |
---|---|
FILTER_CALLBACK | 调用用户自定义函数来过滤数据 |
FILTER_SANITIZE_STRING | 去除标签,去除或编码特殊字符 |
FILTER_SANITIZE_STRIPPED | "string" 过滤器的别名 |
FILTER_SANITIZE_ENCODED | URL-encode 字符串,去除或编码特殊字符 |
FILTER_SANITIZE_SPECIAL_CHARS | HTML 转义字符 '"<>& 以及 ASCII 值小于 32 的字符 |
FILTER_SANITIZE_EMAIL | 删除所有字符,除了字母、数字以及 !#$%&'*+-/=?^_{|}~@.[] |
FILTER_SANITIZE_URL | 删除所有字符,除了字母、数字以及 $-_.+!*'(),{}|\^~[]``<>#%";/?:@&= |
FILTER_SANITIZE_NUMBER_INT | 删除所有字符,除了数字和 +- |
FILTER_SANITIZE_NUMBER_FLOAT | 删除所有字符,除了数字、+- 以及 .,eE |
FILTER_SANITIZE_MAGIC_QUOTES | 应用 addslashes() |
FILTER_UNSAFE_RAW | 不进行任何过滤,去除或编码特殊字符 |
FILTER_VALIDATE_INT | 把值作为整数来验证 |
FILTER_VALIDATE_BOOLEAN | 把值作为布尔选项来验证。如果是 "1"、"true"、"on" 和 "yes",则返回 TRUE。如果是 "0"、"false"、"off"、"no" 和 "",则返回 FALSE。否则返回 NULL |
FILTER_VALIDATE_FLOAT | 把值作为浮点数来验证 |
FILTER_VALIDATE_REGEXP | 根据 regexp(一种兼容 Perl 的正则表达式)来验证值 |
FILTER_VALIDATE_URL | 把值作为 URL 来验证 |
FILTER_VALIDATE_EMAIL | 把值作为 e-mail 地址来验证 |
FILTER_VALIDATE_IP | 把值作为 IP 地址来验证,只限 IPv4 或 IPv6 或 不是来自私有或者保留的范围 |