1 过滤器

PHP 过滤器用于验证和过滤来自非安全来源的数据，比如用户的输入。

1.1 简介

PHP 过滤器用于验证和过滤来自非安全来源的数据。
测试、验证和过滤用户输入或自定义数据是任何 Web 应用程序的重要组成部分。
PHP 的过滤器扩展的设计目的是使数据过滤更轻松快捷。

使用过滤器原因：

几乎所有的 Web 应用程序都依赖外部的输入。这些数据通常来自用户或其他应用程序（比如 web 服务）。通过使用过滤器，能够确保应用程序获得正确的输入类型

应该始终对外部数据进行过滤，输入过滤是最重要的应用程序安全课题之一。
那么什么是外部数据：

来自表单的输入数据
Cookies
Web services data
服务器变量
数据库查询结果

1.2 函数和过滤器

1.2.1 方法说明

如需过滤变量，请使用下面的过滤器函数之一：

filter_var($variable [, $filter = FILTER_DEFAULT [, $options ]])：通过一个指定的过滤器来过滤单一的变量，函数用于获取一个变量并对其进行过滤
- $variable：要过滤的变量。
- $filter：要使用的过滤器类型。默认为 FILTER_DEFAULT，这实际上不会进行任何过滤。
- $options：(可选）指定过滤器选项
filter_var_array(参数同上)：通过相同的或不同的过滤器来过滤多个变量
filter_input($type , $variable_name [, $filter = FILTER_DEFAULT [, $options ]])：获取一个输入变量，并对它进行过滤，用于从外部输入源（如 GET、POST、COOKIE、ENV、SERVER 等）获取一个变量并对其进行过滤。这个函数通常用于处理通过 HTTP 请求发送的数据
- $type：指定输入类型。例如，INPUT_GET、INPUT_POST、INPUT_COOKIE 等。
- $variable_name：要获取的变量的名称。
- $filter：要使用的过滤器类型。默认为 FILTER_DEFAULT。
- $options：（可选）指定过滤器选项
filter_input_array()：获取多个输入变量，并通过相同的或不同的过滤器对它们进行过滤

1.2.2 filter_var示例

在下面的实例中，我们用 filter_var() 函数验证了一个整数：

<?php
$int = 123;
 
if(!filter_var($int, FILTER_VALIDATE_INT))
{
    echo("不是一个合法的整数");
}
else
{
    echo("是个合法的整数");
}
?>

上面的代码使用了 FILTER_VALIDATE_INT 过滤器来过滤变量。

Validating 和 Sanitizing两种过滤器：

Validating 过滤器：
用于验证用户输入
严格的格式规则（比如 URL 或 E-Mail 验证）
如果成功则返回预期的类型，如果失败则返回 FALSE
Sanitizing 过滤器：
用于允许或禁止字符串中指定的字符
无数据格式规则
始终返回字符串

选项和标志用于向指定的过滤器添加额外的过滤选项。
不同的过滤器有不同的选项和标志。
在下面的实例中，我们用 filter_var() 和 min_range 以及 max_range 选项验证了一个整数：

<?php
$var=300;
 
$int_options = array(
    "options"=>array
    (
        "min_range"=>0,
        "max_range"=>256
    )
);
 
if(!filter_var($var, FILTER_VALIDATE_INT, $int_options))
{
    echo("不是一个合法的整数");
}
else
{
    echo("是个合法的整数");
}
?>

就像上面的代码一样，选项必须放入一个名为 options 的相关数组中。如果使用标志，则不需在数组内。

1.2.3 filter_input示例

用 filter_input() 函数过滤输入的数据。在下面的实例中，输入变量 "email" 被传到 PHP 页面：

<?php
if(!filter_has_var(INPUT_GET, "email"))
{
    echo("没有 email 参数");
}
else
{
    if (!filter_input(INPUT_GET, "email", FILTER_VALIDATE_EMAIL))
    {
        echo "不是一个合法的 E-Mail";
    }
    else
    {
        echo "是一个合法的 E-Mail";
    }
}
?>

1.2.4 filter_var_array和filter_input_array示例

表单通常由多个输入字段组成。为了避免对 filter_var 或 filter_input 函数重复调用，我们可以使用 filter_var_array 或 the filter_input_array 函数。

在本例中，我们使用 filter_input_array() 函数来过滤三个 GET 变量。接收到的 GET 变量是一个名字、一个年龄以及一个 e-mail 地址：

<?php
$filters = array
(
    "name" => array
    (
        "filter"=>FILTER_SANITIZE_STRING
    ),
    "age" => array
    (
        "filter"=>FILTER_VALIDATE_INT,
        "options"=>array
        (
            "min_range"=>1,
            "max_range"=>120
        )
    ),
    "email"=> FILTER_VALIDATE_EMAIL
);
 
$result = filter_input_array(INPUT_GET, $filters);
 
if (!$result["age"])
{
    echo("年龄必须在 1 到 120 之间。<br>");
}
elseif(!$result["email"])
{
    echo("E-Mail 不合法<br>");
}
else
{
    echo("输入正确");
}
?>

实例解释：

上面的实例有三个通过 "GET" 方法传送的输入变量 (name、age 和 email)：
设置一个数组，其中包含了输入变量的名称和用于指定的输入变量的过滤器
调用 filter_input_array() 函数，参数包括 GET 输入变量及刚才设置的数组
检测 $result 变量中的 "age" 和 "email" 变量是否有非法的输入。（如果存在非法输入，在使用 filter_input_array() 函数之后，输入变量为 FALSE。）

filter_input_array() 函数的第二个参数可以是数组或单一过滤器的 ID。
如果该参数是单一过滤器的 ID，那么这个指定的过滤器会过滤输入数组中所有的值。

如果该参数是一个数组，那么此数组必须遵循下面的规则：

必须是一个关联数组，其中包含的输入变量是数组的键（比如 "age" 输入变量）
此数组的值必须是过滤器的 ID ，或者是规定了过滤器、标志和选项的数组

1.3 自定义过滤器

通过使用 FILTER_CALLBACK 过滤器，可以调用自定义的函数，把它作为一个过滤器来使用。这样，就拥有了数据过滤的完全控制权。
可以创建自己的自定义函数，也可以使用已存在的 PHP 函数。

将准备用到的过滤器的函数，按指定选项的规定方法进行规定。在关联数组中，带有名称 options。
在下面的实例中，使用了一个自定义的函数把所有 _ 转换为 .：

<?php
function convertSpace($string)
{
    return str_replace("_", ".", $string);
} 
$string = "www_baidu_com!";
echo filter_var($string, FILTER_CALLBACK,array("options"=>"convertSpace"));
?>

实例解释，上面的实例把所有 "_" 转换成 "." ：

创建一个把 "_" 替换为 "." 的函数
调用 filter_var() 函数，它的参数是 FILTER_CALLBACK 过滤器以及包含函数的数组

1.4 PHP Filter函数

函数	描述
filter_has_var()	检查是否存在指定输入类型的变量
filter_id()	返回指定过滤器的 ID 号
filter_input()	从脚本外部获取输入，并进行过滤
filter_input_array()	从脚本外部获取多项输入，并进行过滤
filter_list()	返回包含所有得到支持的过滤器的一个数组
filter_var_array()	获取多个变量，并进行过滤
filter_var()	获取一个变量，并进行过滤

过滤器名称

ID 名称	描述
FILTER_CALLBACK	调用用户自定义函数来过滤数据
FILTER_SANITIZE_STRING	去除标签，去除或编码特殊字符
FILTER_SANITIZE_STRIPPED	"string" 过滤器的别名
FILTER_SANITIZE_ENCODED	URL-encode 字符串，去除或编码特殊字符
FILTER_SANITIZE_SPECIAL_CHARS	HTML 转义字符 `'"<>&` 以及 `ASCII` 值小于 32 的字符
FILTER_SANITIZE_EMAIL	删除所有字符，除了字母、数字以及 `!#$%&'*+-/=?^_{\|}~@.[]`
FILTER_SANITIZE_URL	删除所有字符，除了字母、数字以及 $-_.+!*'(),{}\|\^~[]``<>#%";/?:@&=
FILTER_SANITIZE_NUMBER_INT	删除所有字符，除了数字和 `+-`
FILTER_SANITIZE_NUMBER_FLOAT	删除所有字符，除了数字、`+-` 以及 `.,eE`
FILTER_SANITIZE_MAGIC_QUOTES	应用 addslashes()
FILTER_UNSAFE_RAW	不进行任何过滤，去除或编码特殊字符
FILTER_VALIDATE_INT	把值作为整数来验证
FILTER_VALIDATE_BOOLEAN	把值作为布尔选项来验证。如果是 "1"、"true"、"on" 和 "yes"，则返回 TRUE。如果是 "0"、"false"、"off"、"no" 和 ""，则返回 FALSE。否则返回 NULL
FILTER_VALIDATE_FLOAT	把值作为浮点数来验证
FILTER_VALIDATE_REGEXP	根据 regexp（一种兼容 Perl 的正则表达式）来验证值
FILTER_VALIDATE_URL	把值作为 URL 来验证
FILTER_VALIDATE_EMAIL	把值作为 e-mail 地址来验证
FILTER_VALIDATE_IP	把值作为 IP 地址来验证，只限 IPv4 或 IPv6 或不是来自私有或者保留的范围

标签：FILTER,filter,过滤,讲解,过滤器,array,PHP,输入
From： https://www.cnblogs.com/jingzh/p/18262532

PHP基础之过滤器讲解