首页 > 编程语言 >自动提取土壤线-基于Python

自动提取土壤线-基于Python

时间:2022-12-18 12:34:07浏览次数:47  
标签:... 1.0 Python 65535 nir 提取 土壤 red

以前上遥感课写的记录,我把它搬到这里,错误也有参考的意义。

背景和意义

土壤在可见光波段(R)与近红外波段(NIR)的反射率具有线性关系,在R-NIR通道的二维坐标中,土壤光谱特性的变化表现为一个由近于原点发射的直线,称之为土壤线,可表示为: ρNIR = αR +b,其中α,b分别为土壤线的斜率和斜距。 土壤的光谱特征受土壤有机质、氧化铁、粗糙度等众多因素的影响,但是对于同一种土壤来说,其反射光谱在红与近红外波段形成了特定的土壤线,它不仅反映土壤的光 学特性,有助于了解土壤和植被的理化性质与生态特征,并且参与植被指数计算,消除观测场土壤背景的 影响,如垂直植被指数、土壤调整植被指数和转换型土壤调整植被指数等均基于土壤线方程的参数进行计算,另外还可用于表征土壤的不同湿度状况,基于土壤线斜率提出的土壤干旱指数可以有效监测土壤水分。11

 

方法简介

常规提取土壤线的方法,是利用地面实测土壤光谱、影像解译及其他方法从遥感影像上识别出裸土像元,进行土壤线参数的计算。常规方法较为复杂,受人为因素影响较多,并且对于中低分辨率的遥感影像来说,裸土的识别难度较大而难以实行,本文参考秦其明先生所著论文33,引入统计学中的相关分析-皮尔逊相关系数与一元线性回归模型,自动提取提取土壤线。

皮尔逊相关系数

用于度量两个变量X和Y之间的相關程度(线性相关),其值介于-1与1之间。在自然科学领域中,该系数广泛用于度量两个变量之间的线性相关程度,它是由卡尔·皮尔逊从弗朗西斯·高尔顿在19世纪80年代提出的一个相似却又稍有不同的想法演变而来。 两个变量之间的皮尔逊相关系数定义为两个变量的协方差除以它们标准差的乘积:

相关系数r值介于[-1,1]之间,r > 0,表示正相关,即两要素同向相关;r < 0,表示负相关,即两要素异向相关。r的值越接近于1,表示两要素的关系越密切;越接近于0,表示两要素的关系不密切。

一元线性回归模型

描述两个要素(变量)之间的线性相关关系,假设两个地理要素(变量)x和y,x为自变量,y为因变量。则一元线性回归模型的基本结构形式为:

 

数据说明

报告实验数据为Landsat 8 OLI_TIRS 卫星数字产品,条带号为 115,30,下载自地理空间数据云,部分信息如下:。

  • 数据标识: LE71150302000161EDC00
  • 数据范围:麻栗坡县,云南
  • 日期: 2000年

已在ENVI中进行辐射校正预处理。

 

处理分析

处理环境:Jupyter lab
Python版本:Python3.7 64-bit

 

数据准备与转换

首先使用rasterio库读取遥感影像,提取遥感影像中的灰度值(DN) ,将DN值转为多维数组。影像默认数据类型为无符号16位整形,需要改为32位浮点型。

In [120]:
# 导入依赖库
import rasterio
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib as mpl
mpl.rcParams['font.family'] = "SimHei" # 设置中文字体
mpl.rcParams['agg.path.chunksize'] = 100000000 # 设置散点图最大点数为1亿个
from scipy.optimize import leastsq
In [132]:
# 读取遥感影像,B4.TIF对应红外波段,B5.TIF对应近红外波段
with rasterio.open("./raster/mlp/nir.tif", 'r') as nir_src:
    nir = nir_src.read(1)
with rasterio.open("./raster/mlp/red.tif", 'r') as red_src:
    red = red_src.read(1)
In [127]:
fig, axs = plt.subplots(1,2, figsize=(20, 10))
axs[0].imshow(red,cmap = plt.get_cmap("gray"))
axs[0].set_title("红色波段", fontsize=20, pad=10)
axs[1].imshow(nir, cmap = plt.get_cmap("gray"))
axs[1].set_title("近红外波段", fontsize=20, pad=10)
plt.savefig('./figure/diff.jpeg', dpi=200)
plt.show()  # 预览遥感影像
   

将数据转换为一维数组

In [134]:
# 原始波段维度
red
nir
Out[134]:
array([[65535, 65535, 65535, ..., 65535, 65535, 65535],
       [65535, 65535, 65535, ..., 65535, 65535, 65535],
       [65535, 65535, 65535, ..., 65535, 65535, 65535],
       ...,
       [65535, 65535, 65535, ..., 65535, 65535, 65535],
       [65535, 65535, 65535, ..., 65535, 65535, 65535],
       [65535, 65535, 65535, ..., 65535, 65535, 65535]], dtype=uint16)
In [137]:
max_value = red.max()
red = red.astype(np.float32).flatten() / max_value
nir = nir.astype(np.float32).flatten() / max_value
img_df = pd.DataFrame(
    {"red":red, "nir":nir},
    index=np.arange(len(red))
    )
img_df
Out[137]:
 rednir
0 1.0 1.0
1 1.0 1.0
2 1.0 1.0
3 1.0 1.0
4 1.0 1.0
... ... ...
7111659 1.0 1.0
7111660 1.0 1.0
7111661 1.0 1.0
7111662 1.0 1.0
7111663 1.0 1.0

7111664 rows × 2 columns

 

筛选数据

  • 获取初始土壤点——横坐标所对应的纵坐标值最小的点。

  • 统计特征空间中,横轴的最大/小值,设置组距,将所有像元点按照横轴波段反射率归入不同组,接着提取每组中纵轴波段反射率最小的像元点和其横轴区间均值,构成(xi,yi)土壤点集。

  • 自适应区间选取,由于初始化土壤点集并非全部都是土壤点,需要对其作进一步筛选。我将初始土壤点集划分为0%-50%,0%-75%,0%-100%,25%-75%,25%-100%五个子集。然后逐个计算子集的最小二乘相关系数,最大者即确认为有效点集。

In [94]:
fig, ax = plt.subplots(1,1, figsize=(10, 10))
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
ax.set_ylabel("NIR 反射率", fontsize=15)
ax.set_xlabel("RED 反射率", fontsize=15)
ax.plot(img_df.red, img_df.nir, '.')
plt.show()
    In [140]:
catos = pd.cut(img_df.red, bins=256, right=True, precision=5, labels=np.arange(256))
img_df['class'] = catos # 将分类结果添加到面板数据内
img_df
Out[140]:
 rednirclass
0 1.0 1.0 255
1 1.0 1.0 255
2 1.0 1.0 255
3 1.0 1.0 255
4 1.0 1.0 255
... ... ... ...
7111659 1.0 1.0 255
7111660 1.0 1.0 255
7111661 1.0 1.0 255
7111662 1.0 1.0 255
7111663 1.0 1.0 255

7111664 rows × 3 columns

In [145]:
gb = img_df.groupby(by="class")
nir_min = gb['nir'].min().fillna(0)
red_mean = gb['red'].mean().fillna(0)
r_df = pd.DataFrame({"red": red_mean, "nir": nir_min})
r_df
Out[145]:
 rednir
class  
0 0.096422 0.099825
1 0.099828 0.100496
2 0.103013 0.103349
3 0.106333 0.094331
4 0.109638 0.094682
... ... ...
251 0.000000 0.000000
252 0.000000 0.000000
253 0.000000 0.000000
254 0.994461 0.989120
255 1.000000 1.000000

256 rows × 2 columns

 

cut方法用于将数据分段,这里设定分为256组, 然后获取每组内红色波段(red)的平均值和近红外波段(nir)的最小值。 这样子便获得了土壤点集,分别是近红外最小值——nir_min和红色平均值——red_mean,构建土壤点集面板数据 现在编写计算相关系数代码,分别计算0%~50%,0%~75%,0%~100,25%~75%,25%~100%这五个子集的相关系数

In [117]:
import math
# 计算相关系数函数
def r_calcu(a, b):
    x = a.to_list()
    y = b.to_list()
    sum_ref = 0
    x_sum = 0
    y_sum = 0
    x_mean = sum(x) / len(x)
    y_mean = sum(y) / len(y)
    
    for i in range(len(x)):
        sum_ref += (x[i] - x_mean) * (y[i] - y_mean)
        x_sum  += math.pow((x[i] - x_mean), 2)
        y_sum += math.pow((y[i] - y_mean), 2)
    
    res = sum_ref / (math.sqrt((x_sum) * y_sum))
    print("R values: %.10f" % res)
    return res
In [118]:
box = [(0, 128), (0, 192), (0, 256), (64, 192), (64, 256)]
for b in box:
    data = r_df.iloc[b[0]: b[1]]
    r_calcu(data.red, data.nir)
 
R values: 0.9896115364
R values: 0.9882301318
R values: 0.9887827549
R values: 0.9930419777
R values: 0.9908521183
 

结果五个子集中相关性最大为子集25%-75%,确认为有效土壤集。 得到有效土壤集,接下来借助scikit库对回归线作拟合。

In [150]:
# 拟合残差函数
def err(p, x, y):
    return p[0] * x + p[1] -y
    
#参数p 为最小二乘法拟合的初值
#我试了多个参数,结果是一致的
p = [0.7, 0.8] 
ret = leastsq(err, p, args=(r_df.red[64: 192], r_df.nir[64: 192]))#返回参数为一个包含拟合后参数的元组
k,b = ret[0]
plt.figure(figsize=(15, 15))
x = np.linspace(0,0.8, 20)
y = x * k + b
# 绘制图像
fig, ax = plt.subplots(1,1, figsize=(15, 15))
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
ax.set_ylabel("NIR 反射率", fontsize=15)
ax.set_xlabel("RED 反射率", fontsize=15)
#ax.set_title("土壤线", fontsize=20, pad=10)
ax.plot(img_df.red, img_df.nir, '.')
ax.plot(x, y, linewidth=2, color="gray", label="土壤线")
plt.legend(fontsize=12, loc="upper right")
#plt.savefig("./figure/solil_raw.jpeg", dpi=200)
plt.show()
 
<Figure size 1080x1080 with 0 Axes>
   

参考:

[1]赵英时.遥感应用分析原理与方法(第二版)[M].科学出版社,北京,2013
[2]徐建华.计量地理学(第二版)[M].高等教育出版社,北京,2014
[3]秦其明等.基于二维光谱特征空间的土壤先自动提取算法[J].农业工程学报,2012
In [ ]:  

标签:...,1.0,Python,65535,nir,提取,土壤,red
From: https://www.cnblogs.com/wsh233/p/16990158.html

相关文章

  • PYTHON 模块 - logging
    1.1loggin日志模块用print函数要想同时输出日志信息和时间、所在函数、所在线程等内容是比较困难的。,可以用loggin模块,它是内置的模块。1.2日志级别一共有五个极别,从......
  • Python 为什么如此设计?
    大概两年半前,我萌生了要创作一个新的系列文章的想法,也就是“Python为什么”,试图对Python的语法及特性提出“为什么”式的问题,以此加深对它的理解,探寻使用技巧、发展演变......
  • 短网址解析长网址python示例
    做可视化比较麻烦我就没做,用文件处理的,这里需要两个文件1、readUrl.txt文件保存需要解析的字符串2、newUrl.txt文件保存解析完成的字符串目录​​readUrl.txt文件示例​​​......
  • 走过岁月我才发现——云IDE真方便(Python3.8环境测试)
    目录​​产品测试:​​​​创建工作空间​​​​插件安装​​​​创建python文件​​​​运行python文件​​​​Demo测试​​​​查看环境piplist​​​​云IDE挑战赛​​......
  • 【python/pycharm】豆瓣top250电影
    学弟给的importreimportrequestsurl="https://movie.douban.com/top250"headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/5......
  • python中实现保留几位小数的几种方式
    方式一:format()format(1.235,'.2f')Out[1]:'1.24'format(1.2,'.2f')Out[2]:'1.20'format(1.2,'.3f')Out[3]:'1.200'返回值为字符串类型,末位会自动补0......
  • 【python/pycharm】哆啦A梦
    #!/usr/bin/envpython3#-*-coding:utf-8-*-#@Author:dong#@Date:2018-07-0519:37:42#@Env:python3.6#@Github:https://github.com/PerpetualSmilef......
  • Python之⾯向对象-继承
    一、继承的概念⽣活中的继承,⼀般指的是⼦⼥继承⽗辈的财产。拓展1:经典类或旧式类不由任意内置类型派⽣出的类,称之为经典类。class类名:代码......拓展2:新式类class类名......
  • 开个坑,明天学点Gdb+Python脚本!!!! 22:13 2022年12月17日(星期六)
    写在前面我发现如果调试如果一直截图,其实对于我来说,需要找回当时的记忆,可以一声熬,才能拥有和当时一样的见解。最近心得以前没有记录的习惯,导致很多知识,比如defer的创......
  • 二分查找python与java实现
    定义给定以下情景,假设有一个有序的数组(从大到小排列),我们需要从中找出我们所需的目标元素并返回其索引。一般的思想是可以使用for循环进行遍历,直到找到目标元素......