Processing math: 0%
  • 中文核心期刊要目总览
  • 中国科技核心期刊
  • 中国科学引文数据库(CSCD)
  • 中国科技论文与引文数据库(CSTPCD)
  • 中国学术期刊文摘数据库(CSAD)
  • 中国学术期刊(网络版)(CNKI)
  • 中文科技期刊数据库
  • 万方数据知识服务平台
  • 中国超星期刊域出版平台
  • 国家科技学术期刊开放平台
  • 荷兰文摘与引文数据库(SCOPUS)
  • 日本科学技术振兴机构数据库(JST)
微信公众号

微信公众号

高分三号SAR精准海陆分割的混合策略方法

侯晰月, 徐丰

侯晰月, 徐丰. 高分三号SAR精准海陆分割的混合策略方法[J]. 电波科学学报, 2019, 34(6): 798-805. doi: 10.13443/j.cjors.2019042801
引用格式: 侯晰月, 徐丰. 高分三号SAR精准海陆分割的混合策略方法[J]. 电波科学学报, 2019, 34(6): 798-805. doi: 10.13443/j.cjors.2019042801
HOU Xiyue, XU Feng. Hybrid strategy for precise sea-land segmentation in GF-3 SAR images[J]. CHINESE JOURNAL OF RADIO SCIENCE, 2019, 34(6): 798-805. doi: 10.13443/j.cjors.2019042801
Reference format: HOU Xiyue, XU Feng. Hybrid strategy for precise sea-land segmentation in GF-3 SAR images[J]. CHINESE JOURNAL OF RADIO SCIENCE, 2019, 34(6): 798-805. doi: 10.13443/j.cjors.2019042801

高分三号SAR精准海陆分割的混合策略方法

基金项目: 

国家自然科学基金 61822107

详细信息
    作者简介:

    侯晰月(1996—), 女, 吉林人, 复旦大学电磁波信息科学教育部重点实验室硕士研究生, 研究方向为SAR图像智能解译、图像处理、极化雷达目标检测与识别

    徐丰(1982—), 男, 浙江人, 复旦大学信息科学与工程学院教授, 电磁波信息科学教育部重点实验室副主任, 研究方向为电磁散射建模、SAR图像解译

    通信作者:

    徐丰  E-mail:fengxu@fudan.edu.cn

  • 中图分类号: V474.2

Hybrid strategy for precise sea-land segmentation in GF-3 SAR images

  • 摘要: 高分三号(GF-3)是我国第一颗多极化雷达卫星,主要用于海洋遥感和海面监测,其中海陆分割是重要的预处理步骤.文章针对GF-3多极化合成孔径雷达(synthetic aperture radar,SAR)的精准海陆分割,提出了创新的混合策略方法,可提高分割性能对于相干斑噪声、风浪、成像等因素的稳健性.针对不同的极化通道采取三种不同的策略:1)对数混合高斯模型,用于确定海陆比,将纯陆地和纯海洋图像与海陆图像区分开,同时根据混合模型参数对海陆图像进行精细聚类;2)大津法,通过分别在对数域和复数域实现类间方差最大化,产生基于灰度信息的海陆掩膜;3)对数累积量,分析纹理信息,通过对数二阶矩与对数三阶矩之间的联系判断海陆大致分布,用作对投票机制产生的海陆掩膜进行验证与再分割,增强海陆分割精确性.针对大量GF-3数据进行实验,结果均达到理想效果,具备实际应用价值.
    Abstract: Gaofen-3(GF-3) was the first multi-polarization radar satellite launched by China which is dedicated to marine monitoring and ocean remote sensing. Sea-land segmentation is a vital step of image preprocessing. In this paper, we propose a novel hybrid strategy for precise sea-land segmentation in GF-3 SAR images, which can improve the robustness of segmentation performance with respect to speckle noise, waves, imaging, and etc. Three different strategies are adopted in different polarized channels:1) logarithmic Gaussian mixture model(LGMM) is applied to distinguish all-land and all-sea images from mixture images by determining the ratio of sea-to-land, and it conducts fine clustering of sea-land segmentation according to the parameters of LGMM; 2) OTSU method, which maximizes inter-class variance in logarithmic domain and complex domain respectively, and generates the sea-land masks based on gray information; 3) logarithmic cumulants are adopted to analyze texture information, and judges the general distribution of mixture images by the connection between logarithmic second-order moment and logarithmic third-order moment, so as to verify and predict the sea-land masks generated by majority voting mechanism, and enhance the accuracy of sea-land segmentation. Experiments were carried out on a large number of GF-3 SAR images, and the results are exceptional. The proposed sea-land segmentation algorithm has potential practical application.
  • 海陆分割是实现海岸线提取与监测、海上溢油污染监控、潮汐探测、近岸船只检测等重要任务的必要步骤.然而, 合成孔径雷达(synthetic aperture radar, SAR)影像中的海陆分割要比传统光学影像困难得多, 即使对于有经验的解译人员, SAR图像中的海陆分割在有些情况下也是较为困难的[1].主要表现在两个方面:一是来自粗糙海面的回波信号可能大于或等于沿岸陆地区域的回波信号, 导致边界不连续, 海陆分辨能力差; 二是存在相干斑噪声以及起伏变化的海域, 形成强散射体, 使得分割任务更加复杂.此外, 随着雷达传感器空间分辨率的提高, SAR图像中地貌信息更加详细, 使分割问题更加具有挑战性.

    GF-3是我国第一颗多极化雷达卫星, 海面监测等遥感应用是其主要业务之一.极化SAR的突出优点在于测量数据包含的信息量远大于传统雷达[2], 通过散射分解和特征分析, 提取出能够代表不同散射机理的多极化特征, 因而在很多领域都得到了广泛的应用, 特别是针对海陆分割存在的两大困难, 极化特征具有较为良好的表现.

    本文针对GF-3海陆分割问题展开研究.

    针对图像分割问题提出的解决方法进行总结与分类, 大体分为基于形态学的分割、基于小波变换的分割、基于图论的分割、基于神经网络的分割、基于非监督聚类的分割、基于混合模型的分割、基于阈值的分割七大类, 每种类型算法都有其针对性和局限性.其中基于混合模型的分割方法和基于阈值的分割方法研究最为广泛和成熟.

    基于混合模型的分割方法可分为统计模型, 如马尔可夫随机场、条件随机场、后沿边缘最大化算法、模拟退火法等; 基于边缘的模型, 如微分算子、Marr-Hilderth边缘检测器、曲线拟合技术、基于数学形态学的边缘检测[3], 基于反应-扩散方程的方法等; 基于区域的模型, 如最大期望迭代算法[1], 基于统计准则的区域活动轮廓线模型、参数活动轮廓模型、水平集演化模型、基于边界曲线拟合的活动轮廓模型、基于梯度和曲率构造速度函数监测的活动轮廓模型、区域生长算法、松弛标记区域分割算法、分水岭法等.其中最成功的模型是Chan和Vese基于Mumford-Shah分割技术和Level-Set方法提出的Chan-Vese(C-V)模型及其衍生模型[4], 然而该模型的分割效果过分依赖模型初始化, 参数具有强不确定性, 且求解偏微分方程固有的计算开销也是用水平集实现活动轮廓的一个缺点, 限制了它们在实时情况下的适用性.

    基于阈值的分割方法可分为直方图门限分割, 大津法, 矩不变法, 最大熵法, 最小误差法, 最大相关性准则, Yager测度极小化, 均值漂移, 灰度共生矩阵和峰值谷值分析法等.单纯的阈值分割仅考虑了图像的灰度信息, 忽略了空间位置的关联, 且相干斑对分割造成的影响也很难解决.

    对于分辨率在几十米左右的SAR图像, 如上这些方法都能在一定程度上取得较为满意的分割结果.然而对于高分辨率SAR图像, 如海岸线区域的TerraSAR-X图像和GF-3图像, 这些方法的性能在分割精度和效率上都有所下降.

    本文提出一种混合策略方法, 该海陆分割策略在如下两个方面有创新性:

    1) 充分考虑了海、陆分布各种可能的组合形式, 使得该算法针对任意SAR图像都可以准确提取海陆掩膜;

    2) 应用全极化模式, 结合统计信息、灰度信息和纹理信息, 利用投票机制使得该算法鲁棒性高、精度高, 较为适用于变化复杂的海陆分布情况.

    本文第一节讲述了该算法涉及到的理论知识, 包括对数混合高斯模型(logarithmic Gaussian mixture model, LGMM), 大津法(OTSU)和对数累积量; 第二节详细讲解了该算法实现流程与整体框架; 第三节讲述实验结果, 最后一节对全文进行总结概括.

    理论上, 如果某个混合高斯模型(Gaussian mixture model, GMM)融合的高斯模型个数足够多, 它们之间的权重设定得足够合理, 这个混合模型可以拟合任意分布的样本数据, 也即GMM的概率密度函数曲线可以是任意形状的非线性函数[5]. SAR图像的大量数据值密集地分布在一个较小的区间范围内, 只有极少量数据值分布在离密集区间很远的区域, 为实现精准海陆分割, 需拉大数据值之间的差别, 增强图像对比度, 因而采用LGMM拟合极化SAR图像数据.

    GMM本质就是融合几个单高斯模型, 来使得模型更加复杂, 从而产生更复杂的样本.

    已知一维高斯模型的概率密度函数如下:

    f\left( x \right) = \frac{1}{{\sqrt {2{\rm{ \mathsf{ π} }}} \sigma }}\exp \left( { - \frac{{{{\left( {x - \mu } \right)}^2}}}{{2{\sigma ^2}}}} \right). (1)

    式中:μ代表样本均值; σ代表样本标准差.

    现假设观测样本X={x1, x2, x3, …, xn}是M个高斯函数的混合分布, 则D维高斯混合模型的概率密度函数如下:

    \begin{array}{l} {f_k}\left( {{x_i}\left| {{\mu _k},{\mathit{\boldsymbol{ \boldsymbol{\varSigma} }}_k}} \right.} \right) = \frac{1}{{{{\left( {2{\rm{ \mathsf{ π} }}} \right)}^{\frac{D}{2}}}{{\left| {{\mathit{\boldsymbol{ \boldsymbol{\varSigma} }}_k}} \right|}^{\frac{1}{2}}}}}\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\exp \left( { - \frac{1}{2}{{\left( {{x_i} - {\mu _k}} \right)}^{\rm{T}}}\mathit{\boldsymbol{ \boldsymbol{\varSigma} }}_k^{ - 1}\left( {{x_i} - {\mu _k}} \right)} \right). \end{array} (2)

    式中:μk表示第k类观测值的均值; Σk表示第k类观测值变量之间的相关程度的协方差矩阵.

    对于离散值的M个混合高斯密度函数的加权平均所表示的概率密度函数为

    P\left( {{x_i}\left| \theta \right.} \right) = \sum\limits_{k = 1}^M {{{\rm{ \mathsf{ π} }}_k}{f_k}\left( {{x_i}\left| {{\theta _k}} \right.} \right)} . (3)

    式中:fk(xi|θk)=fk(xi|μk, Σk)表示第k类观测值的密度函数; θk表示条件概率, 由μκΣk组成; πk表示某一观测值属于第k类的概率.

    最大化混合似然函数为

    \begin{array}{l} {L_M}\left( {{\theta _1},{\theta _2}, \cdots ,{\theta _n}\left| x \right.} \right) = \prod\limits_{i = 1}^n {\sum\limits_{k = 1}^M {{{\rm{ \mathsf{ π} }}_k}{f_k}\left( {{x_i}|{\theta _k}} \right)} } ,\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{{\rm{ \mathsf{ π} }}_k} \ge 0,\sum\limits_{k = 1}^M {{{\rm{ \mathsf{ π} }}_k}} = 1. \end{array} (4)

    假设存在一个完整数据集Y:

    Y = \left\{ {\left( {{x_1},{z_1}} \right),\left( {{x_2},{z_2}} \right), \cdots ,\left( {{x_n},{z_n}} \right)} \right\}. (5)

    式中:zi∈{1, 2, …, n}是引入的隐含变量.由式(4)可得完整数据集Y的似然函数[6]

    L\left( {\mathit{\boldsymbol{\theta }}\left| {\mathit{\boldsymbol{X}},\mathit{\boldsymbol{Z}}} \right.} \right) = p\left( {\mathit{\boldsymbol{X}},\mathit{\boldsymbol{Z}}\left| \mathit{\boldsymbol{\theta }} \right.} \right) = \prod\limits_{i = 1}^n {p\left( {{x_i},{z_i},\left| \theta \right.} \right)} . (6)

    该似然函数的期望值为

    \begin{array}{l} E\left( {L\left( {\mathit{\boldsymbol{\theta }}\left| {\mathit{\boldsymbol{X}},\mathit{\boldsymbol{Z}}} \right.} \right)} \right) = E\left( {p\left( {\mathit{\boldsymbol{X}},\mathit{\boldsymbol{Z}}\left| \mathit{\boldsymbol{\theta }} \right.} \right)} \right)\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \int_Z {p\left( {\mathit{\boldsymbol{X}},\mathit{\boldsymbol{Z}}\left| \mathit{\boldsymbol{\theta }} \right.} \right)f\left( Z \right){\rm{d}}z} . \end{array} (7)

    构造辅助函数Q(θ, θi-1):

    \begin{array}{l} Q\left( {\theta ,{\theta _{i - 1}}} \right) = E\left( {\lg L\left( {\mathit{\boldsymbol{\theta }}\left| {\mathit{\boldsymbol{X}},\mathit{\boldsymbol{Z}}} \right.} \right)} \right)\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\; = \int_Z {\lg L\left( {\mathit{\boldsymbol{\theta }}\left| {\mathit{\boldsymbol{X}},\mathit{\boldsymbol{Z}}} \right.} \right)f\left( {\mathit{\boldsymbol{Z}}\left| {{\theta _{i - 1}}} \right.} \right){\rm{d}}z} . \end{array} (8)

    其事实上是对数似然函数lgL(θ|X, Z)的期望值, θi-1是上一步迭代运算求得的参数值.

    求解θ*=argmaxQ(θ, θi-1), 使得Q(θ*, θi-1)达到极大值.若θi*表示第i次迭代的最大似然函数值, θi-1*表示第i-1次迭代的最大似然函数, 我们已知θi*θi-1*, 所以该函数是收敛的.因而, 该完整数据的对数似然函数也可以写为

    L\left( {{\theta _k},{{\rm{ \mathsf{ π} }}_k},{z_{ik}}\left| x \right.} \right) = \sum\limits_{i = 1}^n {\sum\limits_{k - 1}^M {{Z_{ik}}} } \left( {\lg {{\rm{ \mathsf{ π} }}_k}{f_k}\left( {{x_i}|{\theta _k}} \right)} \right). (9)

    简而言之, 求解GMM就是确定GMM的参数, 使得由这组参数确定的混合模型最有可能产生采样的样本数据, 并用最大似然估计最大化似然函数, 通过使得样本集的联合概率最大来对参数进行估计, 从而选择最佳的分布模型[7].

    大津法是一种全局阈值分割算法[4, 8], 通过使灰度信息达到类间方差最大化, 来获取最佳门限阈值. SAR图像中的海洋的起伏变化比陆地建筑小很多, 产生的回波信号强度也较小.因此针对单阈值的海陆分割问题, 利用大津法能够较为容易地获取最佳海陆分割阈值.

    假设总像素数为M×N的SAR图像分为{0, 1, …, L-1}个灰度级, 则第i级灰度出现的概率为

    {p_i} = \frac{{{n_i}}}{{M \times N}}. (10)

    式中, ni是第i个灰度级的像素数.设门限取k, 则两种类别灰度分布、均值和对应的概率分别为

    \left\{ \begin{array}{l} {\mathit{\boldsymbol{C}}_0} = \left\{ {0,1,2, \cdots ,k - 1} \right\},{\mu _0} = \sum\limits_{i = 0}^k {i{p_i}} /{P_0},{P_0} = \sum\limits_{i = 0}^k {{p_i}} \\ {\mathit{\boldsymbol{C}}_1} = \left\{ {k,k + 1, \cdots ,k - 1} \right\},{\mu _1} = \sum\limits_{i = k + 1}^{L - 1} {i{p_i}} /{P_1},{P_1} = \sum\limits_{i = k + 1}^{L - 1} {{p_i}} = 1 - {P_0} \end{array} \right.. (11)

    定义最大类间方差σ*2

    \begin{array}{l} {\sigma ^{ * 2}} = {P_0}{\left( {{\mu _0} - u} \right)^2} + {P_1}{\left( {{\mu _1} - u} \right)^2},\\ u = \sum\limits_{i = 0}^{L - 1} {i{p_i}} = {P_0}{\mu _0} + {P_1}{\mu _1}. \end{array} (12)

    由式(12)可以看出μ0μ1差别越大, 类间方差越大.最佳阈值T*定义为

    {T^ * } = \arg \mathop {\max }\limits_{0 < k < L - 1} \left( {{\sigma ^{ * 2}}} \right), (13)

    T*使得类间方差最大化.

    相对于海洋区域, 陆地区域既包含自然场景, 也包含诸如城市、道路、港口等人造场景[2, 9], 这些场景在SAR图像中呈现出不同的形状和纹理.想要分析图像纹理信息可以从对数矩特征入手.

    通过对概率密度函数进行傅里叶变换, 建立第一特征函数和第二特征函数, 进而计算矩和累积量的变换并不适用于SAR图像特性, 且其特征函数的解析表达式有时可能难以表达[10].已知SAR图像中的相干斑噪声属于乘性噪声, 通常会采取对数变换将乘性噪声转为加性噪声, 因而应用对数累积量处理SAR图像中具有不同纹理特征的海洋和陆地的分割已成为一种主流思想.

    在信号处理中, 数据本质的固有特征允许我们用合适的分布模型对现实做出假设[10].已知随机变量x的特征函数定义为

    \begin{array}{l} {\mathit{\Phi }_x}\left( w \right) = F\left[ {f\left( x \right)} \right]\left( w \right)\\ \;\;\;\;\;\;\;\;\;\; = \int_{ - \infty }^{ + \infty } {f\left( x \right){{\rm{e}}^{{\rm{j}}wx}}{\rm{d}}x} = E\left\{ {{{\rm{e}}^{{\rm{j}}wx}}} \right\}. \end{array} (14)

    s=jw, 则随机变量x的矩函数定义为

    \begin{array}{l} \mathit{\Phi }\left( s \right) = \int_{ - \infty }^{ + \infty } {f\left( x \right){{\rm{e}}^{sx}}{\rm{d}}x} = E\left\{ {{{\rm{e}}^{sx}}} \right\},\\ \mathit{\Phi }\left( {{\rm{j}}w} \right) = {\mathit{\Phi }_x}\left( w \right). \end{array} (15)

    Φx(w)做对数变换, 可得x的第二类特征函数, 也就是对数特征函数:

    \mathit{\Psi }\left( w \right) = \lg {\mathit{\Phi }_x}\left( w \right) = \mathit{\Psi }\left( {{\rm{j}}w} \right). (16)

    通过对特征函数(14)进行求导得

    {\mathit{\Phi }^{\left( n \right)}}\left( s \right) = E\left\{ {{x^n}{{\rm{e}}^{sx}}} \right\}. (17)

    由式(17)可得Φ(n)(s)在原点的各阶导数, 即为随机变量的n阶矩定义

    {m_n} = {\mathit{\Phi }^{\left( n \right)}}\left( 0 \right) = E\left\{ {{x^n}} \right\}. (18)

    特别地, Φ(1)(0)=m1=η, Φ(2)(0)=m2=η2+σ2.

    由第二类特征函数的推导可得n阶累积量

    {\kappa _{x\left( r \right)}} = {\left. {{{\left( { - {\rm{j}}} \right)}^n}\frac{{{{\rm{d}}^r}{\mathit{\Psi }_x}\left( w \right)}}{{{\rm{d}}{w^r}}}} \right|_{w = 0}}. (19)

    针对多视极化SAR数据, 对数累积量求解过程如下.

    已知梅林变换

    \begin{array}{l} {\varphi _x}\left( s \right) = M\left[ {p\left( x \right)} \right]\left( s \right)\\ \;\;\;\;\;\;\;\;\; = \int_0^{ + \infty } {{x^{s - 1}}} p\left( x \right){\rm{d}}x,s = a + {\rm{j}}b. \end{array} (20)

    根据式(16), 可知对数域的第二类特征函数

    {\mathit{\Psi }_x}\left( s \right) = \lg \left( {{\varphi _x}\left( s \right)} \right). (21)

    根据式(17), 在对数域对式(20)进行求导, 有

    M\left[ {g\left( x \right){{\left( {\lg x} \right)}^v}} \right]\left( s \right) = \frac{{{{\rm{d}}^v}M\left[ {g\left( x \right)} \right]\left( s \right)}}{{{\rm{d}}{s^v}}}. (22)

    根据式(18), 可知随机变量的对数矩定义为

    \left\{ \begin{array}{l} {{\tilde m}_v} = \frac{{{{\rm{d}}^v}{\varphi _x}\left( s \right)}}{{{\rm{d}}{s^v}}}\left| {_{s = 1}} \right. = \int_0^{ + \infty } {{{\left( {\lg x} \right)}^v}p\left( x \right){\rm{d}}x} \\ {{\tilde m}_v} = \frac{1}{N}\sum\limits_{i = 1}^N {\left[ {\lg \left( {x_i^v} \right)} \right]} \end{array} \right.. (23)

    根据式(19)和式(21), 可知随机变量的n阶对数累积量定义为

    \begin{array}{l} {{\tilde \kappa }_{x\left( n \right)}} = {\left. {\frac{{{{\rm{d}}^n}{\mathit{\Psi }_x}\left( s \right)}}{{{\rm{d}}{s^n}}}} \right|_{s = 1}}\\ \;\;\;\;\;\;\; = {{\tilde m}_n} - \sum\limits_{i = 1}^{n - 1} {\left( {\begin{array}{*{20}{l}} {n - 1}\\ {i - 1} \end{array}} \right){{\tilde k}_i}{{\tilde m}_{r - i}}} . \end{array} (24)

    显而易见, 根据式(24), 前三阶对数累积量为

    \left\{ \begin{array}{l} {{\tilde \kappa }_1} = {{\tilde m}_1} = \frac{1}{N}\sum\limits_{i = 1}^N {\lg \left( {{x_i}} \right)} \\ {{\tilde \kappa }_2} = {{\tilde m}_2} - \tilde m_1^2 = \frac{1}{N}\sum\limits_{i = 1}^N {\lg \left( {x_i^2} \right)} - \frac{1}{N}\sum\limits_{i = 1}^N {{{\left( {\lg \left( {{x_i}} \right)} \right)}^2}} \\ {{\tilde \kappa }_3} = {{\tilde m}_3} - 3{{\tilde m}_1}{{\tilde m}_2} + 2\tilde m_1^3 = \frac{1}{N}\sum\limits_{i = 1}^N {\lg \left( {x_i^3} \right)} - \frac{3}{{{N^2}}}\sum\limits_{i = 1}^N {\lg \left( {{x_i}} \right)} \sum\limits_{i = 1}^N {\lg \left( {x_i^2} \right)} + \frac{2}{N}\sum\limits_{i = 1}^N {{{\left( {\lg \left( {x_i^3} \right)} \right)}^3}} \end{array} \right.. (25)

    图 1所示, 一般常用三阶对数累积量与二阶对数累积量的关系(\widetilde{\boldsymbol{\kappa}}_{2}, \widetilde{\boldsymbol{\kappa}}_{3})描述各种不同地物目标的纹理分布的特征信息[10], 图中不同区域(或曲线)分别代表不同的统计分布类型.

    图  1  (\widetilde{\boldsymbol{\kappa}}_{2}, \widetilde{\boldsymbol{\kappa}}_{3})图中的K分布与Gamma分布
    Fig.  1  K-and Gamma-distribution in a (\widetilde{\boldsymbol{\kappa}}_{2}, \widetilde{\boldsymbol{\kappa}}_{3})diagram

    当SAR图像有精确的经纬度信息时, 可借助250 m世界海陆数据库掩膜实现像素级分割[8].针对海陆掩膜绘制不精确或缺少精确经纬度信息的情况, 采取本文提出的基于极化信息的SAR图像精准海陆分割混合策略, 如图 2所示.

    图  2  GF-3 SAR精准海陆分割技术
    Fig.  2  Precise sea-land segmentation in GF-3 SAR images

    在进行精细分割前, 需要对全极化数据进行通道特征融合(如图 3), 函数表达如式(25)所示.通道一是总功率通道, 通道二是交叉极化通道, 通道三是同极化通道.

    图  3  全极化SAR图像的通道信息
    Fig.  3  The channel information of polarization SAR images
    \left\{ {\begin{array}{*{20}{l}} {{P_1} = \mathit{\Gamma }\left( {{\rm{HH}},{\rm{HV}},{\rm{VH}},{\rm{VV}}} \right)}\\ {{P_2} = \mathit{\Gamma }\left( {{\rm{HV}},{\rm{VH}}} \right)}\\ {{P_3} = \mathit{\Gamma }\left( {{\rm{HH}},{\rm{VV}}} \right)} \end{array}} \right.. (26)

    多极化SAR与单极化SAR相比, 多极化SAR通过测量每个分辨单元在不同收发极化组合下的散射特性, 更完整地记录了地物目标的后向散射特性, 因而含有更加丰富的地物信息, 且极化模式能很好地消减相干斑噪声带来的不利影响, 提高图像分割解译精度.除此之外, 海面易受风浪影响产生波纹, 极化特征对于消减海面强波纹干扰也有一定帮助.

    本文针对GF-3多极化SAR海陆分割问题, 提出了创新的混合策略方法, 可提高分割性能对于相干斑噪声、风浪、成像等因素的稳健性.全极化相较于单极化具有更多的通道信息, 针对不同的通道该算法采取不同的策略.

    图 3所示, 通道一总功率通道包含最丰富的、完整的地物目标后向散射特性, 适用于统计分析.根据1.1节, LGMM可以较好地拟合任意采样数据, 并通过迭代的方式求得混合统计模型的最大似然估计, 进而通过参数估计结果选择最佳的分布模型.

    假设用通道一的极化数据拟合两类高斯分布的混合, 通过不断迭代1.1节的推导过程, 找到一组最优的参数(μ*, σ*, π*), 使得这组参数表示的模型最有可能产生现有的采样数据.其参数(μ*, σ*, π*)分别代表各个高斯分布的均值、标准差和各个高斯分布所占的比重.当参数π*退化为某一类高斯分布的权重远远大于其他类高斯分布时, GMM就退化成了单高斯模型, 此时π*=0或1, 因而π*可用于确定海陆比R=f*).

    图 4所示, 第一行是实验数据GF-3 SAR图像, 从左到右依次是纯陆地图像、海陆图像、纯海洋图像; 第二行是对应的拟合模型分布, 蓝色直方图代表原始采样数据, 红色曲线代表拟合分布.

    图  4  LGMM拟合GF-3 SAR图像
    Fig.  4  The results of Logarithmic Gaussian Mixture Model fitting GF-3 SAR images

    R=0或1时, 说明该采样数据是纯海洋或纯陆地的情况, 这种情况下不需要进行分割, 因而混合模型可以提前判处这两种情况, 根据“3σ准则”, 可以提取全局异常值点群.已知采样数据分布在(μ0-3σ0, μ0+3σ0)区间范围内的概率为0.997 3, 设定阈值T0

    {T_0} = {\mu _0} + 3{\sigma _0}. (27)

    针对灰度值大于T0的采样数据, 纯海洋样本中有且仅留有具有二面角和三面角等特殊散射结构的船只区域, 数量有限且形状极其规则; 而纯陆地样本地表特征复杂, 保留的数据会呈现为杂乱像素点的集合, 因此二者极易区分开.

    当0 < R < 1时, 会呈现一个较为明显双峰分布, 此时可根据1.1节, 结合混合模型的参数, 对采样数据逐像素点判断属于不同高斯分布的后验概率, 以期望达到最大化的方式进行聚类, 生成通道一的初始掩膜BW1.

    实验表明, 针对GF-3 SAR数据, 当海陆比较少时, 大津法在处理单阈值的海陆分割性能良好[8]; 当海陆比较大时, 大津法会使得部分陆地区域被误分成海面, 局部一阶统计量效果更好[11].因而设置阈值T0=0.5.当0 < R < T0时, 在对数域和复数域分别实现类间方差最大化, 求取最佳分割阈值, 并进行二值化, 产生初始海陆掩膜BW2/BW3;当T0R < 1时, 在对数域和复数域分别根据局部一阶统计量, 利用线性插值生成阈值网格, 进而产生初始海陆掩膜BW2*/BW3*.

    为使不同通道的结果更好地融合, 得到更精准的、鲁棒性更高的海陆分割结果, 针对通道二, 采取不同海陆比不同计算方式, 将三个初始掩膜共同投入到投票机制中去, 将第三通道的对数累积量作为验证与再分割方式, 对投票机制进行监督与修正.

    然后经过形态学处理, 包括平滑轮廓、填充细小孔洞、连通域提取等, 认为面积大于普通船只十倍的连通域是水域.最终获得精细的、鲁棒性高的、适用范围广的海陆分割结果.

    极化数据中出现的异质性, 通常是由不同目标的混合形成.例如, 城市区域通常由不同的物体如房屋、树木和道路等组成, 形成不同的后向散射机制的混合; 森林区域由于树冠和树影的强烈散射, 形成明亮杂乱和黑暗杂乱的混合散射; 海洋区域由海浪、波纹和平静海面组成, 散射机制比较单一, 纹理波动相对较小.根据1.3节, 应用对数累积量分析极化SAR图像中, 陆地区域与海洋区域不同的纹理信息, 将该纹理信息作为预判依据, 对投票机制进行监督与修正.

    图 5是极化GF-3样本数据的海洋、陆地的纹理分布情况对比:海洋区域由海浪、波纹和平静海面等组成, 散射机制较单一, 纹理波动相对较小, 普遍集中在原点附近; 陆地区域由森林、城镇建筑、水田、高山等组成, 散射机制较复杂, 纹理波动相对较多, 普遍分布在中间区域.

    图  5  极化GF-3样本数据的海陆纹理分布情况
    Fig.  5  The distribution of sea and land in a polarization GF-3 SAR images

    我们不能保证单个模型分割效果都是最优, 使用混合模型的组合方式产生BW1、BW2、BW3, 针对BW1、BW2、BW3都相同的区域, 可以确定该区域确实被正确分割; 针对BW1、BW2、BW3不都相同的区域(误差区域), 我们采用耗时长的对数累积量模型分析其纹理信息, 将该区域重新划分为陆地或海洋, 增加分割准确性/鲁棒性, 提高整个系统的可靠性.已知梅林变换对样本协方差矩阵的分析具有重要的研究价值, 可用于确定适合的统计模型, 因而需要对样本数据进行梅林变换, 提取第二特征函数.对第二特征函数求n阶导数得n阶对数矩, 进而求得n阶对数累积量.通过对数二阶矩与对数三阶矩之间的联系判断该区域类型, 用作对投票机制产生的海陆掩膜进行修正, 增强海陆分割精确性.值得一提的是, 针对滑动窗窗口的尺寸, 需要设置的相对大一些, 至少得保证该窗口尺寸下可人为判断出该区域属于哪种类型.此时我们认为, 在该窗口下计算的对数累积量是可靠的.

    针对约200幅GF-3数据进行实验, 结果均达到理想效果, 结果表明, 本文海陆分割算法具有较为良好的实际应用性、鲁棒性和精准性.

    图 6, (a)是极化SAR图像, 海陆比分别为0.083 9、0.144 3、0.282 5、0.717 7、0.988 0; (b)是本文海陆分割算法实验结果图; (c)是海岸线提取图.

    图  6  极化GF-3 SAR实验数据的海陆分割结果
    Fig.  6  The results of sea-land segmentation in SAR images

    本文采取的图像分割效果指标为语义分割的标准度量[8]——平均交并比(mean intersection over union, MIoU), 定义为实验结果与真实结果的交集和并集的比MIoU, 或真正值PT与真正值PT、假负值NF、假正值PF之和的比值:

    {M_{{\rm{loU}}}} = \frac{{A \cap B}}{{A \cup B}} = \frac{{{P_{\rm{T}}}}}{{{P_{\rm{T}}} + {P_{\rm{F}}} + {N_{\rm{F}}}}}. (28)

    表 1所示, 针对GF-3极化数据、ALOS-2数据和TerraSAR数据进行实验, 经对比分析平均交并比可知, 本文海陆分割算法的准确度与稳定性均优于其他三种传统算法.

    表  1  不同分割算法实验结果对比
    Tab.  1  Comparison among experimental results of different segmentation algorithms
    图像数据 本文算法 大津法 聚类法 轮廓模型
    GF-3 99.94% 96.88% 97.30% 75.74%
    ALOS-2 96.68% 95.19% 92.41% 55.52%
    TerraSAR 98.03% 94.32% 94.32% 86.01%
    下载: 导出CSV 
    | 显示表格

    结果表明, 与几种常用的方法相比, 当地形图绘制不准确或缺少地理信息时, 本文提出的分割算法结果优良, 且针对狭窄弯曲的河流、孤立的小岛、轮廓模糊的沿岸、复杂地形等条件下, 海岸线提取效果仍然较为精确, 分割结果图中不存在孤立像素点, 图像连通性好, 海岸线提取精准且鲁棒性高.

    极化SAR图像分割对于探索目标散射特性、提高极化SAR系统的应用水平具有重要的理论意义和实用价值.相较于前人的研究, 本文所提算法充分考虑了海、陆分布的各种可能的组合形式, 且由于应用了全极化模式, 结合统计信息(1.1 LGMM)、灰度信息(1.2大津法)和纹理信息(1.3对数累积量), 有效调节特征模型与空间上下文模型之间关系, 利用投票机制提高分割性能, 使该算法较为适用于变化复杂的海陆分布情况.

    通过对星载GF-3卫星获取的多极化SAR图像进行实验, 与其他算法相比, 验证了该算法的有效性.实验表明, 该分割算法具有较为良好的通用性(在TerraSAR、Alos2等SAR图像上也取得了良好效果)、鲁棒性和精准性.本文的研究内容和成果对于极化SAR图像的分割和解译工作具有一定的意义和实际应用价值.

  • 图  1   (\widetilde{\boldsymbol{\kappa}}_{2}, \widetilde{\boldsymbol{\kappa}}_{3})图中的K分布与Gamma分布

    Fig.  1   K-and Gamma-distribution in a (\widetilde{\boldsymbol{\kappa}}_{2}, \widetilde{\boldsymbol{\kappa}}_{3})diagram

    图  2   GF-3 SAR精准海陆分割技术

    Fig.  2   Precise sea-land segmentation in GF-3 SAR images

    图  3   全极化SAR图像的通道信息

    Fig.  3   The channel information of polarization SAR images

    图  4   LGMM拟合GF-3 SAR图像

    Fig.  4   The results of Logarithmic Gaussian Mixture Model fitting GF-3 SAR images

    图  5   极化GF-3样本数据的海陆纹理分布情况

    Fig.  5   The distribution of sea and land in a polarization GF-3 SAR images

    图  6   极化GF-3 SAR实验数据的海陆分割结果

    Fig.  6   The results of sea-land segmentation in SAR images

    表  1   不同分割算法实验结果对比

    Tab.  1   Comparison among experimental results of different segmentation algorithms

    图像数据 本文算法 大津法 聚类法 轮廓模型
    GF-3 99.94% 96.88% 97.30% 75.74%
    ALOS-2 96.68% 95.19% 92.41% 55.52%
    TerraSAR 98.03% 94.32% 94.32% 86.01%
    下载: 导出CSV
  • [1]

    SHE X Q, QIU X L, LEI B. Accurate sea-land segmentation using ratio of average constrained graph cut for polarimetric synthetic aperture radar data[J]. Remote sensing, 2017, 11(2):026023. http://cn.bing.com/academic/profile?id=737b1005484f97b0ac45ec3d376577f7&encoded=0&v=paper_preview&mkt=zh-cn

    [2] 金添, 宋勇平.超宽带雷达建筑物结构稀疏成像[J].雷达学报, 2018, 7(3):275-284. http://d.old.wanfangdata.com.cn/Periodical/ldxb201803001

    JIN T, SONG Y P. Sparse imaging of building layouts in ultra-wideband radar[J]. Journal of radars, 2018, 7(3):275-284.(in Chinese) http://d.old.wanfangdata.com.cn/Periodical/ldxb201803001

    [3] 郭倩, 王海鹏, 徐丰.星载合成孔径雷达图像的飞机目标检测[J].上海航天, 2018, 35(6):57-64. http://d.old.wanfangdata.com.cn/Periodical/shht201806012

    GUO Q, WANG H P, XU F. Aircraft target detection from spaceborne synthetic aperture radar image[J]. Aerospace Shanghai, 2018, 35(6):57-64.(in Chinese) http://d.old.wanfangdata.com.cn/Periodical/shht201806012

    [4] 张毅飞, 吕科, 代双凤, 等.基于均值漂移的遥感图像海陆边界分割算法[J].光学技术, 2016, 42(1):39-45. http://d.old.wanfangdata.com.cn/Periodical/gxjs201601009

    ZHANG Y F, LYU K, DAI S F, et al. A sea-land segmentation algorithm for remote sensing images based on mean-shift[J]. Optical technique, 2016, 42(1), 39-45.(in Chinese) http://d.old.wanfangdata.com.cn/Periodical/gxjs201601009

    [5] 张苗辉, 郭拯危, 刘扬.基于混合模型的SAR影像海陆分割算法[J].光电子·激光, 2017, 28(3):326-333. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=gdzjg201703015

    ZHANG M H, GUO Z W, LIU Y. Sea-land segmentation algorithm for SAR images based on mixture models[J]. Journal of optoelectronics·laser, 2017, 28(3):326-333.(in Chinese) http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=gdzjg201703015

    [6] 黄瑞, 杜小勇, 胡卫东. OFDM雷达多目标运动参数的近似最大似然估计[J].雷达学报, 2018, 7(4):507-513. http://d.old.wanfangdata.com.cn/Periodical/ldxb201804011

    HUANG R, DU X Y, HU W D. Approximate maximum likelihood estimator of multi-target motion parameters for orthogonal frequency division multiplexing radar[J]. Journal of radars, 2018, 7(4):507-513.(in Chinese) http://d.old.wanfangdata.com.cn/Periodical/ldxb201804011

    [7] 岳佳, 王士同.高斯混合模型聚类中EM算法及初始化的研究[J].微计算机信息, 2006, 22(33):244-246. doi: 10.3969/j.issn.1008-0570.2006.33.086

    YUE J, WANG S T. EM algorithm and its initialization in Gaussian mixture model based clustering[J]. Microcomputer information, 2006, 22(33):244-246.(in Chinese) doi: 10.3969/j.issn.1008-0570.2006.33.086

    [8]

    HOU X Y, AO W, XU F. End-to-end automatic ship detection and recognition in high-resolution Gaofen-3 spaceborne SAR images[C]//IEEE International Geoscience and Remote Sensing Symposium, 2019.

    [9] 郑世超, 王辉, 孙志强, 等. Ka波段机载双模式干涉SAR系统设计及测量精度分析[J].上海航天, 2018, 35(6):1-7. http://d.old.wanfangdata.com.cn/Periodical/shht201806003

    ZHENG S C, WANG H, SUN Z Q, et al. Ka-band airborne dual-mode InSAR system and interferometric accuracy analysis[J]. Aerospace shanghai, 2018, 35(6):1-7.(in Chinese) http://d.old.wanfangdata.com.cn/Periodical/shht201806003

    [10]

    NICOLAS J M. Introduction to second kind statistics:application of log-moments and log-cumulants to the analysis of radar image distributions[J]. Traitement du signal, 2002, 19(3):139-167.

    [11]

    BRADLEY D, ROTH G. Adaptive thresholding using the integral image[J]. Journal of graphics tools, 2007, 12(2):13-21. http://d.old.wanfangdata.com.cn/OAPaper/oai_doaj-articles_4e9424608f9a6c24dfe0462d0e8e4e72

  • 期刊类型引用(2)

    1. 林锋,章瑞. 基于二值化条件随机场卷积网络的极化SAR海陆分割. 现代雷达. 2023(07): 15-20 . 百度学术
    2. 陈志新,聂娜. 高分三号数据在防城港海岛岸线监测的应用研究. 南方国土资源. 2020(08): 45-48+52 . 百度学术

    其他类型引用(3)

图(6)  /  表(1)
计量
  • 文章访问数:  445
  • HTML全文浏览量:  60
  • PDF下载量:  35
  • 被引次数: 5
出版历程
  • 收稿日期:  2019-04-27
  • 网络出版日期:  2020-12-30
  • 发布日期:  2019-12-29
  • 刊出日期:  2019-12-29

目录

/

返回文章
返回