基于随机森林的河流总磷预测模型及影响因素分析

成浩科, 沈菲. 基于随机森林的河流总磷预测模型及影响因素分析[J]. 环境保护科学, 2021, 47(3): 62-67, 117. doi: 10.16803/j.cnki.issn.1004-6216.2021.03.011
引用本文: 成浩科, 沈菲. 基于随机森林的河流总磷预测模型及影响因素分析[J]. 环境保护科学, 2021, 47(3): 62-67, 117. doi: 10.16803/j.cnki.issn.1004-6216.2021.03.011
CHENG Haoke, SHEN Fei. Prediction model and influencing factors of total phosphorus concentration in river based on random forest method[J]. Environmental Protection Science, 2021, 47(3): 62-67, 117. doi: 10.16803/j.cnki.issn.1004-6216.2021.03.011
Citation: CHENG Haoke, SHEN Fei. Prediction model and influencing factors of total phosphorus concentration in river based on random forest method[J]. Environmental Protection Science, 2021, 47(3): 62-67, 117. doi: 10.16803/j.cnki.issn.1004-6216.2021.03.011

基于随机森林的河流总磷预测模型及影响因素分析

    作者简介: 成浩科(1987-),男,博士、工程师。研究方向:环境泥沙、水力学及河流动力学。E-mail:313512229@qq.com
  • 基金项目:
    国家自然科学基金资助项目(51179055)
  • 中图分类号: X824

Prediction model and influencing factors of total phosphorus concentration in river based on random forest method

  • 摘要: 通过采集不同时间段淮河干流19个典型采样点的水样,获得水体中总磷浓度数据,针对河流总磷浓度时空分布差异大,受影响因素多和非线性的特点,基于随机森林算法,选择(气候特性、水动力、土壤类型和流域特性等)特征变量,构建模型对河流中总磷浓度进行预测,然后通过均方差增量参数对影响河流总磷浓度时空分布因素的重要性程度进行评估。研究结果表明,基于随机森林算法的模型可较好地模拟淮河水体中总磷浓度,模拟的一致性相关系数可达到0.83;对影响河流中总磷分布的因素进行评估发现,气候因素(降雨、温度)及水动力因素(流量)是最重要的因素;地表黏土含量对于水体中总磷的贡献要高于粉沙及沙粒的贡献;面源污染是淮河干流中总磷的主要来源,其中旱作农田的重要性系数高于灌溉农田。
  • 加载中
  • 图 1  现场试验采样点分布图

    图 2  随机森林法对水体中总磷的模拟结果

    图 3  各变量在随机森林模型中的重要性参数

    表 1  现场实验采样点及采样时间

    采样点t坐标
    2014-06-11~
    06-16
    2014-11-11~
    11-13
    2015-06.15~
    06-17
    2016-05-30~
    06-02
    2016-09-05~
    09-08
    正阳关-N32°29′,E116°31′
    沙颍河N32°30′,E116°30′
    鲁台子N32°33′,E116°37′
    凤台N32°41′,E116°43′
    孔集N32°41′,E116°49′
    淮南平圩N32°40′,E116°54′
    淮南上N32°40′,E116°57′
    淮南下N32°41′,E117°03′
    涡河口N32°58′,E117°12′
    蚌埠闸河段N32°57′,E117°15′
    吴家渡N32°57′,E117°22′
    高铁桥N32°58′,E117°25′
    沫河口N32°58′,E117°26′
    临淮关N32°55′,E117°37′
    安集N33°01′,E117°48′
    陈台子N33°02′,E117°52′
    小柳巷N33°10′,E118°09′
    盱眙大桥N33°02′,E118°29′
    老子山N33°11′,E118°37′
    采样点t坐标
    2014-06-11~
    06-16
    2014-11-11~
    11-13
    2015-06.15~
    06-17
    2016-05-30~
    06-02
    2016-09-05~
    09-08
    正阳关-N32°29′,E116°31′
    沙颍河N32°30′,E116°30′
    鲁台子N32°33′,E116°37′
    凤台N32°41′,E116°43′
    孔集N32°41′,E116°49′
    淮南平圩N32°40′,E116°54′
    淮南上N32°40′,E116°57′
    淮南下N32°41′,E117°03′
    涡河口N32°58′,E117°12′
    蚌埠闸河段N32°57′,E117°15′
    吴家渡N32°57′,E117°22′
    高铁桥N32°58′,E117°25′
    沫河口N32°58′,E117°26′
    临淮关N32°55′,E117°37′
    安集N33°01′,E117°48′
    陈台子N33°02′,E117°52′
    小柳巷N33°10′,E118°09′
    盱眙大桥N33°02′,E118°29′
    老子山N33°11′,E118°37′
    下载: 导出CSV

    表 2  随机森林模型中所用的子流域特征变量

    变量变量名称结论图中简称描述类型单位来源
    气候降雨Rain各采样点对应流域的平均降雨空间-时间mm中国气象数据网
    温度Tem各采样点对应流域的平均气温空间-时间°C中国气象数据网
    流域流域面积Area各采样点对应的子流域空间m2SRTM 数据
    流量Flow各采样点采样时刻的河流流量空间-时间m3·s−1淮河水利委员会
    土地类型灌溉农田Lu1灌溉农田所占流域比例空间%欧洲空间局
    旱作农田Lu2旱作农田所占流域比例空间%欧洲空间局
    城市Lu3城市面积所占流域比例空间%欧洲空间局
    土壤地表黏粒含量Clay0流域地表黏粒所占土壤比例(0 cm)空间%国际土壤信息
    地表粉沙含量Silt0流域地表粉沙所占土壤比例(0 cm)空间%国际土壤信息
    地表沙粒含量Sand0流域地表沙粒所占土壤比例(0 cm)空间%国际土壤信息
    表层黏粒含量Clay5流域表层黏粒所占土壤比例(0~5 cm)空间%国际土壤信息
    表层粉沙含量Silt5流域地表粉沙所占土壤比例(0~5 cm)空间%国际土壤信息
    表层沙粒含量Sand5流域地表沙粒所占土壤比例(0~5 cm)空间%国际土壤信息
    其他季节Season一个代表四季的因子时间取样时季节
    基流/非基流Baseflow表示取样时河流所处的水量状态时间取样时水量状态
    变量变量名称结论图中简称描述类型单位来源
    气候降雨Rain各采样点对应流域的平均降雨空间-时间mm中国气象数据网
    温度Tem各采样点对应流域的平均气温空间-时间°C中国气象数据网
    流域流域面积Area各采样点对应的子流域空间m2SRTM 数据
    流量Flow各采样点采样时刻的河流流量空间-时间m3·s−1淮河水利委员会
    土地类型灌溉农田Lu1灌溉农田所占流域比例空间%欧洲空间局
    旱作农田Lu2旱作农田所占流域比例空间%欧洲空间局
    城市Lu3城市面积所占流域比例空间%欧洲空间局
    土壤地表黏粒含量Clay0流域地表黏粒所占土壤比例(0 cm)空间%国际土壤信息
    地表粉沙含量Silt0流域地表粉沙所占土壤比例(0 cm)空间%国际土壤信息
    地表沙粒含量Sand0流域地表沙粒所占土壤比例(0 cm)空间%国际土壤信息
    表层黏粒含量Clay5流域表层黏粒所占土壤比例(0~5 cm)空间%国际土壤信息
    表层粉沙含量Silt5流域地表粉沙所占土壤比例(0~5 cm)空间%国际土壤信息
    表层沙粒含量Sand5流域地表沙粒所占土壤比例(0~5 cm)空间%国际土壤信息
    其他季节Season一个代表四季的因子时间取样时季节
    基流/非基流Baseflow表示取样时河流所处的水量状态时间取样时水量状态
    下载: 导出CSV

    表 3  随机森林模型的一致性相关系数参数

    ESTUPPERLOWER
    LCCC0.830.880.77
    ESTUPPERLOWER
    LCCC0.830.880.77
    下载: 导出CSV

    表 4  变量重要性参数:均方差增量

    变量IncMSE/%
    降雨8.91
    dr508.78
    dr708.61
    dr908.82
    dr959.18
    dr9910.23
    dr99912.20
    温度7.92
    dt508.41
    dt707.42
    dt907.25
    dt959.82
    dt9910.06
    dt9997.85
    流量5.98
    df505.95
    df706.32
    df905.27
    df956.36
    df996.35
    df9993.91
    黏土(0 cm)2.60
    粉沙(0 cm)2.73
    沙粒(0 cm)3.55
    黏土(0~5 cm)4.40
    粉沙(0~5 cm)3.60
    沙粒(0~5 cm)−0.06
    季节3.41
    基流/非基流3.08
    灌溉农田0.16
    旱作农田1.00
    城市−1.90
      注:df50, 70, 90, 95, 99, 999:折算系数为0.5、0.7、0.9、0.95、0.99和0.999的流量;dr50, 70, 90, 95, 99, 999:折算系数为0.5、0.7、0.9、0.95、0.99和0.999的流域平均降雨;dt50, 70, 90, 95, 99, 999:折算系数为0.5、0.7、0.9、0.95、0.99和0.999的流域平均温度。
    变量IncMSE/%
    降雨8.91
    dr508.78
    dr708.61
    dr908.82
    dr959.18
    dr9910.23
    dr99912.20
    温度7.92
    dt508.41
    dt707.42
    dt907.25
    dt959.82
    dt9910.06
    dt9997.85
    流量5.98
    df505.95
    df706.32
    df905.27
    df956.36
    df996.35
    df9993.91
    黏土(0 cm)2.60
    粉沙(0 cm)2.73
    沙粒(0 cm)3.55
    黏土(0~5 cm)4.40
    粉沙(0~5 cm)3.60
    沙粒(0~5 cm)−0.06
    季节3.41
    基流/非基流3.08
    灌溉农田0.16
    旱作农田1.00
    城市−1.90
      注:df50, 70, 90, 95, 99, 999:折算系数为0.5、0.7、0.9、0.95、0.99和0.999的流量;dr50, 70, 90, 95, 99, 999:折算系数为0.5、0.7、0.9、0.95、0.99和0.999的流域平均降雨;dt50, 70, 90, 95, 99, 999:折算系数为0.5、0.7、0.9、0.95、0.99和0.999的流域平均温度。
    下载: 导出CSV
  • [1] 王文涛, 曹西华, 袁涌铨, 等. 2012年长江口及其邻近海域营养盐分布的季节变化及影响因素[J]. 海洋与湖沼, 2016, 47(4): 804 − 812. doi: 10.11693/hyhz20160100017
    [2] ZHANG W, JIN X, ZHU X, et al. Phosphorus characteristics, distribution, and relationship with environmental factors in surface sediments of river systems in Eastern China.[J]. Environmental Science & Pollution Research, 2016, 23(19): 1 − 10.
    [3] BARTLEY R, SPEIRS W J, ELLIS T W, et al. A review of sediment and nutrient concentration data from Australia for use in catchment water quality models[J]. Marine Pollution Bulletin, 2012, 65(4): 101 − 116.
    [4] 孙佳颖, 徐卫东. 河流水质预测模型研究进展[J]. 山西建筑, 2010, 36(36): 360 − 361. doi: 10.3969/j.issn.1009-6825.2010.36.229
    [5] SONG G H, ZHANG Y H. Research progress and development trend of water quality models[J]. Equipment Environmental Engineering, 2008, 5(2): 32 − 36.
    [6] 王开章, 刘福胜, 孙鸣. 灰色模型在大武水源地水质预测中的应用[J]. 山东农业大学学报(自然科学版), 2002, 33(1): 66 − 71.
    [7] 宫殿林, 洪曦, 曾冠军, 等. 亚热带典型农业流域河流水质多元线性回归预测[J]. 生态与农村环境学报, 2017, 33(6): 509 − 518. doi: 10.11934/j.issn.1673-4831.2017.06.004
    [8] SELLE B, SCHWIENTEK M, LISCHEID G. Understanding processes governing water quality in catchments using principal component scores[J]. Journal of Hydrology, 2013, 486: 31 − 38.
    [9] SIMEONOV V, STRATIS J A, SAMARA C, et al. Assessment of the surface water quality in Northern Greece[J]. Water Research, 2003, 37(17): 4119 − 4124.
    [10] 张庆庆, 许月萍, 牛少凤, 等. GAM在水质预测中的应用[C]//中国自然资源学会. 水与区域可持续发展——第九届中国水论坛论文集, 兰州, 2011: 258-262.
    [11] YAN B, FANG N F, ZHANG P C, et al. Impacts of land use change on watershed streamflow and sediment yield: An assessment using hydrologic modelling and partial least squares regression[J]. Journal of Hydrology, 2013, 484: 26 − 37.
    [12] 朱广利, 秦玉芳. 基于混沌理论的水质预测方法研究[J]. 湖北农业科学, 2012, 51(17): 3726 − 3729. doi: 10.3969/j.issn.0439-8114.2012.17.019
    [13] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5 − 32.
    [14] TRENDOWICZ A, JEFFERY R. Classification and regression trees[J]. International Journal of Public Health, 2014, 57(1): 243 − 246.
    [15] 穆亚南, 丁丽霞, 李楠, 等. 基于面向对象和随机森林模型的杭州湾滨海湿地植被信息提取[J]. 浙江农林大学学报, 2018, 35(6): 105 − 114.
    [16] 刘家福, 李林峰, 任春颖, 等. 基于特征优选的随机森林模型的黄河口滨海湿地信息提取研究[J]. 湿地科学, 2018, 16(2): 97 − 105.
    [17] 魏复盛. 水和废水监测分析方法[M]. 北京: 中国环境科学出版社, 2002: 596.
    [18] BREIMAN L, FRIEDMAN J, STONE C J, et al. Classification and regression trees[M]. CRC press, 1984.
    [19] Rhodes A L, Newton R M, Pufall A. Influences of land use on water quality of a diverse New England watershed[J]. Environmental Science & Technology, 2001, 35(18): 3640 − 3645.
    [20] THOMAS R B, LEWIS J. An evaluation of flow-stratified sampling for estimating suspended sediment loads[J]. Journal of Hydrology, 1995, 170(1-4): 27 − 45.
    [21] FURNAS M M. Catchments and corals: terrestrial runoff to the Great Barrier Reef[M]. Australian Institute of Marine Science & CRC Reef Research Centre, 2003.
    [22] WANG Y, KUHNERT P, HENDERSON B. Load estimation with uncertainties from opportunistic sampling data–a semiparametric approach[J]. Journal of Hydrology, 2011, 396(1): 148 − 157.
    [23] LAWRENCE I, LIN K. A concordance correlation coefficient to evaluate reproducibility[J]. Biometrics, 1989, 45: 255 − 268.
    [24] 邱二生. 黑河水库水质及藻类监测和水体分层研究[D]. 西安: 西安建筑科技大学, 2010.
    [25] WITHERS P J, JARVIE H P. Delivery and cycling of phosphorus in rivers: a review.[J]. Science of the Total Environment, 2008, 400(1): 379 − 395.
    [26] 陈野, 李青云, 曹慧群. 河流泥沙吸附磷的研究现状与展望[J]. 长江科学院院报, 2014, 31(5): 12 − 16. doi: 10.3969/j.issn.1001-5485.2014.05.003
    [27] JIN X, WANG S, PANG Y, et al. The adsorption of phosphate on different trophic lake sediments[J]. Colloids & Surfaces A Physicochemical & Engineering Aspects, 2005, 254(1): 241 − 248.
    [28] XIAO Y, CHENG H K, YU W W, et al. Effects of water flow on the uptake of phosphorus by sediments: An experime- ntal investigation[J]. Journal of Hydrodynamics Ser B, 2016.
    [29] 肖洋, 陆奇, 成浩科, 等. 泥沙表面特性及其对磷吸附的影响[J]. 泥沙研究, 2011(6): 64 − 68.
    [30] 徐楠, 印红伟, 陈志刚, 等. 农业磷面源污染形成机制及治理进展[J]. 苏州科技学院学报(工程技术版), 2012, 25(1): 18 − 22.
    [31] 冯爱萍, 黄莉, 徐逸, 等. 基于DPeRS模型的淮河流域氮磷面源污染评估[J]. 环境监控与预警, 2019(5): 66 − 71.
    [32] 高超, 张桃林. 不同利用方式下农田土壤对磷的吸持与解吸特征[J]. 环境科学, 2001, 22(4): 67 − 71. doi: 10.3321/j.issn:0250-3301.2001.04.015
    [33] ROMAN D C, VOGEL R M, SCHWARZ G E. Regional regression models of watershed suspended-sediment discharge for the eastern United States[J]. Journal of Hydrology, 2012, 472-473(4): 53 − 62.
  • 加载中
图( 3) 表( 4)
计量
  • 文章访问数:  2929
  • HTML全文浏览数:  2929
  • PDF下载数:  33
  • 施引文献:  0
出版历程
  • 收稿日期:  2020-08-03
  • 刊出日期:  2021-06-20

基于随机森林的河流总磷预测模型及影响因素分析

    作者简介: 成浩科(1987-),男,博士、工程师。研究方向:环境泥沙、水力学及河流动力学。E-mail:313512229@qq.com
  • 1. 长江生态环保集团有限公司,湖北 武汉 430062
  • 2. 河海大学水利水电工程学院,江苏 南京 210098
基金项目:
国家自然科学基金资助项目(51179055)

摘要: 通过采集不同时间段淮河干流19个典型采样点的水样,获得水体中总磷浓度数据,针对河流总磷浓度时空分布差异大,受影响因素多和非线性的特点,基于随机森林算法,选择(气候特性、水动力、土壤类型和流域特性等)特征变量,构建模型对河流中总磷浓度进行预测,然后通过均方差增量参数对影响河流总磷浓度时空分布因素的重要性程度进行评估。研究结果表明,基于随机森林算法的模型可较好地模拟淮河水体中总磷浓度,模拟的一致性相关系数可达到0.83;对影响河流中总磷分布的因素进行评估发现,气候因素(降雨、温度)及水动力因素(流量)是最重要的因素;地表黏土含量对于水体中总磷的贡献要高于粉沙及沙粒的贡献;面源污染是淮河干流中总磷的主要来源,其中旱作农田的重要性系数高于灌溉农田。

English Abstract

  • 磷是河流中重要的营养素之一,其在河流中的分布存在显著的时空差异[1-2]。掌握磷在水体中的时空分布对于保护流域水环境安全,管理流域水系统十分重要。但是水质采样对于人力、财力的要求很高,对于大面积的流域及众多的污染参数(总磷、氨氮、重金属、有机质等),很难实现对污染参数在所有采样点的连续取样监测[3]。绝大多数的监测是对河流流量的连续监测以及对于水环境特性的间断性取样监测。这就需要建立一个可靠的、准确的依赖于河流流量及水环境特性等易检测指标的水质预测模型,对河流中污染物的时空分布特性进行模拟和预测。

    水质预测历来受到国内外学者的广泛关注,前人开发了大量的模型对河流水质进行模拟,按照模型理论基础的不同可分为水质模拟模型预测法、混沌理论预测法、数理统计预测法、灰色系统理论预测法和神经网络模型预测法等[4-6],每种模型都有各自的适用工况和优缺点。其中数理统计模型已被证明在对水质进行预测时可获得较好的模拟效果。宫殿林等[7]通过多元线性回归模型建立了氮磷浓度与土地利用类型(农田、居民地和茶园)、景观格局制度(斑块密度、蔓延度和景观分割度)等变量之间相关关系;主成分分析[8]可以克服传统方法确定权数的随意性,有效消除指标间的相关性,对影响水质的主导因素进行识别;聚类分析[9]通过对水质指标进行聚类,并对聚类结果进行回归检验,以降低水质指标维数,从而获得各指标之间的内在联系,实现水质评估和预测的目的;为了克服解释变量过多造成的模型精度降低问题。张庆庆等[10]将广义加性模型应用于河道断面水质的预测,利用另一断面的流量、氨氮浓度和总氮等6种参数对该断面的氨氮浓度进行预测;偏最小二乘回归方法能够利用样本现有信息,并有效解决变量之间的多重相关问题。YAN et al[11]利用该方法建立了高锰酸盐指数与水体中pH、DO和氨氮等参数之前的相关关系;朱广利等[12]基于混沌理论对洛河流域的溶解氧浓度进行预测,预测误差可达到15%以下。然而,污染物在河流中的时空分布具有很强的随机性和复杂性,与水质影响因素(包括降雨、气温、水动力、人类活动和土地利用等)之间存在着强非线性关系,这使得传统数理统计模型的应用受到一定限制。随机森林模型[13]是一种新的机器学习模型,该模型的基础是决策树算法[14],通过构建了对象属性和对象值之间的映射关系,利用已知的数据构建预测准则,进而根据变量值对一个变量进行预测。该模型在非线性模拟方面具有较好的表现,且在生态、地理、医学和气候等领域已得到广泛应用[15-16]

    为了准确预测淮河中总磷的浓度并对其影响因素进行分析,掌握磷在水体中的时空分布规律。本文采集淮河干流正阳关至老子山段典型断面上覆水,对总磷浓度进行分析,利用随机森林算法建立基于气候特性、水动力、土壤类型和流域特性等参数的预测模型,并对各参数对河流中总磷浓度的影响程度进行评估。

  • 水样采集自淮河干流正阳关至老子山段19个采样点。根据水动力特性、污水排放位置及现场实际情况选择合适的断面。淮河的主汛期为每年的6~9月,受每年降雨等因素的影响日期会有不同程度提前或者推后,本次共取样了7次,3次为汛前采样,2次为汛中采样,2次为汛后采样。水样采集时选择河道左中右3个断面,选择河床上1 m左右采样,每个断面采集3个样品,混合后进行保存。取样点的具体位置见图1表1。水样中总磷的测量使用钼锑抗分光光度法[17]进行。

  • 随机森林(random forest)Breiman基于决策树算法[18]开发的新的算法,通过随机选取多组训练样本,集合各子决策树的预测结果使得它对异常值和噪声具有很高的容忍度,能缓解决策树算法中出现的过拟合问题[13]

    算法流程。

    (1)采用有放回的无权重抽样法(bagging)随机生成训练集,样本容量与原始数据相等,每次未被抽中的数据组成袋外数据(out of bag)。

    (2)对随机抽取的训练集分别建立决策树,构建决策树的关键是特征变量的选取,即在决策树中参与节点分裂的属性。本文的研究中,影响水体总磷时空分布的特征变量主要考虑了气候,包括降雨和温度;水动力(河流流量);土地利用类型与土壤类型[19];季节等因素。具体的解释变量含义及来源见表2

    (3)将测试数据输入随机森林模型,评估随机森林模型对样本数据的模拟精度。如精度满足要求,即可使用该模型对水样中总磷的浓度进行预测。

    值得注意的是,在以前的研究中研究者多使用实时流量来对污染物浓度数据进行分析。THOMAS et ai[20]发现,河流中水流的涨落过程也会影响河流中污染物的浓度,也就是说流量相同时,水体污染物浓度在流量逐渐增大的过程与流量逐渐减小的过程中存在较大差异。因此在对河流中污染物浓度进行预测时,不仅要考虑流量的差异,也要考虑流量变化的差异。

    首次冲刷(first flush)[21]是这样一种现象:非汛期结束后,流域内在汛前的第一次大的产流中,河流水体内通常含有相当高浓度的泥沙及污染物浓度。当汛期来临时,即使流域内的径流及降雨程度都要高于首次冲刷时的程度,由于流域内的污染物的总量是一定的,此时河流水体携带的污染物浓度也不一定比首次冲刷时高,且越到汛期后期河流中的污染物浓度也越低,这一现象在我们的现场实验中也被证实。因此,在模拟河流中污染物浓度时,要考虑水流涨落过程对于污染物浓度的影响,以提高模型的精度。基于这种现象,WANG et al[22]提出了一种考虑先前水流影响的流量计算方法,即折现流量(discounted flow),见式(1)。

    式(1)中,d为折现系数,可取为0~1之间,越接近0表明先前的水流对当前的水流影响越小,越接近1说明先前水流对当前水流的贡献越大,本文中考虑了折现系数分别为0.5、0.7、0.9、0.95、0.99和0.999的情况,当d=0.5时,DF(d)≈qj,当d=0.999时,DF(d)可近似为多日平均流量。对气候因素,包括降雨及温度也采用相同的方法进行考虑,计算折算降雨及折算温度。本文中流域降雨、温度、土地利用和土壤类型的分析使用Arcgis,随机森林模型的构建使用R语言。

  • 随机森林模型对水体中总磷的模拟结果,见图2

    坐标点越靠近直线,表明预测值与实际值越接近。Lin的一致性相关系数(Lin's Concordance Correlation Coefficient,LCCC)[23],置信水平为95%),估算系数为0.83,见表3

    表3可知,针对影响因素多,非线性关系复杂的情况,随机森林模型依然可以较好地模拟河流上覆水中总磷的浓度。

  • 随机森林模型的一个很明显的优势就是可以评估每个变量对于模拟结果的重要性。这一关系主要通过参数均方差的增量(increased mean square error,incmse)来表示,数值越大表明该变量对于模型结果的影响越大。影响河流中总磷浓度分布的各变量重要性系数,见图3表4

    图3表4可知,降雨、温度及流量是影响水体中总磷浓度最重要的3个因素。其中折算系数0.999的降雨对总磷浓度的影响最大,incmse的值为12.2%,不同折算系数的流域平均温度的重要性系数为7.25%~10.06%,这表明降雨及温度的不均匀分布对上覆水中总磷的空间分布差异影响十分显著。

    (1)降雨。图3可以看到,当选择较大的折算系数时,降雨及温度对总磷浓度的影响也较大,这表明前期的降雨和温度对当前上覆水中总磷的含量有较大影响。降雨对水体总磷浓度分布的影响主要体现在2个方面:一方面,降雨会直接影响河流的水动力过程,进而影响磷在河流中的空间分布,另一方面,降雨可通过冲刷和淋溶作用将流域内的磷运输至河流[24],这是河流中总磷的主要来源之一,流域内不均匀的降雨特性会导致水体总磷浓度的不均匀分布。

    (2)温度。温度对河流中总磷的影响体现在:一是温度是衡量水量蒸发的指标,蒸发会造成河流中水量的减少,从而使得污染物浓度升高;二是温度会影响河流中微生物、生物的活性,进而影响磷在河流系统中的循环[25],此外温度还会直接影响泥沙对磷的吸附/解吸过程,改变磷在水体-泥沙中的分配特性,造成上覆水中磷浓度的变化[26-27]

    (3)流量。河流水动力是磷在水体中迁移转化的动力之源,流量对磷在河道中分布的影响主要体现在2个方面,一是溶解态磷随着上覆水的运动而运动,另一方面,水动力的变化也会改变磷水-沙界面的赋存形式[28],从而对河流中磷的空间分布产生影响。

    (4)地理特性。包括土地利用及土壤分类对于总磷浓度的影响要小于以上三个因素,但也有一些值得注意的结论。参数重要性最大的变量为地表0~5 cm的黏土含量,为4.4%,表明地表黏土的含量对于覆水中总磷浓度的贡献要高于粉砂和沙粒,这是由于黏土的比表面积高于粉沙和沙粒,因此黏土表面的磷含量高于粉沙和沙粒[29],随着降雨将黏土冲刷至河流中,黏土表面的磷通过解吸作用释放进入河流。地表0~5 cm沙粒的参数重要性系数为负值,表明沙粒这一参数的存在反而使得模型的准确性下降,这是由于沙粒的比表面积小,携带的总磷对系统几乎没有影响,因此在后续预测总磷浓度的过程中可以将沙粒这一参数删除。

    (5)土地类型。在土地利用参数中:旱作农田的incmse值为1%,灌溉农田incmse值为0.16%,城市incmse值为−1.9%。在流域尺度上来说,农田可视为面源污染的主要来源[30],城市污染可视为点源污染,这表明面源污染对淮河干流中总磷浓度的影响要高于点源污染,这与冯爱萍等[31]对淮河流域氮磷面源污染评估中的研究结果一致,作者通过对淮河流域氮磷面源污染空间特征进行遥感像元尺度分析发现农田径流型的氮磷污染占淮河流域总污染量90%以上。旱作农田的影响高于灌溉农田,出现这种结果的原因有两个,一是因为土壤在旱作时固磷能力较低[32],由降雨冲刷进入河流的旱作农田土壤中的磷更容易发生释放进入水体;二是土壤的类型对水存储量、渗流速率、土壤中水的蒸发和植物根系吸收都会产生重要的影响[33],进而影响磷在整个流域系统中的分布。城市污染的incmse值为负值意味着在去除该参数之后,模型模拟河流总磷的精度反而提高,出现这种情况的原因可能是因为:淮河流域氮磷的主要来源为农田径流型的氮磷污染,从流域尺度来看,城市这一参数的加入对该模型的模拟反而产生了干扰。本文采用城市这一参数代表点源因素仍存在一定的问题,但是针对每个子流域的点源资料的收集和统计的难度较大,后期笔者将对该部分进行进一步的研究,以期更精确的评估点源因素对河流中总磷浓度的影响。

  • 本文通过随机森林算法对采集的淮河干流正阳关至老子山段的河流总磷进行分析,建立了总磷浓度与气候特性、水动力、土壤类型和流域特性等参数的相关关系,并对各参数对总磷浓度的影响程度进行评估。

    (1)基于随机森林的河流总磷预测模型对河流中总磷浓度模拟的一致性相关系数可达到0.83。

    (2)通过该模型对影响河流中总磷浓度的因素进行评估,发现气候(降雨和温度)及水动力(流量)是影响河流中总磷浓度时空分布差异最重要的因素。

    (3)研究表明面源污染是淮河干流中总磷的主要来源,其中旱作农田对总磷浓度的影响高于灌溉农田。

    (4)土壤类型中,地表黏土含量对于水体中总磷的贡献要高于粉沙及沙粒的贡献。。

参考文献 (33)

目录

/

返回文章
返回