本发明涉及数据处理与分析,具体涉及一种基于双重差分法的气候变化对渔业产量影响评估方法。
背景技术:
1、近年来,由于人口增长、工业活动增加等导致的全球气候变化受到广泛关注,其中,全球变暖已导致全球平均海洋表面温度持续升高,可能对渔业经济部门造成冲击。由于全球海洋表面温度变化较为缓慢、难以统一观测到显著变化,不易单独考察海洋变暖对渔业的具体净影响程度及方向;且由于存在多种过程相互作用的非线性影响,定量研究渔业生产和气候指数的相关性问题往往失败,受限于线性或非线性的强假设。气候变化与经济影响的研究中,常用的多元线性回归模型,其拟合能力受到线性假设的限制,不适用于因变量与自变量之间的关系是非线性的复杂情况;非线性回归虽可以处理变量之间的复杂关系,但模型设计需要考虑可能对结果变量产生影响的各种变量及影响机制,拟合结果可能受不同参数初始估计值的影响,模型较为复杂、存在过度拟合风险,且结果解释及模型检验难度较大。
技术实现思路
1、本发明的目的在于提供一种基于双重差分法的气候变化对渔业产量影响评估方法,该方法操作简单,灵活易用,克服了其他潜在线性或非线性因素对结果变量的干扰问题,为气候变化对海洋渔业影响的归因研究带来便利。
2、为实现上述目的,本发明采用以下技术方案:
3、一种基于双重差分法的气候变化对渔业产量影响评估方法,包括以下步骤:
4、s1、选择样本并进行数据提取与数据预处理;
5、s2、确定分组与冲击时间点,构建双重差分模型的双虚拟变量;
6、s3、应用双重差分模型,检验海洋异常变暖事件对海水养殖产量的影响;
7、步骤s3的具体过程为:采用双重差分法控制个体固定效应与时间固定效应;其中,控制变量为各国经济社会发展水平,各国经济社会发展水平包括人均国内生产总值、总人口和第一产业增加值占比;被解释变量为各国海水养殖渔业年产量;解释变量为海洋表面温度是否出现异常升高,以非连续型的双虚拟变量进行考察:
8、引入分组虚拟变量 treat,检验发生海表温度异常升高与未发生海表温度异常升高区域之间海水养殖产量的差异,样本国家开展海水养殖活动所在的专属经济区位于热带太平洋中、东部海域则赋值1,反之赋值0;
9、引入时间虚拟变量 post,检验海表温度异常升高前后实验组与对照组产量的变化,高强度厄尔尼诺事件发生当年及之后年份赋值1,其余年份赋值0;
10、所述双重差分模型的回归方程为: y it = α ( post it × treat it) + x it + μ i + λ t+ ε it其中, i表示每一个样本国家, t表示年份; y it表示被解释变量; x it表示随时间和个体而变化的控制变量; μ i表示个体固定效应; λ t表示时间固定效应; ε it为随机误差项;交互项 post it × treat it表示海表温度异常升高处理变量,实验组内国家在海表温度异常增高前处理变量取值0,实验组国家海表温度异常增高及以后的年份处理变量取值1,对照组处理变量始终为0; α是系数,用于表示实验组海表温度异常增高对其海水养殖渔业产量的处理效应,若经检验 α的显著性水平p值小于0.05,即通过t检验,则表明海表温度异常增高对海水养殖渔业产量具有显著影响,系数 α的正负表示影响的具体方向;
11、s4、进行平行趋势假设检验;
12、s5、采用扩大实验组范围与虚构实验组的方式,进行稳健性检验;
13、s6、检验海洋表面温度对影响效果的调节效应;
14、s7、针对关键影响因素,使用分组回归方式进行异质性分析。
15、优选地,步骤s1中所述样本包括全球开展海洋渔业活动的国家或地区;所述数据包括全球海洋表面温度异常变暖情况、全球沿海国家海水养殖渔业产量情况、全球沿海国家社会经济相关数据和各国边界、领海、毗连区及专属经济区矢量数据;所述全球沿海国家社会经济相关数据包括全球沿海国家的人均国内生产总值、成人人均国民收入、第一产业增加值占比、总人口和劳动力总数。
16、优选地,步骤s1中所述数据提取包括以下步骤:
17、s11、对不同变量进行数据提取:数据提取包括地理信息数据提取、海洋表面温度数据提取和海水养殖产量数据提取;其中,地理信息以各国专属经济区边界作为其可能开展海水养殖渔业活动的最大区域,利用arcgis软件提取其边界范围的经纬度地理坐标;海洋表面温度数据采集自美国国家海洋和大气管理局数据产品,取海表温度的年均值,根据提取的各国可能开展海水养殖渔业活动的海域边界经纬度地理坐标,提取各国专属经济区范围内海表温度的平均值以反映各国所在海域海表温度情况;海水养殖数据采集自联合国粮农组织渔业及水产养殖司统计数据,剔除各国产量数据中标记为来自内陆水域的数据,合并不同物种的产量;
18、s12、统一所有数据的时间尺度和空间尺度:其中,时间尺度以年为单位进行统计,空间尺度以国家为单位进行统计。
19、优选地,步骤s1中所述数据预处理包括筛选并保留样本国家数据、剔除缺失数据、不同变量对象匹配、数据格式转换和对连续型变量对数化处理,形成包含多元变量的长型数据格式的面板数据。
20、优选地,步骤s2中所述确定分组与冲击时间点的具体过程为:借助影响海洋表面温度的外生性事件厄尔尼诺来确定,依据厄尔尼诺事件发生时会引起热带太平洋中、东部海洋表面温度的正异常,参考中国国家气候中心以nino综合区的海温距平指数异常偏高作为厄尔尼诺事件发生的表征,选择经度为160°e-180°-80°w、纬度为23.5°n-23.5°s的热带中、东太平洋地区的国家为实验组,其余国家为对照组;选择高强度厄尔尼诺事件发生年份为海洋异常变暖的冲击时点,距离前后两次低强度厄尔尼诺事件有一定时间间隔的年段作为研究时间区间,用于构建双重差分模型的双虚拟变量,以研究海温变化对海水养殖渔业的影响。
21、优选地,步骤s4中所述平行趋势假设检验的方程为:其中, d it表示海表温度当期异常升高的虚拟变量,若国家 i所在海域在第 t年海表温度异常升高,则取值1,反之取0;其余各变量含义与双重差分模型的回归方程中的相同;是系数,用于表示实验组国家海表温度异常升高的第 t年中实验组与对照组的海水养殖渔业年产量变化的差异。
22、优选地,步骤s5所述稳健性检验包括以下步骤:
23、s51、扩大实验组选取范围,进行双重差分模型回归,检验交互项回归系数 α是否显著;将实验组纬度范围限制依次扩大至南北纬30°之间、南北纬40°之间进行模型回归,以避免由于实验组数量较少、分组范围具有一定主观性而导致模型回归结果可靠性受限;
24、s52、以同纬度其他大洋地区国家为实验组,进行模型回归,检验交互项回归系数 α是否显著,以考察实验组选择在中、东太平洋海域是否合理;
25、s53、随机抽样选择伪实验组,进行模型回归,检验交互项回归系数是否显著。
26、优选地,步骤s6所述检验海洋表面温度对影响效果的调节效应的回归方程为: y it= β ( post it× treat it × ln ( sst it)) + x it + μ i + λ t + ε it其中,ln ( sst it) 表示国家 i所在海域在第 t年海洋表面平均温度的对数值;其余各变量含义与双重差分模型的回归方程中的相同; β是系数,用于表示实验组海洋表面温度对基于厄尔尼诺现象的海洋异常变暖事件冲击效果的调节效应,以检验在气候异常事件厄尔尼诺对海洋渔业的影响中,海洋表面温度因素具体发挥的作用;若经检验,系数 β的显著性水平p值小于0.05,则表明海洋表面温度对冲击效果有显著影响,若系数 β与双重差分模型中交互项系数 α的正负符号相同,则表明海洋表面温度强化了前述海洋异常变暖事件的冲击效果,即实验组海洋表面温度越高,其海洋渔业所受影响越大;若系数 β与双重差分模型中交互项系数 α的正负符号相反,则表明海表温度弱化了冲击效果,即实验组海洋表面温度越高,其海洋渔业所受影响越小。
27、优选地,步骤s7所述异质性分析的过程为:考察海洋变暖对不同社会经济水平国家海水养殖渔业产量的差异化影响程度,分别选取能够体现各国经济发展状况、人口条件、产业结构的不同指标,对样本国家进行分组,再次进行双重差分模型回归,比较不同组交互项系数 α的差异。
28、采用上述技术方案后,本发明具有如下有益效果:
29、1、本发明采用基于双重差分模型的因果推断方法,双重差分法常用于评估外部冲击事件对实验组的平均处理效应的研究,通过计算观察数据中实验组与对照组在干预下所导致的结果增量的差距,来验证因果关系得到外生性干预所带来的净效应。双重差分模型可以通过控制时间与个体的固定效应来消除其他潜在因素对因变量的影响,能够较大程度地避免内生性问题,从而探究变量之间的因果关系,而非局限于相关关系,也不需要基于线性或非线性关系的假设,模型科学简单、稳健可靠,具有广阔的应用前景。
30、2、本发明提供的气候变化对渔业的影响研究采用双重差分模型,通过构建个体与时间的双虚拟变量描述全球尺度区域性海洋异常升温情况,同时固定个体固定效应与时间固定效应,可以消除影响海洋渔业的不易观测的潜在因素对影响程度估计的干扰;通过借助外生性事件厄尔尼诺来确定海表温度发生异常变化的区域及时间节点,确定海洋变暖对不同国家海水养殖产量的净影响程度,为气候变化对海洋渔业的影响研究提供技术支撑。
1.一种基于双重差分法的气候变化对渔业产量影响评估方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于双重差分法的气候变化对渔业产量影响评估方法,其特征在于:步骤s1中所述样本包括全球开展海洋渔业活动的国家或地区;所述数据包括全球海洋表面温度异常变暖情况、全球沿海国家海水养殖渔业产量情况、全球沿海国家社会经济相关数据和各国边界、领海、毗连区及专属经济区矢量数据;所述全球沿海国家社会经济相关数据包括全球沿海国家的人均国内生产总值、成人人均国民收入、第一产业增加值占比、总人口和劳动力总数。
3.如权利要求1所述的一种基于双重差分法的气候变化对渔业产量影响评估方法,其特征在于,步骤s1中所述数据提取包括以下步骤:
4.如权利要求1所述的一种基于双重差分法的气候变化对渔业产量影响评估方法,其特征在于:步骤s1中所述数据预处理包括筛选并保留样本国家数据、剔除缺失数据、不同变量对象匹配、数据格式转换和对连续型变量对数化处理,形成包含多元变量的长型数据格式的面板数据。
5.如权利要求1所述的一种基于双重差分法的气候变化对渔业产量影响评估方法,其特征在于,步骤s2中所述确定分组与冲击时间点的具体过程为:借助影响海洋表面温度的外生性事件厄尔尼诺来确定,依据厄尔尼诺事件发生时会引起热带太平洋中、东部海洋表面温度的正异常,参考中国国家气候中心以nino综合区的海温距平指数异常偏高作为厄尔尼诺事件发生的表征,选择经度为160°e-180°-80°w、纬度为23.5°n-23.5°s的热带中、东太平洋地区的国家为实验组,其余国家为对照组;选择高强度厄尔尼诺事件发生年份为海洋异常变暖的冲击时点,距离前后两次低强度厄尔尼诺事件有一定时间间隔的年段作为研究时间区间,用于构建双重差分模型的双虚拟变量,以研究海温变化对海水养殖渔业的影响。
6.如权利要求1所述的一种基于双重差分法的气候变化对渔业产量影响评估方法,其特征在于,步骤s4中所述平行趋势假设检验的方程为:其中,dit表示海表温度当期异常升高的虚拟变量,若国家i所在海域在第t年海表温度异常升高,则取值1,反之取0;其余各变量含义与双重差分模型的回归方程中的相同;是系数,用于表示实验组国家海表温度异常升高的第t年中实验组与对照组的海水养殖渔业年产量变化的差异。
7.如权利要求1所述的一种基于双重差分法的气候变化对渔业产量影响评估方法,其特征在于,步骤s5所述稳健性检验包括以下步骤:
8.如权利要求1所述的一种基于双重差分法的气候变化对渔业产量影响评估方法,其特征在于:步骤s6所述检验海洋表面温度对影响效果的调节效应的回归方程为:yit= β(postit× treatit× ln (sstit)) + xit + μi+ λt + εit其中,ln (sstit) 表示国家i所在海域在第t年海洋表面平均温度的对数值;其余各变量含义与双重差分模型的回归方程中的相同;β是系数,用于表示实验组海洋表面温度对基于厄尔尼诺现象的海洋异常变暖事件冲击效果的调节效应,以检验在气候异常事件厄尔尼诺对海洋渔业的影响中,海洋表面温度因素具体发挥的作用;若经检验,系数β的显著性水平p值小于0.05,则表明海洋表面温度对冲击效果有显著影响,若系数β与双重差分模型中交互项系数α的正负符号相同,则表明海洋表面温度强化了前述海洋异常变暖事件的冲击效果,即实验组海洋表面温度越高,其海洋渔业所受影响越大;若系数β与双重差分模型中交互项系数α的正负符号相反,则表明海表温度弱化了冲击效果,即实验组海洋表面温度越高,其海洋渔业所受影响越小。
9.如权利要求1所述的一种基于双重差分法的气候变化对渔业产量影响评估方法,其特征在于,步骤s7所述异质性分析的过程为:考察海洋变暖对不同社会经济水平国家海水养殖渔业产量的差异化影响程度,分别选取能够体现各国经济发展状况、人口条件、产业结构的不同指标,对样本国家进行分组,再次进行双重差分模型回归,比较不同组交互项系数α的差异。
