格陵达遥感与随机森林技术在加纳的网格化劳动力市场数据分析.pdf

◎国际劳工组织2026
cc)BY
署名4.0国际(CCBY 4.0)
本作品受Creative Commons Atribution 4.0 International许可。详见:https://creativecommons.orglicenses/by/4.0/用户可以根据许可协议的规定,重复使用、分享(复制和再分发)、改编(混搭、改编和在此基础上进行创作)这些内容。用户必须明确注明国际劳工组织(ILO)是该材料的来源,并说明是否对原始内容进行了修改。禁止在翻译、改编或其他衍生作品中使用国际劳工组织的徽章、名称和标志。
归属用户必须指明是否进行了修改,并按照以下方式引用作品:Yan,J.,Matthieu,C.,Yang.M.,Zeshuo,L.格陵达遥感与随机森林技术在加纳的网格化劳动力市场数据分析国际劳工组织工作论文165。日内瓦:国际劳工局,2026年。◎国际劳工组织。
翻译。
-如果对本作品进行翻译,必须在署名信息之外,同时添加以下免责声明:本译文是国际劳工组织(ILO)受版权保护的作品的翻译版本。本翻译未经国际劳工组织准备、审查或批准,不应被视为国际劳工组织的官方翻译。国际劳工组织对本译文的内容和准确性不承担任何责任。本译文的责任完全由译者承担。
适应如对本作品进行改编,必须添加以下免责声明,并附上归属权声明:这是一份国际劳工组织(LO)版权作品的改编版本。此改编版本未经ILO准备、审核或认可,不应被视为官方ILO改编。ILO对其内容的准确性和完整性概不负责,责任完全由改编版本作者承担。
第三方资料此Creative Commons许可证不适用于本出版物中包含的非国际劳工组织版权材料。如果材料
归因于第三方,使用此类材料的人仅对与版权所有者协商权利并对其侵权索赔负责。
任何根据本许可证产生的、无法友好解决的争议,应提交联合国国际贸易法委员会(UNCITRAL)仲裁规则进行仲裁。各方应受此类仲裁产生的任何仲裁裁决的约束,作为此类争议的最终裁决。
ri就形题枢和许面镞详绷带息组谐胱叛物和数字产品的详细信息,请访问:www.ilo.org/publns.

摘要
这项研究展示了高分辨率(0.005)网格化劳动力市场数据,通过使用随机森林算法和遥感技术对加纳地区层面的普查数据进行降尺度处理而生成。它通过绘制17个就业类别(包括年龄、性别、技能、状态、部门、失业和NEET)来弥补空间分解劳动力市场数据的不足。将辅助数据(64个变量)如土地覆盖、夜间灯光、基础设施和兴趣点整合,以捕捉人口、经济和参与因素。该模型实现了高精度(大多数类别R2>90%),并揭示了显著的空间异质性,就业率在像素间从10%到98%不等。结果突出了城乡和南北差异,以及部门集中。变量重要性分析强调了建成区、夜间灯光、道路密度和植被健康状况在预测就业模式中的作用,并在不同就业类别中表现出特异性。该方法通过纳入劳动力市场复杂性,超越了传统的GDP或人口网格化。研究结果展示了机器学习和地理空间数据在数据匮乏环境中增强社会经济地图制作的潜力。网格化人口和GDP数据是有效政府政策规划和国际援助分配的重要工具。网格化人口数据对于健康监控和城市发展至关重要,能够实现精确和有针对性的干预(Stevens等人,2015;Tatem,2017;Leyk等人,2019;Chen等人,2019;Lebakula等人,2025)。同时,网格化GDP数据使政策制定者能够监控次国家级别的经济发展,促进更明智和本地化的决策(Kummu等人,2018;Chen等人,2022;Jin等人,2023;Wu等人,2024)。
人口统计数据或社会经济属性存在显著差异。社会经济属性需要将经济活动度与人口联系起来,反映物质和人力资本的积累、聚集效应以及政治和经济制度的发展和质量。
网格化社会经济数据需要超越GDP,鉴于其众所周知的局限性以及通过劳动力市场指标、人类发展指数或贫困测量来衡量个人福祉的必要性。然而,很少有人尝试生产高分辨率的贫困测量(Jean等人,2016;Huber和Mayoral,2024)或性别发展指标(Bosc等人,2017),并且目前尚无现有的劳动力市场网格化数据。
在这篇论文中,我们提出了第一套高分辨率劳动力市场数据地图,该地图基于对加纳2021年住房与人口普查district-level统计数据的0.005度分解。降低劳动力市场统计数据的比例背后的理由是较低行政级别的巨大异质性。虽然国家层面的就业率为48%,但区级标准差为11.2个百分点,Nabdam地区区级的最低就业率为16.5%,Ashaiman地区区级的最高就业率为64.7%(见第2.1节和图1)。
高分辨率劳动力市场地图的一个困难是,没有单一的指标能够最好地描述它。虽然就业数量,即总就业人数,是最常讨论的变量,但劳动力市场挑战往往与特定子群体(青年、老年工人、女性)有关,与不充分就业(失业、NEET)相关。1),就业质量(技能、就业状况),或行业(农业、制造业、服务业)。就业情况也常以比率表示,需要估算工作年龄人口。2
第二难度在于劳资关系依赖于多个因素,而这些因素很难通过GIS和遥感数据捕捉。劳动力供应,即工作的
或可工作的人员数量,与人口增长直接相关。然而,还必须考虑其他因素。经济活动水平是劳动力市场的一个重要决定因素,因为它确定了劳动力需求水平。特别是,将GDP的高分辨率地图进行部门分解(金等,2023年;吴等,2024年)是一个挑战。因此,缩放劳动力市场数据需要结合与人口和GDP分散化相关的方法◎一个关键于劳动力市场的第三个要素是基于个人决定的参与决策。个人参与劳动力市场的决策受到各种因素的影响,如教育水平、性别、家庭结构、工作经验年限、贫困状况或活动领域(参见Aaronson等人(2020年);Klasen等人(2021年)关于女性劳动力市场参与;Baah-Boateng(2013年);Amankwah等人(2022年)关于影响加纳劳动力市场参与的具体因素)。
该网格化就业数据集包含17个与就业相关的类别:总就业及其按年龄(青年、成年、老年)分解,按性别(男性、女性),按技能(高技能、低技能),按状态(自营、薪金),按行业(农业、矿业、制造业、工业和服务业),失业和NEET。收集的辅助数据包括64个类别,旨在捕捉人口统计学因素、经济活动水平以及参与劳动市场的决策。这些数据包括GIS数据、遥感数据和兴趣点。劳动力市场统计数据来自加纳2021年住房和人口普查的就业模块,并遵循2019年国际劳工统计学家会议的定义。该模型使用基于区级劳动力统计和辅助数据的随机森林算法进行训练。像素分解在0.005度的分辨率下进行。

本文来自知之小站

 

报告已上传百度网盘群,限时15元即可入群及获得1年期更新

(如无法加入或其他事宜可联系zzxz_88@163.com)