Hehson财经ESG评级中心提供包括资讯、报告、培训、咨询等在内的14项ESG服务,助力上市公司传播ESG理念,提升ESG可持续发展表现。点击查看【ESG评级中心服务手册】
第一作者:黄蕾
通讯作者:黄蕾、段倩囡
通讯单位:南京大学环境学院;西北大学城市与环境学院
成果简介
环境健康(Environmental health,EH)是致力于研究环境行为、毒理学效应、健康风险和减轻有害环境因素的复杂交叉学科。传统的环境健康研究主要是通过控制变量和简化系统结构来研究危险因素与健康结局的相关性。然而,这种方法往往难以解决以不确定性和高维非线性关系为特征的复杂环境健康挑战。近年来,人工智能(AI)技术不仅加速了科研范式的创新,已成为解决复杂环境健康问题的重要工具。然而,AI在环境健康领域的深入和全面应用仍面临诸多障碍,如模型的通用性、数据隐私保护、算法透明度以及监管和伦理问题。本综述聚焦于环境健康中的复合暴露问题,探讨了人工智能在数据收集与融合、危害识别与筛选、风险模拟与评估、环境健康管理等方面的潜力、挑战和发展方向。不难看出,未来人工智能技术必然通过多模式数据融合对复杂的暴露因素进行多维度模拟,从而实现对环境健康风险的精准识别,并最终成为全球环境健康治理的高效工具。本综述将有助于研究人员重新审视“AI for EH”这一发展策略,为人工智能解决复杂的环境暴露问题提供参考。
引言
环境健康是环境科学与健康科学相结合的综合性学科,致力于识别和减轻物理、化学和生物环境因素对人类健康的影响。早期环境健康研究侧重于局部地区污染物的调查和监测;随着全球性环境问题的出现,研究重点转向具体环境问题的成因和机制。21世纪以来,计算化学、高通量实验、毒理学、暴露组学等技术的引入,促使环境健康研究路线日益成熟。然而,复合污染问题的日益显著,给环境健康研究带来了新的挑战。持久性有机污染物、内分泌干扰物、抗生素和微塑料等新兴污染物,具有来源广泛、浓度低和成分复杂的特点,传统方法难以准确、客观地描绘复合暴露场景下的健康结果。AI技术在药物研发、疾病诊断、蛋白质结构预测等领域展现出巨大潜力,同样也提高了环境健康相关大数据的生成和处理效率。机器学习和深度学习算法与分子生物学、遗传学和计算科学的结合,显著提高了多源污染物剂量反应模型的精度。尽管AI在环境健康领域具有巨大潜力,但由于环境暴露的复杂性和动态性,建立标准化的“AI +EH”研究框架面临诸多挑战。本综述面向数据收集与管理、危害识别、风险建模和环境健康管理等环境健康研究的四个关键阶段,重点强调了AI在解决复杂环境健康问题时的应用、挑战和未来方向(图1)。通过综合多模态数据分析,AI能够精准识别和评估风险因素,有助于提升公共安全和全球环境健康管理水平。这一过程重新审视了关键的环境健康研究环节,并突显了AI在重塑环境健康研究范式方面的作用。
图1AI在环境健康研究中的应用、发展与挑战。
图文导读
一、数据收集、融合与管理
环境健康数据是环境风险监测、评估和管理的基础。常见环境健康数据包括了环境监测数据(气象数据、地理数据、环境质量数据等)、人体健康数据(家庭健康监测数据、医学诊断数据等)、环境风险数据(化学品暴露实验数据、基因组学数据等)、文献研究数据以及各类调查数据等多个方面,为评估环境因素对公共健康的影响提供了重要信息。
在数据采集环节,环境监测数据的收集借助遥感、物联网等技术实现智能化升级,提升监测精度和数据及时性,但也面临数据准确性、传输稳定性等挑战。例如,医疗数据采集时,AI与EMR、EHR系统融合,挖掘环境因素与健康结局的相关性,提升诊断准确性,同时面临数据碎片化、隐私保护等难题。在实验及文献数据里,人工智能优化毒理学模型,提高预测准确性,但存在数据收集成本高、模型泛化能力不足等问题。调查数据作为个体环境风险评估的补充,则可通过机器学习技术纠正误差,提升数据质量。在数据融合环节,环境健康数据包括数值、文本、基因组学、影像、音频和视频等多种格式,同样也存在来源多样且标准不统一的问题。因此,AI赋值的多模态数据融合变得至关重要。人工智能的融合方法主要包括时空融合、特征融合、相似性融合和分阶段融合。虽然人工智能技术可将半结构化和非结构化数据转化为标准化信息,但其在数据融合中仍面临多样性、同步性和语义差距等挑战,未来研究需提升模型泛化能力、增强隐私保护,并开发适应动态数据质量波动的算法。
此外,由于其性能依赖数据质量和数量,所以标准化数据采集和记录实践至关重要。例如,建立统一的数据格式和分类标准、使用自动化工具减少人工错误、实施定期数据质量审计及严格执行数据管理政策,标准化诊断术语也有助于 AI 识别和关联术语。不过,因行业差异和利益相关者需求不同,标准化数据采集面临挑战,但这是发展关键。数据库是标准化数据的有效存储库,支持环境健康研究,如生物信息学、影像、化学毒性、社会经济、医疗记录、文献等数据库各有作用。为支持 AI 应用,现有数据库需进一步优化,共享数据库虽提高了数据可访问性并促进合作,但异质性数据来源增加了多模态数据管理复杂性,行业标准应明确统一要求,纳入匿名化和加密技术保护敏感个人信息,建立共享数据库还涉及伦理考量,凸显了法律和伦理框架在未来数据管理中的重要性。
图2 人工智能技术已被用于(A)环境监测、(B)临床诊断、(C)实验与文献以及(D)调查中的数据收集。二、风险识别与危险化学品筛选
在环境健康风险识别中,传统模型和生物实验虽能揭示污染过程与因果关系,但受限于污染物行为不可预测及暴露因素复杂,结论准确性不足,且成本高、操作复杂。AI的融入为提高风险识别、预测和管理精度提供了新机遇,尤其在应对多源复合污染和新兴污染物方面表现出优势。
在大气风险识别中,深度学习整合历史气候和地理信息,可准确预测污染物传输扩散。例如,结合谷歌交通地图与CatBoost模型预测街道级交通污染物;利用深度学习算法提升VOC排放分析精度;集成时间序列模型评估气候变化影响。在水环境风险识别中,深度学习通过CNN与LSTM结合预测富营养化趋势,YOLO模型实现水样细菌污染物实时识别。在土壤和地下水污染源识别中,随机森林与正矩阵分解技术结合识别复杂污染源,混合反演框架提高非高斯场中线性污染物追踪效率。在食品污染识别领域,多模态神经网络和图神经网络框架高效识别污染与掺假,保障生产安全。
针对新兴污染物(如内分泌干扰物),其生物毒性和环境持久性对生态系统和人类健康构成威胁。传统筛选方法费时费力,而机器学习与高通量实验结合显著提高筛选效率并降低成本。例如,GANs生成合成分子结构,强化学习动态调整风险阈值,LSTM捕捉时间模式更新风险分类,GNN生成筛查框架。此外,迭代学习优化复杂化合物识别精度,增强污染物检测能力。AI整合化学结构、环境条件和降解途径等大数据集,开发QSAR模型,准确预测化学品持久性及其长期环境行为,助力政策制定和管理策略优化。基于机器学习的不良结局途径(AOP)框架整合化学和生物数据,显著提升毒性预测和机制洞察能力。例如,随机森林、深度神经网络和XGBoost等算法快速识别新兴污染物与核受体结合潜力及其对生物系统的潜在影响,减少实验资源需求,提高评估准确性和可靠性。
图3 人工智能能够用于(A)识别环境风险,(B)筛选复杂的化学污染物,以及(C)辅助新污染物的高通量筛选。三、风险模拟与评估
AI在环境系统模拟中发挥重要作用。在行为模拟方面,深度学习模型显著提升大气和地表水污染预测能力。例如,STDL模型在中国沿海城市短期PM2.5预测中表现优异,HDL模型用于智能交通系统监测空气污染。地表水模型结合传统数值模型与时间序列算法(如LSTM、GRU、Transformer),可增强对污染物迁移和转化的预测精度,为管理者提供时空动态分析支持。地下水和土壤模型中,数值模型与机器学习算法构建的混合建模方法(如GAN和CNN整合到ILUES框架)提高地下水污染源估算和水力传导性评估精度,RNN模型则优化土壤污染物扩散模拟。
在界面模拟方面,AI助力固-液-气耦合分析,可预测土壤中VOC蒸汽浓度及其与污染物特征的关系。生物-环境介质耦合分析中,机器学习辅助分子模型深入理解有机污染物行为,并在微观尺度上模拟其与环境介质的相互作用。在生物效应模拟方面,降维、特征选择和聚类算法结合Attention机制,利用高通量实验和分子生物学数据预测生物体对外界刺激的反应。
环境健康风险评估面临多源数据整合与智能暴露评估挑战。尽管多模态学习能整合遥感影像、环境监测数据、个体暴露信息和健康数据,但仍存在数据质量差异、复杂关系捕捉不足及传感器噪声等问题。AI通过自动学习特征和模式,发现输入变量间的复杂交互关系,为捕捉个体健康反应变异性提供了工具。例如,贝叶斯模型和集成学习方法可根据个体特征进行分层风险评估。然而,实际应用中仍面临模型可解释性不足、隐私保护和计算资源需求高等挑战。未来研究应通过跨学科合作(如环境科学、流行病学和AI领域专家联合),开发更智能、高效且可解释的环境健康风险评估工具,为公共卫生决策提供支持。
图4人工智能能够实现(A)环境系统建模和(B)环境健康风险评估。四、环境健康管理
AI在健康管理领域的应用正通过跨场景整合数据与算法,推动从个人到公共健康的全方位革新。在个体健康层面,机器学习算法借助可穿戴设备与机器学习技术实现环境健康数据实时监测与个性化干预,如皮肤癌筛查辅助系统与心理健康聊天机器人,显著提升了医疗资源匮乏地区的健康管理效率。在职业健康领域,大模型通过精准农业优化资源利用、制造业污染实时监控及设备故障预测,有效降低工业活动对环境与人体健康的风险,但其长期有效性依赖持续维护与数据安全保障。在公众健康管理中,深度学习模型通过多维度数据分析识别群体风险因素,在疾病预测、政策模拟及医疗资源优化方面展现潜力。与此同时,环境健康管理不可避免的需要确保技术的可靠与伦理合规,因此,在接下来的AI世代,需构建涵盖数据标准、透明度和跨学科协作的监管框架,平衡智能决策支持与人类专业判断,以应对老龄化加剧与慢性病负担等全球性挑战,最终推动医疗体系向智能化、精准化转型。
图6人工智能辅助的环境健康管理,包括(A)个人、(B)行业、(C)政府以及(D)其应对策略和政策的优化。小结
在当前技术革命不断推进的背景下,环境健康研究正处于范式转变的关键时刻。本综述围绕复杂暴露场景下环境健康研究的挑战,从数据收集、整合与管理;危害识别、表征与来源归因;风险建模与评估;以及环境健康治理等几个维度探讨了人工智能应用的潜力、障碍和未来走向。过去,环境健康研究主要依赖于使用简化的系统结构来阐明风险因素与健康结果之间的关系。然而,随着复杂污染物暴露所带来的多方面挑战日益凸显,该领域正逐渐向人工智能驱动的研究范式转变。我们希望本综述能为推进人工智能在环境健康领域的应用提供一些参考。
(生态修复网)(转自:生态修复网)
Hehson财经ESG评级中心简介
Hehson财经ESG评级中心是业内首个中文ESG专业资讯和评级聚合平台,致力于宣传和推广可持续发展,责任投资,与ESG(环境、社会和公司治理)价值理念,传播ESG的企业实践行动和榜样力量,推动中国ESG事业的发展,促进中国ESG评估标准的建立和企业评级的提升。
依托ESG评级中心,Hehson财经发布多只ESG创新指数,为关注企业ESG表现的投资者提供更多选择。同时,Hehson财经成立中国ESG领导者组织论坛,携手中国ESG领导企业和合作伙伴,通过环境、社会和公司治理理念,推动建立适合中国时代特征的ESG评价标准体系,促进中国资产管理行业ESG投资发展。