基于长短时记忆循环神经网络的北京市糖尿病合并呼吸系统疾病患者入院预测研究
【摘要】:目的:比较广义相加模型(GAM)和长短时记忆循环神经网络(LSTM-RNN)对糖尿病合并呼吸系统疾病患者入院频数的预测效果。方法:收集2014年1月1日至2019年12月31日北京市大气污染物、气象因素和呼吸系统疾病入院数据,基于LSTM-RNN预测糖尿病合并呼吸系统疾病患者入院频数并与GAM对比,模型评价采用五折交叉验证法。结果:与GAM相比,LSTM-RNN具有较低的预测误差[均方根误差(RMSE)分别为21.21±3.30和46.13±7.60,P0.01;平均绝对误差(MAE)分别为14.64±1.99和36.08±6.20,P0.01]和较高的拟合优度(R~2值分别为0.79±0.06和0.57±0.12,P0.01)。在性别分层中,预测女性入院频数时,LSTM-RNN三项指标均优于GAM(均P0.05);预测男性入院频数时,两模型误差评价指标差异无统计学意义(均P0.05)。在季节分层中,预测温暖季节的入院频数时,LSTM-RNN的RMSE和MAE均低于GAM(均P0.05),R2值差异无统计学意义(P0.05);预测寒冷季节入院频数时,两种模型的RMSE、MAE和R2值差异均无统计学意义(均P0.05)。在功能区分层中,预测首都功能核心区入院频数时,LSTM-RNN的RMSE、MAE和R2值均优于GAM(均P0.05)。结论:LSTM-RNN预测误差较小,拟合程度优,可作为污染天气提前精准配置医疗资源的预测手段。