Chapter 3 常见使用场景(示例)
剔除生理不可能/输入错误值:如年龄限定在 18–95 岁,BMI 在 10–60 范围;
限定研究窗口期:入组日期在 2021-01-01 至 2023-12-31;
锁定治疗亚组:仅选择“免疫治疗 + 化疗”组合或特定方案;
疾病分期/分层:仅纳入 III–IV 期或 PD-L1 ≥ 50% 患者;
缺失模式敏感性:先排除关键结局缺失,再与“缺失值填补”后的分析集对照。
3.0.1 质量核对(强烈建议)
切换到底部 “筛选前数据概览” 与 “筛选后数据概览”:
观察样本量变化是否符合预期;
查看关键变量的分布偏移是否合理(避免无意间筛掉某个重要亚组);
关注分类变量是否出现稀有水平(过少水平可能影响模型稳定性);
若差异过大,请返回左侧调整条件。