Chapter 3 常见使用场景（示例）

剔除生理不可能/输入错误值：如年龄限定在 18–95 岁，BMI 在 10–60 范围；
限定研究窗口期：入组日期在 2021-01-01 至 2023-12-31；
锁定治疗亚组：仅选择“免疫治疗 + 化疗”组合或特定方案；
疾病分期/分层：仅纳入 III–IV 期或 PD-L1 ≥ 50% 患者；
缺失模式敏感性：先排除关键结局缺失，再与“缺失值填补”后的分析集对照。

3.0.1 质量核对（强烈建议）

切换到底部 “筛选前数据概览” 与 “筛选后数据概览”：

观察样本量变化是否符合预期；
查看关键变量的分布偏移是否合理（避免无意间筛掉某个重要亚组）；
关注分类变量是否出现稀有水平（过少水平可能影响模型稳定性）；
若差异过大，请返回左侧调整条件。

3.0.2 常见问题与排查

筛完后为 0 行：条件过于苛刻或互相冲突；逐步减少条件，定位哪一项导致全被排除。
无法勾选“缺失值”：该选项仅对分类型筛选器开放；数值/日期型建议先在“生成新变量/缺失值填补”模块处理后再筛选。
日期滑块无法正常识别：请确认你的日期列在上一步已设为 Date/POSIX 类型；若源数据是字符串或混合格式，可在“生成新变量”模块先转换。
进度条比例异常：通常与“筛选后行数非常接近 0 或全部”有关，先确认条件组合是否符合预期。

3.0.3 完成的标志

进度条与数据表稳定；
“筛选后数据概览”中的分布与样本量合理；
已导出筛选后的数据，并保存了筛选代码/表达式；
可以进入后续的建模与作图模块。

3.0.4 小贴士

若你计划进行倾向评分匹配/加权等因果推断，请先用本页确定研究队列与纳入标准，再在相应模块实施匹配/加权；
建议为关键筛选步骤建立版本记录（导出的 xlsx 与对应 R 代码），便于协作与审稿追溯。