Chapter 3 常见使用场景(示例)

  • 剔除生理不可能/输入错误值:如年龄限定在 18–95 岁,BMI 在 10–60 范围;

  • 限定研究窗口期:入组日期在 2021-01-01 至 2023-12-31;

  • 锁定治疗亚组:仅选择“免疫治疗 + 化疗”组合或特定方案;

  • 疾病分期/分层:仅纳入 III–IV 期或 PD-L1 ≥ 50% 患者;

  • 缺失模式敏感性:先排除关键结局缺失,再与“缺失值填补”后的分析集对照。

3.0.1 质量核对(强烈建议)

切换到底部 “筛选前数据概览”“筛选后数据概览”

  • 观察样本量变化是否符合预期;

  • 查看关键变量的分布偏移是否合理(避免无意间筛掉某个重要亚组);

  • 关注分类变量是否出现稀有水平(过少水平可能影响模型稳定性);

  • 若差异过大,请返回左侧调整条件。

3.0.2 常见问题与排查

  • 筛完后为 0 行:条件过于苛刻或互相冲突;逐步减少条件,定位哪一项导致全被排除。

  • 无法勾选“缺失值”:该选项仅对分类型筛选器开放;数值/日期型建议先在“生成新变量/缺失值填补”模块处理后再筛选。

  • 日期滑块无法正常识别:请确认你的日期列在上一步已设为 Date/POSIX 类型;若源数据是字符串或混合格式,可在“生成新变量”模块先转换。

  • 进度条比例异常:通常与“筛选后行数非常接近 0 或全部”有关,先确认条件组合是否符合预期。

3.0.3 完成的标志

  • 进度条与数据表稳定;

  • “筛选后数据概览”中的分布与样本量合理;

  • 已导出筛选后的数据,并保存了筛选代码/表达式;

  • 可以进入后续的建模与作图模块。

3.0.4 小贴士

  • 若你计划进行倾向评分匹配/加权等因果推断,请先用本页确定研究队列与纳入标准,再在相应模块实施匹配/加权;

  • 建议为关键筛选步骤建立版本记录(导出的 xlsx 与对应 R 代码),便于协作与审稿追溯。