xdata 数据清洗
Go to file
2021-01-11 20:23:02 +08:00
db 修改目录结构 2020-12-23 15:06:44 +08:00
model update 2021-01-11 20:12:21 +08:00
script update 2021-01-11 19:43:57 +08:00
task update 2021-01-11 20:23:02 +08:00
utils update 2021-01-08 19:20:29 +08:00
.gitignore edit ignore 2021-01-08 16:21:31 +08:00
config.json update 2021-01-11 19:43:57 +08:00
main.py update 2021-01-08 20:28:17 +08:00
Pipfile add Pipfile 2021-01-08 16:16:22 +08:00
README.md 'update' 2020-12-11 10:58:33 +08:00
settings.py update 2021-01-11 09:58:33 +08:00

data_cleaning

xdata 数据清洗

执行流程

  1. 检查任务开始时间戳和运行状态,防止锁死钉钉报警。
  2. 根据上次游标结束时间戳或传如时间戳 读取 event_{date} 集合,考虑跨集合情况。
  3. 标记任务开始时间戳。
  4. 标记为运行状态。run=1
  5. 清洗数据入库。
  6. 设置本次操作游标。
  7. 标记运行结束。run=0