khqp_trainer/flush.py

#!/usr/bin/env python3
# -*- coding:utf-8 -*-
from loguru import logger
from sqlalchemy import Column, Integer, String, create_engine
from sqlalchemy.orm import declarative_base, sessionmaker

from bak.evolve_config2 import train_data
from bak.init_data import BatchDataBase

Base = declarative_base()
# 创建 SQLite 数据库引擎
engine = create_engine('sqlite:///data.db', echo=False)


class BatchData(Base):
    __tablename__ = 'batch_data'
    id = Column(Integer, primary_key=True, autoincrement=True)
    year = Column(Integer)
    census_batch = Column(String)  # 普查批次
    id_code = Column(String)
    precision = Column(String)  # 精度
    is_train = Column(Integer)
    is_validation = Column(Integer)
    ann_file = Column(String)
    img_prefix = Column(String)
    filter_empty_gt = Column(Integer)
    update_cache = Column(Integer)


Base.metadata.create_all(engine)

Session = sessionmaker(bind=engine, )
session = Session()
logger.debug(f"{len(train_data)=}")

census_batches = []
for td in train_data:
    db_obj = BatchData(**BatchDataBase(**td).dict())
    batch_data_db = session.query(BatchData).filter_by(ann_file=db_obj.ann_file).first()
    if '2023' in db_obj.ann_file:
        batch_data_db.year = 2023
    census_batch_idx = db_obj.ann_file.index('kh')
    if census_batch_idx:
        census_batch = db_obj.ann_file[census_batch_idx:census_batch_idx + 4]
        census_batches.append(census_batch)
        batch_data_db.census_batch = census_batch
    # if not batch_data_db:
    #     logger.debug(f"insert {db_obj.ann_file=}")
    #     session.add(db_obj)

session.commit()

logger.info(f"{set(census_batches)=}")