OCR Team sOcCeR
저자: shin moonjong
1. 데이터 전처리
1.1. GAN
1.1.1. CycleGAN
1.1.2. Cut
1.1.3. Fast Cut
1.2. Open CV
1.2.1. 음영 및 기울기 처리
1.2.1.1. dilate
1.2.1.2. OTSU
1.2.1.3. Binary
1.2.1.4. Skew
1.3. 데이터셋 reversion
1.3.1. 가로: 세로 = 4:1 비율 이미지 데이터셋 생성
1.3.2. 세로 이미지 가로 Rotate
2. 모델링
2.1. SATRN
2.1.1. Backbone 교체
2.1.1.1. resnetRS
2.1.1.1.1. 152
2.1.1.1.2. 200
2.1.1.1.3. 270
2.1.1.2. EfficientNetV2
2.1.1.3. NFnet
2.1.2. 논문 재현
2.1.2.1. Positional Encoding
2.1.2.2. Locality-aware feedforward
2.1.2.2.1. convolution
2.1.2.2.2. Separable
2.1.3. 모델 추가 Feature
2.1.3.1. Rezero
2.1.3.2. encoder sharing
2.1.3.3. residual transformer
2.2. ASTER
2.2.1. Backbone 교체
2.2.1.1. DenseNet
2.2.1.2. EfficientNetV2
2.2.2. 논문 재현
2.2.2.1. Feature Encoder 부분 BLSTM 추가
2.2.2.1.1. hidden state concat
2.2.2.1.2. hidden state add
2.2.3. LayerNorm 추가
2.3. ViT
2.3.1. Pretrained model 사용