시작하기. 무료입니다
또는 회원 가입 e메일 주소
OCR Team sOcCeR 저자: Mind Map: OCR Team sOcCeR

1. 데이터 전처리

1.1. GAN

1.1.1. CycleGAN

1.1.2. Cut

1.1.3. Fast Cut

1.2. Open CV

1.2.1. 음영 및 기울기 처리

1.2.1.1. dilate

1.2.1.2. OTSU

1.2.1.3. Binary

1.2.1.4. Skew

1.3. 데이터셋 reversion

1.3.1. 가로: 세로 = 4:1 비율 이미지 데이터셋 생성

1.3.2. 세로 이미지 가로 Rotate

2. 모델링

2.1. SATRN

2.1.1. Backbone 교체

2.1.1.1. resnetRS

2.1.1.1.1. 152

2.1.1.1.2. 200

2.1.1.1.3. 270

2.1.1.2. EfficientNetV2

2.1.1.3. NFnet

2.1.2. 논문 재현

2.1.2.1. Positional Encoding

2.1.2.2. Locality-aware feedforward

2.1.2.2.1. convolution

2.1.2.2.2. Separable

2.1.3. 모델 추가 Feature

2.1.3.1. Rezero

2.1.3.2. encoder sharing

2.1.3.3. residual transformer

2.2. ASTER

2.2.1. Backbone 교체

2.2.1.1. DenseNet

2.2.1.2. EfficientNetV2

2.2.2. 논문 재현

2.2.2.1. Feature Encoder 부분 BLSTM 추가

2.2.2.1.1. hidden state concat

2.2.2.1.2. hidden state add

2.2.3. LayerNorm 추가

2.3. ViT

2.3.1. Pretrained model 사용

2.4. MMOCR

3. 로스