Habit Factory Data Analysis
por Su Jae Lee

1. Data Type
1.1. 카드/입출금 데이터
1.2. 카드 결제예정 데이터
1.3. 펀드/퇴직연금 데이터
1.4. 대출 데이터
1.5. 보험 데이터
1.6. 통신사 멤버쉽 데이터
1.7. 간편결제/입출금 데이터
2. Analysis Subject
2.1. 개별 Data Set 구조 및 의미 파악(Collecting Data Validation)
2.2. 기초 통계 유형 제공 및 확정: 현재 제공되고 있는 기초 동계 유형 파악 후 추가 분석 사항 검토
2.3. Data set 간 연관성 도출: ex) 카드 데이터와 펀드데이터 사이에서 생각해 볼 수 있는 분석 주제 작성
3. As_is
4. Analysis with R
4.1. Data Processing
4.1.1. Date Merging, Split, Sorting
4.1.2. Statistics Summary
4.1.3. Data Exploratory
4.1.4. Statistics Analysis(t-test, ANOVA, F-test, Correlation
4.2. Prediction
4.2.1. Linear Regression
4.2.2. Multi-Linear Regression
4.2.3. Principle Component Regression
4.2.4. Partial Least Square Regression
4.3. Classification
4.3.1. Decision Tree
4.3.2. SVM(Support Vector Machine)
4.3.3. Ramdom Forest
4.3.4. Logistic Regression
4.4. Clustring
4.4.1. Hierarchical Clustering
4.4.1.1. Single linkage method
4.4.1.2. Complete linkage method
4.4.1.3. Average linkage method
4.4.1.4. Centroid linkage method
4.4.2. Non-hierarchical Clustering
4.4.2.1. K-mean
4.4.2.2. K-medoids
4.4.2.2.1. Partitioning Around Medoids
4.4.2.2.2. CLARA(Clustering LARge Applications)
4.5. Association
4.5.1. Association Rule Analysis