B1: GIẢI NGỐ DATA

Get Started. It's Free
or sign up with your email address
B1: GIẢI NGỐ DATA by Mind Map: B1: GIẢI NGỐ DATA

1. Khái niệm về Data

1.1. Là tập hợp các dữ kiện => quan sát

1.2. Phân loại dữ liệu

1.2.1. Dữ liệu phi cấu trúc: không thể biểu thị dưới dạng hàng và cột => Phải xử lý, phân tách

1.2.1.1. NO SQL DATABASE

1.2.2. Dữ liệu có cấu trúc (data dạng cột, đường, ngày tháng,...) => được tổ chức theo schema

1.2.2.1. SQL DATABASE

1.3. Dữ liệu vs Thông tin

1.3.1. Data: không có giá trị nếu không nghiên cứu, phân tích

1.3.2. Thông tin: là data đã được xử lý để đưa ra nội dung hoặc ý nghĩa nhất định

2. Database: Nơi chứa dữ liệu được sản sinh ra từ hệ thống, phần mềm của công ty

2.1. Khóa chính (PK): giá trị định danh cho từng bảng + Không được trùng nhau + Không được bỏ trống

2.2. Khóa ngoại (FK): khóa biểu diễn mối quan hệ giữa các bảng với nhau => tham chiếu

2.3. Schema: dùng để gom nhóm các bảng cùng chủ đề

2.4. Data type

2.4.1. INT

2.4.2. FLOAT

2.4.3. BOOLEAN

2.4.4. VARCHAR

2.4.5. NVARCHAR

2.4.6. DATE

2.4.7. DATETIME

2.4.8. TIME

3. Data System (Hệ thống dữ liệu):

3.1. DATA WAREHOUSE

3.1.1. kho dữ liệu tổng hợp từ nhiều phòng ban khác nhau

3.1.2. Data Mart nằm trong Data Wảehouse

3.1.3. Data đã được chuẩn hóa

3.2. DATA LAKE

3.2.1. Nơi tập trung dữ liệu thô

3.2.2. Có thể lưu trữ dung lượng lớn hơn

3.3. DATA PIPELINE

3.3.1. Là chuỗi các bước để xử lý dữ liệu

3.3.1.1. ELT= Extract, Load, Transform

3.3.1.2. ETL= Extract, Transform, Load

4. SQL

4.1. DDL: lệnh định nghĩa xây dựng và quản lý đối tượng

4.2. DQL: lệnh truy vấn

4.3. DML: lệnh thay đổi giá trị dữ liệu