Các loại mô hình dữ liệu

Get Started. It's Free
or sign up with your email address
Rocket clouds
Các loại mô hình dữ liệu by Mind Map: Các loại mô hình dữ liệu

1. Đặc tính và phân biệt dữ liệu

1.1. -Đặc tính hóa dữ liệu: Tóm tắt dữ liệu của lớp đang nghiên cứu( lớp mục tiêu) theo ngôn ngữ chung.

1.1.1. +Tóm tắt dữ liệu đơn giản dựa trên các biện pháp và sơ đồ thống kê. +Có thể sử dụng thao tác cuộn lên OLAP dựa trên khối dữ liệu.

1.1.2. Output: biểu đồ hình tròn, biểu đồ thanh, đường cong, khối dữ liệu đa chiều và bảng đa chiều, bao gồm cả bảng chéo.

1.2. -Phân biệt dữ liệu: so sánh lớp đích với một hoặc một tập hợp các lớp so sánh (lớp tương phản các lớp).

1.2.1. + Phương pháp tương tự với đặc tính.

1.2.2. Output: tương tự với đặc tính hóa nhưng nên thêm các biện pháp so sánh giúp phân biệt giữa mục tiêu và các lớp tương phản.

1.3. - Cả 2 mô hình trên

2. Khai thác các mô hình thường xuyên

2.1. Các mục thường xuyên

2.1.1. Đề cập đến một tập hợp các mục thường xuất hiện cùng nhau trong một giao dịch

2.2. Các chuỗi thường xuyên

2.2.1. Một sự xuất hiện thường xuyên,ví dụ như mẫu khách hàng, có xu hướng mua máy tính xách tay trước, sau đó là máy ảnh kỹ thuật số và sau đó thẻ nhớ, là một mô hình tuần tự( thường xuyên )

2.3. Các cấu trúc thường xuyên

2.3.1. Nếu 1 cấu trúc xảy ra thường xuyên thì nó được gọi là cấu trúc thường xuyên

3. Phân loại và hồi quy

3.1. Phân loại là quá trình tìm một mô hình (hoặc hàm) mô tả và phân biệt các lớp hoặc khái niệm dữ liệu

3.1.1. Mô hình được rút ra dựa trên phân tích của một tập hợp dữ liệu huấn luyện

3.1.2. Mô hình được sử dụng để dự đoán nhãn lớp của các đối tượng mà có nhãn không xác định

3.1.3. Các loại mô hình dẫn xuất:

3.1.3.1. quy tắc phân loại (quy tắc IF-THEN)

3.1.3.2. Mạng neural

3.1.3.3. Cây quyết định

3.1.3.4. Có nhiều phương pháp khác:Phân loại Bayesian, máy vectơ hỗ trợ và phân loại lân cận(k-nearest-neighbor)

3.2. Hồi quy là mô hình hàm liên tục có giá trị

3.2.1. hồi quy được sử dụng để dự đoán mất mát hoặc giá trị dữ liệu số không có sẵn hơn là dự đoán nhãn lớp

3.2.2. Phân tích hồi quy là một phương pháp thống kê thường được sử dụng để dự đoán số

3.2.3. Hồi quy cũng bao gồm việc xác định phân phối xu hướng dựa trên dữ liệu có sẵn

4. Phân tích phân cụm

4.1. Là phân tích các dữ liệu thành 1 cụm có các tính chất giống nhau

5. Phân tích ngoại lệ

5.1. -Được gọi là phân tích ngoại lệ hoặc khai thác bất thường.

5.1.1. + Kiểm tra thống kê giả định mô hình phân phối.

5.1.2. + Xác suất cho dữ liệu

5.1.3. + Sử dụng các thước đo khoảng cách nơi các đối tượng ở xa bất kỳ cụm khác được coi là ngoại lệ

6. Điều gì làm cho một mô hình trở nên hấp dẫn

6.1. dễ hiểu cho mọi người

6.2. hợp lệ trên dữ liệu mới hoặc thử nghiệm với một mức độ chắc chắn nào đó

6.3. có khả năng hữu ích

6.4. Một số biện pháp khách quan của mô hình thú vị: + support(X=>Y) = P(X U Y): Xác suất + Confidence(X=>Y) = P(X|Y): xác suất có điều kiện + độ chính xác và phạm vi bảo hiểm cho các quy tắc phân loại (IF-THEN)