Nhận dạng thư rác Identifity Spam

Get Started. It's Free
or sign up with your email address
Rocket clouds
Nhận dạng thư rác Identifity Spam by Mind Map: Nhận dạng thư rác Identifity Spam

1. A survey of learning-based techniques of email spam (Một cuộc khảo sát về các kỹ thuật học tập dựa trên thư rác)

1.1. Keywords:

1.1.1. Spam filtering

1.1.2. Machine learning

1.2. The spam phenomenon

1.2.1. Definition and general characteristics of spam

1.2.2. Anti-spam legislation efforts

1.2.3. Modifying email transmission protocols

1.2.4. Local changes in email transmission process

1.3. Learning-based methods of spam filtering

1.3.1. What to analyze?

1.3.2. How to analyze?

1.3.2.1. Methods based on Bag-of-Words model

1.3.2.2. Language-based filters

1.3.2.3. Filters based on non-content features

1.3.2.4. Collaborative spam filtering

1.3.2.5. Hybrid approaches

1.3.2.6. Overview of the methods

1.3.3. Opposing reactivity

1.4. Method evaluation and comparison

1.5. Enrico Blanzieri · Anton Bryl Published online: 10 July 2009 © Springer Science+Business Media B.V. 2009

2. Email Spam Filtering (Lọc thư rác qua Email)

2.1. Phân loại thư rác thủ công

2.1.1. Phân loại người gửi

2.1.2. Phân loại quảng cáo

2.1.3. Lọc theo quy tắc

2.1.4. Danh sách trắng

2.1.5. Danh sách đen

2.2. Phân loại thư rác máy học

2.2.1. Mô hình nén dữ liệu

2.2.2. Phân loại tuyến tính

2.2.3. Phân loại xác xuất

2.3. Gordon V. Cormack David R. Cheriton School of Computer Science, University of Waterloo, Waterloo, Ontario, N2L 3G1, Canada, [email protected]

2.4. Phương pháp đánh giá và biên pháp

2.4.1. Tương tác cộng đồng

2.4.2. Tương tác người gửi

2.4.3. Tương tác với người dùng

2.4.4. Các khía cạnh thời gian thực

3. Lọc thư rác dựa trên nội dung Email.

3.1. Phương pháp

3.1.1. Sử dụng kho dữ liệu SPAM CSDMC2010 có chứa 4327 email trong tập dữ liệu đào tạo và 4292 email trong kiểm tra dữ liệu

3.1.2. Sử dụng cớ chế dự đoán giá trị tin cậy như một phương pháp kết hợp.

3.2. Cách thức thực hiện

3.2.1. Xóa các HTML khỏi email, và cập nhật bộ sự tập từ khóa.

3.2.2. Đếm tần số cho mỗi từ được trích xuất từ nội dung.

3.2.3. Lọc những từ không sử dụng thường xuyên (Dựa trên kho dữ liệu)

3.2.4. Phân loại dựa trên kho dữ liệu để đánh giá nội dung của email.

4. Opinian Spam and Analysis (Ý kiến và phân tích)

4.1. Keywords

4.1.1. Review Spam

4.1.2. Fake reviews

4.1.3. Reviews analysis

4.2. Đánh giả phản biện về sản phẩm

4.3. Công việc liên quan ( Related work)

4.4. Phát hiện Spam

4.5. Analysis review

4.5.1. Sử dụng các bản sao

4.5.2. Các đánh giá khác

4.6. Dữ liệu và phân tích hoạt động(opinion data and analysis)

4.6.1. Xem dữ liệu amazon.com

4.6.2. Đánh giá, xếp hạng và phản hồi

4.7. Nitin Jindal and Bing Liu Department of Computer Science University of Illinois at Chicago 851 South Morgan Street, Chicago, IL 60607-7053

5. Tổng quan về thư rác

5.1. Khái niệm

5.1.1. Thư rác (spam) là một loại thư được gửi với số lượng lớn, theo chủ ý của người gửi, hoàn toàn không có sự liên hệ gì với người nhận.

5.1.2. Phần lớn các thư này có nội dung quảng cáo thương mại cho một loại sản phẩm hay dịch vụ nào đó.

5.2. Đặc điểm

5.2.1. Thư rác được gửi đi một cách tự động

5.2.2. Thư rác được gửi đến những địa chỉ ngẫu nhiên trên một diện rộng.

5.3. Phân loại

5.3.1. Thư rác có thể bị gửi thông qua những hình thức thư điện tử, nhóm thảo luận , điện thoại di động và các dịch vụ gửi tin nhắn trên mạng .

5.3.2. Dựa vào quan hệ với người gửi thư rác.

5.3.3. Dựa vào nội dung của thư rác.

5.3.4. Dựa trên động lực của người gửi thông thường.

5.4. Thiệt hại

5.5. Tài liệu tham khảo

5.5.1. A Bhattarai, V Rus, D Dasgupta - 2009 IEEE Symposium on 2009 - ieeexplore.ieee.org

6. A proposed Data Science Appocach for Email Spams Classifcation using Machine Learning Techniques(Một đề xuất khoa học dữ liệu đề xuất cho thư điện tử. Phân loại bằng kỹ thuật học máy)

6.1. Introduce

6.2. Keywords

6.2.1. Email Classification

6.2.2. Spam, Ham

6.2.3. Spam Filter

6.2.4. Features

6.2.5. Spam Detection

6.2.6. Email Client

6.2.7. Ambiguous Output

6.2.8. Email Structure

6.3. Literature Survey

6.3.1. System Architecture - Three-tier architecture

6.3.1.1. The Fundamental logic behind the classfication of Spam/Non-Spam Email

6.3.1.2. Mainly used for the processing of Data

6.3.1.3. Explored and Analyze Data (EDA)

6.4. Proposed System Architecture

6.5. Mathematical Model

6.6. Proposed

6.6.1. Four stages of system architecture

6.6.1.1. Preparation of Data

6.6.1.2. Assessment

6.6.1.3. Data Analyze

6.6.1.4. Deployment

7. Content Based Spam Email Filtering (Lọc thư rác dựa trên nội dung)

7.1. Introduction

7.2. Related Work

7.2.1. Header-based spam email filtering

7.2.2. Automatic statistical method to classify spam email without users’ feedback through significant word modeling

7.2.2.1. first step : Traning step

7.2.2.2. Secound step: Specialization step

7.2.3. Three-layer spam email filtering

7.3. Propose Work

7.3.1. System Archotecture

7.3.1.1. Content Extraction

7.3.1.2. Content Processing

7.3.1.3. Nevie Bayes Algorithm

7.3.2. Processes to build Keyword corpus

7.3.2.1. Content Extraction

7.3.2.2. Remove HTML tags

7.3.2.3. Remove Insignificant

7.3.2.4. Frequency Conting

7.3.2.5. Filter / Inferquent Words

7.4. Exeperiment

7.4.1. Dataset

7.4.2. Evaluation Metric

7.4.3. Experimental Result

7.5. Conclusion and future work