Chương 2.1 MAPREDUCE & HADOOP
af Trần Thị Mỹ Nhung
1. **MapReduce** : 84
1.1. Hai bước
1.1.1. Tính toán
1.1.2. Tổng hợp
1.2. Cấu trúc dữ liệu: 85
1.2.1. In/Out: Danh sách các cặp khóa giá trị
1.3. Cấu trúc hàm: 87
1.4. RunTime: 90
1.4.1. Lập lịch
1.4.2. Phân tán
1.4.3. Đồng bộ
1.4.4. Lỗi
1.5. Định nghĩa: 93
1.5.1. Mô hình lập trình
1.5.2. Framework
1.5.3. Công cụ chuyên biệt
1.6. Ưu điểm: 95
1.6.1. Xử lý hàng loạt
1.6.2. Ứng dụng: Web, MXH,...
1.7. Hạn chế: 96
1.7.1. Vấn đề dữ liệu lớn
1.7.2. Lặp lại - Đệ quy - Stream
1.8. Hiên thực MapReduce: 97
1.8.1. Hadoop
2. **Hạn chế** trong phát triển công nghệ: 53
2.1. Trong mô hình hiện tại
2.2. Trong các siêu máy tính
2.3. Về băng thông kết nối
2.4. Vấn đề điển hình
3. Thách thức của song song hóa: 63
4. Quản lý cùng lúc nhiều worker: 65
5. Ý tưởng từ lập trình hàm: 73
5.1. Ngôn ngữ LISP
5.2. Hàm Map
5.3. Hàm Reduce - Fold
6. Ý tưởng chính: 70
6.1. Mở rộng, không phải nâng cấp
6.2. Xử lý --> chứa DL
6.3. Xử lý tuần tự, tránh ngẫu nhiên
6.4. Mở rộng liền mạch
6.5. Ý tưởng từ dữ liệu: 72
6.5.1. HPC