1. MongoDb
2. Analisi di link
2.1. Pagerank
2.1.1. Matrice di transizione
2.1.1.1. Autovettore
2.1.2. evitare dead ends
2.1.3. Taxation
2.1.4. Implementazione
2.1.4.1. Striping per map-reduce
2.1.5. Topic-sensitive
2.1.5.1. Bias-walk
2.1.5.2. Identificazione topic
2.1.6. Link Spam
2.1.6.1. Spam Farm
2.1.6.1.1. Contromisure
2.2. Hubs and authorities
2.2.1. link matrix
3. Ricerca itemset frequenti
3.1. Definizione
3.1.1. Supporto
3.1.2. Basket
3.1.3. Market
3.2. Association rules
3.2.1. Confidenza
3.2.2. Interesse
3.2.3. Ricerca
3.3. A-Priori algorithm
3.3.1. Rappresentazione degli itemset
3.3.1.1. Matrice triangolare
3.3.1.2. Triplets
3.3.2. Filtro
3.3.3. Costruisco
3.3.4. Coppie
3.3.4.1. Insiemi più grandi
3.3.5. PCY
3.3.5.1. Multistage
3.3.5.1.1. Multihash
3.4. Simple Random Algorithm
3.4.1. Eliminazione errori
3.4.2. SON
3.4.2.1. Implementazione in Map Reduce
3.4.3. Toivonen
3.4.3.1. Dimostrazione
3.5. Stream
3.5.1. Come fare sampling
4. Clustering
4.1. Euclidei
4.1.1. Gerarchici
4.1.1.1. Agglomerativo
4.1.1.1.1. Euclideo
4.1.1.1.2. Non Euclideo
4.1.2. Point Assignment
4.1.2.1. K-Means
4.1.2.1.1. Scelta cluster iniziali
4.1.2.1.2. Scelta numero dei cluster
4.1.3. BFR
4.1.3.1. Rappresentazione dei cluster
4.1.3.2. Processare i punti
4.1.3.2.1. Assegnazione punti a cluster
4.1.3.3. Distanza di Mahalanobis
4.1.4. CURE
4.1.4.1. Inizializzazione
4.1.4.2. Merge
4.2. Non-Euclidei
4.2.1. GRGPF
4.2.1.1. Rappresentazione (tree)
4.2.1.2. Inizializzazione
4.2.1.3. Aggiunta punti
4.2.1.4. Splitting
4.2.1.5. Merging
5. Web-advertising
5.1. Balance algorithm
5.1.1. Con tanti bidders
5.1.2. Calcolo
5.2. Competitive Ratio
5.3. Simple Greedy Algorithm
6. Reccomendation system
6.1. Utility matrix
6.2. long tail
6.3. Content-Based
6.3.1. Estrazione features
6.3.1.1. Documenti
6.4. Collaborative filtering
6.4.1. Normalizzazione
6.4.2. Rounding
6.4.3. Duality of similarity
6.4.4. Clustering degli elementi
6.5. UV-decomposition
6.5.1. RMSE
6.5.2. Teoria
6.5.3. Algoritmo
6.5.3.1. Preprocessing
6.5.3.2. Inizializzazione
6.5.3.3. Ottimizzazione
6.5.3.4. Punto di stop
6.5.3.5. Overfitting
7. Analisi social
7.1. Tipi di grafi
7.2. Clustering
7.2.1. Problemi con la distanza
7.2.2. Betweness
7.2.2.1. Definizione
7.2.2.2. Calcolo
7.2.2.2.1. Girvan-Newman
7.2.2.3. Come trovare communities
7.3. Partizionamento
7.3.1. Taglio normalizzato
7.3.2. Matrice laplaciana
7.4. Simrank
7.4.1. Base
7.4.2. Con Restart
8. Riduzione della dimensionalità
8.1. Autovettori e autovalori
8.1.1. Definizione
8.1.2. Calcolo
8.1.2.1. Power Iteration
8.1.3. Matrice degli autovettori
8.2. PCA
8.2.1. Rotazione
8.2.2. Riduzione dimensionalità rimuovendo autovettori
8.3. SVD
8.3.1. Struttura
8.3.2. Interpretazione
8.3.2.1. Concetti
8.3.3. Riduzione dimensionalità rimuovendo concetti
8.3.4. Query incrociando concetti
8.3.5. Calcolo dell'SVD
8.3.5.1. Passaggi folli
9. Paradigma Map Reduce
9.1. Traduzione da relazionale
9.1.1. selezione
9.1.2. proiezione
9.1.3. natural join
9.1.4. grouping and aggregation
9.2. Pregel
9.3. Algoritmi su Map Reduce
9.3.1. Moltiplicazione matrice-vettore
9.3.2. Moltiplicazione matrice-matrice
9.3.3. Multiway-join
9.4. Analisi della complessità
9.4.1. reducer size
9.4.2. replication rate
9.4.3. Graph Model
10. Introduzione
10.1. Approssimazione
10.2. TF*IDF
10.3. Principio di Bonferroni
10.4. Funzioni di hash
10.5. Power Laws
11. Calcolo similarità
11.1. Documenti
11.1.1. LSH
11.1.1.1. Banding
11.1.1.2. Signatures
11.1.1.2.1. Matrice Caratteristica
11.1.1.2.2. MinHashing
11.1.1.3. Shingles
11.1.1.4. Combinazioni
11.1.1.4.1. AND
11.1.1.4.2. OR
11.1.1.4.3. Analisi
11.2. Generali
11.2.1. Distanza
11.2.1.1. Distanza euclidea
11.2.1.2. Distanza di Jaccard
11.2.1.3. Distanza di Hamming
11.2.1.4. Edit distance
11.2.2. AND-Combination
11.2.3. OR-Combination
12. Stream
12.1. Stream Model
12.2. Sampling
12.2.1. Dimensione costante del sample
12.3. Filtraggio
12.3.1. Bloom filtering
12.3.1.1. analisi
12.4. Contare elementi
12.4.1. Flajolet-martin
12.4.1.1. Stime