Show full map

Analisi dei dati

Simone Robutti

Get Started. It's Free

or sign up with your email address

Similar Mind Maps Mind Map Outline

Analisi dei dati by Simone Robutti Mind Map: Analisi dei dati

1. MongoDb

2. Analisi di link

2.1. Pagerank

2.1.1. Matrice di transizione

2.1.1.1. Autovettore

2.1.2. evitare dead ends

2.1.3. Taxation

2.1.4. Implementazione

2.1.4.1. Striping per map-reduce

2.1.5. Topic-sensitive

2.1.5.1. Bias-walk

2.1.5.2. Identificazione topic

2.1.6. Link Spam

2.1.6.1. Spam Farm

2.1.6.1.1. Contromisure

2.2. Hubs and authorities

2.2.1. link matrix

3. Ricerca itemset frequenti

3.1. Definizione

3.1.1. Supporto

3.1.2. Basket

3.1.3. Market

3.2. Association rules

3.2.1. Confidenza

3.2.2. Interesse

3.2.3. Ricerca

3.3. A-Priori algorithm

3.3.1. Rappresentazione degli itemset

3.3.1.1. Matrice triangolare

3.3.1.2. Triplets

3.3.2. Filtro

3.3.3. Costruisco

3.3.4. Coppie

3.3.4.1. Insiemi più grandi

3.3.5. PCY

3.3.5.1. Multistage

3.3.5.1.1. Multihash

3.4. Simple Random Algorithm

3.4.1. Eliminazione errori

3.4.2. SON

3.4.2.1. Implementazione in Map Reduce

3.4.3. Toivonen

3.4.3.1. Dimostrazione

3.5. Stream

3.5.1. Come fare sampling

4. Clustering

4.1. Euclidei

4.1.1. Gerarchici

4.1.1.1. Agglomerativo

4.1.1.1.1. Euclideo

4.1.1.1.2. Non Euclideo

4.1.2. Point Assignment

4.1.2.1. K-Means

4.1.2.1.1. Scelta cluster iniziali

4.1.2.1.2. Scelta numero dei cluster

4.1.3. BFR

4.1.3.1. Rappresentazione dei cluster

4.1.3.2. Processare i punti

4.1.3.2.1. Assegnazione punti a cluster

4.1.3.3. Distanza di Mahalanobis

4.1.4. CURE

4.1.4.1. Inizializzazione

4.1.4.2. Merge

4.2. Non-Euclidei

4.2.1. GRGPF

4.2.1.1. Rappresentazione (tree)

4.2.1.2. Inizializzazione

4.2.1.3. Aggiunta punti

4.2.1.4. Splitting

4.2.1.5. Merging

5. Web-advertising

5.1. Balance algorithm

5.1.1. Con tanti bidders

5.1.2. Calcolo

5.2. Competitive Ratio

5.3. Simple Greedy Algorithm

6. Reccomendation system

6.1. Utility matrix

6.2. long tail

6.3. Content-Based

6.3.1. Estrazione features

6.3.1.1. Documenti

6.4. Collaborative filtering

6.4.1. Normalizzazione

6.4.2. Rounding

6.4.3. Duality of similarity

6.4.4. Clustering degli elementi

6.5. UV-decomposition

6.5.1. RMSE

6.5.2. Teoria

6.5.3. Algoritmo

6.5.3.1. Preprocessing

6.5.3.2. Inizializzazione

6.5.3.3. Ottimizzazione

6.5.3.4. Punto di stop

6.5.3.5. Overfitting

7. Analisi social

7.1. Tipi di grafi

7.2. Clustering

7.2.1. Problemi con la distanza

7.2.2. Betweness

7.2.2.1. Definizione

7.2.2.2. Calcolo

7.2.2.2.1. Girvan-Newman

7.2.2.3. Come trovare communities

7.3. Partizionamento

7.3.1. Taglio normalizzato

7.3.2. Matrice laplaciana

7.4. Simrank

7.4.1. Base

7.4.2. Con Restart

8. Riduzione della dimensionalità

8.1. Autovettori e autovalori

8.1.1. Definizione

8.1.2. Calcolo

8.1.2.1. Power Iteration

8.1.3. Matrice degli autovettori

8.2. PCA

8.2.1. Rotazione

8.2.2. Riduzione dimensionalità rimuovendo autovettori

8.3. SVD

8.3.1. Struttura

8.3.2. Interpretazione

8.3.2.1. Concetti

8.3.3. Riduzione dimensionalità rimuovendo concetti

8.3.4. Query incrociando concetti

8.3.5. Calcolo dell'SVD

8.3.5.1. Passaggi folli

9. Paradigma Map Reduce

9.1. Traduzione da relazionale

9.1.1. selezione

9.1.2. proiezione

9.1.3. natural join

9.1.4. grouping and aggregation

9.2. Pregel

9.3. Algoritmi su Map Reduce

9.3.1. Moltiplicazione matrice-vettore

9.3.2. Moltiplicazione matrice-matrice

9.3.3. Multiway-join

9.4. Analisi della complessità

9.4.1. reducer size

9.4.2. replication rate

9.4.3. Graph Model

10. Introduzione

10.1. Approssimazione

10.2. TF*IDF

10.3. Principio di Bonferroni

10.4. Funzioni di hash

10.5. Power Laws

11. Calcolo similarità

11.1. Documenti

11.1.1. LSH

11.1.1.1. Banding

11.1.1.2. Signatures

11.1.1.2.1. Matrice Caratteristica

11.1.1.2.2. MinHashing

11.1.1.3. Shingles

11.1.1.4. Combinazioni

11.1.1.4.1. AND

11.1.1.4.2. OR

11.1.1.4.3. Analisi

11.2. Generali

11.2.1. Distanza

11.2.1.1. Distanza euclidea

11.2.1.2. Distanza di Jaccard

11.2.1.3. Distanza di Hamming

11.2.1.4. Edit distance

11.2.2. AND-Combination

11.2.3. OR-Combination

12. Stream

12.1. Stream Model

12.2. Sampling

12.2.1. Dimensione costante del sample

12.3. Filtraggio

12.3.1. Bloom filtering

12.3.1.1. analisi

12.4. Contare elementi

12.4.1. Flajolet-martin

12.4.1.1. Stime

12.5. Stima dei momenti

or Sign Up