למידה עמוקה שימושית

Laten we beginnen. Het is Gratis
of registreren met je e-mailadres
למידה עמוקה שימושית Door Mind Map: למידה עמוקה שימושית

1. Unconditional generative models

1.1. Auto Encoder

1.2. Generative Latent Optimization

1.2.1. לומדים ישר את הקוד

1.3. Perceptual loss

1.3.1. מרחק בין תמונות ע"י אקטבציה מVGG

1.4. VAE

1.4.1. הקוד מתפלג גאוסיאנית -התפלגות צפופה, אפשר לדגום

1.5. Adversarial Training

1.5.1. אימון במקביל של שתי רשתות. אחת יוצרת ואחת מסווגת

1.6. DCGAN

1.6.1. הראשון

1.7. מרחק וסרשטיין

1.7.1. מרחק בין התפלגויות שהוא לא מתפוץ. מילוי הרים ובורות

1.8. WGAN

1.8.1. גאן שמשתמש במרחק וסרשטיין

2. Conditional generative models

2.1. U-net

2.1.1. חיבור בין שכבות מקבילות

2.2. Pix2Pix-

2.2.1. שינוי מקומי - טקסטורה, מתאמן על פאצים. מקבל גם תמונת קלט וגם פלט

2.3. PatchGAN,

2.4. Pix2Pix-HD

2.4.1. אימון רזולוציה נמוכה , רשת מעלה רזולוציה , הכל ביחד ושוב

2.5. Cycle-Constraint

2.5.1. התרגום של התרגום חוזר למקום. קלט ופלט קשורים ולא רק התפלגויות מתאימות. דורש מיפוי אחד לאחד (לא באמת קורה. מצליח מבאג בגאנים)

2.6. CycleGAN,DiscoGAN

2.6.1. מתתמשים באילוץ המעגלי. סייקל פאצים נפרדים- טקסטורה ברזולוציה גבוהה. דיסקו גלובלי ברזולוציה נמוכה

2.7. MUNIT

2.7.1. לא מחייב סייקל (אחד ל1) מפריד לצורה וסטייל. מחליף סטייל ויוצר חדש.

2.8. ONE-SIDE-GANS

2.8.1. אילוץ ששתי תמונות דומות יהיו דומות גם בדומיין השני

2.9. Contrasite learning-CUT

2.9.1. במקום המעגלי - זוגות / פאצים יצאו הכי דומים מכל השאר

2.10. גאנים אם רגולריזציה

2.10.1. גאן עושה תמונה ראליסטית, אבל לא בטוח קשורה. ולכן מוסיפים L1 או L2 לפעמים

3. Disentanglement

3.1. BetaVAE

3.1.1. אוטו-אנקודר עם אילוץ למימדים מופרדים (גאוסיאן)

3.2. LORD

3.2.1. אין קורלציה בין הידועות ללא ידועות. צוואר בקבוק שמאלץ מינימום מC ועדיין למפות טוב. אם יש קורלציה לפעמים אפשר להתגבר בהכנסת תמונות עם טרנספורמציה,

4. Word embedding and translation

4.1. Word2Vec-

4.1.1. מקודד מילים , משימת הלימוד היא חיזור הקונטקסט או להפך

4.2. דגימת פאולו

4.2.1. דוגמים לפי שורש התדירות (איזון בבאלנס)

4.3. FastText

4.3.1. מימוש מהיר , לוקח גם חלקי מילה

4.4. Word Vector Translation

4.4.1. מעבר בין שפות הוא מטריצת סיבוב

4.5. ICP

4.5.1. איטרטיבי, זוגות , שיפור מטריצה וחזור

4.6. MBC-ICP

4.6.1. התאמה לאתחול צירים ראשיים (יכול להיות הפוך מנסים כמה פעמים) . קריטריון התכנסות מרחק קטן

5. Transformers for everything

5.1. Vision Transformer (ViT)

5.1.1. חילקו תמונה ל16*16 , פחות אינדקטיס ביאס צריך יותר דוגמאות

5.2. DIET: Reducing Pretraining Requirements

5.2.1. שני תטרות סיווג אמיתי ותוצאות VGG (קל יותר לרשת) , פקטורים על שכבות שנותו לדלג עליהם (לכל צאנל)

5.3. Tokens2Token

5.3.1. 4 על 4 מסדרים כמו תמונה עם חפיפה קטנה ויוצר ערבוב

5.4. Pyramid Transformers

5.4.1. משתמשים בפירמידה - נותן להגדיל רזולוציה

5.5. SWIN-

5.5.1. חלונות ואטנשיין רק בתוך חלון, מחפלים חלונות

5.6. DETR

5.6.1. איתור אובייקטים

5.7. CLIP: General Image and Sentence Matching

5.7.1. גם תמונה וגם משפט (אימון על הכי טוב במיניבאצ)

6. Explainability

6.1. LIME-

6.1.1. מיצוע לינארי על כל פיצר משינויים (בנקודה)

6.2. Salience Maps

6.2.1. גראדיאנט מהפיקסל לסיווג

6.3. CAM

6.3.1. מהשכבת אקטבציות האחרונה למה הקלסטרים ?( במאת לינארי)

6.4. GRAD CAM

6.4.1. מהקטבציות עושים השלכה אחורה ואז יותר רזולוציה

6.5. Explaining layers

6.5.1. תיוג ברמת הפיקסל. בודקים אם בשכבה רואים תבנית - לא תמיד יש

6.6. Dissecting Generative Models

6.6.1. מבינים מה שכבה עושה בגאן ואז אפשר לשחק להעלות להוריד את הייצור של זה

7. Adversarial Attacks

7.1. שינויים קטנים מכוונים שגורימים לטעות

7.2. מכניסים אותצן לדאטא סט מוריד את הביסוצים

7.3. שורד הדפסה

7.4. משפקיים שמרמות זיהוי פנים

8. Image Recognition

8.1. SIFT

8.1.1. קלאסי. נקודות עניין. סיווג

8.2. AlexNet

8.2.1. Relu, local normalization, drop out

8.3. VGG

8.3.1. עמוק, פילטרים 3*3

8.4. ResNet

8.4.1. skip-connection, batch-norm,

8.5. WideResNet

8.5.1. יותר צ'אנלים במקום עומק

8.6. ResNext

8.6.1. פיצול הרשת ליעילות החישוב

8.7. DenceNet

8.7.1. סקיפ קונקשיין לכולם

9. Object Detection

9.1. קלאסי

9.1.1. region prposals. non-maximal-suppression, סיווג

9.2. R-CNN

9.2.1. הוצאת פיצרים קלאסית, סיווג ברשת, פרדיקציה לכל אזור- איטי

9.3. Fast R-CNN

9.3.1. תמונה שלמה פעם אחת. רשת נוספת מאקטיבציות מתקדמות

9.4. Faster R-CNN

9.4.1. גם איתור האזורים ע"י רשת. שימוש באנקורים.

9.5. Mask R-CNN

9.5.1. לצבוע את האובייקט בריבוע. עוד ראש סיווג בינארי

9.6. FCOS

9.6.1. רשת אחת מקצה לקצה. פירמידה לריבוי קלסים לפיקסל

10. דיבור ואודיו

10.1. קלאסי

10.1.1. חלונות , פוריה, קיבוץ, לוג, מסווג

10.2. Deep acoustic models

10.2.1. הכל פולי-קונט. לא משתמש בלוקליות

10.3. CL-DNN

10.3.1. מוסיף קונבולוציה וLSTM, התחשבות גם קרוב וגם רחוק (הרמוניות)

10.4. קצה לקצה

10.4.1. לא לומדים רק מהספטוגרמה אלה מהתחלה, יותר גאמא טון דומה למה שיש באוזן

10.5. Audio Generation

10.5.1. קשה. המון בשניה

10.6. PixelCNN-

10.6.1. יצירת הספקטוגרמה פיקסל פיקסל (אוטורגרסיבי)

10.7. WaveNet

10.7.1. מייצר אודיו. קונבולוציה?

10.7.2. Dalated convoloution כל רמה לוקחת שתיים קודמות וככה חולש על הכל (אבל דוגם)

10.8. WaveRNN

10.8.1. מייצר עם RNN- עובד גם טוב

10.9. Tacotron-

10.9.1. טקסט לספטטוגרמה

11. Language Models

11.1. Feedforward Language Models

11.1.1. שרשור ופולי קונקט - אין לוקאליות וסימטיות

11.2. Recurrent Neural Networks

11.2.1. כמו המודל המרכובי החבוי יוצר פלט ומצב להמשך. מתפוץץ או נעלם כי מכפילים באותו דבר

11.3. LSTM Language Models- Different Gated Recurrent Cells ,GRU Block

11.3.1. חלק זוכר וחלק שוכח. מאפשר קלטים ארוכים יותר

11.4. Transformers-

11.4.1. כל המשפט ביחד. מפתח שאילתא וערך לפונקציית הסתברות

11.5. Positional Encoding

11.5.1. מכניסים את המיקום בסינוס או קוסינוס

11.6. GPT-3

11.6.1. מודל שפה (לא משימה ספיצפית) ענק

11.7. BERT-

11.7.1. קידוד למשפט, המשימה לימוד משפטים עם משסכות טעיות רגילים. פיטיוניג לאחרים.

11.8. MT5

11.8.1. אוטואנקודר ענק. כמה שפות ואפשר לעשות פינטיוניג קטן למשימות מאחת לשניה

12. Self-Supervised Learning

12.1. לימוד פיצרים בלי תיוג

12.2. משימות שמאפשרות את זה

12.2.1. Puzzle Learning

12.2.2. Image Colorization

12.2.3. Video prediction

12.2.4. RotNet

12.3. simCLR

12.3.1. שתי אוגמטציות וצריך לצאת הכי קרוב מכל השאר

12.4. MoCo-

12.4.1. למידה נגדיר עם מיניבאצ שמתעדכן לאט (חוסך זיכרון וצורך לעדכו)

12.5. SimSiam

12.5.1. משימה הכי בסיסית, זוגות של תמונות לומדים את את השני

13. Anomaly Detection

13.1. Autoencoder for Anomaly Detection

13.2. RotNet for Anomaly Detection

13.3. SOTA Deep kNN methods

13.3.1. KNN על האקטיבציות

13.4. PANDA-

13.4.1. טיוב לסוטה. צמצום הפרמטרים ותוך כדי חובה שיתייגו טוב. מתכנס לנקודה אבל עוצרים לפני

13.5. Anomaly Segmentation

13.5.1. מזהים איפה בתמונה החריגה משהו עם מירמידה ואקטיבציות עליה