
למה תמיד כשאנחנו משתמשים בUMAP, קלאסטרים עם אותה כמות נקודות נראים באותו הגודל?
השבוע ב-explAInable, מייק והילה צללו לשיטת הויזואליזציה UMAP, שנחשבת לחדשנית ביותר בתחום ומשמשת רבים מאיתנו בהדמיה של נתונים ממימד הגבוה למרחב הטלה של דו-מימד (או תלת-מימד). ניתחנו את משמעות השם של השיטה, ובדקנו איך הנחת התפלגות האחידה שלנו המהווה את הבסיס להטלה במימד הנמוך יכולה לשבש לנו את התוצאות.
האם אנחנו באמת יכולים לסמוך על צפיפות הנקודות במרחב ההטלה, האם יכול להיות שאנומליות ימסו לנו לקלאסטרים המרכזיים? כל זאת ועוד - בפרק!
לינק לקוד הפתוח של UMAP, שכולל הטמעה של densMAP:
https://github.com/lmcinnes/umap
לינק למאמר של UMAP בארכיב (עדכון אחרון של המאמר ב-2020):
https://arxiv.org/abs/1802.03426
בואו להתארח אצלנו כמומחים בפרקים הבאים:
https://forms.gle/JQM2zTmeY6cp58AA9
פרקים
00:00 מתי קווים מקבילים יפגשו?
00:51 היי UMAP, שמור לי על שכנים קרובים ונקודות רחוקות בבקשה!
02:26 החשיבות העסקית של ויז׳ואליזציות בעלות משמעות
03:19 עושים decoding לשם השיטה.
04:55 איך UMAP עובד מתמטית
07:54 אוי לא, הנחת ההתפלגות האחידה מסבכת אותנו!
08:46 האם הויזואליזציות שאנחנו מייצרים משקרות לנו?
11:00 שיפורים של UMAP להתמודדות עם צפיפות משתנה