יום רביעי, 27 באפריל 2016

298 The history of visual object detection

אנחנו בפודקאסט 298, ה22 במרץ, עם אמרי קיסוס והיום נדבר על ראייה ממוחשבת וזיהוי עצמים.

  • 1:13- אמרי, מומחה בראייה ממוחשבת ובזיהוי עצמים ופנים עובד בFDNA. חברה הקיימת מעל 4 שנים ובעלת אפליקציה לזיהוי מחלות גנטיות ככלי עזר לרופא.
  • 3:40 – אילו בעיות קיימות בזיהוי אובייקטים – בעיית זיהוי פנים (Face detection) נחשב בעיה פתורה אך זיהוי למי שייכות הפנים (Face recognition) - אינה פתורה.
  • בזיהוי אובייקטים שונים מקטגוריות שונות, מייקרוסופט הוציאה מערכת לפני מספר חודשים שהיוותה שיפור משמעותי וגוגל אף שיפרה את אחוזי הזיהוי בחודשים האחרונים.
  • סוג הבעיות שמעוניינים לפתור בזיהיו עצמים בתמונות הם (קישור):
  • 7:35- סקירה היסטורית – התיעוד הראשון של זיהוי עצמים הינו ממחקר של סקינר ממלחמת העולם השנייה –לאמן יונים לזהות מטרות ועצמים ליצירת פצצות מונחות. משנות ה70 זוהי טכנולוגיה צבאית לזיהוי מטרות והטכנולוגיה "אוזרחה" בשנים האחרונות.
  • 10:42 – תחילת העיסוק באיתור פנים – המעבר למודלים מתמטיים מתקדמים ומבוססי סטטיסטיקה – המערכת הראשונה Eigenfaces) 1987)– מערכת המנסה לאתר פנים ע"י בניית צירוף של תמונות פנים קודמות.
איך נסווג פנים - אם נצליח להרכיב את התמונה ממספר פרצופי בסיס קטן - אילו פנים, אחרת הם לא פנים.
  • 13:35- הצעד הבא בזיהוי פנים (1997) – הפנים כגרף של נקודות – כמו ש"מדמיינים" זיהוי פנים. מחלקים את הפנים למאפיינים שיש לכל פרצוף וקבעו אותן כנק' חובה ואת הפרופורציות ביניהן. איתור הפנים – כמציאת התאמה בין גרפים. המודל למרות שנראה מרשים אינו עומד במציאות.
  • 16:47 – בשנת 2001 – ויולה וג'ונס – מצאו שיטה שמהווה פריצת דרך בתחום זיהוי הפנים -   השיטה מתבססת על מציאת תבנית של ניגודיות כגון הניגודיות בין העיניים לגבות ואם מספיק תבניות התאמתו כתבניות המתאימות לפנים המערכת מסווגת את התמונה כפנים. מודל יותר סטטיסטי והיוריסטי. דוגמא לטעויות באלגוריתם ניתן לראות ממצלמה של HP ב2009 שלא זיהתה פנים של אנשים כהי-עור.
  • 24:40 – ב2014 יצא מאמר Head Hunter שהראה שבפועל לא הייתה התקדמות משמעותית למרות אלגוריתמים רבים שנוצרו.
  • 25:39- Deep Learning– הקפיצה הבאה שנעשתה בתחום זיהוי הפנים. הDeep Learning  מאפשר לאמן את המערכת עם כמות הרבה יותר גדלה של תמונות מאשר אלגוריתמים קודמים. באלגוריתמים אלו, קשה יותר לרמות את המערכת – נעשה נסיון של Cornell Tech שלא הצליח לשבור את האלגוריתמים.
  • 30:45- שיוך פנים לאדם – המאמר 2014  Deep face – המאמר מוציא מאפיינים לכל אדם לפי מספר תמונות. המערכת מחשבת וקטור של הסתברויות לכל אחד מהפרטים בתמונות. השלב הראשון הוא Feature extraction ולאחר מכן משליכים את התוצאות על שאר התוצאות בTraining set.  כיום מספיק כ3-5 תמונות בכדי לזהות אדם באופן טוב.
  • 34:10- שימוש נוסף, זיהוי הבעות על ידי זיהוי נק' על הפנים.
  • 34:57 – זיהוי פנים לא באופן פרונטלי – זהו אתגר שפחות מטפלים בו ומעדיפים להתמקד בפנים "לא סטנדרטיים" כגון מייקל ג'קסון ומחלת הזיקה.

תודה רבה לחן סלומון על התקצור. הקובץ זמין כאן להורדה.

אין תגובות:

הוסף רשומת תגובה