447 NLP challenges with Inbal Horev from Gong

[קישור לקובץ mp3] 
הפעם אנחנו מארחים רגע לפני פתיחת שנת הלימודים את ענבל חורב מחברת Gong לשיחה על NLP.
(רן) למעשה, דיברנו על NLP ממש-ממש מזמן, ומאז NLP השתנה בגדול, פחות או יותר הכל השתנה...
 
אז רק נעשה רפרנס קטן לפרק שעשינו עם פרופ’ יואב גולדברג, חוקר ידוע בתחום [296 NLP with Yoav Goldberg, אי שם באפריל 2016 - והיה ב-2021 בעניין דומה גם את 401 AutoML at outbrain with Assaf Klein] - שם ממש דיברנו על דברים מאוד ב-High-Level - והיום אנחנו נדבר על אתגרים מעניינים בתחום ה-NLP, בעיקר מהעבודה היומיומית של ענבל.

ולפני כן - שלום ענבל! ככה, בשתי מילים, עליך ועל החברה?
  • (ענבל) אני עובדת ב-Gong כבר חמש שנים
    • התחלתי בסוף 2017 - והייתה קפיצה ענקית ב-NLP במהלך 2018, אז ממש יש את ה”לפני” ואת ה”אחרי” . . 
    • (רן) בתקופה שבה Transformers הייתה סדרת טלויזיה ובובות . . . .
    • (ענבל) בדיוק . . . ולפני ה-Transformers, קראו לזה גם Sesame Street Models - כי היו את ELMo ו-BERT . . .
      • ומצאתי לפני כמה חודשים איזו טיוטא של מייל שכתבתי בזמנו למנהל שלי: “תקשיב, קראתי איזה מאמר ממש מעניין - מודל שקוראים לו ELMo, ונראה לי שזה ממש ממש יכול להקפיץ לנו את הביצועים בכל מיני דברים” וזה . . . 
    • (רן) הוא מיד בדק האם זה 1 באפריל היום . . . . [איפה זהר?]
    • (ענבל) לא נשלח - לא נשלחה, הטיוטא הזו . . . 
      • אבל זה היה מצחיק לקרוא, כי זה מייל מאוד נאיבי - אבל זה באמת “הרעיד את עולם ה-NLP” 
      • באמת ה-Transformer-ים האלה “נותנים בראש”.


(רן) אז אולי באמת נגיע גם לדבר עליהם קצת אחרי זה - אבל אולי עוד קצת עליך ועל הרקע שלך?
(אורי) איזה Transformer [כזה] את, דרך אגב?
(רן) חייב . . . .
  • (ענבל) הייתי משחקת . . . אהבתי את הרובוטריקים כשהייתי ילדה.
  • אז אני עושה Machine Learning כבר הרבה מאוד זמן -
    • למדתי בטכניון פיסיקה והנדסת חשמל ואחר כך המשכתי למכון וייצמן - ועשיתי גם שם תואר שני במדעי המחשב, עם התמחות ב-Machine Learning . . . .
    • אחר כך עשיתי כמעט-דוקטורט באוניברסיטת טוקיו - גרתי שם שנתיים-וחצי 
      • אם תרצו פודקאסט על יפן אז אפשר גם את זה.
  • (רן) למדת יפנית? (אורי) יותר יפנית מיפנית . . . .
    • (ענבל) בזמנו לא הצלחתי לתקשר מחשבות מורכבות ורגשות - אבל להזמין מקום במסעדות וליום-יום אז . . . 
    • (אורי) בצעקות? . . . .
    • (ענבל) אפילו בטלפון - יצא לכם ללמוד שפה זרה? ולנסות לעשות שיחת טלפון? . . . . זה מפחיד.
    • (רן) כן . . . .  זה קשה.
      • הצלחתי להזמין, נגיד, מלון בספרדית - אבל זה לא היה פשוט . . . 
    • (ענבל) כי לא רואים . . .  לא קוראים שפתיים, לא רואים שפת-גוף - זה מדיום מאוד לא-סלחני.
  • אז חזרתי מיפן - וממש קצת אחרי זה התחלתי לעבוד ב-Gong
    • והאמת שלא ידעתי מה החברה עושה . . .  הגעתי ביום הראשון שלי לעבודה ושאלתי את המנהל שלי
    • אמרתי לו “תגיד, עומרי - מה אנחנו עושים?” . . . - והוא צחק והסביר לי
      • (רן) “בשביל זה שכרנו אותך - כדי שתגידי לנו מה לעשות” . . . .
    • (ענבל) בדיוק . . . 
  • אז מה אנחנו עושים, מה Gong עושה? אז אנחנו בנינו - בונים וממשיכים לבנות - מוצר שמנתח אינטראקציות עסקיות
    • שיחות עסקיות עם לקוחות קיימים ולקוחות עתידיים
    • זה פחות “סלקום שלום! אפשר לעניין אתכם בחבילה?” . . .  - זה ממש תקשורת שיכולה להימשך חודשים, זה יכול לקחת שנה . . . 
      • שמדברים עם כל מיני גורמים בתוך החברה הזו - עושים Demo-ים, עושים Pilot-ים - באמת תהליכים מורכבים.
      • ואנחנו מקליטים ואוספים את המידע הזה - משיחות מדוברות, מתוך מיילים, מתוך ערוצים אחרים של תקשורת כתובה
      • שמים את זה במקום אחד - שזה כבר נותן ערך, מעצם זה שרואים מה קורה
      • ועל גבי זה נותנים שכבות שונות של תובנות ושל המלצות ושל . . . 
(רן) אני יכול להגיד נגיד שאצלנו בחברה, Gong זה פועל - כמו “לגגל” - אז “עברתי על ה-Gong שלהם” . . .  אנשי מוצר ואנשי Customer Success עושים את זה חדשות-לבקרים, זה כלי מאוד מאוד שימושי אצלנו.
  • (ענבל) איזה כיף.

(רן) אוקיי, אז בעצם באנו ככה - עכשיו כשהכרנו אותך ואת Gong ממש בקטנה - באנו לדבר על “מה חדש ב-NLP?”
לא נספיק לכסות את כל מה שקרה בשבע השנים האחרונות - אבל אולי נבחר כמה נקודות מעניינות, ובעיקר ככה מהיום-יום שלך. אז . . .
(אורי) מה נשמע? מה חדש? מה קורה? . . . .
  • (ענבל) מה חדש? . . . .
(רן) אולי נתחיל ב”מה הם האתגרים, נכון להיום” - אילו אתגרים מעניינים יש לפצח?
  • (ענבל) יש מלא אתגרים . . . . המודלים האלה - אנחנו לא תמיד מבינים מה בדיוק הם עושים ואיך אנחנו יכולים, ככה, “לעזור להם לעזור לנו” לפתור בעיות.
  • אם יש לנו, למשל, מודל שמטרתו לזהות סימני אזהרה בעיסקה - כשאנשים לא מרוצים, כשאנשים מקפיאים את העסקה, כשהם אומרים “Don’t call us - we’ll call you”, ואנחנו רוצים להציף את זה . . . 
(אורי) או כמו שאומרים - “ . . . . Interesting
  • (ענבל) כן, אבל זה תלוי באיזו מדינה . . . 
(אורי) נכון . . . .
  • (ענבל) . . . . ומכאן המורכבות - יש לנו אולי לקוחות אמריקאים ויש לנו ישראלים, שמדברים *ממש* אחרת . . .
    • היה לנו מקרה כזה, כשניסינו להעביר . . . . לבנות מודל כזה בגרמנית
    • ולא הצלחנו להבין למה הוא לא עובד - למה לא הצלחנו  . . . למה . . . איפה הייתה הבעיה?
    • ועבדנו עם המתייגים שלנו - הגרמנים - והגענו להבנה שפשוט גרמנים עושים עסקים אחרת . . . 
      • וזה פשוט נראה אחרת - ואם מנסים “לתרגם” את המודל מאנגלית לגרמנית זה פשוט  . . . זה לא עובד.
(אורי) אבל אולי אין Data “גרמני” . . . המתייגים הם גרמנים שיודעים  . . . 
(רן) אני אנסה להגיד את זה בשפה שלי, נראה אם אני מבין: את אומרת שאני, כשאני בונה מודל - יש לי איזה-שהן הנחות יסוד, יש לי Case, יש לי מה שנקרא Bias ב-Machine Learning, יש לי איזשהו Bias - אני מניח שככה עושים עסקים ולכן אני בונה מודל בצורה כזאת. אבל אם מראש הנחות היסוד האלו - כמו למשל שכשאני מציע הצעה והוא אומר לי כן או לא, אז אני מניח שזה הפרוטוקול - ובגרמנית זה פשוט לא עובד ככה . . . . 
(אורי) רגע, אבל השאלה היא האם כשאתה אומר “אני בונה מודל” - או “אני מאמן מודל”, כי המאמנים הם גרמנים . . .
  • (ענבל) אז יש לנו מיליוני מיילים - אני רוצה להגיד “ביום” אבל אולי זה בשבוע, אל תתפסו אותי בסדרי הגודל - בגרמנית
    • ואם אנחנו נדגום באקראי את המיילים האלו, כדי לבנות Training Set בגרמנית, אז סביר שאנחנו לא נתפוס הרבה “נורות אדומות” כאלה.
  • עכשיו, יש לנו מודל באנגלית - שעובד, ויש מודלים שהם מקודדים כמה שפות
    • לא זוכרת אם אלה Google או Facebook ששחררו בשבוע שעבר מודל שתומך בעוד 40 שפות בפנים - אז יש לזה תמיכה במעל 40 שפות בתוך אותו המודל [Meta Open-Sources 200 Language Translation AI NLLB-200].
    • אז אפשר לאמן אותו עם ה-Data-Set המתוייג באנגלית - ואז להשתמש בו כדי לעשות פרדיקציות (Predictions) בגרמנית
      • ולנסות ככה “לדוג” מיילים שיש להם את התוכן הזה שאנחנו מחפשים.
      • להעביר אותם דרך מתייג אנושי - ואז לאמן את המודל עם Data-Set בשתי השפות.
(אורי) אבל את אומרת שה-Domain של הבעיה “מתנהג אחרת” - כאילו, “עסקים” זה . . . 
  • (ענבל) אז לא ידענו את זה לפני  . . . לא הבנו למה אנחנו לא מצליחים “להעלות בחכתינו” באופן הזה, שעבד בשפות אחרות, על בעיות אחרות . . . לא הצלחנו לתפוס את “הנורות האדומות” האלה בגרמנית.
    • אבל רק כשממש הסתכלנו לעומק על ה-Data עם המתייגים ו”שברנו את הראש” אז הבנו את זה.
(רן) זאת אומרת שהתחלנו בבעיות NLP, אבל למעשה מדובר פה על איזשהו “פער תרבותי”, איזשהו הבדל תרבותי משמעותי - ש-NLP זו אחת ההתבטאויות שלו-  ש-Natural Language זה אחד הביטויים שלו - אבל למעשה זהו הבדל תרבותי משמעותי.
דרך אגב, אני מניח שזה קיים גם בתרבויות אחרות שאולי פשוט לא הגעתם אליהן - אני מנחש שזה יכול לקרות גם בסין וביפן ובמקומות אחרים שקצת יותר רחוקים מאיתנו תרבותית. דווקא לא הייתי מנחש שגרמנית, דרך אגב . . . .
(אורי) אני דווקא חשבתי על גרמנית באספקט אחר, שגם לי יצא “לחפור” מעט . . .
(רן) . . . שהמילים כל כך ארוכות . . . זה מורכב מכמה מילים . . . 
(אורי) זה לא שהן ארוכות - הן מחוברות ביחד, ואז יוצאת לך כמות אדירה של פרמוטציות (Permutations) של מילים ש . . .
(רן) כל כך הרבה  Vowels וכל זה . . . 
(אורי) כן
  • (ענבל) כן, גרמנית זו שפה שלא ניסיתי אפילו ללמוד - אז יכול להיות שמה שאני אומר פה הוא לא מדויק.
  • אבל בכניסה לתוך המודלים הגדולים האלה, לוקחים את המילים ומפרקים אותן ליחידות קצת יותר קטנות שנקראות Token-ים
    • ואז, אם המודל הזה רואה מידע שהוא לא הכיר אף פעם, שהוא לא פגש אף פעם - אז הוא מחלק את זה למעיין תתי-מילים כאלה ו . . . 
(אורי) השאלה היא פחות או יותר איפה הוא יודע לחתוך - זה קצת כמו לחתוך DNA . . . 
  • (ענבל) אז בגרמנית, בגלל שיש את המבנה, את הקומפוזיציה הזו, אז אני מניחה שה-Tokenizer-ים יודעים לחלק איפה שצריך.
  • ואם אני כבר אני מעלה את הנושא הזה - אז המשאבים שיש ב-NLP באנגלית הם בסדרי-גודל יותר מאשר בשפות אחרות . . . 
    • זאת אומרת שכל עוד אתם נשארים באירופה” - אז בסדר
    • וסין כנראה שנתנה חיזוק ל-NLP בשפה הזאת . . . 
    • אבל עברית, ערבית . . . . אולי ביחידות המודיעין שלנו יודעים להתמודד עם זה, אבל . . . 
    • (רן) אחרי שיסיימו עם פרסית, כן . . . . [צחוק בצד - כש”יפרוץ השלום” זו יכולה להיות תרומה משמעותית לעולם…]

(רן) בסדר, אז ככה ממש . . . לא נוכל לעבור על כל אתגרי ה-NLP נכון להיום, אבל הנושא התרבותי / סמנטי הוא ללא ספק אחד מהם.
אילו עוד אתגרים יש, ככה ביום-יום, כאלה שאת נתקלת בהם?
  • (ענבל) הנושא הזה של אינטרפרטביליות (Interpretability) של המודלים האלו, ולהבין למה הם עושים את השגיאות [בכוונה?]
  • מה יעזור להם לבצע יותר טוב? מהו הידע הזה שהם “מחזיקים” בתוך המטריצות הגדולות האלה? . . . 
(רן) כלומר, מודל ממוצע - כמה פרמטרים, פחות או יותר, יש לו? אנחנו מדברים על סדר-גודל של מיליארדים?
(רן) בסדר . . . . ואם יש איזשהו Bug באחד הניורונים באמצע - מאוד קשה למצוא אותו . . . 

(אורי) יש לי שאלה - זה התפקיד שלי פה . . .  אינטונציות (Intonations) - זה משהו ש . . . .
(רן) אפילו בשאלה הדגמת את השאלה: אינטונציות?: . . . .” - זהו, אל תאמר עוד מילה . . . 
(אורי) . . . . זה יכול להיות Signal?
  • (ענבל) חד משמעית  . . . .
(אורי) אוקי . . . אגב, זה מאוד קשור לתרבות, כן?
  • (ענבל) זה באמת מאוד תלוי-תרבות ומאוד קשה לקודד את זה.
  • אבל כשאנחנו - בני אדם - רוכשים שפה או בכלל הבנה על מה שקורה סביבנו, אז אנחנו לומדים שפה לצד ראייה, אנחנו לומדים שפה לצד שמע . . . 
    • וחיזוק חיובי או שלילי . . . 
  • אז יש כל מיני מה שנקרא מודאליות (Modality) - שאפשר להכניס מקורות מידע כאלה ואחרים כדי לחזק את ה-NLP או  . . . .
(רן) אוקיי, זה אפשרי תיאורטית - אבל עושים את זה, בפרקטיקה? יש אילו-שהן אנוטציות (Annotation) מעל מילים? “הנה, הוא עשה תנועת-גוף כזאת” או “הנה - הוא עשה פרצוף כזה”?
(אורי) או סתם איזשהו שינוי של הסאונד או  . . . .כאילו,  “המוסיקה של הדיבור”.
  • (ענבל) אצלנו לא עושים את זה, מתוך בחירה . . . מתוך הבנה שאי אפשר לעשות הכל.
  • בגלל שהדבר הזה הוא כל כך תלוי-תרבות וכל כך רגיש - אז זה לא המקום להשקיע בו את האנרגיה שלנו, כרגע.
(רן) כן, ובוא נאמר: רוב - אני מניח - רוב ה-Data של המתאמנים הוא Data טקסטואלי, אוקיי? בעולם, לפחות ה-SoTA שאותם הזכרת - ככה שגם לא היו יכולים לעשות את זה.
  • (ענבל) זה בכלל . . . . אם מדברים על אתגר - זה חתיכת אתגר.
  • אני לא יודעת אם יצא לכם לראות תמלול של שיחות - אבל זה ג’אנק . . . .[1+ על זה…]
    • אני מאוד מודעת לזה עכשיו, בחמש השנים שאני עובדת ב-Gong, אז אני משתדלת להשלים משפטים [אכן - ותודה!]
    • אבל רובנו לא - אנחנו מגמגמים ואנחנו . . . [לתמלל את השיחה הזו זה לגמרי מטא . . . ]
    • עזבו, גם אם היינו מדברים בשפה שהיא תחבירית ומתחילים ומסיימים משפטים, אז יש כל מיני ידע שהוא . . . 
    • נגיד, אני אדבר . . . אני אתייחס למשהו שדיברתי עליו לפני חמש דקות - אתם מבינים כי אתם זוכרים . . . 
(רן) יש Context . . . 
  • (ענבל) יש Context, בדיוק.
  • אז חוסר-תחביריות, חוסר-Context . . . 
(אורי) אל תניחי שאנחנו זוכרים . . . 
  • (ענבל) אני מקווה . . . 
(אורי) אנחנו כבר בגיל  . . . 
  • (ענבל) אז זה באמת - זה אתגר ענקי.

(רן) אחד הדברים המעניינים שככה יצא לנו לדבר עליהם לפני השיחה זה שאתם לא עושים רק NLP, אתם בעצם עובדים גם עם בני אדם, אוקיי? ויש איזה-שהם יחסי גומלין בין המכונה לבין בני האדם.
  • (ענבל) כן . . . 
(אורי) תלוי מה הטמפרטורה של ה-Datacenter . . . 
  • (ענבל) זה נכון . . . 
  • אבל זה באמת אחד העקרונות - ה-עקרון - שמוביל אותנו ב-Gong בכל הנושא של NLP
    • זה שאנחנו לא פותרים בעיות-לשם-פתרון-בעיות
    • אנחנו רוצים להביא ערך ללקוחות שלנו
    • וזה הפוקוס שלנו - האנשים
  • וזה מאוד מעניין לראות איך הם עושים אינטראקציה עם ה-AI - אני מרגישה שאנשים מפחדים ומאמינים ואוהבים AI במידה שווה, בערך.
(רן) והאנשים שאיתם אתם עובדים אלו למעשה בדרך כלל אנשי-מכירות, נכון? והם - יש להם מכונה שאולי יודעת לתמלל ואולי להוציא איזה-שהם Action Items מהשיחה וכו’ - ואת אומרת “הם מאמינים ומפחדים במידה שווה”?
  • (ענבל) אני פחות יודעת האם הם, באופן אישי, מפחדים - אבל אני שומעת, משיחות עם חברים שלי . . . 
  • עליית המכונות” זה צמד-מילים שאני שומעת פה ושם.
  • הדוגמא שאתה מתייחס אליה - ה-Action Items - אז דמיינו שאתם אנשי מכירות ויצאתם עכשיו משיחה של שעה עם לקוחות
    • הלך לכם טוב, מעולה - אתם באנרגיות גבוהות . . . .
    • אין לכם כוח עכשיו לרשום סיכום של השיחה וממש לא בא לכם לכתוב רשימה של כל הדברים שאתם צריכים לעשות כ-Follow-up לשיחה הזאת.
  • אחד ה-Feature-ים לדעתי-הכי-פופולאריים, לפחות באיזור הזה של המוצר, הוא ה-Feature הזה, שמזהה Action Items - 
    • אז ירדתם מהשיחה, אתם מקבלים לינק לשיחה - ומסכמים לכם את כל ה-Action Items שהבטחתם.
  • אשת-Product דיברה עם איזשהו לקוח בשבוע שעבר והיא סיפרה לי - 
    • היא אמרה לי “את יודעת, זה די מדהים - ירדתי עכשיו משיחה עם מישהו שאמר לי שהוא מאוד אוהב את ה-Action Items, את ה-Feature הזה”
      • והוא יודע שכשהוא אומר מילים מסויימות - כשהוא אומר “Let me follow up with you next week”, למשל - אז המודל תופס את זה, המכונה תופסת
      • אז הוא משתדל לדבר ככה - הוא משתדל להגיד את המילים האלה, כדי לסמן . . .
(אורי) . . . כדי “לעזור למכונה”  . . . 
(רן) . . . “לעזור למכונה לעזור לו”, למעשה . . . . כן. זה קצת מזכיר לי את הסיפור על Google, שפעם כולנו היינו הולכים ומחפשים בשפה מאוד יפה, ככה “אבשלום-קורית”, בתיבת החיפוש - עד שהבנו שכל מה שצריך זה איזשהו “Bag of Words”, כמה מילים לזרוק פנימה ובסדר - Google כבר יבין . . . אני לא באמת צריך לסדר אותן בסדר הנכון, זה ממש לא משנה - זה לא צריך להראות כמו משפט וזה בטח שלא צריך להיראות כמו שאלה . . . 
(אורי) אבל זה, כאילו . . .  אתה “זורק רמזים” לעולם סביבך, אתה משאיר קליפות תפוזים” על הדרך . . . .
(רן) כן . . . 
(רן) כן . . . לגמרי  . . . זה מוזר, אני לגמרי . . . אבל זה כאילו נותן תחושה שאולי זה עמק המוזרות” שם, אבל זו סוג של תחושה. כאילו, אם אני כותב אז אני באמת לא צריך לכתוב - אבל כשמדברים, אז אולי יש שם מישהו, אולי יש שם איזו ישות כזאת . . . 
(אורי) השאלה איך זה בנהיגה . . . 
  • (ענבל) אבל אין לי אוטו! אז זה  . . . הגעתי עד כאן ברכבת . . . 
(אורי) חוץ מזה שאין רכבת עכשיו . . . .
  • (ענבל) אין רכבות עכשיו . . . בסדר.

(רן) אז זהו - יחסי-הגומלין האלה מאוד מעניינים. יצא לך לראות עוד סיטואציות? זאת אומרת - נגיד עם ה-Taggers או אנשים אחרים שהם ככה בתוך ה-Loop, שראית יחסי-גומלין מעניינים בין האדם לבין המכונה?
  • (ענבל) בהחלט
  • יש לנו עוד איזה Feature די גדול, שבעצם מאפשר למשתמשים שלנו לאמן את המודל שלהם בעצמם.
    • אז למשל - חברה א’: מאוד מעניין אותה לשמוע ולזהות בשיחות את כל המקומות שבהם מדברים על המתחרים שלהם, ומתייחסים למהירות השירות שלהם.
      • זה משהו שהוא מאוד ספציפי לחברה הזאת
    • ומי מכיר את המידע של הלקוחות שלנו יותר טוב מהלקוחות עצמם? . . . 
  • אנחנו הגענו לשלב כזה - ב-NLP בכלל אבל גם ב-Machine Learning . . . ב-NLP בפרט וב-Machine Learning בכלל - שהמודלים טובים . . . 
(רן)  . . . עכשיו את עוזרת למכונה, נכון? את מדברת על הכללה . . . [רגע, למה אתה מנסה לרמוז כאן?]
  • (ענבל) כן . . . המודלים טובים - מה שמשנה עכשיו זו איכות ה-Data שמשתמשים בו כדי לאמן אותם.
  • אז זה בעצם Win-Win - הלקוחות מקבלים את היכולת לזהות את מה שמעניין אותם
    • וגם הם מקבלים בעצם מודל יותר טוב - כי ה-Data שהם סיפקו הוא יותר טוב.
(אורי) זאת לא אמירה שהיא, וואלה - תמיד נכונה ב-Machine Learning? במיוחד היום, כש . . . . בכלל, הנדסת-המודלים די “בוגרת”, ורק עבודה על ה-Data כאילו - משחקים ב-Feature-ים, טיובים של ה-Feature-ים וכאלה . . . .
  • (ענבל) אז אנחנו כבר לא עושים Feature-ים . . . 
  • זאת אומרת, ה . . . אחד הדברים הלא-כל-כך-טריויאליים במודלי-שפה הענקיים האלה זה שלא עשינו Feature Engineering
    • והאמירה הזאת - ש”ה-Data זה מה שחשוב” - היא תמיד הייתה נכונה
    • אבל לפני 2018 - “הקפיצה הגדולה” הזאת - המודלים לא היו כל כך טובים, כאילו . . . .
    • רגרסיה - Logistic Regression, אני תמיד מתבלבלת בין זה לבין Linear Regression, וזה לא אותו הדבר בכלל - יש לה . . . 
      • זה מודל מאוד פשוט עם ביצועים לא רעים בכלל, אבל . . . 
(אורי) אבל הוא בסיסי . . .
  • (ענבל) אבל הוא מאוד בסיסי - ובימים שבהם זה היה כלי העבודה, אז היה הרבה מאוד מה לשפר במודל, לפני שמגיעים ל-Data.
(אורי) לתיוג . . . 
  • (ענבל) כן
(אורי) זאת אומרת שעכשיו נשאר לנו להתעסק בתיוג ובאיכות התיוג . . . “לנקות רעשים”.
  • (ענבל) כן  - ובלהגדיר את הבעיה באופן הנכון.
(רן) כן, אז את אומרת שאם בעבר עבודת ה-Machine Learning התרכזה בבנייה של מודל “נכון”, היום המודלים הם “נכונים” ואין מה להתעסק בזה, בגדול אין מה להתעסק בזה. 
מקום שבו כן אפשר להשיג שיפורים משמעותיים זה בטיוב של ה-Data - היזון שלו, תיוג שלו, מתן סמנטיקה וכו’ - אבל לא במודל.
(אורי) וגם Context של ה-Domain - זה בסוף Problem Domain וצריך להכיר אותו, והמודל צריך להכיר אותו.
  • (ענבל) נכון.
  • אנחנו עדיין לא מספיק טובים במה שנקרא Domain Adaptation - יש שם המון שיטות
    • עובדים לצידי אנשים שכתבו על זה את עבודות הדוקטורט שלהם
    • ועדיין זה לא בדיוק שם - זאת אומרת, להעביר את זה מ-Domain, נגיד, של “רפואה” ל”עסקים” או משפה אחת לשנייה . . .
(אורי) “רפואה” ו”מוסכים”, כאילו . . . שניהם פותחים ורואים”, אבל . . . 
  • (ענבל) “אורטופדים” ו”מוסכניקים” זה דומה . . . 
(רן) אבל “אורטופדיה” ו”רפואת נשים” זה שונה . . .
  • (ענבל) נכון.

(רן) אחד המושגים שככה “צפים” פה ושם זה מודל של שפה - Language Model.
מי שלא מגיע מהתחום אולי פשוט אומר “’רשת ניורונים’ - מה זה אומר?”
אז מה המשמעות של מודל שפה”? מה זה הכלי הזה? איך משתמשים בו? איך בונים אותו? מה זה?
  • (ענבל) שאלה מצויינת . . .  [יש שקף?]
(אורי) יש לו אחלה שאלות . . . 
  • (ענבל) אתה עושה את זה כבר זמן-מה . . . מרגישים.
(רן) בשביל זה אני פה . . . 
  • (ענבל) Language Model זה בעצם כלי-העבודה העיקרי שיש לנו ב-NLP
  • ובעצם זה משהו מאוד פשוט - איך אימנו את הרשתות המפלצתיות האלה? נתנו להן משימה מאוד פשוטה
    • נתנו להן איזשהו טקסט והחסירו מילה - וביקשו מהן “לחזות” את המילה החסרה . . . 
(רן) כמו במבחן באנגלית . . . 
  • (ענבל) בדיוק . . . זהו - והם עושים בזה עבודה לא רעה בכלל.
  • אולי שמעתם על GPT-3 וכל המודלים ה . . . כבר הפסקתי לעקוב אחרי כל הגרסאות וזו קצת תחרות של “של מי יותר גדול”
  • אז כל ה-GPT-3 הזה”, שיודע לייצר טקסטים שנדמה שנכתבו על ידי בני אדם - כל מה שהם עושים זה חוזים את המילה הבאה.
    • נותנים להם איזושהי התחלה של משפט או שנותנים להם איזושהי הוראה - והם מוצאים מילה אחרי מילה אחרי מילה . . . 
      • וניהיה טקסט.
    • וזה לא מובן מאליו שבאמצעות משימת אימון כל כך פשוטה, אנחנו בעצם יכולים לקודד את כל הידע הזה של השפה והידע הכללי - 
      • ולהיות מסוגלים לפתור בעיות כמו Questions answering או . . . .
(רן) . . . וכתיבת שירים או כתיבת סיפורים - יש המון דוגמאות . . .
  • (ענבל) זה די מטריד, איך שהם משלימים דברים . . . 
(רן) כן . . . ה-Autocomplete , התכוונת
(אורי) ה-Autocomplete
  • (ענבל) כן - אבל אם כבר העלת את זה, אז בכלל - אתגר מאוד משמעותי: המודלים האלה “קראו” את כל האינטרנט
(רן) Black Mirror - here we come . . . 
  • (ענבל)  . . . אבל הם באמת ראו - בכל מיני ספרים: “נשים הן אחיות” ו”גברים הם רופאים” 
(אורי) אז יש להם את ה-Bias שיש לכולנו . . . .
(רן) כן . . .  אגב, אורי - זה נושא מרתק, של אתיקה ב-AI ו-Fairness וכל זה - זה נושא סופר-מעניין ואנחנו צריכים למצוא מישהו לדבר איתו עליו.

אבל נחזור לרגע, ממש ללפני סיום - נחזור למודל-שפה.
את בעצם אומרת שמודל-שפה - המטרה שלו זה לג’נרט (To Generate) משפטים, אבל הוא אומן בצורה מאוד פשוטה: “הנה משפט, הנה מילה חסרה - נחש מה המילה הבאה” - ואם ניחשת אז קיבלת “חיזוק” ואם לא אז קיבלת “חילוש”, או איך שאומרים את זה . . . 
וזה עובד - הטכניקה הפשוטה הזאת עובדת בצורה מפתיעה: כל מי שראה איזשהו Output של GPT-3, חמשירים ש”הוא” כתב או סיפורי-מתח ש”הוא” כתב - נראה כאילו יש שם משורר מאחורי זה . . .
(רן) כן . . . . זאת אומרת - זה נראה כמו משהו נורא-נורא-טכני - “לחזות את המילה הבאה”, אוקיי  . . . אבל נראה כאילו יש שם “נשמה” בפנים . . . 
(אורי) נשמה גזענית ומיזוגנית . . . 
(רן) כן, ואת אומרת שחלק מזה זה . . . 
(אורי) אגב - אנחנו נכנסים ל . . .  “אנשים שמאמינים ויראים” באותו . . .  מה קורה? רוצה לדבר על זה?
  • (ענבל) קראת לי את המחשבות
  • (ענבל) הדיונים האלה, שיוצא לי להשתתף בהם לא מעט - זה לא מפתיע אתכם לשמוע את זה - יש בהם הרבה סממנים של דת . . .
    • מה זה “אינטליגנציה”? מה זה . . . 
(רן) קצת מזכיר את הסיפור על הבחור הזה מ-Google שהיה משוכנע שמדובר ביישות אנושית לפניו . . . כן, אנחנו נכניס רפרנס לזה בשיחה, ב-Show-notes [אוקיי, זה שאני מוסיף הערות זה בסדר ורגיל - זה שהן עונות לי בחזרה זה מפתיע וקצת מוזר . . . ]

אז לצערי זמננו תם - הייתה שיחה מרתקת, בואי נראה עכשיו מה המכונה עושה ממנה . . . .  
(אורי) אנחנו הולכים על זה, נכון? אפשר לשחרר את המתמלל שלנו אחרי הפרק הזה [רגע, מה?!]
(רן) תודה רבה, עפר - עשית עבודה מצויינת! [זה בהחלט ב-Top 10 של הפרקים שהיה מוזר לתמלל . . .]
(ענבל) ניתן למכונות לתמלל [שיהיה לכם בהצלחה עם זה . . . .]

אז שוב - תודה רבה, ענבל! היה מרתק, נושא שברור שיש עוד הרבה מה לדבר עליו, אבל אנחנו נעצור פה. להתראות.
[ובהיעדר פינת ה”המגייסים?” - חדשות לא טובות מ-Snap, אבל אולי הזדמנות לחפש אנשי NLP מוכשרים]


 האזנה נעימה ותודה רבה לעופר פורר על התמלול!