065 hadoop | רברס עם פלטפורמה

צוות הפתוח של Outbrain העלה לאחרונה מערכת דוחות חדשה, מבוססת Hadoop ו- Hive

דניאל וגבי מצוות הפיתוח של Outbrain התארחו אצלנו וסיפרו חוויות על המערכת החדשה

הזכרנו לכל המאזינים מי הוא Hadoop עליו דיברנו גם בפרק 2
מה הן היכולות שמוסיף Hive והסבר קצר על MapReduce
גבי סיפרה איך המערכת עבדה בעבר, מה הוליד את הצורך להחליף את המערכת הישנה
דניאל סיפר שאחרי טעינת המידע ל- Hadoop, בניגוד למערכת הישנה, ניתן להריץ שאילתות כבדות
מה עושה חברת Cloudera והתמיכה שלהם ב- Hadoop
שימוש ב- Hadoop ו- Hive וכתיבת ממשק בפרוטוקול Thrift
כלי ניטור וממשקי משתמש ל- Hadoop ו- Hive וכלי Cloudera שמשלימים את התמונה
תמיכה ומגבלות בשאילתות SQL ותוספות לשפה כגון multi-insert
האפשרות לגדול – כאשר נגמר המקום בדיסק או כשיש יותר מדי תהליכים
Cascading כממשק נוסף ומטמון ל- MapReduce
הצורך להיכרות טובה עם Hadoop בכדי לעבוד עם Hive

הקובץ נמצא כאן האזנה נעימה