בפרק הפעם אנחנו מתחילים סדרה שתכלול בין 9-12 נושאים, ותסקור נושאים שונים הקשורים לענן כמו למשל זמינות גבוהה, התאוששות מאסון, מובייל, אפליקציות Web, ניתוח נתונים, ביג דאטה ועוד. בכל פרק נכסה נושא אחד והיום הנושא הוא זמינות גבוהה (High Availability) והתאוששות מאסון (Disaster Recovery) בפלטפורמת הענן של גוגל. בנוסף נסקור את השימוש במגוון ספקי שירותי ענן בסביבה הטרוגנית אחת, או MultiCloud.
אורח התוכנית הפעם הוא ואדים סולובי, עובד בחברת DoIT, השותפה של גוגל בישראל, אבל גם Google Developer Expert. GDE היא רשת של מומחים בתחומים כמו פיתוח לאנדרואיד, UI ו-UX, שיווק וניהול מוצר. סולובי הוא אחד משני המומחים בישראל לפלטפורמת הענן של גוגל.
כמו תמיד אנחנו מחלקים כוסות למגיבים שתרמו הערות מעניינות ומחכימות בבלוג. הזוכה הפעם הוא אורי פינקלשטיין על הפרק שדן ב-FPGA, שהוסיף הערה על ההיסטוריה של השפות. משתתפים בתוכנית האורחים הקבועים, נתי שלום ואורי להב.
נקודות עיקריות במהלך התוכנית:
- משנת 2001 גוגל משקיעה מאמצים אדירים בתשתית המחשוב שלה. ב-2009 התקבלה החלטה לפתוח את התשתית ללקוחות. (04:30)
- זמינות גבוהה והתאוששות מאסון קשורים באופן ישיר לשימוש במספר ספקי שירותי ענן. לקוחות רוצים לנצל את היתרונות של כל ספק שירות ענן, ביחד עם יכולות פנימיות שלהם. המטרה היא לקבל סוג של ביזור סיכונים מבחינת התלות בספק אחד. (06:46)
- לפלטפורמה של גוגל שני יתרונות משמעותיים – האפשרות לקחת שרת וירטואלי תוך כדי שהוא חי ולנייד אותו בין מארחים (Transparent Migration). היכולת הזאת סייעה לגוגל לבצע עדכון של מאות אלפי שרתים כדי להתמודד עם באג HeartBleed. עד כמה שידוע לי היכולת הזאת בלעדית לגוגל. (09:25)
- יכולת נוספת היא אתחול אוטומטי (Auto Restart). במקרה של תקלה פיזית, גוגל תמצא מקום אחר לשרתים הווירטואליים שרצו במקום פיזי סמוך ותפעיל אותם מחדש. צריך כמובן להתאים את האפליקציה למצב כזה, ולהתמודד עם ההשלכות של ה-State של האפליקציה במצב של תקלה כזאת. (13:05)
- בהשוואה ל-vMotion שבו אנחנו משתמשים כדי לאזן עומסים בין שרתים שונים, גוגל יוזמת מצידה מעברים בין שרתים בגלל הצרכים שלה. אבל אנחנו כמשתמשים לא בהכרח צריכים לבצע את זה באופן יזום. (18:03)
- הבדיל בין השיטות – Migration היא פעולה שאנחנו מתכננים מראש, אפילו ברמה של שניות. Auto Restart זאת פעולה שאנחנו נאלצים לעשות בגלל אירוע מסוים. (19:48)
- גוגל מאפשרת התייחסות לאוספים של שרתים, Instance Group, וניתן לקבוע כללים לכל הקבוצה כמו מספר מינימלי של שרתים. במידה ושרת נופל הקבוצה תקים אותו מחדש. הבדיקות של מצב התפקוד של השרת נעשות באופן אוטומטי. (20:15)
- גוגל מציעה לנו אפשרות להשתמש ב-Deployment Manager כדי להקים שרתים חדשים, וניתן גם לבצע זאת באמצעות אינטגרציה עם כלים כמו Chef, Puppet וכלים נפוצים אחרים. (22:48)
- CloudSQL ישום מבוסס MySQL שהוא מנוהל לחלוטין, וכולל יכולות זמינות גבוהה מובנות. גוגל מתחזקת עותקים (Replicas) של השרת במרכזי מידע ברחבי העולם, ועוברת ביניהם באופן אוטומטי במקרה תקלה. (24:42)
- כל המרכזים של גוגל מחוברים לרשת סיבים אופטיים משלה, מה שמאפשר מהירות תגובה גבוהה בין מרכזי מידע. (27:40)
- גוגל הוסיפה יכולות במנוע של בסיס הנתונים, יישום מיוחד של InnoDB, על מנת לאפשר יכולות של זמינות גבוהה. (31:20)
- לקוחות משתמשים בענן כדי לעשות התאוששות מאסון למרכז הנתונים בארגון. מגוון הסיבות הוא השקעה שכבר נעשתה בארגון, אבטחת מידע גבוהה בענן, מגבלות רגולציה. (33:30)
- Google Cloud Storage כולל גם את Google Cloud Storage Nearline שמתומחר בצורה משתלמת עבור גיבויים. מבחינת המחיר הוא דומה ל-Cold Storage אבל מציע מהירות שדומה ל-Hot Storage. (36:10)
- בתחום ה-MultiCloud גוגל מציעה מצב שתואם את S3 של אמזון, במידה ואנחנו רוצים להעביר אפליקציה שכבר פיתחו ל-S3. גוגל מפתחת גם את Kubernetes שמנהל אוסף של קונטיינרים כמערכת אחת. (43:20)
תודה לרועי שלומי על התקציר של הפרק.
הקובץ נמצא כאן, האזנה נעימה
אין תגובות:
הוסף רשומת תגובה