יום רביעי, 31 ביולי 2019

373 The Public Knowledge Workshop

פודקאסט מספר 373 של רברס עם פלטפורמה - אורי ורן מארחים בכרכור את אדם קריב, ממייסדי הסדנא לידע ציבורי (הקבלה שלכם מ-Reversim Summit הקודם וזה שלפניו? אז זה) לשיחה על שקיפות, ידע ציבורי וסדר בבלגן.


הקדמה קצרה - לרברסים יש קשרים ארוכים ועמוקים עם הסדנא, החל מפרק פרה-היסטורי (154! ילידי 2012 כבר עולים לכיתה ב’) שעסק בסדנא דאז (ובכנסת פתוחה), דרך שיתוף פעולה עם כנסי רברסים לאורך השנים (כולל תרומה של הרבה מהכנסות הכנס בשנים האחרונות) ובאופן כללי מקום חם בלב לסדנא.

אז אדם - 
  • אחד ממייסדי הסדנא, שקיימת כבר כמעט 10 שנים, עוד מהתקופה שהיא לא הייתה סדנא אלא פרויקט קוד פתוח (Open Knesset) - גוף שנולד מתוך רצון לקחת בעיה פוליטית / אזרחית ולתת לה מענה טכנולוגי.
  • עפרי (רביב) ובני (דאון, מפרק 154) התחילו ב - scraping לאתר הכנסת על מנת להבין איזה ח”כ מצביע על מה, ולפי זה לדעת למי להצביע (כן . . . היום אנחנו קצת פחות תמימים).
  • מתוך המהלך הזה נולד פרויקט קוד פתוח בשם כנסת פתוחה”, ונולדה עמותה בשם הסדנא לידע ציבורי, שהיא מעיין “חממה לפרוייקטים מהסוג הזה”.
    • זו עמותה מאוד לא סטנדרטית שמיועדת לפרויקטי קוד פתוח - אין עוד כאלה בארץ, ובכלל מעט מאוד בעולם.
  • יותר מקוד פתוח - הסדנא היא מקום לידע פתוח: עם הזמן הבנו שהסדנא היא חלק מתנועה עולמית של Open Data, שנולדה מתוך רעיון מאוד חכם (סוג של Hack על הדמוקרטיה, כי אם כבר גיקים אז עד סוף)
    • הנחת היסוד מאחורי הרעיון הבסיס של הדמוקרטיה (“מצביעים כל ארבע שנים ובוחרים את הנציגים שלנו”) היא שאנחנו מסוגלים להבין מה הנציגים שלנו בכלל עשו עם הכוח הזה, ולהבין האם אנחנו רוצים להצביע עבורם שוב או לא.
    • אם אנחנו לא מסוגלים לדעת את זה באמת - כל השיטה נשברת.
    • אחת הבעיות הקשות כרגע היא שנראה שזה בדיוק מה שקורה - הממשל מאוד מסובך.
    • זה לא רק מה קורה ומידע שצריך להתעדכן ולא זמין - זו גם ההבנה הבסיסית של איך בכלל הדברים עובדים (בהנחה האופטימית שהם עובדים).
    • גם אם הבנת מה עושים - צריך להבין מה בדיוק נעשה בפועל (הממשלה היא גוף עצום), וגם אז הרבה פעמים אין לך את הידע על מנת להעריך - האם זה טוב או רע? האם אני מסכים או לא? אנשים לא מבינים את הממשלה, ולא יודעים למי להצביע - להמשיך? להחליף? לפי מה?
  • זה המקום להמליץ על “עושים פוליטיקה” של דפנה ליאל (מבית עושים הסטוריה של רן לוי) - מסבירה המון על איך דברים עובדים בממשל ובפוליטיקה בכלל.

מעבר לסדנא והרקע שלה - עוד קצת על אדם:
  • אדם במקור בוגר תלפיות, הרבה שנים בצבא ומשם כל מיני סטארטאפים (חלקם שהוא הקים) - המסלול המוכר של צבא - סטארטאפים - פוליטיקה . . .
  • ב-2015 הסטארטאפ של אותו זמן נסגר, ואדם החליט להיות עצמאי - ועוד במשהו שהוא אוהב
    • עד אז הסדנא הייתה מעיין פעילות התנדבותית - פעילות של ערבים וסופ”ש - ועכשיו היה רצון לראות האם ניתן להפוך את זה למקצוע
    • זה לא היה פשוט - בעיקר במובן המחשבתי / קונספטואלי (קפיצה משכיר לעצמאי), אבל היום זו פעילות Full-time, וקשה לחשוב על לחזור אחורה להיות שכיר. למי שמתלבט - אדם ממליץ.

הסדנא התחילה כגוף “אלטרואיסטי”, מתוך מטרה להנגיש מידע ומתוך מחשבה שאם המידע יהיה נגיש הדמוקרטיה תיהיה טובה יותר. 
היום זה כבר גוף עם מימון כלשהו מאחוריו? האם העבודה נעשית בתשלום?
  • נושא המימון מעניין תמיד . . . כל הרעיון של Open Data היה מאוד “חם” לפני כ-5 שנים, והיה “מאוד קל” להשיג כסף מתורמים. 
  • היום קצת פחות, ואנחנו הרבה יותר מפוקסים על פרויקטים כאמצעי לממן את עצמנו.
  • מבצעים הרבה פרויקטים עם ועבור ובמימון הממשלה - מענקים של המדען הראשי (רשות החדשנות, גם שווה להאזין) למשל ועוד.
    • מחפשים הזדמנות לעשות פרויקט תוכנה - “ועל הדרך” גם לדאוג שהמידע נאסף ומפורסם בצורה טובה ומונגש כמו שצריך, לפי העקרונות והפילוסופיה שלנו של איך דברים צריכים להיעשות.
    • יש תמיד הקשר למשימה של הסדנא? כן - אנחנו לא בית תוכנה, ולא ניקח כל פרויקט. הסדנא עוסקת בפרויקטים שיש להם ערך משל עצמם עבור הממשלה, אבל כאלו שגם יקדמו את האג’נדה של “לעשות דברים בצורה נכונה”.
    • הרבה פעמים רואים פרויקטי מחשוב של הממשלה ש”איכשהו” נגמרים בכך שהדפדפן היחיד שנתמך הוא Explorer 5 וכאלה, והמידע משוחרר “רק בגרסת Excel 2007” וכו’. ככה יצא.
    • דברים לא עבדו כי זה לא היה הפוקוס - אנחנו מנסים לקחת את הדבר הזה ולהביא אותו כן לפוקוס, בתוך הפרויקטים שאנחנו מבצעים.
אז כל הפרויקטים הללו הם בעצם פרויקטי נגישות?
    • זה החלק הראשון  - גם ההסברה וגם העבודה בפועל. מהצד השני - צריך שהציבור גם ידע איך להשתמש בזה.
    • גם כאן הגישה השתנתה עם השנים - בתהחלה אמרנו Johnny Sixpack חוזר הביתה - במקום לפתוח את “האח הגדול” הוא יפתח את ספר התקציב ויראה מה כל אחד מהח”כים עשה ועל איזו הצעת חוק”. 
    • הבנו שזה, ובכן - לא הולך לקרות.
    • התחלנו לעבוד עם גופים מתווכים - תקשורת, אקדמיה, עמותות מהמגזר השלישי - גופים שלוקחים את המידע והופכים אותו לנרטיב מסויים. 
    • אנחנו משתדלים להיות בצד של המידע ולא לתת פרשנות, אבל אנחנו עובדים עם הרבה גופים שתפקידם במובן מסויים “לרדד” את המידע וקצת לספר סיפור, תוך מטרה שהסיפור יהיה מגובה בנתונים ולא מבוסס על תחושות בטן או המצאות, שזה משהו שראינו ואנחנו רואים הרבה.

הייתה לכם פעם מחשבה על כניסה לתוכנית הלימודים של לימודי אזרחות?

טעימה קצרה מפרויקטים שקורים היום, או לפחות מהזמן האחרון, תחת המטרייה של הסדנא - 
  • הפרויקט הכי גדול והכי חשוב (וממש במקרה גם זה שאדם מוביל) נקרא מפתח התקציב - סוג של תמנון רב זרועות, שמטרתו להביא את כל מה שקשור לכסף ושלטון לתוך מסד נתונים אחד.
    • היום ניתן לומר שזהו בעצם מסד הנתונים הכי עשיר שיש על כספי מדינה (משחק מילים מטורף)
      • כולל אגב את הממשלה עצמה, שבנויה מהרבה גופים שונים שכל אחד מהם שומר על המידע שלו (לפעמים בכוח), והם לא תמיד ששים לשתף פעולה אחד עם השני.
      • עד כדי לבוא לסדנא ולבקש מידע במקום לגשת ישירות למשרד הרלוונטי, שלא בהכרח ישתף פעולה.
      • מפתיע שהם לא מבקשים בתור התחלה את המידע של עצמם? ובכן, גם זה קורה . . .
    • החל מתקציב המדינה, דרך תמיכות ורכש ומכרזים, ומידע על כל התאגידים בישראל
      • נשמע טריוויאלי, רק שבתוך רשם התאגידים יש כל מיני רשמים שונים - רשם החברות, רשם העמותות, רשם ההקדשים (רשם ההקדשות - דווקא הם מכולם דאגו להיות מכלילים), אגודות קואופרטיביות, רשם השותפויות . . . יש גם רשם משותף לרשויות שאין להן רשם (פאראדוקס? רשם בלי תיק? רקורסיה? חור במרחב-זמן?).
    • היום יש מסד נתונים אחד - אפילו שלכל אחד יש אתר משלו בפורמט משלו
      • חלק מייצאים מידע ב-CSV וחלק לא, לחלק יש אתר Web - כל רשם הלך ובנה לעצמו אתר נפרד, ואנחנו אוספים את הכל למאגר אחד של כל הישויות
      • למה זה חשוב? כי בסופו של דבר כאשר מסתכלים על כסף, לא מעניין לדעת רק מה היה בתקציב אלא איך הכסף זרם הלאה
        • רכש, תמיכות לעמותות . . . וממי כל אלו קיבלו עוד כסף? למי הם קשורים? מי המייסדים? לרוב הם קשורים גם לגופים אחרים
        • יש עוד צד - של הפרטה (“מיקור חוץ”) - הכסף עובר לחברה אחרת ורק משם עובר (בתקווה) ליעד, או דרך רשות מקומית למשל
        • כשמתחילים למפות כל דבר’ פתאום הרבה דברים מתקשרים - מידע על תרומות לפוליטיקאים, כספי פריימריס וכו’.
        • בכל פעם אוספים עוד ועוד מקורות מידע, כשחלק מגיע לאתר אבל לא הכל - חלק מגיע ישירות למסד הנתונים, ואפשר לערוך כל מיני ניתוחים על בסיס זה (עבור גופי תקשורת למשל).
      • הסדנא היא זו שעושה את הניתוחים? ברוב המקרים כן.
        • יש משתמשים שעושים את זה בעצמם, אבל בכל מקרה המידע פתוח, כך שכל מי שרוצה יכול - אבל לרוב אנחנו עושים את זה.
      • כלומר - המשתמשים העיקריים הם . . ?
        • עיתונות
        • המגזר השלישי (עמותות) - יש לסדנא קורס בשם תקציביזם, שמלמד אנשים איך להשתמש בתקציב ככלי על מנת להשיג ולקדם את האג’נדה שלהם
          • למשל - עמותה שרוצה לקבל תמיכה מהמדינה ולא יודעת בכלל מה זה ואיפה להתחיל
          • מסתבר שמי שמכיר ויודע איך המנוע עובד יכול להפיק מידע מאוד שימושי, ולמי שיודע יותר קל להשיג כסף
          • הקורס מלמד אנשים איך להשתמש בכלי שנקרא “תקציב המדינה”
      • בתי המשפט גם משתמשים בזה?
        • פחות . . . יש פרויקט נוסף שנקרא תולעת המשפט (קבוצת הפייסבוק נראית קצת יותר פעילה), שמטרתו להנגיש את המידע על מה שקורה בבתי המשפט, וגם לנתח אותו, כיוון שגם זה מידע “סגור”.
        • האם בתי המשפט משתמשים בזה לתביעות מסויימות? לא תמיד המשתמשים מספרים לנו מה הם עושים עם המידע . . .
          • לא מזמן משהו ביקש שנכתוב לו הקדשה לשער האחורי של הספר שהוא כתב על מדיניות הממשלה בארבעים השנים האחרונות והשתמש הרבה במפתח התקציב, בלי שבכלל ידענו שזה קורה עד שהספר יצא . . .
          • יש לנו עשרות אלפי כניסות בחודש אז סביר להניח שאנחנו לא מודעים להכל.
        • עד כמה (אם בכלל) תקציב הביטחון פתוח?
          • תקציב הביטחון כעיקרון אינו פתוח. אנחנו לא יודעים מה קורה מבחינת רכש, מכרזים וכו’.
            • אפשר להגיד שבהרבה מובנים זה בצדק . . . יש חלקים מסווגים, אם כי יש גם חלקים שאפשר לשקול לפתוח (שכרגע הם סגורים), אבל בישראל זה קצת קשה.
            • משתדלים לא להכנס למלחמות (עוד משחק מילים! בטח עם משרד הבטחון) - בעולם העמותות (הסוער) - יש את העמותות “הלעומתיות”, שמנסות לתקוף את הממשלה, ואנחנו מנסים להיות עמותה שבאה לעזור, ולעבוד עם פקידים שמנסים לשחרר מידע ולא כל כך יודעים איך. יש מספיק עמותות בצד השני שתוקפות, ואנחנו גם יודעים להיעזר בהן כשצריך, אבל אנחנו כעמותה תמיד ניהיה בעד וננסה לעזור.
            • מניסיון עבודה עם הרבה גופי ממשלה - יש המון אנשים שרוצים לעשות את הדבר הנכון ולא כל כך יודעים איך.

המידע שאותו אתם אוספים זמין כי יש אנשים טובים שרוצים להנגיש אותו או על פי חוק?
  • כל הסיפור של שקיפות ושחרור מידע זו רכבת שכבר יצא מתחנה (עוד משחק מילים?! אם כן ההקבלה לרכבות כאן מדאיגה… יש גם פרויקט כזה) - ברור לכולם שזה הולך לקרות, יש החלטת ממשלה שקובעת שכל המידע הממשלתי צריך להיות מונגש (עד 2022…), Open by default - 
    • אם לא משחררים אז צריך להסביר למה לא לשחרר את מידע
    • עד 2022 צריך לשחרר את כל מאגרי המידע הממשלתיים באופן פומבי ונח וכו’
    • זו מעיין מהפכה שקרתה ב-10 השנים האחרונות, כי לפני כן התגובה של משרד האוצר לגבי תקציב המדינה הייתה משהו בסגנון “כן, אתם ההיפים האלה שרוצים לשחרר את התקציב . . . הציבור לא ידע איך לאכול את זה” (וגם “אנחנו בכוונה מסתירים” . . .).
    • היום אנחנו במקום אחר לגמרי, 180 מעלות - יש להם אתר משלהם, הם מעלים את התקציב בעצמם ומעלים סרטונים שמסבירים את תקציב המדינה - לגמרי במקום אחר, רק שלא תמיד יודעים איך לעשות את זה נכון.

פרויקט נוסף שאדם עובד עליו - DataCity (כאן יש הרצאה על פרויקט DataCity מכנס PyCon 2019)
  • פרויקט שהתחלנו השנה, במימון המדען הראשי (רשות החדשנות) וישראל דיגיטלית
  • הרעיון הוא לייצר סכמה סטנדרטית למידע של רשויות מקומיות (תחשבו על זה רגע . . .).
    • יש כ-256 רשויות מקומיות (בממוצע)
    • אין עליהן כמעט רגולציה - לא אוהבים רגולציה על רשויות מקומיות בישראל, וגם אם הייתה היא כנראה לא הייתה טובה
    • כל רשות מפרסמת את המידע שהיא רוצה ואיך שהיא רוצה  - במקרה הטוב (שהיא בכלל מפרסמת)
    • מה שנוצר הוא מצב שבו (מעבר לענייני שקיפות שנשים לרגע בצד) יישומים מתקדמים שמשתמשים במידע עירוני, כמו שאנחנו רואים למשל בארה”ב - מדלן ו-Via (פרק 360!) ו - BreezoMeter ועוד המון יישומים שמתמקדים בעולם העירוני (מי אמר Pango?) - לא יכולים להתקיים בישראל.
      • אם אני, כיזם שרוצה ליזום אפלקציה שקשורה לעולם העירוני, צריך ללכת ולהתקשר מול 256 אתרים של 256 רשויות שונות, לאתר את הקובץ Excel הרלוונטי (שאולי מופיע שם, ויש לי מזל וזה באמת Excel כי בהרבה מקרים זה בכלל דף HTML או שלא קיים בכלל) . . .
      • לפחות 256 אפשר להכניס בבייט אחד . . . יש מצב שזו הגבלה של משרד הפנים Mainframe). לא בטוח שזה מצחיק . . .
      • כל זה יוצר סביבת עבודה לא הגיונית שהופכת את השוק הישראלי ללא כדאי בכל מה שקשור לפיתוח אפליקציות לעיר חכמה (Smart city).
    • רצינו לפתור את המצב הזה - ועל הדרך להרוויח את זה שמידע יצא החוצה וגם שקיפות.
    • אנחנו בונים פרויקטים שבמסגרתו אנחנו יוצרים סכמה סטנדרטית של כל המידע שנראה לנו חשוב ושיש לו ערך כלכלי - עולמות של עסקים, חינוך, אירועים וכו’.
    • עובדים כבר עם 6-7 רשויות ועושים איתן פיילוטים על המידע שלהן - ממפים את המידע כפי שהוא נמצא בתוך מערכות המידע הפנימיות שלהן לתוך אותה הסכמה, ובונים End-Point אחד של API, שדרכו ניתן עכשיו להשיג את המידע.

איך ניגשים למידע הזה (בעיקר בצד של הממשלה, שם זה פחות או יותר “אחיד”)? אילו Interfaces קיימים אם מישהו רוצה לגשת למידע ולפתח מעליו אפליקציה?
  • אם זה בסדנא, אז לרוב הפרויקטים יש API וניתן לבנות מעליהם אפליקציות.
  • בתוך הממשלה זה בדרך כלל יותר מורכב, כיוון שבדר”כ אין API, המידע לא מאוד אחיד ולא מפורסם בצורה אחידה ולא כל כך מתועד . . .
  • לגבי מידע שכן זמין דרך הסדנא - קודם כל אחת לשבוע בימי שני יש מפגשי פיתוח, ב -  Google Campus TLV בשעה 19:00 (באתר כתוב 18:00, ושיש גם ברביעי בירושלים…) - 
    • אפשר לבוא ולדבר עם מובילי הפרויקטים השונים ולהגיד “אני רוצה את ה-Data” . . . המידע פתוח תמיד, כפילוסופיה ובפועל, אין פרויקטים שבהם אנחנו שומרים את המידע אצלנו.
    • כל מי שרוצה את ה-Data, לשימוש מסחרי או לא-מסחרי, יכול לקחת ולהיעזר בו.

באילו סוגי API מדובר - מה בחרתם? איך בחרתם? אנחנו קצת טכנולוגיים פה (זו השמועה)
  • במפתח התקציב לדוגמא יש API שמאפשר לקבל ב-JSON כל פריט שנמצא אצלנו ב - Database
    • סעיף תקציבי, העברה תקציבית, תמיכה, עמותה, חברה . . . כל דבר אפשר לקבל כ - Data
  • יש גם API SQL, שמאפשר להריץ שאילתות SQL Queries על ה - Database שלנו ולקבל את זה ב-API.
  • כמובן שאם רוצים את כל המידע כ - Flat File - גם את זה אפשר להוריד ועל זה לעשות ניתוחים ומה שרוצים.
  • מהבחינה הזו אנחנו מאוד ליברליים - לא כל כך אכפת לנו מי לוקח את המידע, אנחנו לא מרוויחים מזה.

יש גם פיצ’רים יותר מתקדמים? אפליקציה שמאפשרת לקבל התראה כשיש עדכון במידע למשל?
  • לפחות עבור חלק מהדברים יש מייל שיוצא . . . אין בעיה לייצר שירות של התראות, צריך רק לכתוב בשביל זה קצת פייתון ולממש את זה
  • נשמח אם מישהו רוצה לבוא לכתוב שירות של Notifications ולשלב את זה פנימה slightly smiling face - אנחנו מאוד שמחים לקבל מתנדבים: בכל חודש מגיעים 50-100 אנשים בכדי לשמוע, וחלקם גם נשארים אח”כ
  • הסדנא היא חממה לפרויקטי קוד פתוח - כל הקוד פתוח By Definition - אין מצב שמישהו עושה פרויקט וסוגר אותו, זה האופן שבו אנחנו מתנהלים.
  • יש למשל מאגר של רשם החברות - זה מאגר שהוא כביכול פתוח אבל לא מאונדקס בגוגל (Indexed by Google . . .), ויש כמה חברות שקיבלו את המאגר, הקימו אתרים שמכילים את המידע ועכשיו אם אתה רוצה לקבל מידע שלם על החברה אפשר לשלם להן 40 ש”ח ולקבל את המידע - בזמן שבאתר של רשם החברות זה עולה 11 ש”ח . . . זו בעצם עמלה על ה - Redirection.
    • אנחנו לקחנו את כל המידע, שמנו אותו פתוח באינטרנט ומאונדקס ב-Google - יש מלא כניסות לדבר הזה.
    • חוץ מזה יש לינק לאתר רשם התאגידים שאומר “זה עולה רק 11 ש”ח - אל תשלמו יותר” . . .
    • אנחנו לא עושים כסף - לא מהמידע ולא מהקוד, מי שרוצה לקחת מוזמן
    • זה מאוד מקשה עלינו - מאוד קל לעשות כסף מהמידע . . . הכי קל זה לסגור אותו ולגבות עבורו תשלום, אבל זה משהו שאנחנו לא מוכנים לעשות.

איך אתם עובדים ביום-יום? הזכרנו את ימי שני בערב, אבל האם יש אנשים שקמים בבוקר והולכים לעבוד בסדנא?
  • יש לנו צוות קטן שכולל מנכ”לית (בחלקיות משרה) ומנהלת קהילה (גם כן בחלקיות משרה), ויש גם Admin.
  • יש משרד פיסי - במקום בתל אביב שנקרא בית העמותות (מעיין Open space משנות השמונים)
  • מעבר לזה - יש את המיטאפים השבועיים, וכמובן את הפרויקטים שאנחנו עושים - על חלקם אדם עובד ועל חלקם אנשים אחרים - הפרוייקטים הממומנים, שהם אלו שמכסים את ההוצאות.
  • העבודה עצמה היא רק בימי שני בערב, או שגם במהלך השבוע אתה עובד על זה? 
    • אדם אישית עובד במהלך כל השבוע; המתנדבים בדרך באים בימי שני, יש כאלה שנוח להם לעבוד בשעות אחרות, חלק שכירים ונוח להם במהלך הבוקר, לאחרים נוח בלילה, חלק לא גרים באיזור המרכז (!) ולא מגיעים למפגשי הפיתוח אז מתקשרים דרך ה - GitHub - כל אחד עם איך שנוח לו.
  • המפגשים הם הזדמנות להיפגש ולדבר ולהכניס איזשהו מימד חברתי לכל העניין, אבל בסופו של דבר (ככל פרויקט קוד פתוח) מקבלים גם הרבה מאוד Contributions ב - Remote, ויש אנשים שאדם מכיר אותם רק על פי המשתמש ב - Github, בלי שפגש בהם (פיסית) מעולם.

הזכרת גם משהו שקורה פעם בחודש - מה זה?

נתקלתם ב”בונקרים”? אנשים שבאופן אקטיבי ניסו לחסום אתכם כי פחדו שהאינטרס שלהם יפגע?

זה מעלה שאלה אחרת - האם יש פרטי מידע שאתם יודעים שמוכרים אותם, ותכל’ס אין סיבה? (מי אמר חניה בחוף הים?) - מידע שאמור להיות (לפי חוק) שייך לציבור.
  • הזכרנו קודם לכן את רשם החברות ואת שורת המתווכחים בדרך אליו כדוגמא אחת
  • כל הסיפור של מידע על חברות ועמותות . . .אני לא משפטן אלא מתכנת, אבל על פניו יש כאן איזושהי לקונה
    • מצד אחד - אתה יכול לקנות את המידע, כך שהוא לא מידע פרטי
    • מצד שני - אתה צריך לקנות אותו (בשונה מחינם), על מנת למנוע ממך (או לפחות להקשות) לעשות Scraping ולקבל מאגר שלם, כך שלא תוכל לדעת, למשל, עבור אדם מסוים - באילו חברות הוא מכהן כדירקטור, ובמקביל בעלים של אילו חברות?
    • המאגר השלם מכיל (כביכול) מידע פרטי, אבל כל רשומה בודדת בו לא מכילה מידע פרטי
    • מכל זה יוצא שאם אתה בעל אמצעים, ויכול / מוכן לשלם 11 ש”ח x שלוש (או ארבע) מאות אלף חברות - אתה יכול לבנות לעצמך את כל המאגר, וכמובן שיש חברות (קו מנחה, D&B) שיש להן את המאגר הזה אצלן, וברשות המדינה הן מוכרות את המידע הזה לגופים אחרים.
      • הן גם עושות ניתוחים שונים - מה שמכונה “מידע עסקי”.
  • זו דוגמא אחת, ויש עוד . . . “היופי” בעולם הזה הוא שלא משנה לאן אתה מסתכל - יש מה לעשות
    • הרבה פעמים לנסות ללכת “עם הראש בקיר” באיזשהו מאבק קשה זו לא תמיד האסטרטגיה הכי טובה, ואפשר להשקיע את אותו המאמץ ולעשות מהפכה באיזור אחר, שפשוט צריך שמישהו יבוא ויסדר את הדברים, ויש מוכנות ויש רצון.

אנחנו, כמפתחים, יודעים לכתוב API ממש טוב (מתבקש), ויודעים לעשות Scraping ממש טוב, ולהמיר כל פורמט לכל פורמט (אפילו אם זה Excel 2007!) - אבל אנחנו לא בהכרח מבינים בפיננסים, או בנדל”ן, או במשפטים.
האם יש גם אנשים במקצועות האלה שנמצאים בעמותה ונותנים לכם את הייעוץ המקצועי בתחומים האלה - על מנת לקבל את ההקשר (Context) של המידע?
  • בודאי - כיון שהעמותה כבר קיימת הרבה מאוד זמן, אנחנו נמצאים בקשר מאוד טוב עם הרבה מאוד פקידים בתוך הממשלה וגם עם הרבה מומחי-תוכן.
  • אדם בעצמו הפך למעיין מומחה תקציב . . .
  • כשצריך להביא את המומחה הרלוונטי - העמותה יודעת להביא אותו, וזה באמת משהו שחסר לאנשים שמגיעים מהעולם של הסטארטאפים וההיי-טק.
    • מאוד נוח לפעמים לחשוב ש”אני אשב עכשיו בבית, אכתוב כמה שורות קוד ואעשה Disruption לכל השוק ואצור אפליקציה שתשנה את איך שאנשים מתנהגים . . . “ - וקשה לחשוב על כל הדבר הזה כ”איך אני אשנה את המערכת הפוליטית בישראל?” או “בוא נשנה את שוק ההון בישראל” - זו קפיצה שהיא הרבה פעם קשה, וזה לפעמים אפילו סוג של מחסום בלתי-עביר.
  • האמת היא שזה כמעט אותו הדבר - תכתוב כמה שורות קוד, ואנחנו כבר נדע לקשר אותך לתקשורת ולתוך הממשלה, וכו’.
    • בממשלה צמאים לכאלה רעיונות שלא עולים כסף (קוד פתוח זה חינם, לא?) - הרבה פעמים זה קשה, אבל אם זה לא עולה כסף . . . הם רק מחכים שיבוא מישהו עם רעיון מדהים (ובחינם).
    • מזכיר את הבדיחה על לוחות הברית (לבעלי רגישויות כלשהן, אנא דלגו לסעיף הבא) - אמ;לק: אלוהים מנסה לעניין דתות שונות בלוחות הברית; “מה זה? כל מיני כללים ואיסורים? לא מעוניינים”; מגיע ליהודים - “רוצים לוחות ברית?” - “כמה עולה? חינם?! תביא שניים”.
    • אז הממשלה.
    • זה כנראה ה-Data הפתוח הראשון, ועוד על טאבלט! לגמרי “תביא שניים” . . .

איך אנחנו ביחס לעולם, כ - Benchmark? הזכרנו קודם קצת מידע עירוני מארה”ב, איך אנחנו לעומתם בתחומים השונים? ולעומת אירופה? אפריקה? המזרח?
  • אפשר להסתכל על זה בשתי דרכים - 
    • מצד אחד - הנורמות השלטוניות. במובן הזה אנחנו לא מתקדמים כמו במדינות אחרות בהן השקיפות יותר מושרשת, גם בהתנהלות של הממשלה והפוליטיקאים וגם במה שהציבור רגיל לדרוש.
      • זה מגיע, אבל הולך טיפה יותר לאט. טיפה . . .
      • אם היית מדבר עם עיתונאים לפני עשר שנים הם בכלל לא היו חושבים להסתכל באתר של Data ולבדוק, היו פשוט מתקשרים למקור שלהם במשרד ראש הממשלה בשביל לשאול שאלה
      • לפני כמה שנים ראיתי (אדם) כתבה בערוץ 2 עם תגובה של אחד מהשרים - ואז הוכחה שהשר (תחזיקו חזק) לא אומר אמת (הלם), והציגו מסמך סרוק - ואמרתי “הנה קפיצת מדרגה”.
      • רואים את הדור הצעיר (יחסית) של העיתונאים, שכבר כן מתחילים להבין איך לעבוד עם הדבר הזה.
      • גם הציבור כבר התרגל ל-Google וללקבל כל דבר בלחיצת כפתור במאית השנייה, וכבר לא מוכן לקבל תשובות בנוסח “בואו לארכיון ופה הכל מודפס”. זו לא תשובה מקובלת יותר.
    • מצד שני - אם מסתכלים על תשתית המידע של ישראל, אפשר להגיד שאנחנו במצב די טוב
      • דברתי קודם על רשם החברות וכל הבלגן שיש שם - מצד שני אפשר להגיד שאנחנו שנות אור מתקדמים לעומת מדינה כמו אנגליה.
      • בישראל יש לפחות מספר תאגיד” - לכל יישות משפטית יש מספר, Unique ID - משהו מדהים
      • לכל אזרח בישראל יש UID (ת.ז.)
      • בארה”ב אין UID לאנשים, באנגליה אין UID לחברה . . . עכשיו לך תדע (ותבנה מדינה) - אין UID, יש רק שם
        • חברה קיבלה כסף, אבל איזו חברה זו? איפה היא נמצאת? היא נקראת “משהו” ויושבת רחוב XYZ - לך תמצא אותה . . . ואז יש שתי רשומות, ובכל אחת זה רשום קצת אחרת - האם זו אותה חברה או לא?
      • הבן של האיכור משדרה 3? אה… קריאה מהנה.
    • גם מבחינה תקציבית - התקציב של ישראל הוא מאוד מפורט: יש רמת פירוט של כ-10,000 שורות תקציביות לשנה, לעומת מדינות אחרות ששם יכולים להיות רק כמה מאות סעיפים בשנה (מבחינת רמת פירוט)
      • וזה עוד כשעל חלק עצום אין פירוט (ביטחון…)
    • עוד יתרון של ישראל - אנחנו מדינה מאוד קטנה, ואם רוצים לעשות שינוי כמו למשל בפרויקט DataCity - אז 256 רשויות זה אולי הרבה, אבל זה לא בלתי אפשרי.
      • במדינה כמו ארה”ב, עם סדר גודל של עשרות אלפי יישובים ו-50 מדינות כשבכל אחת יש ה - Counties ויש כל כך הרבה היררכיות לשלטון וכל אחד מנהל את התקציב בנפרד - זה פרויקט שהוא כמעט בלתי אפשרי.
      • בישראל זה מאוד מזכיר את העולם של המידע הרפואי - יש פה פונצטיאל לחדש ולייצר מודלים חדשניים גם בתחום הזה דווקא בגלל שאנחנו קטנים יחסית ובגלל שהממשלה כל כך נגישה, ברמה שאפשר להרים טלפון לפקיד ממשלה או סגן שר או עוזר פרלמנטרי, להתכתב איתם ב - Whatsapp ולהניע דברים בצורה שהיא מאוד קלה אם משווים את זה למדינות אחרות שהן גם עם מסורת יותר ותיקה של כבדות, וגם עם הרבה יותר שטח והרבה יותר אנשים והרבה יותר היררכיות.
      • מעניין - אם נסתכל על מפת הרשויות בארה”ב ועל ההיררכיה, האם נראה שלכל רמה בהיררכיה יש 256 כניסות? עץ מאוזן . . . (או שאילון צודק).

לקראת סיום - עוד נושאים? ואם חלק מהמאזינים מעוניינים להצטרף - איך יוצרים קשר? פשוט להגיע? להרשם באתר?
  • אם רוצים להתנדב - בואו לאתר של הסדנא לידע ציבורי: https://www.hasadna.org.il/
  • אפשר גם סתם להגיע לקמפוס גוגל בימי שני ב-19:00, אנחנו תמיד נמצאים שם (אלא אם כן יום כיפור וכאלה…)
  • אם למישהו יש רעיון מדהים למשהו שאפשר לעשות עם מידע של הממשלה ולהתחיל פרויקט - מאוד נשמח לקבל את הדברים האלה, אנחנו לא נעולים על הפרויקטים שיש לנו כרגע
    • זו לא רשימה סגורה - מי שבא לו לבוא ולקדם פרויקט קוד פתוח בעולמות האלה, יותר ממוזמנת (או מוזמן)
  • יש המון נושאים שבכלל לא התעסקנו בהם עדיין - איכות הסביבה, בריאות . . . המון נושאים
    • נושאים של צרכנות ,שלפעמים מתחילים ולא כל כך מתרוממים כי אף אחד לא חשב להתעסק בזה עד היום
    • לאן שלא מסתכלים - יש המון עבודה לעשות. יש מלא דברים Up for grabs - רק תבואו ויש מספיק.
  • רגע - Vim או emacs? מה שעובד לכם. כל עוד זה Vim.

מה המספרים נכון להיום - כמה אנשים מגיעים בימי שני? כמה אנשים מעורבים בכל הסיפור?
  • קצת קשה להעריך . . . מבחינת אנשים שמגיעים אז זה סביב ה-40 בכל יום שני
  • כמות האנשים שמעורבים כמובן הרבה יותר גדולה, כי חלק לא מגיעים כל שבוע, חלק תורמים מרחוק, יש הרבה אנשים שפשוט “יושבים על הדף פייסבוק ועושים לייקים”, ומתעניינים בתחום (יש קטיגוריה כזו מסתבר, וזה גם בסדר).
  • לא רבים יודעים, אבל באי הכנס ב2017-2018 כבר תרמו לסדנא - ההכנסות הפנויות שנשארו מהכנס נתרמו לעמותה.
  • לסיכום - בין כמה עשרות לכמה מאות.
    • המתנדבים בפרויקט מתחלפים - בפרויקט של אדם כבר עברו למעלה ממאה מתנדבים, וזה נחמד, כי רואים גם אנשים שרוצים לתרום וגם כאלו שרוצים ללמוד - Python, Angular, React . . . - “למדתי עכשיו קורס ואני רוצה עכשיו לעבוד בזה, ואין לי איפה ואני רוצה לתרום”. אז הנה - באים אלינו בשביל ההתנסות הראשונה, ואנחנו גם פתוחים לדברים מהסוג הזה, נותנים משימה צדדית ויש לכם כמה זמן שאתם רוצים לעבוד עליה, וזה משהו שאנחנו מאוד שמחים לראות - אנשים שבאים, לומדים, עושים Networking עם אנשים אחרים.

וברמה הטכנולוגית - Python, Angular, React?
  • בגדול כן, אלו הטכנולוגיות המובילות
  • משתדלים להשאר באיזורים המוכרים - כדי שאנשים שבאים יוכלו לעבוד עם טכנולוגיות שהם מכירים ולא יצטרכו עכשיו לעשות פרויקט ב-haskell וכו’

איפה הפרויקט נשמר?
  • המידע נשמר ב - Database, בקבצים.
  • יש Cluster ב-K8s שעליו כל הפרויקטים רצים
    • רץ כרגע על הענן של Google
    • הם (Google) עוזרים קודם כל בזה שהם נותנים לנו אפשרות להיות שם אחת לשבוע כבר שנים ארוכות שזו עזרה מאוד גדולה, ויש גם עזרה בקרדיטים על הענן.
  • צריך לזכור גם שבסוף לא מדובר על כמויות אדירות של מידע - אנחנו מתארים את המידע הממשלתי כ - Big Data (!), אבל זה לא ה - BIG Data שקיים בתעשייה
    • לא דיסקט, יושב על ה - Hard Disk, אולי לא יכול לעלות ל - Memory במכה אחת - אבל לא כמויות אדירות של מידע, אולי כמה עשרות או מאות Gb אם אוספים הכל כולל הכל.
    • זה לא Big Data של פייסבוק או של חברת טלפוניה גדולה (אפשר לשאול ולבקש מה-CIA להשוות).
    • הרבה פעמים באים אלינו כל מיני Data Scientists ורוצים לעשות איזה ניתוח מיוחד “על כל התקציב” - צריך להבין ש”כל התקציב” זה משהו כמו 10,000 שורות, ולא מיליון או 10M - הדרישות “המחשוביות” לא עצומות, וזה מה שמאפשר לנו כעמותה לתחזק את כל הדבר הזה בלי לקרוס.

היה מרתק. בואו להתנדב!
הקובץ נמצא כאן, האזנה נעימה ותודה רבה לעופר פורר על התמלול