כפי שתיארנו בתחזית 10 ימים לבחירות, פיזור התוצאות בסקרים השונים המתפרסמים באמצעי התקשורת הוא קטן עד מאוד. יש לזכור שסקרי בחירות אמורים להיות מבוססים על מדגם אקראי של האוכלוסייה. כפי שהסברנו בעבר, כאשר שואלים מדגם של 500 איש מתוך האוכלוסייה הכללית, ניתן לחשב מהי טעות הדגימה הסטטיסטית לכל מפלגה עפ"י מספר המנדטים שקיבלה בסקר, ויש לצפות שתוצאות הסקרים "ירקדו" סביב הממוצע בהתאם לטעות הזו, בניגוד למה שעולה מן הנתונים בסקרים של השבוע האחרון.
אנחנו כבר קרובים מאוד ליום הבחירות, ובשלב הזה אפשר להפסיק להיתמם. ברור שסקר בחירות איננו מדגם אקראי טהור. אין הרבה מקום לספק בכך שהסוקרים השונים מבצעים מניפולציות במידע הגולמי שהם מפיקים מתשאול הנסקרים. כיצד לפלח את אחוזי המצביעים בקרב אוכלוסיות שונות ואיך לפענח את כוונות ההצבעה של המתלבטים הן רק שתי דוגמאות טריוויאליות להחלטות שהסוקרים נאלצים לבצע בהרכבתם את תוצאות הסקר. אבל אם כל סוקר היה עושה זאת בנפרד, בחדר סגור ובלי גישה לתקשורת, היינו מצפים להבדלים בין ההנחות של הסוקרים השונים, שרק היו מגדילים את פיזור התוצאות בין הסקרים!
אלא אם כן...
התופעה שאנו עדים לה מכונה עדריות (herding), והיא לא ייחודית לישראל (לניתוח של התופעה בבחירות לקונגרס בארה"ב מאת נייט סילבר, לחצו כאן). אך מתנוסס מעליה תג מחיר ברור: ניתוח-על פשוט של סקרי הבחירות לא צפוי לספק דיווידנדים ברורים לעומת הסתמכות על סקר בודד כלשהו. וכפי שסילבר מסביר, הסכנה היא שאם מובילי העדר לוקים בעיוורון, לא יהיה מי שיצעק שהמלך עירום.
מדוע זה קורה? האם זה מפתיע? מה היה בבחירות קודמות? ומה ההשפעה על היכולת שלנו לנבא את תוצאות הבחירות? בואו נקדיש לכך קצת מחשבה...
אנחנו כבר קרובים מאוד ליום הבחירות, ובשלב הזה אפשר להפסיק להיתמם. ברור שסקר בחירות איננו מדגם אקראי טהור. אין הרבה מקום לספק בכך שהסוקרים השונים מבצעים מניפולציות במידע הגולמי שהם מפיקים מתשאול הנסקרים. כיצד לפלח את אחוזי המצביעים בקרב אוכלוסיות שונות ואיך לפענח את כוונות ההצבעה של המתלבטים הן רק שתי דוגמאות טריוויאליות להחלטות שהסוקרים נאלצים לבצע בהרכבתם את תוצאות הסקר. אבל אם כל סוקר היה עושה זאת בנפרד, בחדר סגור ובלי גישה לתקשורת, היינו מצפים להבדלים בין ההנחות של הסוקרים השונים, שרק היו מגדילים את פיזור התוצאות בין הסקרים!
אלא אם כן...
מדוע זה קורה? האם זה מפתיע? מה היה בבחירות קודמות? ומה ההשפעה על היכולת שלנו לנבא את תוצאות הבחירות? בואו נקדיש לכך קצת מחשבה...
ראשית, הבה ניזכר בתמונת הסקרים של סוף השבוע האחרון:
בטבלה שלעיל מופיעות תוצאות הסקרים השונים עבור שבע המפלגות הגדולות על-פי תחזית בטל בשישים מסוף השבוע האחרון. בתחתית הטבלה מופיע ממוצע הסקרים, ולידו הטווח בין התוצאה הגדולה ביותר לקטנה ביותר (מדד "מקסימום - מינימום"). תוצאות-הקיצון עבור כל מפלגה מודגשות ולידן מופיע המרחק שלהן מן הממוצע השבועי. ניתן לראות שהפיזור בתוצאות קטן מאוד. עבור הרשימה המשותפת, למשל, כל התוצאות הן תוצאות-קיצון (עבור קוראינו האדוקים, אולי אין זה מפתיע). אך גם עבור יש עתיד נרשם כעת קונצנזוס כמעט מוחלט בין הסוקרים, וכנ"ל עבור המחנה הציוני.
למה היינו מצפים במקרה תקין? עבור הליכוד, לדוגמא, במדגם של 500 נשאלים, רווח בר-סמך של 66% הוא כ-2 מנדטים לכל כיוון. מכיוון שממוצע המנדטים של הליכוד בסקרים היה 22.8, פירושו של דבר שבערך שליש מהתוצאות היו צריכות להיות מחוץ לטווח שבין 20.8 ל-24.8, בעוד שבמציאות לא הופיעה תוצאה כזו אפילו בסקר אחד בשבוע שעבר (מתוך שלושה-עשר). למעשה, בהינתן ממוצע הסקרים, אף-אחד מהסקרים הבודדים לא היווה הפתעה של יותר משני מנדטים(!), מלבד במספר מקרים עבור מפלגת ש"ס.
תוצאות סקרי השבוע הקודם (11-17 ימים לבחירות), הממוצע שלהם, מדד מקס'-מינ' וסטיית התקן |
למה היינו מצפים במקרה תקין? עבור הליכוד, לדוגמא, במדגם של 500 נשאלים, רווח בר-סמך של 66% הוא כ-2 מנדטים לכל כיוון. מכיוון שממוצע המנדטים של הליכוד בסקרים היה 22.8, פירושו של דבר שבערך שליש מהתוצאות היו צריכות להיות מחוץ לטווח שבין 20.8 ל-24.8, בעוד שבמציאות לא הופיעה תוצאה כזו אפילו בסקר אחד בשבוע שעבר (מתוך שלושה-עשר). למעשה, בהינתן ממוצע הסקרים, אף-אחד מהסקרים הבודדים לא היווה הפתעה של יותר משני מנדטים(!), מלבד במספר מקרים עבור מפלגת ש"ס.
האם זו תופעה חריגה? מהתבוננות בנקודת הזמן המקבילה בשתי מערכות הבחירות האחרונות, מסתבר שכן. בטבלאות הבאות מופיעה תמונת הסקרים השבועית עבור המפלגות הגדולות כ-10 ימים לפני הבחירות ב-2009 ו-2013:
ניתן להיווכח מיד שבבחירות הקודמות התוצאות היו הרבה פחות צפופות. כמעט עבור כל מפלגה היו תוצאות חריגות פה ושם, רחוקות כ-2 מנדטים לפחות מהממוצע. מדד המקס'-מינ' מגיע ל-5-6 על-פי רוב עבור המפלגות הגדולות ביותר, בניגוד ל-2-3 בבחירות הנוכחיות. מדד נוסף המבטא את פיזור התוצאות הוא כמובן סטיית התקן. כפי שניתן לראות בטבלאות, בשבוע שעבר לאף מפלגה מלבד ש"ס לא נמדדה סטיית-תקן גדולה מ-1, ושוב המצב חמור יותר מבעבר.
תוצאות סקרי השבוע המקביל, 11-17 ימים לפני בחירות 2009 |
תוצאות סקרי השבוע המקביל, 11-17 ימים לפני בחירות 2013 |
כל מי שהתנסה ברעיית-צאן (או שראה מערבון או שניים בחייו), יודע שהעדר נוטה להיות צפוף יותר ככל שמתקדמים לראש הקבוצה. כשמדובר בסקרי בחירות עדריים, המקבילה היא שככל שיום הבחירות מתקרב, הסקרים הולכים ומתקרבים לממוצע, מחשש להציג תוצאות חריגות שיבדילו אותם מהרוב ויחשפו אותם להשפלה אפשרית. עד כמה, אם כן, העדריות בבחירות 2015 מובהקת?
בטבלה שלהלן ניתן לראות את פיזור תוצאות הסקרים עבור המחנה הציוני, החל מ-90 ימים לפני הבחירות ועד לסוף השבוע האחרון. על הגרף מופיע גם הממוצע הנע של סקרי השבוע האחרון בכל נקודת זמן (להסבר על ממוצע-נע ודיון ביתרונותיו, מומלץ לקרוא את הפוסט שלנו: "האם שלושים זה הארבעים החדש?", מבחירות 2013), ורווח בר-הסמך של 66% על-פי השגיאה הסטטיסטית המתאימה לממוצע המנדטים (בהנחת מדגם של כ-500 נשאלים). הקווים האנכיים בגרף מציינים את השבוע האחרון והשבוע שלפניו. לבסוף, בירוק מסומנים הסקרים של מינה צמח ומנו גבע.
המנדטים למחנ"צ בסקרי 2015. הציר האופקי מציין את מספר הימים לבחירות. (לחצו להגדלה) |
ניתן לראות שפיזור התוצאות עבור המחנה הציוני קטן מאוד לאורך כל מערכת הבחירות האחרונה, למרות דיבורים חוזרים ונשנים על "המראות" ו"קריסות" בקמפיין הבחירות שלו. הסקרים של מינה צמח יציבים מאוד גם הם, ובאופן עקבי נמצאים מעט מעל הממוצע.
אז אולי מינה צמח יודעת משהו שהאחרים לא יודעים? ניתוח מעניין נוסף באתר 538, מראה שכאשר ישנו סוקר בעל "סטנדרט-זהב" שעורך סקרים במירוץ מסוים, ישנה נטייה מובהקת לעדריות-יתר בקרב הסוקרים האמינים-פחות, לעומת מירוצים שבהם אין "סוסים מיוחסים". בישראל אין הרבה סוקרים וגם אין הרבה מירוצי בחירות. זאת לעומת ארה"ב, למשל, שם פועלים כ-300 סוקרים שונים ובכל ארבע שנים ישנם 536 מירוצים לקונגרס ונשיאות, עוד כ-468 (לבית הנבחרים ושליש מהסנאט) בכל מחצית כהונה, וזאת בנוסף לאינספור מירוצי פריימריז. על כן בישראל קשה (בהרבה!) לתת ציון סוקרים מהימן (זו אחת הסיבות לכך שמודל הניבוי של בטל בשישים נותן עדיפות נמוכה להעדפות בין סוקרים). פרוייקט 61, אותו הזכרנו מספר פעמים בעבר, פיתח ציון כזה על-פי המרשם של נייט סילבר וכייל אותו לפי מערכות הבחירות האחרונות בישראל. באופן עקבי מקבלת מינה צמח את הציון הגבוה ביותר מבין הסוקרים בישראל. ב-2013 היא לא רק דייקה יותר מכולם, אלא גם היתה היחידה שניפקה תחזית טובה יותר מזו של בטל בשישים (מאז עבר המודל מקצה שיפורים, שבקרוב נראה את תוצאותיו..).
כיצד נראים מכונים אחרים לעומת מינה צמח? בואו נביט בשתי דוגמאות נוספות ממערכת הבחירות הנוכחית:
המנדטים ליש עתיד בסקרי 2015. הציר האופקי מציין את מספר הימים לבחירות. (לחצו להגדלה) |
המנדטים לליכוד בסקרי 2015. הציר האופקי מציין את מספר הימים לבחירות. (לחצו להגדלה) |
בגרף של יש עתיד, מסומנים הסקרים של מינה צמח בירוק לצד אלו של מכון גיאוקרטוגרפיה של פרופ' אבי דגני באדום. בגרף של הליכוד, לצד מינה צמח בירוק מסומנים הסקרים של מכון טלסקר באדום. אלו אמנם רק שתי דוגמאות, אך המספרים מדברים בעד עצמם. לקראת סוף המירוץ, הסוקררים נצמדים לדבוקה.
ככלל, ניתן לראות שיש פחות ופחות סקרים חורגים ככל שיום הבחירות מתקרב, וכך עולה מגרפים דומים עבור מפלגות נוספות בבחירות 2015 (בפוסט נפרד נפרסם מגוון רחב יותר של גרפים כגון אלה, לטובת המכורים-באמת). נדגיש שוב שבבחירות הקודמות המצב לא היה כל-כך קיצוני, כפי שמדגימים הגרפים הבאים עבור העבודה ב-2006, קדימה ב-2009 והליכוד ב-2013:
המנדטים לעבודה בסקרי 2006. הציר האופקי מציין את מספר הימים לבחירות. (לחצו להגדלה) |
המנדטים לקדימה בסקרי 2009. הציר האופקי מציין את מספר הימים לבחירות. (לחצו להגדלה) |
המנדטים לליכוד בסקרי 2013. הציר האופקי מציין את מספר הימים לבחירות. (לחצו להגדלה) |
בכל המקרים שלעיל העדריות הרבה פחות מובהקת. אמנם אין מספיק סקרים החורגים מרווח בר-הסמך של 66% לאורך מערכות הבחירות השונות, אבל אפקט ההתכנסות לעבר הממוצע לקראת סיום המירוץ - שניכר היטב בנתונים של 2015 - חלש משמעותית בבחירות הקודמות.
לסיום, נשאלת השאלה מה עושים? בהחלט ייתכן שדברים ישתנו השבוע. אך בהיעדר שינוי חד במגמה המסתמנת, משמעות הממצאים שהבאנו כאן היא שכלים פשוטים לעריכת "סקר הסקרים", כגון ממוצע או חציון, יניבו תוצאה שאינה שונה בהרבה מהסקרים עצמם (ואנו לא שוכחים לרגע את החיים עצמם, כמובן). אז האם זו סיבה להתייאש ממשימת הניבוי ופשוט ללכת עם העדר, כצאן לטבח?
אין ספק שהאתגר גדול. עם זאת, מרכיבים שונים במודל הבייסיאני של בטל בשישים פותחו בדיוק על-מנת להתמודד עם קשיים כגון אלו שתוארו כאן. הכיצד? על כך ועוד, בפוסט נפרד בימים הקרובים.
לסיום, נשאלת השאלה מה עושים? בהחלט ייתכן שדברים ישתנו השבוע. אך בהיעדר שינוי חד במגמה המסתמנת, משמעות הממצאים שהבאנו כאן היא שכלים פשוטים לעריכת "סקר הסקרים", כגון ממוצע או חציון, יניבו תוצאה שאינה שונה בהרבה מהסקרים עצמם (ואנו לא שוכחים לרגע את החיים עצמם, כמובן). אז האם זו סיבה להתייאש ממשימת הניבוי ופשוט ללכת עם העדר, כצאן לטבח?
אין ספק שהאתגר גדול. עם זאת, מרכיבים שונים במודל הבייסיאני של בטל בשישים פותחו בדיוק על-מנת להתמודד עם קשיים כגון אלו שתוארו כאן. הכיצד? על כך ועוד, בפוסט נפרד בימים הקרובים.
ניתוח מצויין (אם גם מייאש קמעא), תודה.
השבמחק