איך חוזים תוצאות משחקים

מערכת קשר אחורי
8 דקות קריאה

במשך שנים, הניסיון לחזות תוצאות כדורגל היה נראה כמו תרגיל בחשבונאות יותר מאשר ניתוח ספורט. אנשים הסתכלו על הכדורגל דרך משקפיים של אקסל: אם קבוצה א' הבקיעה 20 שערים וקבוצה ב' הבקיעה 10, אז קבוצה א' תנצח. אם לריאל מדריד יש דירוג ELO של 2000 ולחטאפה יש 1600, המשוואה פתורה. הגישה הזו הניחה שכדורגל הוא ליניארי. שאפשר לקחת את העבר, לעשות ממוצע, ולקבל את העתיד. אבל כדורגל הוא לא בייסבול והוא בטח לא משוואה ריבועית. הוא כאוס מאורגן. הגישה הישנה ספרה את ה"מה" (שערים, ניצחונות), אבל פספסה לחלוטין את ה"למה". היא התייחסה למשחק כאל רצף מספרים אקראי, במקום כאל מערכת דינמית של בני אדם ושטחים.

וזה בדיוק המקום שבו אנחנו נמצאים היום. המעבר ממספרים שמתארים היסטוריה, למודלים שמנסים לפצח את המכניקה של המשחק. אז ואו נדבר על – איך באמת עושים את זה.

שלב 1: לנקות את הרעש הסטטיסטי קודם כל, בואו נזרוק לפח את מה שלא עובד. בגזרת הלא-רלוונטי: אנחנו מוצאים את מודלים שמנסים לשחק עם סטטיסטיקה כללית בלי להבין כלל את מאפייני הכדורגל. היסטורית, סטטיסטיקאים היו לוקחים משתנים כמו מספר השערים שכל קבוצה כבשה בעבר, מספר בעיטות לשער, את מי היא ניצחה ומכניסים אותם למודל סטטיסטי. זה נשמע הגיוני בתיאוריה, אבל זה לא רלוונטי כי אין את "הקוד לפיצוח הכדורגל" במספרים הללו. לספור "בעיטות לשער" זה כמו לספור כמה פעמים סופר הקליד על המקלדת כדי לדעת אם הספר יהיה טוב. בעיטה דרדל'ה מ-40 מטר ובעיטה מול שער ריק נספרו בעולם הישן כאותו נתון בדיוק ("בעיטה למסגרת"). המודל הישן היה עיוור להקשר.

שלב 2: מהפכת האיכות (xG) השינוי הגדול התחיל כשעברנו מלספור כמות, למדוד איכות. מודלי ה"צדק" והשערים הצפויים (xG): באמצע העשור הקודם נכנס ה-xG לתמונה – היכולת לתת ערך מספרי לאיכות של כל ההזדמנויות שהיו על המגרש. פתאום, יכולנו להגיד משהו חכם יותר מאשר "הם החמיצו". יכולנו לכמת את הכישלון או ההצלחה. והסתבר, שאם מסתכלים על היסטוריית הביצועים של קבוצה לפי השערים שהקבוצה הייתה אמורה לכבוש, ולא דווקא כבשה בפועל, מצליחים לשפר את חיזוי הביצועים שלה במשחקים הבאים? התשובה היא כן. למה? ניקוי רעש. תוצאת הסיום של משחק בודד היא שקרן ידוע. היא מושפעת ממזל, טעויות שיפוט ויום רע של שוער. אבל היכולת להגיע להזדמנויות היא יכולת שמתארת את איכות הקבוצה יותר טוב מ-האם הצלחתי להבקיע אותן במשחק הנוכחי. קבוצה שמייצרת מצבים באופן עקבי היא קבוצה בריאה, גם אם הכדור לא נכנס בשבועיים האחרונים.

שלב 3: לתמחר את הבלתי נראה (xT) אבל ה-xG הוא רק ההתחלה. הוא מטפל בבעיטה, אבל מה עם כל מה שקרה לפניה? מה עם הקשר האחורי שנתן את המסירה ששברה את קו ההגנה, אבל לא נכנס לסטטיסטיקה כי הוא לא בעט ולא בישל? וזה לא נגמר רק בשערים צפויים. מודלים שהמשיכו את הרעיון התחילו לתת גם ניקוד לאיום צפוי (xT) ובכלל לכל פעולה שהייתה על המגרש לפי כמה שהיא העלתה או הורידה את הסיכוי לגול ברגעים הקרובים. זה הרגע שבו האנליטיקה מתחילה להעריך את ה"פועלים השחורים" של המשחק. שחקנים כמו בוסקטס בזמנו, או רודרי היום, הם מלכי המודלים האלו. הם אולי לא מופיעים בתקציר, אבל כל נגיעה שלהם בכדור מעלה את ההסתברות של הקבוצה להבקיע ב-3% או 4%. תצברו מספיק פעולות כאלו – וקיבלתם ניצחון. אבל אלו מודלים מסוג של "אל תנסו את זה בבית". המורכבות רק בלאסוף את כל הנתונים, עוד לפני המודל עצמו, היא גבוהה מאוד. זה כבר לא אקסל, זה ביג-דאטה.

שלב 4: הפיזיקה של המרחב (Pitch Control) עד עכשיו דיברנו על הכדור. אבל רוב המשחק מתנהל כשהשחקנים בכלל לא נוגעים בו. כאן נכנסת הפיזיקה. מודלי המרחב והשליטה במגרש: ב-2018 הייתי בכנס האנליטיקס ב MIT Sloan ואחד הנושאים החמים שדוברו שם היה שיתוף הפעולה בין קבוצת מדעני הנתונים של ברצלונה (כן, יש כזו) ובין סטטיסטיקאי הכדורסל לוק בורן כדי ליצור מודלים שיודעים לזהות את מיקומי השחקנים על המגרש ולתת מדד סיכון לעמידה הקבוצתית כולה, ולא רק לשחקן הבודד.

תחשבו על המושג "שטח מת". בעיניים שלנו זה סתם דשא ריק. במודל מתמטי, זה שדה קרב של הסתברויות. תחשבו על זה רגע – אם אנחנו יודעים היכן ממוקמים כל 11 השחקנים של הקבוצה, הצפיפות שלהם, הזוויות ביניהם, השטח שהם מכסים – אנחנו יכולים להעריך, בצורה טובה יותר מקודם – 1. מה הסיכוי שלהם להגיע למצב מסוכן בקרוב 2. עד כמה הם מאורגנים כנגד התקפת היריבה שיכולה להגיע.

ואם אנחנו עושים את זה לאורך מספר רב של משחקים, אפשר לזהות תבניות שנותנות לקבוצה אחת יתרון על פני קבוצה אחרת. זה המקום שבו מזהים קבוצה שעומדת לקרוס הגנתית עוד לפני שהיא ספגה גול אחד. המבנה שלה לא נכון, המרווחים גדולים מדי. ה-ELO לא רואה את זה, טבלת הליגה לא רואה את זה, אבל המודל המרחבי רואה את זה בבירור. החבר'ה מברצלונה הם לא היחידים שעושים את זה, כמובן. וויליאם ספירמן, הפיזיקאי שאחראי על האנליטיקה של ליברפול, גם עובד עם מודלים של דינמיקה במרחב, ומן הסתם יש אחרים שכרגע פחות זוכים לפרסום. רמת קושי: את זה בטוח אל תנסו בבית.

שלב 5: המטריקס (סימולציות) הגענו לקצה הפירמידה. אם הבנו את האיכות (xG), את בניית ההתקפה (xT) ואת המרחב (Pitch Control), השלב הבא הוא להפסיק לנתח את העבר ולהתחיל לייצר את העתיד. אחרון חביב: סימולציות סימולציות הן אחד הכלים האהובים עליי, כי מה שסימולציה אומרת זה: עזוב לתכנן "מלמעלה" מה יקרה. אם תדע להסביר למודל שלך את הדינמיקות של המשחק, ותזרוק פנימה נתונים שיודעים לתאר את האופן שבו קבוצה א' וקבוצה ב' משחקות – תוכל להעריך מה יקרה.

כאן אנחנו נכנסים לטריטוריה של Google DeepMind ופרויקטים כמו TacticAI. הרעיון הוא לא לנחש תוצאה, אלא לשחק את המשחק אלפי פעמים לפני שהוא קרה. בסימולציה מורכבת בטח בעידן ה-AI וה-DeepMind, מכניסים פנימה כמות עצומה של משתנים שיכולה לדמות כל מיקרו-סיטואציה שהגיוני שתקרה במשחק. המודל לומד את ההרגלים של השחקנים, את התגובות שלהם ללחץ, את דפוסי התנועה. הוא מריץ 5,000 משחקים וירטואליים ונותן למאמן מפת סיכונים: "אם תלחץ גבוה בדקה ה-60, ב-70% מהמקרים תנצח, וב-30% תיחשף למתפרצת קטלנית". זה מדהים, אבל לוקח הרבה מאוד זמן והרבה מאוד כסף לאמן מודלים גדולים כאלו לזהות מה באמת סביר שיקרה ומה רעש.

בחזרה לקרקע אז מה עושים בלי מחשבי על ומצלמות מעקב? האם חזרנו לנקודת ההתחלה? לא. כי גם בלי הטכנולוגיה, אנחנו יכולים לאמץ את צורת החשיבה. אבל לא חייבים עוזר בינה מלאכותית כדי לייצר סימולציה בסיסית. החוכמה היא להפסיק להסתכל על הטבלה ולהתחיל להסתכל על המאצ'-אפ. לרוב אפשר להתחיל מאיפיון של איך כל קבוצה מנסה להבקיע את השערים שלה, באיזו תדירות ומה היכולת של היריבה להתגונן. אנחנו יכולים להריץ את ה"סימולציה" בראש שלנו: איך הלחץ הגבוה של קבוצה א' יפגוש את הנעת הכדור האיטית של קבוצה ב'? האם היתרון של קבוצה ג' במצבים נייחים פוגש את החולשה הכי גדולה של היריבה שלה? אפשר לחשוב על זה כמו הכנה טקטית בחדר המאמנים, רק הרבה יותר חדה על המספרים.

בסופו של דבר, ההבדל בין המהמר שניחש נכון למקצוען שידע מה יקרה, הוא לא המזל, אלא העומק. המהמר מסתכל על השורה התחתונה; המקצוען מבין את המנגנון שמייצר אותה. והמנגנון הזה, מתברר, הרבה פחות אקראי ממה שחשבנו.

לשיתוף הכתבה
אין תגובות