آیا پرسپولیس بهترین خط دفاع جهان را دارد؟
تأملی در باب استنتاجهای مخدوش آماری
چندی پیش، باشگاه پرسپولیس اعلام کرد که در مقایسۀ جدول لیگ برتر ایران با جداول لیگهای کشورهای دیگر، این تیم کمترین تعداد گل خورده در بازی را داشته است و لذا «بهترین خط دفاع جهان» را دارد. این خبر یا خبرسازی (حتی صرفنظر از ایرادی که خبرگزاری مهر مطرح کرده بود که یک تیم یونانی از لحاظ این معیار، عملکرد بهتری داشته است) ابتدا به ساکن مضحک به نظر میرسد، اما با قدری دقت در علت مخدوش بودن آن، به نتایج جالبی رسیدم که در نگاه اول چندان بدیهی نیستند.
پیش از بررسی این استنتاج آماری، یک نکتۀ مقدماتی را باید مطرح کنم. معیار بیشترین گل زده و کمترین گل خورده اساساً بر مبنای یک نسخۀ سادهسازیشده از بازی فوتبال مطرح میشود: اینکه هر تیم از دروازهبان، خط دفاع، خط میانی و خط حمله تشکیل شده است و خط حمله مسؤول گلهای زدۀ تیم و خط دفاع (به همراه دروازهبان) مسؤول گلهای خوردۀ تیم است. مشخصاً این سادهسازی درست نیست چرا که این خطوط با همدیگر همکاری دارند و مدافعین گلزن یا مهاجمین مدافع نیز در طول بازیها دیده میشوند. با این حال، در ادامۀ این بحث، بر اساس همین سادهسازی جلو میرویم.
دربارۀ خبرسازی باشگاه پرسپولیس، اولین خدشۀ بدیهی آن است که مقایسۀ بافت میان لیگها انجام نشده است. به تعبیری، خط دفاع پرسپولیس در برابر هاشم بیگزاده امتحان پس داده است و خط دفاع رئال مادرید در برابر لیونل مسی! برای اصلاح این مقایسۀ میانبافتی نیز راهکار چندانی در دست نیست مگر آنکه تیمهای دو لیگ با هم بازی کرده باشند.
از این ایراد مقدماتی لاینحل که بگذریم، یک مسئلۀ دیگر خودنمایی میکند: شاید در مقایسۀ میان دو لیگ، خطوط حملۀ تیمهای یک لیگ به طور کلی ضعیفتر از لیگ دیگر باشد. لذا ضعف خطوط حمله در یک لیگ را نباید به پای قوت خطوط دفاع در لیگ دیگر نوشت. مثلاً فرض کنید متوسط گل زده در یک لیگ 6 گل در بازی و متوسط گل زده در یک لیگ دیگر 2 گل در بازی باشد. بدین ترتیب، معیار «متوسط گل خورده در بازی» برای اکثر تیمهای لیگ دوم مقدار کمتری را نشان خواهد داد. البته اگر «متوسط گل خوردۀ یک تیم در بازیهایش» را بر «متوسط گل زده در کل بازیهای لیگ» تقسیم کنیم، مشکل تا حدودی حل میشود، اما این معیار هم نمیتواند مشکل را به طور کامل حل کند.
مراقب باشیم قدرت خط حملۀ یک تیم را به پای قدرت خط دفاعش ننویسیم!
در تأمل پیرامون این خبرسازی باشگاه پرسپولیس، در این مرحله مسألۀ تأثیر خط حمله برای من پررنگ شد. این مسأله، دلالتهای مهمی در آمارهای مقایسهای درونلیگی (در یک لیگ خاص) نیز دارد که این قسمت مهمترین بخش ماجراست. آیا پرسپولیس بهترین خط دفاع لیگ را دارد؟
مدل سادهسازیشدۀ بازی فوتبال را دوباره در نظر بگیرید. فرض کنید تیم الف و ب هرکدام با تیم ج بازی کنند. در شرایط برابر، اگر تیم ج بتواند به تیم الف بیشتر از تیم ب گل بزند، میتوان گفت خط دفاع تیم ب قویتر عمل کرده است؛ و اگر تیم الف بتواند بیشتر از تیم ب به تیم ج گل بزند، میتوان گفت خط حملۀ تیم الف قویتر عمل کرده است. پس ملاک مقایسه، بازی برابر خط حملهها و خط دفاعهای مشابه است.
تا اینجا احتمالاً یک نکته روشن میشود: مقایسۀ دو تیم در یک لیگ باید یا در نیمفصل یا ترجیحاً در پایان فصل (برای لحاظ کردن بازیهای در خانه و خارج از خانه) انجام شود تا هر دو تیم با تیمهای مشابه بازی کرده باشند؛ چون مثلاً در اواسط نیمفصل دوم، ممکن است یک تیم با راهآهن سورینت دوبار بازی کرده باشد و یک تیم دیگر با استقلال دوبار بازی کرده باشد!
اما دلالتهای ماجرای «قوت خط حمله را به پای خط دفاع گذاشتن» در مقایسۀ درونلیگی هم خودنمایی میکند. گفتیم که اگر تیمهای الف و ب با تیم ج (یا مجموعۀ تیمهای ثالث) بازی کرده باشند، مقایسۀ نتایجشان بر اساس آن مدل سادهسازیشده از بازی فوتبال میتواند کار درستی باشد. اما در بازی رودرروی این تیمهای الف و ب چه اتفاقی میافتد؟ در این بازی، خط دفاع تیم الف در برابر خط حملۀ تیم ب محک میخورد، و خط دفاع تیم ب در برابر خط حملۀ تیم الف. لذا این بازی خاص برای مقایسۀ خطوط دفاع و حملۀ دو تیم، کاندیدای مناسبی نیست. فرض کنید خط حملۀ تیم الف بسیار قویتر از خط حملۀ تیم ب باشد، در این صورت تعداد گلهای خوردۀ تیم ب بیشتر از تعداد گلهای خوردۀ تیم الف خواهد بود، اما این نشانۀ آن نیست که خط دفاع ب ضعیفتر از خط دفاع الف است. (دقت کنید که این نکته درمورد بازی با تیمهای ثالث صادق نبود.)
لذا برای مقایسۀ خط دفاع یا خط حملۀ دو تیم در یک لیگ بر اساس متوسط تعداد گل خورده یا تعداد گل زده در هر بازی (که این مقایسه بهتر است در پایان فصل انجام شود)، باید از بازی رودرروی این دو تیم صرفنظر کرد. این مسأله برای تیمهایی که آماری نزدیک به هم دارند، اهمیت پیدا میکند و اگر با این روش اصلاحشده تیمها را مقایسه کنیم ممکن است جای تیمهای نزدیک به هم در جدول بهترین خط دفاع یا بهترین خط حمله عوض شود.
کل این ماجرا، یک دلالت جذاب دیگر هم دارد! یکی دیگر از آمارهای مرسوم در لیگ، بهترین گلزن است. در نگاه اول، ماجرای «تأثیر خط دفاع بر حمله و بالعکس» برای بهترین گلزن صدق نمیکند. اما اگر بخواهیم توان گلزنی دو مهاجم را با هم مقایسه کنیم، باید دوباره این کار را در بافت تیمی انجام دهیم. اگر دو مهاجم متعلق به یک تیم باشند، مقایسۀ کل تعداد گلهای زدۀ آنها میتواند یک معیار نسبی از توان گلزنی آنها باشد. اما اگر دو مهاجم متعلق به دو تیم باشند، طبق توضیحات بالا باید گلهای زده در بازیهای رودرروی آن دو تیم را از آمار آنها حذف کنیم و سپس آمار را مقایسه کنیم: اگر مهاجم ایکس از تیم الف را با مهاجم وای از تیم ب مقایسه میکنیم، در بازی رودرروی این دو تیم، مهاجم ایکس در برابر خط دفاع تیم ب بازی کرده است و مهاجم وای در برابر خط دفاع تیم الف. لذا باید توان گلزنی این دو مهاجم در برابر تیمهای «ج» بیطرف را مقایسه کرد. (طبعاً همین مسأله برای مقایسۀ توان دروازهبانی دو دروازهبان نیز صادق است.)