روزنوشت‌های من

آرام‌گاه تأمل‌های گاه‌ و بیگاه‌ام

آیا پرسپولیس بهترین خط دفاع جهان را دارد؟

تأملی در باب استنتاج‌های مخدوش آماری

چندی پیش، باشگاه پرسپولیس اعلام کرد که در مقایسۀ جدول لیگ برتر ایران با جداول لیگ‌های کشورهای دیگر، این تیم کمترین تعداد گل خورده در بازی را داشته است و لذا «بهترین خط دفاع جهان» را دارد. این خبر یا خبرسازی (حتی صرف‌نظر از ایرادی که خبرگزاری مهر مطرح کرده بود که یک تیم یونانی از لحاظ این معیار، عملکرد بهتری داشته است) ابتدا به ساکن مضحک به نظر می‌رسد، اما با قدری دقت در علت مخدوش بودن آن، به نتایج جالبی رسیدم که در نگاه اول چندان بدیهی نیستند.

پیش از بررسی این استنتاج آماری، یک نکتۀ مقدماتی را باید مطرح کنم. معیار بیشترین گل زده و کمترین گل خورده اساساً بر مبنای یک نسخۀ ساده‌سازی‌شده از بازی فوتبال مطرح می‌شود: اینکه هر تیم از دروازه‌بان، خط دفاع، خط میانی و خط حمله تشکیل شده است و خط حمله مسؤول گل‌های زدۀ تیم و خط دفاع (به همراه دروازه‌بان) مسؤول گل‌های خوردۀ تیم است. مشخصاً این ساده‌سازی درست نیست چرا که این خطوط با همدیگر همکاری دارند و مدافعین گل‌زن یا مهاجمین مدافع نیز در طول بازی‌ها دیده می‌شوند. با این حال، در ادامۀ این بحث، بر اساس همین ساده‌سازی جلو می‌رویم.

دربارۀ خبرسازی باشگاه پرسپولیس، اولین خدشۀ بدیهی آن است که مقایسۀ بافت میان لیگ‌ها انجام نشده است. به تعبیری، خط دفاع پرسپولیس در برابر هاشم بیگ‌زاده امتحان پس داده است و خط دفاع رئال مادرید در برابر لیونل مسی! برای اصلاح این مقایسۀ میان‌بافتی نیز راهکار چندانی در دست نیست مگر آنکه تیم‌های دو لیگ با هم بازی کرده باشند.

از این ایراد مقدماتی لاینحل که بگذریم، یک مسئلۀ دیگر خودنمایی می‌کند: شاید در مقایسۀ میان دو لیگ، خطوط حملۀ تیم‌های یک لیگ به طور کلی ضعیف‌تر از لیگ دیگر باشد. لذا ضعف خطوط حمله در یک لیگ را نباید به پای قوت خطوط دفاع در لیگ دیگر نوشت. مثلاً فرض کنید متوسط گل زده در یک لیگ 6 گل در بازی و متوسط گل زده در یک لیگ دیگر 2 گل در بازی باشد. بدین ترتیب، معیار «متوسط گل خورده در بازی» برای اکثر تیم‌های لیگ دوم مقدار کمتری را نشان خواهد داد. البته اگر «متوسط گل خوردۀ یک تیم در بازی‌هایش» را بر «متوسط گل زده در کل بازی‌های لیگ» تقسیم کنیم، مشکل تا حدودی حل می‌شود، اما این معیار هم نمی‌تواند مشکل را به طور کامل حل کند.

مراقب باشیم قدرت خط حملۀ یک تیم را به پای قدرت خط دفاعش ننویسیم!

در تأمل پیرامون این خبرسازی باشگاه پرسپولیس، در این مرحله مسألۀ تأثیر خط حمله برای من پررنگ شد. این مسأله، دلالت‌های مهمی در آمارهای مقایسه‌ای درون‌لیگی (در یک لیگ خاص) نیز دارد که این قسمت مهمترین بخش ماجراست. آیا پرسپولیس بهترین خط دفاع لیگ را دارد؟

مدل ساده‌سازی‌شدۀ بازی فوتبال را دوباره در نظر بگیرید. فرض کنید تیم الف و ب هرکدام با تیم ج بازی کنند. در شرایط برابر، اگر تیم ج بتواند به تیم الف بیشتر از تیم ب گل بزند، می‌توان گفت خط دفاع تیم ب قوی‌تر عمل کرده است؛ و اگر تیم الف بتواند بیشتر از تیم ب به تیم ج گل بزند، می‌توان گفت خط حملۀ تیم الف قوی‌تر عمل کرده است. پس ملاک مقایسه، بازی برابر خط حمله‌ها و خط دفاع‌های مشابه است.

تا اینجا احتمالاً یک نکته روشن می‌شود: مقایسۀ دو تیم در یک لیگ باید یا در نیم‌فصل یا ترجیحاً در پایان فصل (برای لحاظ کردن بازی‌های در خانه و خارج از خانه) انجام شود تا هر دو تیم با تیم‌های مشابه بازی کرده باشند؛ چون مثلاً در اواسط نیم‌فصل دوم، ممکن است یک تیم با راه‌آهن سورینت دوبار بازی کرده باشد و یک تیم دیگر با استقلال دوبار بازی کرده باشد!

اما دلالت‌های ماجرای «قوت خط حمله را به پای خط دفاع گذاشتن» در مقایسۀ درون‌لیگی هم خودنمایی می‌کند. گفتیم که اگر تیم‌های الف و ب با تیم ج (یا مجموعۀ تیم‌های ثالث) بازی کرده باشند، مقایسۀ نتایج‌شان بر اساس آن مدل ساده‌سازی‌شده از بازی فوتبال می‌تواند کار درستی باشد. اما در بازی رودرروی این تیم‌های الف و ب چه اتفاقی می‌افتد؟ در این بازی، خط دفاع تیم الف در برابر خط حملۀ تیم ب محک می‌خورد، و خط دفاع تیم ب در برابر خط حملۀ تیم الف. لذا این بازی خاص برای مقایسۀ خطوط دفاع و حملۀ دو تیم، کاندیدای مناسبی نیست. فرض کنید خط حملۀ تیم الف بسیار قوی‌تر از خط حملۀ تیم ب باشد، در این صورت تعداد گل‌های خوردۀ تیم ب بیشتر از تعداد گل‌های خوردۀ تیم الف خواهد بود، اما این نشانۀ آن نیست که خط دفاع ب ضعیف‌تر از خط دفاع الف است. (دقت کنید که این نکته درمورد بازی با تیم‌های ثالث صادق نبود.)

لذا برای مقایسۀ خط دفاع یا خط حملۀ دو تیم در یک لیگ بر اساس متوسط تعداد گل خورده یا تعداد گل زده در هر بازی (که این مقایسه بهتر است در پایان فصل انجام شود)، باید از بازی رودرروی این دو تیم صرف‌نظر کرد. این مسأله برای تیم‌هایی که آماری نزدیک به هم دارند، اهمیت پیدا می‌کند و اگر با این روش اصلاح‌شده تیم‌‌ها را مقایسه کنیم ممکن است جای تیم‌های نزدیک به هم در جدول بهترین خط دفاع یا بهترین خط حمله عوض شود.

کل این ماجرا، یک دلالت جذاب دیگر هم دارد! یکی دیگر از آمارهای مرسوم در لیگ، بهترین گلزن است. در نگاه اول، ماجرای «تأثیر خط دفاع بر حمله و بالعکس» برای بهترین گلزن صدق نمی‌کند. اما اگر بخواهیم توان گل‌زنی دو مهاجم را با هم مقایسه کنیم، باید دوباره این کار را در بافت تیمی انجام دهیم. اگر دو مهاجم متعلق به یک تیم باشند، مقایسۀ کل تعداد گل‌های زدۀ آنها می‌تواند یک معیار نسبی از توان گل‌زنی آنها باشد. اما اگر دو مهاجم متعلق به دو تیم باشند، طبق توضیحات بالا باید گل‌های زده در بازی‌های رودرروی آن دو تیم را از آمار آنها حذف کنیم و سپس آمار را مقایسه کنیم: اگر مهاجم ایکس از تیم الف را با مهاجم وای از تیم ب مقایسه می‌کنیم، در بازی رودرروی این دو تیم، مهاجم ایکس در برابر خط دفاع تیم ب بازی کرده است و مهاجم وای در برابر خط دفاع تیم الف. لذا باید توان گل‌زنی این دو مهاجم در برابر تیم‌های «ج» بی‌طرف را مقایسه کرد. (طبعاً همین مسأله برای مقایسۀ توان دروازه‌بانی دو دروازه‌بان نیز صادق است.)

+ نوشته شده در  ۱۳۹۲/۱۰/۲۸ساعت   توسط محمد معماريان  | 

یک پارادوکس منطقی در نظریه‌ی تصمیم‌گیری

در دوران انتخابات ریاست‌جمهوری، وضعیت رأی‌دهنده‌ی الف را در نظر بگیرید که معتقد است نباید کاندیدای مطلوب انگلستان رأی بیاورد، و برای کشف اینکه کاندیدای مطلوب انگلستان کیست به بی‌بی‌سی رجوع می‌کند. فرض کنید بی‌بی‌سی به صراحت خواستار رأی دادن به کاندیدای ایکس می‌شود.

مرحله‌ی اول استنتاج: الف با خود فکر می‌کند که بی‌بی‌سی می‌خواهد ایکس رأی بیاورد، «پس من به ایکس رأی نمی‌دهم.»

مرحله‌ی دوم استنتاج: اکنون الف به این فکر می‌افتد که شاید بی‌بی‌سی می‌دانسته است که من طبق مرحله‌ی اول فکر خواهم کرد، و در واقع بی‌بی‌سی نمی‌خواسته است که ایکس رأی بیاورد؛ و این حقه را به کار بسته است تا من به ایکس رأی ندهم. «پس من به ایکس رأی می‌دهم.»

فرد الف می‌تواند این مراحل استنتاج را تا بی‌نهایت مرحله ادامه بدهد، و به هیچ جواب مشخصی نمی‌رسد. این پارادوکس که به گمانم ذیل عنوان کلی مسائل Common Knowledge (مانند مسئله‌ی معروف «جزیره‌ی چشم‌آبی‌ها») مطرح می‌شود نشان‌گر یک خدشه‌ی جدی در انواع تحلیل‌هایی است که بر این اساس استوارند.


پی‌نوشت: این پارادوکس در اپیزودهایی از سریال‌های فرندز و فرینج مطرح شده است. یادتان می‌آید؟!

+ نوشته شده در  ۱۳۹۲/۱۰/۲۱ساعت   توسط محمد معماريان  |