عدد پی در توزیع نرمال
فرض کنید در حال صحبت با شخصی که خیلی ریاضی بلد نیست، هستید؛ به او درمورد قانون اعداد بزرگ و توزیع نرمال توضیح داده و به اینکه توزیع نرمال میتواند توصیفکنندهٔ خیلی چیزها در طبیعت باشد اشاره میکنید. مثلاً به او میگویید که قد افراد در یک منطقهٔ جغرافیایی از توزیع نرمال پیروی میکند. این موضوع برای آن شخص باید خیلی عجیب باشد؛ توزیعی که اکثر چیزهای طبیعی را توصیف میکند، باورنکردنی به نظر میآید. سپس فرض کنید به آن شخص فرمول تابع چگالی احتمال (PDF) توزیع نرمال را نشان داده و اجزایش را توضیح میدهید:
وقتی آن شخص، عدد که نسبت محیط دایره به قطرش است را در این فرمول میبیند، قطعاً فکر میکند که دارید سربهسرش میگذارید! توزیع نرمال چه ربطی به محیط دایره دارد؟
اینکه عدد پی در توزیع نرمال وجود دارد چیزی است که در ابتدا احتمالاً برای ما عجیب بوده و بعد از مدتی بدون گرفتن دلیل قانع کنندهای این موضوع را پذیرفتهایم. اگر هم دنبال دلیل وجودش رفتهایم، احتمالاً به ما گفتهاند دلیلش این است که انتگرال روی برابر است با و بهصورت ریاضیاتی آن را نشان دادهاند.
اما این توضیحات شاید برای بعضی قانعکننده نباشد یا شهود لازم برای درک این موضوع را فراهم نکند. اگر بخواهیم روی این موضوع دقیق شویم، باید سه سوال را جواب بدهیم تا این موضوع برای شخصی که نخستین بار است این موضوع را میبیند، قانعکننده باشد:
- انتگرال چه ارتباطی با دایره و محیطش دارد؟
- اصلاً چرا اینکه با دایره ارتباط دارد طبیعی است؟
- چرا قانون اعداد بزرگ ما را به تابع نمایی میرساند؟
در این متن سعی میکنیم به دو سؤال اول جواب بدهیم.
انتگرال را چگونه میتوان حساب کرد؟ در ریاضی ۱ خواندهایم که انتگرال و مشتق به نوعی برعکس همدیگر هستند، پس اولین راهی که برای محاسبهٔ آن ممکن است به ذهنمان برسد، پیدا کردن تابعیست که مشتقش باشد. اما مشکلی که وجود دارد، این است که انتگرال جواب تحلیلی ندارد. یعنی نمیتوان آن را بر حسب توابعی که میشناسیم، مانند توابع مثلثاتی، لگاریتم و… بیان کرد. پس سوالی که پیش میآید این است که اصلاً چگونه میتوان را حساب کرد؟ برای این کار، تکنیکی استفاده میکنیم که برای کسانی که اولین بار است آن را میبینند، خیلی عجیب به نظر میرسد؛ انتگرال را به یک بعد بالاتر میبریم. یعنی سعی میکنیم را حساب کنیم. واضح است که داریم:
پس اگر را حساب کنیم، با یک رادیکال گرفتن میتوانیم به خواستهٔ سوال برسیم. اگر ریاضی ۲ را به یاد داشته باشید، میتوانید خیلی راحت با تغییر متغیر به دستگاه مختصات قطبی این انتگرال را حساب کنید. ما هم از یک روش مشابه برای بهدست آوردن جواب این انتگرال استفاده میکنیم، اما بدون استفاده از تکینیکهای انتگرال دوگانه و کاملاً به صورت هندسی و شهودی.
برای محاسبۀ اول باید بفهمیم چه چیزی است. چون انتگرال را هم در راستای و هم در راستای روی کل میگیریم و به این معنی است که میخواهیم کل حجم زیرنمودار را با این انتگرال محاسبه کنیم. نمودار این تابع به این شکل است:
اگر دقت کنیم، میبینیم نقاطی که در راستای و فاصلهٔ یکسانی از مبدأ دارند، ارتفاع یکسانی هم دارند. این منطقی است، چون اگر فاصله از مبدأ را در نظر بگیریم، طبق قضیهٔ فیثاغورس داریم ، پس ارتفاع آن نقاط برابر است با . پس این نقاط ارتفاع یکسانی دارند و در نتیجه، یک استوانه را تشکیل میدهند. حال، برای اینکه حجم زیر این سطح را حساب کنیم، یک پوستهٔ خیلی نازک استوانهای (به ضخامت ) و به مرکز محور در نظر میگیریم و سعی میکنیم حجم آن را بهدست بیاوریم. فرض میکنیم شعاع داخلی این استوانه هست، پس ارتفاعش در بازهٔ و قرار میگیرد. ما میتوانیم ارتفاعش را ثابت گرفته و فرض کنیم مساوی با است. این فرض ما با کوچکتر شدن دقیقتر میشود، پس در حد این فرض ما دقیق است (این حرف ما از لحاظ ریاضیاتی دقیق نیست، اما چون هدف ما داشتن شهود به این مسئله است، آن را درست در نظر میگیریم). همچنین اگر را خیلی کوچک در نظر بگیریم، میتوان آن استوانه را طوری بُرید تا به شکل یک صفحهٔ نازک مستطیلی در بیاید:
پس ما حجم این استوانهٔ نازک را با این مستطیل تخمین میزنیم. واضح است که هرچه کوچکتر باشد، این تخمین دقیقتر است. در شکل بالا، و هستند. پس حجم این پوستهٔ استوانهای برابر است با .
اگر نمودار را به این استوانههای خیلی نازک تقسیم کنیم و ضخامت هر استوانه را در نظر بگیریم، حجم کل زیر نمودار برابر با جمع حجم کل این استوانههاست:
حال توانستیم ببینیم که اصلاً عدد پی از کجا در این انتگرال پیدایش شد. اما راستش را بگوییم، احتمالاً خیلی قانعکننده نباشد. اول از همه اینکه ما در محاسبهٔ انتگرال ظاهراً بدون هیچ دلیلی مسئله را از یک تابع تک متغیره به یک تابع دومتغیره تبدیل کردیم. مشکل دوم هم این است که حتی اگر بپذیریم انتگرال روی مساوی با عدد پی میشود، اینکه چرا مسئلهٔ اولیه را یک بعد بالاتر بردیم تا به این تابع برسیم، بهاندازۀ وجود عدد پی در توزیع نرمال عجیب به نظر میرسد.
برای اینکه این موضوع و همچنین تابع کمی طبیعیتر به نظر برسند، نشان میدهیم که اگر روی کل توزیعهای احتمالی دومتغیره و پیوسته، دو شرط خیلی ساده و طبیعی بگذاریم، به همین تابع میرسیم، و نه هیچ تابع دیگری.
فرض کنید یک تابع چگالی احتمال را میخواهید پیدا کنید که این دو خاصیت را داشته باشد:
- این تابع فقط به فاصله از مبدأ وابسته باشد؛ به زبان هندسی یعنی میتوانید محور مختصات را حول مبدأ دوران بدهید، بدون اینکه توزیع تغییری کند. به زبان ریاضی:
که یک تابع تک متغیره است. همچنین بدون اینکه جامعیت مسئله از بین برود، فرض میکنیم؛ . این فرض مشکلی بهوجود نمیآورد، چون تابع فقط برای ورودیهای نامنفی برای ما اهمیت دارد و صرفاً برای ساده شدن محاسبات در ادامه، این فرض را میکنیم.
- مقدار و در این توزیع از هم مستقل باشند. یعنی اگر یک نمونه از این توزیع بگیریم، دانستن مقدار این نقطه هیچ اطلاعاتی از مقدار این نقطه به ما ندهد. به زبان ریاضی:
همچنین فرض میکنیم پیوسته است، چون توابعی که در طبیعت پیدا میشوند، اکثراً پیوسته هستند (یادآوری میکنیم که هدف ما پیدا کردن ارتباط و به همراهش عدد پی با توزیعهای آماری حاکم بر طبیعت است). حال نشان میدهیم تنها تابع پیوستهای است که آن دو شرط بالا را دارد. از شرط دوم میدانیم که . حال این توابع را به ازای ورودیهای متفاوت بررسی میکنیم:
پس توابع و توابع یکسانی هستند و فقط ضریب ثابت متفاوتی پشتشان است. ما برای سادگی میتوانیم فرض کنیم که توابع دقیقاً یکسانی هستند؛ زیرا طبق تعریفشان، فقط لازم است که عبارت برقرار باشد، و این معادله میتواند طوری تعریف شود که این ضریب پشت و یکسان باشد. همچنین در معادلات بالا، ما نشان دادیم که ، پس و نیز توابع یکسانی هستند و فقط ضریب پشتشان متفاوت است.
حال برای اینکه محاسبات ما راحتتر باشد، فرض میکنیم است. اگر این فرض ما برقرار نباشد، تنها اتفاقی که رخ میدهد این است که تابعی که بهدست میآوریم به یک ضریب ثابت اضافهتر در پشتش نیاز دارد و میتوان این ضریب اضافهتر را با نرمالایز کردن تابع بهدست آورد. پس میتوانیم بگوییم که و توابع یکسانی هستند و در نتیجه:
حال ما تابع را تعریف میکنیم. واضح است که دامنهٔ ، اعداد نامنفی است. دقت کنید که خاصیت بالا (که برای بود)، تبدیل به این خاصیت برای تابع میشود:
به راحتی میتوان نشان داد که این خاصیت برای هر تعداد عدد برقرار است. یعنی:
پس به ازای اعداد طبیعی داریم . میتوان نشان داد که به ازای هر عدد گویای نامنفی مثل داریم:
اگر بخواهیم تابع پیوسته باشد، لازم است که این خاصیت برای اعداد گنگ هم برقرار باشد. پس بهصورت کلیتر با تعریف داریم:
پس لازم است که به فرم باشد، پس به فرم است، و در نتیجه داریم:
پس دیدیم که تابع خیلی تابع عجیبی نیست و این خانواده از توابع، تنها توزیع پیوستهای است که دو شرط خیلی معمولی را همزمان دارد. پس حضور این تابع در توزیعهای احتمالیای که در طبیعت دیده میشوند خیلی موضوع عجیبی نیست. همچنین دیدیم که در انتگرال چطور عدد پی پیدا شد. پس اینکه نسبت محیط دایره به قطرش در توزیعهای احتمالی حاکم بر طبیعت وجود دارد، نباید خیلی موضوعی عجیب و باورنکردنی باشد.