روش بیشینه درستنمایی متداولترین رویه در تخمین پارامترهای یک مدل انتخاب گسسته بر اساس نمونهای از دادههای مشاهداتی است به طوری که در آن مقادیر پارامترهای مدل به گونهای تخمین زده میشود که احتمال رخ دادن نمونه مشاهده شده، بیشینه شود.
در صورتیکه با مدل های انتخاب گسسته آشنایی ندارید، می توانید با مراجعه به مقالات پیشین این مجموعه در مورد مبانی مدل های انتخاب گسسته، مدل های لوجیت و پروبیت مطالعه کنید.
فرض کنید مجموعه مشاهدات در یک نمونه باشند به طویکه مشاهدات از جامعه به صورت تصادفی و مستقل انتخاب شده باشند. در اینصورت تابع درستنمایی
به صورت زیر تعریف میشود:
که در آن احتمال شرطی
به شرط
و
بردار پارامترها است.
در ادبیات مدلهای انتخاب مسیر گسسته متداول است که به جای بیشینه کردن تابع درستنمایی، لگاریتم آن را بیشینه نمایند. زیرا تابع لگاریتم، تابعی اکیداً صعودی است و در نتیجه، این عمل در مقادیر بهینه بردار پارامترهای مدل () تاثیری ندارد به طوریکه می توان نوشت:
با توجه به اینکه، تابعی غیرخطی است لذا جواب بهینه این تابع باید شرایط درجه اول را ارضاء نماید؛ به عبارتی دیگر
در رابطه فوق، ، k امین عضو مقادیر بهینه بردار پارامترها
است.
لازم به ذکر است که برای ارزیابی نیکویی برازش مدلهای تخمین زده شده توسط روش بیشینه کردن درستنمایی، از معیار استفاده میشود که تا حدودی نقشی شبیه به
در ارزیابی نیکویی برازش مدلهای رگرسیونی ایفا مینماید؛ به طوریکه:
که در آن، بیانگر مقدار تابع درستنمایی است هنگامی که مقادیر همه پارامترها در تابع درستنمایی برابر با صفر در نظر گرفته شود. شاخص
بین 0 تا 1 تغییر میکند و بیانگر بهبود در مقدار لگاریتم تابع درستنمایی نسبت به شرایطی است که همه پارامترهای مدل، صفر در نظر گرفته شوند. لذا، هر چه مقدار شاخص فوق بیشتر باشد، مدل مناسبتر است. به بیانی دیگر، در مقایسه دو مدل که مجموعه گزینههای انتخاب آن یکسان و از یک مجموعه داده برای پرداخت مدلها استفاده شده باشد، مدلی که
بیشتری دارد، مناسبتر خواهد بود.
همچنین در ارزیابی مدلهای انتخاب گسسته، از آزمون t-test برای بررسی فرض صفر بودن یک پارامتر و از شاخص برای برسی فرض صفر بودن تمامی پارامترها استفاده میشود. شایان ذکر است که شاخص
دارای توزیع کای دو با K (تعداد پارامترهای مدل) درجه آزادی است. برای آشنایی بیشتر با روش بیشینه درستنمایی، در ادامه یک مثال در زمینه برآورد پارامترهای مدل لوجیت پرداخته میشود.
فرض شود داده های جدول زیر مشاهدات حاصل از یک آمارگیری باشند. قصد داریم با داده های جدول زیر یک مدل لوجیت برای انتخاب شیوه سفر بین اتوبوس و خودروی شخصی بسازیم.
فرض شود که تابع مطلوبیت اتوبوس و سواری شخصی به صورت زیر باشند:
بر اساس مشاهدات و روش بیشینه درستنمایی، تابع ذیل باید بیشینه شود:
همانطور که پیشتر بیان شد، برای آسانی کار از دو طرف رابطه فوق لگاریتم می گیریم. سپس مشتق جزیی LL نسبت به پارامترهای مجهول را محاسبه و برابر با صفر قرار می دهیم. به عبارتی دیگر:
در نهایت، با حل معادلات فوق، پارامترها به صورت زیر بدست میآیند:
پاسخها