اطلاعیه

مقاله ترجمه شده حسابداری برای عدم قطعیت پارامتریک در فرآیند تصمیم گیری مارکوف

دانلود رایگان مقاله بیس انگلیسی خرید و دانلود ترجمه ی مقاله انگلیسی

کد محصول: h104

قیمت فایل ترجمه شده ۱۸۵۰۰ تومان

تعداد صفحه انگلیسی

سال نشر: ۲۰۱۳

تعداد صفحه ترجمه فارسی: ۲۴ صفحه WORD

عنوان فارسی:

مقاله ترجمه شده حسابداری برای عدم قطعیت پارامتریک در فرآیند تصمیم گیری مارکوف(تئوری حسابداری)

عنوان انگلیسی:

:Accounting for parametric uncertainty in Markov decision processes

چکیده فارسی:

فرآیند تصمیم گیری مارکوف تبدیل به ابزاری استاندارد برای مدل سازی متوالی مسائل تصمیم گیری در حفاظت از محیط زیست شده است. با این حال، در بسیاری از برنامه های کاربردی جهان واقعی، پارامترها درتابع انتقال وضعیت عملا به طور دقیق غیرعملی هستند. در این مطالعه، یک راه جدید برای برخورد با ابهام در تابع انتقال وضعیت معرفی می کنیم. در مقایسه با روش های موجود، ما اثرات عدم قطعیت در سطح سیاست، و نه در سطح تصمیم گیری در وضعیتها را بررسی می کنیم. ما با استفاده از تئوری تصمیم گیری شکاف اطلاعاتی،در پاسخ به این سوال که چگونه عدم قطعیت زیاد در تابع انتقال وضعیت می­تواند تحمل شود در حالی که هنوز هم مقادیر مورد انتظار تعیین شده از سوی تابع هدف ارائه می شود. بر این اساس، هدف دیگر از مسئله بهینه سازی به حداکثر رساندن مقادیر مورد انتظار نیست،بلکه به حداکثر رساندن مقاوم بودن مکانی برای عدم قطعیت است(در حالی که هنوز مجمعی در ارتباط با سطح مطلوب عملکرد صورت نگرفته است). ما مسئله ی ساده تملک اراضی را با استفاده از تئوری تصمیم گیری شکاف اطلاعاتی برای ترویج عدم قطعیت تجزیه وتحلیل کردیم و سیاست های جایگزین را رتبه بندی کردیم. ابتدا، شکاف اطلاعاتی به جای نیاز به اطلاعات در مورد میزان  پارامترعدم قطعیت ، به این پرسش که چه میزان عدم قطعیت در تابع انتقال وضعیت قبل از تغییر سیاست های مطلوب مجاز است ،می پردازد.

واژه های کلیدی: شکاف اطلاعاتی ،فرآیند تصمیم گیری مارکوف، انتخاب ذخیره ، برنامه نویسی پویای تصادفی ،عدم قطعیت

مقدمه

فرآیند تصمیم گیری مارکوف (MDPs) بطور فزاینده ای نقش مهمی در پژوهش های برنامه ریزی حفاظت از محیط زیست، تشکیل مدل پایه برای تحقیقات اخیر به سمت مدیریت فراجمعیتی(به عنوان مثال، وست و همکاران، ۲۰۰۳) ، کنترل گونه های مهاجم (به عنوان مثال، بوگیچ و شیا، ۲۰۰۸)، جابجایی وجایگیری(به عنوان مثال، تنهومبرگ و همکاران، ۲۰۰۴)، مدیریت برداشت محصول (نیکولز و همکاران، ۲۰۰۷) و انتخاب متوالی ذخایر (به عنوان مثال، چاپاوق و تایری، ۲۰۱۲) بازی می کند. هدف از چنین برنامه ی کاربردی ایجاد یک سیاست است که وضعیت هر سیستم را با یک عمل خاص مرتبط می سازد. این سیاست باید عملکرد بهینه به معنای به حداکثر رساندن یا به حداقل رساندن هدف حفاظت از محیط زیست مشخص شده را ارائه دهد (پوسینقام و همکاران، ۲۰۰۱). فرآیند تصمیم گیری مارکوف بر نظریه احتمال برای مدل انتقال وضعیت تکیه می کند. به طور خاص، هر عمل امکان پذیر دارای ماتریس انتقال مرتبطی است که شامل احتمالاتی  است که انجام این عمل در وضعیت سیستم s را به سمت حالت s حرکت می¬دهد.به عبارتی فرآیند تصادفی‌ مارکوف بصورت چندگانه ( áS,A,R,Tñ)نشان داده می شود که در آن‌ Sمجموعه متناهی از‌وضعیت‌ها ؛A  مجموعه عملیات قابل دسترس برای عامل، T: S×A×S ®[۰,۱]  احتمال انتقال از وضعیت جاری به وضعیت بعدی با انجام عملa  است وR: S×A®Â بیانگر تابع پاداش است که یک مقدار عددی را بر می گرداند. ماتریس انتقال در مجموع به تابع انتقال وضعیت اشاره دارد، و این می تواند برآوردی از داده ها، آموزه های تجربی، و یا طراحی شده بوسیله ی دست باشد. فرض رایج براین است که پارامترهای تابع انتقال وضعیت در میان بوم شناسان و دانشمندان حفاظت از محیط زیست دقیقا شناخته شده است؛ با این حال، تعیین این احتمال با چنین اطمینانی می تواند مشکل باشد

Abstract

Markov decision processes have become the standard tool for modeling sequential decision-making problems in conservation. In many real-world applications, however, it is practically infeasible to accurately parameterize the state transition function. In this study, we introduce a new way of dealing with ambiguity in the state transition function. In contrast to existing methods, we explore the effects of uncertainty at the level of the policy, rather than at the level of decisions within states. We use information-gap decision theory to ask the question of how much uncertainty in the state transition function can be tolerated while still delivering a specified expected value given by the objective function. Accordingly, the goal of the optimization problem is no longer to maximize expected value, but to maximize local robustness to uncertainty (while still meeting the desired level of performance). We analyze a simple land acquisition problem, using info-gap decision theory to propagate uncertainties and rank alternative policies. Rather than requiring information about the extent of parameter uncertainty at the outset, info-gap addresses the question of how much uncertainty is permissible in the state transition function before the optimal policy would change.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Time limit is exhausted. Please reload the CAPTCHA.