مشخصات مقاله فهرست مطالب نمونه ترجمه مقاله انگلیسی خرید ترجمه مقالات مرتبط
سلام دوست من ، توی این پست براتون یه مقاله ترجمه شده با موضوع یک جریان کار یادگیری ماشینی نوآورانه برای تحقیق در مورد بحران مالی سیستماتیک چین با مقدار SHAP و رگرسیون شپلی، منتشر کردیم. این مقاله یه مقاله ISI و علمی پژوهشی هست که توی پایگاه اشپرینگر در سال ۲۰۲۴ منتشر شده. فایل انگلیسی ۴۰ صفحه PDF و فایل ترجمه ۶۲ صفحه WORD و قابل ویرایشه، مثل همیشه مقاله انگلیسی رو می تونید رایگان دانلود کنید. بخش هایی از ترجمه هم براتون رایگان گذاشتم که قبل از خرید ، کیفیت ترجمه رو بررسی کنید. از کیفیت ترجمه هم نگم براتون که مثل همیشه عالییییه. برای خرید ترجمه کامل مقاله روی گزینه خرید و دانلود آنی ترجمه کلیک کنید بعد از پرداخت لینک دانلود بهتون نشون داده میشه، به ایمیلتونم ارسال میشه. اگر سوالی بود می تونید زیر این پست کامنت بزارید سریع جوابتونو میدم.
یک جریان کار یادگیری ماشینی نوآورانه برای تحقیق در مورد بحران مالی سیستماتیک چین با مقدار SHAP و رگرسیون شپلی
عنوان انگلیسی:
An innovative machine learning workflow to research China’s systemic financial crisis with SHAP value and Shapley regression
کد محصول: H1112
سال نشر: ۲۰۲۴
نام ناشر (پایگاه داده): اشپرینگر
نام مجله: Financial Innovation
نوع مقاله: علمی پژوهشی (Research Article)
متغیر : دارد
فرضیه: دارد
مدل مفهومی: مدل ریاضی دارد
پرسشنامه : ندارد
تعداد صفحه انگلیسی: ۴۰ صفحه PDF
تعداد صفحه ترجمه فارسی: 62 صفحه WORD
قیمت فایل ترجمه شده: 175000 تومان
برای دانلود رایگان مقاله انگلیسی بر روی دکمه ذیل کلیک نمایید
وضعیت ترجمه: این مقاله به صورت کامل ترجمه شده برای خرید ترجمه کامل مقاله بر روی دکمه ذیل کلیک نمایید (لینک دانلود بلافاصله بعد از خرید نمایش داده می شود)
مقالات مرتبط با این موضوع: برای مشاهده سایر مقالات مرتبط با این موضوع (با ترجمه و بدون ترجمه) بر روی دکمه ذیل کلیک نمایید
فهرست مطالب
مقدمه
مرور ادبیات
روش ها
شاخص ها
مجموعه داده ها
جریان کار و روش
مهندسی ویژگی
ساخت ویژگی
استخراج ویژگی
انتخاب ویژگی
ارزیابی ویژگی
ساخت مدل
جنگل تصادفی (RF)
درخت تصمیم تقویت گرادیان (GBDT)
ارزیابی نتایج
تجزیه نتایج مدل
استنتاج آماری در مورد تجزیه
رگرسیون
عملکرد جریان کار
توضیحات داده ها
پیش بینی عملکرد مدل
رگرسیون شپلی
جریان کار آموزش دیده در ریسک چین
بحث و نتیجه گیری
اختصارات
چکیده
این مطالعه یک جریان کار پیشگام و چندمرحلهای را پیشنهاد داد و با بررسی و رفع نقص آن در ارتباط با چگونگی تعیین سیستم شاخص بهصورت عینی، آن را بروزرسانی کرد. سپس از جریان کار به روز شده برای شناسایی احتمال بحران مالی سیستماتیک چین استفاده کرد و تأثیر شاخص های اقتصاد کلان بر بحران را تحلیل کرد. جریان کار نهایی شامل چهار مرحله است: انتخاب شاخص های منطقی، مدل سازی با استفاده از یادگیری نظارت شده، تجزیه تابع داخلی مدل، و انجام استنتاج آماری غیر خطی و ناپارامتریک، که مزایایی مانند انتخاب شاخص هدف، پیش بینی دقیق و شفافیت بالای مدل دارد. علاوه بر این، از آنجایی که نفوذ بینالمللی چین به تدریج در حال افزایش است و گزارش نوزدهمین کنگره ملی حزب کمونیست چین نشان داده است که چین با چالشهای کنترل ریسک شدیدی مواجه است و تأکید کرده که دولت باید تضمین کند که هیچ ریسک سیستمیک به وجود نخواهد آمد، این مطالعه بحران مالی سیستمیک چین را به عنوان نمونه انتخاب کرد. به طور خاص، یک عامل تجارت جهانی و ۱۱ شاخص کلان اقتصادی در سطح کشور برای اجرای مدلهای یادگیری ماشین انتخاب شدند. مدلهای پیشبینی شش دوره افزایش ریسک در سیستم مالی چین از سال ۱۹۹۰ تا ۲۰۲۰ را ثبت کردند که با واقعیت همخوانی دارد. تکنیکهای تفسیر، غیرخطی بودن محرکهای ریسک را نشان میدهند که به صورت اثرات آستانه ای و بازه ای هستند. علاوه بر این، رگرسیون شپلی همسویی شاخص ها را تأیید می کند. جریان کار نهایی برای تحلیل های طبقه بندی و رگرسیون در چندین زمینه مناسب است. این روش ها نیز بسته به نیاز تحقیق می توانند به صورت مستقل یا ترکیبی مورد استفاده قرار گیرند. محققان میتوانند برای مدلسازی به دیگر مدلهای یادگیری ماشینی سطحی یا شبکههای عصبی عمیق روی بیاورند. نتایج مربوط به بحرانها میتواند مرجع خاصی را برای تنظیمکنندههای بانکی و سیاستگذاران فراهم کند تا اقدامات مهمی برای حفظ ثبات اقتصاد کلان و مالی ایجاد کنند.
کلمات کلیدی: چین، یادگیری ماشین، مقدار SHAP، رگرسیون شپلی ، بحران مالی سیستمیک
Abstract: study proposed a cutting-edge, multistep workflow and upgraded it by addressing its flaw of not considering how to determine the index system objectively. It then used the updated workflow to identify the probability of China’s systemic financial crisis and analyzed the impact of macroeconomic indicators on the crisis. The final workflow comprises four steps: selecting rational indicators, modeling using supervised learning, decomposing the model’s internal function, and conducting the non-linear, nonparametric statistical inference, with advantages of objective index selection, accurate prediction, and high model transparency. In addition, since China’s international influence is progressively increasing, and the report of the 19th National Congress of the Communist Party of China has demonstrated that China is facing severe risk control challenges and stressed that the government should ensure that no systemic risks would emerge, this study selected China’s systemic financial crisis as an example. Specifically, one global trade factor and 11 country-level macroeconomic indicators were selected to conduct the machine learning models. The prediction models captured six risk-rising periods in China’s financial system from 1990 to 2020, which is consistent with reality. The interpretation techniques show the non-linearities of risk drivers, expressed as threshold and interval effects. Furthermore, Shapley regression validates the alignment of the indicators. The final workflow is suitable for categorical and regression analyses in several areas. These methods can also be used independently or in combination, depending on the research requirements. Researchers can switch to other suitable shallow machine learning models or deep neural networks for modeling. The results regarding crises could provide specific references for bank regulators and policymakers to develop critical measures to maintain macroeconomic and financial stability.
Keywords: China, Machine learning, SHAP value, Shapley regression, Systemic financial crisis
مقدمه
همهگیری کروناویروس (کووید-۱۹) تهدید قابلتوجهی برای اقتصاد جهانی بهشمار میرفت. بنابراین، جلوگیری از فروپاشی مالی بر اساس روشهای فنی جدید و مطالعات موردی جامع، در دوره پس از همهگیری که احتمال دارد بازگشت نامتوازن جهانی ثبات مالی بازارهای نوظهور و اقتصادهای در حال توسعه را به چالش بکشد، اهمیت زیادی دارد (نیوورژکین و کندروگیانیس ۲۰۲۰). علاوه بر این، پیشگیری و نظارت بر ریسک مالی سیستمیک در چین از اولویتهای اصلی است.
ابتدا، چین بهعنوان دومین بازار بزرگ در جهان، بهطور عمیقی در اقتصاد جهانی ادغام شده و اکنون یکی از نیروهای محرکه اصلی رشد اقتصادی جهانی است. در نتیجه، توجه به سیستم مالی چین در سطح جهانی افزایش یافته است. دوم، گزارش نوزدهمین کنگره ملی حزب کمونیست نشان داد که چین با چالشهای جدی مواجه است. در این گزارش تأکید شد که دولت باید نظارت، هشدار زودهنگام، کنترل و کاهش ریسکهای مالی را تقویت کند تا از بروز ریسکهای سیستمیک جلوگیری شود. بنابراین، نظارت بر ریسکهای سیستمیک چین برای این کشور و سایر اقتصادها ضروری است…
Introduction The coronavirus disease (COVID-19) pandemic posed a significant threat to the global economy. Therefore, preventing financial collapse based on new technical methods and comprehensive case studies is of great significance in the post-pandemic period, when an uneven global rebound is more likely to challenge the financial stability of emerging markets and developing economies (Nivorozhkin and Chondrogiannis 2020). Moreover, prevention and monitoring of systemic financial risk in China is a top priority.
First, as the second-largest market in the world, China has become deeply integrated into the global economy and is now one of the critical driving forces of global economic growth. Consequently, attention focused on the Chinese financial system has increased globally. Second, the report of the 19th National Congress of the Communist Party of China demonstrated that China was confronted with severe challenges. It stressed that the government would strengthen monitoring, early warning, mitigation, and control of financial risks to ensure that no systemic risks would emerge. Thus, it is essential to monitor China’s systemic risks to both the country and other economies…
مرور ادبیات
روش ها: مدلهای هشدار اولیه زیادی برای شناسایی و پیشبینی ریسک سیستمیک پس از بروز بحرانهای مالی منطقهای در دهه ۱۹۹۰ پیشنهاد شدهاند. به عنوان مثال، مدل پروبیت (فرانکل و رُز، ۱۹۹۶)، تحلیل سیگنال کامینسکی-لیزوندو-رینهاست (KLR) (کامینسکی و همکاران، ۱۹۹۷؛ کامینسکی، ۱۹۹۹؛ شی و گاو، ۲۰۰۹) و مدل رگرسیون مقطعی (ساکس و همکاران، ۱۹۹۶) به طور گستردهای استفاده شدهاند. با این حال، مدل رگرسیون مقطعی نمیتواند احتمال ریسک دقیقی را محاسبه کند و تحلیل سیگنال KLR در تعیین شاخصها و آستانهها به طور ذهنی است…
Literature review
Methods: Many early warning models have been proposed to recognize and predict systemic risk after the outbreak of regional financial crises in the 1990s. For example, the probit model (Frankel and Rose 1996), Kaminsky–Lizondo–Reinhart (KLR) signal analysis (Kaminsky et al. 1997; Kaminsky 1999; Shi and Gao 2009), and the cross-section regression Model (Sachs et al. 1996) have been extensively used. Nevertheless, the cross-section regression model cannot compute the accurate risk probability, and the KLR signal analysis is subjective in setting indicators and thresholds…
شاخص ها
از آنجایی که ما ریسک را با استفاده از دادههای کلان اقتصادی پیشبینی کردیم، خلاصهای از ادبیات مربوطه پیدا کردیم که پیشبینیکنندههای کلان ریسک را میتوان تقریباً به دستههای زیر تقسیم کرد.
(۱) عملکرد اقتصادی: سلامت اقتصادی به طور معناداری بر بازار مالی تأثیر می گذارد و تورم شدید یا رکود می تواند خطراتی ایجاد کند. شاخص های مرتبط شامل نرخ رشد تولید ناخالص داخلی، نرخ تورم و شاخص قیمت مصرف کننده است (فرانکل و ساراولوس ۲۰۱۲؛ کاجیانو و همکاران ۲۰۱۴؛ شولاریک و تیلور ۲۰۱۲)…
Indicators Since we predicted risk using macroeconomic data, we found a summary from the relevant literature that macropredictors of risk can be roughly divided into the following categories2: (1) Economic performance: Economic health significantly impacts the financial market, and overheating or a recession can pose risks. Representative indicators include the GDP growth rate, inflation rate, and Consumer Price Index (Frankel and Saravelos 2012; Caggiano et al. 2014; Schularick and Taylor 2012)…
ساخت مدل
اولین گام این است که مسئله را چارچوب بندی کنیم: آیا این مسئله تحت کنترل است یا غیر قابل کنترل، و اینکه آیا این یک کار طبقه بندی، کار رگرسیونی یا چیز دیگری است. سپس مدل مناسب بر اساس نوع مسئله، اندازه داده و منابع محاسباتی تعیین میشود (جیرون ۲۰۱۷). همه الگوریتم های یادگیری ماشین انتخاب شدند. با این حال، برای ارائه تفسیری متقاعدکنندهتر از مقادیر SHAP، مدلهای غیرافزودنی مناسب نیستند. این مطالعه مدل های مبتنی بر درخت را به دلایل زیر انتخاب کرد. اول، مدلهای مبتنی بر درخت، مدلهای افزودنی هستند (کومار و همکاران ۲۰۲۰)، که SHAP-friendly نیز هستند. دوم، در مدلسازی درختی نیازی به دادههای استاندارد شده نیست، که میتواند توضیح دقیقتری در مراحل بعدی ارائه دهد. به طور خاص، ما RF و GBDT را انتخاب کردیم. RF دارای واریانس کم اما دقت بالایی است و ممکن است با دسته بندی تا حدی از انطباق مازاد جلوگیری کند. محاسبات RF نیز به دلیل تصادفیسازی نمونهها و ویژگیها قبل از مدلسازی کوچک است. GBDT با تعمیم پذیری و ظرفیت خوب برای شاخص های مختلف برای همه مسائل طبقه بندی مناسب است. همچنین برای کنترل انطباق مازاد مانند RF مفید است. فرمول ها و مراحل این دو به شرح زیر است:..
Building the model The first step is to frame the problem: whether it is supervised or unsupervised, and whether it is a classification task, regression task, or something else. The appropriate model is then determined based on the problem type, data size, and computational resources (Géron 2017). All machine learning algorithms were chosen. However, for a more convincing subsequent interpretation of SHAP values, non-additive models are not appropriate. This study selected tree-based models for the following reasons. First, tree-based models are additive models (Kumar et al. 2020), which are SHAP-friendly. Second, there is no need for standardized data in tree modeling, which can provide a more precise explanation later. Specifically, we selected RF and GBDT. RF has a low variance but high accuracy and may prevent overfitting to an extent by bagging. The RF computation is also small because of the randomization of the samples and features before modeling. The GBDT is appropriate for all classification issues, with good generalization ability and tolerance for different indicators. It is also helpful in handling overfitting, similar to RF. The formulae and steps for these two are as follows:..
تجزیه نتایج مدل
این مرحله در ابتدا با استفاده از مقادیر SHAP اجرا شد. SHAP توسط لوندبرگ و لی (۲۰۱۷) با الهام از لوندبرگ و همکاران (۲۰۱۸) پیشنهاد شد که برای تمام خروجی های مدل یادگیری ماشین مناسب است. با این وجود، باید دانست که حالت بهینه برای تخصیص ویژگی زمانی است که ویژگی هایی که مختل می شوند در ابتدا مستقل باشند (کومار و همکاران ۲۰۲۰؛ چن و همکاران ۲۰۲۰) و برای مدل، مدل افزودنی بهترین است (کومار و همکاران ۲۰۲۰). بنابراین، در این مطالعه، ما سعی کردیم SHAP را با انتخاب مدلهای مبتنی بر درخت و تصدیق زیرمجموعه ویژگیها با استفاده از عامل تورم واریانس (VIF) سازگارتر کنیم…
Decomposing model results This step was primarily implemented using the SHAP values. SHAP was suggested by Lundberg and Lee (2017), with visualization in Lundberg et al. (2018). It is suitable for all machine learning model outputs. Nevertheless, it should be known that the optimum case for feature attribution is when the features that are being perturbed are independent at the outset (Kumar et al. 2020; Chen et al. 2020), and for the model, the additive model is the best (Kumar et al. 2020). Therefore, in this study, we attempted to make SHAP more consistent by selecting tree-based models and authenticating the feature subset using the Variance Inflation Factor (VIF)….
بحث و نتیجه گیری
این مطالعه یک جریان کاری متشکل از انتخاب شاخصها، مدلسازی، تجزیه نتایج و استنتاج آماری را ارتقا میدهد و جریان کار را قادر میسازد تا به طور دقیق ویژگیها را طبقهبندی و تفسیر کند و همچنین بهترین زیرمجموعه ویژگیها را انتخاب کند. در مقایسه با جریان کار قدیمی، جریان کار جدید از مزیت انتخاب ویژگی ها برخوردار است و می تواند به عملکرد بهتر مدل منجر شود. علاوه بر این، جریان کار در این مطالعه برای مطالعات طبقه بندی یا رگرسیون در بسیاری از زمینه ها مناسب است. این تکنیک ها همچنین می توانند به صورت مستقل یا ترکیبی، بسته به نیازهای تحقیق، اعمال شوند. نتایج ما از مزایای متمایز تکنیکهای مهندسی ویژگی، از جمله RFE، الگوریتمهای یادگیری ماشین، RF و GBDT، مدلهای تفسیری پیشرفته، مقادیر SHAP و چارچوب استنتاج آماری رگرسیون شپلی بهره میبرند. ترکیب این تکنیک های فناورانه نه تنها می تواند ویژگی های مناسب را تعیین کند و دقت پیش بینی بالایی را به دست آورد، بلکه همچنین به ما اجازه می دهد تا تابع فطری مدل را تجزیه کنیم و استنتاج های آماری را بر روی همه متغیرها در مدل های غیر خطی و غیر پارامتری با ترکیب فواید مدل های دشوار و استنتاج آماری انجام دهیم،. این مطالعه می تواند به عنوان نمونه ای برای سایرین باشد و محققان می توانند به دیگر مدل های ترجیحی یادگیری ماشین سطحی یا حتی الگوریتم های یادگیری عمیق برای مدل سازی روی آورند…
Discussion and conclusion This study upgrades a workflow consisting of selecting indicators, modeling, decomposing results, and statistical inference, enabling the workflow to accurately classify and interpret, as well as select the best subset of features. Compared with the old workflow, the new workflow has the advantage of selecting features and can lead to better model performance. In addition, the workflow in this study is well suited to categorical or regression studies in many areas. These techniques can also be applied independently or in combination, depending on the research requirements. Our results benefit from the distinct advantages of feature engineering techniques, including RFE, machine learning algorithms, RF and GBDT, cutting-edge interpretation models, SHAP values, and the Shapley regression statistical inference framework. The combination of these technological techniques can not only determine proper features and acquire high prediction precision, but also allow us to decompose the intrinsic functions of the model and conduct statistical inferences on all variables in non-linear, non-parametric models, combining the merits of difficult models and statistical inference. This study can serve as an example for others, and scholars can switch to other preferred shallow machine learning models or even deep learning algorithms for modeling…

مقالات مرتبط با این موضوع |
مقالات کاربرد فناوری در امور مالی مقالات کاربرد هوش مصنوعی در امور مالی |