یک مطالعه جامع از پیش بینی بازار از فرضیه بازار کارآمد تا رویکردهای پیش بینی بازار هوشمند اواخر

ساخت وبلاگ

در این مقاله روند آزمایش کارآیی بازار ، فرآیند تولید داده و امکان پیش بینی بازار با یک رویکرد دقیق ، منسجم و آماری بررسی شده است. علاوه بر این ، تلاش برای استخراج دانش از داده های بازار S& P 500 با تأکید بر مهندسی ویژگی ها انجام می شود. به این ترتیب ، بازنمایی داده های مختلف از طریق روشهای مختلف ارائه می شود و عملکرد آنها در استخراج دانش مورد بحث قرار می گیرد. در میان شبکه های عصبی ، حافظه کوتاه مدت طولانی به اندازه کافی آزمایش نشده است. LSTM ، به دلیل ذاتی ، حافظه بلند مدت و کوتاه مدت را در محاسبات خود در نظر می گیرد. بنابراین ، در این مقاله LSTM بیشتر در پیش بینی بازگشت مورد بررسی قرار می گیرد و روشهای مختلف پیش پردازش برای بهبود صحت آن مورد آزمایش قرار می گیرند. این مطالعه بر روی داده های بازار در سپتامبر 2000 تا فوری ه-2021 انجام شده است. به منظور گسترش میزان دانش استخراج شده از سری زمانی مالی و انتخاب بهترین ویژگی های ورودی ، مزیت تجزیه و تحلیل مؤلفه اصلی ، جنگل تصادفی ، موجک و روش استخراج عمیق ویژگی LSTM گرفته شده است و 4 مدل گردآوری شده است. پس از آن ، برای اعتبارسنجی عملکرد مدل ها ، MAE ، MSE ، MAPE ، CSP و CDCP محاسبه می شوند. نتایج حاصل از آزمون Diebold Mariano حاکی از آن است که اگرچه اخیراً شبکه عصبی LSTM توجه زیادی را به خود جلب کرده است ، اما عملکرد بهتری نسبت به روش معیار در پیش بینی بازگشت شاخص S& P 500 ندارد. با این حال ، نتایج حاصل از آزمون رتبه بندی امضا شده Wilcoxon ، اهمیت بهبود در پیش بینی های انجام شده توسط ترکیبی از تجزیه و تحلیل مؤلفه اصلی و LSTM را نشان داد.

روی نسخه خطی کار می کنید؟

از رایج ترین اشتباهات خودداری کنید و نسخه خطی خود را برای ویراستاران ژورنال آماده کنید.

معرفی

پیش بینی بازار سهام

پیش بینی بازار سهام برای مدت طولانی استدلال شده است. قبل از ادعای FAMA ، تحقیقات مختلفی توسط محققان مختلف در مورد پیش بینی بازار سهام انجام شده است ، اما سال 1965 نقطه عطف در ادبیات این حوزه در امور مالی بود. در آن سال ، فاما و ساموئلسون اعتقادات خود را در مورد رفتار سریال زمانی مالی بیان کردند. FAMA ، برای اولین بار ، اصطلاح "بازار کارآمد" را پیشنهاد کرد و اظهار داشت که سری زمان قیمت در بازارهای کارآمد قوی از یک روند پیاده روی تصادفی پیروی می کند. در همان سال ، ساموئلسون به جای پیاده روی تصادفی برای رفتار سری زمانی مالی ، روند تصادفی Martingale را پیشنهاد کرد. علاوه بر تفاوت های دیدگاه آنها ، هر دو بر غیرقانونی بودن پیش بینی ها در بازارهای سهام کارآمد به ویژه با مزیت داده های تاریخی موافق هستند. به FAMA (1970) و ساموئلسون (2013) مراجعه کنید. بر این اساس ، مطالعه شواهد فرضیه بازار کارآمد (EMH) برای تعیین میزان کارآیی در بازارهای مختلف در نظرسنجی های پیش بینی بسیار توصیه می شود.

اگرچه بسیاری از محققان با هدف مطالعه کارآیی بازار از روشهای مختلفی استفاده کرده اند. به Abeysekera (2001) ، Dias and Peters (2020) ، Dickinson and Muragu (1994) ، Dima and Miloş (2009) ، Gordon and Rittenberg (1995) و Pele and Voineagu (2008) مراجعه کنید. نظرسنجی های انجام شده در مورد EMH ممکن است با توجه به رفتار غیرخطی داده ها فاقد آن باشد. به Basu (1977) ، Busse & Clifton Green (2002) ، جنسن (1978) و روزنبرگ و همکاران مراجعه کنید.(1985) ، در نتیجه آنها ممکن است کارایی بازار را در سطوح مختلف پذیرفته اند. در این راستا ، یک تحقیق فرضیه پیاده روی تصادفی را با آزمون مشخصات مبتنی بر نوسانات آزمایش کرد. آنها شواهد محکمی برای رد فرضیه پیاده روی تصادفی در داده های هفتگی بازار سهام CRSP پیدا کردند. آنها همچنین شواهد حافظه بلند مدت و پیش بینی را تا برخی گسترش می دهند. به Doan and Lo (1988) و Lo (1991) مراجعه کنید. علاوه بر این ، بروک و همکاران.(1996) آزمایش دیگری به نام BDS را با هدف مطالعه مؤثر توزیع مستقل و یکسان (IID) در رفتار داده ها ایجاد کرد. این آزمون می تواند به طور مؤثرتر سری زمانی مالی و رفتار آنها را با یک رویکرد غیرخطی مطالعه کند ، در نتیجه مطالعه EMH در تحقیقات مختلف عمیق تر شد.

با وجود تحولات در رویکردهای ارزیابی کارآیی بازار ، هنوز بحث های زیادی در این زمینه وجود دارد. از سال 1980 ، گروهی از محققان ایده تأثیرات رفتاری سرمایه گذاران را بر روی جنبش های بازار توسعه دادند. این ایده برای اولین بار توسط شیلر (1981) در حالی که مطالعه حرکات استاندارد و فقیر (S& P) پس از هر بار که اطلاعات جدیدی در بازار تهیه می شد ، شاهد بود. او می تواند پس از هر انتشار اطلاعات ، نوسانات اضافی غیر قابل توضیح (توسط ادبیات EMH کلاسیک) را مشاهده کند. در همین راستا ، در سال 2004 ، LO تعریف جدیدی را برای کارآیی در بازارهای مالی با اصطلاح فرضیه بازار تطبیقی (AMH) توضیح داد. در این تعریف ، به عنوان رفتار سرمایه گذاران منطقی تلقی نمی شود بلکه ترکیبی از عوامل پیچیده روانشناختی است. به باربر و اودین (2000) و شلیفر (2000) مراجعه کنید ، ممکن است دوره هایی وجود داشته باشد که بازار صرف سازگاری با شرایط جدید می کند. به LO (2004) مراجعه کنید. این شاخه از ادبیات ، امروزه ، با تحقیقات در مورد احساسات سرمایه گذار نیز ادامه دارد.

پس از مفهوم توسعه یافته توسط LO ، رویکردهایی پس از مطالعه کارآیی بازار تغییر کرده است. به نظر می رسد با پیشرفت در الگوریتم های استخراج دانش یادگیری ماشین یا در دسترس بودن داده های کمی و کیفی مانند آنچه در رسانه های اجتماعی موجود است ، نگرش به سطح کارآیی بازار تغییر کرده است. بر این اساس ، کارآیی آن بازارهایی که تأیید شده اند ممکن است هنوز تأیید نشود. در نتیجه ، یک ادبیات غنی وجود دارد که به حوزه امور مالی اختصاص داده شده است که با هدف مدل سازی و پیش بینی سری زمانی مالی ، از ریاضیات و آمار استفاده می کند. این روشها از روشهای اولیه آماری و اقتصاد سنجی تا یادگیری ماشین دیرهنگام (ML) و تکنیک های بهینه سازی مبتنی بر تکاملی متفاوت است. به عنوان مثال مراجعه کنیدKanas and Yannopoulos (2001) ، کیم (2003 ، 2006) ، پارک و همکاران.(2010) ، و همکاران.(2015) و هان و همکاران.(2020).

مطالعات بسیاری وجود دارد که با هدف مدل سازی سری زمانی مالی با روش های مختلف مرزی وجود دارد ، اما باید در نظر داشت که پیش بینی های مالی باید آگاهانه و با احتیاط توسط پیش از مطالعه های انجام شده بر روی داده ها انجام شود. بنابراین ، در این تحقیق تلاش می شود تا شاخص S& P 500 را با آخرین روشهای پیشرفته یادگیری عمیق (DL) پیش بینی کنید. تازگی این تحقیق این است که تأکید می شود بر پیش بینی داده ها و روند مهندسی ویژگی.

ادامه مقاله به شرح زیر تدوین شده است. در فرقه1. 2 ادبیات پیش بینی های مالی با استفاده از روشهای یادگیری ماشین و مزایای آنها در برابر روشهای کلاسیک خلاصه می شود. بخش 2 مواد از جمله تست های آماری و روش های مورد استفاده در مطالعه را توضیح می دهد. بخش 3 مربوط به مطالعات مربوط به ویژگی های داده های استفاده شده است. بخش 4 روش و آزمایش های انجام شده برای اعتبارسنجی روشهای مختلف مهندسی ویژگی را توضیح می دهد. بخش 5 به توضیح معیارها و آزمون آماری مورد استفاده برای اعتبار سنجی مدلهای مرکب اختصاص یافته است. بخش 6 نتایج و بحث ها را در معرض دید قرار می دهد. سرانجام ، فرقه7 نتیجه را نتیجه می گیرد.

مدل های پیش بینی

شبکه های عصبی مصنوعی (ANN) یک کلاس از مدل های محاسباتی پیچیده است که از سیستم شبکه عصبی انسان الهام گرفته شده و یک کلاس از الگوریتم های ML هستند. از آنجا که مغز انسان می تواند با یادگیری روابط و الگوهای اساسی بین متغیرها ، بسیاری از مشکلات پیچیده را حل کند ، انتظار می رود آن بسیاری از مشکلات را که روشهای قبلی نمی توانند حل کنند. این شبیه سازی فرآیند بیولوژیکی تفکر و حل حدود 80 سال در موضوعات مختلف استفاده شده است. به Adya and Collopy (1998) ، McCulloch و Pitts (1943) و Tsaih و همکاران مراجعه کنید.(1998). علاوه بر این ، ANN ها حتی در پیش بینی چرخه هایی که شامل دوره های بحران با خطای حاشیه ای دقت در زیر 5 ٪ Yavuz و همکاران بود ، موفق بوده اند.(2015).

اگرچه بسیاری بر این باورند که ANN بدون قید و شرط می تواند بهتر از روشهای آماری معمولی در مدل سازی سری زمانی مالی ، نتایج متناقض از ادبیات اخیر عمل کند. به McAleer و Medeiros (2011) در استفاده از آنها در بازارهای مالی مراجعه کنید ، منجر به بحث و جدال در بین دانشمندان شده است. نتایج متناقض در موفقیت ANN در برابر روشهای قبلی به دلایل مختلفی از جمله اجرای مدل نامناسب (به عنوان مثال انتخاب مدل و انتخاب هایپرپارامتر) و غفلت از مطالعه ویژگی های داده ها است. امروزه ، با پیشرفت هوش مصنوعی (AI) در تکنیک های عمیق شبکه عصبی و مدل ، امیدها برای حل اولین مشکل در حال افزایش است. با توجه به اینکه پاسخ به مشکل دوم در مطالعه فرآیند تولید داده ها (DGP) نهفته است. به نظر می رسد در بعضی موارد وقتی مشخصات خطی و غیر خطی در داده ها وجود ندارد ، نتایج بحث برانگیز رخ می دهد. به عنوان مثال ، در بعضی موارد در حالی که ANN با پیچیدگی غیر ضروری داده ها ، ماهیت خطی در رابطه با ویژگی ها و ارزش هدف ، در حال مبارزه با مدل های کلاسیک خطی در مدل سازی آنها است. این مشکل را می توان با یک مطالعه کافی در مورد خطی بودن و ویژگی های غیر خطی از داده ها که منجر به انتخاب مدل منسجم تر می شود ، جلوگیری کرد. Eğrioğlu و Fildes (2020) این مشخصات را از طریق آزمون اهمیت ورودی در تحقیقات خود در نظر گرفته اند.

از این گذشته ، بدیهی است که روشهای آماری معمولی محدودیت های زیادی در مطالعه داده های مالی دارند. مشکلاتی از قبیل تعداد زیاد محاسبات ، از دست دادن میزان آزادی ، مواجهه با متغیرهای اضافی و حذف شده و چند خطی بین ویژگی های ورودی. در پیش بینی های مالی ، به دلیل تعداد زیاد متغیرها ، برای جلوگیری از مشکلات ذکر شده در بالا ، نیاز به یک رویکرد انتخاب ویژگی روشن و قوی وجود دارد. متأسفانه ، مدل های کلاسیک فاقد یک روش مؤثر در انتخاب ویژگی ها نیز هستند. در نتیجه ، محققان برای انتخاب ویژگی ها یا به طور اتفاقی یا با محاسبه همبستگی خطی و شاید توصیه های ادبیات قبلی استفاده می کردند. به عنوان مثال ، حاجیزاد و همکاران.(2012) در مقاله خود ذکر کرد که متغیرهای ورودی اگزوژن برای مدل ترکیبی آنها از توصیه های برخی تحقیقات قبلی انتخاب شده است. علاوه بر این ، بازار سهام یک سیستم پویا است که ممکن است الگوی وابستگی خود را در طول زمان و در شرایط مختلف اقتصادی تغییر دهد ، بنابراین ، برای پیش بینی بهتر باید یک رویکرد مهندسی ویژگی مناسب وجود داشته باشد.

علاوه بر این ، اگرچه مدل های خانواده Garch به دلیل قابلیت مدل سازی غیرخطی شناخته شده اند ، اما آنها برای مدل سازی نوسانات به جای بازگشت طراحی شده اند و نمی توانند به اندازه کافی وابستگی های طولانی مدت را در داده ها ضبط کنند. بنابراین ، به نظر می رسد که مدل های کلاسیک در مدل سازی سری زمانی مالی کافی نیستند. در نتیجه ، بسیاری از محققان به ناچار به روشهای پیچیده تری تبدیل شده اند که می توانند حافظه بلند مدت را بهتر ضبط کنند.

خوشبختانه ، همراه با تحولات داده های بزرگ و علوم داده ، رویه های جدید برای مقابله با مشکلاتی که روشهای قبلی نمی توانند مقابله کنند ، پیشنهاد می شود. به عنوان مثال ، روش های مختلفی برای مهندسی ویژگی ها قبل از استقرار مدل های پیش بینی ارائه شده است. در رویکردهای مهندسی ویژگی ، برخی از روشها با تمرکز بر لعنت ابعاد وجود دارد. استخراج ویژگی ها و انتخاب ویژگی ها دو شاخه مهندسی ویژگی با هدف کاهش ابعاد هستند. تفاوت اصلی بین این دو رویکرد در این است که در انتخاب ویژگی ، زیر مجموعه های ویژگی های اصلی توسط این روش ارائه می شود ، اما در استخراج ویژگی ویژگی های جدید با توجه به ویژگی های اولیه ایجاد می شود. جنگل تصادفی (RF) ؛به Tin Kam (1995) و تجزیه و تحلیل مؤلفه اصلی (PCA) مراجعه کنید. به Gastpar و همکاران مراجعه کنید.(2006) به ترتیب نمونه های شناخته شده ای از هر روش مهندسی ویژگی معرفی شده است. علاوه بر این ، اخیراً ، مهندسی ویژگی های هوشمند توسط شبکه های عصبی عمیق مانند شبکه های عصبی مکرر (RNN) و شبکه های عصبی حلقوی (CNN) انجام می شود. به Lecun و Bengio (1998) مراجعه کنید. به عبارت دیگر ، شبکه های عصبی عمیق علاوه بر عملکرد نقشه برداری آنها از طریق فرآیند آموزش ، یک روش استخراج ویژگی را نیز ارائه داده اند. به نظر می رسد شبکه های عصبی ساده معمولی این فرآیند استخراج ویژگی را ارائه نمی دهند ، در نتیجه بسیاری از محققان مانند حافظه کوتاه مدت بلند مدت (LSTM) به CNN و RNN تغییر یافته اند. برای مطالعات خود به شبکه های Hochreiter و Schmidhuber (1997) مراجعه کنید.

ادبیات دارایی و یادگیری عمیق در سالهای اخیر سهم بسیاری داشته است. روشهای مختلفی از مدلهای DL از طریق زیرمجموعه های متنوع مالی مانند تجارت الگوریتمی ، ارزیابی ریسک ، تشخیص کلاهبرداری ، مدیریت نمونه کارها ، قیمت گذاری دارایی ، تجزیه و تحلیل صورتهای مالی ، استخراج متن ، امور مالی رفتاری و غیره نفوذ کرده است. به Ozbayoglu و همکاران مراجعه کنید.(2020). در جدول 1 لیستی از ادبیات اخیر یادگیری ماشین و روشهای DL به طور خاص تر در امور مالی ارائه شده است.

با پیشرفت های پیشرفته در زبانهای برنامه نویسی به ویژه پایتون و کتابخانه های خاص آن از علوم داده مانند Sikitlea ، Pytorch ، Tensorflow ، Scipy و غیره ، اجرای انواع مختلف مدل ها بسیار مناسب است. از این رو ، نگرانی اصلی این مقاله به دنبال یک مدل جدید یا ایجاد یکی نیست ، بلکه مدیریت یک روش منحصر به فرد است که تحقیقات قبلی پیش بینی های مالی را تکمیل می کند. هدف اصلی این مقاله دو برابر است. اول این است که به اندازه کافی ویژگی های سری زمانی مالی را مطالعه کرده و سپس متغیرهای توضیحی را در پیش بینی ها بهتر بگنجانید. معیارهای بیان شده در بسیاری از تحقیقات اختصاص داده شده به پیش بینی سهام وجود ندارد ، اما مطالعه آنها منجر به پیش بینی های معقول ، دقیق تر و قابل اعتماد تر می شود.

در این تحقیق ، اول ، تحقیقات برای به دست آوردن درک اصلی در مورد ویژگی های داده های مورد مطالعه انجام می شود که بینشی در مورد فرآیند تولید داده می دهد. از طریق این مرحله EMH بر اساس داده های S& P 500 مورد مطالعه قرار می گیرد. در مرحله بعد ، تلاش می شود تا دقت یک مدل ML خاص (LSTM) ، آزمایش را با اصلاح روش انتخاب ویژگی ، استخراج ویژگی و دفع کردن انجام دهد. در واقع ، این مدل در درجه اول با انواع متغیرهای ورودی تغذیه می شود و سپس ویژگی ها با روش های مختلف استخراج می شوند. آزمایشات موجود در این مقاله به شرح زیر است:

4- LSTM عمق موجک

نمودار نمودار در شکل 1 نمای کلی از قسمت دوم روش را نشان می دهد.

کتاب دستیار معامله گر...
ما را در سایت کتاب دستیار معامله گر دنبال می کنید

برچسب : نویسنده : عزت‌الله انتظامی بازدید : 889 تاريخ : چهارشنبه 9 فروردين 1402 ساعت: 12:41