COVID19-HPSMP: COVID-19 چارچوب همجوشی اطلاعات عمیق ترکیبی و موازی برای پیش بینی حرکت قیمت سهام

ساخت وبلاگ

از ژانویه سال 2020 Elsevier یک مرکز منابع COVID-19 با اطلاعات رایگان به زبان انگلیسی و ماندارین در رمان Coronavirus Covid-19 ایجاد کرده است. مرکز منابع COVID-19 در وب سایت اخبار و اطلاعات عمومی شرکت Elsevier Connect میزبان است. Elsevier از این طریق اجازه می دهد تا تمام تحقیقات مربوط به COVID-19 خود را که در مرکز منابع Covid-19 موجود است-از جمله این محتوای تحقیق-بلافاصله در مخازن PubMed Central و سایر سرمایه گذاری های عمومی ، مانند پایگاه داده WHO COVID با حقوق در دسترس باشد ، اعطا کند. تحقیقات بدون محدودیت دوباره استفاده و تجزیه و تحلیل به هر شکلی یا به هر وسیله با تأیید منبع اصلی. این مجوزها تا زمانی که مرکز منابع COVID-19 فعال باشد ، توسط Elsevier به صورت رایگان اعطا می شود.

چکیده

رمان ویروس کرونا (COVID-19) به طور ناگهانی و ناگهانی جهان را همانطور که در آغاز دهه سوم قرن بیست و یکم می دانستیم تغییر داده است. به ویژه، همه گیر COVID-19 بر اقتصاد سنجی مالی و بازارهای سهام در سراسر جهان تأثیر منفی گذاشته است. مدل های پیش بینی مبتنی بر هوش مصنوعی (AI) و یادگیری ماشین (ML)، به ویژه معماری های شبکه عصبی عمیق (DNN)، این پتانسیل را دارند که به عنوان عاملی کلیدی برای کاهش اثرات نامطلوب همه گیری COVID-19 و موارد احتمالی آینده عمل کنند. در بازارهای مالیدر این راستا، ابتدا یک مجموعه داده منحصربفرد پیش بینی حرکت قیمت مربوط به COVID-19 (COVID19 PRIMO) در این مقاله معرفی شده است که اثرات روندهای رسانه های اجتماعی مرتبط با COVID-19 را بر حرکات قیمت بازار سهام در بر می گیرد. پس از آن، یک چارچوب جدید مبتنی بر DNN ترکیبی و موازی پیشنهاد می شود که معماری های یادگیری مختلف و متنوع را ادغام می کند. از آن به عنوان چارچوب همجوشی عمیق ترکیبی و موازی COVID-19 برای پیش بینی حرکت قیمت سهام (COVID19-HPSMP) یاد می شود، استراتژی های همجوشی نوآورانه برای ترکیب اخبار پراکنده رسانه های اجتماعی مرتبط با COVID-19 با داده های علامت تاریخی استفاده می شوند. COVID19-HPSMP پیشنهادی شامل دو مسیر موازی (از این رو ترکیبی)، یکی مبتنی بر شبکه عصبی کانولوشن (CNN) با ماژول های توجه محلی/جهانی، و یک مسیر CNN یکپارچه و حافظه کوتاه مدت دو جهته (BLSTM) است. دو مسیر موازی توسط یک لایه همجوشی چند لایه دنبال می شوند که به عنوان یک مرکز همجوشی عمل می کند که ویژگی های موضعی را ترکیب می کند. ارزیابی های عملکرد بر اساس مجموعه داده PRIMO COVID19 معرفی شده انجام می شود که عملکرد برتر چارچوب پیشنهادی را نشان می دهد.

واژه های کلیدی: همه گیری COVID-19، شبکه های عصبی عمیق، مدل های ترکیبی، همجوشی اطلاعات، پیش بینی حرکت سهام

1. معرفی

رمان Coronavirus (Covid-19) به طور ناگهانی و ناگهان جهان را تغییر داده است همانطور که در اواخر دهه 2 قرن 21 می دانستیم. همه گیر جهانی Covid-19 باعث نوسانات بازار شد (باک و همکاران ، 2020 ، مازور و همکاران ، 2020) به سمت بالا در سراسر جهان. به طور خاص ، این بیماری همه گیر چندین بخش از جمله اما محدود به بازار سهام ، زنجیره های تأمین جهانی ، بازارهای کار و رفتارهای مصرف را محدود نکرده است. اختلال در چنین بخش هایی ، به ویژه بازار سهام (Al-Awadhi و همکاران ، 2020 ، انصاری و دل وال ، 2020 ، بوستوس و پومارس-کویمبایا ، 2020) ، می توانند بر اقتصاد جهانی تأثیر منفی بگذارند. سطح نوسانات ایالات متحده در اواسط ماه مارس 2020 شبیه به آخرین مواردی است که در اکتبر 1987 دیده می شود. پس از سال 1929 تا 1939 ، و ؛در سال 2008در سپتامبر 2008 ، میانگین صنعتی داو جونز در معاملات Intraday 777. 68 امتیاز کاهش یافت. در طول همه گیر اخیر ، در قسمت دوم مارس 2020 ، نوسانات شروع به عقب نشینی کرد و تا اواخر ماه آوریل به شدت سقوط کرد اما بسیار بالاتر از سطح پیش از ثبت نام بود. انتظار می رود که بازارهای نوظهور ، آنهایی که دارای منابع محدود برای مقابله با تأثیرات منفی COVID-19 هستند ، به دلیل رشد اقتصادی آهسته تر و عدم ورود سرمایه کافی ، فشار Covid-19 را احساس می کنند. در این زمان های همه گیر غم انگیز و ناگوار ، هوش مصنوعی (AI) و یادگیری ماشین (ML) مبتنی بر (Chong et al. ، 2019 ، Hoseinzade and Haratizadeh ، 2019 ، Radojicic و Kredatus ، 2020 ، Rezaei et al. ، 2020 ، Seong وNAM ، 2021 ، ژانگ و همکاران ، 2021) راه حل های پیش بینی حرکت بازار سهام به طور بالقوه می تواند از بحران همه گیر جلوگیری کند که تأثیر منفی بر بازار در سراسر جهان ایجاد می کند و باعث ویرانی های غیر منتظره می شود.

بررسی ادبیات: پیش بینی جنبش بورس یک مشکل مهم و چالش برانگیز در اقتصاد سنجی مالی است ، زیرا این امر تمرکز گسترده تحقیقاتی اخیر را به خود جلب کرده است (بولن و مائو ، 2011 ، ادواردز و همکاران ، 2007 ، فرانکل ، 1995 ، هو و همکاران ، 2019 ، جیانگ، 2020 ، کوشیاما و همکاران ، 2020 ، محمد و همکاران ، 2017 ، روناگی و همکاران ، 2020 ، شوماکر و چن ، 2009). به طور گسترده ای اذعان می شود که سرمایه گذاران برای تصمیم گیری های آگاهانه و دقیق به داده های باکیفیت نیاز دارند. به ویژه ، در زمان بحران بازار ، به طور خاص در طول همه گیر COVID-19 ، سرمایه گذاران برای به دست آوردن داده های به موقع و دقیق نیاز به فن آوری های تحلیلی و اطلاعاتی پیشرفته بزرگ داده ها (Choudrie et al. ، 2021) دارند. با استفاده از داده های با کیفیت بالا ، سرمایه گذاران می توانند تجزیه و تحلیل سریع و تصمیم گیری را در نوسانات بازار انجام دهند و به سرعت در برابر شرایط سریع در حال تغییر واکنش نشان دهند. هرگونه خبرهای مثبت یا منفی مربوط به بحران بازار سهام می تواند تأثیر گسترده ای بر روند تصمیم گیری سرمایه گذاران در بازار سهام داشته باشد. در طول منطقه همه گیر ، به طور معمول ، پیش بینی حرکت سهام به طور قابل توجهی چالش برانگیز می شود زیرا بازارهای سهام تمایل دارند با نوسانات بالایی روبرو شوند. در نتیجه ، توسعه راه حل های نوآورانه و پیشرفته پردازش و یادگیری برای پیش بینی دقیق حرکات سهام برای دستیابی به حداکثر سود بالقوه از اهمیت ویژه ای برخوردار است. این امر منجر به افزایش علاقه به تکنیک های پیش بینی مبتنی بر ML/AI (Anik et al. ، 2020 ، Hu et al. ، 2019) و همجوشی منابع اطلاعات چند منظوره شده است. در زمینه پیش بینی حرکت قیمت سهام ، قیمت سهام تاریخی به طور معمول با اطلاعات به دست آمده از اخبار رسانه ای ذوب می شود (بکمن ، 2017). برای دومی ، علاوه بر سیستم عامل های خبری معمولی ، اخیراً ، علاقه گسترده ای به استفاده از منابع خبری مبتنی بر اینترنت ، مانند رسانه های اجتماعی برای توسعه مدل های پیش بینی کننده ML/AI نشان داده شده است. نسخه خطی به این موضوع متمرکز شده و نقش اخبار مربوط به رسانه های اجتماعی مرتبط با COVID-19 را در مورد رفتار بازار داو جونز بررسی می کند.

پیشرفت ها و پیشرفت های اخیر در زمینه ML و AI، به ویژه شبکه های عصبی عمیق (DNNs)، انگیزه کارهای تحقیقاتی مختلف را برای ترکیب چنین تکنیک های مدل سازی پیشرفته برای پیش بینی و وظایف پیش بینی در بازارهای سهام فراهم کرده است (Tetlock، 2017). به طور خاص، اخیراً افزایش علاقه به آمیختگی اطلاعات (Narkhede et al., 2021) و تجزیه و تحلیل احساسات (Choudrie et al., 2021) بر اساس داده های بازار سهام (Gite et al., 2021, Patel et al., 2021) وجود داشته است.، 2015) و اثرات آنها بر بازارهای سهام. از یک طرف، Ref. پاتل و همکاران(2015) بر پیش بینی جهت حرکت سهام و شاخص قیمت سهام متمرکز شد. این مطالعه مدل های مختلف ML از جمله شبکه عصبی مصنوعی (ANN)، ماشین بردار پشتیبان (SVM)، جنگل های تصادفی (RF) و ساده لوحان را مقایسه کرد. دو رویکرد مختلف برای تغذیه مدل های ML توسعه داده شده است. رویکرد اول شامل محاسبه ده پارامتر فنی با استفاده از داده های معاملات سهام است، در حالی که رویکرد دوم بر نمایش این پارامترهای فنی به عنوان داده های قطعی روند تمرکز دارد. آزمایش ها بر روی بازارهای سهام هند و بر اساس مجموعه داده ای متشکل از 10 سال داده های تاریخی از سال 2003 تا 2012 از دو سهم (ریلاینس اینداستریز و اینفوسیس با مسئولیت محدود) و دو شاخص قیمت سهام (CNX Nifty و S& P Bombay Stock Exchange (BSE) انجام می شوند.) سکس). نتایج تجربی نشان می دهد که عملکرد پیش بینی زمانی بهبود می یابد که پارامترهای فنی به عنوان داده های قطعی روند نمایش داده شوند. به همین ترتیب، Ref. پاتل و همکاران(2015) بر پیش بینی ارزش های آتی شاخص بازار سهام از طریق یک رویکرد همجوشی دو مرحله ای متمرکز شد. رگرسیون بردار پشتیبان (SVR) در مرحله اول استفاده می شود، در حالی که ANN، RF، یا SVR در مرحله دوم استفاده می شود که منجر به مدل های پیش بینی همجوشی S VR - A N N، S VR - R F و SVR - SVR می شود. عملکرد پیش بینی این مدل های ترکیبی با مدل های مستقل مقایسه می شود که قدرت مدل سازی ترکیبی را نشان می دهد. از سوی دیگر، Ref. گیته و همکاران(2021) بر پیش بینی قیمت سهام از تحلیل احساسات با استفاده از رویکردهای ML/DL متمرکز شد. عناوین اخبار تأثیر فوق العاده ای بر الگوهای خرید و فروش دارند زیرا معامله گران به راحتی تحت تأثیر آنچه می خوانند قرار می گیرند. در این اثر عناوین اخبار از نبض استخراج شده و قیمت های تاریخی از یاهو فاینانس به دست آمده است. مدل های DL پیشنهادی، یعنی مدل LSTM و LSTM-CNN، پتانسیل های DL را برای تحلیل احساسات به خوبی نشان می دهند.

راه حل های مبتنی بر DNN، تکنیک های داده محور هستند که از طریق پردازش حجم زیادی از داده ها، پویایی های اساسی حرکات قیمت سهام را یاد می گیرند. متدولوژی های مبتنی بر DNN معمولاً نیاز به داده دارند و در غیاب مجموعه وسیع و متنوعی از منابع داده، عملکرد خوبی نخواهند داشت. در دسترس بودن رسانه های خبری عمومی، کانال های خبری مبتنی بر اینترنت و رسانه های اجتماعی می تواند راه را برای آموزش بهتر مدل های DNN و افزایش بیشتر استفاده از هوش مصنوعی در بازارهای سهام هموار کند. با این حال، این زمینه تحقیقاتی به دلیل وابستگی زیاد آن به قابلیت اطمینان و کیفیت اطلاعات موجود از طریق کانال های خبری مبتنی بر اینترنت و منابع رسانه های اجتماعی، هنوز در مراحل ابتدایی خود قرار دارد (Hu et al., 2019). علاوه بر این، چنین منابع داده ای نمی توانند به طور مستقیم برای کارهای پیش بینی استفاده شوند (Luss & D'Aspremont، 2015) به دلیل ماهیت بسیار همبسته حرکات قیمت در بازار سهام. برای مقابله با مسائل فوق الذکر، یک تلاش ناکامل و به موقع برای توسعه و طراحی وجود دارد: (1) مدل های پردازش/یادگیری ترکیبی مبتنی بر معماری های مختلف و متنوع یادگیری برای گرفتن همبستگی ها و متغیرهای اساسی منابع داده، و.(۲) استراتژی های همجوشی هوشمند برای ترکیب اخبار پراکنده رسانه های اجتماعی با داده های علامت تاریخی. هدف اصلی مدل پیش بینی مبتنی بر DNN، ایجاد یک چارچوب ترکیبی اطلاعات جدید برای تجزیه و تحلیل و تفسیر روندهای همیشه در حال تغییر در طول منطقه همه گیری COVID-19 است.

مشارکت ها: مقاله مشارکت های زیر را انجام می دهد. اول، یک مجموعه داده منحصر به فرد و واقعی مربوط به پیش بینی حرکت قیمت مربوط به COVID-19 (COVID19 PRIMO) (COVID19 PRIMO, 0000) 1 ساخته شده است تا تأثیرات گرایش های مبتنی بر اینترنت و رسانه های اجتماعی مرتبط با COVID-19 را بر حرکات قیمت بازار سهام ترکیب کند. مؤلفه اصلی مجموعه داده COVID19 PRIMO ساخته شده بر اساس پیام های توییتر است. به خوبی شناخته شده است که اخبار و رسانه ها قیمت سهام را تغییر می دهند (فاما، 1998، هوانگ و لی، 2020، یون و همکاران، 2019). امروزه، اطلاعات از طریق بسترهای خبری مختلف از روزنامه، رادیو و تلویزیون گرفته تا رسانه های اجتماعی و مکان های مبتنی بر اینترنت به دست عموم می رسد. در این زمینه، رسانه های اجتماعی، به ویژه توییتر، یک پلت فرم محبوب و پرکاربرد برای به اشتراک گذاشتن نظرات شخصی در مورد موضوعات مختلف است. توییتر همچنین به طور گسترده توسط سیاستمدارانی استفاده می شود که به طور بالقوه تأثیر زیادی بر حرکت قیمت سهام دارند. بر اساس نظرسنجی در Statista (کلمنت، 2020)، از سه ماهه اول سال 2017 تا 2020، توییتر 186 میلیون کاربر فعال در سراسر جهان داشته است.

بر اساس مجموعه داده های Primo Covid19 ساخته شده ، مقاله یک چارچوب فیوژن ترکیبی و موازی عمیق برای پیش بینی حرکت قیمت سهام (COVID19-HPSMP) را ارائه می دهد (Covid19-HPSMP) که از همجوشی اطلاعات مربوط به COVID-19 استفاده می کند. داده های توییتر با داده های تاریخی بازار افق گسترده. به طور خاص ، برخلاف مدل های پیش بینی حرکت داده های موجود ، که در آن از یک مدل DL منفرد استفاده می شود (Ronaghi و همکاران ، 2020) ، Covid19-HPSMP پیشنهادی یک چارچوب ترکیبی با دو مسیر موازی است ، یعنی یکی بر اساسشبکه عصبی Convolutional (CNN) با ماژول های توجه محلی/جهانی ، و یک CNN یکپارچه و حافظه کوتاه مدت کوتاه دو جهته (BLSTM). مسیر قبلی در چارچوب COVID19-HPSMP برای استخراج ویژگی های زمانی گنجانیده شده است ، در حالی که از مسیر دوم برای استخراج ویژگی های مکانی استفاده می شود. دو مسیر موازی توسط یک لایه همجوشی چند لایه عمل می کند که به عنوان یک مرکز همجوشی عمل می کند که از ویژگی های بومی شده استخراج شده در هر یک از دو مسیر موازی استفاده می کند. از مجموعه داده COVID19 PRIMO برای ارزیابی عملکرد چارچوب پیشنهادی COVID19-HPSMP استفاده می شود ، که عملکرد برتر آن را در مقایسه با همتایان مستقل (غیر هیبریدی) نشان می دهد.

بخش باقیمانده مقاله به شرح زیر سازماندهی شده است: بخش 2 مجموعه داده Primo Covid19 را معرفی می کند و وظیفه پیش بینی حرکت سهام را تدوین می کند. چارچوب ترکیبی COVID19-HPSMP در بخش 3 ارائه شده است. مطالعه و نتایج اجرای در بخش 4 ارائه شده است. سرانجام ، بخش 5 مقاله را نتیجه می گیرد.

2. تعریف مشکل و Covid19 Primo

در این بخش ، ابتدا ، مجموعه داده Covid19 Primo معرفی شده است که بر اساس شاخص بورس سهام داو جونز و پیام های توییتر مرتبط با آن برای دوره 01/01/2016 تا 30/07/2020 ساخته شده است. تمرکز روی مشکل پیش بینی حرکت قیمت سهام است زیرا مشاهده نزدیک از حرکات بازار می تواند حضور قابل توجهی از اهداف معاملاتی با نسبت های حرکتی جزئی را نشان دهد. به طور خاص ، این مقاله بر بررسی اثرات همه گیر COVID-19 بر پیش بینی حرکت قیمت سهام متمرکز شده است. در این مقاله ، پیش بینی حرکت سهام به عنوان یک مشکل طبقه بندی دو طبقه بر اساس قیمت بسته بندی تعدیل شده سهام زیرین مدل شده است. قیمت بسته بندی تعدیل شده معمولاً برای محاسبه سود سهام و درآمد سهام مرتبط استفاده می شود (Xie ، Passonneau ، Wu ، & Creamer ، 2013). علاوه بر این ، قیمت بسته بندی تعدیل شده برای یادگیری و پیش بینی نوسانات موجود در بورس سود مفید است (لی و همکاران ، 2014 ، Rekabsaz و همکاران ، 2017).

ما یک مجموعه داده جدید برای مشکل پیش بینی فوق تهیه کرده ایم ، که می تواند تجزیه و تحلیل و ارزیابی تأثیرات احتمالی یک بیماری همه گیر در بورس را تسهیل کند و می تواند بینش های بی ارزش را برای مبارزه با همه گیر ممکن آینده فراهم کند. مجموعه داده Primo Covid19 ساخته شده از دو مؤلفه ، یعنی قیمت های تاریخی و پیام های توییتر تشکیل شده است. اولین مؤلفه ، داده های تاریخی ، از بازار سهام داو جونز بدست می آید. با تیک DJI. داو جونز یک شاخص بورس سهام است که عملکرد 30 شرکت بزرگ مانند اپل ، بوئینگ و مایکروسافت را اندازه گیری می کند. قیمت بازار سهام تاریخی از امور مالی یاهو بدست می آید. برای این کار ، ما از کتابخانه مالی یاهو در پایتون 2 برای جمع آوری داده ها از API Yahoo استفاده کردیم. برای برخی از سهام ، ما همچنین از Alpha Vantage API استفاده کردیم. 3 داده ها بر اساس سه قطعنامه زمانی مختلف ، یعنی روزانه تهیه می شوند. هفتگی ، وماهانهقیمت های روزانه در مدل ما که بعداً برای وظیفه پیش بینی حرکت سهام شرح داده شده است استفاده می شود.

با استفاده از حقایق مشخص شده در بخش 1 ، برای مؤلفه خبری مجموعه داده های پیش بینی حرکت قیمت COVID-19 ، ما روی توییتر متمرکز شدیم. شکل 1 نمودار بلوک رویکرد را برای جمع آوری و تجزیه و تحلیل پیام های توییتر نشان می دهد. خراش وب از موتور جستجوی توییتر برای ساخت مجموعه داده های توییتر استفاده می شود. API رسمی توییتر محدودیت هایی دارد که میزان متن را که می توان استخراج کرد محدود می کند. علاوه بر این ، API رسمی توییتر توییت ها را در بعضی مواقع کاهش می دهد ، که به نوبه خود منجر به مواردی با داده های گمشده می شود. ما یک API بومی سازی شده برای رسیدگی به موضوعات فوق الذکر ایجاد کرده ایم. API بومی سازی شده از موتور جستجوی توییتر استفاده می کند و به طور مستقیم مجموعه داده های مورد نیاز را از توییتر جمع می کند. ما بستر جمع آوری داده های خود را بر اساس تهیه وب سایت توییتر تنظیم کردیم. Scraping Web Twitter محتوای متن توییت را با طیف وسیعی از ویژگی های مفید باز می گرداند ، به عنوان مثال ، توییت ایجاد شده در ، بازتوییت ، متن ، تعداد مورد علاقه ، متن هشتگ ، شناسه کاربر ، تعداد پیروان ، تعداد دوستان ، تعداد وضعیت ، تعداد وضعیت ، تعداد دوستان ، تعداد دوستان ، تعداد دوستان ، تعداد دوستان ، تعداد دوستان ، شمارش دوستان ، تعداد دوستان ،کاربر ایجاد شده در و مکان. برای جمع آوری توییت های عمومی آموزنده ، ما یک محدودیت به اجرای خود برای جمع آوری توییت های بازتوییت شده بیش از یک بار اضافه کردیم. بسیاری از ویژگی های غیر ضروری دیگر در مورد یک توییت نیز از جلسه جمع آوری داده ها حذف شدند تا به اطلاعات ضروری مانند تاریخ ، متن توییت و تعداد بازتوییت ها توجه کنند. شکل 2 نمونه ای از توییتهای خام جمع آوری شده توسط خراش وب را نشان می دهد.

تجارت با گزینه‌‌های باینری...
ما را در سایت تجارت با گزینه‌‌های باینری دنبال می کنید

برچسب : نویسنده : حمیدرضا پگاه بازدید : 34 تاريخ : پنجشنبه 21 ارديبهشت 1402 ساعت: 23:37