میانگین متحرک یکپارچه خودرگرسیون (ARIMA)، به عنوان یک مدل آماری اساسی، نقش مهمی در پیشبینی سریهای زمانی دارد. ریشه در ریاضیات برآورد آماری، ARIMA به طور گسترده در بخش های مختلف برای پیش بینی نقاط داده های آینده بر اساس نقاط داده قبلی در این سری استفاده می شود.
ریشه های ARIMA
ARIMA اولین بار در اوایل دهه 1970 توسط آماردانان جورج باکس و گویلیم جنکینز معرفی شد. این توسعه بر اساس کار قبلی پیرامون مدلهای خودرگرسیون (AR) و میانگین متحرک (MA) بود. باکس و جنکینز با ادغام مفهوم تفاوت، توانستند سری های زمانی غیر ثابت را مدیریت کنند که منجر به مدل ARIMA شد.
درک ARIMA
ARIMA ترکیبی از سه روش اساسی است: خود رگرسیون (AR)، یکپارچه (I) و میانگین متحرک (MA). از این روش ها برای تحلیل و پیش بینی داده های سری زمانی استفاده می شود.
-
خود رگرسیون (AR): این روش از رابطه وابسته بین یک مشاهده و تعدادی از مشاهدات عقب افتاده (دوره های قبلی) استفاده می کند.
-
یکپارچه (I): این رویکرد شامل تفاوت مشاهدات برای ثابت کردن سری زمانی است.
-
میانگین متحرک (MA): این تکنیک از وابستگی بین یک مشاهده و یک خطای باقیمانده از یک مدل میانگین متحرک استفاده میکند که برای مشاهدات با تاخیر اعمال میشود.
مدلهای ARIMA اغلب بهعنوان ARIMA (p, d, q) مشخص میشوند، جایی که 'p' ترتیب قسمت AR است، 'd' ترتیب تفاضل مورد نیاز برای ثابت کردن سری زمانی و 'q' ترتیب است. از بخش MA
ساختار داخلی و کار ARIMA
ساختار ARIMA از سه بخش AR، I و MA تشکیل شده است. هر بخش نقش خاصی در تجزیه و تحلیل داده ها دارد:
- بخش AR تأثیر مقادیر دوره های گذشته بر دوره جاری را اندازه گیری می کند.
- جدا میشم برای ثابت کردن داده ها، یعنی حذف روند از داده ها استفاده می شود.
- بخش MA وابستگی بین یک مشاهده و یک خطای باقیمانده از یک مدل میانگین متحرک اعمال شده برای مشاهدات تاخیری را در بر می گیرد.
مدل ARIMA برای یک سری زمانی در سه مرحله اعمال می شود:
- شناسایی: تعیین ترتیب تفاوت، 'd' و ترتیب اجزای AR یا MA.
- برآورد کردن: پس از شناسایی مدل، داده ها برای برآورد ضرایب با مدل برازش می شوند.
- تایید: مدل برازش شده برای اطمینان از تناسب مناسب با داده ها بررسی می شود.
ویژگی های کلیدی ARIMA
- مدل های ARIMA می توانند نقاط داده آینده را بر اساس داده های گذشته و حال پیش بینی کنند.
- میتواند دادههای سری زمانی را که ثابت هستند مدیریت کند.
- به ویژه زمانی موثر است که داده ها روند واضح یا الگوی فصلی را نشان دهند.
- ARIMA برای به دست آوردن نتایج دقیق به مقدار زیادی داده نیاز دارد.
انواع ARIMA
دو نوع اصلی از مدل های ARIMA وجود دارد:
-
ARIMA غیر فصلی: ساده ترین شکل ARIMA است. برای داده های غیر فصلی که در آن روند چرخه ای قطعی وجود ندارد استفاده می شود.
-
ARIMA فصلی (SARIMA): این افزونه ARIMA است که به صراحت از یک جزء فصلی در مدل پشتیبانی می کند.
کاربردهای عملی ARIMA و حل مسئله
ARIMA کاربردهای متعددی از جمله پیش بینی اقتصادی، پیش بینی فروش، تحلیل بازار سهام و غیره دارد.
یکی از مشکلات رایجی که در ARIMA با آن مواجه میشویم، بیش از حد برازش است، که در آن مدل بسیار نزدیک به دادههای آموزشی تناسب دارد و در دادههای جدید و دیده نشده ضعیف عمل میکند. راه حل در استفاده از تکنیک هایی مانند اعتبار سنجی متقاطع برای جلوگیری از برازش بیش از حد نهفته است.
مقایسه با روش های مشابه
ویژگی | آریما | هموارسازی نمایی | شبکه عصبی مکرر (RNN) |
---|---|---|---|
داده های غیر ثابت را مدیریت می کند | آره | خیر | آره |
خطا، روند و فصلی را در نظر می گیرد | آره | آره | خیر |
نیاز به مجموعه داده های بزرگ | آره | خیر | آره |
سهولت در تفسیر | بالا | بالا | کم |
چشم اندازهای آینده آریما
ARIMA همچنان یک مدل اساسی در زمینه پیش بینی سری های زمانی است. ادغام ARIMA با تکنیک های یادگیری ماشین و فناوری های هوش مصنوعی برای پیش بینی های دقیق تر روند قابل توجهی برای آینده است.
سرورهای پروکسی و ARIMA
سرورهای پروکسی به طور بالقوه می توانند از مدل های ARIMA در پیش بینی ترافیک سود ببرند و به مدیریت تعادل بار و تخصیص منابع سرور کمک کنند. با پیش بینی ترافیک، سرورهای پروکسی می توانند به صورت پویا منابع را برای اطمینان از عملکرد بهینه تنظیم کنند.