Failover به فرآیندی اطلاق میشود که طی آن یک سیستم بهطور خودکار به سیستم آمادهبهکار، جزء سختافزاری یا شبکه سوئیچ میکند، زمانی که سیستم اولیه از کار میافتد یا بهطور موقت برای سرویسدهی از کار میافتد. هدف نهایی Failover اطمینان از خدمات بدون وقفه، بهبود قابلیت اطمینان و در دسترس بودن سیستم است.
تاریخچه شکست: از ضرورت تا همه جا
مفهوم failover را می توان به روزهای اولیه محاسبات، به ویژه در زمینه سیستم های حیاتی که در آن خرابی سیستم می تواند منجر به از دست دادن قابل توجه یا اختلال در عملیات شود، ردیابی کرد. این سیستمها به راهی برای حفظ عملکرد حتی در صورت خرابی سختافزار یا نرمافزار نیاز داشتند، که منجر به توسعه سیستمهای پشتیبان یا ثانویه میشود که میتوانند در صورت خرابی اولیه سیستم - پیش درآمدی برای failover مدرن - کنترل شوند.
اولین اجرای failover در سیستمهای اصلی بود، جایی که افزونگیها برای رسیدگی به خرابیها تعبیه شده بودند. این رویکرد با ظهور سیستمهای توزیعشده و اینترنت کاربرد گستردهای پیدا کرد، جایی که نیاز به دسترسی بالا و قابلیت اطمینان سیستم بسیار مهم شد.
عمیق تر: Failover چیست؟
در قلب خود، failover یک استراتژی افزونگی است که در دسترس بودن سیستم را در صورت خرابی تضمین می کند. این بخش جدایی ناپذیر از برنامه های بازیابی بلایا و استراتژی های در دسترس بودن بالا را تشکیل می دهد. فرآیندهای Failover میتواند خودکار، بدون نیاز به مداخله انسانی، یا دستی باشد، که نیاز به یک مدیر برای تغییر به سیستم آماده به کار دارد.
هنگامی که سیستم اولیه دچار نقص می شود، مکانیسم شکست وارد می شود. سیستم آماده به کار فعال می شود و بار کاری سیستم شکست خورده را به عهده می گیرد. هنگامی که سیستم اولیه دوباره آنلاین و پایدار شد، میتوان یک فرآیند برگشتی برای بازگرداندن عملیات به سیستم اولیه آغاز کرد.
رونمایی از فرآیند: Failover چگونه کار می کند؟
سیستمهای Failover سلامت سیستم اولیه را از طریق بررسیهای منظم یا ضربان قلب کنترل میکنند. اگر سیستم اولیه به این بررسی ها پاسخ ندهد، فرض بر این است که شکست خورده است. سپس فرآیند Failover سوئیچ به سیستم آماده به کار را آغاز می کند.
در یک زمینه نرمافزاری، سیستم آمادهباش به دادههای بهروز سیستم اولیه دسترسی دارد تا از تداوم اطمینان حاصل کند. فرآیند خاص بسته به نوع failover اجرا شده و پیچیدگی سیستم متفاوت است.
Failover همچنین میتواند شامل تغییر به سختافزارهای مختلف، مانند سرور اضافی در یک مرکز داده، یا حتی سوئیچ کردن به یک شبکه یا ارائهدهنده خدمات اینترنتی دیگر در صورت خرابی شبکه اصلی باشد.
ویژگی های کلیدی Failover
Failover با چندین ویژگی کلیدی مشخص می شود:
-
افزونگی: سیستم ها یا اجزای تکراری یک جنبه حیاتی از failover هستند. افزونگی می تواند فعال (جایی که سیستم آماده به کار به موازات اولیه در حال اجرا است) یا غیرفعال (جایی که سیستم آماده به کار تا زمانی که خرابی رخ ندهد، بیکار است).
-
یکپارچگی: هدف Failover ارائه خدمات بدون وقفه است. این بدان معنی است که سوئیچ از سیستم اولیه به سیستم آماده به کار باید بدون درز باشد و کاربران حداقل اختلال را تجربه کنند.
-
اتوماتیک یا دستی: Failover میتواند خودکار باشد، بدون دخالت انسان، یا دستی، جایی که سوئیچ به اپراتور انسانی نیاز دارد. انتخاب بین اینها معمولاً بر اساس بحرانی بودن سیستم و خطرات خرابی است.
-
تکرار داده ها: برای سیستمهای نرمافزاری و پایگاهداده، failover متکی بر تکرار مداوم دادهها از سیستم اولیه به سیستم آمادهباش است.
انواع Failover
بسته به مقیاس و نیازهای سیستم، انواع مختلفی از مکانیسم های شکست وجود دارد. در اینجا چند مورد از رایج ترین آنها آورده شده است:
-
خرابی سخت افزار: این نوع failover به سوئیچ خودکار به یک دستگاه سخت افزاری پشتیبان در هنگام خرابی دستگاه اصلی اشاره دارد.
-
نرم افزار Failover: در این نوع failover، برنامهها بهطور خودکار به سیستم نرمافزاری پشتیبان سوئیچ میکنند که سیستم نرمافزار اصلی از کار بیفتد.
-
خرابی پایگاه داده: خرابی پایگاه داده شامل جابجایی به یک پایگاه داده پشتیبان زمانی است که پایگاه داده اولیه با خطا یا شکست مواجه می شود.
-
خرابی شبکه: این نوع failover شامل سوئیچ کردن به یک شبکه پشتیبان در هنگام خرابی شبکه اصلی است.
شکست در عمل: استفاده، مشکلات و راه حل ها
Failover اغلب در سیستم های با دسترسی بالا مانند وب سرورها، پایگاه های داده، سیستم های ابری و شبکه ها استفاده می شود. در بخشهایی که خرابی سیستم غیرقابل قبول است، مانند مراقبتهای بهداشتی، مالی، و تجارت الکترونیک ضروری است.
علیرغم مزایایی که دارد، اجرای failover با چالش هایی همراه است، از جمله از دست دادن داده در طول فرآیند شکست و سندرم تقسیم مغز، که در آن هر دو سیستم اولیه و پشتیبان به طور همزمان فعال می شوند. با این حال، راه حل هایی مانند تکرار داده های همزمان و داوری مبتنی بر حد نصاب می توانند این مشکلات را کاهش دهند.
Failover: یک تحلیل مقایسه ای
Failover اغلب با سایر استراتژیهای در دسترس بالا مانند خوشهبندی، متعادلسازی بار و تکرار مقایسه میشود. خوشه بندی شامل گروه بندی چندین سرور برای عمل به عنوان یک سیستم واحد، بهبود قابلیت اطمینان و مقیاس پذیری است. تعادل بار ترافیک شبکه را به طور مساوی بین چندین سرور توزیع می کند تا اطمینان حاصل شود که هیچ سروری غرق نمی شود. Replication شامل ایجاد کپی های دقیق داده برای محافظت در برابر از دست دادن داده ها است. در حالی که آنها مفاهیم جداگانه ای هستند، همه آنها می توانند بخشی از یک استراتژی جامع در دسترس بودن بالا همراه با failover باشند.
روندهای آینده در فناوری Failover
با نگاهی به آینده، اهمیت failover تنها با افزایش اتکای ما به سیستمهای دیجیتال افزایش مییابد. فنآوریهایی مانند هوش مصنوعی و یادگیری ماشینی ممکن است در سیستمهای Failover ادغام شوند و امکان سوئیچهای هوشمندتر و کارآمدتر بین سیستمهای اولیه و آماده به کار را فراهم کنند. همچنین، ظهور محاسبات لبه و اینترنت اشیا مستلزم استراتژیهای Failover پیشرفتهتر برای اطمینان از دسترسی بالا در این شبکههای غیرمتمرکز است.
سرورهای پروکسی و Failover
در زمینه سرورهای پروکسی، failover برای حفظ سرویس بدون وقفه ضروری است. سرورهای پروکسی به عنوان واسطه بین کلاینت ها و سرورها عمل می کنند، بنابراین هرگونه خرابی می تواند چندین سرویس و کاربر را مختل کند. با failover، اگر یک سرور پراکسی از کار بیفتد، یک سرور پروکسی دیگر میتواند مدیریت را به دست بگیرد و تداوم سرویس را تضمین کند. شرکتهایی مانند OneProxy اطمینان حاصل میکنند که سرورهای پروکسیشان مکانیزمهای خرابی قوی دارند و تجربه یکپارچه و قابل اعتماد را برای کاربرانشان تضمین میکنند.
لینک های مربوطه
برای اطلاعات بیشتر در مورد failover، این منابع را بررسی کنید: