رفع خرابی‌ سرور (سخت‌افزاری و نرم‌افزاری)

رفع خرابی‌ سرور
نظر بده

تشخیص و رفع خرابی‌ سرور | مشکلات سخت افزاری و نرم افزاری

هشدار مهم! قبل از هر اقدام این بخش را مطالعه کنید:

در صورتی که با خرابی سرور مواجه شده‌اید، پیش از هر اقدامی لازم است بدانید که بیشترین آسیب به اطلاعات، معمولاً ناشی از خود خرابی نیست، بلکه نتیجه‌ی اقداماتی است که بدون تحلیل و بررسی دقیق وضعیت سیستم انجام می‌شوند. اقداماتی مانند ریستارت‌های مکرر، جابه‌جایی هارد یا Rebuild در ساعات اولیه بحران که می‌تواند باعث از بین رفتن فرصت ریکاوری و به خطر افتادن اطلاعات شود و شانس موفقیت در بازیابی را به شدت کاهش دهد.

بنابراین، اگر در سرور شما چراغ‌های وضعیت هارد (Fault LED) یا مادربرد به رنگ قرمز ثابت درآمده‌اند، بلافاصله اقدامات زیر را انجام دهید:

  • فوراً سرور را خاموش کنید.(ادامه کار با دستگاه در این وضعیت باعث تراشیده شدن پلاتر هارد یا سوختن کامل برد میشود.)
  • به هیچ وجه Rebuild یا Initialize نکنید.
  • جای هاردها (Slot) را عوض نکنید.

هر ثانیه کار کردن سرور در این شرایط، شانس بازیابی اطلاعات و تعمیر سرور را به شدت کاهش می‌دهد.

خاموش شدن سرور باعث عدم دسترسی به تمامی اپلیکیشن ها و اطلاعات مهم خواهد شد.
ما درک میکنیم نیاز دارید هر چه سریعتر شرایط به حالت قبل بازگردد و مجددا به اطلاعات دسترسی پیدا کنید.

با این حال خوب است بدانید:
خرابی سرور به معنای از دست رفتن دائمی اطلاعات نیست.

این راهنما به شما کمک میکند تا هنگام مواجهه با خطاهای سرور بهترین اقدامات را انجام دهید تا اطلاعات با بالاترین شانس موفقیت بازیابی شوند.

انواع خرابی های سرور

بر اساس استانداردهای جهانی و تجربیات مرکز هارد ایران در زمینه سرورهای HPE ProLiant ، Dell PowerEdge و ….، خرابی‌ها معمولاً به دو دسته اصلی تقسیم می‌شوند:

دسته اول: آسیب‌دیدگی‌های سخت‌افزاری (Physical Failures)

  • خرابی هارد های سیستم عامل و دیتا (Hard Drive Failure)
  • خرابی قطعات پردازشی: سوختن مادربرد، خطای RAM و نقص CPU
  • نقص در رید کنترلر داخلی (Internal RAID Controller)
  • آسیب‌های محیطی (نوسان برق، گرما)

 دسته دوم: آسیب‌دیدگی‌های نرم‌افزاری (Logical Failures)

  •  مشکلات بوت و سیستم عامل: صفحه آبی (BSOD) یا صفحه بنفش (PSOD)
  •  خرابی دیتابیس: (SQL Server Suspect Mode / Exchange Corruption)
  •  خطاهای انسانی و حملات باج‌افزاری

رفع ارور های سرور و بازیابی اطلاعات سرور و ماشین مجازی

آسیب‌دیدگی‌های سخت‌افزاری سرور

خرابی فیزیکی هارد (OS Drives & Data LUNs)

یکی از رایج ترین دلایل خاموشی سرور، وجود آسیب دیدگی سخت افزاری در هارد هاست.

نشانه‌های قطعی:

روشن شدن چراغ‌های هشدار (LED Status): روشن شدن چراغ نارنجی چشمک‌زن (Predicted Failure) یا قرمز ثابت روی کیج هارد.

عدم شناسایی (Not Detected)هارد : هارد روشن می‌شود اما در محیط بایوس (RBSU) یا سیستم عامل دیده نمی‌شود.

کندی یا توقف کپی (Bad Sectors): اگر سرور به شدت کند شده یا حین کپی اطلاعات، هنگ می‌کند، نشانه وجود بدسکتور فیزیکی است.

خاموشی ناگهانی: سناریوهایی که سرور حین کار ناگهان خاموش شده و روشن نمیشود (سوختن موتور/برد)

خرابی قطعات پردازشی (CPU, RAM, Mainboard)

خرابی‌ رم و پردازنده (CPU) در سرورها بسیار رایج است و معمولاً باعث توقف ناگهانی و اختلال در عملکرد سیستم می‌شود.

علائم اصلی:

بوق‌های ممتد: شنیدن بوق‌های خاص هنگام روشن شدن سرور (معمولاً نشانگر خرابی RAM یا کارت گرافیک است)

ارورهای مموری: نمایش پیام‌های Uncorrectable Memory Error قبل از بوت شدن.

ریستارت‌های ناگهانی : سرور بدون هیچ پیامی ریست می‌شود (نقص در مدار تغذیه مادربرد یا CPU)

خرابی کنترلر رید اینترنال(Internal RAID Controller)

گاهی هاردها سالم هستند، اما “مغز” مدیریت‌کننده آن‌ها (مثل کارت‌های HP Smart Array) دچار اختلال میشوند.

علائم اصلی:

شناسایی نشدن RAID : سرور هنگام بوت شدن ، Volume را نمی‌شناسد.

از دست رفتن کانفیگ (Lost Config): خرابی باتری کش (Cache Battery) باعث از بین رفتن تنظیمات RAID می‌شود.

مشکلات کابل و اتصالات: عدم شناسایی هاردها پس از جابجایی کابل‌های SAS/SATA یا جا به جا بستن هاردها در اسلات‌های اشتباه.

خرابی های محیطی و فیزیکی

برای رفع این نوع خرابی ها تجهیزات (کلین روم) و سرعت(ریکاوری اورژانسی) نقش تعیین کننده ای خواهد داشت:

شایع ترین خرابی های محیطی:

آب‌خوردگی: نشت آب از کولینگ یا سقف. نفوذ آب در سرور باعث سولفاته شدن قطعات می‌شود.

نوسانات شدید برق: شوک الکتریکی باعث میشود همزمان پاور سرور (PSU) و قطعات داخلی آن بسوزد.

گرمای بیش از حد (Over heating): گرمای بیش از حد باعث از کار افتادن فن ها و خاموش شدن سرور میشود.

بازیابی اطلاعات سازمانی از سرورهای آسیب دیده

دسته دوم: آسیب‌دیدگی‌های نرم‌افزاری (The Logical Failures)

در این حالت، سخت‌افزار سرور سالم است و چراغ‌ها، وضعیت عادی (سبز) نشان می‌دهند، اما سرویس‌ها به درستی بالا نمی‌آیند یا

سیستم‌عامل دچار کرش می‌شود.

خرابی سیستم عامل و بوت (Boot Failure & Crashes)

مشکلاتی که مستقیماً سیستم عامل سرور (ویندوز یا لینوکس) را هدف قرار می‌دهند.

رایج ترین علائم :

صفحه آبی مرگ (BSOD): این خطا در ویندوز سرور، نشان‌دهنده خرابی فایل‌های سیستمی یا درایورها است.

صفحه بنفش مرگ (PSOD): صفحه بنفش مرگ در محیط مجازی‌سازی VMware ESXi، نشان‌دهنده خطای کرنل یا ناسازگاری سخت‌افزاری است.

ارور “No Bootable Device”: پریدن سکتورهای بوت یا خرابی پارتیشن تیبل.

خرابی دیتابیس و اپلیکیشن‌ها (Database Corruption) : دیتابیس‌های (SQL, Oracle, Exchange) حساس‌ترین بخش نرم‌افزاری سرور هستند.

علائم اصلی خرابی:

  • سرویس SQL استارت نمی‌شود.
  • دیتابیس در حالت Suspect Mode یا Recovery Pending قرار می‌گیرد.
  • فایل‌های EDB Exchange باز نمی‌شوند (Dirty Shutdown).

خطاهای انسانی و باج‌افزار

  • خطای انسانی: پاک شدن ماشین مجازی (Deleted VMs) ، فرمت کردن اشتباهی LUN، یا Initialize کردن مجدد RAID.
  • باج‌افزار: نفوذ از طریق RDP و رمزگذاری فایل‌ها .

توجه داشته باشید برای بازیابی اطلاعات ماشین مجازی و یا فایل های رمزگذاری شده سرور ، لازم است سرور توسط متخصصین ریکاوری سرور و RAID مورد بررسی قرار گیرند تا شانس بازیابی کامل و موفق سرور شما تضمین شود .

بازیابی اطلاعات سرور دان شده و رفع ارور های سرور

جدول عیب یابی و رفع خرابی‌ سرور در یک نگاه

علائم خرابی نوع آسیب احتمالی اقدام حیاتی
چراغ نارنجی/قرمز روی هارد سخت‌افزاری (Physical Disk) خاموش کردن سرور؛ عدم تعویض هارد
بوق ممتد / ارور Memory سخت‌افزاری (RAM/CPU) بررسی ماژول‌های رم توسط متخصص
صفحه بنفش (PSOD) نرم‌افزاری/سخت‌افزاری (VMware) از ارور عکس بگیرید و ریستارت نکنید.
دیتابیس Suspect شده نرم‌افزاری (Database) عدم اجرای دستورات تعمیر دیتابیس (DBCC)
صدای تق‌تق یا سوت سخت‌افزاری (Head Crash) خاموشی فوری؛ وضعیت بحرانی
توقف کپی / کندی شدید سخت‌افزاری (Bad Sector) توقف کار؛ ایمیج‌گیری تخصصی
آب‌خوردگی / بوی دود محیطی (Environmental) جدا کردن از برق؛ هرگز روشن نکنید

3 اقدام رایج که اطلاعات را نابود میکند

طبق آمار و تجربه تیم فنی مرکز هارد ایران ، بیش از 90 درصد سرور هایی که در فرایند ریکاوری با شکست مواجه میشوند، برای برطرف کردن ارور و رفع خرابی‌ سرور اقدامات زیر را انجام داده اند:

عملیات Rebuild روی RAID خراب: اگر یک هارد خراب و هاردهای دیگر دچار بدسکتور باشند، انجام فرآیند Rebuild باعث نابودی اطلاعات میشود.

نرم‌افزارهای ریکاوری رایگان: هنگامی که هارد دچار خرابی فیزیکی شده، اسکن کردن آن با استفاده از نرم افزار ها، باعث فشار به هد و خراشیدگی پلاتر خواهد شد.

دستکاری دیتابیس: تلاش برای تعمیر دیتابیس SQL بدون داشتن بکاپ سالم، باعث حذف جداول خراب و ناقص شدن دیتا می‌شود.

رفع خرابی سخت افزاری سرور و بازیابی دیتابیس SQL شرکت ….پویان در مرکز هارد ایران (فوری)

خرابی 5 RAID : خاموشی غیر منتظره هارد سرور و قطع  دسترسی دیتابیس

سرور HPE DL380 G9 شرکت … پویان که دارای RAID 5 بود به دلیل خرابی سخت افزاری هارد سوم که از نوع SSD بود با مشکلات زیر روبه رو شده بود :

  • هارد SSD بعد از چند ثانیه خاموش و از مدار خاموش میشد .
  • هارد در ویندوز شناسایی نمی شد .
  • دسترسی به نرم افزار اتوماسیون اداری به طور کامل قطع شده بود .

اقدامات تیم فنی مرکز هارد ایران

تیم فنی ما با تست و بررسی دقیق  لاگ‌های ILO ، دریافتند وجود آسیب الکترونیکی هارد SSD ، موجب قطع دسترسی به RAID شده بود .

از آنجایی که هارد SSD دچار آسیب سخت افزاری شده بود ، فشار آوردن به هارد معیوب می توانست ،  موجب تخریب کامل هارد گردد ، به همین دلیل کارشناسان ما ، RAID 5 را به شکل مجازی شبیه سازی کرده و دیتابیس SQL و اطلاعات مهم شرکت را بازیابی کردند .

مرکز تخصصی بازیابی اطلاعات و تعمیر سرور

مرکز هارد ایران برای رفع خرابی‌ سرور و بازیابی اطلاعات ، مجهز به PC3000 SAS می باشد و به پشتوانه این تجهیزات ریکاوری سرور و هارد را در کوتاه ترین زمان ممکن انجام میدهد. همچنین در مواردی که هارد ها دچار آسیب فیزیکی شده باشند و نیاز به تعویض هد یا جراحی هارد وجود داشته باشد، این مرکز با استفاده از محیط کلین روم و بهره بری از مجرب ترین تکنسین جراحی هارد در کشور تعویض هد را در استاندارد ترین حالت ممکن انجام خواهد داد.

کارشناسان ما با داشتن تجربه و تخصص کافی در زمینه ریکاوری اطلاعات ، توانایی بازیابی اطلاعات از فایل های VMDK و تعمیر دیتابیس های SQL را دارند.

بنابراین در صورت روبرو شدن با هرگونه اختلال در عملکرد سرور بهتر است هیچ اقدامی جهت تعمیر و بازیابی اطلاعات آن انجام نداده و با کارشناسان مرکز هارد ایران تماس بگیرید. متخصصین ما پس از تشخیص دقیق نوع خرابی و بررسی اولیه هزینه دقیق و مدت زمان لازم برای بازیابی دیتا را به شما اعلام میکنند.

بهترین مرکز تعمیر و ریکاوری سرور در تهران

روند بازیابی اطلاعات مرکز هارد ایران12
روند بازیابی اطلاعات مرکز هارد ایران

2 thoughts on “رفع خرابی‌ سرور (سخت‌افزاری و نرم‌افزاری)

  1. hessam میگوید:

    سلام و خسته نباشید. ممنون بابت هشدار مهمی که اول مقاله دادید.
    متاسفانه ما قبل از خوندن این مطلب، وقتی چراغ یکی از هاردها قرمز شد، هارد رو درآوردیم و توی یک اسلات دیگه جا زدیم (گفتیم شاید پورتش خاک گرفته باشه).
    الان سرور کلاً ارور RAID Configuration Lost میده.
    طبق گفته شما این کار باعث به هم ریختگی آرایش RAID شده. الان با توجه به اینکه جای هاردها عوض شده، شما توی مرکز میتونید ترتیب صحیح هاردها رو دوباره پیدا کنید یا چون جابجا کردیم دیگه اطلاعات پریده؟

    • کارشناس فنی 3 میگوید:

      سلام
      جابجا کردن هارد‌ها می‌تونه ترتیب RAID رو به هم بزنه، ولی به معنی از بین رفتن قطعی اطلاعات نیست.

      در مرکز ما با بررسی متادیتا و ساختار هاردها معمولاً میشه ترتیب صحیح رو بازسازی کرد.
      حتی اگر اسلات‌ها جابجا شده باشن، در بسیاری از موارد آرایش قبلی قابل تشخیصه.

      مهم اینه که دیگه روی سرور عملیات Rebuild یا Initialize انجام نشه.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *