تشخیص و رفع خرابی سرور | مشکلات سخت افزاری و نرم افزاری
هشدار مهم! قبل از هر اقدام این بخش را مطالعه کنید:
در صورتی که با خرابی سرور مواجه شدهاید، پیش از هر اقدامی لازم است بدانید که بیشترین آسیب به اطلاعات، معمولاً ناشی از خود خرابی نیست، بلکه نتیجهی اقداماتی است که بدون تحلیل و بررسی دقیق وضعیت سیستم انجام میشوند. اقداماتی مانند ریستارتهای مکرر، جابهجایی هارد یا Rebuild در ساعات اولیه بحران که میتواند باعث از بین رفتن فرصت ریکاوری و به خطر افتادن اطلاعات شود و شانس موفقیت در بازیابی را به شدت کاهش دهد.
بنابراین، اگر در سرور شما چراغهای وضعیت هارد (Fault LED) یا مادربرد به رنگ قرمز ثابت درآمدهاند، بلافاصله اقدامات زیر را انجام دهید:
- فوراً سرور را خاموش کنید.(ادامه کار با دستگاه در این وضعیت باعث تراشیده شدن پلاتر هارد یا سوختن کامل برد میشود.)
- به هیچ وجه Rebuild یا Initialize نکنید.
- جای هاردها (Slot) را عوض نکنید.
هر ثانیه کار کردن سرور در این شرایط، شانس بازیابی اطلاعات و تعمیر سرور را به شدت کاهش میدهد.
خاموش شدن سرور باعث عدم دسترسی به تمامی اپلیکیشن ها و اطلاعات مهم خواهد شد.
ما درک میکنیم نیاز دارید هر چه سریعتر شرایط به حالت قبل بازگردد و مجددا به اطلاعات دسترسی پیدا کنید.
با این حال خوب است بدانید:
خرابی سرور به معنای از دست رفتن دائمی اطلاعات نیست.
این راهنما به شما کمک میکند تا هنگام مواجهه با خطاهای سرور بهترین اقدامات را انجام دهید تا اطلاعات با بالاترین شانس موفقیت بازیابی شوند.
انواع خرابی های سرور
بر اساس استانداردهای جهانی و تجربیات مرکز هارد ایران در زمینه سرورهای HPE ProLiant ، Dell PowerEdge و ….، خرابیها معمولاً به دو دسته اصلی تقسیم میشوند:
دسته اول: آسیبدیدگیهای سختافزاری (Physical Failures)
- خرابی هارد های سیستم عامل و دیتا (Hard Drive Failure)
- خرابی قطعات پردازشی: سوختن مادربرد، خطای RAM و نقص CPU
- نقص در رید کنترلر داخلی (Internal RAID Controller)
- آسیبهای محیطی (نوسان برق، گرما)
دسته دوم: آسیبدیدگیهای نرمافزاری (Logical Failures)
- مشکلات بوت و سیستم عامل: صفحه آبی (BSOD) یا صفحه بنفش (PSOD)
- خرابی دیتابیس: (SQL Server Suspect Mode / Exchange Corruption)
- خطاهای انسانی و حملات باجافزاری

آسیبدیدگیهای سختافزاری سرور
خرابی فیزیکی هارد (OS Drives & Data LUNs)
یکی از رایج ترین دلایل خاموشی سرور، وجود آسیب دیدگی سخت افزاری در هارد هاست.
نشانههای قطعی:
روشن شدن چراغهای هشدار (LED Status): روشن شدن چراغ نارنجی چشمکزن (Predicted Failure) یا قرمز ثابت روی کیج هارد.
عدم شناسایی (Not Detected)هارد : هارد روشن میشود اما در محیط بایوس (RBSU) یا سیستم عامل دیده نمیشود.
کندی یا توقف کپی (Bad Sectors): اگر سرور به شدت کند شده یا حین کپی اطلاعات، هنگ میکند، نشانه وجود بدسکتور فیزیکی است.
خاموشی ناگهانی: سناریوهایی که سرور حین کار ناگهان خاموش شده و روشن نمیشود (سوختن موتور/برد)
خرابی قطعات پردازشی (CPU, RAM, Mainboard)
خرابی رم و پردازنده (CPU) در سرورها بسیار رایج است و معمولاً باعث توقف ناگهانی و اختلال در عملکرد سیستم میشود.
علائم اصلی:
بوقهای ممتد: شنیدن بوقهای خاص هنگام روشن شدن سرور (معمولاً نشانگر خرابی RAM یا کارت گرافیک است)
ارورهای مموری: نمایش پیامهای Uncorrectable Memory Error قبل از بوت شدن.
ریستارتهای ناگهانی : سرور بدون هیچ پیامی ریست میشود (نقص در مدار تغذیه مادربرد یا CPU)
خرابی کنترلر رید اینترنال(Internal RAID Controller)
گاهی هاردها سالم هستند، اما “مغز” مدیریتکننده آنها (مثل کارتهای HP Smart Array) دچار اختلال میشوند.
علائم اصلی:
شناسایی نشدن RAID : سرور هنگام بوت شدن ، Volume را نمیشناسد.
از دست رفتن کانفیگ (Lost Config): خرابی باتری کش (Cache Battery) باعث از بین رفتن تنظیمات RAID میشود.
مشکلات کابل و اتصالات: عدم شناسایی هاردها پس از جابجایی کابلهای SAS/SATA یا جا به جا بستن هاردها در اسلاتهای اشتباه.
خرابی های محیطی و فیزیکی
برای رفع این نوع خرابی ها تجهیزات (کلین روم) و سرعت(ریکاوری اورژانسی) نقش تعیین کننده ای خواهد داشت:
شایع ترین خرابی های محیطی:
آبخوردگی: نشت آب از کولینگ یا سقف. نفوذ آب در سرور باعث سولفاته شدن قطعات میشود.
نوسانات شدید برق: شوک الکتریکی باعث میشود همزمان پاور سرور (PSU) و قطعات داخلی آن بسوزد.
گرمای بیش از حد (Over heating): گرمای بیش از حد باعث از کار افتادن فن ها و خاموش شدن سرور میشود.

دسته دوم: آسیبدیدگیهای نرمافزاری (The Logical Failures)
در این حالت، سختافزار سرور سالم است و چراغها، وضعیت عادی (سبز) نشان میدهند، اما سرویسها به درستی بالا نمیآیند یا
سیستمعامل دچار کرش میشود.
خرابی سیستم عامل و بوت (Boot Failure & Crashes)
مشکلاتی که مستقیماً سیستم عامل سرور (ویندوز یا لینوکس) را هدف قرار میدهند.
رایج ترین علائم :
صفحه آبی مرگ (BSOD): این خطا در ویندوز سرور، نشاندهنده خرابی فایلهای سیستمی یا درایورها است.
صفحه بنفش مرگ (PSOD): صفحه بنفش مرگ در محیط مجازیسازی VMware ESXi، نشاندهنده خطای کرنل یا ناسازگاری سختافزاری است.
ارور “No Bootable Device”: پریدن سکتورهای بوت یا خرابی پارتیشن تیبل.
خرابی دیتابیس و اپلیکیشنها (Database Corruption) : دیتابیسهای (SQL, Oracle, Exchange) حساسترین بخش نرمافزاری سرور هستند.
علائم اصلی خرابی:
- سرویس SQL استارت نمیشود.
- دیتابیس در حالت Suspect Mode یا Recovery Pending قرار میگیرد.
- فایلهای EDB Exchange باز نمیشوند (Dirty Shutdown).
خطاهای انسانی و باجافزار
- خطای انسانی: پاک شدن ماشین مجازی (Deleted VMs) ، فرمت کردن اشتباهی LUN، یا Initialize کردن مجدد RAID.
- باجافزار: نفوذ از طریق RDP و رمزگذاری فایلها .
توجه داشته باشید برای بازیابی اطلاعات ماشین مجازی و یا فایل های رمزگذاری شده سرور ، لازم است سرور توسط متخصصین ریکاوری سرور و RAID مورد بررسی قرار گیرند تا شانس بازیابی کامل و موفق سرور شما تضمین شود .

جدول عیب یابی و رفع خرابی سرور در یک نگاه
| علائم خرابی | نوع آسیب احتمالی | اقدام حیاتی |
|---|---|---|
| چراغ نارنجی/قرمز روی هارد | سختافزاری (Physical Disk) | خاموش کردن سرور؛ عدم تعویض هارد |
| بوق ممتد / ارور Memory | سختافزاری (RAM/CPU) | بررسی ماژولهای رم توسط متخصص |
| صفحه بنفش (PSOD) | نرمافزاری/سختافزاری (VMware) | از ارور عکس بگیرید و ریستارت نکنید. |
| دیتابیس Suspect شده | نرمافزاری (Database) | عدم اجرای دستورات تعمیر دیتابیس (DBCC) |
| صدای تقتق یا سوت | سختافزاری (Head Crash) | خاموشی فوری؛ وضعیت بحرانی |
| توقف کپی / کندی شدید | سختافزاری (Bad Sector) | توقف کار؛ ایمیجگیری تخصصی |
| آبخوردگی / بوی دود | محیطی (Environmental) | جدا کردن از برق؛ هرگز روشن نکنید |
3 اقدام رایج که اطلاعات را نابود میکند
طبق آمار و تجربه تیم فنی مرکز هارد ایران ، بیش از 90 درصد سرور هایی که در فرایند ریکاوری با شکست مواجه میشوند، برای برطرف کردن ارور و رفع خرابی سرور اقدامات زیر را انجام داده اند:
عملیات Rebuild روی RAID خراب: اگر یک هارد خراب و هاردهای دیگر دچار بدسکتور باشند، انجام فرآیند Rebuild باعث نابودی اطلاعات میشود.
نرمافزارهای ریکاوری رایگان: هنگامی که هارد دچار خرابی فیزیکی شده، اسکن کردن آن با استفاده از نرم افزار ها، باعث فشار به هد و خراشیدگی پلاتر خواهد شد.
دستکاری دیتابیس: تلاش برای تعمیر دیتابیس SQL بدون داشتن بکاپ سالم، باعث حذف جداول خراب و ناقص شدن دیتا میشود.
رفع خرابی سخت افزاری سرور و بازیابی دیتابیس SQL شرکت ….پویان در مرکز هارد ایران (فوری)
خرابی 5 RAID : خاموشی غیر منتظره هارد سرور و قطع دسترسی دیتابیس
سرور HPE DL380 G9 شرکت … پویان که دارای RAID 5 بود به دلیل خرابی سخت افزاری هارد سوم که از نوع SSD بود با مشکلات زیر روبه رو شده بود :
- هارد SSD بعد از چند ثانیه خاموش و از مدار خاموش میشد .
- هارد در ویندوز شناسایی نمی شد .
- دسترسی به نرم افزار اتوماسیون اداری به طور کامل قطع شده بود .
اقدامات تیم فنی مرکز هارد ایران
تیم فنی ما با تست و بررسی دقیق لاگهای ILO ، دریافتند وجود آسیب الکترونیکی هارد SSD ، موجب قطع دسترسی به RAID شده بود .
از آنجایی که هارد SSD دچار آسیب سخت افزاری شده بود ، فشار آوردن به هارد معیوب می توانست ، موجب تخریب کامل هارد گردد ، به همین دلیل کارشناسان ما ، RAID 5 را به شکل مجازی شبیه سازی کرده و دیتابیس SQL و اطلاعات مهم شرکت را بازیابی کردند .
مرکز تخصصی بازیابی اطلاعات و تعمیر سرور
مرکز هارد ایران برای رفع خرابی سرور و بازیابی اطلاعات ، مجهز به PC3000 SAS می باشد و به پشتوانه این تجهیزات ریکاوری سرور و هارد را در کوتاه ترین زمان ممکن انجام میدهد. همچنین در مواردی که هارد ها دچار آسیب فیزیکی شده باشند و نیاز به تعویض هد یا جراحی هارد وجود داشته باشد، این مرکز با استفاده از محیط کلین روم و بهره بری از مجرب ترین تکنسین جراحی هارد در کشور تعویض هد را در استاندارد ترین حالت ممکن انجام خواهد داد.
کارشناسان ما با داشتن تجربه و تخصص کافی در زمینه ریکاوری اطلاعات ، توانایی بازیابی اطلاعات از فایل های VMDK و تعمیر دیتابیس های SQL را دارند.
بنابراین در صورت روبرو شدن با هرگونه اختلال در عملکرد سرور بهتر است هیچ اقدامی جهت تعمیر و بازیابی اطلاعات آن انجام نداده و با کارشناسان مرکز هارد ایران تماس بگیرید. متخصصین ما پس از تشخیص دقیق نوع خرابی و بررسی اولیه هزینه دقیق و مدت زمان لازم برای بازیابی دیتا را به شما اعلام میکنند.



سلام و خسته نباشید. ممنون بابت هشدار مهمی که اول مقاله دادید.
متاسفانه ما قبل از خوندن این مطلب، وقتی چراغ یکی از هاردها قرمز شد، هارد رو درآوردیم و توی یک اسلات دیگه جا زدیم (گفتیم شاید پورتش خاک گرفته باشه).
الان سرور کلاً ارور RAID Configuration Lost میده.
طبق گفته شما این کار باعث به هم ریختگی آرایش RAID شده. الان با توجه به اینکه جای هاردها عوض شده، شما توی مرکز میتونید ترتیب صحیح هاردها رو دوباره پیدا کنید یا چون جابجا کردیم دیگه اطلاعات پریده؟
سلام
جابجا کردن هاردها میتونه ترتیب RAID رو به هم بزنه، ولی به معنی از بین رفتن قطعی اطلاعات نیست.
در مرکز ما با بررسی متادیتا و ساختار هاردها معمولاً میشه ترتیب صحیح رو بازسازی کرد.
حتی اگر اسلاتها جابجا شده باشن، در بسیاری از موارد آرایش قبلی قابل تشخیصه.
مهم اینه که دیگه روی سرور عملیات Rebuild یا Initialize انجام نشه.