رفع خرابی فایل سیستم سرور | تشخیص خطا و بازیابی اطلاعات
سرور روشن است و چراغ هارد سبز است؛ در ظاهر همهچیز عادی به نظر میرسد، اما چرا دیتابیس ها بالا نمیآید؟ چرا پارتیشنهای چند ترابایتی ناپدید شدهاند؟
اینها نمونههایی از مشکلات نرمافزاری سرور هستند.
اگر خونسرد باشید و هیچ اقدام غیر تخصصی انجام ندهید،، اطلاعات قابل بازیابی است و سرور به حالت قبل باز خواهد گشت.
در چنین شرایطی مهمترین نکته این است که:
یک کلیک اشتباه در console management یا هرگونه اقدام جهت بازیابی اطلاعات یا تعمیر سرور، منجر به نابودی کامل اطلاعات میشود.
نشانههای قطعی خرابی فایل سیستم در سرور
مشکلات نرمافزاری یا Logical Corruption در سرور، زمانی رخ میدهد که سختافزار سالم است، اما اطلاعات به دلیل بهم ریختگی نرم افزاری، خرابی فایل سیستم سرور یا خطای پارتیشن بندی غیر قابل دسترس میشود. در چنین شرایطی برخلاف خرابی های فیزیکی، سرور همچنان روشن میماند، اما سیستم عامل بوت نمیشود، درایوها از دسترس خارج شده یا حجم و محتوای پارتیشنها قابل شناسایی نیستند.
در ادامه به بررسی هر یک از نشانه های خرابی فایل سیستم سرور می پردازیم:
خرابی های متادیتا
هنگامی که در محیط ESXI، دیتا استور Datastore با مشکلات ظرفیت مواجه میشود، معمولا به این معناست که متا دیتا دچار آسیب دیدگی شده است. در صورت بروز چنین مشکلاتی توصیه میشود قبل از هرگونه اقدام جهت بازیابی اطلاعات با مرکز هارد ایران تماس بگیرید.
خطای “Unknown Datastore” در سرور
روبرو شدن با ارور “Unknown Datastore” در لینوکس یا VMware یکی از نشانه های خرابی فایل سیسم سرور است که به دلیل عدم تشخیص فایل سیستم رخ میدهد .
در این شرایط سرور هاردها را شناسایی میکند اما فایل سیستمی را برای بوت سرور تشخیص نمیدهد.

کرش کردن و خطاهای سیستمی
ارور BSOD یا همان خطای صفحه آبی و یا توقف سیستم عامل سرور با ارور Kernel Panic نشانه های تخریب (Corrupt) فایل های سیستمی حیاتی میباشد.
اقدامی که باعث نابودی اطلاعات میشود
Rebuild کردن RAID: درصورتی که ندانید کدام درایو در چه زمانی از RAID خارج شده است، Rebuild کردن آن باعث ایجاد (Parity Pollution) میشود. در این حالت، دیتا با صفر و یکهای نادرست بازنویسی شده و ساختار اطلاعات خراب میشود، در نتیجه بازیابی اطلاعات غیر ممکن خواهد بود.
انواع آسیبدیدگیهای نرمافزاری سرور
بر اساس گزارش های مشتریان مرکز هارد ایران، بیشترین خرابی های سرور معمولا محدود به این دلایل می شود که در ادامه به آنها می پردازیم:
1.خطاهای بحرانی (Critical Failures) در پلتفرمهای مجازیسازی (VMware/ESXi & Hyper-V)
مدیریت و بازیابی اطلاعات از پلتفرم های مجازی سازی پیچیدگیهای خاص خود را دارد و نیازمند متخصصانی است که به ساختار فایلسیستم (بهویژه تحلیل در سطح Hex) مسلط باشند.
* مشکلات Datastore: شایعترین نوع خرابی ، Mount نشدن یا شناسایی نشدن پارتیشنهای VMFS است. گاهی اوقات به دلیل باگ در فرمور (Firmware) یا کنترلر RAID ، سیگنچر (Signature) پارتیشن آسیب میبیند یا اصطلاحاً Lost Partition رخ میدهد.
* نمایش نادرست ظرفیت: اگر ESXi به طور ناگهانی یک LUN چند ترابایتی را فقط چند گیگابایت نشان دهد، معمولاً نشاندهنده خرابی در GPT Partition Table یا آسیب دیدن LVM Metadata است.توجه داشته باشید ، بررسی و بازیابی اطلاعات ESXi تنها باید در حضور کارشناس و متخصص این حوزه صورت پذیرد .
* مشکل Mount نشدن سرویسها: این مورد اغلب زمانی رخ میدهد که فایل سیستم سرور در وضعیت “Dirty” قرار گرفته باشد؛ در این حالت کرنل ESXi برای جلوگیری از تخریب بیشتر دیتا، اجازه دسترسی یا Mount کردن دیتا استور را نمیدهد.

۲. خطاهای داخلی ماشینهای مجازی (VM Errors Analysis)
این موارد داخل فولدر ماشین مجازی (VM Folder) رخ میدهد و بسیار حساس هستند:
- Corrupted Configuration Files (خرابی فایلهای پیکربندی): آسیب دیدن فایلهای .vmx (کانفیگ/Configuration) یا هدر فایلهای .vmdk (دیسک مجازی/Virtual Disk).
- Snapshotها: یکی از پیچیدهترین مواردی که با آن مواجه میشویم، خطای Consolidation است. زمانی که اسنپشاتها (Snapshots) بهدرستی با هم Merge (ادغام) نمیشوند.
- “Redo log corrupted”: اگر هنگام روشن کردن ماشین مجازی با این خطا مواجه شدید، زنجیره اسنپشاتها (Snapshot Chain) خراب شده است. این خطا بسیار حساس است و نیاز به Hex Editing و VMDK Files دارد.
در صورتی که با هر یک از خطاهای بالا روبه روشدید ، جهت بررسی و بازیابی تخصصی vm میتوانید از کارشناسان مرکز هارد ایران کمک بگیرید .
۳. مشکلات پارتیشنبندی و تغییر سایز (Partitioning Failures)
- Resize Failure: تلاش برای افزایش (Extend) در VOLUME یا Filesystem در حالی که برق قطع شود یا سیستم هنگ کند، باعث میشود پارتیشن در وضعیت”Inconsistent” (ناسازگار) بماند.
- عدم شناسایی پس از آپدیت: در موارد بسیاری مشاهده شده کردیم که پس از Upgrade کردن Hypervisor (مانند Proxmox یا ESXi)، پارتیشنها یا Datastore دیگر شناسایی نمیشوند. علت این مشکل معمولاً ناسازگاری نسخهی جدید با درایو های استوریج یا Firmware (فریمور) قدیمی است.

۴. خرابی در فایل سیستمهای استاندارد (NTFS, ReFS, ZFS)
- در ویندوز سرور، خرابی MFT (جدول اصلی فایل) باعث میشود درایو RAW شود.
- در فایل سیستم ReFS (که مایکروسافت ادعا میکرد خراب نمیشود!) شاهد Raw شدن Large Volumes (والیوم های حجیم) هستیم که بازیابی آنها بسیار تخصصیتر از NTFS است و ابزار های ریکاوری معمولی قادر به شناسایی و بازیابی آنها نیستند.
دلایل اصلی بروز مشکلات لاجیکال در سرورها
چرا این مشکلات رخ میدهد؟ شناخت دقیق علت بروز مشکل میتواند به جلوگیری از تکرار آنها کمک کند.
- قطع ناگهانی برق و کش تخلیه نشده: اکثر کنترلرهای RAID دارای حافظه کش (Cache) هستند. اگر برق بهطور ناگهانی قطع شود و باتری بکاپ (BBU) خالی باشد، اطلاعات ذخیره شده در کش روی هارد نوشته نمیشوند (Write-hole phenomenon). این امر منجر به ناسازگاری فایل سیستم سرور میشود.
- تداخل در بروز رسانی: آپدیتهای ناقص سیستم عامل یا فریمور (مانند موردی که در Proxmox مشاهده شد) میتواند ساختار آدرسدهی دیتا را به هم بریزد.
- خاموش کردن نادرست: خاموش کردن اجباری سرور (Hard Reset) در حالی که ماشینهای مجازی روشن هستند، آسیب شدیدی به فایلهای دیتابیس مانند SQL و Oracle وارد میکند.
تجربه موفق مرکز هارد ایران در رفع خرابی فایل سیستم سرور
بازیابی فوری نرم افزار حسابداری و دیتابیس حضور و غیاب شرکت …. سفر
سرور شرکت …. سفر بر پایه RAID 5 پیکربندی شده بود .
با خرابی این RAID ، دسترسی به درایو D به طور کامل قطع شده بود ، ویندوز سرور بالا نمیامد و هنگام بوت ، ارور های متعددی مشاهده میشد .
پس از بررسی RAID این مجموعه توسط کارشناس فنی مرکز هارد ایران ، مشکلات زیر در سرور شناسایی شد که موجب اختلال در عملکرد سیستم شده بود :
- جدول پارتیشن RAID دچار بهم ریختگی شده بود.
- به علت نوسانات برق و خاموشی مکرر سرور ، ساختار فایل سیستم NTFS ، دچار آسیب جدی شده بود .
- سیستم عامل ویندوز قادر به Mount کردن هارد ها نبود .
رفع خرابی RAID و بازیابی کامل اطلاعات
کارشناسان ما در مرکز هارد ایران پس از تشخیص دقیق مشکل با شبیه سازی نرم افزاری پارامتر های RAID و بازسازی فایل سیستم آسیب دیده ، تمامی اطلاعات حیاتی شرکت که شامل دیتابیس های حسابداری و اطلاعات حضور و غیاب کارکنان بود را بازیابی نمودند.

تفاوت خرابی نرم افزاری و سخت افزاری
یکی از رایج ترین پرسش ها این است که : چرا هزینه و مدت زمان تعمیر سرورها متفاوت است؟
پاسخ آن روشن است: این تفاوت کاملاً به نوع خرابی و شدت آسیبدیدگی بستگی دارد.
| ویژگی | خرابی لاجیکال (نرمافزاری) | خرابی فیزیکی (سختافزاری) |
|---|---|---|
| وضعیت سرور | سرور روشن میشود و فنها کار میکنند | ممکن است سرور بوق بزند |
| چراغ هارد | معمولاً سبز یا چشمکزن | نارنجی، قرمز یا خاموش |
| شناسایی در BIOS | هاردها شناسایی میشوند | هاردها شناسایی نمیشوند (not detected) |
| نیاز به (Cleanroom) | خیر | بله |
| زمان تقریبی | ۲۴ تا ۴۸ ساعت (بسته به حجم داده) | ۳ روز تا ۲ هفته |
خدمات تخصصی مرکز هارد ایران در رفع ارورهای logical سرور
کارشناسان مرکز هارد ایران با بکارگیری دانش تخصصی خود در زمینه ترمیم فایل های VMDK و Redo log قادر به Hex Editing هستند که جهت بازیابی snapshot های خراب ضروری میباشد.
همچنین در صورت بروز مشکلات نرم افزاری، اگر سرور به اینترنت متصل باشد بدون نیاز به جابجایی فیزیکی سرور و در کمترین زمان ممکن نوع خرابی را تشخیص داده و با بکارگیری پیشرفته ترین تجهیزات مانند PC-3000 و قدرتمند ترین سخت افزار روز دنیا برای شبیه سازی RAID اطلاعات را با موفقیت بازیابی میکنند.

سوالات متداول درباره خرابی فایل سیستم سرور
آیا میتوان فایل VMDK که ارور Redo log corrupted میدهد را تعمیر کرد؟
بله، این ارور نشاندهنده خرابی در Snapshot Chain باشد. کارشناسان ما با آنالیز کردن هدر فایلها و اصلاح دستی لینکهای CID، ماشین های مجازی را مجددا بوت میکنند.
Datastore پس از ریستارت از دسترس خارج شده، آیا اطلاعات پاک شده است؟
در ۹۰٪ موارد اطلاعات سالم هستند اما (Partition Table) یا متادیتای VMFS، آسیب دیده است. در چنین شرایطی به هیچ عنوان هارد را فرمت نکنید.
آیا تغییر سایز (Resize) ناموفق پارتیشن باعث نابودی کامل اطلاعات میشود؟
معمولاً خیر. دیتای اصلی دست نخورده باقی میماند اما سیستم عامل دیگر نمیداند انتهای پارتیشن کجاست. با ترمیم جدول پارتیشن، اطلاعات قابل برگشت است.
هزینه بازیابی اطلاعات مشکلات نرم افزاری VMware چقدر است؟
هزینه بازیابی اطلاعات بر اساس نوع خرابی و مشخصات سرور متغیر است. اگر سرور شما خراب شده و اطلاعات آن برایتان ارزشمند است، ریسک نکنید؛ زیرا هرگونه اقدام غیر تخصصی شانس بازیابی اطلاعات را بهطرز چشمگیری کاهش میدهد. مرکز هارد ایران تست و بررسی اولیه سرور جهت تشخیص نوع خرابی را بهصورت رایگان انجام میدهد و پس از آن، هزینه دقیق و مدت زمان بازیابی اطلاعات را به شما اعلام میکنند.


