ریکاوری استوریج NetApp

ریکاوری استوریج NetApp
5/5 - (1 امتیاز)

ریکاوری استوریج NetApp | بازیابی تخصصی WAFL و RAID-DP 

مشاهده چراغ‌های هشدار روی استوریج NetApp یا خطای Panic در کنسول مدیریتی، نشانه وجود آسیب در سیستم ذخیره‌سازی اطلاعات شما است. با این حال، هنوز فرصت کافی برای بازیابی اطلاعات و جلوگیری از آسیب‌های جدی وجود دارد، به شرط آنکه تصمیمات آگاهانه بگیرید و از اقدامات عجولانه بپرهیزید.
اما سؤال مهم این است:
چه اقداماتی می‌تواند شما را از بحران نجات دهد و ریسک از دست رفتن اطلاعات را به حداقل برساند؟ در ادامه، به بررسی راهکارهای عملی، نکات کلیدی برای مدیریت بحران و بهترین روش های بازیابی اطلاعات می‌پردازیم تا بتوانید در کوتاه‌ترین زمان ممکن کنترل اوضاع را در دست بگیرید.

عوامل اصلی نابودی اطلاعات در استوریج نت اپ NetApp

در صورت مشاهده هر یک از خطاهای زیر در کنسول مدیریتی (مانند Putty)، فورا دستگاه را خاموش کنید.کار کردن در این شرایط با دستگاه احتمال نابودی اطلاعات را به طرز چشمگیری افزایش میدهد.

WAFL inconsistent : یکی از خطرناک ترین خطاها در استوریج نت اپ میباشد که نشان دهنده بهم ریختگی در ساختار فایل است. چنانچه با این خطا مواجه شدید هیچ تغییری روی دستگاه ایجاد نکنید.

 NVRAM checksum failed: اگر دستگاه هنگام بالا آمدن با خطای NVRAM checksum failed رو به رو شود، به این معنی است که مشکل از NVRAM بوده و دستگاه قادر به دیتکت NVRAM نیست.

Aggregate offline یا Volume offline: استوریج به‌صورت هوشمند تشخیص می‌دهد کدام هارد باعث اختلال در عملکرد یا کاهش سرعت دستگاه شده تا آن را به‌طور خودکار آفلاین کند. در این وضعیت، اگرچه والیوم‌ها همچنان در RAID فعال هستند، اما مجموعه درایوها از دسترس مستقیم کاربران خارج می‌شوند.

Disk failed: هنگام مواجهه با این خطا، دستگاه ابتدا با چراغ نارنجی به شما هشدار می‌دهد. مشاهده چراغ نارنجی فرصت مناسبی برای جلوگیری از آسیب بیشتر به اطلاعات است. در صورتی که به این هشدار توجه نشود، چراغ هشدار به رنگ قرمز تغییر می‌کند. به محض مشاهده چراغ قرمز، حتی اگر دسترسی به برخی فایل‌ها امکان‌پذیر باشد، این دسترسی موقت بوده و سریعا قطع خواهد شد. بنابراین بهترین اقدام این است که دستگاه را بدون دستکاری خاموش و از متخصصین ریکاوری استوریج و سرور کمک بگیرید.

دستورات wafl_check یا reallocate را هرگز بدون تایید و نظارت متخصصین بازیابی اطلاعات اجرا نکنید ، زیرا این دستورات تغییراتی روی هاردها ایجاد میکند که نتیجه آن از بین رفتن قطعی اطلاعات خواهد بود.

ریکاوری دیتاهای مالی ، اتوماسیون مالی و ماشین های مجازی از استوریج های نت اپ

چرا اطلاعات در NetApp از بین می‌روند؟

موارد زیر اصلی ترین دلایل بروز خطا در استوریج‌های NetApp میباشد:

خرابی همزمان بیش از دو هارد در RAID-DP

تکنولوژی (RAID-DP Double Parity) خرابی همزمان دو هارد را میتواند تحمل کند، اما اگر هارد سوم هم از کار بیفتد، کل (Volume) از دسترس خارج می‌شود. معمولاً در چنین شرایطی ، تلاش برای تعویض هارد و Rebuild ، به دلیل فشار زیاد خواندن/نوشتن، باعث خرابی‌ بیشتر در هاردهای باقی‌مانده می‌شود.

خرابی کنترلر (Controller Failure) و اختلال در OS

گاهی اوقات هاردها سالم هستند، اما کنترلر دستگاه ( مغز ) به دلیل مشکلات سیستم عامل ONTAP، از دسترس خارج شده و بالا نمی آید. در این حالت، هاردها در سیستم‌های دیگر قابل شناسایی نیستند. اما اطلاعات همچنان روی هارد موجود بوده و با بررسی باتری و یا خود RAID کنترلر میتوان به مشکل اصلی پی برد.

حذف تصادفی Volume ها یا LUN ها

اگر به اشتباه یک LUN را حذف و یا یک Volume را فرمت کنید، بلافاصله دسترسی سرور به تمام اطلاعات قطع خواهد شد .

تغییر در ترتیب هاردها ، خارج کردن LUN ها و یا جابه جایی در LUN

هرگونه تغییر در ترتیب هاردها، خارج کردن LUN ها و یا جابه جایی آنها ، اطلاعات شما را در معرض نابودی قرار میدهد . بنابراین در صورت وجود هر نوع آسیب یا خرابی به هیچ عنوان اقدام به جابه جایی و خارج کردن، هاردها و LUN ها نکنید.

مشکلات مربوط به آپدیت Firmware ONTAP

گاهی ممکن است آپدیت ناقص یا ناسازگار، باعث شناسایی نشدن سیستم WAFL توسط دستگاه شود و آن را در وضعیت ناسازگار (Inconsistent) قرار دهد.

آپدیت فریمور : برای بروزرسانی فریمور باید از اپلیکیشن ها و نرم افزار هایی استفاده کرد که در سایت سازنده استوریج نت اپ قرار دارد. در صورت عدم به روز رسانی فریمور ، کاربر با ارورهایی روبرو خواهد شد که منجر به اختلال در عملکرد استوریج شده و ممکن است دستگاه شناسایی نشود .

آپدیت ناقص فریمور:
اگر در طول فرایند بروز رسانی فریمور، برق قطع شود، آنتی ویروس، فریمور را به عنوان ویروس شناسایی و آن را حذف میکند. در این شرایط هاردها سالم باقی می‌مانند و هیچ مشکل سخت‌افزاری برای استوریج netapp ایجاد نمی کنند، اما دستگاه در فرایند شناسایی با مشکل مواجه خواهد شد.

از آنجایی که برای بروزرسانی فریمور لازم است فایل‌ها از سایت سازنده استوریج دانلود شوند، محدودیت‌های اینترنت در ایران می‌تواند باعث اختلال در فرآیند دانلود شود. در صورت بروز مشکل در شبکه، ممکن است فایل‌ها به‌طور کامل و صحیح آپدیت نشوند و فریمور دچار اختلال گردد.
شکست در بروزرسانی فریمور می‌تواند مشکلاتی از جمله عدم شناسایی هارد ها، بالا نیامدن دستگاه و سایر مشکلات مشابه در استوریج ایجاد کند.
به همین دلیل، توصیه تخصصی ما این است که حتی در صورت مواجهه با هشدارها یا توقف کامل فعالیت سیستم (مانند بالا نیامدن سیستم)، و یا در شرایط اضطراری یا جنگی که دسترسی به متخصص ممکن نباشد، از اطلاعات خود بکاپ تهیه کرده و از هرگونه اقدام دیگر خودداری کنید تا پس از رفع مشکل و دسترسی به متخصص، اقدامات لازم انجام شود.

چگونه می‌توان تشخیص داد که هاردها سالم هستند و مشکل از RAID کنترلر می‌باشد؟

  • عدم دسترسی کامل به هارد ها 
  • عدم شناسایی کلی هارد ها
  • دستگاه در هر بار روشن شدن، هارد های متفاوتی را شناسایی می‌کند (یک‌بار هارد ۱ و ۲ و بار دیگر هاردهای ۳ و۴ را شناسایی میکند ).
  • مشکل در شناسایی و بالا آوردن هارد ها 
  •  مشکل در بوت و راه اندازی استوریج 

مواردی که پیش‌تر به آن‌ها اشاره شد از نشانه‌های خرابی RAID کنترلر محسوب می‌شوند. در واقع، هرگاه هاردها به‌طور کامل شناسایی نشوند ، لازم است علت خرابی را در RAID کنترلر یا باتری آن جستجو کنیم.

آیا با جابجایی هارد ها به سیستم دیگر که بتوان RAID آن را شبیه سازی کرد و یا Raid آماده داشته باشد، میتوان اطلاعات را بازیابی کرد؟

خیر، در صورتی که بدون تجهیزات تخصصی یا بدون داشتن مهارت لازم اقدام به راه‌اندازی هاردها روی دستگاهی دیگر کنید، احتمال Rebuild شدن RAID وجود دارد و این موضوع می‌تواند منجر به از دست دادن اطلاعات RAID بعد از Rebuild شدن و نابودی دائمی اطلاعات شود .

آیا با تعویض RAID کنترلر، اطلاعات استوریج نت اپ مجدداً بالا می‌آید؟ 

خیر، زیرا روی رید کنترلر خراب، چیپ حاوی پروگرامی وجود دارد که تمامی اطلاعات مربوط به RAID، از جمله نوع RAID و تعداد هاردها، روی آن ذخیره شده است. رید کنترلر جدید به‌دلیل خام بودن قادر به شناسایی RAID نیست و سیستم را مجبور به Rebuild می‌کند که در این حالت ممکن است اطلاعات برای همیشه از بین برود.

در مرکز هارد ایران با تعمیر، بازسازی و یا تعویض RAID کنترلر میتوانیم اطلاعات را با موفقیت و بدون از دست دادن دیتا بازیابی کنیم.

 آیا تا به حال با حذف تصادفی یک volume مهم استوریج مواجه شده‌اید؟

تجربه مرکز هارد ایران در ریکاوری استوریج NetApp

یکی از تجربه‌های ما در مرکز هارد ایران مربوط به بازیابی اطلاعات استوریج SAN 2050 بود که شامل سه volume و دو گروه هارد RAID10 در Pool A می‌شد.

مشکل اصلی :

این استوریج یکی ازvolume Pool A به نام Vol-A-01 به صورت تصادفی از طریق کنسول مدیریتی وب حذف شد. این volume دارای فایل‌سیستم VMFS6 و حجمی حدود ۲۰ ترابایت بود.

اقدام هوشمندانه مشتری:
پس از حذف، مشتری با خونسردی عمل کرده و هیچ اقدام اشتباهی انجام نداده بود؛ ویژگی Disk Scrub را غیرفعال کرد و هیچ اطلاعات جدیدی روی استوریج نریخته بود.
این اقدام ساده، شانس بازیابی کامل اطلاعات را به‌طور چشمگیری افزایش داد.

فرایند بازیابی اطلاعات استوریج آسیب دیده در مرکز هارد ایران

  • کارشناسان ما ساختار Pool A را تحلیل کردند و متادیتای باقی‌مانده از volume حذف شده را شناسایی کردند.
  • سپس پارتیشن VMFS6 به‌صورت مجازی بازسازی شد، با وجود اینکه LUN مربوطه حذف شده بود.
  • در نهایت بازیابی فایل ماشین‌های مجازی با حجم ۱۰ ترابایت (VMDK) به‌طور کامل و بدون هیچ آسیبی توسط تیم فنی مرکز هارد ایران انجام شد .

تمامی اطلاعات را در کوتاه ترین زمان با موفقیت بازیابی کردیم و اطلاعات را به مشتری تحویل دادیم.

بهترین مرکز بازیابی استوریج NETAPP در تهران

بهترین مرکز ریکاوری استوریج NetApp در ایران 

ریکاوری استوریج NETAPP و بازیابی اطلاعات از سیستم WAFL و RAID-DP ، فرایندی کاملاً تخصصی است.
کارشناسان ما، با به‌کارگیری شبیه‌سازهای نرم‌افزاری پیشرفته و بدون نیاز به انجام عملیات پرریسک و مخرب Rebuild سعی کرده اند تا هارد های آسیب‌دیده به هیچ عنوان تحت فشار قرار نگیرند و ریسک از دست رفتن دائمی اطلاعات به صفر برسد. در این شرایط، اطلاعات شما مستقیماً از داخل LUNها و Volumeهای آسیب‌دیده استخراج می‌شود.
خدمات تخصصی ما ، تمامی مدل های  FAS و E-Series در استوریج‌های NetApp را پوشش می‌دهد .
تعهد ما در مرکز هارد ایران، تضمین بازیابی کامل اطلاعات شما همراه با حفظ محرمانگی در تمامی مراحل کار است.

ریکاوری استوریج NetApp ، مدل‌های FAS, E-Series, AFF در مرکز هارد ایران 

مدل‌های تحت پوشش نوع هارد شایع‌ترین خرابی و خطا راهکار تخصصی مرکز هارد ایران
FAS2020, FAS2040, FAS2240, FAS3200 هارد SATA / SAS • اتمام عمر باتری NVRAM و از دست رفتن کش • خطای Disk failed به دلیل فرسودگی • سوختن کنترلر بر اثر نوسان برق شبیه‌سازی چیپ NVRAM: استخراج لاگ‌ها بدون نیاز به باتری سالم. جراحی هارد در کلین‌روم: تعویض هد هاردهای SAS با ابزار PC-3000 SAS بدون آسیب به پلاتر.
FAS8000, FAS8200, FAS2700 Series ترکیب SAS + SSD • خطای WAFL Inconsistent • آفلاین شدن Aggregate بعد از آپدیت ناموفق • مشکل در شناسایی شلف‌ها (Shelf ID) ترمیم ساختار WAFL: اصلاح کدهای هگزادسیمال فایل سیستم بدون Rebuild کردن خطرناک.مانت کردن مجازی (Virtual Mount): دسترسی به اطلاعات بدون نیاز به راه‌اندازی سیستم‌عامل اصلی.
E-Series (E2700, E2800, E5600) هاردهای ظرفیت بالا NL-SAS • خرابی همزمان ۳ هارد در RAID-6 یا DDP • کندی شدید و تایم‌اوت شدن LUNها • ارور Unreadable Sector در دیتابیس‌ها بازسازی مجازی RAID: چینش مجدد بلاک‌های اطلاعات با الگوریتم‌های اختصاصی NetApp.ایمیج‌گیری هوشمند: خواندن سکتورهای خراب با تکنیک‌های خاص PC-3000 برای نجات دیتابیس.
AFF Series (All Flash A200, A300) حافظه‌های SSD & NVMe • مشکلات Firmware کنترلر فلش • خطای Panic ناشی از Overheat • فرمت شدن یا پاک شدن Volume تکنیک‌های Anti-TRIM: جلوگیری از صفر شدن سلول‌های حافظه پس از پاک شدن. بایپس کنترلر (Controller Bypass): خواندن مستقیم اطلاعات از چیپ‌های NAND در صورت خرابی برد.

برآورد هزینه و زمان ریکاوری استوریج NetApp

بعد از آشناشدن با خطاها و روش‌های ریکاوری استوریج NetApp ، معمولاً مهم‌ترین سؤال این است که هزینه و مدت زمان بازیابی اطلاعات چطور مشخص می‌شود؟
برآورد هزینه : هزینه ریکاوری استوریج NetApp به عوامل متعددی مانند تعداد هاردها، نوع RAID، ظرفیت کلی و نوع خرابی بستگی دارد. از آنجایی که علت خرابی هر دستگاه متفاوت است، بررسی اولیه رایگان توسط کارشناسان بهترین راه برای برآورد دقیق هزینه میباشد. لینک بزارید با این حال یک نکته همیشه ثابت است:
«No Data, No Charge»
یعنی اگر اطلاعات شما بازیابی نشود، هیچ هزینه‌ای پرداخت نخواهید کرد.
برآورد زمان: مدت‌زمان ریکاوری استوریج NetApp به نوع خرابی دستگاه بستگی دارد، اما معمولاً این فرایند بین 3 ساعت تا 3 روز کاری زمان میبرد. در مواقع اضطراری که دسترسی سریع به اطلاعات بسیار مهم است، مرکز هارد ایران دستگاه شما را در شرایط اورژانسی قرار داده و فرایند بازیابی استوریج را در کمتر از 3 ساعت به اتمام میرساند.

جهت برآورده هزینه و زمان ریکاوری استوریج NetApp میتوانید همین حالا با کارشناسان دیتا ریکاوری مرکز هارد ایران تماس بگیرید .

ریکاوری استوریج NetApp در مرکز هارد ایران (تخصص ویژه در ساختار WAFL و ONTAP)

استوریج‌های NetApp به دلیل استفاده از سیستم‌عامل ONTAP و فایل‌سیستم WAFL، ساختاری پیچیده و تخصصی دارند. مرکز هارد ایران، با تسلط کامل بر ساختار داخلی WAFL و داشتن مهارت تحلیل، سکتوربه‌سکتور این دستگاه، بازیابی اطلاعات در پیچیده ترین شرایط را ممکن میکند.
تاکنون بیش از ۹۵٪ خرابی‌های استوریج‌های NetApp که به مرکز هارد ایران ارجاع شده‌اند، با موفقیت بازیابی شده است، حتی در شرایطی که Snapshot ها حذف شده یا Volume ها آفلاین باشند، قادر به ارائه راهکارهای پیشرفته و تخصصی ریکاوری استوریج NetApp هستیم.

تعمیر و بازیابی استوریج های سازمانی نت اپ

سوالات متداول در خصوص ریکاوری استوریج NetApp

آیا در استوریج نت اپ می‌توانیم هارد معیوب را با یک هارد نو عوض کنیم تا RAID بازسازی شود؟

در شرایطی که اطلاعات برای شما اهمیت ندارد، میتوانید هارد معیوب را عوض کنید، با این کار nas storage شما بالا خواهد آمد. اما اگر اطلاعات مهمی بر روی دستگاه دارید، این اقدام می‌تواند منجر به از دست رفتن دائمی اطلاعات شود.

آیا می‌توان هاردهای NetApp را به سیستم ویندوز یا سرور معمولی وصل کرد تا اطلاعات را کپی کنیم؟

خیر، به هیچ وجه. سیستم فایل (NetApp WAFL) توسط ویندوز یا لینوکس قابل شناسایی نیست، همچنین سیستم عامل‌های معمولی به محض اتصال، درخواست Initialize یا Format می‌دهند که قبول کردن آن باعث نابودی کامل متادیتا و از بین رفتن اطلاعات می‌شود.

 اسنپ‌شات‌ها (Snapshot) را پاک کرده‌ام؛ آیا هنوز راهی برای بازیابی LUN وجود دارد؟

بله. در ساختار WAFL، حذف اسنپ‌شات باعث پاک شدن اطلاعات نمیشود، بلکه فقط پوینترها آزاد می‌شوند. بنابراین اگر دیتای جدیدی روی استوریج نوشته نشود و اقدامات لازم توسط کارشناسان انجام گیرد، امکان بازیابی اسنپ شات های حذف شده با بکارگیری تجهیزات پیشرفته در مرکز هارد ایران وجود دارد.

اگر کنترلر سوخته باشد، می‌توانم هاردها را به یک شاسی NetApp دیگر (Head Swap) منتقل کنم؟

این کار ریسک بسیار بالایی دارد. تفاوت در نسخه‌ی Firmware یا تنظیمات سیستم‌عامل (ONTAP) در دستگاه جدید باعث می‌شود کنترلر جدید هاردها را به‌عنوان هارد خارجی تشخیص دهد و اقدام به Zero-ing (صفر کردن) آن‌ها کند که منجر به نابودی کامل اطلاعات خواهد شد.

عملیات Rebuild در RAID-DP روی ۹۹٪ گیر کرده و ارور داده است؛ چه باید کرد؟

فورا دستگاه را خاموش کنید زیرا توقف Rebuild معمولاً نشانه وجود بدسکتور و یا مشکل سخت افزاری در هارد یا خرابی همزمان چند هارد است. در این شرایط تلاش مجدد برای Rebuild، فشار فیزیکی را بالا برده و باعث خراشیدگی پلاتر (Media Damage) می‌شود و دیتا تحت هیچ شرایطی قابل ریکاوری نخواهد بود .

جهت مطالعه بیشتر در خصوص رفع بدسکتور هارد میتوانید به لینک مقاله مراجعه کنید .

آیا امکان ریکاوری استوریج NetApp ، در صورتی که رمزنگاری شده (NSE/NVE) باشد هم وجود دارد ؟

بله، مرکز هارد ایران با بکارگیری روش های تخصصی امکان عبور از رمزنگاری سخت افزاری و نرم افزاری NETAPP را فراهم کرده است. البته در این موارد، در اختیار داشتن کلیدهای امنیتی یا دسترسی به Key Management Server KMS می‌تواند شانس موفقیت را به طور قابل توجهی افزایش دهد.

روند بازیابی اطلاعات مرکز هارد ایران12
روند بازیابی اطلاعات مرکز هارد ایران

2 thoughts on “ریکاوری استوریج NetApp

  1. صادق میگوید:

    بعد از تعویض یکی از هاردهای NetApp، ترتیب دیسک‌ها به هم خورده و الان RAID detect نمیشه. امکان ریکاوری اطلاعات بدون آسیب بیشتر وجود داره؟

    • کارشناس فنی 3 میگوید:

      سلام

      به‌هم خوردن ترتیب دیسک‌ها لزوماً به معنی از بین رفتن اطلاعات نیست، اما ادامه کار اشتباه می‌تونه وضعیت رو پیچیده‌تر کنه.

      در بسیاری از موارد با بررسی متادیتا و ساختار هر هارد می‌توان آرایش صحیح RAID را بازسازی کرد.
      نکته مهم اینه که عملیات Initialize یا Recreate RAID انجام نشود.

      برای جلوگیری از آسیب بیشتر بهتر است سیستم در همین وضعیت متوقف بماند تا بررسی تخصصی انجام شود.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *