جدول محتوا
خطاهای سرور HP کداماند؟ سرورهای HP از محبوبترین مدلهای سرور در بازار بین برندهای مختلف هستند و خرید سرورهای HP به دلیل محبوبیت بیشتر در مقایسه با سایر برندها، توصیه میشود. با این حال در برخی مواقع هنگام استفاده از این سرورها، با پیامهای خطا مواجه میشویم. این خطاهای سرور HP ممکن است ناشی از عوامل گوناگونی مانند مشکلات سختافزاری، باگهای نرمافزاری، پیکربندی سرور و غیره باشند.
بر اساس آمارهای جهانی 5٪ از سرورها در همان سال اول به مشکلات سختافزاری دچار میشوند. این ارورها با گذر زمان و پیر شدن سرورها افزایش مییابد، به گونهای که پس از هفت سال، 18٪ از سرورها به مشکلات سختافزاری مبتلا خواهند شد. از این رو، شناخت ارورهای سرورهای HP به عنوان پرفروشترین سرورهای بازار ایران، میتواند به کاهش ریسک خرابی سرور کمک نماید. در ادامه مهمترین خطاهای سرورهای HP و دلایل آن را بررسی میکنیم.
خطاهای سرور hp
اشکالات سرورها مانند سرور های HP GEN11 و server اچ پی dl380 و … عمدتاً به مسائل سختافزاری و فیزیکی مرتبط میشوند. این مشکلات ممکن است به دلیل مسائل سیستمی، خرابی سختافزار، خطاهای نرمافزاری در سطح سختافزار و سایر اشکالات ظاهر شوند. در ادامه چند نمونه از این اشکالات سرورها را مورد بررسی قرار میدهیم:
اختلالات سختافزاری
این اشکالات ممکن است ناشی از خرابی قطعات سختافزاری نظیر دیسکهای سخت، حافظه RAM، پردازنده، کارت شبکه و دیگر اجزای سرور باشد. این اشکالات به طور معمول منجر به قطع خدمات و از دست دادن دسترسی به سرور میشوند.
اشکالات منابع
این اشکالات در شرایطی رخ میدهند که منابع اختصاص داده شده به سرور، از جمله پهنای باند شبکه، پردازنده، حافظه و… کافی نباشد. این مشکل میتواند منجر به کاهش عملکرد سرور و ایجاد اشکالات گردد.
اختلالات تغذیه برق
مسائل مربوط به تغذیه برق میتوانند باعث اشکالات سرور شوند. قطع ناگهانی برق، نوسانات برق و مشکلات مرتبط با سیستمهای UPS میتوانند باعث قطع سرویسها و اختلالات سروری گردند.
اشکالات سیستمعامل
اشکالات نرمافزاری در سطح سیستمعامل سرور نیز ممکن است اشکالات سرور را ایجاد کنند. این اشکالات ممکن است به دلیل نصب نادرست سیستمعامل، خرابی فایلهای سیستم، مشکلات درایورها و سرویسهای سیستمی و… باشند.
علت روشن نشدن سرور HP
مشکلات روشن نشدن سرور HP و راهحلها
قطع بودن برق سرور
ابتدا از اتصال برق سرور اطمینان حاصل کنید. از چک کردن سوکت و اتصال کابل برق اطمینان حاصل کنید. اگر قطعی برق در منطقه وجود دارد، منتظر بازگشت برق باشید یا از یک منبع برق پشتیبان ( (UPSاستفاده کنید.
اشکال در منبع تغذیه و پاور
بررسی کنید که آیا منبع تغذیه (پاور) به درستی متصل شده و روشن است. چراغهای LED روشن بر روی پاور ممکن است نشاندهنده وجود مشکل باشد. در صورت لزوم پاور را با یک پاور سالم تعویض کنید.
اشکال در UPS
اگر از UPS استفاده میکنید، اطمینان حاصل کنید که آن روشن و عملکرد صحیحی دارد. اگر UPS به دلیل خطاهای برق یا خودکار خاموش شده است، باید مشکلات آن را بررسی و رفع کنید.
انواع خطاهای سرور HP کداماند؟
تنوع خطاهای سرور HP به دو دسته اصلی تقسیم میشود:
1.خطاهای عددی سرور HP
در این دسته از خطاها، کدهای عددی تولید شده توسط سرورهای ProLiant هنگام انجام تست بوت شدن اولیه ((Power On Self Test یا POST، مورد بررسی قرار میگیرند. این کدها نمایانگر وضعیت و کارکرد سختافزار و پیکربندی بایوس سرور هستند. برخی از این پیامها تنها برای اطلاعرسانی وضعیت سرور بوده و خطای خاصی را نشان نمیدهند.
2.خطاهای غیر عددی سرور HP
در این گروه پیامهایی که بیشتر برای اطلاعرسانی وضعیت سرور ارائه میشوند و معمولاً شامل مواردی نظیر پیکربندی بایوس و گزینههای سختافزاری نصب شده هستند، به خطاهای غیر عددی معروفاند.
کدهایی که در این مقاله آمدهاند، تمام پیامهایی است که در هنگام انجام تست بوت شدن اولیه ((POST توسط سرورهای ProLiant تولید میشوند. برخی از این پیامها صرفاً برای اطلاعرسانی وضعیت سرور ارائه شده و خطای خاصی را نشان نمیدهند. تمام این پیامها به همراه صدای بوق متعلق به مرحله قبل از بارگذاری سیستم عامل روی سرور، ایجاد میشوند؛ بنابراین سرور فقط کدهایی تولید میکند که با پیکربندی بایوس و گزینههای سختافزاری نصب شده سازگار هستند.
خطاهای رایج سرور HP
خطاهای سرور یا Server Errors به مجموعهای از اشتباهات در محاسبات منطقی یا فیزیکی اشاره دارند که در فرایند اجرای سرویسها و برنامهها رخ میدهند. در ادامه برخی از رایجترین خطاهای سرور HP را بررسی میکنیم.
خطای POST Error در سرورهای اچ پی
این خطا از رایجترین خطاهای سرور HP است که ممکن است پس از روشن کردن سرور، در مرحله POST آن را مشاهده کنید. این خطا معمولاً با شمارههای خطا و پیامهای خطا نمایش داده میشوند و میتواند به دلیل مشکلات سختافزاری مانند خرابی رم، کارت گرافیک، پاور و… رخ دهد.
خطای حافظه اصلی در سرور اچ پی
این خطا معمولاً به دلیل مشکلات سختافزاری یا پیکربندی اشتباه حافظه رخ میدهد. از مهمترین دلایل بروز خطاهای حافظه میتوان به موارد زیر اشاره کرد:
- مشکلات سختافزاری: مشکلات فیزیکی در حافظه سرور، مانند خرابی یک یا چند ماژول حافظه (DIMM)، ناسازگاری با سرور و عدم تطابق فرکانس حافظهها با یکدیگر از مشکلات رایج سختافزاری هستند.
- تنظیمات نرمافزاری: تنظیمات اشتباه در بایوس، پیکربندی اشتباه در مدیریت حافظه (Memory Management) یا افزایش غیر اصولی فرکانس حافظه که باعث ناپایداری سیستم میشود در گروه ارورهای نرمافزاری سرور قرار میگیرند.
- نصب اشتباه حافظه: نصب اشتباه ماژولها در اسلاتهای سرور نیز باعث بروز مشکل خطای حافظه میشود. نصب حافظهها در اسلاتهای حافظه اصول خاصی دارد و عدم توجه به این مسئله در هنگام راهاندازی سرور باعث بروز مشکل خطای حافظه میشود.
معمولاً خطاهای حافظه با پیامهای خطایی همراه هستند که اطلاعات اولیهای را جهت رفع مشکل ارائه میکنند.
خطای خاموش کردن غیرمنتظره (Unexpected Shutdown ) و دلایل آن
خطای Unexpected Shutdown یعنی سرور بدون اطلاع قبلی و بدون اجرای فرایندهای مربوطه، به صورت ناگهانی خاموش شده است. این خطا ممکن است به دلیل مشکلات سختافزاری یا نرمافزاری رخ دهد. از دلایل بروز این خطا در سرور HP باید به موارد زیر اشاره کرد:
دلایل خطای Unexpected Shutdown
- مشکلات سختافزاری در قطعاتی مثل منبع تغذیه، پردازنده، حافظه، مادربورد و…
- مشکلات نرمافزاری (خطاها در سیستمعامل سرور، درایورهای نصب شده، برنامههای کاربردی یا سرویسهای عملیاتی، درایورها)،
- مشکلات محیطی (افت یا نوسانات ولتاژ برق، دمای بالا)
- مشکلات سیستم خنککننده، انجام عملیات یا پیکربندی اشتباه و…
خطای Critical Error از رایجترین ارورهای سرور اچ پی
خطای Critical Error نمایانگر مسائل جدی و اساسی است که توانایی سرور را در انجام عملیات مختلف به شدت محدود میکند. این خطا ممکن است از طریق دلایل متنوعی به وقوع بپیوندد از جمله:
- مشکلات سختافزاری
خطاهای در پردازنده، حافظه، دیسک سخت و کارت گرافیک ممکن است باعث بروز خطای Critical Error گردند. مشکلات فیزیکی در این اجزاء سختافزاری میتوانند توانایی صحیح عملکرد سرور را تضعیف کرده و خطای اساسی ایجاد کنند.
- مشکلات نرمافزاری
خطاهای در سیستم عامل، ناسازگاری درایورها، تداخل برنامهها با یکدیگر، و پیکربندی اشتباه مانند تنظیمات نادرست در BIOS، RAID، شبکه یا سیستم عامل میتوانند به شکلگیری خطاهای Critical Error اقدام کنند.
- مشکلات برق و سیستم خنککننده
عدم پایداری در تأمین برق، نوسانات برق، یا مشکلات در سیستم خنککننده نیز میتوانند به بروز خطای Critical Error منجر شوند. این مسائل مستقیماً تأثیرگذار بر عملکرد سرور بوده و وضعیت ناپایداری را ایجاد مینمایند.
خطای Fan Solution در سرورهای اچ پی
خطای Fan Solution به مشکلات مربوط به سیستم خنککننده (فنها) اشاره دارد. این خطا نشاندهنده این است که درجه حرارت سرور به اندازهای بالا رفته است که نیاز به تداخل فوری با سیستم خنککننده دارد. این مشکل ممکن است ناشی از فنهای خراب یا ناکارآمد، وجود گردوخاک درون فنها، عدم چرخش صحیح فنها یا عدم دفع درست حرارت توسط فنها باشد. این خطا میتواند به افزایش دمای سرور و آسیبدیدگی قطعات داخلی منجر شود.
خطای Fatal DMA در سرورهای HP
خطای Fatal DMA به مشکلات مربوط به DMA سرنام ( (Direct Memory Accessاشاره دارد. DMA فناوری است که به قطعاتی مانند کارتهای گرافیک، کارتهای صدا و دیگر دستگاههای ورودی/خروجی اجازه میدهد بدون نیاز به مداخله مستقیم از سوی پردازشگر مرکزی به حافظه دسترسی داشته باشند. یکی از دلایل بروز این مشکل، خرابی DMA است.
خطای Fatal Express Port
خطای Fatal Express Port در سرورها به مشکلات مربوط به اسلاتها و پورتهای PCI Express اشاره دارد. Express یک رابط ارتباطی است که برای اتصال تجهیزات جانبی مانند کارتهای گرافیک، کارتهای شبکه و دیگر مؤلفهها به سرور استفاده میشود.
خطای iLo Generated NMI
خطای iLo Generated NMI به مشکلات NMI سرنام (Non-Maskable Interrupt) اشاره دارد که توسط iLO به وجود آمده است. iLO فناوری مدیریت از راه دور سرورهای اچپی است که اجازه کنترل و مانیتورینگ سرور را از راه دور فراهم میکند. NMI یک نوع از سیگنالهای وقفه است که نشان میدهد یک مشکل بحرانی در سرور به وجود آمده است. خطای iLo Generated NMI نشان میدهد که iLO درخواست ارسال NMI به سیستم را داشته است.
خطای Fatal ROM در سرورهای HP
خطای “ ”Fatal ROM به مشکلات ROM سرور اشاره دارد. ROM یک حافظه غیر قابل نوشتن است که شامل دادهها و برنامههای ضروری برای راهاندازی سیستم میشود. این حافظه فقط خواندنی است و اطلاعات آن را نمیتوان تغییر داد. خطای Fatal ROM بیانگر خرابی یا عدم توانایی در دسترسی به ROM است. این خطا ممکن است به دلیل خرابی فیزیکی ROM یا عدم توانایی سیستم در دسترسی به اطلاعات موجود در ROM رخ دهد.
خطاهای سرور hp : خطای Invalid Memory
خطای Invalid Memory به مشکلات حافظه اشاره دارد. این خطا نشان میدهد که سرور نمیتواند به درستی با حافظه ارتباط برقرار کند یا از حافظه اشتباهی در سرور استفاده کردهاید. یکی از دلایل نمایش این پیغام، مشکلات فیزیکی در حافظه است. دلیل دوم، ناسازگاری است. در برخی موارد حافظه ممکن است با سرور ناسازگار باشد یا از حافظههای مختلفی روی سرور استفاده کرده باشید.
خطای درجه حرارت بالای پردازنده
درجه حرارت بالای سرور که با پیغام “”High Temperature Condition detected by Processor X نشان داده میشود بیانگر این موضوع است که پردازنده بیش از اندازه داغ شده و به دمای فراتر از حد مجاز رسیده است. از دلایل اصلی بروز این مشکل خرابی فن و هیتسینک پردازنده است که مانع از آن میشود تا گرمای تولید شده از طریق لولههای مسی به هیتسینک منتقل شده و توسط فنها دفع شود. دومین دلیل بروز این مشکل، دمای محیطی است. اگر دمای محیط زیاد باشد یا تهویه به درستی انجام نشود، درجه حرارت پردازنده به سرعت افزایش پیدا میکند. سومین دلیل بروز این مشکل اجرای پردازشهای سنگین مثل بازیهای گرافیکی یا نرمافزارهای محاسبات علمی است که باعث افزایش دمای پردازنده میشود.
علت ریست شدن سرور hp
سرورهای مختلف اچ پی با مشکلات متنوع روبهرو میشوند و راهحلهای متنوعی برای رفع آنها وجود دارد. تنها نکته قابل تأکید این است که سرورهای اچ پی به صورت اتوماتیک خراب نمیشوند. اما برخی از مشکلات شایع ممکن است شامل موارد زیر باشند:
قطع و وصل برق
اطمینان حاصل کنید که سیستم برقی به درستی و پایدار متصل شده باشد. درصد بالایی از مشکلات سرورهای اچ پی ناشی از قطع و وصل نامناسب برق هستند.
نصب قطعات تقلبی یا چینی
از قطعات اورجینال اچ پی استفاده کنید و از خرید قطعات تقلبی یا چینی خودداری کنید. استفاده از قطعات اصلی باعث پایداری و عملکرد بهتر سرور خواهد شد.
مشکلات رم
اگر سرور ری استارت میشود و بالا نمیآید، رمها را بررسی کنید. اطمینان حاصل کنید که از رمهای اصلی اچ پی استفاده میکنید و در صورت لزوم، رمها را جابهجا کنید.
با این راهحلها و انجام عملیات بررسی دقیق، مشکلات سرورهای اچ پی بهبود یافته و عملکرد بهینه آنها تضمین میشود. همچنین به یاد داشته باشید که همواره برای مسائل پیچیدهتر به تکنسینهای متخصص مراجعه کنید.
مهمترین ارورهای سرور HPE نسل 10
اشکالات در سرورهای HPE نسل 10 عمدتاً در زمان اجرای POST ارور ایجاد میکنند. این پیامها معمولاً به مشکلات سختافزاری و نرمافزاری اشاره دارند. اگرچه پیغامهای این بخش نمیتوانند به تنهایی همه جزئیات مشکلات سرور HPE را فاش کنند، اما شناخت این ارورها میتواند به جلوگیری از مشکلات جدی و فوری کمک کند.
پیغامهای خطا در POST
خطاهای نسل 10 سرور HPE در بخش POST توسط ماژولهای محاسباتی HPE تولید میشوند. بهطور عمومی، این پیامهای خطا با تنظیمات بایوس و مشکلات سختافزاری مرتبط هستند. برخی از این خطاها شامل موارد زیر هستند:
- خطا سری 100 Series، ارور 101 (101-Option ROM Error)
- خطا سری 200 Series
ارورهای Firmware نسل 10 سرور HPE
ارور 1:
مشکلات نرمافزاری Firmware
ارور 2:
مشکلات آپلود Firmware
خطاهای سرور HPE نسل 10 مرتبط با SAN Manager
یکی از ارورهای نسل 10 سرور اچ پی ای مربوط به عدم پشتیبانی از نسخه SAN Manager است، که این هشدار ” “ID: Sanrm.SanManager.UnsupportedVersionدر HPE OneView 3.1 نمایش داده میشود. برای رفع این مشکل نسخه سازگار با سرور را نصب کنید.
- خطاهای مربوط به Server Resource Manager
- خطاهای مربوط به انکلوژر (Enclosure)
- خطاهای ماژول اتصال
- خطاهای سلامت سختافزار
ارورهای سلامت سختافزار در صورت بروز مشکلات بحرانی در قطعات سختافزاری، به طور خودکار سیستم را خاموش میکنند. این هشدارها در HPE OneView 5.0 قابل مشاهده و بررسی است. شناخت دقیق از این ارورها به مدیران سیستم کمک میکند تا به سرعت و با کارآمدی به رفع مشکلات در سرورهای HPE نسل 10 بپردازند.