Para servidores dedicados y servidores dedicados especiales

    En este artículo te explicamos cómo monitorizar el estado de tu hardware RAID y cómo reconocer un RAID defectuoso.

    Identificar el controlador de hardware

    En los servidores raíz de IONOS se utilizan controladores de hardware de 3ware, Areca, Adaptec, Broadcom o Dell.

    Puedes comprobar qué controlador está instalado en tu servidor en el Administrador de dispositivos de Windows en la sección Controlador de memoria. Para abrir el administrador de dispositivos, introduce en el buscador de la barra de tareas "administrador de dispositivos" y haz clic para abrirlo.

    Controladores del RAID: programas

    Los programas de software que se encargan de la gestión de los controladores del RAID están instalados de manera predeterminada. Si lo necesitas, puedes descargar el software necesario para tu controlador a continuación: 

    Adaptec:

    https://storage.microsemi.com/en-us/downloads/

    Broadcom:

    https://www.broadcom.com/support/download-search

    Dell:

    https://www.dell.com/support/home/es-es?app=products

    3ware:

    https://www.broadcom.com/support/knowledgebase/1211161499498/operating-systems-supported-for-the-lsi-3ware-and-megaraid-contr

    Areca:

    https://www.areca.com.tw/support/downloads.html

    Comprobar el estado del RAID

    Adaptec

    El controlador de red de Adaptec se gestiona con la herramienta de línea de comandos arcconf. Los siguientes comandos hacen que se muestre infomación detallada acerca del controlador de RAID de Adaptec y de la configuración:

    COMANDO EXPLICLACIÓN
    arcconf GETCONFIG 1 Con este comando se muestra información acerca del controlador del RAID, de la configuración, de las matrices del RAID, así como de los discos duros disponibles y su estado actual.
    arcconf getconfig 1 PD Con este comando se muestra información acerca de los discos duros existentes.
    arcconf getlogs controller-number device ¦ dead ¦ event [clear ¦ tabular] Con este comando se muestran las entradas de logs. Puedes introducir los siguientes parámetros para especificar el tipo de entradas que se muestran:
    Ejemplo: arcconf getlogs 1 device tabular DEVICE: Muestra todas las entradas de logs con errores que el controlador ha podido encontrar en los dispositivos vinculados.
      DEAD: Muestra todas las entradas de logs en los que se registró una avería de los dispositivos o discos duros.
      EVENT: Muestra todas las entradas de logs con información sobre acontecimientos especiales (p.ej. rebuilds, LDMs, etc.)
      También puedes utilizar los siguientes parámetros:
      tabular: Muestra el log en formato tabla.
      clear: Elimina el protocolo del controlador asignado.
    arcconf getlogs controller-number device ¦ dead ¦ event [clear ¦ tabular] >NOMBRE_DEL_ARCHIVO.log Con este comando se escriben las entradas de logs en un archivo.
    Ejemplo: arcconf getlogs 1 device tabular > device.log  

    Podrás encontrar más información al respecto aquí:

    User's Guide ARCCONF Command Line Utility 

    Broadcom

    El controlador de RAID de Broadcom se gestiona y controla con la herramienta de línea de comandos StorCLI. Con los siguientes comandos puedes hacer que se muestre información detallada acerca del controlador de RAID Broadcom y de la configuración:

    COMANDO EXPLICACIÓN
    storcli64 /c0 show all Con este comando se muestra información acerca del controlador del RAID y de la configuración.
    storcli64 /c0/eall/sall show Con este comando se muestra información acerca de los discos duros existentes.
    storcli64 /c0/eALL/sALL show all Con este comando se muestra información acerca de los discos duros disponibles y su estado acutal (número de serie, temperatura, etc.).
    storcli /cx show eventloginfo Con este comando se muestran las entradas de logs.

    Podrás encontrar más información al respecto aquí:

    12Gb/s MegaRAID Tri-Mode StorCLI User Guide

    Dell

    El controlador del RAID de Dell se gestiona con la interfaz de línea de comandos PERCCLI. Con los siguientes comandos puedes hacer que se muestre información detallada acerca del controlador de RAID de Dell y de la configuración:

    COMANDO EXPLICACIÓN
    perccli64 /c0/e32/s0 show all Con este comando se muestra información del disco duro 0.
    perccli64 /c0/e32/s1 show all Con este comando se muestra información del disco duro 1.
    perccli64 /c0 show Con este comando se muestra información acerca de los discos duros existentes.
    perccli /c0 show eventloginfo Con este comando se muestran las entradas de logs para el controlador 0.

    Podrás encontrar más información al respecto aquí:

    Dell EMC PowerEdge RAID Controller CLI Reference Guide

    3ware

    El controlador del RAID 3ware se gestiona con la interfaz de línea de comandos 3ware Storage Controller Management Command Line Interface. Para abrir la interfaz de línea de comandos, introduce el comando tw_cli. Con el comando help se muestran todos los comandos disponibles.

    Nota

    Si la interfaz de línea de comandos 3ware Storage Controller Management Command Line Interface no estuviera disponible en tu servidor, puedes descargarla aquí:

    Descargar 3ware Storage Controller Management Command Line Interface

    # tw_cli
    //XXX> help
    
    Copyright(c) 2012 LSI
    
    LSI/3ware CLI (version 2.00.11.022)
    
    
    Commands Description
    -------------------------------------------------------------------
    focus Changes from one object to another. For Interactive Mode Only!
    show Displays information about controller(s), unit(s) and port(s).
    flush Flush write cache data to units in the system.
    rescan Rescan all empty ports for new unit(s) and disk(s).
    update Update controller firmware from an image file.
    commit Commit dirty DCB to storage on controller(s). (Windows only)
    /cx Controller specific commands.
    /cx/ux Unit specific commands.
    /cx/px Port specific commands.
    /cx/phyx Phy specific commands.
    /cx/bbu BBU specific commands. (9000 series)
    /cx/ex Enclosure specific commands. (9690SA, 9750)
    /ex Enclosure specific commands. (9550SX/9650SE)
    
    
    Certain commands are qualified with constraints of controller type/model support.
    Please consult the twi_cli documentation for explanation of the controller-qualifiers.
    
    Type help <command> to get more details about a particular command.
    For more detail information see twi_cli's documentation.
    
    //XXX>
    bash

    El comando info muestra información sobre el RAID y su estado actual. En este ejemplo, se trata de un RAID5 con una capacidad de 1,36 TB, que consta de 3 discos duros.

    //XXXX> info
    
    Ctl Model Ports Drives Units NotOpt RRate VRate BBU
    ------------------------------------------------------------------------
    c0 9750-4i 3 3 1 0 2 1 -
    
    //XXXX> info c0
    
    Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
    -----------------------------------------------------------------------------
    u0 RAID-5 OK - - 256K 2793.95 RIW ON
    
    VPort Status Unit Size Type Phy Encl-Slot Model
    -------------------------------------------------------------------------------
    p0 OK u0 1.36 TB SATA 0 ST1500L003-9VT16L
    p1 OK u0 1.36 TB SATA 0 ST1500L003-9VT16L
    p2 OK u0 1.36 TB SATA 0 ST1500L003-9VT16L
    bash

    El comando show alarms muestra los mensajes de alarma del controlador del hardware RAID.

    //XXXX> show alarms
    
    Ctl Date Severity AEN Message
    ------------------------------------------------------------------------------
    c0 [Wed Feb 01 2014 03:25:11] INFO Rebuild startet: unit=0
    c0 [Wed Feb 01 2014 08:13:31] INFO Rebuild completed: unit=0
    c0 [Wed Feb 01 2014 08:14:13] INFO Initialize started: unit=0
    c0 [Wed Feb 01 2014 08:14:13] INFO Initialize completed: unit=0
    bash

    En caso de error, la salida se vería así. Aquí el tercer disco (unit=0, vport 2) falló:

    //XXXX> show alarms
    
    Ctl Date Severity AEN Message
    ------------------------------------------------------------------------------
    c0 [Wed Feb 02 2014 08:22:10] INFO Rebuild started: unit=0
    c0 [Wed Feb 02 2014 08:14:13] ERROR Unit degraded: unit=0, vport 2
    bash

    Para eliminar el disco duro defectuoso del tercer puerto (p2) del RAID, introduce el siguiente comando maint remove c0 p2:

    //XXXX> maint remove c0 p2
    Removing port /c0/p2 ... Done.
    bash

    Después de reemplazar el disco defectuoso, es necesario que el controlador reconozca el disco nuevo. Para ello, introduce el siguiente comando:

    //XXXX> maint rescan
    Rescanning controller /c0 for units and drives ...Done.
    Found the following unit(s): [none].
    Found the following drive(s): [/c0/p2].
    bash

    Para conectar un disco duro al tercer puerto y reconstruirlo, introduce el siguiente comando:

    //XXXX> maint rebuild c0 u0 p2
    Sending rebuild start request to /c0/u0 on 1 disk(s) [2] ... Done.
    bash

    Introduce el siguiente comando para que se muestre información para reconstruir el RAID:

    //XXXX> info c0
    
    Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
    ------------------------------------------------------------------------------------
    u0 RAID-5 REBUILDING 0 - 256k 232.885 RiW ON
    
    Port Status Unit Size Type Phy Encl-Slot Model
    ------------------------------------------------------------------------------------
    p0 OK u0 1.36 TB SATA 0 - ST1500L003-9VT16L
    p1 OK u0 1.36 TB SATA 0 - ST1500L003-9VT16L
    p2 DEGRADED u0 1.36 TB SATA 1 - ST1500L003-9VT16L
    bash
    Monitorizar el controlador del RAID con el software 3ware Disk Manager 2

    3ware ofrece un software para monitorizar y gestionar tu controlador del RAID. Puedes descargarte este software aquí:

    Descargar 3ware Disk Manager 2

    Guía de uso de 3ware

    Si necesitas más información acerca de la instalación, configuración o aplicación de 3ware, consulta su guía de uso:

    Guía de uso de 3ware

    Areca

    Descarga la Windows - CLI utility y ejecútala en tu servidor.

    Puedes descargar el manual completo de CLI de Areca aquí: Manual de CLI de Areca.

    En el siguiente ejemplo se muestran algunos comandos:

    Copyright (c) 2004 Areca, Inc. All Rights Reserved.
    Areca CLI, Version: 1.71.240( Windows )
    
    
    Controllers List
    ----------------------------------------
    Controller#01(PCI): ARC-1110
    Current Controller: Controller#01
    ----------------------------------------
    
    CMD Description
    ==========================================================
    main Show Command Categories.
    set General Settings.
    rsf RaidSet Functions.
    vsf VolumeSet Functions.
    disk Physical Drive Functions.
    sys System Functions.
    net Ethernet Functions.
    event Event Functions.
    hw Hardware Monitor Information.
    exit Exit CLI.
    ==========================================================
    Command Format: <CMD> [Sub-Command] [Parameters].
    Note: Use <CMD> -h or -help to get details.
    CLI>
    bash

    Con el comando <cmd> info se puede consultar la información del sistema. El comando hw info hace que se muestre la información del monitor (hardware).

    CLI> hw info
    The Hardware Monitor Information
    ===========================================
    Fan#1 Speed (RPM) : 2673
    HDD #1 Temp. : 48
    HDD #2 Temp. : 47
    HDD #3 Temp. : 51
    HDD #4 Temp. : 0
    ===========================================
    GuiErrMsg<0x00>: Success.
    
    CLI>
    bash

    Para mostrar información sobre los discos duros, introduce el siguiente comando:

    CLI> disk info
    # ModelName Serial# FirmRev Capacity State
    ===============================================================================
    1 ST3750640AS 5QD5G7Z1 3.AAK 750.2GB RaidSet Member(1)
    2 ST3750640AS 5QD5G6JR 3.AAK 750.2GB RaidSet Member(1)
    3 ST3750640AS 5QD5G7XQ 3.AAK 750.2GB RaidSet Member(1)
    ===============================================================================
    GuiErrMsg<0x00>: Success.
    
    CLI>
    bash

    El siguiente comando proporciona información sobre el propio controlador:

    CLI> sys info
    The System Information
    ===========================================
    Main Processor : 500MHz
    CPU ICache Size : 32KB
    CPU DCache Size : 32KB
    System Memory : 256MB/333MHz
    Firmware Version : V1.43 2007-4-17
    BOOT ROM Version : V1.43 2007-4-17
    Serial Number : Y813CAAAAR101890
    Controller Name : ARC-1110
    ===========================================
    GuiErrMsg<0x00>: Success.
    
    CLI>
    bash

    Para mostrar los eventos actuales, introduce el siguiente comando:

    CLI> event info
    Date-Time Device Event Type
    ===============================================================================
    2013-07-09 07:23:14 H/W MONITOR Raid Powered On
    2013-09-29 08:06:24 H/W MONITOR Raid Powered On
    2013-09-29 07:51:37 H/W MONITOR Raid Powered On
    ...
    bash

    Para mostrar información sobre el set de RAID actual (en este ejemplo 3 x 750 GB), introduce el siguiente comando:

    CLI> rsf info
     #  Name             Disks TotalCap  FreeCap DiskChannels       State
    ===============================================================================
     1  Raid Set # 00        3 2250.5GB    0.0GB 123                Normal
    ===============================================================================
    GuiErrMsg<0x00>: Success.
    
    CLI>
    bash

    Para mostrar información respecto a los volúmenes lógicos del RAID, introduce el siguiente comando:

    CLI> vsf info
    # Name Raid# Level Capacity Ch/Id/Lun State
    ===============================================================================
    1 ARC-1110-VOL#00 1 Raid5 1500.3GB 00/00/00 Normal
    ===============================================================================
    GuiErrMsg<0x00>: Success.
    
    CLI>
    bash
    Guía de uso de Areca

    Si necesitas más información acerca de la instalación, configuración o aplicación de Areca, consulta su guía de uso:

    Guía de uso de Areca

    Pasos necesarios tras sustituir un disco duro

    Por regla general, cada vez que se sustituye un disco duro defectuoso, la reconstrucción del sistema de RAID empieza automáticamente. Sin embargo, te recomendamos que supervises esta reconstrucción para garantizar la funcionalidad del sistema de RAID.