sábado, 9 de julho de 2016

Monitorando as baterias no Exadata


As controladoras de disco no Exadata Storage e servidores de banco de dados possuem uma bateria que permite a utilização de um cache de gravação, seu proposito é acelerar o desempenho de operações de escrita uma vez que os blocos são mantidos inicialmente em cache e apenas escritos em disco quando o cache estiver cheio ou uma requisição de escrita exigida. (WriteBack) 

Se a carga da bateria se degrada de tal forma que já não é mais possivel garantir a proteção dos dados em cache para uma perda de energia de 48 horas ou superior, então o cache de gravação é "desativado" e a controladora de disco passa a realizar além das gravações em cache as gravações diretas no disco o que acaba prejudicando o desempenho/tempo total de gravação. (WriteThrough)

[root@db01 ~]# /opt/MegaRAID/MegaCli/MegaCli64 -LDInfo -LALL -aALL | grep "Cache Policy" | head -n 2
Default Cache Policy: WriteBack, ReadAheadNone, Direct, No Write Cache if Bad BBU
Current Cache Policy: WriteBack, ReadAheadNone, Direct, No Write Cache if Bad BBU

O Exadata Storage Server gera um alerta quando a capacidade de carga da bateria é insuficiente ou quando a temperatura é alta, e quando a bateria deve ser substituída. 

A capacidade de carga da bateria se degrada ao longo do tempo e sua expectativa de vida é proporcional a temperatura de funcionamento. 

A tabela a seguir demonstra a expectativa de vida da bateria.



A temperatura da bateria pode ser verifica atraves do seguinte comando:

[root@db01 ~]# /opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -a0 | grep BatteryType; /opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -a0 | grep -i temper
BatteryType: iBBU08
Temperature: 23 C
  Temperature                             : OK

Em nota a Oracle indica que se a temperatura for maior ou igual a 55 graus Celsius, deve ser determinado a causa e corrigido o problema. Para monitorarmos a capacidade da bateria utilizamos o seguinte comando:

[root@db01 ~]# /opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -a0 | egrep  "Full Charge|Max Error" | sort
  Full Charge Capacity: 1324 mAh
  Max Error: 0 %

Uma ação proativa de troca da bateria pode ser realizada quando a capacidade (Full Charge Capacity) for menor que 800 mAh e a quantidade máxima de erros (Max Error) for inferior a 10%. 

Realize um substituição imediata de qualquer bateria onde a capacidade for inferior a 674 mAh ou a quantidade máxima de erros for superior a 10%. 

Podemos filtrar ainda por "Battery Replacement required" para saber se a troca é necessária ou não.

[root@db01 ~]# /opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -a0 | grep "Battery Replacement required"
  Battery Replacement required            : No

Para visualizar todas as informações:

[root@db01 ~]# /opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -a0

BBU status for Adapter: 0

BatteryType: iBBU08
Voltage: 3827 mV
Current: 0 mA
Temperature: 23 C
Battery State: Optimal
Design Mode  : 48+ Hrs retention with a non-transparent learn cycle and moderate service life.

BBU Firmware Status:

  Charging Status              : None
  Voltage                                 : OK
  Temperature                             : OK
  Learn Cycle Requested                   : No
  Learn Cycle Active                      : No
  Learn Cycle Status                      : OK
  Learn Cycle Timeout                     : No
  I2c Errors Detected                     : No
  Battery Pack Missing                    : No
  Battery Replacement required            : No
  Remaining Capacity Low                  : No
  Periodic Learn Required                 : No
  Transparent Learn                       : No
  No space to cache offload               : No
  Pack is about to fail & should be replaced : No
  Cache Offload premium feature required  : No
  Module microcode update required        : No

BBU GasGauge Status: 0x0180
  Relative State of Charge: 58 %
  Charger System State: 1
  Charger System Ctrl: 0
  Charging current: 0 mA
  Absolute state of charge: 51 %
  Max Error: 0 %
  Battery backup charge time : 48 hours +

BBU Capacity Info for Adapter: 0

  Relative State of Charge: 58 %
  Absolute State of charge: 51 %
  Remaining Capacity: 765 mAh
  Full Charge Capacity: 1324 mAh
  Run time to empty: Battery is not being charged.
  Average time to empty: 1 Hour, 32 Min.
  Estimated Time to full recharge: Battery is not being charged.
  Cycle Count: 1

BBU Design Info for Adapter: 0

  Date of Manufacture: 01/21, 2014
  Design Capacity: 1500 mAh
  Design Voltage: 4100 mV
  Specification Info: 0
  Serial Number: 3384
  Pack Stat Configuration: 0x0000
  Manufacture Name: LS36691
  Firmware Version   :
  Device Name: bq27541
  Device Chemistry: LION
  Battery FRU: N/A
  Transparent Learn = 0
  App Data = 0

BBU Properties for Adapter: 0

  Auto Learn Period: 28 Days
  Next Learn time: None  Learn Delay Interval:1 Hours
  Auto-Learn Mode: Disabled
  BBU Mode = 7

Exit Code: 0x00

Replacing Batteries in Disk Controllers: 

If the battery charge capacity in the disk controllers falls below the minimum threshold, then Oracle will replace the failed batteries at no extra charge, if the system is covered either by the Oracle Premier Support for Systems or occurs during the warranty period. For customers with Premier Support for Systems, Oracle attempts to proactively replace the batteries in Oracle Exadata Rack before the end of the estimated lifetime, on a best efforts basis.

Referência:
http://docs.oracle.com/cd/E50790_01/doc/doc.121/e51951/app_fru.htm#DBMMN21578
Postagem mais recente Postagem mais antiga Página inicial

0 comentários:

Postar um comentário

Translate

# ACE Program

#Oracle

#Oracle
Disclaimer: The views expressed on this blog are my own and do not necessarily reflect the views of Oracle.

#Blog reconhecido

#ARTICULISTA

Marcadores

Postagens populares