sexta-feira, 6 de dezembro de 2019

Oracle Cluster Health Monitor (CHM) usando grande quantidade de espaço (BUG)

Devido a existência de um BUG na versão 11g, o Cluster Health Monitor (CHM) que é responsável pela coleta de métricas de sistema como utilização de memória, swap, processos, I/O, entre outros, acaba gerando abaixo do GI (Grid Infrastructure) enormes arquivos de dados, como por exemplo o crfclust.bdb.

Verificando a retenção do repositório temos 1094795585 segundos, que são 12671 dias, sendo este um dos fatores de problema.

[grid@rac2 ~]$ oclumon manage -get repsize

CHM Repository Size = 1094795585

 Done


A coleta Essa coleta se dá através do “Cluster Health Monitor Service” – ora.crf, desta forma vamos proceder com a parada do serviço que pode ser realizada com o cluster funcionando sem gerar qualquer problema ao ambiente.

Local onde os arquivos correspondentes ao repositório do CHM são armazenados (gerados).

[grid@rac2 ~]$ oclumon manage -get reppath

CHM Repository Path = /orabin01/app/11.2.0/grid/crf/db/rac2

 Done

Parando o serviço:

[grid@rac2 ~]$ crsctl stop res ora.crf -init
CRS-2673: Attempting to stop 'ora.crf' on 'rac2'
CRS-2677: Stop of 'ora.crf' on 'rac2' succeeded


Com o usuário root proceda com a remoção de todos os arquivos .bdb localizados abaixo do diretório retornado no reppath

[root@rac2 ~]# cd /orabin01/app/11.2.0/grid/crf/db/rac2
[root@rac2 rac2]# rm -f *.bdb

Suba novamente o serviço ora.crf:

[root@rac2 rac2]# su - grid
[grid@rac2 ~]$ . oraenv <<< +ASM2
ORACLE_SID = [+] ? The Oracle base has been set to /orabin01/app/11.2.0
[grid@rac2 ~]$ crsctl start res ora.crf -init
CRS-2672: Attempting to start 'ora.crf' on 'rac2'
CRS-2676: Start of 'ora.crf' on 'rac2' succeeded

Os arquivos .bdb serão novamente recriados e as coletas retomadas!

[grid@rac2 rac2]$ ls -hlrt *.bdb
-rw-r----- 1 root root 8.0K Nov 25 09:26 repdhosts.bdb
-rw-r----- 1 root root 8.0K Nov 25 09:28 crfconn.bdb
-rw-r----- 1 root root 2.5M Dec  5 19:22 crfts.bdb
-rw-r----- 1 root root 3.8M Dec  5 19:22 crfloclts.bdb
-rw-r----- 1 root root 9.5M Dec  5 19:22 crfcpu.bdb
-rw-r----- 1 root root 4.2M Dec  5 19:22 crfalert.bdb
-rw-r----- 1 root root 4.0M Dec  5 19:22 crfhosts.bdb
-rw-r----- 1 root root 221M Dec  5 19:22 crfclust.bdb

Ajuste a retenção do repositório para 259200 (3 dias)

[grid@rac2 ~]$ oclumon manage -repos resize 259200
rac1 --> retention check successful
rac2 --> retention check successful
New retention is 259200 and will use 4516300800 bytes of disk space

CRS-9115-Cluster Health Monitor repository size change completed on all nodes.


Referência:

Oracle Cluster Health Monitor (CHM) using large amount of space (more than default) (Doc ID 1343105.1)

Postagem mais antiga Página inicial

0 comentários:

Postar um comentário

Translate

# Suporte

# ACE Program

#Oracle

#Oracle
Disclaimer: The views expressed on this blog are my own and do not necessarily reflect the views of Oracle.

#Blog reconhecido

#ARTICULISTA

Marcadores

Postagens populares