segunda-feira, 24 de abril de 2017

Importando dados com o Oracle SQL*Loader

O Oracle SQL*Loader é um utilitário presente tanto na instalação do Oracle Server quanto na instalação do Oracle client e sua função é basicamente ler arquivos textos e inserir os dados no banco de dados.

Sua vantagem é de ser extremamente flexível e rápido em relação aos tradicionais scripts de INSERT o que permite a inserção de milhões de linhas em poucos segundos.

 Características do SQL*Loader:

·      Permite carregar dados via rede, ou seja, o arquivo de dados pode estar em um sistema diferente do banco de dados (userid=username/password@instance);

·      Permite carregar dados de vários arquivos de dados durante a mesma sessão de carga;

·      Permite Carregar dados em várias tabelas durante a mesma sessão de carga;

·      Permite especificar o conjunto de caracteres (CHARACTERSET) dos dados;

·      Permite carregar dados de forma seletiva (pode carregar registos com base nos valores dos registos) - "when" categoria='Bebida';

·      Permite a manipulação dos dados antes de carregá-los, usando funções SQL;

·      Permite gerar valores sequencias para uma determinada coluna, entre outras.

A inserção dos dados é realizada com base em um arquivo de controle (control file) onde estão previamente configuradas informações como a localização do arquivo de dados (data file), como analisar e interpretar os dados, onde inserir os dados, entre outras configurações possíveis.

Além do arquivo de controle (control file) e arquivo de dados (data file), a estrutura do SQL*Loader é composta ainda pelo arquivo de log (log file) que contém um detalhamento do processo de carga, arquivo de dados rejeitados (bad file) contendo os registros rejeitados durante o processo de carga de dados e o arquivo de dados descartados (discard file) que é criado apenas se for especificado no arquivo de controle e que registra os dados descartados do processo de carga por não atenderem os critérios de seleção dos dados.


O SQL*Loader, assim como diversos outros utilitários Oracle, está abaixo do $ORACLE_HOME/bin sendo identificado pelo nome sqlldr.

Fazendo uma simples chamada, sem nenhum parâmetro, podemos ver diversas opções/comandos de utilização.



[oracle@db2 ~]$ sqlldr

SQL*Loader: Release 12.1.0.2.0 - Production on Thu Mar 16 15:02:07 2017

Copyright (c) 1982, 2014, Oracle and/or its affiliates.  All rights reserved.


Usage: SQLLDR keyword=value [,keyword=value,...]

Valid Keywords:

    userid -- ORACLE username/password
   control -- control file name
       log -- log file name
       bad -- bad file name
      data -- data file name
   discard -- discard file name
discardmax -- number of discards to allow          (Default all)
      skip -- number of logical records to skip    (Default 0)
      load -- number of logical records to load    (Default all)
    errors -- number of errors to allow            (Default 50)
      rows -- number of rows in conventional path bind array or between direct path data saves
               (Default: Conventional path 64, Direct path all)
  bindsize -- size of conventional path bind array in bytes  (Default 256000)
    silent -- suppress messages during run (header,feedback,errors,discards,partitions)
    direct -- use direct path                      (Default FALSE)
   parfile -- parameter file: name of file that contains parameter specifications
  parallel -- do parallel load                     (Default FALSE)
      file -- file to allocate extents from
skip_unusable_indexes -- disallow/allow unusable indexes or index partitions  (Default FALSE)
skip_index_maintenance -- do not maintain indexes, mark affected indexes as unusable  (Default FALSE)
commit_discontinued -- commit loaded rows when load is discontinued  (Default FALSE)
  readsize -- size of read buffer                  (Default 1048576)
external_table -- use external table for load; NOT_USED, GENERATE_ONLY, EXECUTE
columnarrayrows -- number of rows for direct path column array  (Default 5000)
streamsize -- size of direct path stream buffer in bytes  (Default 256000)
multithreading -- use multithreading in direct path
 resumable -- enable or disable resumable for current session  (Default FALSE)
resumable_name -- text string to help identify resumable statement
resumable_timeout -- wait time (in seconds) for RESUMABLE  (Default 7200)
date_cache -- size (in entries) of date conversion cache  (Default 1000)
no_index_errors -- abort load on any index errors  (Default FALSE)
partition_memory -- direct path partition memory limit to start spilling (kb)  (Default 0)
     table -- Table for express mode load
date_format -- Date format for express mode load
timestamp_format -- Timestamp format for express mode load
terminated_by -- terminated by character for express mode load
enclosed_by -- enclosed by character for express mode load
optionally_enclosed_by -- optionally enclosed by character for express mode load
characterset -- characterset for express mode load
degree_of_parallelism -- degree of parallelism for express mode load and external table load
      trim -- trim type for express mode load and external table load
       csv -- csv format data files for express mode load
    nullif -- table level nullif clause for express mode load
field_names -- field names setting for first record of data files for express mode load
dnfs_enable -- option for enabling or disabling Direct NFS (dNFS) for input data files  (Default FALSE)
dnfs_readbuffers -- the number of Direct NFS (dNFS) read buffers  (Default 4)

PLEASE NOTE: Command-line parameters may be specified either by
position or by keywords.  An example of the former case is 'sqlldr
scott/tiger foo'; an example of the latter is 'sqlldr control=foo
userid=scott/tiger'.  One may specify parameters by position before
but not after parameters specified by keywords.  For example,
'sqlldr scott/tiger control=foo logfile=log' is allowed, but
'sqlldr scott/tiger control=foo log' is not, even though the
position of the parameter 'log' is correct.

Para Exemplificar alguns casos de uso do SQL*Loader foi criado a seguinte tabela:



SQL> create table produtos (
2  codigo   number,
3  nome     varchar2(100),
4  categoria varchar2(50),
5  data_inclusao date );

Table created.

Arquivo de dados que será utilizado em alguns exemplos:


[oracle@db2 ~]$ cat dados1.txt
1,Shampoo,Higiene,16-MAR-17
2,Creme Dental,Higiene,16-MAR-17
3,Detergente,Limpeza,16-MAR-17
4,Alvejante,Limpeza,16-MAR-17
5,Amaciante,Limpeza,16-MAR-17
6,Refrigerante,Bebida,16-MAR-17
7,Agua,Bebida,16-MAR-17
8,Cerveja,Bebida,16-MAR-17
9,Suco,Bebida,16-MAR-17
10,Whisky,Bebida,16-MAR-17

1.    Carregando os dados (“normal”):

Arquivo de controle:

[oracle@db2 ~]$ cat exemplo1.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados1.txt'
 badfile '/home/oracle/exemplo1.bad'
 discardfile '/home/oracle/exemplo1.dsc'
 into table produtos
 fields terminated by ","
( codigo, nome, categoria, data_inclusao )

ERRORS: Independente da quantidade de erros que ocorram, o processo de carga deve continuar, por isso o número alto. Caso nenhum erro seja permitido ajuste o valor para 0. O valor padrão deste parâmetro é 50;

ROWS: Frequência de commits, ou seja, no exemplo a cada 5 linhas inseridas irá ocorrer um commit;

CHARACTERSET: Character set utilizado;

INFILE: Nome do arquivo texto que contém os dados que serão importados baseado nas configurações do control file;

BADFILE: Arquivo texto que será criado dos os registros rejeitados;

DISCARDFILE: Arquivo texto que será criado com os registros descartados mediante as condições de carga;

FIELDS TERMINATED BY: É o delimitador das colunas, ou seja, sempre que o caractere definido for encontrado significa que uma nova coluna se inicia.

Executando o SQL*Loader para carregar os registros contidos no arquivo dados1.txt baseado nas configurações do arquivo de controle (control file).




[oracle@db2 ~]$ sqlldr anderson/anderson@pdb1 control=exemplo1.ctl

SQL*Loader: Release 12.1.0.2.0 - Production on Thu Mar 16 15:04:08 2017

Copyright (c) 1982, 2014, Oracle and/or its affiliates.  All rights reserved.

Path used:      Conventional
Commit point reached - logical record count 5
Commit point reached - logical record count 10

Table PRODUTOS:
  10 Rows successfully loaded.

Check the log file:
  exemplo1.log
for more information about the load.

Finalizada a execução, a saída do comando irá informar o nome do log gerado ( Check the log file: exemplo1.log ), nele existirá detalhes adicionais da carga.


[oracle@db2 ~]$ cat exemplo1.log

SQL*Loader: Release 12.1.0.2.0 - Production on Thu Mar 16 15:04:08 2017

Copyright (c) 1982, 2014, Oracle and/or its affiliates.  All rights reserved.

Control File:   exemplo1.ctl
Character Set WE8ISO8859P1 specified for all input.

Data File:      /home/oracle/dados1.txt
  Bad File:     /home/oracle/exemplo1.bad
  Discard File: /home/oracle/exemplo1.dsc
 (Allow all discards)

Number to load: ALL
Number to skip: 0
Errors allowed: 9999999
Bind array:     5 rows, maximum of 256000 bytes
Continuation:    none specified
Path used:      Conventional

Table PRODUTOS, loaded from every logical record.
Insert option in effect for this table: INSERT

   Column Name                  Position   Len  Term Encl Datatype
------------------------------ ---------- ----- ---- ---- ---------------------
CODIGO                              FIRST     *   ,       CHARACTER
NOME                                 NEXT     *   ,       CHARACTER
CATEGORIA                            NEXT     *   ,       CHARACTER
DATA_INCLUSAO                        NEXT     *   ,       CHARACTER


Table PRODUTOS:
  10 Rows successfully loaded.
  0 Rows not loaded due to data errors.
  0 Rows not loaded because all WHEN clauses were failed.
  0 Rows not loaded because all fields were null.


Space allocated for bind array:                   5160 bytes(5 rows)
Read   buffer bytes: 1048576

Total logical records skipped:          0
Total logical records read:            10
Total logical records rejected:         0
Total logical records discarded:        0

Run began on Thu Mar 16 15:04:08 2017
Run ended on Thu Mar 16 15:04:09 2017

Elapsed time was:     00:00:00.40
CPU time was:         00:00:00.01

Registros na tabela PRODUTOS do banco de dados:


SQL> set lines 200
SQL> col nome for a30
SQL> col categoria for a20
SQL> select * from produtos;

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
         1 Shampoo                        Higiene              16-MAR-17
         2 Creme Dental                   Higiene              16-MAR-17
         3 Detergente                     Limpeza              16-MAR-17
         4 Alvejante                      Limpeza              16-MAR-17
         5 Amaciante                      Limpeza              16-MAR-17
         6 Refrigerante                   Bebida               16-MAR-17
         7 Agua                           Bebida               16-MAR-17
         8 Cerveja                        Bebida               16-MAR-17
         9 Suco                           Bebida               16-MAR-17
        10 Whisky                         Bebida               16-MAR-17

10 rows selected.

2.    Inserindo dados adicionais:


Após a inserção dos registros do arquivo dados1.txt se tornou necessário inserir alguns registros adicionais, desta forma, o SQL*Loader foi novamente executado informando um segundo arquivo de dados chamado dados2.txt, contudo ocorreu ocorre um erro informando que a tabela PROTUDOS precisa estar vazia.


[oracle@db2 ~]$ sqlldr anderson/anderson@pdb1 control=exemplo2.ctl

SQL*Loader: Release 12.1.0.2.0 - Production on Thu Mar 16 15:20:37 2017

Copyright (c) 1982, 2014, Oracle and/or its affiliates.  All rights reserved.

Path used:      Conventional
SQL*Loader-601: For INSERT option, table must be empty.  Error on table PRODUTOS


Como o arquivo dados2.txt contém apenas registros adicionais, será utilizado o comando APPEND que instrui o SQL*Loader a "acrescentar" os registros do arquivo dados2 na tabela PRODUTOS.


[oracle@db2 ~]$ cat dados2.txt
11,Trigo,Cereal,16-MAR-17
12,Arroz,Cereal,16-MAR-17

Arquivo de controle contendo o comando APPEND:


[oracle@db2 ~]$ cat exemplo2.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados2.txt'
 badfile '/home/oracle/exemplo2.bad'
 discardfile '/home/oracle/exemplo2.dsc'
 append
 into table produtos
 fields terminated by ","
( codigo, nome, categoria, data_inclusao )


Execução do SQL*Loader para carregar os dados adicionais:



[oracle@db2 ~]$ sqlldr anderson/anderson@pdb1 control=exemplo2.ctl

SQL*Loader: Release 12.1.0.2.0 - Production on Thu Mar 16 15:28:12 2017

Copyright (c) 1982, 2014, Oracle and/or its affiliates.  All rights reserved.

Path used:      Conventional
Commit point reached - logical record count 2

Table PRODUTOS:
  2 Rows successfully loaded.

Check the log file:
  exemplo2.log
for more information about the load.

Verificando se os registros foram acrescentados a tabela com sucesso:


SQL> select * from produtos;

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
         1 Shampoo                        Higiene              16-MAR-17
         2 Creme Dental                   Higiene              16-MAR-17
         3 Detergente                     Limpeza              16-MAR-17
         4 Alvejante                      Limpeza              16-MAR-17
         5 Amaciante                      Limpeza              16-MAR-17
         6 Refrigerante                   Bebida               16-MAR-17
         7 Agua                           Bebida               16-MAR-17
         8 Cerveja                        Bebida               16-MAR-17
         9 Suco                           Bebida               16-MAR-17
        10 Whisky                         Bebida               16-MAR-17
        11 Trigo                          Cereal               16-MAR-17

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
        12 Arroz                          Cereal               16-MAR-17

12 rows selected.

Caso os novos registros tenham sido adicionados no mesmo arquivo de dados anterior (dados1.txt), utilize o parâmetro TRUNCATE em vez de APPEND, desta forma, a tabela será primeiramente truncada e posteriormente os dados inseridos.


[oracle@db2 ~]$ cat exemplo3.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados1.txt'
 badfile '/home/oracle/exemplo3.bad'
 discardfile '/home/oracle/exemplo3.dsc'
 truncate
 into table produtos
 fields terminated by ","
( codigo, nome, categoria, data_inclusao )

Execução do SQL*Loader com o novo arquivo de controle (control file):


[oracle@db2 ~]$ sqlldr anderson/anderson@pdb1 control=exemplo3.ctl

SQL*Loader: Release 12.1.0.2.0 - Production on Thu Mar 16 15:37:06 2017

Copyright (c) 1982, 2014, Oracle and/or its affiliates.  All rights reserved.

Path used:      Conventional
Commit point reached - logical record count 5
Commit point reached - logical record count 10
Commit point reached - logical record count 12

Table PRODUTOS:
  12 Rows successfully loaded.

Check the log file:
  exemplo3.log


3.    Diferentes delimitadores:


Em alguns cenários os delimitadores dos registros poderão ser diferentes, como no arquivo de dados abaixo:


[oracle@db2 ~]$ cat dados3.txt
1,Shampoo|Higiene^16-MAR-17
2,Creme Dental|Higiene^16-MAR-17
3,Detergente|Limpeza^16-MAR-17
4,Alvejante|Limpeza^16-MAR-17
5,Amaciante|Limpeza^16-MAR-17
6,Refrigerante|Bebida^16-MAR-17
7,Agua|Bebida^16-MAR-17
8,Cerveja|Bebida^16-MAR-17
9,Suco|Bebida^16-MAR-17
10,Whisky|Bebida^16-MAR-17
11,Trigo|Cereal^16-MAR-17
12,Arroz|Cereal^16-MAR-17

Para carregar estes dados, além do já configurado terminated by "," será adicionado após cada coluna no arquivo de controle um novo terminated by especificando o caractere necessário para quebrar cada coluna.


[oracle@db2 ~]$ cat exemplo4.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados3.txt'
 badfile '/home/oracle/exemplo4.bad'
 discardfile '/home/oracle/exemplo4.dsc'
 truncate
 into table produtos
 fields terminated by ","
( codigo, nome terminated by "|", categoria terminated by "^", data_inclusao )


Execução:

[oracle@db2 ~]$ sqlldr anderson/anderson@pdb1 control=exemplo4.ctl

Verificando os registros:

SQL> select * from produtos;

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
         1 Shampoo                        Higiene              16-MAR-17
         2 Creme Dental                   Higiene              16-MAR-17
         3 Detergente                     Limpeza              16-MAR-17
         4 Alvejante                      Limpeza              16-MAR-17
         5 Amaciante                      Limpeza              16-MAR-17
         6 Refrigerante                   Bebida               16-MAR-17
         7 Agua                           Bebida               16-MAR-17
         8 Cerveja                        Bebida               16-MAR-17
         9 Suco                           Bebida               16-MAR-17
        10 Whisky                         Bebida               16-MAR-17
        11 Trigo                          Cereal               16-MAR-17

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
        12 Arroz                          Cereal               16-MAR-17

12 rows selected.

4.    Formatando datatype DATE e definindo "tamanho fixo" para os dados:

Da mesma forma que um arquivo de dados pode ter diferentes delimitadores, também é possível que ele não tenha qualquer delimitador. Utilizando o comando "position(start:end)" é possível delimitar onde começa e onde termina cada coluna/registro.

Na coluna DATA_INCLUSAO, datatype DATE, também é permitido aplicar mascaras, transformando-a conforme necessidade.


Arquivo de dados:


[oracle@db2 ~]$ cat dados4.txt
1Shampoo1Higiene16/03/2017 16:18:00
2Shampoo2Higiene16/03/2017 16:18:00
3Shampoo3Higiene16/03/2017 16:18:00
4Shampoo4Higiene16/03/2017 16:18:00

Arquivo de controle contendo a máscara para a data_inclusao e com as posições de início:fim de cada coluna/registro:


[oracle@db2 ~]$ cat exemplo5.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados4.txt'
 badfile '/home/oracle/exemplo5.bad'
 discardfile '/home/oracle/exemplo5.dsc'
 truncate
 into table produtos
 fields terminated by ","
( codigo position(1:1), nome position(2:9), categoria position(10:16), data_inclusao position(17:35) "to_date(trim(:data_inclusao),'DD/MM/YYYY HH24:MI:SS')" )

Registros inseridos:

SQL> select * from produtos;

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
         1 Shampoo1                       Higiene              16-MAR-17
         2 Shampoo2                       Higiene              16-MAR-17
         3 Shampoo3                       Higiene              16-MAR-17
         4 Shampoo4                       Higiene              16-MAR-17

5.    Alterando os dados durante a carga:

Nem sempre os dados de entrada representam o formato ou nome que é necessário que eles tenham no banco de dados. Para tanto podemos usar funções SQL para “transformar” estes dados durante o processo de carga.


No exemplo será utilizado o arquivo de dados dados1.txt, onde cada código será incrementado em +10, o nome convertido para UPPERCASE (Maiúsculo) e a categoria além do UPPERCASE será substituída por DESCONHECIDA quando a categoria de entrada (arquivo de dados) for Limpeza.


[oracle@db2 ~]$ cat exemplo6.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados1.txt'
 badfile '/home/oracle/exemplo6.bad'
 discardfile '/home/oracle/exemplo6.dsc'
 truncate
 into table produtos
 fields terminated by ","
( codigo ":codigo+10", nome "upper(:nome)", categoria "upper(decode(:categoria,'Limpeza','Desconhecida', :categoria))", data_inclusao )

Verificando se os registros foram alterados durante a carga de dados conforme especificado:


SQL> select * from produtos;

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
        11 SHAMPOO                        HIGIENE              16-MAR-17
        12 CREME DENTAL                   HIGIENE              16-MAR-17
        13 DETERGENTE                     DESCONHECIDA         16-MAR-17
        14 ALVEJANTE                      DESCONHECIDA         16-MAR-17
        15 AMACIANTE                      DESCONHECIDA         16-MAR-17
        16 REFRIGERANTE                   BEBIDA               16-MAR-17
        17 AGUA                           BEBIDA               16-MAR-17
        18 CERVEJA                        BEBIDA               16-MAR-17
        19 SUCO                           BEBIDA               16-MAR-17
        20 WHISKY                         BEBIDA               16-MAR-17
        21 TRIGO                          CEREAL               16-MAR-17

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
        22 ARROZ                          CEREAL               16-MAR-17

12 rows selected.

6.    Carregando dados de forma seletiva:


Se nem todos os dados precisam ser carregados, basta inserir a clausula WHEN logo após o "into table" onde apenas os registros que satisfazerem a condição serão carregados para a tabela no banco de dados.


[oracle@db2 ~]$ cat exemplo7.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados1.txt'
 badfile '/home/oracle/exemplo7.bad'
 discardfile '/home/oracle/exemplo7.dsc'
 truncate
 into table produtos
 when categoria = 'Bebida'
 fields terminated by ","
( codigo, nome, categoria, data_inclusao )

Dados que foram inseridos na tabela PRODUTOS:

SQL> select * from produtos;

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
         6 Refrigerante                   Bebida               16-MAR-17
         7 Agua                           Bebida               16-MAR-17
         8 Cerveja                        Bebida               16-MAR-17
         9 Suco                           Bebida               16-MAR-17
        10 Whisky                         Bebida               16-MAR-17

Como existem dados descartados em função da condição WHEN, o arquivo discardfile foi criado contendo os registros que foram descartados no processo de carga por não atenderem a condição imposta.


[oracle@db2 ~]$ cat exemplo7.dsc
1,Shampoo,Higiene,16-MAR-17
2,Creme Dental,Higiene,16-MAR-17
3,Detergente,Limpeza,16-MAR-17
4,Alvejante,Limpeza,16-MAR-17
5,Amaciante,Limpeza,16-MAR-17
11,Trigo,Cereal,16-MAR-17
12,Arroz,Cereal,16-MAR-17

7.    Utilizando valores sequenciais:

Nos exemplos até aqui utilizados, sempre existiu no arquivo de dados o código do produto, mas e se não existe? Pois bem, lembra da flexibilidade do SQL*Loader supracitada?

SEQUENCE(MAX): Especificado após o nome da coluna no arquivo de controle (control file) faz com que o SQL*Loader gere de forma sequencial os valores para a determinada coluna.

Arquivo de dados criado sem os códigos:


[oracle@db2 ~]$ cat dados5.txt
Shampoo,Higiene,16-MAR-17
Creme Dental,Higiene,16-MAR-17
Detergente,Limpeza,16-MAR-17
Alvejante,Limpeza,16-MAR-17
Amaciante,Limpeza,16-MAR-17
Refrigerante,Bebida,16-MAR-17
Agua,Bebida,16-MAR-17
Cerveja,Bebida,16-MAR-17
Suco,Bebida,16-MAR-17
Whisky,Bebida,16-MAR-17
Trigo,Cereal,16-MAR-17
Arroz,Cereal,16-MAR-17

Arquivo de controle com o sequence(max) na coluna código:

[oracle@db2 ~]$ cat exemplo8.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados5.txt'
 badfile '/home/oracle/exemplo8.bad'
 discardfile '/home/oracle/exemplo8.dsc'
 truncate
 into table produtos
 fields terminated by ","
( codigo sequence(max), nome, categoria, data_inclusao )

Após a execução da carga, foram inseridos os seguintes registros na tabela PRODUTOS:


SQL> select * from produtos;

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
         1 Shampoo                        Higiene              16-MAR-17
         2 Creme Dental                   Higiene              16-MAR-17
         3 Detergente                     Limpeza              16-MAR-17
         4 Alvejante                      Limpeza              16-MAR-17
         5 Amaciante                      Limpeza              16-MAR-17
         6 Refrigerante                   Bebida               16-MAR-17
         7 Agua                           Bebida               16-MAR-17
         8 Cerveja                        Bebida               16-MAR-17
         9 Suco                           Bebida               16-MAR-17
        10 Whisky                         Bebida               16-MAR-17
        11 Trigo                          Cereal               16-MAR-17

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
        12 Arroz                          Cereal               16-MAR-17

12 rows selected.

Caso seja necessário carregar mais dados, não tem problema. Altere o arquivo de controle substituindo o comando TRUNCATE por APPEND. O sequence(max) irá continuar a sequência sem problemas.


[oracle@db2 ~]$ cat dados6.txt
Trigo,Cereal,16-MAR-17
Arroz,Cereal,16-MAR-17
[oracle@db2 ~]$ cat exemplo9.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados6.txt'
 badfile '/home/oracle/exemplo9.bad'
 discardfile '/home/oracle/exemplo9.dsc'
 append
 into table produtos
 fields terminated by ","
( codigo sequence(max), nome, categoria, data_inclusao )

Registros na tabela PRODUTOS após a carga de dados adicional:


SQL> select * from produtos;

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
        13 Trigo                          Cereal               16-MAR-17
        14 Arroz                          Cereal               16-MAR-17
         1 Shampoo                        Higiene              16-MAR-17
         2 Creme Dental                   Higiene              16-MAR-17
         3 Detergente                     Limpeza              16-MAR-17
         4 Alvejante                      Limpeza              16-MAR-17
         5 Amaciante                      Limpeza              16-MAR-17
         6 Refrigerante                   Bebida               16-MAR-17
         7 Agua                           Bebida               16-MAR-17
         8 Cerveja                        Bebida               16-MAR-17
         9 Suco                           Bebida               16-MAR-17

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
        10 Whisky                         Bebida               16-MAR-17
        11 Trigo                          Cereal               16-MAR-17
        12 Arroz                          Cereal               16-MAR-17

14 rows selected.

Além da opção nativa do SQL*Loader ainda é possível utilizar sequences criadas na própria base de dados, contudo a antiga coluna de código ainda deve existir no arquivo de dados, caso contrário será gerado erro.

Será utilizado o arquivo de dados - dados1.txt para a simulação.


SQL> create sequence seq_tst1 start with 5 increment by 5;

Sequence created.

Arquivo de controle especificando a sequência criada no banco de dados:

[oracle@db2 ~]$ cat exemplo10.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados1.txt'
 badfile '/home/oracle/exemplo10.bad'
 discardfile '/home/oracle/exemplo10.dsc'
 truncate
 into table produtos
 fields terminated by ","
( codigo "SEQ_TST1.nextval", nome, categoria, data_inclusao )

Realizada a carga, seguem os dados carregados:


SQL> select * from produtos;


    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
         5 Shampoo                        Higiene              16-MAR-17
        10 Creme Dental                   Higiene              16-MAR-17
        15 Detergente                     Limpeza              16-MAR-17
        20 Alvejante                      Limpeza              16-MAR-17
        25 Amaciante                      Limpeza              16-MAR-17
        30 Refrigerante                   Bebida               16-MAR-17
        35 Agua                           Bebida               16-MAR-17
        40 Cerveja                        Bebida               16-MAR-17
        45 Suco                           Bebida               16-MAR-17
        50 Whisky                         Bebida               16-MAR-17
        55 Trigo                          Cereal               16-MAR-17

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
        60 Arroz                          Cereal               16-MAR-17

12 rows selected.

Outra opção para trabalhar com uma sequence da base de dados é via trigger, ou seja, a coluna código deve ser removida do arquivo de controle da mesma forma que no arquivo de dados também não é mais necessário.

Será utilizado o arquivo de dados - dados5.txt para a simulação, onde não existem valores "codigo".


Trigger criada na base de dados:


SQL> create trigger trg_seq_tst1 before insert on produtos
2 for each row
3 begin
4  select seq_tst1.nextval into :new.codigo from dual;
5 end;
6 /

Trigger created.

Arquivo de controle onde foi removido a coluna "codigo":

[oracle@db2 ~]$ cat exemplo11.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados5.txt'
 badfile '/home/oracle/exemplo11.bad'
 discardfile '/home/oracle/exemplo11.dsc'
 truncate
 into table produtos
 fields terminated by ","
( nome, categoria, data_inclusao )

Registros após a nova carga dos dados utilizando o arquivo de controle exemplo11.ctl:


SQL> select * from produtos;

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
        65 Shampoo                        Higiene              16-MAR-17
        70 Creme Dental                   Higiene              16-MAR-17
        75 Detergente                     Limpeza              16-MAR-17
        80 Alvejante                      Limpeza              16-MAR-17
        85 Amaciante                      Limpeza              16-MAR-17
        90 Refrigerante                   Bebida               16-MAR-17
        95 Agua                           Bebida               16-MAR-17
       100 Cerveja                        Bebida               16-MAR-17
       105 Suco                           Bebida               16-MAR-17
       110 Whisky                         Bebida               16-MAR-17
       115 Trigo                          Cereal               16-MAR-17

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
       120 Arroz                          Cereal               16-MAR-17

12 rows selected.

8.    Carregando dados de múltiplos arquivos de dados:


Para carregar dados de múltiplos arquivos, insira múltiplos infile dentro do arquivo de controle.


[oracle@db2 ~]$ cat exemplo12.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados1.txt'
 infile '/home/oracle/dados2.txt'
 badfile '/home/oracle/exemplo12.bad'
 discardfile '/home/oracle/exemplo12.dsc'
 truncate
 into table produtos
 fields terminated by ","
(  codigo, nome, categoria, data_inclusao )

Como no meu arquivo de dados dados1.txt atualmente existem registros duplicados com o dados2.txt, será criado uma primary key (PK) na tabela PRODUTOS sobre a coluna codigo de forma a não importar dados duplicados e gerar o arquivo badfile com os registros rejeitados.


SQL> alter table produtos add constraint pk_cod primary key(codigo);

Table altered.

Execução da carga:


[oracle@db2 ~]$ sqlldr anderson/anderson@pdb1 control=exemplo12.ctl

SQL*Loader: Release 12.1.0.2.0 - Production on Thu Mar 16 19:43:39 2017

Copyright (c) 1982, 2014, Oracle and/or its affiliates.  All rights reserved.

Path used:      Conventional
Commit point reached - logical record count 5
Commit point reached - logical record count 10
Commit point reached - logical record count 12
Commit point reached - logical record count 14

Table PRODUTOS:
  12 Rows successfully loaded.

Check the log file:
  exemplo12.log
for more information about the load.

Arquivos rejeitados (badfile) – O nome do caminho/arquivo é o configurado no arquivo de controle, neste caso /home/oracle/exemplo12.bad:


[oracle@db2 ~]$ cat exemplo12.bad
11,Trigo,Cereal,16-MAR-17
12,Arroz,Cereal,16-MAR-17

Erro gerado no arquivo de log que justificam os registros rejeitados:


[oracle@db2 ~]$ cat exemplo12.log | grep ORA-
ORA-00001: unique constraint (ANDERSON.PK_COD) violated
ORA-00001: unique constraint (ANDERSON.PK_COD) violated

Registros que foram inseridos:

SQL> select * from produtos;

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
         1 Shampoo                        Higiene              16-MAR-17
         2 Creme Dental                   Higiene              16-MAR-17
         3 Detergente                     Limpeza              16-MAR-17
         4 Alvejante                      Limpeza              16-MAR-17
         5 Amaciante                      Limpeza              16-MAR-17
         6 Refrigerante                   Bebida               16-MAR-17
         7 Agua                           Bebida               16-MAR-17
         8 Cerveja                        Bebida               16-MAR-17
         9 Suco                           Bebida               16-MAR-17
        10 Whisky                         Bebida               16-MAR-17
        11 Trigo                          Cereal               16-MAR-17

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
        12 Arroz                          Cereal               16-MAR-17

12 rows selected.

9.    Carregando dados em múltiplas tabelas:

Assim como para carregar múltiplos arquivos basta inserir outros infile no arquivo de controle, para carregar os dados em múltiplas tabelas basta inserir outros into table.


Neste exemplo será criado uma nova tabela chamada CATEGORIA onde teremos o código da categoria e seu respectivo nome.


SQL> create table categoria (
2  codigo  number,
3  nome   varchar2(100) );

Table created.

Na tabela PRODUTOS não existirá mais o nome da categoria, mas o código da categoria que fara referência a tabela CATEGORIA. Desta forma, o arquivo de controle foi ajustado para:



[oracle@db2 ~]$ cat exemplo13.ctl
options (errors=9999999, rows=5)
load data
 characterset WE8ISO8859P1
 infile '/home/oracle/dados1.txt'
 badfile '/home/oracle/exemplo13.bad'
 discardfile '/home/oracle/exemplo13.dsc'
 truncate
 into table produtos
 fields terminated by ","
( codigo, nome, categoria "decode(:categoria,'Higiene','1','Limpeza','2','Bebida','3','Cereal','4',:categoria)", data_inclusao )
 into table categoria
 fields terminated by ","
 trailing nullcols
( codigo "decode(:nome,'Higiene','1','Limpeza','2','Bebida','3','Cereal','4',:nome)", x filler position(1), y filler,  nome )

O decode na categoria foi inserido para transformar o "nome da categoria" em "códigos" para os mesmos grupos.


No arquivo de dados existem 4 colunas/registros para cada linha, diferentemente da tabela PRODUTOS a tabela CATEGORIA possui apenas 2 colunas e que não seguem a mesma sequência das colunas no arquivo de dados.


Para ler apenas a 3ª coluna de cada linha e popular corretamente a tabela CATEGORIA foi inserido o comando TRAILING NULLCOLS para que quando não houverem valores eles sejam nulos e foi criado colunas fictícias com o comando FILLER para simular as colunas do arquivo de dados.

Posterior a coluna código da CATEGORIA existe o FILLER x e y além da coluna nome. No arquivo de dados a coluna que contém os dados do nome da categoria é a 3ª e não a 4ª coluna, isto é necessário pois quando se trabalha com múltiplas tabelas e diferentes colunas de inserção o delimitador acaba se perdendo e para voltar ao início da linha foi atribuído junto ao comando FILLER da coluna x o comando position(1), por isso existem mais 3 colunas após a coluna categoria, justamente para simular as colunas fictícias desde o início de cada linha (null,null,CATEGORIA).

Executando a carga dos dados:


[oracle@db2 ~]$ sqlldr anderson/anderson@pdb1 control=exemplo13.ctl

SQL*Loader: Release 12.1.0.2.0 - Production on Fri Mar 17 14:33:33 2017

Copyright (c) 1982, 2014, Oracle and/or its affiliates.  All rights reserved.

Path used:      Conventional
Commit point reached - logical record count 5
Commit point reached - logical record count 10
Commit point reached - logical record count 12

Table PRODUTOS:
  12 Rows successfully loaded.

Table CATEGORIA:
  12 Rows successfully loaded.

Check the log file:
  exemplo13.log
for more information about the load.

Registros carregados na tabela PRODUTOS:


SQL> select * from produtos;

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
         1 Shampoo                        1                    16-MAR-17
         2 Creme Dental                   1                    16-MAR-17
         3 Detergente                     2                    16-MAR-17
         4 Alvejante                      2                    16-MAR-17
         5 Amaciante                      2                    16-MAR-17
         6 Refrigerante                   3                    16-MAR-17
         7 Agua                           3                    16-MAR-17
         8 Cerveja                        3                    16-MAR-17
         9 Suco                           3                    16-MAR-17
        10 Whisky                         3                    16-MAR-17
        11 Trigo                          4                    16-MAR-17

    CODIGO NOME                           CATEGORIA            DATA_INCL
---------- ------------------------------ -------------------- ---------
        12 Arroz                          4                    16-MAR-17

12 rows selected.

Pelo output (saída) da execução do SQL*Loader já é perceptível que ocorreu a inserção de 12 linhas também na tabela CATEGORIA, mas temos apenas 4 distintas categorias. Como não é possível trabalhar com distinct no SQL*Loader, basta agora remover os valores duplicados da tabela CATEGORIA.


SQL> delete from categoria A
2      where rowid > (select min(rowid)
3                       from categoria B
4                      where a.codigo = b.codigo
5                        and a.nome   = b.nome
6                     );

8 rows deleted.

SQL> commit;

Commit complete.

SQL> select * from categoria;

    CODIGO NOME
---------- ------------------------------
         1 Higiene
         2 Limpeza
         3 Bebida
         4 Cereal

Além das opções e comandos citados que já tornam o SQL*Loader uma poderosa ferramenta, ainda existem diversas outras parametrizações e comandos que podem ser empregados na sua configuração deixando-o ainda mais rápido (direct, parallel, etc) e versátil (skip, begindata, dnfs_enable, etc).


Referências:

https://docs.oracle.com/database/122/SUTIL/oracle-sql-loader-concepts.htm
https://docs.oracle.com/database/122/SUTIL/oracle-sql-loader-commands.htm
Postagem mais recente Postagem mais antiga Página inicial

0 comentários:

Postar um comentário

Translate

# Suporte

# ACE Program

#Oracle

#Oracle
Disclaimer: The views expressed on this blog are my own and do not necessarily reflect the views of Oracle.

#Blog reconhecido

#ARTICULISTA

Marcadores

Postagens populares