Configuração de vários arquivos de saída

Se volumes de dados muito grandes forem extraídos e gravados em um único arquivo de saída como eventos de sistema, o arquivo poderá tornar-se difícil de tratar. Nesses casos, é possível configurar a fonte de dados usada de forma que os dados extraídos sejam gravados em qualquer número de arquivos de saída XML. Tudo o que precisa fazer é especificar o número máximo de eventos de sistema por arquivo de saída e o nome do arquivo de saída no elemento XML dataextraction.

Exemplo (para uma fonte de dados CSV, mesmo procedimento para os tipos JDBC e SAP)

<?xml version="1.0" encoding="ISO-8859-1"?>

<!DOCTYPE datasource SYSTEM "datasource.dtd">

<datasource name="BILLING" type="CSV">

<dataextraction>

<outputfilename>..\custom\<clientname>\data\

BILLING_data_$EXTRACTIONDATE$_$EXTRACTIONTIME$.zip

</outputfilename>

<numberofeventsperxmlfile>

100000

</numberofeventsperxmlfile>

</dataextraction>

...

<systemconfig>...</systemconfig>

<eventspec>...</eventspec>

...

</datasource>

Para a fonte de dados BILLING, o elemento XML numberofeventsperxmlfile especifica que cada arquivo de saída XML deve conter 100000 eventos de sistema, com o último arquivo de saída gerado contendo todos os eventos restantes.
O elemento XML outputfilename especifica o caminho e nome dos arquivos de saída. Estas definições geram arquivos XML com nomes no formato BILLING_data_$EXTRACTIONDATE$_$EXTRACTIONTIME$.zip, no diretório de saída especificado. A variável do nome $EXTRACTIONDATE$ contém a data de extração, enquanto $EXTRACTIONTIME$ contém a hora de extração. Os arquivos de saída gerados são numerados colocando _<x> no final do nome, em que x é um número consecutivo e o primeiro arquivo de saída gerado não é numerado.

Se 369000 eventos de sistema tiverem sido extraídos em 23 de junho de 2007 às 11:36:45, o uso da configuração de exemplo exibida criará os seguintes arquivos de saída:

A tabela abaixo lista todas as opções de configuração:

Elemento XML

Descrição

numberofeventsperxmlfile

Número fixo de eventos de sistema gravados para um arquivo de saída. O último arquivo de saída criado contém o número restante de eventos. Se este elemento estiver ausente, todos os eventos de sistema serão gravados em um arquivo de saída.

outputfilename

Caminho e padrão de nomeação do arquivo de saída. Os formatos XML e ZIP são suportados. Um arquivo de saída ZIP contém um arquivo de saída XML com o mesmo nome. Os arquivos de saída para uma extração são numerados consecutivamente com _<x> no final do nome, apesar de o primeiro arquivo não ser numerado.

As seguintes variáveis são permitidas no nome do arquivo de saída (outputfilename) e podem ser usadas em qualquer combinação:

Variável (tipo de fonte de dados)

Descrição

$EXTRACTIONDATE$
(CSV, SAP, JDBC)

Data de extração (formato: aaaaMMdd)

$EXTRACTIONTIME$
(CSV, SAP, JDBC)

Hora de extração (formato: HHmmss)

$BEGINDATE$
(SAP, JDBC)

Data de início do período de extração
(formato: aaaaMMdd)

$BEGINTIME$
(SAP, JDBC)

Hora de início do período de extração
(formato: HHmmss)

$ENDDATE$
(SAP, JDBC)

Hora de término do período de extração
(formato: aaaaMMdd)

$ENDTIME$
(SAP, JDBC)

Hora de término do período de extração
(formato: HHmmss)

$VALUECONSTRAINT$
(SAP, ver o capítulo Operadores de condição e JDBC, ver o capítulo Operadores de condição)

Formato de saída:
<Operator>_Value1 ou <Operator>_Value1_<Operator>_Value2

Saída de operadores e valores de comparação de números inteiros usados para restringir o volume de dados extraídos. O nome do arquivo de saída pode ser: outfile_gt_230_le_300_<x>.xml, em que x é o número consecutivo.
Representação do operador:
maior do que: gt
maior ou igual a: ge
inferior a: lt
inferior ou igual a: le

Pode configurar convenientemente a distribuição dos conjuntos de dados extraídos para vários arquivos de saída em PPM Customizing Toolkit, no Gerenciamento da fonte de dados do cliente, por meio de Configurações adicionais..., na área Extração de dados.