Extrair campos ou tabelas individuais para análise de dados

Para permitir a fácil extração de dados para análise de dados, pode extrair todo o conteúdo de uma tabela do sistema de origem para um arquivo no formato de evento, que pode ser importado para um território de análise para análise de dados.

Também pode restringir os dados a serem extraídos definindo condições para a extração de dados.

A tabela a ser extraída não é configurada usando a configuração da tabela, mas o próprio arquivo da fonte de dados. Para isso, o arquivo datasource.dtd contém as entradas seguintes:

Elemento/atributo XML

Descrição

analysistype

Atributo XML:
Tem de ter o valor DATA_ANALYTICS.

realmtable

Elemento XML abrangente para configurar a fonte de dados para análise de dados.

tablename

Atributo XML do elemento realmtable:
Nome da tabela do sistema de origem

sourcetable

Elemento XML abrangente para configurar a tabela de fonte de dados para análise de dados.

Tem de incluir pelo menos um elemento sourcefield.

tablename

Atributo XML do elemento sourcetable:
Nome da tabela do sistema de origem

sourcefield

Contém o nome do campo da tabela do sistema de origem.

O atributo analysistype do elemento XML datasource tem de ter o valor DATA_ANALYTICS se o elemento <realmtable> especificar uma tabela de território de análise (valor padrão: PROCESS).

O atributo tablename do elemento <realmtable> indica o nome da tabela de destino na configuração do território de análise. O nome da tabela não afeta a extração em si, mas é avaliado apenas pela importação do PPM.

Pode encontrar mais informações sobre importação de dados para análise no manual do usuário para análise de dados do PPM.

O elemento XML <realmtable> contém o elemento opcional <sourcetable> que especifica a tabela a ser extraída. As colunas a serem extraídas desta tabela têm de ser especificadas no elemento <sourcefield>. O elemento <sourcetable> é opcional. Para o Extrator JDBC ou SAP, devem ser especificadas uma única tabela de origem e pelo menos uma coluna de origem. Caso contrário, uma mensagem de erro será emitida durante a análise do arquivo da fonte de dados.

Uma definição de fonte de dados apenas pode ter, no máximo, uma tabela. É impossível restringir o número de linhas. Todas as linhas são extraídas, incluindo todas as linhas com valores idênticos nas colunas a serem extraídas. Por exemplo, se as colunas Primeiro nome e Sobrenome tiverem de ser extraídas e a tabela incluir dez entradas Peter e Schmidt, serão criados dez eventos com valores de atributo idênticos.

O exemplo seguinte explica a configuração:

<realmtable tablename="COMPANY_EMPLOYEE">

<sourcetable tablename="EMPLOYEE">

<sourcefield>EMPLOYEE_ID</sourcefield>

<sourcefield>NAME</sourcefield>

</sourcetable>

...

</realmtable>

<dataextraction>

<outputfilename>..\custom\testclient\data\employee.xml</outputfilename>

</dataextraction>

...

<systemconfig>..\custom\testclient\SourceSystemConfig.xml</systemconfig>

Em contraste com o comportamento do Extrator convencional JDCB ou SAP, os atributos não recebem mais um nome de tabela como um prefixo no arquivo de saída do evento. Por exemplo, se a tabela EMPLOYEE foi extraída, normalmente o extrator gera eventos do tipo <table name>-<column name>:

<event>

<attribute type="EMPLOYEE-EMPLOYEE_ID">4711</attribute>

<attribute type="EMPLOYEE-NAME">Schmidt</attribute>

</event>

No entanto, extrair uma tabela usando o elemento <realmtable>, apenas cria eventos sem nomes de tabela:

<event>

<attribute type="EMPLOYEE_ID">4711</attribute>

<attribute type="NAME">Schmidt</attribute>

</event>

Valores null no modo ANÁLISE DE DADOS

Se o valor de uma coluna for null no momento em que uma tabela do território de análise é extraída, esse valor não é gravado no evento. Se uma linha EMPLOYEE_ID = 4712 existir sem sobrenome, o extrator cria os eventos seguintes.

<event>

<attribute type="EMPLOYEE_ID">4711</attribute>

<attribute type="NAME">Schmidt</attribute>

</event>

<event>

<attribute type="EMPLOYEE_ID">4712</attribute>

</event>

No entanto, se todos os valores da coluna a serem extraídos forem null, o evento será gravado com atributos vazios:

<event>

<attribute type="EMPLOYEE_ID">4711</attribute>

<attribute type="NAME">Schmidt</attribute>

</event>

<event>

<attribute type="EMPLOYEE_ID"></attribute>

<attribute type="NAME"></attribute>

</event>

Se existirem várias dessas linhas, elas serão - em contraste com o procedimento de extração comum (analysistype = PROCESS) - transferidas devidamente, de modo que existam tantos elementos <event> no arquivo de eventos, como linhas na tabela de dados do sistema de origem.