Os dados gerados pelos sistemas transacionais das organizações podem ser reestruturados para adequação a um modelo de dados dimensional que dará base a um Data Warehouse que, para ser contruído, exige a elaboração de programas que farão a extração, transformação e carga dos dados, fase esta conhecida como ETL (Extract, Transform, Load). A fim de explorar fatores que determinem a escolha de ferramentas ETL, este trabalho avalia a execução de programas para carga de dados fazendo um comparativo entre duas soluções bastante utilizadas no mercado mundial: DataStage Server, que executa o processo de carga seqüencial; e o DataStage Enterprise Edition, que utiliza recursos de paralelismo. Os experimentos mostraram que os programas que utilizam-se do processamento paralelo gastaram menos tempo para executar, entretanto a utilização de memória e CPU foi consideravelmente maior.
Fonte: Monografia do Curso de Sistemas de Informação - PUC-MG - Pontifícia Universidade Católica de Minas Gerais. 2008. 47 p.
Veja a Monografia Completa
Nenhum comentário:
Postar um comentário