Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco...

20
Escriturário Informática – Parte 6 Prof. Márcio Hunecke

Transcript of Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco...

Page 1: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

Escriturário

Informática – Parte 6

Prof. Márcio Hunecke

Page 2: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –
Page 3: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br 3

Informática

DATA WAREHOUSE (MODELAGEM CONCEITUAL PARA DATA WAREHOU-SES, DADOS MULTIDIMENSIONAIS) E OLAP

Data Warehouse

Executivos tomadores de decisão (diretores, gerentes, analistas, etc.) necessitam de ferramentas de apoio a tomada de decisão. É aí que entram os sistemas de suporte à decisão (Decision Sup-port Systems – DSS), ferramentas que ofereçam consultas sob demanda, interfaces gráficas, etc.

Um data warehouse visa integrar os dados internos e externos de uma organização em uma estrutura unificada, a fim de permitir uma melhor utilização dos dados.

A partir de uma estrutura de DW obtida, a análise destes dados se dá através de sistemas como OLAP (On-Line Analytical Processing) e data mining.

Um data warehouse é uma coleção de dados orientada por assuntos, integrada, variante no tempo, que tem por objetivo dar suporte aos processos de tomada de decisão.

O data warehouse é um banco de dados contendo dados extraídos do ambiente de produção da empresa (OLTP), que foram selecionados, tendo sido otimizados para processamento de consulta e não para processamento de transações através de um processo de extração trans-formação e carga (ou ETL – Extract transform and Load).

De maneira geral, um data warehouse pode consolidar dados de outras fontes externas, in-cluindo informações provenientes de planilhas eletrônicas, documentos, dados da web, etc.

O objetivo de um data warehouse é fornecer uma imagem única da realidade do negócio. De uma forma geral, sistemas de data warehouse compreendem um conjunto de programas que extraem dados do ambiente de dados operacionais da empresa, um banco de dados que os mantém, e sistemas que fornecem estes dados aos seus usuários.

Sistemas de Data Warehouse revitalizam os sistemas da empresa, pois:

• permitem que sistemas mais antigos continuem em operação;

• consolidam dados inconsistentes dos sistemas mais antigos em conjuntos coerentes;

• extraem benefícios de novas informações oriundas das operações correntes;

Como se vê, existem diferentes visões do que seria um data warehouse: uma arquitetura, um conjunto de dados semanticamente consistente com o objetivo de atender diferentes neces-sidades de acesso a dados e extração de relatórios, ou ainda, um processo em constante evo-lução, que utiliza dados de diversas fontes heterogêneas para dar suporte a consultas ad-hoc (sob demanda), relatórios analíticos e à tomada de decisão.

Page 4: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br4

Figura 1 – Representação do ambiente DW

Propósitos de um Data Wharehouse

Para entender o propósito do DW, analisaremos as seguintes questões:

“Nós possuímos montanhas de dados, no entanto, não conseguimos acessá-los. ”

“É necessário facilitar o acesso às informações para os usuários de negócio. ”

“Apenas mostre-me o que é importante. ”

“Nós precisamos que as pessoas usem a informação para suportar uma tomada de decisão ba-seada em fatos. ”

Uma das missões do data Warehouse é justamente consolidar os dados que são importantes para a tomada de decisão. Evitar o “Achômetro”.

Data warehouse e Data Mart

Um data mart é uma subdivisão ou subconjunto de um data warehouse. Os data marts são como pequenas fatias de data warehouse, que armazenam subconjuntos de dados.

Normalmente o data mart é direcionado para uma linha de negócios ou equipe, sendo que a sua informação costuma pertencer a um único departamento.

Page 5: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

Banco do Brasil - TI (Escriturário) – Informática – Márcio Henecke

www.acasadoconcurseiro.com.br 5

Extraindo informações do Data Warehouse

Existem várias maneiras de recuperar informações de um data warehouse, as formas de extra-ção mais comuns no mercado hoje são:

• Ferramentas de consulta e emissão de relatórios; • EIS (Executive Information Systems); • Ferramentas OLAP; • Ferramentas Data mining.

Ferramentas de Data Mining

Data mining (ou mineração de dados) é o processo de extrair informação válida, previamente desconhecida e de máxima abrangência a partir de grandes bases de dados, usando-as para efetuar decisões cruciais.

Data mining vai muito além da simples consulta a um banco de dados, no sentido de que per-mite aos usuários explorar e inferir informação útil a partir dos dados, descobrindo relaciona-mentos escondidos no banco de dados.

Um ambiente de apoio à tomada de decisões, integrando técnicas de data mining sobre um am-biente de data warehousing, possibilita um grande número de aplicações, que já vêm sendo im-plementadas em diversos segmentos de negócios, como manufatura, automação de pedido de remessas, varejo, gerenciamento de inventários, financeiro, análise de risco, transporte, gerencia-mento de frotas, telecomunicação, análise de chamadas, saúde, analise de resultados, marketing, estabelecimento do perfil dos consumidores, seguros, detecção de fraude, dentre outros.

OLAP

Partindo dos primórdios da informatização, quando um sistema que gerava relatórios era a principal fonte de dados residentes na empresa, toda vez que uma análise necessitasse ser feita, eram necessários produzir novos relatórios. Estes relatórios tinham que ser produzidos pela área de informática e, normalmente, precisavam de muito tempo para ficar prontos. E, também, apresentavam os seguintes problemas:

• Os relatórios eram estáticos;

• O acúmulo de diferentes tipos de relatórios num sistema gerava um problema de manutenção.

Então surgiu o conceito de OLAP (On-Line Analytic Processing).

OLAP é um software cuja tecnologia de construção permite aos analistas de negócios, gerentes e executivos analisar e visualizar dados corporativos de forma rápida, consistente e principal-mente interativa. A funcionalidade OLAP é inicialmente caracterizada pela análise dinâmica e multidimensional dos dados consolidados de uma organização permitindo que as atividades do usuário final sejam tanto analíticas quanto navegacionais A tecnologia OLAP é geralmente im-

Page 6: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br6

plementada em ambiente multiusuário e cliente/servidor, oferecendo assim respostas rápidas às consultas ad-hoc (construção de listagens, interligando a informação disponível na base de dados conforme as necessidades especificas da empresa, assim como a sua exportação, possi-bilitando várias simulações), não importando o tamanho do banco de dados nem sua complexi-dade. Hoje em dia, essa tecnologia também vem sendo disponibilizada em ambiente Web. Essa tecnologia auxilia o usuário a sintetizar informações corporativas por meio de visões compara-tivas e personalizadas, análises históricas, projeções e elaborações de cenários.

A classificação de ferramentas OLAP é uma tarefa imprecisa e gera alguma perplexidade por parte dos profissionais envolvidos na escolha e aquisição de uma ferramenta analítica, uma vez que não existe nenhuma característica peculiar que dite como a ferramenta deva ser cons-truída, qual tecnologia deva ser usada em sua construção, nem mesmo que funcionalidades devem ser implementadas.

Para tornar o processo de classificação mais complexo, muitos fornecedores anunciam carac-terísticas que tornam suas ferramentas compatíveis com funcionalidades OLAP sem que estas sejam sequer ferramentas OLAP. Outras oferecem suítes de produtos que são conhecidos como os melhores do mercado.

Atualmente existem no mercado diversos produtos OLAP que se diferenciam muito uns dos outros, tal fato gera uma situação muitas vezes contraditória no momento da escolha da ferra-menta mais adequada às necessidades de uma organização.

Para tornar o problema ainda mais complexo, nem os profissionais de tecnologia da informação (TI) nem os usuários finais estão suficientemente informados sobre que produtos OLAP ad-quirir. O processo de avaliação de uma ferramenta OLAP envolve análise das: funcionalidades, arquitetura, e interfaces e impacto sobre a organização.

O processo de aquisição de uma ferramenta OLAP deveria envolver não só os profissionais de TI como também os grupos de usuários finais. Porém, nem sempre esta premissa é verdadeira. Diversas organizações relatam sérios problemas de comunicação entre as equipes envolvidas na escolha de uma ferramenta OLAP.

A escolha de uma ferramenta OLAP inadequada pode ocasionar severas consequências para um projeto de data warehouse, entre as quais podemos citar:

• Falha total do projeto e consequente perda dos benefícios esperados para os negócios da empresa, além dos prejuízos financeiros gerados pelo alto custo da aquisição de software, serviços e treinamentos das equipes iniciais do projeto resultando benefícios ilusórios e temporários. Esta situação é muito comum em diversas organizações e sob certos aspectos gera piores resultados.

• Falha parcial do projeto onde apenas alguns módulos sobrevivem, reduzindo assim o esco-po, estando comparados com o item anterior, uma vez que passam a existir menores incen-tivos para substituir os sistemas atuais.

Funcionalidades da Ferramenta OLAP

A funcionalidade de uma ferramenta OLAP é caracterizada pela análise multidimensional dinâ-mica dos dados, apoiando o usuário final nas suas atividades.

Page 7: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

Banco do Brasil - TI (Escriturário) – Informática – Márcio Henecke

www.acasadoconcurseiro.com.br 7

Arquiteturas OLAP

Acompanhando a evolução dos sistemas, introduziram uma nova classe de Ferramentas no mercado, que se chamava de OLAP (On-Line Analitical Processing), que permitiam acesso rápi-do aos dados conjugado com funcionalidades de análise multidimensional dos mesmos pelos usuários finais. A rapidez exigida tinha de ser satisfatória. A análise deveria ser dinâmica, onde o usuário poderia fazer a consulta que quisesse sem depender de um profissional, multidimen-sional e compartilhado.

A análise multidimensional é uma das grandes utilidades da tecnologia OLAP, consistindo em ver determinados cubos de informações de diferentes ângulos e de vários níveis de agregação. Os “cubos” são massas de dados que retornam das consultas feitas ao banco de dados e podem ser manipulados e visualizados.

ROLAP – As ferramentas ROLAP (Relational On Line Analitical Processing), possuem uma en-genharia de acesso aos dados e análise OLAP com uma arquitetura um pouco diferente. Nesse caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor.

MOLAP – A arquitetura MOLAP (Multidimensional On Line Analitical Processing) processa-se da seguinte forma: com um servidor multidimensional, o acesso aos dados ocorre diretamen-te no banco, ou seja, o usuário trabalha, monta e manipula os dados do cubo diretamente no servidor. Isso traz grandes benefícios aos usuários no que diz respeito à performance, mas tem problemas com escalabilidade, além de ter um custo alto para aquisição.

HOLAP – Recentemente surgiu outra arquitetura denominada HOLAP (Hybrid On Line Analitical Processing), ou simplesmente processamento híbrido. Essa nova forma de acessar os dados nada mais é do que uma mistura de tecnologias onde há uma combinação entre ROLAP e MO-LAP. A vantagem é que com a mistura de tecnologias pode-se extrair o que há de melhor de cada uma, ou seja, a alta performance do MOLAP com a escalabilidade melhor do ROLAP.

DOLAP – As ferramentas que disparam uma instrução SQL, de um cliente qualquer, para o ser-vidor e recebem o microcubo de informações de volta para ser analisado na estação de traba-lho, chamam-se DOLAP (Desktop On Line Analitical Processing).

Page 8: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br8

Operações da Análise OLAP

Drill Down: Ocorre quando o usuário aumenta o nível de detalhe da informação, diminuindo o grau de granularidade.

Drill Up: é o contrário do Drill Down, ele ocorre quando o usuário aumenta o grau de granulari-dade, diminuindo o nível de detalhamento da informação.

Slice (fatiar) – seleciona dados de uma única dimensão de um cubo OLAP.

Dice – extrai um subcubo do cubo original executando uma operação de seleção em duas ou mais dimensões.

Pivot (rotacional) – Operação de rotação que permite visualizar dados de uma nova perspecti-va.

Modelagem Multidimensional

As análises sobre dados históricos envolvem uma série de possibilidades de cruzamentos e agrupamentos de informações, com o uso dos seguintes termos:

• Dimensões: estabelecem a organização dos dados, determinando possíveis consultas/cru-zamentos. Por exemplo: região, tempo, canal de venda,... Cada dimensão pode ainda ter seus elementos, chamados membros, organizados em diferentes níveis hierárquicos. A di-mensão tempo, por exemplo, pode possuir duas hierarquias: calendário gregoriano (com os níveis ano, mês e dia) e calendário fiscal (com os níveis ano, semana e dia);

• Medidas: são os valores a serem analisados, como médias, totais e quantidades;

• Fatos: são os dados a serem agrupados, contendo os valores de cada medida para cada combinação das dimensões existentes. O tamanho da tabela que contém os fatos merece atenção especial do analista;

• Agregações: totalizações calculadas nos diversos níveis hierárquicos.

A consulta ocorre inicialmente nas tabelas de dimensão e depois na tabela de fatos, asseguran-do a precisão dos dados.

Modelo Estrela (Star): o esquema estrela é uma estrutura simples, com poucas tabelas e liga-ções bem definidas, assemelha-se ao modelo de negócio e facilita a leitura e entendimento por todos. O nome estrela está associado à disposição das tabelas de dimensão e de fatos do modelo.

Tabela de fatos é a tabela dominante de um esquema de modelagem tipo estrela (Star Sche-ma), criado pelo Dr. Ralph Kimball, em um modelo multidimensional, e tem como característica principal a presença de dados altamente redundantes para se obter um melhor desempenho.

A tabela de fatos, no "centro" da estrela, fica rodeada por tabelas auxiliares, chamadas de ta-belas de dimensão. A tabela de fatos conecta-se as demais por múltiplas junções e as tabelas de dimensões se conectam com apenas uma junção a tabela de fatos. Esta tabela armazena grande quantidade de dados históricos, em função do tempo, obtidos a partir da intersecção

Page 9: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

Banco do Brasil - TI (Escriturário) – Informática – Márcio Henecke

www.acasadoconcurseiro.com.br 9

de todas as dimensões da estrela. A dimensão tempo (uma das tabelas auxiliares) é sempre integrante da chave primária e é na tabela de fatos onde armazenamos os indicadores de de-sempenho do negócio.

Hierarquia Implícita: também conhecidas como múltiplas hierarquias, representam as hierar-quias embutidas nos atributos das dimensões. Ou seja, não há normalização! Um exemplo, é uma tabela de dimensão de produtos onde a classificação do produto por Tipo de Armazena-mento e Tipo de Embalagem estão presentes na mesma tabela dimensão. A hierarquia implíci-ta está associada ao conceito do Esquema Estrela.

Modelo Floco de Neve (Snow Flake): é uma variação do esquema estrela, no qual todas as tabelas de dimensão são normalizadas na segunda forma normal (2FN), ou seja, são retirados das tabelas os campos que são funcionalmente dependentes de outros campos que não são chaves. Recomenda-se utilizar o esquema floco de neve apenas quando a linha de dimensão (número de atributos da tabela) ficar muito longa e começar a ser relevante do ponto de vista de espaço de armazenamento.

Hierarquia Explícita: são caracterizadas por uma sequência de entidades interligadas, cujos re-lacionamentos, entre cada par de entidades na sequência é de 1:N. Ou seja, neste caso, a di-mensão é normalizada dando origem a um Esquema Floco de Neve.

Page 10: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –
Page 11: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br 11

Questões

1. (2018 – FCC – DPE-AM – Analista em Gestão Especializado de Defensoria – Analista de Banco de Dados)

Uma das características fundamentais de um ambiente de data warehouse está em

a) servir como substituto aos bancos de dados operacionais de uma empresa, na eventualida-de da ocorrência de problemas com tais bancos de dados.

b) ser de utilização exclusiva da área de aplicações financeiras das empresas. c) proporcionar um ambiente que permita realizar análise dos negócios de uma empresa com

base nos dados por ela armazenados. d) ser de uso prioritário de funcionários responsáveis pela área de telemarketing das empre-

sas. e) armazenar apenas os dados mais atuais (máximo de 3 meses de criação), independente-

mente da área de atuação de cada empresa.

2. (2018 – FCC – DPE-AM)

Prova: Analista em Gestão Especializado de Defensoria – Analista de Banco de Dados

Sobre o processo de ETL, aplicado a data warehouse, é correto afirmar que

a) a fase de extração de dados consiste em obter os dados do servidor do data warehouse.b) a fase de transformação consiste em realizar modificações nos dados carregados, adequan-

do seus valores ao modelo definido para o data warehouse.c) as fases de extração e carga de dados são realizadas de forma simultânea. d) a fase de carga de dados visa eliminar valores nulos contidos nos bancos de dados transa-

cionais da empresa. e) a fase de carga de dados consiste em inserir os dados transformados nos bancos de dados

transacionais da empresa.

3. (2018 – CESGRANRIO – Petrobras – Analista de Sistemas Júnior – Processos de Negócio)

Ao construir um modelo de dados para um data warehouse de sua empresa, um desenvolvedor viu-se às voltas com três tabelas relacionais: venda, cliente e vendedor.

Ao fazer uma transformação para o modelo estrela, ele deve organizar:

a) venda, como tabela fato; cliente e vendedor, como tabelas dimensão b) cliente e vendedor, como tabelas fato; venda, como tabela dimensão c) cliente, como tabela fato; venda e vendedor, como tabelas dimensão d) vendedor e venda, como tabelas fato; cliente, como tabela dimensão e) vendedor, como tabela fato; cliente e venda, como tabelas dimensão

Page 12: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br12

4. (2017 – IBFC – TJ-PE – Analista Judiciário – Analista de Sistemas)

Numa aplicação que necessita de Data Warehouse uma das fases mais críticas é a forma pela qual os dados são efetivamente carregados ou introduzidos em um Data Warehouse. As ferra-mentas de software cuja função é apoiar essa atividade são conhecidas pela sigla em inglês:

a) OLAP b) SQL c) ETL d) BI e) OLTP

5. (2017 – IBFC – TJ-PE – Técnico Judiciário – Programador de Computador)

Ferramentas de software cuja função é a extração de dados de diversos sistemas, transforma-ção desses dados conforme regras de negócios e por fim o carregamento dos dados geralmente para um Data Mart e/ou Data Warehouse são chamados pela sigla, em inglês:

a) DTB – Draw Transform Buren b) ETL – Extract Transform Load c) ECB – Extract Convert Buren d) DCL – Draw Convert Load e) ETB – Extract Transform Buren

6. (2017 – UPENET/IAUPE – UPE – Analista de Sistemas – Banco de Dados)

O modelo dimensional de um data warehouse em que cada dimensão se divide em várias ou-tras subdimensões é denominado de

a) Floco de neve. b) Estrela. c) Barramento. d) Árvore. e) Anel.

7. (2017 – UPENET/IAUPE – UPE – Analista de Sistemas – Engenharia de Software)

O modelo dimensional de um data warehouse, no qual todas as tabelas relacionam-se dire-tamente com a tabela de fatos, de forma que as tabelas dimensionais devem conter todas as descrições que são necessárias para se definir uma classe, é denominado de

a) Floco de neve. b) Estrela. c) Barramento. d) Árvore. e) Anel.

8. (2017 – FCC – DPE-RS – Analista – Banco de Dados)

Um dos modelos mais utilizados no projeto e implementação de um data warehouse é o mo-delo dimensional ou multidimensional. Em um modelo dimensional (composto por uma tabela fato e várias tabelas dimensão),

Page 13: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br 13

Banco do Brasil - TI (Escriturário) – Informática – Márcio Hencke

a) as tabelas dimensão devem conter apenas atributos do tipo literal. b) a tabela fato tem uma cardinalidade de mapeamento de um para um com cada tabela di-

mensão. c) a tabela fato deve conter atributos numéricos, visando proporcionar dados para uma análi-

se de atividades da empresa. d) há um número teórico mínimo de 3 e máximo de 15 tabelas dimensão. e) as tabelas dimensão comportam um número máximo teórico de atributos.

9. (2017 – FADESP – COSANPA – Analista de Sistema)

As etapas de carregamento dos dados em um DataWarehousing (DW) são

a)

b)

c)

d)

10. (2017 – Quadrix – CFO-DF – Analista de Desenvolvimento de Sistema de Informação)

Julgue o item seguinte quanto a sistemas de suporte à decisão e a banco de dados distribuído. Os sistemas de suporte à decisão utilizam uma coleção de dados relativos a uma empresa. A essa coleção dá-se o nome de Data Warehouse.

( ) Certo   ( ) Errado

11. (2017 – FUNDEP (Gestão de Concursos) – CRM – MG – Analista de Sistema)

Uma funcionalidade típica em um sistema de Data Warehouse permite a visualização dos da-dos em várias dimensões diferentes. Assinale a alternativa que apresenta a funcionalidade pré--programada que permite níveis diferentes de detalhe dos dados não revelados.

a) Roll-up b) Drill-down c) Pivô d) Slice

Page 14: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br14

12. (2017 – FCC – TST – Analista Judiciário – Análise de Sistemas)

Hipoteticamente, um Analista de Sistemas, trabalhando no Tribunal Superior do Trabalho − TST, se deparou com as seguintes questões:

1. Como o número de processos trabalhistas deste trimestre se compara com o número de pro-cessos de um ano atrás?

2. O que se pode prever para o próximo trimestre com relação ao número de processos traba-lhistas?

3. Qual é a tendência do número de processos, medida pela variação percentual?

4. Quem é provável que faça acordo trabalhista nos próximos seis meses?

5. Quais são as características dos casos prováveis de acordos trabalhistas?

Considerando que o Tribunal utiliza o sistema gerenciador de banco de dados Oracle, para res-ponder as perguntas, o Analista achou adequado o auxílio de dois recursos, cujas descrições encontram-se abaixo:

I – Fornece dados resumidos e gera cálculos ricos, adequado para ajudar a responder as ques-tões 1, 2 e 3.

II – Descobre padrões ocultos em dados, operando em nível detalhado, adequado para ajudar a responder as questões 4 e 5.

Os recursos para resolver os problemas de análise de dados referentes às questões apresenta-das, que são descritos em I e II são, correta e respectivamente,

a) OLAP e Data Mining. b) ETL e ROLAP. c) Data Mining e SAP R/1. d) OLTP e OLAP. e) MOLAP e OLTP.

13. (2017 – IBFC – TJ-PE – Técnico Judiciário – Programador de Computador)

A equipe de sistema está mexendo em um modelo OLAP para ver diferentes níveis de detalhe. Existem várias operações que podem ser realizadas nesse modelo. Identifique a única alternati-va que apresenta uma operação que NÃO seja possível, ou existente:

a) Roll Up b) Slice c) Dice d) Shut Up e) Drill Down

14. (2017 – PUC-PR – TJ-MS – Técnico de Nível Superior – Analista de Banco de Dados)

A tecnologia OLAP (Online Analytical Processing) provê suporte a banco de dados multidimen-sionais, usado em soluções de apoio à decisão e Business Intelligence (BI), como o Microsoft SQL Server Analytical Services (SSAS), que fornece os dados analíticos para relatórios de negó-cios e aplicativos cliente, tais como Excel e relatórios do Reporting Services.

Page 15: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br 15

Banco do Brasil - TI (Escriturário) – Informática – Márcio Hencke

Com relação às diferentes características e ferramentas próprias da OLAP, analise as assertivas a seguir.

I – Na modelagem usada para representar dados multidimensionais, o diagrama do esquema estrela tem em seu centro uma tabela fato vinculada a várias tabelas dimensões, dispostas ra-dialmente. A tabela fato armazena dados descritivos, enquanto as tabelas dimensões armaze-nam dados numéricos.

II – Dentre as operações suportadas no OLAP, estão os operadores de cubos de dados: slice, que seleciona um subconjunto de dimensões; dice, que seleciona um subconjunto do cubo ori-ginal; e drill-down, que retorna detalhes de uma dimensão.

III – Uma instância do Microsoft SQL Server Analysis Services (SSAS) é executada em bancos de dados tabulares, bancos de dados multidimensionais, ou em ambos.

IV – O processo de mineração de dados (datamining) permite descobrir padrões implícitos nos dados armazenados em datawarehouse, com o objetivo de usar tais padrões para vantagens competitivas em negócios.

Estão CORRETAS apenas as assertivas:

a) III e IV. b) I, II e III. c) II e IV. d) I e IV. e) II, III e IV.

15. (2017 – PUC-PR – TJ-MS – Técnico de Nível Superior – Analista de Banco de Dados)

Os dados para suporte à decisão são conceitualmente diferentes dos dados usados nos bancos de dados para processamento de transações. Esses últimos, também conhecidos como banco de dados operacionais, trabalham com dados pormenorizados, próprios para tratar questões como rastrear pedidos, resolver reclamações de cliente, atender às necessidades dos funcio-nários, etc. Em contraposição, os bancos para suporte à decisão, são estruturados a partir da transformação dos dados dos bancos operacionais, com o objetivo de facilitar a integralização dos diferentes processos de negócios, mantendo o desempenho de acesso.

Um modelo de dados Multidimensional é muito adequado à representação de dados e às ope-rações próprias ao processamento de suporte à decisão. Com relação aos recursos e técnicas característica a dados multidimensionais, assinale a afirmativa CORRETA.

a) O ROLAP (Relational OLAP) é uma alternativa proposta pelos fornecedores de SGBDs rela-cionais, que ampliaram seus produtos para oferecer uma arquitetura em que o armazena-mento de dados multidimensionais é feito em bases de dados relacionais, o que permite utilizar linguagem SLQ para consulta, facilitando a construção e acesso aos datawarehou-ses, bem como a otimização dessas consultas, o que proporciona bom desempenho a esse tipo de solução.

b) Os dados de movimentação dos sistemas-fonte oferecem a base para atualizar um datawa-rehouse, afetando fatos e/ou dimensões. Os dados de movimentação ditos cooperativos envolvem a captura das atividades nos sistemas-fonte a partir dos registros de log, cuja disponibilidade é imediata. Contudo, é necessária uma quantidade de processamento sig-nificativa para extrair dados úteis.

Page 16: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br16

c) Dois exemplos de problemas comuns relativos à qualidade dos dados, que devem ser trata-dos nas fases de propagação e notificação do fluxo de trabalho para a manutenção de um datawarehouse, são do tipo transação orfanada – em que elementos importantes da tran-sação são perdidos – e dados conflitantes – em que diferentes fontes apresentam conflito de dados, como endereços diferentes para o mesmo cliente.

d) No processo de renovação de um datawarehouse, a diferença de tempo de carga é a dife-rença entre a ocorrência de um evento no mundo real e seu armazenamento em um banco relacional (tempo de transação), para, na sequência, ocorrer o armazenamento do evento em um datawarehouse.

e) A tecnologia de armazenamento MOLAP (Multidimensional OLAP) permite a manipulação direta de cubos armazenados pré-calculados – com características exclusivas como esparsi-dade e agregação complexa, o que permite desempenho de consulta melhor do que as de abordagens concorrentes.

16. (2018 – FCC – DPE-AM – Analista em Gestão Especializado de Defensoria – Analista de Banco de Dados)

As ferramentas OLAP compreendem diversas formas de organização dos dados de um data wa-rehouse. Dentre tais formas de organização, no tipo de ferramenta OLAP denominado

a) ROLAP, os cubos pré-calculados são armazenados no servidor do ambiente de data wa-rehouse.

b) DOLAP, as consultas são feitas diretamente no modelo dimensional do data warehouse.c) MOLAP, as consultas são feitas diretamente no modelo dimensional do data warehouse. d) DOLAP, os cubos pré-calculados são armazenados no servidor do ambiente de data wa-

rehouse. e) MOLAP, os cubos pré-calculados são armazenados no servidor do ambiente de data wa-

rehouse.

17. (2017 – UPENET/IAUPE – UPE – Analista de Sistemas – Banco de Dados)

Sobre business intelligence, analise as afirmativas abaixo:

I – Uma das etapas da abordagem OLAP diz respeito às ferramentas que são utilizadas para ex-tração dos dados do repositório para posterior inserção no datawarehouse.

II – A predição de eventos é uma das propriedades da mineração de dados.

III – O data warehouse é um banco de dados que contém dados voláteis sumarizados de várias formas para respostas rápidas a consultas.

Está CORRETO o que se afirma em

a) III, apenas. b) I e III, apenas. c) II e III, apenas. d) I, II e III. e) II, apenas.

Page 17: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br 17

Banco do Brasil - TI (Escriturário) – Informática – Márcio Hencke

18. (2017 – IBFC – EMBASA – Prova: Analista de Tecnologia da Informação (Desenvolvimento)

Assinale a alternativa que complete correta e respectivamente as lacunas da seguinte frase:

“A tecnologia OLAP permite uma análise _________e __________, neste tipo de análise, os dados são modelados em uma estrutura conhecida como ____________”:

a) dinâmica – multidimensional – cubo b) estática – multidimensional – quadrado c) estática – unidimensional – cubo d) dinâmica – unidimensional – quadrado

19. (2017 – FGV – IBGE – Analista Censitário – Análise de Sistemas – Desenvolvimento de Aplica-ções)

Observe as seguintes figuras que ilustram uma operação OLAP em que a exibição dos dados foi modificada da Visão A para a Visão B.

Para alterar a perspectiva de análise dos dados da Visão A para a Visão B, deve-se executar a operação OLAP:

a) Drill Down; b) Roll Up; c) Slice; d) Pivot; e) Dice.

Page 18: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br18

20. (2017 – FGV – IBGE – Analista Censitário – Análise de Sistemas – Desenvolvimento de Aplica-ções)

Ambientes OLTP (Online Transaction Processing) se diferem de ambientes OLAP (Online Analyti-cal Processing), pois ambientes OLTP reúnem sistemas de informação que possuem as seguin-tes características:

a) os dados devem estar integrados e resumidos; b) o Banco de Dados é multidimensional; c) suportam operações DML, como UPDATE e DELETE; d ransações envolvem a análise massiva de dados; e) apoiam decisões no nível estratégico.

21. (2017 – FEPESE – JUCESC – Prova: Analista de Informática)

Sobre conceitos e ferramentas OLAP, considere as seguintes afirmativas:

1. HOLAP refere-se às ferramentas OLAP híbridas, utilizando técnicas ou gerenciadores de ban-co de dados relacionais e multidimensionais.

2. ROLAP refere-se às implementações OLAP baseadas em gerenciadores de bancos de dados relacionais.

3. MOLAP refere-se às implementações OLAP baseadas em gerenciadores de bancos de dados multidimensionais.

Assinale a alternativa que indica todas as afirmativas corretas.

a) É correta apenas a afirmativa 2. b) São corretas apenas as afirmativas 1 e 2. c) São corretas apenas as afirmativas 1 e 3. d) São corretas apenas as afirmativas 2 e 3. e) São corretas as afirmativas 1, 2 e 3.

22. (2017 – FEPESE – JUCESC – Analista de Informática)

No contexto de data warehouse e ferramentas OLAP, associe os seguintes conceitos às respec-tivas afirmativas:

Coluna 1 Conceitos

1. Slice

2. Dice

3. Roll up

4. Pivot

Coluna 2 Descrição

( ) Permite rotacionar um cubo de modo a visualizar os dados sob diferentes faces, modifi-cando a orientação dimensional do cubo.

( ) Produz um subcubo através da seleção de um subconjunto de atributos de múltiplas di-mensões.

Page 19: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br 19

Banco do Brasil - TI (Escriturário) – Informática – Márcio Hencke

( ) Produz um subcubo através da seleção de uma dimensão em detrimento de outras.

( ) Realiza operações de agregação em um cubo de dados.

Assinale a alternativa que indica a sequência correta, de cima para baixo.

a) 1 • 4 • 2 • 3 b) 1 • 4 • 3 • 2 c) 3 • 2 • 1 • 4 d) 4 • 1 • 2 • 3 e) 4 • 2 • 1 • 3

23. (2017 – IESES – CEGÁS – Analista de Gestão – Analista de Sistemas)

Assinale a alternativa correta para a conceituação de OLAP:

a) Trata-se de estruturas de dados voltadas unicamente para o processamento de dados es-tratégicos organizacionais.

b) Trata-se de um modelo de recuperação de informações para dado aberto conectados. c) Trata-se de um conjunto de rotinas e procedimentos que permitem a atualização de banco

de dados. d) Trata-se de um tipo de processamento analítico sobre um deposito de dados histórico vol-

tado para processos de gerenciamento e tomada de decisão. Codd et al (1993).

24. (2017 – CONSULPLAN – TRF – 2ª REGIÃO – Prova: Analista Judiciário – Informática Desenvol-vimento )

O cubo de uma estrutura OLAP (Online Analytical Processing) armazena diversas informações, permitindo várias combinações entre elas. Esse tipo de organização da informação permite ao usuário uma flexibilidade em observar os dados a partir de diferentes perspectivas e em di-ferentes níveis de detalhe, resultando na extração de várias formas de visões sobre o mesmo tema. Os dados são organizados em múltiplas dimensões e cada uma contém múltiplos níveis de abstração. Esses níveis são, ainda, definidos pelo conceito de hierarquia. As ferramentas OLAP podem ser implementadas de diversas formas, como em um Data Warehouse implemen-tado com banco de dados relacional ou um banco de dados multidimensional especializado em Sistema de Informações Geográficas. Nessas abordagens nos referimos às arquiteturas:

a) HOLAP e DOLAP. b) MOLAP e SOLAP. c) HOLAP e WOLAP. d) DOLAP e WOLAP

25. (2017 – CONSULPLAN – TRF – 2ª REGIÃO – Prova: Analista Judiciário – Informática Desenvol-vimento)

OLAP (Online Analytical Processing) é um conceito de interface com o usuário, que disponibiliza uma estrutura multidimensional, permitindo analisá-lo profundamente em diversos ângulos. As funções básicas do OLAP são: visualização multidimensional dos dados, exploração, rotação, entre outros. Com relação às operações OLAP, analise as afirmativas a seguir.

I – Pivot – executa uma operação de visualização rotacional dos eixos de um determinado cubo, mudando o eixo de visualização.

Page 20: Informática – Parte 6 Prof. Márcio Hunecke · caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no Servidor. MOLAP –

www.acasadoconcurseiro.com.br20

II – Dice – executa uma operação de seleção em duas ou mais dimensões.

III – Drill Across – visualização múltipla em uma única tela, alternar linhas e colunas, sendo que todos os valores totalizados serão recalculados.

Está(ão) correta(s) apenas a(s) afirmativa(s)

a) l. b) I e II. c) I e III. d) II e III.

26. (2018 – CESGRANRIO – Petrobras – Prova: Analista de Sistemas Júnior – Processos de Negócio)

A principal definição de Big Data parte de três características, conhecidas como 3 V do Big Data, a saber: velocidade, variedade e volume. O termo velocidade refere-se, principalmente, à

a) necessidade das aplicações de gerar respostas rapidamente, a partir de grandes massas de dados.

b) existência de um alto fluxo de dados na entrada. c) necessidade de gerar aplicações rapidamente, em função da demanda do negócio.d) importância da facilidade de manipular cubos de visualização de dados, rapidamente.e) rapidez com que os dados se tornam inválidos com o tempo.

27. (2018 – CESGRANRIO – Petrobras – Prova: Analista de Sistemas Júnior – Processos de Negócio)

Em relação ao uso de modelos de dados em data warehouses, Inmon (2005) declara que o mo-delo de dados por trás do modelo relacional é em um nível razoavelmente alto de abstração, enquanto o modelo de processo por trás do modelo multidimensional não é de nenhuma for-ma abstrato. Nesse contexto, o modelo

a) multidimensional deve ser adotado também para as aplicações de processamento de tran-sações da empresa, pela sua forma otimizada.

b) multidimensional é altamente eficiente, podendo, por meio de um modelo único, servir a todas as comunidades de usuários dentro de uma empresa.

c) relacional é adequado para o acesso de um usuário ou comunidade de usuários únicos, por causa de suas otimizações inerentes.

d) relacional é altamente flexível, mas não tem o desempenho otimizado para nenhum usuá-rio.

e) relacional é mais adequado aos data marts, nos níveis de departamento ou subdeparta-mento, onde os dados têm escopo menor.

Gabarito: 1. C 2. B 3. A 4. C 5. B 6. A 7. B 8. C 9. A 10. Certo 11. B 12. A 13. D 14. C 15. E 16. E  17. E 18. A 19. D 20. C 21. E 22. E 23. D 24. B 25. B 26. B 27. D