Questões

Total de Questões Encontradas: 82

Ano: 2015 Banca: FGV Órgão: TJ-SC Prova: Analista Judiciário - Analista de Sistemas
João trabalha no setor de BI da empresa e recebeu a tarefa de identificar agrupamentos de alunos de uma escola segundo seu desempenho acadêmico. A partir das notas obtidas, João deve formar grupos tal que integrantes de um grupo tenham desempenho similar, e que integrantes de grupos distintos sejam dissimilares. O algoritmo mais apropriado para essa tarefa é:
A
Apriori;
B
decision tree;
C
PageRank;
D
CART;
E
k-means.
Ano: 2015 Banca: FCC Órgão: TRE-RR Prova: Analista Judiciário - Análise de Sistemas
Os dados de sistemas OLAP se baseiam nas informações contidas nos diversos softwares utilizados pela empresa (ERPs, planilhas, arquivos texto, arquivos XML etc.). Estes sistemas possuem uma camada onde estão os dados originais e outra camada onde estão os dados tratados (um gigantesco repositório de dados sobre assuntos diversos preparados para serem consultados por um sistema OLAP), que chamamos de
A
Data Mining.
B
Online Transactional Database.
C
Data Mart.
D
Datawarehouse.
E
Big Data.
Ano: 2015 Banca: FCC Órgão: CNMP Prova: Analista do CNMP - Desenvolvimento de Sistemas
Em relação às ferramentas de Data Discovery e os fundamentos de Data Mining, é correto afirmar:
A
Data Mining é o processo de descobrir conhecimento em banco de dados, que envolve várias etapas. O KDD – Knowledge Discovery in Database é uma destas etapas, portanto, a mineração de dados é um conceito que abrange o KDD.
B
A etapa de KDD do Data Mining consiste em aplicar técnicas que auxiliem na busca de relações entre os dados. De forma geral, existem três tipos de técnicas: Estatísticas, Exploratórias e Intuitivas. Todas são devidamente experimentadas e validadas para o processo de mineração. 
C
Os dados podem ser não estruturados (bancos de dados, CRM, ERP), estruturados (texto, documentos, arquivos, mídias sociais, cloud) ou uma mistura de ambos (emails, SOA/web services, RSS). As ferramentas de Data Discovery mais completas possuem conectividade para todas essas origens de dados de forma segura e controlada. 
D
Estima-se que, atualmente, em média, 80% de todos os dados disponíveis são do tipo estruturado. Existem diversas ferramentas open source e comerciais de Data Discovery. Dentre as open source está a InfoSphere Data Explorer e entre as comerciais está a Vivisimo da IBM.
E
As ferramentas de Data Mining permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados. Esses tipos de ferramentas podem utilizar técnicas avançadas de computação como redes neurais, algoritmos genéticos e lógica nebulosa, dentre outras. 
No data mining, uma das formas de se obter conhecimento é por meio das Regras de Associação, que buscam eventuais associações entre 2 determinados produtos, um denominado antecedente e o outro, consequente. Uma medida utilizada nesse tipo de regra é denominada ‘suporte’, que representa
A
a fração da população-alvo que satisfaz o antecedente e o consequente.
B
a razão entre o produto antecedente e o consequente.
C
a razão entre o produto consequente e o precedente.
D
o número absoluto da população-alvo que satisfaz o a ntecedente e o consequente.
E
o número absoluto de produtos do tipo antecedente.
Considere uma dada população de eventos ou novos itens que podem ser particionados (segmentados) em conjuntos de elementos similares, tal como, por exemplo, uma população de dados sobre uma doença que pode ser dividida em grupos baseados na similaridade dos efeitos colaterias produzidos. Como um dos modos de descrever o conhecimento descoberto durante a data mining este é chamado de
A
associação.
B
otimização.
C
classificação.
D
clustering.
E
temporização. 
Uma das abordagens de mining define que, se uma regra de classificação é considerada uma função sobre variáveis que as mapeia em uma classe destino, a regra é chamada 
A
categorização.
B
Apriori.
C
algoritmo genético.
D
regressão.
E
minimização.
No âmbito dos algoritmos associados ao mining, se houver um banco de dados com um número potencial pequeno de conjuntos de itens grandes, isto é, uns poucos milhares, então o suporte para todos eles pode ser testado em uma passagem usando a técnica específica de
A
hierarquização. 
B
partição. 
C
amostragem. 
D
árvore de padrão frequente. 
E
séries temporais. 
A data mining apoia o conhecimento indutivo que pode ser representado por

I. Lógica proposicional.
II. Árvores de decisão.
III. Redes neurais.
IV. Redes semânticas.

Está correto o que consta em
A
I e III, apenas.
B
II e III, apenas.
C
II, III e IV, apenas.
D
I, II e IV, apenas.
E
I, II, III e IV. 
NÃO é um objetivo da mineração de dados (mining), na visão dos diversos autores, 
A
garantir a não redundância nos bancos transacionais. 
B
conhecer o comportamento de certos atributos no futuro.
C
possibilitar a análise de determinados padrões de eventos. 
D
categorizar perfis individuais ou coletivos de interesse comercial. 
E
apoiar a otimização do uso de recursos limitados e/ou maximizar variáveis de resultado para a empresa.
Os sistemas de apoio à decisão são sistemas que ajudam na análise de informações do negócio. Os Banco de Dados de apoio à decisão exibem certas características especiais. NÃO é uma característica adicional dos Bancos de Dados de apoio à decisão.
A
Em geral, a integridade é uma preocupação (supõe-se que os dados estão corretos quando são carregados pela primeira vez e não são atualizados subsequentemente).
B
As colunas tendem a ser usadas em combinação.
C
As chaves frequentemente incluem um componente temporal.
D
O Banco de Dados tende a estar fortemente indexado.
E
O Banco de Dados envolve frequentemente vários tipos de redundância controlada.  
Página 3 de 9