Questões

Total de Questões Encontradas: 32

Dois funcionários de uma empresa de crédito discutiam sobre quais algoritmos deveriam usar para ajudar a classificar seus clientes como bons ou maus pagadores. A empresa possui, para todos os empréstimos feitos no passado, um registro formado pelo conjunto de informações pessoais sobre o cliente e de como era composta a dívida inicial. Todos esses registros tinham classificações de bons ou maus pagadores, de acordo com o perfil de pagamento dos clientes. A partir desses dados, os funcionários querem construir um modelo, por meio de aprendizado de máquina, que classifique os novos clientes, que serão descritos por registros com o mesmo formato. A melhor opção, nesse caso, é usar um algoritmo
A
supervisionado, como SVM
B
supervisionado, como K-means
C
não supervisionado, como regressão linear 
D
não supervisionado, como árvores de decisão
E
semi-supervisionado, como redes bayesianas
Ano: 2017 Banca: FEPESE Órgão: CIASC Prova: Analista - Analista de Sistemas (Desenvolvedor)
Analise as afirmativas abaixo com relação ao assunto Análise de Agrupamento (Clustering).
1. Análise de agrupamento (Clustering) é o nome dado para o grupo de técnicas cujo propósito consiste em separar objetos em grupos, baseando-se nas características que estes objetos possuem. O conceito básico consiste em colocar em um mesmo grupo objetos que sejam similares de acordo com algum critério pré-determinado.
2. O agrupamento hierárquico avança sucessivamente, tanto juntando pequenos grupos em maiores, quanto dividindo grandes grupos em menores. O método de agrupamento difere na regra pela qual dois pequenos grupos são unidos ou na forma como um grande é dividido.
3. No método de Encadeamento Completo (Vizinho mais próximo), utiliza-se a distância entre os dois itens mais próximos (vizinhos) como a distância entre dois grupos. Essa regra aglomera itens para formar grupos e os aglomerados resultantes tendem a representar longas “cadeias”.

Assinale a alternativa que indica todas as afirmativas corretas.
A
É correta apenas a afirmativa 2.
B
São corretas apenas as afirmativas 1 e 2.
C
São corretas apenas as afirmativas 1 e 3. 
D
São corretas apenas as afirmativas 2 e 3.
E
São corretas as afirmativas 1, 2 e 3.
Ano: 2017 Banca: FEPESE Órgão: CIASC Prova: Analista - Analista de Sistemas (Desenvolvedor)
Qual técnica de mineração de texto permite agrupar termos ou padrões similares a partir de vários documentos, e pode ser executada de modo top-down ou bottom-up através da aplicação de métodos de hierarquização, distribuição, densidade, entre outros? 
A
Clustering
B
Summarização
C
Contagem de Frequência
D
Recuperação de Informação
E
Extração de Informação
Ano: 2017 Banca: FEPESE Órgão: CIASC Prova: Analista - Analista de Sistemas (Desenvolvedor)
O modelo Estrela (Star) e o modelo Floco de Neve (Snow Flake) são tipos de modelos dimensionais. 
Com relação a esses modelos, assinale a alternativa correta.
A
No modelo Floco de Neve (Snow Flake) todas as tabelas relacionam-se diretamente com a tabela de fatos.
B
No modelo Floco de Neve (Snow Flake), as tabelas dimensionais relacionam-se com a tabela de fatos, mas algumas dimensões relacionam-se apenas entre elas. Isto ocorre para fins de normalização das tabelas dimensionais, visando diminuir o espaço ocupado por essas tabelas.
C
O modelo Estrela (Star) é composto no centro por uma tabela de dimensão, que é rodeada por tabelas de fato, ficando parecido com a forma de uma estrela (origem do nome do modelo).
D
O modelo de dados Estrela (Star) consiste em uma extensão do modelo Floco de Neve (Snow Flake) no qual cada uma das “pontas da estrela” passa a ser o centro de outras estrelas. Isto porque cada tabela de dimensão seria normalizada, “quebrando-se” a tabela original ao longo de hierarquias existentes em seus atributos.
E
O modelo Estrela (Star) reduz o espaço de armazenamento dos dados dimensionais, mas acrescenta várias tabelas ao modelo, deixando-o mais complexo, tornando mais difícil a navegação pelos softwares que utilizarão o banco de dados.
Ano: 2015 Banca: FGV Órgão: TJ-SC Prova: Analista Judiciário - Analista de Sistemas
João trabalha no setor de BI da empresa e recebeu a tarefa de identificar agrupamentos de alunos de uma escola segundo seu desempenho acadêmico. A partir das notas obtidas, João deve formar grupos tal que integrantes de um grupo tenham desempenho similar, e que integrantes de grupos distintos sejam dissimilares. O algoritmo mais apropriado para essa tarefa é:
A
Apriori;
B
decision tree;
C
PageRank;
D
CART;
E
k-means.
No data mining, uma das formas de se obter conhecimento é por meio das Regras de Associação, que buscam eventuais associações entre 2 determinados produtos, um denominado antecedente e o outro, consequente. Uma medida utilizada nesse tipo de regra é denominada ‘suporte’, que representa
A
a fração da população-alvo que satisfaz o antecedente e o consequente.
B
a razão entre o produto antecedente e o consequente.
C
a razão entre o produto consequente e o precedente.
D
o número absoluto da população-alvo que satisfaz o a ntecedente e o consequente.
E
o número absoluto de produtos do tipo antecedente.
Considere uma dada população de eventos ou novos itens que podem ser particionados (segmentados) em conjuntos de elementos similares, tal como, por exemplo, uma população de dados sobre uma doença que pode ser dividida em grupos baseados na similaridade dos efeitos colaterias produzidos. Como um dos modos de descrever o conhecimento descoberto durante a data mining este é chamado de
A
associação.
B
otimização.
C
classificação.
D
clustering.
E
temporização. 
Uma das abordagens de mining define que, se uma regra de classificação é considerada uma função sobre variáveis que as mapeia em uma classe destino, a regra é chamada 
A
categorização.
B
Apriori.
C
algoritmo genético.
D
regressão.
E
minimização.
No âmbito dos algoritmos associados ao mining, se houver um banco de dados com um número potencial pequeno de conjuntos de itens grandes, isto é, uns poucos milhares, então o suporte para todos eles pode ser testado em uma passagem usando a técnica específica de
A
hierarquização. 
B
partição. 
C
amostragem. 
D
árvore de padrão frequente. 
E
séries temporais. 
A data mining apoia o conhecimento indutivo que pode ser representado por

I. Lógica proposicional.
II. Árvores de decisão.
III. Redes neurais.
IV. Redes semânticas.

Está correto o que consta em
A
I e III, apenas.
B
II e III, apenas.
C
II, III e IV, apenas.
D
I, II e IV, apenas.
E
I, II, III e IV. 
Página 1 de 4