Ano: 2019 Banca: UFPR Órgão: ITAIPU Prova: Pesquisador - Gestão da Informação
Em sistemas de Recuperação de Informação, os termos de indexação podem ser extraídos diretamente do texto dos documentos, fornecendo uma visão lógica dos documentos. Assinale a alternativa que apresenta corretamente uma das operações realizadas para obter as palavras-chaves.
A
No processo de reconhecimento da estrutura, ocorre a análise léxica e a remoção de palavras sem semântica associada.
B
O processo de quebra do texto em palavras (tokenização) é dependente da stoplist, um dicionário próprio aplicado à separação das palavras.
C
A classificação de grupos nominais visa a identificação dos verbos e remoção das demais palavras, através de listas de palavras, etiquetadores automáticos e um thesaurus da língua ou do domínio.
D
Acentos, espaçamento e demais símbolos são delimitadores considerados naturais no processo de stemming.
E
O processo de stemming consiste em remover os afixos, preservando o radical e possibilitando o casamento entre variações de uma mesma palavra.