Banco de dadosBanco de dados textuais
- (FGV 2022)
Um analista do TCU gostaria de aplicar um modelo de Latent Dirichlet Allocation (LDA) em um conjunto de textos. A alternativa que melhor descreve o resultado do modelo é:
A) uma lista de tópicos, cada um com um título diferente;
B) uma lista das palavras mais importantes no conjunto de documentos;
C) cada documento é classificado em somente um tópico, onde cada tópico é formado por uma lista de palavras;
D) cada documento possui uma distribuição de probabilidade de pertencer a algum dos tópicos, onde cada tópico é formado por uma lista de palavras e cada palavra pertence a somente um tópico;
E) cada documento possui uma distribuição de probabilidade de pertencer a algum dos tópicos, onde cada tópico é formado por uma distribuição de probabilidade sobre todas as palavras presentes nos documentos.
Vamos para o Anterior: Exercício 24
Tente Este: Exercício 24
Primeiro: Exercício 1
VOLTAR ao índice: Banco de dados