EstatísticaConhecimentos de estatística
- (FGV 2022)
Um modelo semântico vetorial foi criado com a seguinte definição:
v(w)i = tf(w, di) ∙ idf(w, D)onde v é o vetor correspondente à palavra w, dié o i-ésimo documento da coleção Dde artigos da Wikipédia, ordenados alfabeticamente por título, e tfe idfsão, respectivamente, as funções de frequência de termo e inverso da frequência em documentos.
A alternativa que classifica corretamente o modelo acima descrito e apresenta a razão correta para a classificação é:
A) latente, pois v(w) descreve uma distribuição de tópicos em D ;
B) latente, pois o modelo produz vetores densos;
C) explícito, pois há uma interpretação intrínseca ao modelo para cada dimensão dos vetores;
D) latente, pois o modelo é construído de forma não supervisionada;
E) explícito, pois a informação do modelo é específica a um corpus.
Próximo:
EXERCÍCIOS - Exercício 137
Vamos para o Anterior: Exercício 135
Tente Este: Exercício 89
Primeiro: Exercício 1
VOLTAR ao índice: Estatística