Proposta de modelo de recomendação de conteúdo baseado em arquivos de legendas de filmes e séries

Autores

  • Armstrong Gomes Brito Universidade FUMEC
  • Luiz Claudio Gomes Maia Universidade FUMEC

Resumo

A crescente complexidade dos objetos armazenados e o grande volume de dados exigem modelos de recuperação e recomendação cada vez mais sofisticados. O objetivo deste trabalho é propor um modelo de recomendação de conteúdo baseado em arquivos de legendas de filmes e séries. Utilizando a ferramenta Apache Lucene para recuperação da informação, e a ferramenta OGMA, para análise de textos, foi possível propor para o modelo, três etapas distintas: uma pesquisa utilizando palavra-chave, a classificação de filmes e séries por gênero e a identificação de títulos similares. Também é apresentado uma adaptação ao modelo para identificar em cada título um sentimento, denominado análise de sentimentos. Como resultado ressaltamos que a pesquisa por palavras-chave gerou recomendações relevantes, já que proporcionam ao usuário liberdade de pesquisa dentro de um conteúdo específico. Já a classificação por gênero apresentou índice de 73% de acerto em comparação com os gêneros apresentados pelo site IMDb, facilitando a recomendação de conteúdo. A análise de sentimentos demonstrou recomendações com coesão, determinando títulos apropriados para cada sentimento. Por último, a identificação de títulos similares, apresentou resultados primários, trazendo apenas filmes e séries com a mesma temática, sem apresentar nenhum resultado em comum com o site IMDb. Concluiu-se que apesar da enorme dificuldade de ser assertivo na recuperação da informação, existem vantagens em se utilizar os arquivos de legendas para ajudar na composição dos sistemas de recomendação.

Palavras-chave: Recomendação de conteúdo. Recuperação da informação. Recomendação de filmes e séries. Arquivos de legenda. Classificação por gênero. Apache-Lucene. OGMA. Sistemas de recomendação.

Link: http://www.periodicos.ufpb.br/ojs/index.php/itec/article/view/38189/20173

Downloads

Não há dados estatísticos.

Publicado

2018-11-19

Edição

Seção

Resumos de artigos científicos