Use este identificador para citar ou linkar para este item:
https://www.arca.fiocruz.br/handle/icict/61868
Tipo de documento
TeseDireito Autoral
Acesso aberto
Objetivos de Desenvolvimento Sustentável
03 Saúde e Bem-EstarColeções
Metadata
Mostrar registro completo
A REPRESENTAÇÃO TEMÁTICA DE ARTIGOS DA ÁREA DE SAÚDE PÚBLICA EM PORTUGUÊS: UM OLHAR EXPLORATÓRIO DA INDEXAÇÃO AUTOMÁTICA
Linguagem Natural
Coerência Semântica
Artigos Científicos
Saúde Pública
Brasil
Natural Language
Semantic Coherence
Scientific Articles
Public Health
Brazil
Santos, Fatima Cristina Lopes dos | Data do documento:
2023
Autor(es)
Orientador
Afiliação
Fundação Oswaldo Cruz. Instituto de Comunicação e Informação Científica e Tecnológica em Saúde. Rio de Janeiro, RJ, Brasil.
Resumo
Esta tese objetivou verificar o grau de coerência semântica entre a representação temática via linguagem controlada e a indexação automática dos artigos publicados em português na área de saúde pública, com o aporte teórico da mineração de textos. Propôs-se a análise da coerência semântica entre o conteúdo dos artigos científicos selecionados e sua representatividade (palavras-chave e descritores), observando o uso da indexação automática e da linguagem controlada na representação temática dessa informação em saúde. A amostra utilizada na análise foi constituída de 104 textos publicados em português em seis periódicos brasileiros da Coleção Saúde Pública, disponíveis na Scientific Electronic Library - SciELO, publicados no ano de 2020. A pesquisa baseou-se na bibliometria, apoiada no processamento da linguagem natural, com o uso de software para mineração de textos. Trata-se de um estudo exploratório-descritivo, composto por análise quantitativa e qualitativa, que possibilitou a compreensão da forma, estrutura, volume e representação desses textos para a indexação automática dessa produção. O estudo aponta que a coerência dos conteúdos dos artigos estudados com seus termos representativos poderia chegar a um melhor resultado com o uso da indexação automática. O método possibilitou o aumento do quantitativo de termos representativos do conteúdo dos textos, o que é promissor para o campo da recuperação da informação. Foi também possível perceber como esse processo pode colaborar no aprimoramento da representação de conteúdo de artigos na área da saúde pública, apesar de a área analisada possuir um vocabulário controlado
Resumo em Inglês
This thesis aimed to verify the degree of semantic coherence between thematic representation via controlled language and automatic indexing of articles published in Portuguese in the area of public health, with the theoretical support of text mining. It was proposed to analyze the semantic coherence between the content of selected scientific articles and their representativeness (keywords and descriptors), observing the use of automatic indexing and controlled language in the thematic representation of this health information. The sample used in the analysis consisted of 104 texts published in Portuguese in six Brazilian journals of the Public Health Collection, available at the Scientific Electronic Library - SciELO, published in 2020. The research was based on bibliometrics, supported by natural language processing, using text mining software. This is an exploratory-descriptive study, consisting of quantitative and qualitative analysis, which made it possible to understand the form, structure, volume and representation of these texts for the automatic indexing of this production. The study points out that the coherence of the contents of the articles studied could reach a better result with the use of automatic indexing. The method made it possible to increase the number of terms representative of the content of the texts, which is promising for the information retrieval field. It was also possible to see how this process can help improve the representation of the content of articles in the area of public health, despite the area analyzed having a controlled vocabulary
Palavras-chave
Indexação AutomáticaLinguagem Natural
Coerência Semântica
Artigos Científicos
Saúde Pública
Brasil
Palavras-chave em inglês
Automatic IndexingNatural Language
Semantic Coherence
Scientific Articles
Public Health
Brazil
Compartilhar