Lexicometric analysis with IRAMUTEQ: methodological recommendations for textual corpus preparation
DOI:
https://doi.org/10.9789/2175-5361.rpcfo.v18.14805Keywords:
Qualitative Research, Data Mining, Natural Language Processing, Research Methods, NursingAbstract
Objetivo: Sistematizar recomendaciones metodológicas para la preparación y organización de corpus textual destinado al análisis lexicométrico en investigaciones cualitativas en el área de la salud.
Método: Se trata de un estudio metodológico, de naturaleza teórico-aplicada, fundamentado en la literatura científica sobre análisis de datos cualitativos y en el uso del software IRAMUTEQ. Se sistematizaron procedimientos relacionados con la organización del corpus, estandarización lingüística, definición de variables analíticas, segmentación textual y estructuración del material para procesamiento computacional.
Resultados: Se describieron etapas operativas y recomendaciones metodológicas para la preparación del corpus textual, incluyendo estandarización léxica, organización de las unidades de contexto inicial, definición de variables y codificación del material textual, con el fin de garantizar mayor rigor metodológico, trazabilidad y reproducibilidad de los análisis lexicométricos.
Conclusión: La preparación del corpus textual constituye una etapa metodológica fundamental para el análisis lexicométrico en IRAMUTEQ, influyendo directamente en la calidad, estabilidad y confiabilidad de los resultados obtenidos, y debe ser comprendida como una etapa estructurante de la investigación cualitativa apoyada por software.
DESCRIPTORES: Investigación Cualitativa; Minería de Datos; Procesamiento del Lenguaje Natural; Enfermería; Métodos de Investigación.
Downloads
References
Bardin L. Análise de conteúdo. Lisboa: Edições 70; 1977.
Braun V, Clarke V. Using thematic analysis in psychology. Qual Res Psychol. [Internet]. 2006 [cited 2026 Apr 10];3(2). Available from: https://doi.org/10.1191/1478088706qp063oa.
Gibbs GR. The analysis of qualitative data. London: SAGE Publications; 2012.
Miles MB, Huberman AM, Saldaña J. Qualitative data analysis: a methods sourcebook. 3rd ed. Thousand Oaks: SAGE Publications; 2014.
Camargo BV, Justo AM. IRAMUTEQ: um software gratuito para análise de dados textuais. Temas Psicol. [Internet]. 2013 [acesso em 10 de abril 2026];21(2). Disponível em: https://pepsic.bvsalud.org/.
Mazieri MR, Quoniam L, Reymond D, Cunha KCT. Uso do IRAMUTEQ para análise de conteúdo baseada em classificação hierárquica descendente e análise fatorial de correspondência. Braz J Mark. [Internet]. 2022 [acesso em 10 de abril 2026];21(2). Disponível em: https://www.researchgate.net/.
Rodríguez J, Reguant M, Ortega D. A practical case study of qualitative data analysis with IRAMUTEQ: lexicometric analysis of narratives of bisexual men and women. Rev Investig Educ. [Internet]. 2024 [cited 2026 Apr 10];42(2). Available from: https://doi.org/10.6018/rie.560411.
Chaves MMN, Santos APR, Santos NP, Larocca LM. Use of the software IRAMUTEQ in qualitative research: an experience report. In: Costa AP, Reis LP, Souza FN, Moreira A, editors. Computer supported qualitative research. Cham: Springer; 2017.
Soares SSS, Souza NVDO, Carvalho EC, Varella TCMML, Andrade KBS, Pereira SRM. Ensino do IRAMUTEQ para uso em pesquisas qualitativas segundo vídeos do YouTube: estudo exploratório-descritivo. Rev Esc Enferm USP. [Internet]. 2022 [acesso em 10 de abril de 2026];56:e20210407. Disponível em: https://www.scielo.br/.
Carvalho V, Silva EN, Sousa MS, Sampaio R, Barreto J. IRAMUTEQ analysis of Trastuzumab's public consultation in Brazil. Int J Technol Assess Health Care. [Internet]. 2018 [cited 2026 Apr 10];34(1). Available from: https://doi.org/10.1017/S0266462317004420 .
EQUATOR Network. Enhancing the quality and transparency of health research [Internet]. Oxford: EQUATOR Network; 2023 [cited 2026 Mar 23]. Available from: https://www.equator-network.org/.
Reinert M. Une méthode de classification descendante hiérarchique: application à l’analyse lexicale par contexte. Cah Anal Données. 1983;8(2).
Guimarães CCV. Corpus metodológico de enfermagem para análise lexicométrica (CME-AL): exemplo de corpus textual para uso no software IRAMUTEQ [dataset]. Zenodo [Internet]. 2026 [acesso em 10 de abril 2026]. Disponível em: https://doi.org/10.5281/zenodo.19008125.
Barbosa RO, Oliveira Júnior J, Lugli LC, Peralta DA. Preparação automatizada de corpus textual para pesquisas qualitativas com IRAMUTEQ. Inf Inf. [Internet]. 2025 [acesso em 10 de abril 2026];30(3). Disponível em: https://doi.org/10.5433/1981-8920.2025v30n3p521
Lebart L, Salem A, Berry L. Exploring textual data. Dordrecht: Kluwer Academic Publishers; 1998.
Marchand P, Ratinaud P. L’analyse de similitude appliquée aux corpus textuels. In: Actes des 11èmes Journées internationales d’Analyse statistique des Données Textuelles. Liège, Belgique; 2012.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2026 Revista de Pesquisa Cuidado é Fundamental Online

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
TRANSFER AGREEMENT COPYRIGHT I transfer copyright of the article to the Journal of Care Survey is Fundamental - Online - RPCF, so it is accepted due to electronic publishing. The copyright includes the right to reproduce in whole or in part by any means, distributing that article, including figures, photographs, and any translations. The author can also print and distribute copies of your article, stating that since the rights belong to RPCF. I declare that this manuscript is original and has not been submitted for publication, in whole or in part to other online journals or not, so BMMC in the Annals of scientific events or book chapters.












