REPRODUCIBILIDAD EN LOS FLUJOS DE TRABAJO BIOINFORMÁTICOS APLICADOS A GENÓMICA Y ONCOLOGÍA CLÍNICA
Reproducibility in bioinformatics workflows applied to genomics and clinical oncology
DOI:
https://doi.org/10.47187/cssn.Vol16.Iss2.453Palabras clave:
bioinformática, genómica, oncología, reproducibilidad, SnakemakeResumen
Introducción: El incremento exponencial de datos genómicos en la oncología clínica ha posicionado a la reproducibilidad bioinformática como un pilar crítico para la validez de diagnósticos y terapias personalizadas. No obstante, la variabilidad en pipelines y la falta de estándares técnicos generan una crisis de consistencia en los resultados. Objetivo: Analizar los flujos de trabajo bioinformáticos aplicados a genómica oncológica, evaluando la capacidad de herramientas como Snakemake, Onkopipe e iCOMIC para garantizar resultados clínicos reproducibles. Metodología: Se realizó una revisión integrativa siguiendo la declaración PRISMA 2020. La búsqueda se ejecutó en Pubmed y ScienceDirect. De 124 registros identificados, 38 estudios cumplieron con los criterios de elegibilidad y fueron analizados mediante una síntesis cualitativa y temática. Resultados: Se identificó una crisis de reproducibilidad ligada a la ineficiente documentación de parámetros. De los estudios analizados, 18 describieron prácticas explícitas: el 88,8% (n=16) destacó la documentación detallada, el 77,7% (n=14) el uso de gestores de flujo como Snakemake y el 61,1% (n=11) la implementación de contenedores y control de versiones. Se evaluaron 12 flujos específicos, donde el uso de Snakemake demostró optimizar la trazabilidad y escalabilidad del diagnóstico molecular. Conclusiones: La adopción rigurosa de gestores de flujos automatizados y la estandarización de la documentación técnica son indispensables para transitar de la bioinformación investigativa a una genómica clínica auditable y confiable.
Descargas
Citas
1. Canzoneri R, Lacunza E, Abba MC. Genómica y bioinformática como pilares de la medicina de precisión en oncología. Medicina (B Aires). 2019;79(6/1):587–92.
2. Del Pozo A. Bioinformática y gestión de datos ómicos en diagnóstico genético. An Pediatr (Engl Ed). 2025;103:504013. doi:10.1016/j. anpedi.2025.504013
3. Yang J, Beißbarth T, Dönitz J. Onkopipe: A Snakemake Based DNA-Sequencing Pipeline for Clinical Variant Analysis in Precision Medicine. Stud Health Technol Inform [Internet]. el 12 de septiembre de 2023 [citado el 1 de noviembre de 2025];307:60–8. Disponible en: https:// pubmed.ncbi.nlm.nih.gov/37697838/
4. Fernandez Isern G. Herramientas informáticas para la bioinformática [Internet]. Fundació Universitat Oberta de Catalunya (FUOC); 2023 [citado 2025 Nov 1]. Available from: https://eines-informatiques.recursos.uoc.edu/ workflows/es/
5. Yang J. An automated data integration platform for interpreting genomic data and reporting treatment options in molecular tumor boards [Internet]. 2024 [citado 2025 Nov 1]. Available from: https://ediss.uni-goettingen.de/handle/11858/15432
6. Anilkumar Sithara A, Maripuri DP, Moorthy K, Amirtha Ganesh SS, Philip P, Banerjee S, et al. iCOMIC: a graphical interface-driven bioinformatics pipeline for analyzing cancer omics data. NAR Genom Bioinform. 2022;4(3).
Available from: https://pubmed.ncbi.nlm.nih. gov/35899080/
7. Ziemann M, Poulain P, Bora A. The five pillars of computational reproducibility: bioinformatics and beyond. Brief Bioinform. 2023;24(6):bbad375. doi:10.1093/bib/bbad375
8. Flier JS. The Problem of Irreproducible Bioscience Research. Perspect Biol Med [Internet]. el 1 de junio de 2022 [citado el 1 de noviembre de 2025];65(3):373–95. Disponible en: https://muse.jhu.edu/pub/1/article/863666
9. Gundersen OE. The fundamental principles of reproducibility. Philos Trans A Math Phys Eng Sci. 2021;379(2197). doi:10.1098/
rsta.2020.0210
10. Kim YM, Poline JB, Dumas G. Experimenting with reproducibility: a case study of robustness in bioinformatics. Gigascience. 2018;7(7):giy077. doi:10.1093/gigascience/giy077
11. Ziemann M, Poulain P, Bora A. The five pillars of computational reproducibility: bioinformatics and beyond. Brief Bioinform [Internet]. el 22 de septiembre de 2023 [citado el 1 de noviembre de 2025];24(6):1–13. Disponible en: https:// dx.doi.org/10.1093/bib/bbad375
12. Mattevi S, Mazzarotto F, Martini P. Allelespecific expression analysis: pipelines, applications, challenges, and unmet needs. Comput Biol Med. 2025;196:110890
13. Kadri S, Sboner A, Sigaras A, Roy S. Containers in bioinformatics: applications, practical considerations, and best practices in molecular pathology. J Mol Diagn. 2022;24(5):442–54.
14. Vallet N, Michonneau D, Tournier S. Toward practical transparent verifiable and long-term reproducible research using Guix. Sci Data. 2022;9(1):1–9.
15. Git Project. Git documentation [Internet]. [citado 2025 Nov 1]. Available from: https:// git-scm.com/docs/gi
16. Cadwallader L, Gabhann FM, Papin J, Pitzer VE. Advancing code sharing in the computational biology community. PLoS Comput Biol.
2022;18(6):e1010193
17. Granger BE, Perez F. Jupyter: thinking and storytelling with code and data. Comput Sci Eng. 2021;23(2):7–14.
18. O’Brien J, Mitchell C, Auerbach S, Doonan L, Ewald J, Everett L, et al. Bioinformatic workflows for deriving transcriptomic points of departure: current status, data gaps, and research priorities. Toxicol Sci. 2025;203(2):147–59.
19. Mölder F, Jablonski KP, Letcher B, Hall MB, van Dyken PC, Tomkins-Tinch CH, et al. Sustainable data analysis with Snakemake. F1000Res. 2025;10:33.
20. Snakemake developers. Snakemake documentation [Internet]. [citado 2025 Nov 2]. Available from: https://snakemake. readthedocs.io/en/stable/index.html
21. Baykal PI, Łabaj PP, Markowetz F, Schriml LM, Stekhoven DJ, Mangul S, et al. Genomic reproducibility in the bioinformatics era. Genome Biol. 2024;25(1):1–15.
22. Chen S, Zhou Y, Chen Y, Gu J. fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics. 2018;34(17):i884–90.
23. Broad Institute. Picard tools [Internet]. [citado 2025 Nov 2]. Available from: https:// broadinstitute.github.io/picard/
24. Rapti M, Zouaghi Y, Meylan J, Ranza E, Antonarakis SE, Santoni FA. CoverageMaster: comprehensive CNV detection and visualization from NGS short reads for genetic medicine applications. Brief Bioinform. 2022;23(2):bbac049.
25. Manolio TA, Fowler DM, Starita LM, Haendel MA, MacArthur DG, Biesecker LG, et al. Building bridges between basic and clinical genomic research. Cell. 2017;169(1):6–12.
26. Dodani DD, Talhouk A. Assessing the reproducibility crisis in vaginal microbiome studies for clinical applications in endometrial cancer. Clin Cancer Res. 2024;30(5 Suppl):A023.
27. Tang S, Borlak J. Genomics of human NAFLD: lack of data reproducibility and high interpatient variability in drug target expression
as major causes of drug failures. Hepatology. 2024;80(4):901–15.
28. Pan B, Ren L, Onuchic V, Guan M, Kusko R, Bruinsma S, et al. Assessing reproducibility of inherited variants detected with short-read whole genome sequencing. Genome Biol. 2022;23(1):2.
29. Baykal PI, Łabaj PP, Markowetz F, Schriml LM, Stekhoven DJ, Mangul S, et al. Genomic reproducibility in the bioinformatics era. Genome Biol [Internet]. el 9 de agosto de 2024 [citado el 9 de noviembre de 2025];25(1):213. Disponible en: https://genomebiology. biomedcentral.com/articles/10.1186/ s13059-024-03343-2
30. Keenum I, Jackson SA, Eloe-Fadrosh E, Schriml LM. A standards perspective on genomic data reusability and reproducibility. Front Bioinform. 2025;5:1572937.
31. Cokelaer T, Cohen-Boulakia S, Lemoine F. Reprohackathons: promoting reproducibility in bioinformatics through training. Bioinformatics. 2023;39(Suppl_1):i11–20.
32. Kulkarni N, Alessandrì L, Panero R, Arigoni M, Olivero M, Ferrero G, et al. Reproducible bioinformatics project: a community for reproducible bioinformatics analysis pipelines. BMC Bioinform. 2018;19(10):5.
Publicado
Cómo citar
Número
Sección
Licencia

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.





