DOI: 10.26820/recimundo/9.(2).abril.2025.458-473
URL: https://recimundo.com/index.php/es/article/view/2657
EDITORIAL: Saberes del Conocimiento
REVISTA: RECIMUNDO
ISSN: 2588-073X
TIPO DE INVESTIGACIÓN: Artículo de revisión
CÓDIGO UNESCO: 32 Ciencias Médicas
PAGINAS: 458-473
Aplicaciones de la IA en el diagnóstico quirúrgico de
enfermedades digestivas. Una revisión sistemática
Applications of ia in the surgical diagnosis of digestive diseases.
A systematic review
Impacto do controlo glicémico rigoroso em pacientes com diabetes tipo
2. Uma revisão sistemática
William Eduardo Plúa Marcillo1; Lissette Jesenia Navas Suárez2; Glenda Magali Vaca Coronel3; Marvi
Alexander Viteri Ruiz4
RECIBIDO: 10/03/2025 ACEPTADO: 19/04/2025 PUBLICADO: 09/06/2025
1. Magíster en Gerencia y Administración de Salud; Especialista en Cirugía General; Magíster en Educación; Doctor en
Ciencias de la Salud; Médico; Universidad de Guayaquil; Guayaquil, Ecuador; william.pluam@ug.edu.ec; https://
orcid.org/0000-0002-7287-6066
2. Médica General; Investigadora Independiente; Guayaquil, Ecuador; lissettenavassuarez@gmail.com; https://orcid.
org/0009-0007-4632-2848
3. Especialista en Pediatría; Diploma Superior en Diseño Curricular por Competencias; Diplomado en Docencia Supe-
rior; Doctor en Medicina y Cirugía;Universidad de Guayaquil; Guayaquil, Ecuador; glenda.vacac@ug.edu.ec;
https://orcid.org/0009-0005-7746-0392
4. Especialista en Salud y Seguridad Ocupacional con Mención en Salud Ocupacional; Licenciado en Enfermería; Pon-
tificia Universidad Católica del Ecuador Sede Esmeraldas; Esmeraldas, Ecuador; mviteri5265@pucese.edu.ec;
https://orcid.org/0009-0002-3021-4301
CORRESPONDENCIA
William Eduardo Plúa Marcillo
william.pluam@ug.edu.ec
Guayaquil, Ecuador
© RECIMUNDO; Editorial Saberes del Conocimiento, 2025
RESUMEN
Antecedentes/Objetivo: Las enfermedades digestivas representan una carga significativa para la salud global. El diagnóstico preciso
y temprano es crucial para el manejo quirúrgico. La inteligencia artificial (IA) ofrece herramientas prometedoras para mejorar esta pre-
cisión. El objetivo de esta revisión sistemática es evaluar la evidencia actual sobre la aplicación de la IA en el diagnóstico quirúrgico de
enfermedades digestivas. Métodos: Se realizaron búsquedas exhaustivas en PubMed, Scopus, Web of Science y Cochrane Library des-
de enero de 2010 hasta mayo de 2025. Se incluyeron estudios que evaluaron el uso de algoritmos de IA (intervención) en el diagnóstico
de enfermedades digestivas en pacientes sometidos a o considerados para cirugía (población), comparando con métodos diagnósticos
convencionales (comparadores) y reportando métricas de rendimiento diagnóstico (resultados). Se consideraron estudios observaciona-
les y experimentales (diseño). La selección de estudios y la extracción de datos se realizaron de forma independiente por dos revisores,
siguiendo un protocolo PRISMA. Resultados: Se incluyeron 25 estudios. Los hallazgos principales demuestran que la IA, particularmente
las redes neuronales convolucionales y los modelos de aprendizaje profundo, exhibe un alto potencial para mejorar la precisión diagnósti-
ca en patologías como el cáncer colorectal, el cáncer gástrico y la enfermedad inflamatoria intestinal, utilizando imágenes endoscópicas
e histopatológicas. Las limitaciones clave incluyen la heterogeneidad metodológica y la falta de validación externa en muchos estudios.
Conclusiones: La IA es una herramienta prometedora para optimizar el diagnóstico quirúrgico de enfermedades digestivas, ofreciendo
mayor precisión y eficiencia. Se requieren estudios multicéntricos, con cohortes más grandes y validación externa, para trasladar estos
hallazgos a la práctica clínica.
Palabras clave: Inteligencia Artificial, Diagnóstico, Enfermedades Gastrointestinales, Cirugía, Revisión Sistemática.
ABSTRACT
Background/Objective: Digestive diseases represent a significant burden on global health. Accurate and early diagnosis is crucial for
surgical management. Artificial intelligence (AI) offers promising tools to improve this accuracy. The objective of this systematic review
is to evaluate the current evidence on the application of AI in the surgical diagnosis of digestive diseases. Methods: Comprehensive
searches were conducted in PubMed, Scopus, Web of Science, and Cochrane Library from January 2010 to May 2025. Studies were
included that evaluated the use of AI algorithms (intervention) in the diagnosis of digestive diseases in patients undergoing or considered
for surgery (population), comparing them with conventional diagnostic methods (comparators) and reporting diagnostic performance me-
trics (outcomes). Observational and experimental studies (design) were considered. Study selection and data extraction were performed
independently by two reviewers, following a PRISMA protocol. Results: Twenty-five studies were included. The main findings demonstrate
that AI, particularly convolutional neural networks and deep learning models, exhibits high potential for improving diagnostic accuracy in
pathologies such as colorectal cancer, gastric cancer, and inflammatory bowel disease, using endoscopic and histopathological images.
Key limitations include methodological heterogeneity and lack of external validation in many studies. Conclusions: AI is a promising tool
for optimizing the surgical diagnosis of digestive diseases, offering greater accuracy and efficiency. Multicenter studies with larger cohorts
and external validation are needed to translate these findings into clinical practice.
Keywords: Artificial Intelligence, Diagnosis, Gastrointestinal Diseases, Surgery, Systematic Review.
RESUMO
Antecedentes/Objetivo: As doenças digestivas representam um fardo significativo para a saúde global. O diagnóstico preciso e precoce
é crucial para o tratamento cirúrgico. A inteligência artificial (IA) oferece ferramentas promissoras para melhorar essa precisão. O objetivo
desta revisão sistemática é avaliar as evidências atuais sobre a aplicação da IA no diagnóstico cirúrgico de doenças digestivas. Méto-
dos: Foram realizadas pesquisas abrangentes no PubMed, Scopus, Web of Science e Cochrane Library de janeiro de 2010 a maio de
2025. Foram incluídos estudos que avaliaram o uso de algoritmos de IA (intervenção) no diagnóstico de doenças digestivas em pacientes
submetidos ou considerados para cirurgia (população), comparando-os com métodos de diagnóstico convencionais (comparadores) e
relatando métricas de desempenho diagnóstico (resultados). Foram considerados estudos observacionais e experimentais (desenho). A
seleção dos estudos e a extração dos dados foram realizadas de forma independente por dois revisores, seguindo um protocolo PRIS-
MA. Resultados: Foram incluídos 25 estudos. As principais conclusões demonstram que a IA, particularmente as redes neurais convo-
lucionais e os modelos de aprendizagem profunda, exibe um elevado potencial para melhorar a precisão do diagnóstico em patologias
como o cancro colorretal, o cancro gástrico e a doença inflamatória intestinal, utilizando imagens endoscópicas e histopatológicas. As
principais limitações incluem a heterogeneidade metodológica e a falta de validação externa em muitos estudos. Conclusões: A IA é
uma ferramenta promissora para otimizar o diagnóstico cirúrgico de doenças digestivas, oferecendo maior precisão e eficiência. São
necessários estudos multicêntricos com coortes maiores e validação externa para traduzir essas descobertas na prática clínica.
Palavras-chave: Inteligência Artificial, Diagnóstico, Doenças Gastrointestinais, Cirurgia, Revisão Sistemática.
460 RECIMUNDO VOL. 9 N°2 (2025)
Introducción
Las enfermedades digestivas representan
una carga significativa para los sistemas
de salud a nivel mundial, siendo respon-
sables de millones de consultas médicas,
intervenciones quirúrgicas y muertes cada
año (GBD 2019 Diseases and Injuries Co-
llaborators, 2020). Dentro del abordaje clí-
nico-quirúrgico, el diagnóstico temprano y
preciso es esencial para optimizar los resul-
tados quirúrgicos, reducir complicaciones
y mejorar la calidad de vida de los pacien-
tes. No obstante, los métodos diagnósticos
convencionales —como la endoscopia, la
ecografía, la tomografía computarizada y
la laparoscopia exploratoria— siguen sien-
do limitados por su dependencia del juicio
clínico individual, la variabilidad interobser-
vador y el acceso a especialistas altamente
entrenados (Chan et al., 2022).
En los últimos años, la inteligencia artifi-
cial (IA) ha emergido como una herramien-
ta prometedora en el ámbito médico, con
aplicaciones cada vez más frecuentes en
la imagenología diagnóstica, el análisis
de grandes volúmenes de datos clínicos
y la toma de decisiones quirúrgicas (To-
pol, 2019). Particularmente en el campo
de las enfermedades digestivas, la IA ha
demostrado un potencial significativo en
la detección automatizada de lesiones en
colonoscopias, la estratificación de riesgo
en cáncer gastrointestinal y la planificación
quirúrgica asistida por algoritmos (Hirasawa
et al., 2018). Sin embargo, la investigación
existente es heterogénea en cuanto a me-
todologías, poblaciones evaluadas y tipos
de algoritmos empleados, lo que limita la
generalización de los hallazgos. Además,
muchos estudios reportan métricas de des-
empeño sin validación externa, generando
incertidumbre sobre su aplicabilidad clínica
real (Lambin et al., 2021).
Motivación de la revisión
Ante la rápida evolución de la inteligencia
artificial en el ámbito clínico, resulta urgente
consolidar la evidencia científica sobre su
PLÚA MARCILLO, W. E. ., NAVAS SUÁREZ, L. J. ., VACA CORONEL, G. M., & VITERI RUIZ, M. A.
utilidad específica en el diagnóstico quirúr-
gico de enfermedades digestivas. Una revi-
sión sistemática resulta indispensable para
sintetizar de manera rigurosa y transparente
los estudios disponibles, identificar patro-
nes comunes, evaluar la calidad de la evi-
dencia y detectar áreas de incertidumbre o
controversia. A diferencia de las revisiones
narrativas, que pueden estar sesgadas por
la selección subjetiva de estudios, la me-
todología sistemática permite minimizar el
sesgo de selección y proporciona una base
más sólida para la toma de decisiones clíni-
cas y el diseño de políticas sanitarias (Page
et al., 2021).
Objetivos de la revisión
El objetivo principal de esta revisión siste-
mática es evaluar la evidencia actual sobre
la aplicación de la inteligencia artificial en el
diagnóstico quirúrgico de enfermedades di-
gestivas. Específicamente, se pretende de-
terminar la efectividad de los algoritmos de
IA en comparación con métodos diagnósti-
cos convencionales, analizar sus principa-
les campos de aplicación clínica y explorar
sus limitaciones, riesgos e implicaciones
éticas. Como resultado, se espera identifi-
car tecnologías prometedoras y establecer
recomendaciones para futuras investigacio-
nes y su posible implementación clínica.
Marco conceptual
Esta revisión se basa en un marco concep-
tual que integra la relación entre inteligencia
artificial, diagnóstico médico y toma de de-
cisiones quirúrgicas. Se entiende por inteli-
gencia artificial a los sistemas informáticos
que realizan tareas que normalmente requie-
ren inteligencia humana, como el reconoci-
miento de patrones, el aprendizaje automáti-
co (machine learning) y el análisis predictivo
(Russell & Norvig, 2021). En el contexto qui-
rúrgico digestivo, la IA puede aplicarse al
análisis de imágenes endoscópicas, histo-
patológicas o radiológicas; a la clasificación
automatizada de lesiones; o a la predicción
de desenlaces postoperatorios. Se conside-
rará como diagnóstico quirúrgico a toda
461
RECIMUNDO VOL. 9 N°2 (2025)
APLICACIONES DE LA IA EN EL DIAGNÓSTICO QUIRÚRGICO DE ENFERMEDADES DIGESTIVAS. UNA RE-
VISIÓN SISTEMÁTICA
herramienta o intervención que permita con-
firmar o descartar la indicación quirúrgica,
optimizar la elección del procedimiento, o
mejorar la planificación intraoperatoria.
Relevancia de la revisión
Esta revisión tiene un valor significativo tan-
to para la comunidad científica como para
los profesionales de la salud, dado que pro-
porciona una evaluación crítica y estructu-
rada sobre una tecnología emergente de
alto impacto potencial. Los resultados po-
drían guiar futuras líneas de investigación,
facilitar la integración de la IA en protocolos
quirúrgicos digestivos, y servir como insu-
mo para el desarrollo de normativas éticas y
regulatorias sobre su uso en entornos clíni-
cos. Asimismo, al identificar las fortalezas y
limitaciones actuales de la IA, se promueve
un enfoque más realista, seguro y centrado
en el paciente para su adopción en la prác-
tica médica.
Metodología
La presente investigación se llevó a cabo
mediante una revisión sistemática de la li-
teratura cientíca, adherida rigurosamente
a las directrices de la guía PRISMA 2020
(Page et al., 2021). Este enfoque metodo-
lógico fue seleccionado con el propósito
de evaluar el uso de la inteligencia arti-
cial (IA) en el diagnóstico quirúrgico de
enfermedades del aparato digestivo, ga-
rantizando así una síntesis de la evidencia
disponible que es a la vez rigurosa, trans-
parente yreproducible.
Para estructurar la búsqueda de información,
se formuló una pregunta de investigación
utilizando el modelo PICO, donde: la P (Po-
blación) se centró en pacientes con enfer-
medades digestivas que requieren abordaje
quirúrgico, incluyendo condiciones como el
cáncer gastrointestinal, apendicitis, colelitia-
sis y enfermedad inflamatoria intestinal; la I
(Intervención) se definió como las aplicacio-
nes de inteligencia artificial para el diagnós-
tico clínico, imagenológico o intraoperatorio;
la C (Comparación) consideró los métodos
diagnósticos convencionales, como la ima-
genología interpretada por especialistas o
diagnósticos clínicos sin IA; y los O (Resul-
tados) se enfocaron en métricas como la
precisión diagnóstica, sensibilidad, especifi-
cidad, reducción de errores diagnósticos y
optimización del tratamiento quirúrgico. Así,
la pregunta guía de esta revisión fue: "¿Cuál
es el impacto de la inteligencia articial,
en comparación con los métodos conven-
cionales, en el diagnóstico quirúrgico de
enfermedades digestivas?"
En cuanto a los criterios de elegibilidad, se
incluyeron estudios originales (ensayos clí-
nicos, estudios de cohortes, estudios trans-
versales) publicados entre 2013 y 2024 que
evaluaran el uso de herramientas de IA en
el proceso diagnóstico previo o intraope-
ratorio en cirugía digestiva. Además, los
artículos debían estar en inglés o español,
publicados en revistas indexadas y reportar
métricas de desempeño como sensibilidad,
especificidad o precisión. Por el contrario,
se excluyeron revisiones narrativas, cartas
al editor, comentarios o estudios con infor-
mación insuficiente sobre el uso de IA, in-
vestigaciones centradas exclusivamente en
el tratamiento o seguimiento postquirúrgico,
estudios que no aplicaran IA directamente
al proceso diagnóstico, y artículos duplica-
dos o sin acceso al texto completo.
La estrategia de búsqueda fue sistemática
y exhaustiva, abarcando las bases de da-
tos electrónicas PubMed, Scopus, Web of
Science, IEEE Xplore y Cochrane Library.
Esta búsqueda se complementó con una re-
visión manual de las referencias de artículos
que se consideraron relevantes. Se empleó
una combinación de términos en inglés y
español, tales como: ("artificial intelligence"
OR "machine learning" OR "deep learning")
AND ("digestive diseases" OR "gastrointes-
tinal disorders" OR "abdominal surgery")
AND ("diagnosis" OR "surgical decision-ma-
king" OR "image analysis"). Adicionalmente,
se utilizaron términos MeSH y DeCS según
la base de datos (Bramer et al., 2018) para
optimizar la relevancia de los resultados
462 RECIMUNDO VOL. 9 N°2 (2025)
La selección de estudios se llevó a cabo
en tres fases bien definidas. Inicialmente,
se procedió a la eliminación de duplicados
utilizando el software Rayyan QCRI (Ouzza-
ni et al., 2016). Posteriormente, dos reviso-
res trabajaron de forma independiente para
examinar los títulos y resúmenes, decidien-
do su elegibilidad conforme a los criterios
preestablecidos. En la etapa final, los tex-
tos completos de los artículos preseleccio-
nados fueron revisados exhaustivamente.
Cualquier discrepancia surgida entre los
revisores durante este proceso fue resuelta
mediante consenso o, en su defecto, con la
intervención de un tercer evaluador.
Para la extracción de datos, se diseñó una
matriz específica en Microsoft Excel. Esta
matriz permitió recopilar información crucial
de cada estudio, incluyendo el autor(es), año
de publicación, país de origen, tipo de estu-
dio, el tipo de IA implementada, la población
estudiada, la enfermedad digestiva analiza-
da, la comparación realizada con métodos
convencionales, las métricas diagnósticas
reportadas y los hallazgos principales. La
extracción de esta información fue realizada
de manera independiente por dos revisores,
garantizando la fiabilidad de los datos.
La evaluación de la calidad metodológica
de los estudios se realizó de manera dife-
renciada según su diseño. Para los ensayos
clínicos aleatorizados, se aplicó la herra-
mienta Cochrane Risk of Bias 2.0 (Sterne
et al., 2019). Los estudios observacionales
fueron evaluados utilizando la escala New-
castle-Ottawa, que valora la selección, com-
parabilidad y los resultados. Finalmente, en
el caso de los estudios de diagnóstico, se
empleó la herramienta QUADAS-2 (Whiting
et al., 2011), que permite evaluar el riesgo de
sesgo en estudios de precisión diagnóstica.
En lo que respecta al análisis y síntesis de
resultados, se optó por una síntesis cualitati-
va, dada la heterogeneidad de los algoritmos
y desenlaces identificados en la literatura.
Los estudios fueron agrupados consideran-
do el tipo de enfermedad digestiva, la cla-
se de IA aplicada (machine learning, deep
learning, redes neuronales convolucionales,
etc.) y el tipo de datos utilizados (imágenes,
historias clínicas, parámetros intraoperato-
rios). Este enfoque permitió identificar patro-
nes comunes, así como las ventajas y limi-
taciones reportadas. Aunque no fue posible
realizar un metaanálisis, se calcularon medi-
das de rendimiento como la sensibilidad, es-
pecificidad y AUC cuando los datos lo per-
mitieron, y se llevó a cabo una comparación
narrativa entre los estudios.
Últimamente, esta revisión sistemática fue
meticulosamente diseñada para aportar evi-
dencia fiable y actualizada sobre las aplica-
ciones clínicas de la inteligencia articial
en el diagnóstico quirúrgico de enferme-
dades digestivas. La metodología imple-
mentada asegura una síntesis estructurada
y transparente de la literatura existente. Sin
embargo, es fundamental reconocer ciertas
limitaciones inherentes a este tipo de in-
vestigación, como la heterogeneidad de los
estudios incluidos, la rápida evolución tec-
nológica en el campo de la IA y la frecuen-
te falta de estandarización en el reporte de
resultados. Estas limitaciones subrayan la
imperiosa necesidad de llevar a cabo es-
tudios prospectivos de alta calidad en este
campo, con el fin de avanzar en la aplica-
ción clínica de la IA en la cirugía digestiva
Resultados
Diagrama de ujo PRISMA
El diagrama de flujo PRISMA ilustra el pro-
ceso sistemático seguido en la revisión, co-
menzando con la identificación de estudios
a través de búsquedas en bases de datos
como PubMed, Scopus, Web of Science y
Cochrane Library, así como mediante revi-
siones manuales de referencias. Tras elimi-
nar duplicados utilizando herramientas como
Rayyan QCRI, se procedió a la evaluación
de elegibilidad mediante la revisión de títulos
y resúmenes por dos revisores independien-
tes, quienes aplicaron criterios predefinidos
para filtrar estudios irrelevantes.
PLÚA MARCILLO, W. E. ., NAVAS SUÁREZ, L. J. ., VACA CORONEL, G. M., & VITERI RUIZ, M. A.
463
RECIMUNDO VOL. 9 N°2 (2025)
En la fase de selección, los textos comple-
tos de los artículos preseleccionados fueron
examinados en profundidad para verificar
su alineación con los objetivos de la revisión,
descartando aquellos que no cumplían con
los criterios de inclusión, como revisiones
narrativas o estudios sin métricas diagnósti-
cas. Posteriormente, se realizó la extracción
de datos mediante una matriz estandarizada
en Excel, donde se recopilaron detalles clave
como el tipo de IA, población estudiada, en-
fermedades analizadas y métricas de rendi-
miento, asegurando la consistencia mediante
la revisión cruzada por dos investigadores.
Finalmente, los estudios incluidos fueron
sometidos a una evaluación de calidad me-
todológica utilizando herramientas como
Cochrane RoB 2.0 para ensayos clínicos,
Newcastle-Ottawa para estudios observa-
cionales y QUADAS-2 para estudios diag-
nósticos. Este proceso riguroso garantizó
la solidez de la síntesis cualitativa, aunque
la heterogeneidad de los estudios impidió
un metaanálisis, destacando la necesidad
de futuras investigaciones con diseños más
estandarizados, ver figura 1.
Figura 1. Diagrama de flujo PRISMA
Nota: Elaborado por los autores. (2025)
Evaluación de la Calidad Metodológica
de los Estudios
1. Ensayos Clínicos Aleatorizados (ECA)
Herramienta: Cochrane Risk of Bias 2.0
(RoB 2.0)
Estudios evaluados:
Wang et al. (2019): Ensayo aleatorizado
sobre detección de pólipos en colonos-
copia con IA
APLICACIONES DE LA IA EN EL DIAGNÓSTICO QUIRÚRGICO DE ENFERMEDADES DIGESTIVAS. UNA RE-
VISIÓN SISTEMÁTICA
464 RECIMUNDO VOL. 9 N°2 (2025)
Tabla 2. Ensayos Clínicos Aleatorizados (ECA)
Nota: Elaborado por los autores. (2025)
Criterio (Puntaje
máximo)
Hirasawa et al.
Minoda et al.
Shichijo et al.
Selección (4)
3 (Falta de grupo control
explícito)
3 (Muestra representativa pero
sin aleatorización)
3 (Comparación con
métodos tradicionales)
Comparabilidad (2)
1 (Ajuste limitado por
variables clínicas)
1
1
Resultados (3)
3 (Seguimiento adecuado,
métricas claras)
3
3
Puntuación total (9)
7 (Buena calidad)
7
7
Dominio
Zhu et al.
Barua et al.
Selección de
pacientes
Riesgo bajo (pacientes consecutivos con
criterios claros).
Riesgo moderado (heterogeneidad en
estudios incluidos).
Prueba índice
(IA)
Riesgo bajo (protocolo estandarizado).
Riesgo bajo (análisis riguroso).
Gold
Standard
Riesgo moderado (histopatología como
referencia, pero posible sesgo).
Riesgo bajo (colonoscopia como estándar).
Flujo y
tiempo
Riesgo bajo (todas las muestras incluidas en
análisis).
Riesgo moderado (variabilidad en tiempos
de estudio).
Herramienta
Riesgo de Sesgo Predominante
Recomendaciones
Cochrane RoB 2.0
Moderado (falta de
enmascaramiento)
Mejorar transparencia en
aleatorizacn.
Newcastle-Ottawa
Moderado (comparabilidad
limitada)
Incluir grupos control ajustados.
QUADAS-2
Bajo-moderado (depende del gold
standard)
Estandarizar protocolos de
referencia.
AMSTAR-2
(opcional)
Variable (sesgo de publicación)
Reportar fuentes de
financiamiento.
Dominio
Evaluación
Riesgo de Sesgo
Aleatorización
Secuencia de aleatorización no detallada.
Alto
Desviaciones del
tratamiento
No se menciona enmascaramiento de endoscopistas.
Preocupación
moderada
Datos faltantes
No reporta pérdidas de seguimiento.
Bajo
Medición de resultados
Métricas claras (tasa de detección), pero posible
sesgo en evaluación.
Moderado
Reporte selectivo
Resultados principales reportados.
Bajo
Riesgo de sesgo moderado debido a falta
de detalles en aleatorización y enmascara-
miento.
2. Estudios Observacionales (Cohorte,
Casos y Controles, Series de Casos)
Herramienta: Escala Newcastle-Ottawa
(NOS)
Estudios evaluados:
Hirasawa et al. (2018): Estudio clínico
sobre CNN en cáncer gástrico.
Minoda et al. (2022): Estudio clínico so-
bre IA en ultrasonido endoscópico.
Shichijo et al. (2017): Estudio clínico so-
bre CNN en H. pylori.
Tabla 3. Herramienta: Escala Newcastle-Ottawa (NOS)
Nota: Elaborado por los autores. (2025)
Criterio (Puntaje
máximo)
Hirasawa et al.
Minoda et al.
Shichijo et al.
Selección (4)
3 (Falta de grupo control
explícito)
3 (Muestra representativa pero
sin aleatorización)
3 (Comparación con
métodos tradicionales)
Comparabilidad (2)
1 (Ajuste limitado por
variables clínicas)
1
1
Resultados (3)
3 (Seguimiento adecuado,
métricas claras)
3
3
Puntuación total (9)
7 (Buena calidad)
7
7
Dominio
Zhu et al.
Barua et al.
Selección de
pacientes
Riesgo bajo (pacientes consecutivos con
criterios claros).
Riesgo moderado (heterogeneidad en
estudios incluidos).
Prueba índice
(IA)
Riesgo bajo (protocolo estandarizado).
Riesgo bajo (análisis riguroso).
Gold
Standard
Riesgo moderado (histopatología como
referencia, pero posible sesgo).
Riesgo bajo (colonoscopia como estándar).
Flujo y
tiempo
Riesgo bajo (todas las muestras incluidas en
análisis).
Riesgo moderado (variabilidad en tiempos
de estudio).
Tipo de
Estudio
Herramienta
Riesgo de Sesgo Predominante
Recomendaciones
ECA
Cochrane RoB 2.0
Moderado (falta de
enmascaramiento)
Mejorar transparencia en
aleatorizacn.
Observacionales
Newcastle-Ottawa
Moderado (comparabilidad
limitada)
Incluir grupos control ajustados.
Diagnóstico
QUADAS-2
Bajo-moderado (depende del gold
standard)
Estandarizar protocolos de
referencia.
Revisiones
AMSTAR-2
(opcional)
Variable (sesgo de publicación)
Reportar fuentes de
financiamiento.
Dominio
Evaluación
Riesgo de Sesgo
Aleatorización
Secuencia de aleatorización no detallada.
Alto
Desviaciones del
tratamiento
No se menciona enmascaramiento de endoscopistas.
Preocupación
moderada
Datos faltantes
No reporta pérdidas de seguimiento.
Bajo
Medición de resultados
Métricas claras (tasa de detección), pero posible
sesgo en evaluación.
Moderado
Reporte selectivo
Resultados principales reportados.
Bajo
Calidad moderada-alta, pero con limitacio-
nes en comparabilidad y diseño de grupos
control.
3. Estudios de Diagnóstico (Precisión de
IA vs. Gold Standard)
Herramienta: QUADAS-2
Estudios evaluados:
Zhu et al. (2019): CNN para invasión de
cáncer gástrico.
Barua et al. (2021): Meta-análisis en de-
tección de pólipos.
PLÚA MARCILLO, W. E. ., NAVAS SUÁREZ, L. J. ., VACA CORONEL, G. M., & VITERI RUIZ, M. A.
465
RECIMUNDO VOL. 9 N°2 (2025)
Tabla 4. Herramienta: QUADAS-2
Nota: Elaborado por los autores. (2025)
Criterio (Puntaje
máximo)
Hirasawa et al.
Minoda et al.
Shichijo et al.
Selección (4)
3 (Falta de grupo control
explícito)
3 (Muestra representativa pero
sin aleatorización)
3 (Comparación con
métodos tradicionales)
Comparabilidad (2)
1 (Ajuste limitado por
variables clínicas)
1
1
Resultados (3)
3 (Seguimiento adecuado,
métricas claras)
3
3
Puntuación total (9)
7 (Buena calidad)
7
7
Dominio
Zhu et al.
Barua et al.
Selección de
pacientes
Riesgo bajo (pacientes consecutivos con
criterios claros).
Riesgo moderado (heterogeneidad en
estudios incluidos).
Prueba índice
(IA)
Riesgo bajo (protocolo estandarizado).
Riesgo bajo (análisis riguroso).
Gold
Standard
Riesgo moderado (histopatología como
referencia, pero posible sesgo).
Riesgo bajo (colonoscopia como estándar).
Flujo y
tiempo
Riesgo bajo (todas las muestras incluidas en
análisis).
Riesgo moderado (variabilidad en tiempos
de estudio).
Tipo de
Estudio
Herramienta
Riesgo de Sesgo Predominante
Recomendaciones
ECA
Cochrane RoB 2.0
Moderado (falta de
enmascaramiento)
Mejorar transparencia en
aleatorizacn.
Observacionales
Newcastle-Ottawa
Moderado (comparabilidad
limitada)
Incluir grupos control ajustados.
Diagnóstico
QUADAS-2
Bajo-moderado (depende del gold
standard)
Estandarizar protocolos de
referencia.
Revisiones
AMSTAR-2
(opcional)
Variable (sesgo de publicación)
Reportar fuentes de
financiamiento.
Dominio
Evaluación
Riesgo de Sesgo
Aleatorización
Secuencia de aleatorización no detallada.
Alto
Desviaciones del
tratamiento
No se menciona enmascaramiento de endoscopistas.
Preocupación
moderada
Datos faltantes
No reporta pérdidas de seguimiento.
Bajo
Medición de resultados
Métricas claras (tasa de detección), pero posible
sesgo en evaluación.
Moderado
Reporte selectivo
Resultados principales reportados.
Bajo
Zhu et al.: Riesgo de sesgo bajo-mode-
rado.
Barua et al.: Riesgo moderado por hete-
rogeneidad en meta-análisis.
4. Revisiones Sistemáticas y Meta-aná-
lisis
Herramienta: AMSTAR-2 (Opcional, aplica-
ble a Chevalier et al. 2025, Lewis et al. 2024)
Hallazgos:
Fortalezas: Protocolos registrados, bús-
queda exhaustiva.
Debilidades: En Lewis et al., falta de
análisis de sesgo de publicación.
Tabla 5. Resumen General de Calidad
Nota: Elaborado por los autores. (2025)
Criterio (Puntaje
máximo)
Hirasawa et al.
Minoda et al.
Shichijo et al.
Selección (4)
3 (Falta de grupo control
explícito)
3 (Muestra representativa pero
sin aleatorización)
3 (Comparación con
métodos tradicionales)
Comparabilidad (2)
1 (Ajuste limitado por
variables clínicas)
1
1
Resultados (3)
3 (Seguimiento adecuado,
métricas claras)
3
3
Puntuación total (9)
7 (Buena calidad)
7
7
Dominio
Zhu et al.
Barua et al.
Selección de
pacientes
Riesgo bajo (pacientes consecutivos con
criterios claros).
Riesgo moderado (heterogeneidad en
estudios incluidos).
Prueba índice
(IA)
Riesgo bajo (protocolo estandarizado).
Riesgo bajo (análisis riguroso).
Gold
Standard
Riesgo moderado (histopatología como
referencia, pero posible sesgo).
Riesgo bajo (colonoscopia como estándar).
Flujo y
tiempo
Riesgo bajo (todas las muestras incluidas en
análisis).
Riesgo moderado (variabilidad en tiempos
de estudio).
Tipo de
Estudio
Herramienta
Riesgo de Sesgo Predominante
Recomendaciones
ECA
Cochrane RoB 2.0
Moderado (falta de
enmascaramiento)
Mejorar transparencia en
aleatorización.
Observacionales
Newcastle-Ottawa
Moderado (comparabilidad
limitada)
Incluir grupos control ajustados.
Diagnóstico
QUADAS-2
Bajo-moderado (depende del gold
standard)
Estandarizar protocolos de
referencia.
Revisiones
AMSTAR-2
(opcional)
Variable (sesgo de publicación)
Reportar fuentes de
financiamiento.
Dominio
Evaluación
Riesgo de Sesgo
Aleatorización
Secuencia de aleatorización no detallada.
Alto
Desviaciones del
tratamiento
No se menciona enmascaramiento de endoscopistas.
Preocupación
moderada
Datos faltantes
No reporta pérdidas de seguimiento.
Bajo
Medición de resultados
Métricas claras (tasa de detección), pero posible
sesgo en evaluación.
Moderado
Reporte selectivo
Resultados principales reportados.
Bajo
Limitaciones globales:
Sesgo de selección en estudios obser-
vacionales.
Falta de acceso a protocolos detallados
en ECA.
Heterogeneidad en estudios de diag-
nóstico.
La mayoría de los estudios presentan cali-
dad moderada-alta, pero con áreas críticas
a mejorar (e.g., diseño de grupos control,
estandarización de métricas). Los ECA son
escasos, lo que resalta la necesidad de más
investigación con metodologías robustas.
Resultados cualitativos
Los resultados cualitativos de esta revisión
sistemática se organizaron en función de la
APLICACIONES DE LA IA EN EL DIAGNÓSTICO QUIRÚRGICO DE ENFERMEDADES DIGESTIVAS. UNA RE-
VISIÓN SISTEMÁTICA
466 RECIMUNDO VOL. 9 N°2 (2025)
enfermedad digestiva, el tipo de inteligencia
artificial (IA) aplicada y los datos utilizados,
permitiendo identificar patrones comunes,
ventajas y limitaciones de estas tecnologías
en distintos contextos clínicos. En primer lu-
gar, en el caso del cáncer gástrico, se em-
plearon principalmente redes neuronales
convolucionales (CNN) y técnicas de apren-
dizaje profundo aplicadas a imágenes en-
doscópicas. Los hallazgos revelaron una alta
precisión diagnóstica, con una sensibilidad
del 92.2% y una especificidad del 95.9% (Hi-
rasawa et al., 2018), así como una exactitud
del 84.7% en la evaluación de la profundidad
de invasión tumoral (Zhu et al., 2019). Estas
herramientas permiten un diagnóstico tem-
prano y la reducción de errores humanos.
No obstante, su efectividad depende fuerte-
mente de la calidad de las imágenes y de
bases de datos bien etiquetadas.
En cuanto a los pólipos y adenomas colo-
rrectales, se destacaron los sistemas auto-
máticos de detección basados en CNN y
meta-análisis, utilizando imágenes de colo-
noscopia. Se observó un aumento significa-
tivo en la detección de adenomas (29.1%
frente al 20.3% con colonoscopia conven-
cional) (Wang et al., 2019), además de
una alta sensibilidad (90%) y especificidad
(85%) para pólipos pequeños (Barua et al.,
2021). También se reportó una reducción
de costos del 34.8% y mejora en la eficien-
cia del procedimiento (Mori et al., 2020). A
pesar de estos beneficios, se señala la po-
sibilidad de falsos positivos y la necesidad
de validación en poblaciones diversas.
Respecto a las enfermedades del intestino
delgado, se ha implementado IA en cápsu-
las endoscópicas y aprendizaje automático
(ML), lo que ha permitido una mayor de-
tección de lesiones en comparación con la
cápsula convencional (Dhali et al., 2025).
Las principales ventajas son su carácter no
invasivo y la cobertura total del intestino,
aunque el costo elevado y el acceso limita-
do en algunas regiones constituyen barre-
ras importantes.
En el caso de la infección por Helicobacter
pylori, se aplicaron CNN sobre imágenes
endoscópicas, logrando un diagnóstico no
invasivo con alta precisión (sensibilidad del
88.9% y especificidad del 87.4%) (Shichijo
et al., 2017). Esto representa una alternativa
efectiva a métodos invasivos como la biopsia,
aunque se requiere un entrenamiento robus-
to con datos diversos para lograr generaliza-
ción. Por otro lado, para los tumores del es-
troma gastrointestinal (GIST), la IA aplicada a
imágenes de ultrasonido endoscópico mostró
una exactitud diagnóstica del 89.5% en la di-
ferenciación de tumores (Minoda et al., 2022).
Este enfoque contribuye a un diagnóstico
diferencial más preciso y apoya la toma de
decisiones clínicas, aunque sigue siendo de-
pendiente de la experiencia del operador. En
el abordaje de úlceras gástricas, se ha utiliza-
do IA en el cierre de úlceras post-endosco-
pia, combinando parámetros intraoperatorios
e imágenes. Los estudios indican una tasa de
éxito del 92.9% en procedimientos asistidos
por IA (Minoda et al., 2020), lo que sugiere un
aumento en la seguridad y eficiencia, aunque
se destaca la necesidad de validación en es-
tudios de mayor escala.
Finalmente, en el análisis global de enferme-
dades digestivas, los estudios de revisión y
meta-análisis han demostrado que la IA, ya
sea mediante aprendizaje profundo, ML o IA
aplicada a la endoscopia y cirugía, supera en
sensibilidad y especificidad a los métodos
tradicionales (Lewis et al., 2024). Además, se
ha evidenciado una optimización de procedi-
mientos quirúrgicos (Shukla et al., 2024; Yangt
et al., 2025) y un potencial transformador en
la medicina diagnóstica (Yu et al., 2018), con
beneficios en la planificación quirúrgica e in-
tegración multifuncional. Sin embargo, persis-
ten desafíos como la heterogeneidad de los
estudios y la falta de estandarización.
En síntesis, los patrones comunes observa-
dos revelan ventajas significativas como una
mayor precisión diagnóstica, eficiencia en
procedimientos y el uso de técnicas no in-
vasivas. No obstante, también se identifican
limitaciones recurrentes, tales como la necesi-
PLÚA MARCILLO, W. E. ., NAVAS SUÁREZ, L. J. ., VACA CORONEL, G. M., & VITERI RUIZ, M. A.
467
RECIMUNDO VOL. 9 N°2 (2025)
dad de datos de alta calidad, la validación en
diversos contextos poblacionales y barreras
económicas y tecnológicas. Por lo tanto, se
recomienda establecer estándares uniformes
para la validación clínica, promover estudios
prospectivos multicéntricos y garantizar un
enfoque equitativo en el acceso a estas tec-
nologías. Este análisis cualitativo subraya así
el prometedor impacto de la IA en gastroente-
rología, al tiempo que enfatiza la importancia
de superar sus limitaciones para una imple-
mentación clínica efectiva y equitativa.
La aplicación de la inteligencia artificial (IA)
en el diagnóstico quirúrgico de enfermeda-
des digestivas ha ganado un gran impulso,
especialmente gracias a los avances en las
técnicas de aprendizaje automático (ML) y
aprendizaje profundo (DL). Estas tecnolo-
gías mejoran la precisión y la eficiencia del
diagnóstico de afecciones gastrointestina-
les (GI), lo que en última instancia mejora
los resultados de los pacientes. En las si-
guientes secciones se describen las princi-
pales aplicaciones y conclusiones de revi-
siones sistemáticas recientes.
Técnicas de IA en endoscopia
Modelos de aprendizaje profundo: Las re-
des neuronales convolucionales (CNN) se
utilizan principalmente para analizar imáge-
nes endoscópicas, logrando una alta preci-
sión diagnóstica para afecciones como los
pólipos colorrectales y el cáncer gástrico,
con tasas de detección del 93,7 % y el 88,3
%, respectivamente (Ouyang y Hu, 2023).
Enfoques de aprendizaje automático: se
han empleado técnicas como la extracción
de características y la clasificación para
preprocesar los datos endoscópicos, lo que
facilita la identificación de lesiones benig-
nas y malignas (Lewis et al., 2023).
Precisión diagnóstica
Sensibilidad y especificidad: La IA ha de-
mostrado una alta sensibilidad (hasta el
99 %) y especificidad (hasta el 100 %) en
el diagnóstico de diversas enfermedades
gastrointestinales, incluidas las infecciones
por Helicobacter pylori y las úlceras gas-
trointestinales (Baldacchino, 2022).
Metaanálisis: Las revisiones sistemáticas in-
dican que los diagnósticos asistidos por IA
pueden reducir significativamente las tasas
de diagnósticos erróneos, mejorando la de-
tección precoz de afecciones críticas (Bal-
dacchino, 2022).
Endoscopia capsular controlada magnéti-
camente (MCCE)
Diagnóstico no invasivo: La MCCE, com-
binada con la IA, ofrece una alternativa no
invasiva para el diagnóstico de enfermeda-
des gastrointestinales, con un rendimiento
comparable al de la endoscopia tradicional
(Wang et al., 2022).
Potencial futuro: Aunque la MCCE se en-
cuentra todavía en una fase inicial de in-
vestigación, su integración con la IA podría
conducir a una mejora de las capacidades
de diagnóstico, incluido el análisis de imá-
genes en tiempo real (Wang et al., 2022).
A pesar de estos avances, siguen existiendo
preocupaciones sobre la calidad metodoló-
gica de los estudios y la necesidad de en-
sayos a gran escala para validar la eficacia
de la IA en entornos clínicos (Pecere et al.,
2021). La integración de la IA en el diagnós-
tico quirúrgico presenta oportunidades pro-
metedoras, pero también requiere una cui-
dadosa consideración de sus limitaciones y
la necesidad de una evaluación rigurosa.
Discusión de los resultados
Esta revisión sistemática analizó la eviden-
cia disponible sobre el uso de la inteligen-
cia artificial (IA) en el diagnóstico quirúrgico
de enfermedades digestivas, con el propó-
sito de identificar patrones relevantes, be-
neficios clínicos y limitaciones metodológi-
cas. Los hallazgos obtenidos se discuten a
continuación en relación con los objetivos
planteados, los antecedentes científicos y
sus implicaciones prácticas en el campo de
la gastroenterología.
APLICACIONES DE LA IA EN EL DIAGNÓSTICO QUIRÚRGICO DE ENFERMEDADES DIGESTIVAS. UNA RE-
VISIÓN SISTEMÁTICA
468 RECIMUNDO VOL. 9 N°2 (2025)
En primer lugar, se destaca la efectividad de
la IA en el diagnóstico quirúrgico. La evi-
dencia recopilada muestra que tecnologías
como las redes neuronales convolucionales
(CNN) y los modelos de aprendizaje profun-
do superan consistentemente a los métodos
convencionales en términos de precisión
diagnóstica. Por ejemplo, en el caso del cán-
cer gástrico, se reportó una sensibilidad del
92.2% y una especificidad del 95.9% (Hira-
sawa et al., 2018), junto con una notable ca-
pacidad para evaluar la profundidad de inva-
sión tumoral (Zhu et al., 2019). En los pólipos
colorrectales, se evidenció un incremento
significativo en la tasa de detección de ade-
nomas (29.1% frente a 20.3%) y una reduc-
ción de costos cercana al 34.8% (Wang et
al., 2019; Mori et al., 2020). Asimismo, en las
enfermedades del intestino delgado, el uso
de cápsula endoscópica con IA mostró una
mejora sustancial en la detección de lesio-
nes (Dhali et al., 2025). Estos resultados son
coherentes con estudios previos (Lewis et
al., 2024; Pecere et al., 2021) que resaltan la
capacidad de la IA para reducir errores hu-
manos y optimizar recursos clínicos. No obs-
tante, la variabilidad en las métricas reporta-
das —como la sensibilidad, especificidad o
exactitud— complica la comparación directa
entre los estudios.
En segundo lugar, se observó una amplia
diversidad de campos de aplicación clí-
nica de la IA en gastroenterología. La tec-
nología se ha integrado en diversas fases
del proceso diagnóstico, incluyendo la en-
doscopia, mediante detección automatiza-
da de lesiones (como en cáncer gástrico y
pólipos), y en la imagenología, a través del
ultrasonido endoscópico para el diagnósti-
co de tumores del estroma gastrointestinal
(Minoda et al., 2022). También se han docu-
mentado aplicaciones en cirugía, como en
la planificación intraoperatoria y el segui-
miento de instrumentos (Yangt et al., 2025).
De forma destacada, se han desarrollado
enfoques no invasivos como el diagnóstico
de Helicobacter pylori mediante CNN, evi-
tando así la necesidad de biopsias (Shichijo
et al., 2017). A pesar de estas innovaciones,
la adopción clínica de la IA aún es limitada,
principalmente por la falta de validación ex-
terna en contextos reales, como lo señalan
Lambin et al. (2021).
En cuanto a las limitaciones y desafíos,
el análisis identifica varias barreras críticas
que impiden una implementación generali-
zada. Desde el punto de vista metodológico,
muchos ensayos controlados aleatorizados
(ECA) presentan riesgos de sesgo modera-
do por la ausencia de enmascaramiento o
una aleatorización poco clara (Wang et al.,
2019). Los estudios observacionales, aun-
que obtienen puntuaciones aceptables en
herramientas como Newcastle-Ottawa (7/9),
muestran baja comparabilidad entre grupos
(Hirasawa et al., 2018). Además, los estudios
diagnósticos presentan heterogeneidad en
la definición del "gold standard", como re-
fleja la evaluación con QUADAS-2 (Barua et
al., 2021). A ello se suma la dependencia
de imágenes de alta calidad y de bases de
datos etiquetadas, con una representación
insuficiente de poblaciones diversas. Fac-
tores prácticos como los altos costos de
tecnologías como la cápsula endoscópica
con IA y la necesidad de capacitación es-
pecializada también constituyen obstáculos
importantes. Estos aspectos concuerdan
con estudios previos (Kröner et al., 2021),
que han advertido sobre la brecha entre la
investigación y la práctica clínica.
Por otro lado, el uso de IA en el diagnósti-
co quirúrgico también conlleva implicacio-
nes éticas y regulatorias signicativas.
Uno de los principales desafíos es la falta
de transparencia, ya que los algoritmos tipo
“caja negra” dificultan la interpretación y ex-
plicación de los resultados clínicos (Topol,
2019). Además, existe el riesgo de inequi-
dad debido a sesgos en los datos utilizados
para entrenar los modelos, especialmente
si no incluyen diversidad étnica, geográfica
o socioeconómica (Chan et al., 2022). Otro
aspecto crítico es la responsabilidad legal:
todavía no está claramente definido quién
debe asumir la responsabilidad en caso de
PLÚA MARCILLO, W. E. ., NAVAS SUÁREZ, L. J. ., VACA CORONEL, G. M., & VITERI RUIZ, M. A.
469
RECIMUNDO VOL. 9 N°2 (2025)
errores diagnósticos asistidos por IA. Ante
esto, se requiere con urgencia el desarro-
llo de marcos regulatorios que garanticen la
seguridad, equidad y transparencia del uso
de IA en medicina, como lo proponen Cal-
deraro y Kather (2021) en el contexto de la
patología digital.
Conclusiones
La IA es una herramienta transformadora en
el diagnóstico quirúrgico de enfermedades
digestivas, con ventajas demostradas en
precisión, eficiencia y reducción de costos.
Sin embargo, su implementación generali-
zada requiere superar limitaciones meto-
dológicas, éticas y prácticas. Esta revisión
subraya la urgencia de investigaciones ri-
gurosas y colaborativas para cerrar la bre-
cha entre el potencial teórico y la aplicación
clínica real.
Esta revisión sistemática analizó el impacto
de la inteligencia artificial (IA) en el diag-
nóstico quirúrgico de enfermedades diges-
tivas, a partir del examen de 25 estudios
publicados entre 2010 y 2025. Los resulta-
dos evidencian que la IA, en particular las
redes neuronales convolucionales (CNN) y
los modelos de aprendizaje profundo, ha
mejorado de manera significativa la preci-
sión diagnóstica frente a los métodos tradi-
cionales. Esta mejora se manifiesta en dis-
tintos escenarios clínicos, especialmente
en el ámbito de la endoscopia digestiva, la
planificación quirúrgica y la identificación
temprana de patologías complejas.
En cuanto a la efectividad diagnóstica, la IA
ha demostrado un desempeño sobresaliente
en enfermedades como el cáncer gástrico,
donde se alcanzaron niveles de sensibili-
dad del 92.2% y especificidad del 95.9%
(Hirasawa et al., 2018). Igualmente, en la
detección de adenomas colorrectales, los
sistemas automatizados basados en IA in-
crementaron la tasa de detección del 20.3%
al 29.1% (Wang et al., 2019), lo cual repre-
senta un avance relevante en la prevención
del cáncer colorrectal. En otros casos, como
la infección por Helicobacter pylori, se ob-
servó que la IA puede ofrecer diagnósticos
no invasivos con una precisión comparable
a la de los métodos tradicionales, lo que
representa una alternativa menos agresiva
para los pacientes (Shichijo et al., 2017).
Respecto a las aplicaciones clínicas, se ha
observado que la IA ha sido integrada con
éxito en múltiples procedimientos médicos,
tales como endoscopias, estudios por ultra-
sonido y cirugías gastrointestinales. Su im-
plementación ha permitido optimizar la de-
tección de lesiones, mejorar la planificación
quirúrgica y, en algunos contextos, reducir
costos considerablemente. Por ejemplo, en
colonoscopias asistidas por IA, se reportó
una disminución de costos del 34.8% sin
comprometer la calidad del diagnóstico
(Mori et al., 2020). Estos beneficios sugieren
que la IA no solo mejora la precisión diag-
nóstica, sino también la eficiencia operativa
en los entornos clínicos.
Sin embargo, también se identificaron di-
versas limitaciones y desafíos que deben
ser abordados antes de considerar una
adopción generalizada de estas tecnolo-
gías. En el plano metodológico, varios es-
tudios presentan un riesgo de sesgo mode-
rado debido a la falta de enmascaramiento
o a procesos de aleatorización poco rigu-
rosos, lo que puede afectar la validez in-
terna de los resultados (Wang et al., 2019).
Desde una perspectiva práctica, la efica-
cia de la IA depende en gran medida de
la calidad de los datos empleados para su
entrenamiento, lo cual requiere imágenes
de alta resolución y bases de datos etique-
tadas con precisión. Además, tecnologías
avanzadas como la cápsula endoscópica
con IA conllevan altos costos y presentan
barreras de acceso en regiones con menos
recursos. A nivel ético, se plantea la preo-
cupación por el uso de algoritmos de “caja
negra” cuya falta de transparencia puede
dificultar su validación clínica, así como
por los riesgos de inequidad en el acce-
so a estas herramientas, especialmente en
poblaciones subrepresentadas.
APLICACIONES DE LA IA EN EL DIAGNÓSTICO QUIRÚRGICO DE ENFERMEDADES DIGESTIVAS. UNA RE-
VISIÓN SISTEMÁTICA
470 RECIMUNDO VOL. 9 N°2 (2025)
Frente a este panorama, se proponen varias
recomendaciones para futuras investigacio-
nes. En primer lugar, se sugiere realizar es-
tudios multicéntricos con cohortes amplias
y diversas, lo que permitiría validar los re-
sultados en distintos contextos clínicos y
poblacionales. Además, es indispensable
mejorar el diseño de los ensayos clínicos
aleatorizados (ECA), incorporando pro-
cedimientos más rigurosos que reduzcan
los sesgos metodológicos. Paralelamente,
debe avanzarse en la formulación de están-
dares de validación clínica y en la creación
de marcos regulatorios que promuevan la
equidad, la transparencia y la seguridad en
el uso de IA en medicina.
En síntesis, la inteligencia artificial repre-
senta una herramienta con gran potencial
para revolucionar el diagnóstico quirúrgi-
co en el campo de la gastroenterología, al
ofrecer mayor precisión, eficiencia diag-
nóstica y una reducción significativa de los
costos. No obstante, para que estas venta-
jas se traduzcan en beneficios reales para
los pacientes, es indispensable superar los
desafíos metodológicos, prácticos y éticos
aún existentes. Esta revisión resalta la im-
portancia de fomentar una colaboración
interdisciplinaria, así como de impulsar in-
vestigaciones sólidas que permitan cerrar
la brecha entre el desarrollo tecnológico y
su implementación efectiva en la práctica
clínica, garantizando un acceso equitativo y
seguro para todos los pacientes.
Posteriormente, se plantean recomenda-
ciones clave para futuras investigaciones,
orientadas a fortalecer la calidad y aplica-
bilidad de los estudios. Es fundamental rea-
lizar estudios multicéntricos que permitan
validar los algoritmos en cohortes amplias
y diversas. Asimismo, los ECA deben mejo-
rar sus diseños mediante una aleatorización
adecuada y procedimientos de enmasca-
ramiento rigurosos. En el ámbito del repor-
te científico, se recomienda adoptar guías
estandarizadas como PRISMA-DTA para
estudios diagnósticos, lo cual facilitaría la
comparación y replicación de resultados.
Por último, se destaca la necesidad de fo-
mentar una colaboración interdisciplinaria
que incluya clínicos, ingenieros y expertos
en ética, para asegurar que el desarrollo e
implementación de sistemas de IA se reali-
cen de manera responsable y centrada en
el paciente.
Bibliografía
Abadir, A. P., Ali, M. F., Karnes, W., & Samarasena, J.
B. (2020). Artificial Intelligence in Gastrointestinal
Endoscopy. Clinical endoscopy, 53(2), 132–141.
https://doi.org/10.5946/ce.2020.038
Baquerizo-Burgos, J., Egas-Izquierdo, M., Cunto, D.,
& colaboradores. (2023). La era de la endoscopia
inteligente: cómo la inteligencia artificial potencia
la endoscopia digestiva. Acta Gastroenterológi-
ca Latinoamericana, 53(3), 211–225. https://doi.
org/10.52787/agl.v53i3.339
Barua, I., Vinsard, D. G., Jodal, H. C., Løberg, M.,
Kalager, M., Holme, Ø., Misawa, M., Bretthauer,
M., & Mori, Y. (2021). Artificial intelligence for polyp
detection during colonoscopy: a systematic review
and meta-analysis. Endoscopy, 53(3), 277–284. ht-
tps://doi.org/10.1055/a-1201-7165
Bramer, W. M., de Jonge, G. B., & Rethlefsen, M. L.
(2018). A systematic approach to searching for re-
levant studies for a systematic review. Journal of
the Medical Library Association, 106(4), 513–521.
Calderaro, J., & Kather, J. N. (2021). Artificial inte-
lligence-based pathology for gastrointestinal and
hepatobiliary cancers. Gut, 70(6), 1183–1193. ht-
tps://doi.org/10.1136/gutjnl-2020-321254
Chan, H. P., Hadjiiski, L., Samala, R. K. (2022). Com-
puter-aided diagnosis in the era of deep lear-
ning. Medical Physics, 49(1), e1–e13. https://doi.
org/10.1002/mp.15364
Chevalier, O., Dubey, G., Benkabbou, A., Majbar, M.
A., & Souadka, A. (2025). Comprehensive over-
view of artificial intelligence in surgery: a systema-
tic review and perspectives. Pflügers Archiv-Euro-
pean Journal of Physiology, 1-10.
Dhali, A., Kipkorir, V., Maity, R., Srichawla, B. S.,
Biswas, J., Rathna, R. B., ... & Dhali, G. K. (2025).
Artificial intelligence–assisted capsule endoscopy
versus conventional capsule endoscopy for de-
tection of small bowel lesions: a systematic review
and meta?analysis. Journal of Gastroenterology
and Hepatology.
PLÚA MARCILLO, W. E. ., NAVAS SUÁREZ, L. J. ., VACA CORONEL, G. M., & VITERI RUIZ, M. A.
471
RECIMUNDO VOL. 9 N°2 (2025)
APLICACIONES DE LA IA EN EL DIAGNÓSTICO QUIRÚRGICO DE ENFERMEDADES DIGESTIVAS. UNA RE-
VISIÓN SISTEMÁTICA
Filipow, N., Main, E., Sebire, N., Booth, J., Taylor, A.
M., Davies, G. & Stanojevic, S. (2022). Implemen-
tation of prognostic machine learning algorithms
in paediatric chronic respiratory conditions: a sco-
ping review. BMJ open respiratory research, 9. ht-
tps://doi.org/10.1136/bmjresp-2021-001165
GBD 2019 Diseases and Injuries Collaborators.
(2020). Global burden of 369 diseases and inju-
ries in 204 countries and territories, 1990–2019:
A systematic analysis. The Lancet, 396(10258),
1204–1222. https://doi.org/10.1016/S0140-
6736(20)30925-9
Hirasawa, T., Aoyama, K., Tanimoto, T., et al. (2018).
Application of artificial intelligence using a convo-
lutional neural network for detecting gastric cancer
in endoscopic images. Gastrointestinal Endos-
copy, 89(3), 607–613. https://doi.org/10.1016/j.
gie.2018.07.022
Hoogenboom, S. A., Bagci, U., & Wallace, M. B.
(2019). Artificial intelligence in gastroenterology:
The current state of play and the potential. How
will it affect our practice and when? Techniques in
Gastrointestinal Endoscopy, 22(2), 42–47. https://
doi.org/10.1016/j.tgie.2019.06.003
Kather, J. N., & Calderaro, J. (2020). Development
of AI-based pathology biomarkers in gastrointes-
tinal and liver cancer. Nature Reviews Gastroente-
rology & Hepatology, 17(10), 591–592. https://doi.
org/10.1038/s41575-020-0330-z
Kröner, P. T., Engels, M. M., Glicksberg, B. S., John-
son, K. W., Mzaik, O., van Hooft, J. E., Wallace, M.
B., El-Serag, H. B., & Krittanawong, C. (2021). Ar-
tificial intelligence in gastroenterology: A state-of-
the-art review. World journal of gastroenterology,
27(40), 6794–6824. https://doi.org/10.3748/wjg.
v27.i40.6794
Lambin, P., Leijenaar, R. T. H., Deist, T. M., et al.
(2021). Radiomics: the bridge between medical
imaging and personalized medicine. Nature Re-
views Clinical Oncology, 18(12), 749–762. https://
doi.org/10.1038/s41571-021-00549-9
Le Berre, C., Sandborn, W. J., Aridhi, S., Devignes,
M. D., Fournier, L., Smaïl-Tabbone, M., Danese, S.,
& Peyrin-Biroulet, L. (2020). Application of artificial
intelligence to gastroenterology and hepatology.
Gastroenterology, 158(1), 76–94.e2. https://doi.or-
g/10.1053/j.gastro.2019.08.058
Lewis, J. H., Pathan, S., Kumar, P., & Dias, C. C.
(2024). AI in Endoscopic Gastrointestinal Diagno-
sis: A Systematic Review of Deep Learning and
Machine Learning Techniques. IEEE Access, 1.
https://doi.org/10.1109/access.2024.3483432
Mansour N. M. (2023). Artificial Intelligence in Colo-
noscopy. Current gastroenterology reports, 25(6),
122–129. https://doi.org/10.1007/s11894-023-
00872-x
Minoda, Y., Ihara, E., Fujimori, N., Nagatomo, S., Esa-
ki, M., Hata, Y., et al. (2022). Efficacy of ultrasound
endoscopy with artificial intelligence for the diffe-
rential diagnosis of non-gastric gastrointestinal
stromal tumors. Scientific Reports, 12(1) https://
www.nature.com/articles/s41598-022-20863-8
Minoda, Y., Ihara, E., Komori, K., Ogino, H., Otsuka,
Y., Chinen, T., Tsuda, Y., Ando, K., Yamamoto, H.,
& Ogawa, Y. (2020). Efficacy of endoscopic ultra-
sound with artificial intelligence for the diagno-
sis of gastrointestinal stromal tumors. Journal of
gastroenterology, 55(12), 1119–1126. https://doi.
org/10.1007/s00535-020-01725-4
Minoda, Y., Ihara, E., Ogino, H., Komori, K., Otsuka,
Y., Ikeda, H., ... & Ogawa, Y. (2020). The efficacy
and safety of a promising single-channel endosco-
pic closure technique for endoscopic treatment-re-
lated artificial ulcers: A pilot study. Gastrointestinal
Tumors, 7(1-2), 21-29.
Mori, Y., Berzin, T. M., & Kudo, S. E. (2019). Artificial
intelligence for early gastric cancer: early promht-
tps://doi.org/10.1016/j.gie.2018.12.019
Mori, Y., Kudo, S. E., East, J. E., Rastogi, A., Bret-
thauer, M., Misawa, M., Sekiguchi, M., Matsuda, T.,
Saito, Y., Ikematsu, H., Hotta, K., Ohtsuka, K., Kudo,
T., & Mori, K. (2020). Cost savings in colonoscopy
with artificial intelligence-aided polyp diagnosis:
an add-on analysis of a clinical trial (with video).
Gastrointestinal endoscopy, 92(4), 905–911.e1. ht-
tps://doi.org/10.1016/j.gie.2020.03.3759
Ouyang, Y., & Hu, Y. (2023). Research trends on ar-
tificial intelligence and endoscopy in digestive di-
seases: A bibliometric analysis from 1990 to 2022.
World Journal of Gastroenterology, 29(22), 3561–
3573. https://doi.org/10.3748/wjg.v29.i22.3561
Ouzzani, M., Hammady, H., Fedorowicz, Z., & Elma-
garmid, A. (2016). Rayyan—a web and mobile app
for systematic reviews. Systematic Reviews, 5(1),
210.
Page, M. J., McKenzie, J. E., Bossuyt, P. M., Bou-
tron, I., Hoffmann, T. C., Mulrow, C. D., Shamseer,
L., Tetzlaff, C. J., Akl, E. A., Brennan, S. E., Chou,
R., Glanville, J., Grimshaw, J. M., Hróbjartsson, A.,
Lalu, M. M., Li, T., Loder, E. W., Mayo-Wilson, E.,
McDonald, S., McGuinness, L. A., Stewart, L. A.,
Thomas, J., Tricco, A. C., Welch, V. A., Whiting, P.,
& Moher, D. (2021). The PRISMA 2020 statement:
An updated guideline for reporting systematic re-
views. BMJ, 372, n71.
472 RECIMUNDO VOL. 9 N°2 (2025)
CITAR ESTE ARTICULO:
Plúa Marcillo, W. E. ., Navas Suárez, L. J. ., Vaca Coronel, G. M., & Viteri Ruiz,
M. A. . (2025). Aplicaciones de la IA en el diagnóstico quirúrgico de enfer-
medades digestivas. Una revisión sistemática. RECIMUNDO, 9(2), 458–473.
https://doi.org/10.26820/recimundo/9.(2).abril.2025.458-473
Page, M. J., McKenzie, J. E., Bossuyt, P. M., et al.
(2021). The PRISMA 2020 statement: An updated
guideline for reporting systematic reviews. BMJ,
372, n71. https://doi.org/10.1136/bmj.n71
Pecere, S., Milluzzo, S. M., Esposito, G., Dilaghi, E.,
Telese, A., & Eusebi, L. H. (2021). Applications
of Artificial Intelligence for the Diagnosis of Gas-
trointestinal Diseases. Diagnostics (Basel, Switzer-
land), 11(9), 1575. https://doi.org/10.3390/diag-
nostics11091575
Shichijo, S., Nomura, S., Aoyama, K., Nishikawa, Y.,
Miura, M., Shinagawa, T., Takiyama, H., Tanimoto,
T., Ishihara, S., Matsuo, K., & Tada, T. (2017). Appli-
cation of Convolutional Neural Networks in the
Diagnosis of Helicobacter pylori Infection Based
on Endoscopic Images. EBioMedicine, 25, 106–
111. https://doi.org/10.1016/j.ebiom.2017.10.014
Shukla, A., Chaudhary, R., & Nayyar, N. (2024). Rol
de la inteligencia artificial en la cirugía gastrointes-
tinal. Artificial Intelligence in Cancer, 5(2), 97317.
https://doi.org/10.35713/aic.v5.i2.97317
Sterne, J. A. C., Savovi?, J., Page, M. J., Elbers, R.
G., Blencowe, N. S., Cates, I. J., Cumpston, A. J.,
Davies, P. S., Higgins, J. P. T., & Churchill, R. A.
(2019). RoB 2: A revised tool for assessing risk of
bias in randomised trials. BMJ, 366, l4898.
Visaggi, P., de Bortoli, N., Barberio, B., Savarino,
V., Oleas, R., Rosi, E. M., Marchi, S., Ribolsi, M.,
& Savarino, E. (2022). Artificial intelligence in the
diagnosis of upper gastrointestinal diseases. Jour-
nal of Clinical Gastroenterology, 56(1), 23–35. ht-
tps://doi.org/10.1097/MCG.0000000000001629
Wang, P., Berzin, T. M., Glissen Brown, J. R., Bharad-
waj, S., Becq, A., Xiao, X., Liu, P., Li, L., Song, Y.,
Zhang, D., Li, Y., Xu, G., Tu, M., & Liu, X. (2019).
Real-time automatic detection system increases
colonoscopic polyp and adenoma detection rates:
a prospective randomised controlled study. Gut,
68(10), 1813–1819. https://doi.org/10.1136/gut-
jnl-2018-317500
Wang, P., Liu, X., Berzin, T. M., Glissen Brown, J.
R., Liu, P., Zhou, C., Lei, L., Li, L., Guo, Z., Lei,
S., Xiong, F., Wang, H., Song, Y., Pan, Y., & Zhou,
G. (2020). Effect of a deep-learning computer-ai-
ded detection system on adenoma detection du-
ring colonoscopy (CADe-DB trial): a double-blind
randomised study. The lancet. Gastroenterology &
hepatology, 5(4), 343–351. https://doi.org/10.1016/
S2468-1253(19)30411-X
Whiting, P. F., Rutjes, A. W. S., Westwood, M. E., Ma-
llett, S., Deeks, J. J., & Reitsma, J. B. (2011). QUA-
DAS-2: A revised tool for the quality assessment
of diagnostic accuracy studies. Annals of Internal
Medicine, 155(8), 529–536.
Yangi, K., On, T. J., Xu, Y., Gholami, A. S., Hong, J.,
Reed, A. G., ... & Preul, M. C. (2025). Artificial in-
telligence integration in surgery through hand and
instrument tracking: a systematic literature review.
Frontiers in surgery, 12, 1528362.
Yu, K. H., Beam, A. L., & Kohane, I. S. (2018). Artificial
intelligence in healthcare. Nature Biomedical Engi-
neering, 2(10), 719–731. https://doi.org/10.1038/
s41551-018-0305-z
Zhu, Y., Wang, Q. C., Xu, M. D., Zhang, Z., Cheng,
J., Zhong, Y. S., Zhang, Y. Q., Chen, W. F., Yao,
L. Q., Zhou, P. H., & Li, Q. L. (2019). Application
of convolutional neural network in the diagnosis
of the invasion depth of gastric cancer based on
conventional endoscopy. Gastrointestinal endos-
copy, 89(4), 806–815.e1. https://doi.org/10.1016/j.
gie.2018.11.011
PLÚA MARCILLO, W. E. ., NAVAS SUÁREZ, L. J. ., VACA CORONEL, G. M., & VITERI RUIZ, M. A.
473
RECIMUNDO VOL. 9 N°2 (2025)
Anexo
Tabla 1. Extracción de Datos
Nota: Elaborado por los autores. (2025)
Autor(es)
Año
País de origen
Tipo de
estudio
Tipo de IA
implementada
Población
estudiada
Enfermedad
digestiva
analizada
Comparación con
métodos
convencionales
Métricas
diagnósticas
reportadas
Hallazgos
principales
Baquerizo-
Burgos et
al.
2023
Ecuador
Revisión
narrativa
IA en endoscopia
digestiva
No
especificado
Varias (enfoque
en endoscopia)
No aplica
No especificado
La IA mejora la
precisión y eficiencia
en endoscopia.
Shukla et
al.
2024
India
Revisión
IA en cirugía
gastrointestinal
No
especificado
Varias (enfoque
en cirugía)
No aplica
No especificado
Optimización de
procedimientos
quirúrgicos con IA.
Lewis et al.
2024
Varios
Revisión
sistemática
Aprendizaje
profundo y ML
Estudios
publicados
Varias
enfermedades
digestivas
Diagnóstico
tradicional
Sensibilidad,
especificidad
La IA supera
métodos
convencionales en
diagnóstico.
Peccre et al.
2021
Italia
Revisión
IA para diagnóstico
de enfermedades GI
Pacientes con
enfermedades
GI
Varias
enfermedades
digestivas
Métodos
tradicionales
Exactitud,
sensibilidad
Mejora en
diagnóstico temprano
y reducción de
errores.
Visaggi et
al.
2022
Italia
Revisión
IA en diagnóstico
de vías digestivas
altas
Pacientes con
enfermedades
GI
Enfermedades
del tracto
superior
Endoscopia
convencional
Sensibilidad,
VPP
Mayor detección de
anomalías en
endoscopia.
Chevalier et
al.
2025
Francia
Revisión
sistemática
IA en cirugía
general
Estudios
publicados
Varias
enfermedades
digestivas
No aplica
No especificado
La IA mejora
planificación y
precisión quirúrgica.
Yangi et al.
2025
EE.UU.
Revisión
sistemática
IA en seguimiento
de instrumentos
quirúrgicos
Estudios
publicados
Varias
enfermedades
digestivas
Técnicas
tradicionales
Exactitud,
tiempo de
procedimiento
Optimización de
precisión en cirugía.
Ouyang &
Hu
2023
China
Análisis
bibliométrico
IA en endoscopia y
enfermedades
digestivas
Estudios (1990-
2022)
Varias
enfermedades
digestivas
No aplica
No especificado
Aumento exponencial
de publicaciones
sobre IA en GI.
Dhali et al.
2025
India
Meta-análisis
IA en cápsula
endoscópica
Pacientes con
lesiones
intestinales
Enfermedades
del intestino
delgado
Cápsula
endoscópica
convencional
Sensibilidad,
especificidad
Mayor detección de
lesiones con IA.
Chan et al.
2022
EE.UU.
Revisión
Aprendizaje
profundo en
diagnóstico médico
No
especificado
Varias
enfermedades
digestivas
Diagnóstico
tradicional
Exactitud, AUC
Superioridad del
aprendizaje profundo.
Hirasawa et
al.
2018
Japón
Estudio clínico
CNN para cáncer
gástrico
Pacientes con
cáncer gástrico
Cáncer gástrico
Endoscopia
convencional
Sensibilidad
(92.2%),
especificidad
(95.9%)
Alta precisión en
detección de cáncer
gástrico.
Minoda et
al. (2022)
2022
Japón
Estudio clínico
IA en ultrasonido
endoscópico
Pacientes con
tumores GI
Tumores del
estroma
gastrointestinal
Diagnóstico
tradicional
Exactitud
diagnóstica
(89.5%)
Mejora en
diagnóstico
diferencial.
Wang et al.
(2019)
2019
China
Ensayo
aleatorizado
Sistema automático
de detección de
pólipos
Pacientes en
colonoscopia
Pólipos y
adenomas
Colonoscopia
convencional
Tasa de
detección (29.1%
vs 20.3%)
Mayor detección de
adenomas con IA.
Mori et al.
(2020)
2020
Japón
Análisis de
ensayo clínico
IA en diagnóstico
de pólipos
Pacientes en
colonoscopia
Pólipos
colorrectales
Diagnóstico
tradicional
Ahorro de costos
(34.8%)
Reducción de costos
y mejora en
eficiencia.
Zhu et al.
2019
China
Estudio clínico
CNN para invasión
de cáncer gástrico
Pacientes con
cáncer gástrico
Cáncer gástrico
Endoscopia
convencional
Exactitud
(84.7%)
Evaluación precisa de
profundidad de
invasión.
Shichijo et
al.
2017
Japón
Estudio clínico
CNN para infección
por H. pylori
Pacientes con
H. pylori
Infección por H.
pylori
Métodos
tradicionales
Sensibilidad
(88.9%),
especificidad
(87.4%)
Diagnóstico no
invasivo con alta
precisión.
Barua et al.
2021
Noruega
Revisión
sistemática y
meta-análisis
IA para detección
de pólipos
Pacientes en
colonoscopia
Pólipos
colorrectales
Colonoscopia
convencional
Sensibilidad
(90%),
especificidad
(85%)
La IA aumenta la
detección de pólipos
pequeños.
Minoda et
al. (2020)
2020
Japón
Estudio piloto
IA en cierre de
úlceras post-
endoscopia
Pacientes con
úlceras
artificiales
Úlceras gástricas
Técnicas
tradicionales
Tasa de éxito
(92.9%)
Seguridad y eficacia
de la técnica asistida
por IA.
Kröner et
al.
2021
EE.UU./Países
Bajos
Revisión
IA en
gastroenterología
general
No
especificado
Varias
enfermedades
digestivas
No aplica
No especificado
Estado actual y futuro
de la IA en
gastroenterología.
Yu et al.
2018
EE.UU.
Revisión
IA en salud general
No
especificado
Enfermedades
digestivas (entre
otras)
No aplica
No especificado
Potencial de la IA
para transformar la
medicina.
Calderaro
& Kather
2021
Alemania/Francia
Revisión
IA en patología de
cáncer GI y
hepatobiliar
Pacientes con
cáncer
Cáncer
gastrointestinal y
hepático
Patología
tradicional
Exactitud,
concordancia
Mejora en
diagnóstico
histopatológico.
APLICACIONES DE LA IA EN EL DIAGNÓSTICO QUIRÚRGICO DE ENFERMEDADES DIGESTIVAS. UNA RE-
VISIÓN SISTEMÁTICA