Adewoyin A. Osonuga a,Ayokunle Osonuga b c,Déborah Omeni d,Gloria C. Okoye y,Eghosasere Egbon f,David B. Olawade g h i

Resumen del Trabajo de Osaguna AA et al 2026. sobre el empleo de la inteligencia artificial en la prevención de caídas.
La inteligencia artificial (IA) está cobrando un rol fundamental en la prevención de caídas de pacientes en el ámbito hospitalario debido a su capacidad para analizar grandes volúmenes de datos y detectar patrones complejos que escapan a las herramientas tradicionales. A diferencia de los métodos convencionales, la IA permite la integración de información clínica estructurada y no estructurada, datos provenientes de sensores ambientales y monitoreo fisiológico en tiempo real, lo que facilita la actualización continua del perfil de riesgo de cada paciente. De este modo, los sistemas basados en IA pueden identificar cambios sutiles en la condición del paciente o en el entorno hospitalario que aumentan la probabilidad de una caída, permitiendo la activación inmediata y personalizada de intervenciones preventivas.
Además, la IA contribuye a optimizar la asignación de recursos, ya que su alta capacidad predictiva reduce la necesidad de intervenciones generalizadas y costosas, enfocando los esfuerzos preventivos en aquellos pacientes realmente en riesgo. Esta precisión no solo mejora la seguridad y calidad de la atención, sino que también representa un ahorro económico sustancial para las instituciones de salud. Por último, la adopción de IA impulsa un cambio de paradigma hacia una prevención proactiva y personalizada, facilitando la colaboración multidisciplinaria y la adaptación dinámica a la creciente complejidad clínica y demográfica de los pacientes hospitalizados. Así, la inteligencia artificial se consolida como un aliado clave para reducir la incidencia y el impacto de las caídas en hospitales.
El costo de su implementación requiere una inversión importante, además un cambio fundamental de paradigma, y el agregado de nuevas tecnologías, e interoperabilidad de los sistemas analíticos del lenguaje y la historia clínicas electrónicas. Pero resulta importante incorporar al blog un avance importante en el control y prevención de las caídas en los pacientes internados, como es la inteligencia artificial en este problema de seguridad de pacientes.
La problemática de las caídas hospitalarias constituye un desafío crítico y persistente en la seguridad del paciente, con una incidencia global que afecta a entre 3 y 5 pacientes por cada 1,000 días cama. Estos eventos adversos generan no solo una elevada frecuencia de lesiones físicas —el 30-50% de las caídas provocan algún tipo de daño y entre el 2-12% resultan en lesiones graves—, sino también importantes consecuencias psicológicas, como el desarrollo del miedo a caer, disminución de la movilidad y calidad de vida, y mayor dependencia funcional. Las fracturas de cadera, que representan uno de los desenlaces más devastadores, se asocian a una significativa morbilidad y mortalidad.
Desde el punto de vista económico, las caídas hospitalarias imponen una carga considerable: los costos directos por incidente grave oscilan entre $50,000 y $150,000, pudiendo superar los $300,000 cuando se consideran los gastos indirectos y el daño reputacional. A nivel sistémico, en Estados Unidos se estiman gastos anuales de 80 mil millones de dólares relacionados con lesiones por caídas en pacientes internados. Las estrategias tradicionales de prevención, como el monitoreo continuo y el aumento de horas de enfermería, implican costos operativos elevados y resultados modestos en la reducción de tasas de caída, debido principalmente a la limitada capacidad predictiva de herramientas como la Escala de Morse y el modelo Hendrich II.
El riesgo de caídas es dinámico y multifactorial, involucrando factores intrínsecos del paciente, condiciones ambientales y variables organizacionales cambiantes. Esta complejidad demanda soluciones más sofisticadas, motivo por el cual la inteligencia artificial (IA) y el aprendizaje automático emergen como alternativas prometedoras. Las aplicaciones de IA en prevención de caídas se dividen en modelos predictivos, sistemas de detección en tiempo real y marcos integrados de prevención que combinan ambas capacidades con la activación automatizada de intervenciones clínicas. La integración de datos estructurados y no estructurados, monitoreo fisiológico y sensores ambientales permite la actualización dinámica y continua del perfil de riesgo, superando las limitaciones de las herramientas convencionales.
La adopción de tecnologías de IA implica desafíos significativos, como la adaptación a regulaciones específicas, la protección de la privacidad, la integración con los flujos de trabajo clínicos y la demostración de efectividad y valor económico. No obstante, estas innovaciones representan un cambio de paradigma hacia una prevención personalizada, proactiva y multidisciplinaria, con potencial para transformar la calidad y seguridad de la atención hospitalaria ante el creciente envejecimiento poblacional y la complejidad clínica de los pacientes. El equilibrio entre la innovación y la implementación práctica será esencial para el éxito de estas estrategias en la reducción de caídas hospitalarias.
Reflejos
- •El aprendizaje automático supera a las herramientas tradicionales de riesgo de caídas.
- •La visión artificial permite la monitorización del comportamiento en tiempo real.
- •Los sensores portátiles permiten el seguimiento del movimiento del paciente las 24 horas del día, los 7 días de la semana.
- •La PNL extrae factores de riesgo de caídas de la documentación clínica.
- •Los sistemas impulsados por IA reducen las tasas de caídas entre un 15 y un 40 % en los hospitales.
Abstract
Las caídas hospitalarias representan un desafío crítico para la seguridad del paciente, afectando a millones de pacientes a nivel mundial y resultando en morbilidad, mortalidad y costos de atención médica sustanciales. Las estrategias tradicionales de prevención de caídas, aunque beneficiosas, a menudo carecen de la precisión y la capacidad de respuesta en tiempo real necesarias para una protección óptima del paciente. Esta revisión narrativa con búsqueda sistemática examina las aplicaciones actuales, la efectividad y los desafíos de implementación de las tecnologías de inteligencia artificial (IA) en la prevención de caídas hospitalarias. Se realizó una búsqueda exhaustiva en las bases de datos PubMed, EMBASE, IEEE Xplore y Google Scholar desde enero de 2015 hasta octubre de 2024. Las tecnologías de IA demuestran ser prometedoras en cuatro dominios principales: modelos predictivos de aprendizaje automático que logran un AUROC de 0.85-0.97 (con calibración informada de forma variable), sistemas de visión artificial que permiten la monitorización del comportamiento en tiempo real (94-97% de precisión de detección en entornos controlados), tecnologías basadas en sensores que proporcionan vigilancia continua del paciente (89-96% de precisión con fusión multisensor) y procesamiento del lenguaje natural que mejora la extracción de factores de riesgo de la documentación clínica (sensibilidad IC del 95% en estudios seleccionados). Estas métricas representan principalmente estudios retrospectivos de un solo centro con validación externa limitada y tasas de caídas basales variables.
Las implementaciones exitosas informan tasas de reducción de caídas de 0,9 a 1,2 caídas por 1000 días-paciente (reducción relativa del 15-40 %) en varios entornos de atención médica, aunque las tasas basales variaron de 2,8 a 5,1 caídas por 1000 días-paciente en diferentes entornos de atención, y las tendencias seculares y la heterogeneidad del diseño del estudio limitan la inferencia causal. Los sistemas impulsados por IA ofrecen una mayor precisión de predicción, capacidades de monitoreo en tiempo real y una evaluación de riesgos personalizada.
Sin embargo, los desafíos de implementación incluyen la fatiga de alarmas (las tasas de alerta y el valor predictivo positivo rara vez se informan), el sesgo algorítmico que requiere auditorías de imparcialidad continuas, las preocupaciones por la responsabilidad cuando los sistemas de IA no logran prevenir las caídas, las preocupaciones por la privacidad de los datos, las complejidades de la integración, la adaptación del flujo de trabajo clínico y las barreras de costo sustanciales para las instituciones más pequeñas. Los desarrollos futuros deberían priorizar los sistemas de IA explicables, la validación externa en múltiples sitios con métricas estandarizadas (AUROC, AUPRC, calibración), enfoques de aprendizaje federado y ensayos de implementación que examinen tanto las tasas de caídas como los resultados del proceso de atención.
1. Introducción
Las caídas hospitalarias representan un desafío crítico y persistente en la seguridad del paciente, constituyendo uno de los eventos adversos reportados con mayor frecuencia en instituciones de salud a nivel mundial. Estos descensos involuntarios al piso o superficie de nivel inferior afectan aproximadamente de 3 a 5 pacientes por cada 1,000 días cama a nivel mundial, convirtiéndolos en una preocupación omnipresente para proveedores de salud, pacientes y sistemas de salud por igual ( Bouldin et al., 2013 ). Los resultados relacionados con las caídas varían considerablemente. Aproximadamente 30-50% de las caídas resultan en algún tipo de lesión física, mientras que 2-5% conducen a lesiones graves que requieren intervención médica (Komisar et al., 2022). Cabe destacar que las caídas representan alrededor del 3.9% de todos los casos nuevos de fractura de cadera en hombres y 7.0% en mujeres, la consecuencia más devastadora debido a sus significativas implicaciones de morbilidad y mortalidad ( Ilic et al., 2023 ). La magnitud de este problema se extiende mucho más allá de las meras cifras estadísticas, ya que las caídas hospitalarias sirven como un indicador significativo de la calidad de la atención y la cultura de seguridad del paciente dentro de las organizaciones de salud. Con el envejecimiento de la población mundial y la creciente agudeza de los pacientes en los entornos hospitalarios, la prevalencia y la complejidad de los incidentes relacionados con caídas continúan aumentando, lo que exige enfoques innovadores para la prevención y el tratamiento.El costo humano de las caídas en hospitales es profundo y multifacético, creando efectos dominó que se extienden por todo el ecosistema de atención médica. Estos incidentes resultan en daños sustanciales a los pacientes, con un 30-50% de caídas en hospitales que causan lesiones físicas que van desde hematomas y laceraciones menores hasta complicaciones graves que incluyen fracturas, lesiones en la cabeza y hemorragias internas ( Agency for Healthcare Research and Quality, 2013 ). Más alarmante aún, entre el 6 y el 12% de las caídas resultan en lesiones graves que requieren intervención médica adicional, procedimientos quirúrgicos o manejo de cuidados intensivos ( Appeadu y Bordoni, 2023 , Guirguis-Blake et al., 2024 ). El estudio de Ilic et al. (2023) sobre la epidemiología de las fracturas de cadera debido a caídas enfatiza que las fracturas de cadera siguen siendo la consecuencia más devastadora, ocurriendo en aproximadamente el 2% de las caídas en hospitales, pero representando la mayoría de la morbilidad y mortalidad relacionadas con caídas. Más allá de las consecuencias físicas inmediatas, las caídas contribuyen al trauma psicológico, incluyendo el desarrollo del síndrome de miedo a caer, disminución de la movilidad, la confianza y una menor calidad de vida, que puede persistir mucho después del incidente inicial ( Schoene et al., 2019 , Lee y Tak, 2023 ). Este impacto psicológico a menudo conduce a un deterioro funcional, mayor dependencia y menor participación en actividades de rehabilitación, creando un círculo vicioso que aumenta aún más el riesgo de caídas futuras ( Zijlstra et al., 2007 ).Las ramificaciones económicas de las caídas hospitalarias crean una carga sustancial en los sistemas de salud a nivel mundial, con costos que aumentan drásticamente cuando ocurren lesiones graves. Las lesiones relacionadas con caídas contribuyen a estadías hospitalarias prolongadas, con aumentos en la duración promedio de la estadía que varían de 6.3 a 12.8 días por incidente, dependiendo de la gravedad de la lesión y la complejidad del paciente ( Wong et al., 2011 ). Los costos médicos directos asociados con los tratamientos relacionados con caídas, incluidas las intervenciones de emergencia, los procedimientos quirúrgicos, los servicios de rehabilitación y los requisitos de atención prolongada, se estiman entre $ 50,000 y $ 150,000 por incidente de caída grave ( Morello et al., 2015 , Ganz et al., 2023 ). Al contabilizar los costos indirectos como los gastos de litigio, las sanciones regulatorias, el aumento de las primas de seguros y el daño a la reputación, el impacto económico total puede superar los $ 300,000 por evento de caída grave ( Stevens et al., 2006 , Vaishya y Vaish, 2020 ). A nivel del sistema de salud, el costo anual de las lesiones relacionadas con caídas en pacientes hospitalizados se estima en 80 mil millones de dólares solo en los Estados Unidos, lo que representa una carga financiera significativa que afecta la asignación de recursos, las decisiones de personal y la capacidad de prestación de atención médica en todos los niveles institucionales ( Haddad et al., 2024 ).La comparación económica entre la prevención de caídas impulsada por IA y las intervenciones tradicionales requiere una consideración cuidadosa. Las estrategias convencionales de prevención de caídas incurren en costos continuos sustanciales: la observación continua 1:1 del paciente («cuidadores») cuesta aproximadamente $ 25-35 por hora o $ 600-840 por período de 24 horas, lo que se traduce en costos anuales de $ 219,000- $ 306,600 por paciente monitoreado continuamente ( Stevens et al., 2006 , Morello et al., 2015 ). El aumento de las horas de enfermería, otra intervención estándar, cuesta aproximadamente $ 45-65 por hora de enfermería adicional, y las unidades de alto riesgo requieren de 2 a 4 horas adicionales por paciente por día ($ 90-260 diarios, o $ 32,850- $ 94,900 anuales por paciente). Por el contrario, los sistemas de IA implican mayores costos de capital iniciales ($ 150,000- $ 750,000) pero menores costos marginales por paciente monitoreado, lo que potencialmente ofrece ventajas económicas a escala cuando se monitorean varios pacientes simultáneamente. Esta estructura de costos hace que las soluciones de IA sean particularmente atractivas para los grandes sistemas de atención médica con altos volúmenes de caídas, aunque las instalaciones más pequeñas enfrentan mayores barreras financieras para su adopción.A pesar de décadas de iniciativas de investigación y programas de mejora de la calidad, las estrategias tradicionales de prevención de caídas han logrado solo un éxito modesto en la reducción de las tasas de caídas en diversos entornos de atención médica. Estos enfoques convencionales se basan predominantemente en herramientas de evaluación de riesgos estandarizadas, como la Escala de caídas de Morse, STRATIFY y el Modelo de riesgo de caídas de Hendrich II. Si bien estos instrumentos ofrecen capacidades útiles de detección inicial, su validez predictiva sigue siendo limitada. Los valores de sensibilidad y especificidad informados varían de 0,72 a 0,96 y de 0,51 a 0,83, respectivamente, para la Escala de caídas de Morse, y de 0,77 y 0,72 para el Modelo de riesgo de caídas de Hendrich II ( Hempel et al., 2013 , Titler et al., 2011 ). Estas cifras resaltan solo una precisión predictiva moderada, insuficiente para explicar la naturaleza dinámica y multifactorial del riesgo de caídas, que fluctúa a lo largo de la hospitalización. Las principales limitaciones incluyen criterios de evaluación subjetivos que introducen variabilidad entre evaluadores, una evaluación periódica en lugar de continua que no capta las fluctuaciones temporales del riesgo y la incapacidad de considerar la evolución de los factores de riesgo que surgen durante la hospitalización del paciente. En consecuencia, estas herramientas pueden pasar por alto a los pacientes de alto riesgo y asignar incorrectamente los recursos preventivos a aquellos con menor riesgo.La naturaleza multifactorial de las causas de las caídas complica aún más los esfuerzos de prevención tradicionales, ya que las caídas son el resultado de interacciones complejas entre factores intrínsecos del paciente, peligros ambientales y variables organizacionales que cambian continuamente durante la hospitalización. Los factores intrínsecos incluyen edad avanzada, deterioro cognitivo, limitaciones de movilidad, efectos de la medicación y condiciones médicas agudas, mientras que los factores extrínsecos abarcan peligros ambientales como mala iluminación, superficies resbaladizas, ubicación inadecuada de muebles y obstáculos relacionados con el equipo ( Currie, 2008 ). Los factores organizacionales, incluidos los niveles de personal, los patrones de comunicación, la eficiencia del flujo de trabajo y la cultura de seguridad, influyen significativamente en el riesgo de caídas, pero rara vez se capturan en las herramientas de evaluación tradicionales. Esta complejidad requiere enfoques más sofisticados que puedan acomodar múltiples variables interactuantes y adaptarse a las circunstancias clínicas cambiantes en tiempo real.El advenimiento de la inteligencia artificial (IA) y las tecnologías de aprendizaje automático presenta oportunidades para mejorar la prevención de caídas a través de una mejor predicción (identificar quién se caerá), detección en tiempo real (identificar las caídas a medida que ocurren) y estrategias de prevención específicas (determinar qué intervenciones implementar) ( Stephen et al., 2025 ). Estas tres aplicaciones representan distintos niveles de madurez tecnológica y requisitos de infraestructura. Los modelos de predicción, al estar basados principalmente en software, representan la aplicación más madura, requiriendo solo la integración de registros médicos electrónicos (EHR) e infraestructura computacional ya disponible en la mayoría de los hospitales. Los sistemas de detección, particularmente aquellos que emplean visión artificial o sensores ambientales, necesitan modernización de hardware que incluye instalaciones de cámaras, redes de sensores y dispositivos de computación de borde, lo que representa una carga de infraestructura moderada con plazos de instalación de 3 a 6 meses y costos de $ 50,000 a $ 200,000 por unidad. Los marcos de prevención, que integran predicción y detección con desencadenantes automatizados del flujo de trabajo clínico, representan la implementación más compleja, ya que requieren no solo algoritmos de predicción y hardware de detección, sino también integración bidireccional de HCE, sistemas de enrutamiento de alertas, protocolos de capacitación del personal y gestión del cambio cultural, con plazos de implementación de entre 12 y 24 meses. Comprender estos distintos niveles de madurez y requisitos de infraestructura es esencial para las instituciones sanitarias que planifican estrategias de adopción de IA.Esta revisión distingue estas tres aplicaciones superpuestas pero distintas: los modelos predictivos estiman el riesgo futuro de caídas en un horizonte temporal definido; los sistemas de detección identifican eventos de caídas o comportamientos de alto riesgo en tiempo real; y los marcos de prevención integran la predicción y la detección con los flujos de trabajo clínicos para activar intervenciones basadas en la evidencia. A diferencia de las herramientas convencionales de evaluación de riesgos, los sistemas de IA pueden integrar datos estructurados de registros médicos electrónicos, notas clínicas no estructuradas, monitoreo fisiológico en tiempo real y datos de sensores ambientales para crear perfiles de riesgo dinámicos y continuamente actualizados que reflejan la naturaleza cambiante del riesgo de caídas a lo largo de la hospitalización. Los algoritmos de aprendizaje automático sobresalen en la detección de relaciones no lineales entre variables, la identificación de patrones de riesgo previamente desconocidos y la adaptación a las poblaciones locales de pacientes y las prácticas clínicas a través de mecanismos de aprendizaje continuo ( Hill et al., 2025 , Li et al., 2020 ).La integración de las tecnologías de IA en la prevención de caídas hospitalarias representa un cambio de paradigma: de la evaluación reactiva y periódica a la monitorización proactiva y continua con capacidades de intervención personalizadas. Los sistemas de visión artificial permiten la monitorización del comportamiento en tiempo real sin comprometer la privacidad del paciente, los sensores portátiles proporcionan datos fisiológicos y de movimiento continuos, y el procesamiento del lenguaje natural extrae información valiosa de la documentación clínica que las herramientas tradicionales no pueden capturar ( Montesinos et al., 2018 ). Estos avances tecnológicos ofrecen el potencial de transformar la prevención de caídas, de una actividad principalmente impulsada por la enfermería, a un enfoque integrado y multidisciplinario respaldado por sistemas inteligentes que mejoran, en lugar de reemplazar, el criterio clínico.Sin embargo, la implementación de sistemas de prevención de caídas basados en IA no está exenta de desafíos, ya que estas tecnologías deben adaptarse a entornos regulatorios complejos, abordar cuestiones éticas y de privacidad, integrarse fluidamente con los flujos de trabajo clínicos existentes y demostrar una clara evidencia de eficacia clínica y valor económico. El rápido ritmo de los avances tecnológicos, sumado al carácter conservador de los procesos de adopción en el sector sanitario, genera una tensión entre el potencial de innovación y las realidades de la implementación práctica, que deben equilibrarse cuidadosamente para lograr una implementación exitosa.A pesar de décadas de énfasis clínico en la prevención de caídas, las caídas hospitalarias siguen siendo un desafío persistente, y los métodos tradicionales de evaluación de riesgos a menudo se quedan cortos en entornos dinámicos y de alta agudeza. Estas herramientas convencionales son reactivas, se aplican de forma intermitente y tienen una capacidad limitada para procesar datos cambiantes de pacientes en tiempo real. La creciente digitalización de los datos sanitarios y el avance de las tecnologías de inteligencia artificial (IA) ofrecen una justificación convincente para revisar y modernizar las estrategias de prevención de caídas. Sin embargo, si bien la aplicación de la IA en la atención médica se ha estudiado ampliamente, su uso específico en la prevención de caídas hospitalarias sigue siendo un campo emergente y fragmentado con una síntesis limitada de evidencia en diferentes modalidades de IA, entornos clínicos y poblaciones de pacientes. La novedad de esta revisión narrativa radica en su exploración exhaustiva de los enfoques impulsados por la IA, incluido el aprendizaje automático, la visión artificial, el procesamiento del lenguaje natural y la integración de sensores, tal como se aplican a la predicción, detección e intervención de caídas en entornos hospitalarios. El objetivo principal es consolidar el conocimiento actual, destacar aplicaciones innovadoras, examinar las barreras de implementación e identificar lagunas en la investigación, guiando así a profesionales clínicos, investigadores y administradores de atención médica en el uso de la IA para mejorar la seguridad del paciente y reducir los daños prevenibles relacionados con las caídas.
La figura 1 contrasta las estrategias tradicionales de prevención de caídas con los enfoques basados en IA, demostrando el cambio de paradigma de las evaluaciones intermitentes y subjetivas a la gestión continua, precisa y personalizada del riesgo de caídas.

2. Métodos
Esta revisión narrativa, respaldada por una búsqueda sistemática de literatura, se realizó para identificar y sintetizar la evidencia actual sobre la aplicación de la inteligencia artificial en la prevención de caídas hospitalarias. Se desarrolló y ejecutó una estrategia de búsqueda exhaustiva en múltiples bases de datos, como PubMed, EMBASE, IEEE Xplore, ACM Digital Library y Google Scholar, abarcando el período de enero de 2015 a octubre de 2025.
2.1 . Composición y experiencia del equipo de revisión
Esta revisión narrativa fue realizada por un equipo multidisciplinario con experiencia en ciencias de la enfermería, informática clínica, ingeniería biomédica, investigación en servicios de salud e inteligencia artificial. El revisor principal (AAO) posee credenciales clínicas en enfermería y salud pública, con amplia experiencia en aplicaciones de IA en entornos sanitarios. La revisión técnica de las metodologías de aprendizaje automático fue realizada por miembros del equipo con formación en informática y bioestadística. La relevancia clínica y la viabilidad de la implementación fueron evaluadas por enfermeras en ejercicio y especialistas en mejora de la calidad hospitalaria. Este enfoque multidisciplinario garantizó tanto el rigor técnico como la aplicabilidad clínica de la evidencia sintetizada.
2.2 . La estrategia de búsqueda utilizó la siguiente combinación de términos en las bases de datos.
PubMed/MEDLINE:
((“inteligencia artificial”[MeSH] O “aprendizaje automático”[MeSH] O “aprendizaje profundo”[tiab] O “red neuronal”[tiab]) Y (“caídas accidentales”[MeSH] O “caídas ”[tiab] O “prevención de caídas”[tiab]) Y (“hospitales”[MeSH] O “pacientes hospitalizados”[MeSH] O “hospital*”[tiab]))**.EMBASE, IEEE Xplore y Google Scholar emplearon combinaciones de palabras clave similares adaptadas a la sintaxis de búsqueda de cada base de datos.Se realizó una búsqueda de citas retrospectiva y prospectiva de artículos clave. Se incluyó literatura gris (actas de congresos, tesis doctorales, preprints) cuando el texto completo estaba disponible y los métodos se describían adecuadamente.Si bien la búsqueda principal abarcó de enero de 2015 a octubre de 2025, incluimos estudios fundamentales seleccionados publicados antes de 2015 que proporcionaron un contexto epidemiológico esencial o establecieron metodologías de referencia para la prevención de caídas con las que comparar las innovaciones en IA. Además, incorporamos varias publicaciones de 2025 que se publicaron durante el proceso de revisión para garantizar la vigencia de las tecnologías emergentes y los ensayos clínicos recientes. Todas las citas fuera de la ventana de búsqueda principal se indican explícitamente en la lista de referencias, con la justificación de su inclusión.Los criterios de inclusión abarcaron: (1) artículos revisados por pares publicados en inglés, (2) estudios centrados en tecnologías de IA aplicadas a la prevención de caídas en hospitales o pacientes hospitalizados, (3) informes de investigación sobre resultados de implementación o desarrollo tecnológico, y (4) estudios con sujetos humanos en entornos clínicos. Los criterios de exclusión incluyeron: (1) estudios centrados únicamente en caídas en la comunidad o en el hogar, (2) revisiones o comentarios sin datos originales, (3) resúmenes de conferencias sin disponibilidad de texto completo, (4) estudios que no abordan específicamente aplicaciones de IA o aprendizaje automático, y (5) estudios realizados exclusivamente en residencias de ancianos o centros de atención a largo plazo. La exclusión de los entornos de atención a largo plazo refleja la distinta infraestructura de prevención de caídas, las poblaciones de pacientes (principalmente residenciales en lugar de cuidados agudos), los modelos de reembolso y los marcos regulatorios en estos entornos. Los centros de atención a largo plazo enfrentan desafíos únicos, incluyendo tasas de caídas de referencia más altas (5-15 caídas por 1,000 días-residentes), diferentes modelos de personal y menor disponibilidad de la infraestructura de EHR requerida para la implementación de IA. Las revisiones futuras deberían abordar específicamente las aplicaciones de IA en estos entornos, ya que la base de evidencia en el cuidado a largo plazo aún es incipiente y requiere una síntesis dedicada.Dos revisores independientes realizaron una revisión inicial de títulos y resúmenes, seguida de una revisión completa de los artículos potencialmente relevantes. La extracción de datos se centró en: el entorno del estudio (tipo de unidad, país, nivel de ingresos), las definiciones de los resultados (caídas, caídas con lesiones, casi caídas), la prevalencia de caídas y el desequilibrio de clases, el método de validación (validación cruzada interna, temporal, externa a nivel de centro), las métricas de rendimiento (AUROC, AUPRC, sensibilidad, especificidad, medidas de calibración cuando se informaron), el tamaño de la muestra, los detalles de la implementación (destinatarios de alertas, protocolos de respuesta) y cualquier informe de imparcialidad o sesgo.Dada la heterogeneidad de los estudios incluidos, con diversas metodologías, definiciones de resultados, técnicas de IA, entornos clínicos y métricas de rendimiento, se adoptó un enfoque de síntesis narrativa. Debido a esta heterogeneidad, no fue posible realizar un metanálisis formal . Si bien existen marcos de evaluación del riesgo de sesgo como PROBAST (Herramienta de Evaluación del Riesgo de Sesgo de Modelos de Predicción) y PROBAST-AI para estudios de modelos de predicción, la literatura incluida combina modelos de predicción, sistemas de detección y evaluaciones de implementación, lo que impide una evaluación uniforme del sesgo. Las principales limitaciones metodológicas de cada estudio se señalan a lo largo de la síntesis narrativa.
3. Antecedentes: Caídas hospitalarias y factores de riesgo
Las caídas hospitalarias representan un fenómeno complejo y multifactorial, influenciado por la intrincada interacción de factores específicos del paciente, ambientales y organizacionales, que crean un perfil de riesgo dinámico y único para cada individuo y entorno clínico. Esta naturaleza multifacética distingue las caídas hospitalarias de otros eventos adversos, ya que el conjunto de riesgos cambia continuamente a lo largo de la hospitalización del paciente, lo que dificulta especialmente la predicción y la prevención para los equipos de salud.Los factores de riesgo intrínsecos relacionados con el paciente forman la base de la susceptibilidad a las caídas y abarcan un amplio espectro de características fisiológicas, psicológicas y funcionales. La edad avanzada sigue siendo el predictor más significativo, con tasas de caídas que aumentan exponencialmente después de los 65 años, llegando a 8-12 caídas por cada 1000 días de cama en pacientes mayores de 85 años ( Bouldin et al., 2013 ). El deterioro cognitivo, incluido el delirio, la demencia y la confusión inducida por medicamentos, afecta el juicio, la conciencia espacial y los comportamientos de seguridad, y los pacientes delirantes experimentan tasas de caídas de 2 a 3 veces más altas que los individuos cognitivamente intactos. Las limitaciones de movilidad resultantes de la debilidad muscular, los trastornos del equilibrio, las anomalías de la marcha y la hipotensión ortostática crean riesgos directos de caídas mecánicas que a menudo se ven exacerbados por el reposo prolongado en cama y el desacondicionamiento durante la hospitalización ( Dykes et al., 2010 ).Los efectos de los medicamentos representan un factor de riesgo particularmente modificable pero complejo, con la polifarmacia (cinco o más medicamentos) aumentando el riesgo de caídas en un 28% y clases específicas de medicamentos que conllevan perfiles de riesgo distintos. Los medicamentos psicotrópicos, incluidos los sedantes, antipsicóticos y antidepresivos, deterioran la función cognitiva y la coordinación motora, mientras que los medicamentos cardiovasculares como los antihipertensivos y los diuréticos contribuyen a la hipotensión ortostática y los desequilibrios electrolíticos. Los analgésicos opioides crean sedación y deterioro de la propiocepción, mientras que los anticoagulantes, aunque no aumentan directamente el riesgo de caídas, amplifican significativamente la gravedad de las lesiones cuando ocurren caídas ( Staggs et al., 2014 ). Las condiciones comórbidas como el delirio, la depresión, la enfermedad cardiovascular, la diabetes con neuropatía y las deficiencias visuales crean efectos de riesgo multiplicativos en lugar de aditivos, y los pacientes que tienen tres o más comorbilidades experimentan tasas de caídas 4 a 5 veces más altas que aquellos con condiciones únicas.Los peligros ambientales dentro de los entornos hospitalarios crean factores de riesgo extrínsecos que interactúan dinámicamente con las vulnerabilidades de los pacientes para precipitar las caídas. Las malas condiciones de iluminación, en particular durante las horas nocturnas y en los baños, perjudican la agudeza visual y la percepción de profundidad cuando los pacientes son más vulnerables debido a la interrupción del sueño y los efectos de la medicación. Las superficies resbaladizas de las soluciones de limpieza, los líquidos derramados o los revestimientos de suelo inadecuados crean peligros mecánicos inmediatos, mientras que los pasillos abarrotados de equipos médicos, muebles y pertenencias personales obstruyen las rutas de deambulación seguras. Los sistemas de señalización y orientación inadecuados contribuyen a la confusión del paciente y a los intentos de navegación inseguros, particularmente problemáticos para pacientes con deterioro cognitivo o desconocidos ( Currie, 2008 ). Las variaciones de altura de la cama, la ausencia de barandillas de cama cuando es necesario y las luces de llamada mal ubicadas obligan a los pacientes a intentos de transferencia inseguros. Las instalaciones de los baños presentan entornos particularmente de alto riesgo debido a las superficies duras, las condiciones húmedas y las restricciones de privacidad que limitan la supervisión del personal durante las actividades vulnerables.Los factores organizacionales representan las influencias sistémicas que dan forma al riesgo de caídas a través de los patrones de personal, la efectividad de la comunicación, el diseño del flujo de trabajo y la cultura de seguridad institucional. Los niveles de personal de enfermería demuestran relaciones inversas con las tasas de caídas, y cada hora adicional de enfermería por día de paciente se asocia con reducciones del 3 al 12 % en los incidentes de caídas, según el tipo de unidad y la agudeza del paciente ( Spetz et al., 2013 ). Los patrones de comunicación entre turnos, disciplinas y familiares afectan la transferencia de información sobre el estado de riesgo del paciente, y las fallas de comunicación contribuyen al 60 al 70 % de los eventos de caídas graves debido a la identificación de riesgos omitidos o retrasos en la intervención. Los factores de diseño del flujo de trabajo, incluidos los tiempos de respuesta de enfermería a las luces de llamada, el momento de la administración de medicamentos y la disponibilidad de asistencia para ir al baño y deambular, crean ventanas de vulnerabilidad cuando los pacientes intentan actividades independientes que superan sus capacidades. Las variables de la cultura de seguridad, que abarcan el compromiso del liderazgo, la participación del personal en las iniciativas de seguridad y el aprendizaje organizacional de los eventos adversos, influyen tanto en los comportamientos individuales como en la efectividad de la prevención a nivel del sistema.La complejidad de las causas de las caídas requiere enfoques integrales de evaluación de riesgos que puedan dar cabida a múltiples variables interactuantes y al mismo tiempo adaptarse a la naturaleza dinámica de la hospitalización. Las herramientas de evaluación tradicionales, si bien son valiosas para la detección inicial y proporcionan marcos estandarizados, a menudo no logran capturar las fluctuaciones temporales y las interacciones complejas que caracterizan el riesgo real de caídas en la práctica clínica. Los factores de riesgo no operan de forma aislada, sino que crean efectos sinérgicos donde las combinaciones de factores aparentemente menores producen aumentos desproporcionados del riesgo de caídas. Por ejemplo, el deterioro cognitivo leve combinado con la administración de nuevos medicamentos y un entorno desconocido crea un riesgo exponencialmente mayor que cualquier factor por sí solo ( Oliver et al., 2010 ). Además, el riesgo de caídas fluctúa drásticamente en función de los cambios de medicación, el deterioro clínico, las modificaciones ambientales y las variaciones horarias que las herramientas de evaluación estáticas no pueden capturar de forma eficaz. La dinámica temporal del riesgo de caídas presenta desafíos particulares para los enfoques tradicionales de prevención, ya que el estado del paciente cambia continuamente durante la hospitalización debido a intervenciones médicas, ajustes de medicación y progresión clínica. Las horas de la mañana después de la sedación nocturna, los períodos postanestésicos y los momentos inmediatamente posteriores a la administración de la medicación representan períodos de máxima vulnerabilidad que requieren una mayor vigilancia e intervención. Los fines de semana y los turnos de noche presentan tasas elevadas de caídas debido a la reducción de personal y a los patrones de supervisión modificados, mientras que las transiciones de la atención al paciente entre unidades o después de un procedimiento generan lagunas de información que aumentan la exposición al riesgo.Las caídas pueden tener consecuencias devastadoras que se extienden mucho más allá del incidente inmediato, creando efectos en cascada que impactan los resultados del paciente, los costos de atención médica y la responsabilidad legal. Las lesiones físicas varían desde daños menores en los tejidos blandos hasta complicaciones potencialmente mortales, donde las fracturas de cadera representan el resultado más grave, ocurriendo en aproximadamente el 2% de las caídas hospitalarias, pero representando la mayoría de la morbilidad y mortalidad relacionadas con caídas ( Ilic et al., 2023 ). Las lesiones cerebrales traumáticas, aunque menos frecuentes, tienen profundas implicaciones para la función cognitiva y la independencia a largo plazo, particularmente en pacientes de edad avanzada con reserva fisiológica limitada. El deterioro funcional después de las lesiones por caídas a menudo excede el atribuible a la condición médica original, y los pacientes experimentan períodos de recuperación prolongados, mayores niveles de dependencia y un potencial de rehabilitación reducido. Las tasas de mortalidad del 10-15% después de lesiones graves relacionadas con caídas en pacientes hospitalizados reflejan tanto la gravedad de las lesiones como la vulnerabilidad de las poblaciones afectadas. Más allá del daño físico, las caídas contribuyen a consecuencias psicológicas significativas que pueden persistir mucho después de que se produce la curación física, creando impactos duraderos en la calidad de vida del paciente y la independencia funcional. El miedo a caer, que afecta al 40-60% de los pacientes que experimentan caídas en el hospital, conduce a la restricción de la actividad, el aislamiento social y el deterioro funcional progresivo que puede superar las limitaciones impuestas por la lesión original ( Lee y Tak, 2023 , Zijlstra et al., 2007 ). La confianza reducida en la movilidad afecta la participación en actividades de rehabilitación, la voluntad de deambular de forma independiente y las trayectorias generales de recuperación, a menudo requiriendo niveles más altos de atención y estadías institucionales prolongadas. Los familiares también experimentan angustia psicológica, que incluye culpa, ansiedad por futuras caídas y pérdida de confianza en las capacidades del proveedor de atención médica, lo que crea cargas emocionales adicionales que afectan los sistemas de apoyo al paciente y las decisiones de atención.Las implicaciones legales y regulatorias de las caídas hospitalarias crean niveles adicionales de complejidad para las instituciones de salud, ya que las caídas se consideran eventos en gran medida prevenibles que reflejan la calidad de la atención y las prácticas de seguridad. Los organismos reguladores, incluyendo la Comisión Conjunta y los departamentos de salud estatales, mantienen requisitos estrictos para los programas de prevención de caídas, la notificación de incidentes y las iniciativas de mejora de la calidad, cuyas deficiencias pueden resultar en sanciones de acreditación o multas económicas ( Comisión Conjunta, 2023 ). Los riesgos de litigio asociados con las lesiones por caídas siguen aumentando, con montos promedio de liquidación por lesiones graves relacionadas con caídas que oscilan entre $300,000 y $2.5 millones, dependiendo de la gravedad de la lesión, la edad del paciente y las circunstancias que rodean el evento. Estas presiones legales y regulatorias crean incentivos convincentes para que las instituciones de salud inviertan en estrategias integrales de prevención de caídas que demuestren una eficacia medible en la reducción tanto de las tasas de caídas como de la gravedad de las lesiones. Para contextualizar visualmente la interacción entre la modificabilidad de los factores de riesgo y la disponibilidad de datos, la Figura 2 mapea los determinantes del riesgo de caídas modificables y no modificables a sus correspondientes flujos de datos accesibles mediante IA, destacando las entradas multidimensionales que permiten marcos integrales de predicción y prevención de riesgos.

La Tabla 1 relaciona sistemáticamente los factores de riesgo de caídas con su grado de modificabilidad, las fuentes de datos disponibles (HCE, wearables, sensores, PLN) y las aplicaciones de IA correspondientes para su predicción o detección. Dado que la fragilidad acelera el deterioro funcional tras una caída y el ejercicio representa la principal intervención modificable, una síntesis bibliométrica reciente destaca el crecimiento sostenido y la colaboración internacional en la literatura sobre ejercicio y fragilidad (Azizan, 2024a ), lo que respalda la justificación del triaje basado en IA para programas de ejercicio estructurados como parte de los paquetes integrales de prevención de caídas.Tabla 2 .
Tabla 1. Asignación de factores de riesgo de caídas a los flujos de datos disponibles.
| Categoría de factor de riesgo | Ejemplos | ¿Modificable? | Fuente(s) de datos primarios | Aplicación de IA |
|---|---|---|---|---|
| Demográfico | Edad, sexo | No modificable | Campos estructurados de EHR | Modelos de predicción |
| Cognitivo | Delirio, demencia, confusión | Parcialmente modificable | Historia clínica electrónica + notas de enfermería (PNL) | Predicción + Extracción de PNL |
| Movilidad/Funcional | Inestabilidad de la marcha, debilidad muscular, trastornos del equilibrio. | Modificable | Dispositivos portátiles, sensores de marcha y evaluaciones de fisioterapia | Predicción + detección |
| Medicamentos | Psicotrópicos, antihipertensivos, polifarmacia | Modificable | Listas de medicamentos de la HCE | Modelos de predicción |
| Sensorio | Discapacidad visual, déficit de propiocepción | Parcialmente modificable | HCE + notas clínicas (PLN) | Modelos de predicción |
| Comorbilidades | Accidente cerebrovascular, diabetes, enfermedad cardiovascular | No modificable (condición) pero efectos modificables | EHR estructurado + notas | Modelos de predicción |
| Ambiental | Mala iluminación, pisos mojados, desorden, altura de la cama. | Modificable | Visión artificial, sensores ambientales | Sistemas de detección |
| Conductual | Intentos de transferencia inseguros, uso del baño sin ayuda | Modificable | Visión artificial y wearables | Detección en tiempo real + alertas |
| Organizativo | Niveles de personal, tiempos de respuesta, cultura de seguridad | Modificable (a nivel de sistema) | Metadatos de EHR, datos de flujo de trabajo | Investigación de implementación |
| Psicológico | Miedo a caer, depresión, ansiedad. | Modificable | Notas de enfermería (PNL), resultados informados por el paciente | Predicción + focalización de la intervención |
Tabla 2. Comparación del rendimiento de las tecnologías de detección de caídas basadas en IA por entorno clínico.
| Entorno clínico | Tipo de tecnología | Método de detección | Exactitud (%) | Tiempo de respuesta | Población de pacientes | Ventajas clave | Desafíos de implementación | Referencia |
|---|---|---|---|---|---|---|---|---|
| Unidades médicas/quirúrgicas | Visión artificial + aprendizaje automático | Estimación de la postura, análisis de la marcha | 88–92 | 2–5 segundos | Pacientes adultos en general | Monitorización continua y no invasiva | Preocupaciones sobre la privacidad y dependencias de la iluminación | AJMC., 2019 , Hill y otros, 2025 |
| Unidades de cuidados intensivos | Fusión multisensor | Acelerómetro + cámara + signos vitales | 94–97 | 1–3 segundos | Pacientes sedados y gravemente enfermos | Datos multimodales de alta sensibilidad | Integración compleja, falsas alarmas | Dai et al., 2024 , Lee et al., 2017 |
| Salas geriátricas | Sensores portátiles y ambientales | Acelerómetro + tapetes de presión | 89–93 | 3–8 segundos | Personas mayores con movilidad reducida | Comodidad, monitoreo 24/7 | Cumplimiento del dispositivo, problemas de carga | Ruiz-García et al., 2023 , Igual et al., 2013 |
| Departamentos de Emergencia | Modelos predictivos de aprendizaje automático | Datos de EHR + evaluaciones de triaje | 85–89 | 10–30 minutos | Diversos niveles de agudeza | Identificación temprana de riesgos | Variaciones en la calidad de los datos | Hekman et al., 2023 , Staggs et al., 2014 |
| Unidades de rehabilitación | Análisis de la marcha + IA | Captura de movimiento 3D + ML | 91–95 | 5–15 segundos | Pacientes posquirúrgicos con accidente cerebrovascular | Evaluación precisa de la movilidad | Costo del equipo, requisitos de espacio | Howcroft et al., 2013 , Bet et al., 2019 |
| Unidades psiquiátricas | Visión artificial (preservación de la privacidad) | Análisis de siluetas + reconocimiento de comportamiento | 86–90 | 3–7 segundos | Pacientes de salud mental | Mantiene la dignidad, reduce la agitación. | Imprevisibilidad del comportamiento | Kalron y Achiron, 2013 , Yu et al., 2012 |
| Unidades pediátricas | Dispositivos portátiles ligeros + aprendizaje automático | Miniacelerómetros + reconocimiento de actividad | 83–87 | 2–6 segundos | Niños, adolescentes | Dispositivos apropiados para la edad | Limitaciones de tamaño, necesidades de supervisión. | Yang et al., 2024 , Singh y Suresh, 2021 |
4. Metodologías de IA en la prevención de caídas
4.1 . Aprendizaje automático y modelado predictivo
Los enfoques de aprendizaje automático han demostrado un mejor rendimiento en comparación con las herramientas tradicionales de evaluación de riesgos para predecir caídas hospitalarias, aunque las métricas reportadas varían considerablemente. Los algoritmos de aprendizaje supervisado, como la regresión logística, los bosques aleatorios, las máquinas de vectores de soporte y los métodos de potenciación de gradiente, se han empleado ampliamente con datos de historias clínicas electrónicas (HCE).Choi et al. (2023) desarrollaron y validaron múltiples modelos de aprendizaje automático para predecir caídas intrahospitalarias entre pacientes con accidente cerebrovascular agudo, utilizando datos de 8462 admisiones. Entre seis algoritmos probados bajo validación interna (validación cruzada de 5 veces), el modelo de refuerzo de gradiente extremo (XGB) logró un AUROC de 0,85 (IC del 95 %: 0,78-0,92), superando a la Escala de caídas de Morse (AUROC: 0,76). No se informaron las métricas de calibración (Choi et al. 2023 ). Los modelos Bayes ingenuo y XGB registraron la puntuación F1 más alta de 0,44. Zhou et al. (2024) desarrollaron y evaluaron tres modelos de predicción, regresión logística, bosque aleatorio y Bayes ingenuo, para identificar a los pacientes con alto riesgo de caídas. El estudio incluyó a 459 participantes, de los cuales 156 (34,0 %) fueron clasificados como de alto riesgo de caídas. Para desarrollar los modelos se incorporaron siete predictores independientes: estado de fragilidad, edad, tabaquismo, antecedentes de infarto, enfermedad cerebrovascular, artritis y osteoporosis. Entre estos, el modelo de regresión logística demostró el mejor rendimiento, logrando un área bajo la curva de 0,856, una precisión de 0,797 y una sensibilidad de 0,735 en el conjunto de prueba. Estos resultados resaltan el potencial de los modelos de aprendizaje automático para proporcionar predicciones específicas de la enfermedad y clínicamente procesables, ofreciendo una precisión mejorada en comparación con las herramientas tradicionales de evaluación del riesgo de caídas. De manera similar,Sahni et al. (2025) implementaron un enfoque de aprendizaje por conjuntos que logró una sensibilidad del 97,93 % y una especificidad del 98,99 % en la validación interna; sin embargo, estos resultados se basaron en un conjunto de datos retrospectivo con un manejo poco claro del desequilibrio de clases y sin validación externa, lo que limita la generalización. Los modelos de aprendizaje profundo, en particular las redes neuronales recurrentes (RNN) y las redes de memoria a largo plazo (LSTM), analizan patrones temporales en datos secuenciales de pacientes. Butt et al. (2022) realizaron un análisis comparativo de dos arquitecturas, redes de memoria a largo plazo (LSTM) y redes neuronales convolucionales (CNN) utilizando aprendizaje por transferencia. El modelo de aprendizaje por transferencia basado en CNN logró el mayor rendimiento, con una precisión del 98 %. Estos modelos se destacan por capturar relaciones temporales complejas que pueden no ser evidentes a través de enfoques estadísticos tradicionales. Se han empleado técnicas de aprendizaje no supervisado para identificar patrones de riesgo y subgrupos de pacientes previamente desconocidos. Los algoritmos de agrupamiento han revelado fenotipos de riesgo de caídas distintos que pueden requerir estrategias de intervención personalizadas ( Stuby et al., 2025 , Goh et al., 2022 ). Sin embargo, la validación clínica de estos fenotipos basados en datos sigue siendo incipiente.La elección del algoritmo de aprendizaje automático influye fundamentalmente en los requisitos de datos, la viabilidad de la implementación y las demandas computacionales. Los modelos de regresión logística, si bien ofrecen alta interpretabilidad y requieren conjuntos de datos de entrenamiento más pequeños (típicamente 10-15 eventos por variable predictora), pueden tener un rendimiento inferior al de capturar relaciones no lineales complejas. Los bosques aleatorios y los métodos de potenciación de gradiente (XGBoost, LightGBM) demuestran un rendimiento robusto con requisitos de datos moderados (típicamente 500-1000 eventos de caída para un entrenamiento confiable), manejan los datos faltantes de manera efectiva y proporcionan métricas de importancia de características valiosas para la interpretación clínica. Las arquitecturas de aprendizaje profundo, incluidas las redes neuronales recurrentes (RNN) y las redes de memoria a corto plazo (LSTM), sobresalen en la captura de dependencias temporales en datos secuenciales de pacientes, pero exhiben un «hambre de datos» sustancial, que generalmente requiere 5000-10 000 eventos de caída para un entrenamiento adecuado y 20 000-50 000 para un rendimiento óptimo ( Butt et al., 2022 ). Esta intensidad de datos dificulta las implementaciones en una sola institución, especialmente en unidades especializadas con menor volumen de caídas, lo que requiere colaboraciones multiinstitucionales o enfoques de aprendizaje federado para obtener suficientes datos de entrenamiento. Los requisitos computacionales varían de forma similar: la regresión logística y los modelos basados en árboles se ejecutan eficientemente en servidores hospitalarios estándar, mientras que los modelos de aprendizaje profundo pueden requerir unidades de procesamiento gráfico (GPU) para el entrenamiento y la inferencia, lo que aumenta los costos de hardware entre $10,000 y $50,000.Los avances recientes en arquitecturas híbridas demuestran enfoques prometedores para equilibrar el rendimiento y la eficiencia de los datos. Bostani et al. (2023) desarrollaron un perceptrón multicapa basado en aprendizaje de refuerzo (MLP-RL) para el diagnóstico del riesgo cardiovascular en atletas, logrando una medida F del 87,4 % y una media geométrica del 89,6 % mediante un novedoso marco de aprendizaje de refuerzo que considera la clasificación como una toma de decisiones secuencial, recompensando las predicciones correctas en cada capa. Su enfoque aborda el desequilibrio de datos mediante la optimización de colonias artificiales de abejas basada en aprendizaje mutuo (ML-ABC), superando la sensibilidad a la inicialización común en los métodos basados en gradientes. Aplicada al cribado cardiovascular, esta metodología ofrece paralelismos directos con la predicción del riesgo de caídas: ambas implican el procesamiento de datos fisiológicos complejos (signos vitales, medidas antropométricas) para evaluar el riesgo físico en tiempo real. El éxito del marco MLP-RL en el manejo de conjuntos de datos desequilibrados, un desafío universal en la predicción de caídas, donde los casos sin caídas superan ampliamente a los eventos de caída, y su capacidad para aprender límites de decisión óptimos sin un ajuste exhaustivo de hiperparámetros, sugieren posibles aplicaciones en la prevención de caídas en hospitales. Las investigaciones futuras deberían explorar si las arquitecturas basadas en el aprendizaje de refuerzo pueden mejorar la precisión de la predicción de caídas y, al mismo tiempo, mantener una eficiencia computacional adecuada para la implementación en hospitales en tiempo real.Los algoritmos de optimización bioinspirados representan otra dirección prometedora para mejorar el rendimiento de los modelos predictivos. Jamshidi et al. (2024) demostraron la aplicación del Algoritmo Dragonfly (AD) para optimizar un Perceptrón Multicapa Wavelet (WMLP) para la detección de cáncer de pulmón en imágenes de TC, logrando una precisión del 99,82 % tanto en el entrenamiento como en las pruebas. El Algoritmo Dragonfly, una técnica de optimización metaheurística inspirada en la naturaleza que imita el comportamiento de enjambre de las libélulas, explora sistemáticamente el espacio de parámetros para identificar pesos de red óptimos e hiperparámetros sin dependencias del descenso de gradiente. Este enfoque es especialmente relevante para los algoritmos de riesgo de caídas, donde minimizar los falsos positivos es fundamental para prevenir la fatiga de alarmas. La optimización tradicional basada en gradientes puede converger a mínimos locales, lo que resulta en compensaciones subóptimas entre sensibilidad y especificidad; los algoritmos bioinspirados exploran el espacio de soluciones con mayor profundidad, identificando potencialmente configuraciones que maximizan simultáneamente la sensibilidad (detectando verdaderos riesgos de caídas) y la especificidad (minimizando las falsas alarmas). La implementación en la prevención de caídas implicaría optimizar no solo los pesos del modelo, sino también los umbrales de decisión adaptados a contextos clínicos específicos (p. ej., UCI vs. unidades médico-quirúrgicas) y la tolerancia al riesgo institucional. Sin embargo, estos enfoques de optimización requieren recursos computacionales considerables (tiempos de entrenamiento de 24 a 72 h en sistemas multinúcleo) y validación en diversas poblaciones de pacientes para garantizar su generalización.
4.2 . Visión artificial y videovigilancia
Los sistemas de visión artificial representan un avance significativo en la prevención de caídas en tiempo real, ya que permiten la monitorización continua del comportamiento y los patrones de movimiento del paciente. Estos sistemas utilizan redes neuronales convolucionales (CNN) y algoritmos de estimación de postura para analizar transmisiones de vídeo e identificar comportamientos de alto riesgo y caídas en el momento en que ocurren (detección), a diferencia de predecir caídas futuras.La plataforma de detección de caídas SafelyYou, basada en IA e implementada en múltiples centros sanitarios, emplea visión artificial para detectar caídas y cuasi accidentes con una precisión del 95 % ( AJMC, 2019 ). Wang et al. (2020) analizaron sistemas que utilizan cámaras de profundidad y análisis de siluetas para preservar la privacidad del paciente, a la vez que monitorizan cambios posturales repentinos indicativos de caídas. Los métodos que preservan la privacidad incluyen el procesamiento de bordes (análisis de vídeo local en lugar de transmitir imágenes sin procesar), la anonimización en el dispositivo y el análisis basado en siluetas en lugar de imágenes identificables ( Wang y Lin, 2024 ).Los modelos de estimación de postura, como OpenPose y MediaPipe, se han adaptado para aplicaciones sanitarias, lo que permite el análisis en tiempo real de la postura y los patrones de marcha de los pacientes. El análisis de Hill et al. (2025) de los modelos de estimación de postura basados en aprendizaje automático utilizados en el análisis del movimiento y la postura humana evidenció una precisión superior al 80 % en la identificación de pacientes con alto riesgo de caídas, basándose en patrones de movilidad observados durante actividades rutinarias. Sin embargo, el rendimiento se degrada considerablemente en condiciones de poca iluminación, oclusión (p. ej., cuando los pacientes están parcialmente ocultos por el equipo) y limitaciones en la línea de visión. Los enfoques de fusión de sensores, que combinan la visión artificial con acelerómetros portátiles y sensores ambientales, abordan estas limitaciones y mejoran la robustez de la detección ( Zhao et al., 2024 ).Para mejorar aún más la privacidad y la calidad de la imagen, Li et al. (2022) presentan un novedoso marco de detección de caídas llamado DCLSTMAE, que utiliza convolución dilatada y LSTM para extraer eficientemente características espacio-temporales de datos de vídeo. El método está diseñado para operar con datos sin etiquetar, lo que mejora la privacidad y logra una alta precisión en la detección de caídas, con una precisión reportada del 97,1 % en el conjunto de datos UR.Más allá de las CNN convencionales, los Transformadores de Visión (ViT) demuestran un rendimiento superior en imágenes médicas gracias a mecanismos de autoatención que permiten una comprensión holística de la escena. Khaniki et al. (2025) lograron una precisión del 98,93 % en la clasificación de tumores cerebrales utilizando ViT con Mecanismo de Calibración de Características y Atención Cruzada Selectiva, superando así a las CNN estándar. Para la detección de caídas, los ViT ofrecen ventajas en entornos hospitalarios complejos, manteniendo una detección robusta a pesar de oclusiones, iluminación variable y diversas posiciones del paciente, al prestar atención a las partes visibles del cuerpo e inferir las regiones ocluidas. Sin embargo, los ViT requieren conjuntos de datos de entrenamiento considerablemente mayores (10 000-50 000 frente a 2 000-5 000 fotogramas etiquetados) y una memoria GPU de 2 a 3 veces mayor, lo que podría aumentar la latencia en escenarios de monitorización multipaciente.El procesamiento perimetral que preserva la privacidad presenta desventajas críticas en términos de latencia. Si bien los dispositivos perimetrales garantizan que el video sin procesar se mantenga local, su menor potencia computacional (entre una décima y una quinta parte de la de las GPU en la nube) aumenta la latencia de inferencia de 30 a 50 ms a 200-400 ms por fotograma, extendiéndose a 500-800 ms para el análisis basado en siluetas que requiere preprocesamiento. Si bien son adecuados para cambios graduales de posición, estos retrasos pueden comprometer la detección de caídas rápidas (<1 s). Los sistemas futuros deben equilibrar la protección de la privacidad, la eficiencia computacional y la sensibilidad de detección mediante enfoques escalonados donde los dispositivos perimetrales realizan un cribado preliminar y activan el análisis en la nube para eventos de alto riesgo.
4.3 . Tecnologías de sensores ambientales y portátiles
Los sistemas de prevención de caídas basados en sensores abarcan tanto dispositivos portátiles como tecnologías de monitorización ambiental que recopilan datos fisiológicos y de movimiento de forma continua. Los acelerómetros, giroscopios y magnetómetros integrados en dispositivos portátiles pueden detectar anomalías en la marcha, inestabilidad del equilibrio y patrones de movimiento repentinos asociados con el riesgo de caídas ( Li et al., 2025 ).Ruiz-García et al. (2023) amplían CareFall, un sistema automatizado de detección de caídas diseñado para adultos mayores mediante relojes inteligentes portátiles equipados con acelerómetros y giroscopios de 3 ejes. Incorpora dos estrategias de detección: un método basado en umbrales y un enfoque de aprendizaje automático más avanzado. El modelo de aprendizaje automático supera significativamente al método de umbrales, demostrando una precisión del 98,4 % frente al 77,3 %, con una sensibilidad y especificidad mejoradas en condiciones de laboratorio controladas. Los sensores ambientales, como las alfombrillas sensibles a la presión, los detectores de movimiento infrarrojos y los sistemas de radar, ofrecen funciones de monitorización no invasiva. El sistema GaitRite se ha integrado con algoritmos de IA para analizar los parámetros de la marcha y predecir el riesgo de caídas con una precisión del 86 % ( Rehman et al., 2020 ). Los enfoques de fusión multisensor combinan datos de diversas modalidades de detección para mejorar la precisión de la detección y reducir los falsos positivos. Ejupi et al. (2017) y Taramasco et al. (2025) demostraron que la combinación de datos de acelerómetros portátiles con sensores de presión ambiental mejoró la precisión de la detección de caídas del 82 % al 96 % en entornos experimentales. Sin embargo, los dispositivos portátiles se enfrentan a desafíos prácticos, como la adherencia del paciente (disposición a usar los dispositivos de forma constante), la carga excesiva (los dispositivos que requieren recarga diaria reducen su usabilidad), los problemas de integridad de la piel (lesiones por presión, reacciones alérgicas) y los flujos de trabajo de asignación de dispositivos al ingreso y al alta. Las tasas de falsas alarmas, cruciales para prevenir la fatiga por alarmas, deberían reportarse por cada 100 horas-paciente junto con el valor predictivo positivo; sin embargo, rara vez se cuantifican en la literatura. La integración con los flujos de trabajo de enfermería debe especificar los destinatarios de las alertas, los protocolos de escalamiento y los tiempos de respuesta esperados para que la detección se traduzca en prevención.
4.4 . Procesamiento del lenguaje natural
Las técnicas de procesamiento del lenguaje natural (PLN) extraen información valiosa relacionada con las caídas de la documentación clínica no estructurada, incluyendo notas de enfermería, evaluaciones médicas e informes de incidentes. Los enfoques de PLN abarcan desde léxicos de palabras clave y sistemas basados en reglas hasta modelos de lenguaje neuronal; la portabilidad entre diferentes proveedores de HCE y estilos de documentación sigue siendo un desafío ( Eguia et al., 2024 , Nakatani et al., 2019 ). Estos enfoques pueden identificar factores de riesgo no capturados en campos de datos estructurados, como el delirio, el nivel de sedación, el uso de ayudas para la marcha y el miedo a las caídas, que pueden documentarse mejor en notas narrativas que en campos discretos de HCE, y mejoran la exhaustividad de la evaluación del riesgo de caídas.Nakatani et al. (2019) demostraron con éxito que las caídas en pacientes hospitalizados pueden predecirse mediante el análisis de registros de enfermería mediante un algoritmo de PLN combinado con aprendizaje automático. Los resultados de la predicción, utilizando el conjunto de datos de prueba, mostraron sensibilidad y especificidad con intervalos de confianza del 95 %; sin embargo, el tamaño de la muestra y el método de validación (interno vs. externo) fueron limitados. Estos hallazgos resaltan la eficacia del PLN y el aprendizaje automático para extraer factores de riesgo de caídas de la documentación de enfermería.Los sistemas de apoyo a la toma de decisiones clínicas que incorporan PLN han demostrado una mejor calidad de la documentación y la identificación de factores de riesgo. El Modelo de Riesgo de Caídas EPIC integra información derivada del PLN con datos estructurados para proporcionar una evaluación completa del riesgo de caídas, que se actualiza dinámicamente a medida que se introducen nuevas notas clínicas ( Eguia et al., 2024 , Rice et al., 2022 ).Más allá de los textos de la HCE, las señales relevantes para la salud mental en los corpus digitales públicos podrían, con una gobernanza y una supervisión ética adecuadas, complementar la estratificación del riesgo de los pacientes hospitalizados para los síntomas depresivos y el miedo a las caídas, factores fuertemente asociados con el riesgo de caídas ( Azizan, 2024b ). Sin embargo, estas aplicaciones requieren rigurosas protecciones de la privacidad, consentimiento informado y validación en poblaciones clínicas antes de su implementación.El manejo de la negación en la documentación clínica representa un desafío técnico crítico para la extracción de riesgo de caídas basada en PNL. Los paquetes estándar de PNL a menudo tienen dificultades con los patrones de negación clínica, donde frases como «el paciente niega el miedo a caer» contienen el factor de riesgo objetivo («miedo a caer») pero indican su ausencia en lugar de su presencia. La coincidencia ingenua de palabras clave clasificaría incorrectamente a este paciente como de alto riesgo, lo que podría desencadenar intervenciones innecesarias y contribuir a la fatiga de alarmas. Los sistemas avanzados de PNL emplean algoritmos de detección de negación (p. ej., NegEx, ConText, Clinical Language Annotation, Modeling, and Processing [CLAMP]) que identifican claves de negación («niega», «no», «sin») y determinan su alcance (qué términos subsiguientes se niegan). Sin embargo, estos algoritmos alcanzan un rendimiento variable (sensibilidad 80-95 %, especificidad 85-98 %) según el estilo de la documentación, con desafíos particulares en oraciones complejas con múltiples cláusulas («el paciente informa mareos ocasionales pero niega el miedo a caer o caídas previas»). Las incrustaciones contextuales de modelos de lenguaje basados en transformadores (BERT, BioBERT, ClinicalBERT) capturan mejor el significado semántico, incluida la negación, logrando una precisión del 92-97 % en tareas de detección de negación. La implementación requiere una validación cuidadosa mediante la revisión manual de historias clínicas para garantizar que el manejo de la negación no infle ni desinfle sistemáticamente las puntuaciones de riesgo, con auditorías trimestrales que examinan las discrepancias entre los factores de riesgo extraídos mediante PNL y los documentados por el médico. Sin un manejo robusto de la negación, los sistemas de PNL corren el riesgo de invertir las evaluaciones de riesgo, clasificando paradójicamente a los pacientes de bajo riesgo (aquellos documentados explícitamente como libres de factores de riesgo) como de alto riesgo con base en la mera mención de términos de factores de riesgo en contextos negativos.Las características de rendimiento de las tecnologías de detección de caídas basadas en IA varían significativamente en los diferentes entornos clínicos, como se detalla en la Tabla 1. Las unidades de cuidados intensivos demuestran la mayor precisión de detección (94-97 %) cuando emplean enfoques de fusión de múltiples sensores, aunque esto conlleva una mayor complejidad de implementación y potencial de falsas alarmas. Las unidades médicas/quirúrgicas logran un rendimiento sólido (88-92 %) con sistemas de visión artificial, mientras que las salas geriátricas se benefician de las capacidades de monitoreo sostenido de las combinaciones de sensores ambientales y portátiles (89-93 %). En particular, las unidades pediátricas presentan desafíos únicos con tasas de precisión más bajas (83-87 %) debido a las limitaciones de tamaño y los requisitos de supervisión, mientras que los departamentos de emergencia dependen de modelos predictivos con tiempos de respuesta más largos pero valiosas capacidades de identificación temprana de riesgos. Como se ilustra en la Fig. 3 , múltiples modalidades de IA, incluido el aprendizaje automático, la visión artificial, las tecnologías de sensores y el procesamiento del lenguaje natural, funcionan sinérgicamente para permitir la evaluación y prevención integrales y en tiempo real del riesgo de caídas en entornos hospitalarios.

5. Implementaciones clínicas y estudios de casos
5.1 . Implementaciones de sistemas de salud a gran escala
Varios sistemas de atención sanitaria importantes han implementado con éxito programas de prevención de caídas basados en IA con resultados clínicos demostrados; sin embargo, los diseños de los estudios varían y las tendencias seculares a menudo dificultan la atribución causal.Partners HealthCare (ahora Mass General Brigham) desarrolló el programa FALL TIPS (Tailoring Interventions for Patient Safety), que combina modelos de predicción de aprendizaje automático con intervenciones específicas ( Dykes et al., 2017 ). Operando desde una tasa de caída de referencia de 3,9 caídas por cada 1000 días-paciente, el sistema logró una reducción relativa del 25 % en las caídas (a aproximadamente 2,9-3,0 caídas por cada 1000 días-paciente, o 0,9-1,0 caídas menos por cada 1000 días-paciente) en 15 unidades hospitalarias durante 12 meses en un ensayo aleatorizado por grupos. La intervención incluyó no solo el modelo de predicción de IA, sino también materiales educativos para pacientes personalizados y campeones basados en la unidad, lo que dificulta aislar el efecto independiente del componente de IA ( Dykes y Brigham, 2018 ).Mayo Clinic implementó un sistema de predicción de caídas basado en IA que analiza datos de la historia clínica electrónica (HCE) en tiempo real y proporciona puntuaciones de riesgo actualizadas cada 4 h ( Salehinejad et al., 2025 , CBINSIGHTS, 2024 ). Con una tasa de caídas de referencia de 4,1 caídas por cada 1000 días-paciente, el sistema demostró una reducción relativa del 30 % en las lesiones relacionadas con caídas (a aproximadamente 2,9 caídas por cada 1000 días-paciente, lo que representa una reducción absoluta de 1,2 caídas por cada 1000 días-paciente); sin embargo, el estudio empleó un diseño pre-post sin controles concurrentes, lo que limitó la inferencia causal. Las puntuaciones de satisfacción del personal relacionadas con las actividades de prevención de caídas mejoraron, lo que sugiere una buena integración del flujo de trabajo.El Hospital Johns Hopkins implementó la Herramienta de Evaluación del Riesgo de Caídas Johns Hopkins (JHFRAT), mejorada con capacidades de aprendizaje automático, lo que resultó en una mayor precisión predictiva del riesgo de caídas entre pacientes mayores con accidente cerebrovascular en rehabilitación. Hong et al. (2024) y Damoiseaux-Volman et al. (2022) evaluaron la validez predictiva del JHFRAT utilizando una gran cohorte retrospectiva de 17.263 pacientes mayores hospitalizados. La cohorte del estudio demostró una tasa de caídas inicial de 3,5 caídas por cada 1.000 días-paciente. El rendimiento predictivo del modelo, medido por el área bajo la curva característica operativa del receptor (AUC), arrojó un valor de 0,65 (IC del 95 %: 0,63-0,67), lo que indica una precisión moderada. El sistema se integra con los flujos de trabajo de enfermería existentes y proporciona recomendaciones de intervención prácticas. Se envían alertas al personal de enfermería de cabecera, con escalamiento para cobrar a las enfermeras para los pacientes identificados como de alto riesgo, aunque no se informó la mediana de los tiempos de respuesta.La variación en las tasas de caídas iniciales en estas implementaciones (2,8 a 5,1 caídas por cada 1000 días-paciente, como se detalla en la Tabla 3 ) influye fundamentalmente en la interpretación de las reducciones relativas. Una reducción del 40 % en una unidad médica general de bajo riesgo (línea de base 2,8 caídas por cada 1000 días-paciente) produce entre 0,7 y 0,8 caídas menos por cada 1000 días-paciente, mientras que una reducción del 15 % en una unidad de neurología o accidente cerebrovascular de alto riesgo (línea de base 5,1 caídas por cada 1000 días-paciente) produce un impacto absoluto similar o mayor de 0,8 caídas por cada 1000 días-paciente. Los cálculos de coste-efectividad deben tener en cuenta estas diferencias iniciales: prevenir una caída cuesta entre 20 000 y 30 000 dólares en entornos de bajo riesgo con costes operativos de IA modestos, frente a entre 8000 y 12 000 dólares en entornos de alto riesgo donde la misma inversión previene más caídas. Esta heterogeneidad subraya la importancia de informar métricas tanto relativas como absolutas, tasas de referencia y ROI específico del entorno al evaluar la efectividad de la prevención de caídas con IA.
Tabla 3. Evaluación del impacto económico de la prevención de caídas mediante IA en los sistemas de atención sanitaria.
| Tamaño del sistema de salud | Volumen de pacientes (camas) | Tasa de caída de referencia | Costo de implementación de IA | Costo operativo anual | Caídas prevenidas | Ahorro de costes | ROI neto (3 años) | Período de recuperación | Referencia |
|---|---|---|---|---|---|---|---|---|---|
| Gran centro académico (>800 camas) | 1.200 | 4,2/1000 días-cama | $750,000 | $180,000 | 145 caídas/año | $6,815,000 | 287 % | 14 meses | Morello y otros, 2015 , Dykes y otros, 2017 |
| Centro médico regional (400–800 camas) | 600 | 3,8/1000 días-cama | $520,000 | $125,000 | 68 caídas/año | $3,196,000 | 245 % | 18 meses | Wong y otros, 2011 , Hempel y otros, 2013 |
| Hospital comunitario (200–400 camas) | 300 | 3,5/1000 días-cama | $380,000 | $95,000 | 32 caídas/año | $1,504,000 | 198 % | 22 meses | Currie, 2008 , Stevens y otros, 2006 |
| Comunidad pequeña (<200 camas) | 150 | 3,2/1000 días-cama | $280,000 | $75,000 | 15 caídas/año | $705,000 | 145 % | 28 meses | Healey et al., 2004 , Titler et al., 2011 |
| Hospital de especialidades (variable) | 250 | 5,1/1000 días-cama | $420,000 | $110,000 | 42 caídas/año | $1,974,000 | 221 % | 19 meses | Ilic et al., 2023 , Bouldin et al., 2013 |
| Acceso crítico (<25 camas) | 20 | 2,8/1000 días-cama | $150,000 | $45,000 | 2 caídas/año | $94,000 | 67 % | 48 meses | Casey et al., 2017 , Trabajos de Salud Rural, 2019 |
| Cuidados agudos a largo plazo | 180 | 4,8/1000 días-cama | $350,000 | $85,000 | 28 caídas/año | $1,316,000 | 186 % | 24 meses | Spetz et al., 2013 ; Agencia para la Investigación y la Calidad de la Atención Sanitaria, 2013 |
5.2 . Aplicaciones de unidades especiales
La implementación de modelos de predicción de caídas basados en IA en unidades hospitalarias especializadas ha mostrado resultados prometedores, especialmente cuando se adaptan a las necesidades clínicas de poblaciones específicas de pacientes. Choi et al. (2023) desarrollaron algoritmos de aprendizaje automático para un hospital especializado en enfermedades cerebrovasculares, centrándose en pacientes hospitalizados con ictus agudo, un grupo con alto riesgo de caídas debido a deficiencias neurológicas. Utilizando una cohorte retrospectiva de 8462 pacientes con validación cruzada interna, el modelo alcanzó un AUROC de 0,85 (IC del 95 %: 0,78-0,92), superando la Escala de Caídas de Morse. Sin embargo, no se ha publicado la validación externa en otros centros especializados en ictus, y no se evaluó la calibración del modelo, crucial para establecer umbrales de intervención adecuados. Más allá de las unidades de ictus, las unidades de cuidados intensivos (UCI) presentan desafíos únicos para la prevención de caídas debido a la agudeza del paciente, la sedación y la presencia de equipo médico complejo. Dai et al. (2024) demostraron cómo los sistemas de IA integran la visión artificial con la monitorización fisiológica para detectar signos tempranos de agitación del paciente o patrones de movimiento que preceden a los intentos de caída. El sistema logró una precisión de clasificación general del 91,2 %, con una sensibilidad del 89,6 % y una especificidad del 92,8 %, incluso al operar con videoclips cortos de 2 segundos para la monitorización en tiempo real. Estos resultados se validaron frente a estados de agitación etiquetados por expertos según la Escala de Agitación-Sedación de Richmond (RASS), lo que confirma la fiabilidad del modelo. Aunque el estudio no midió directamente la reducción de caídas, su capacidad para monitorizar la agitación de forma continua y objetiva sugiere potencial para mejorar la seguridad del paciente y reducir los eventos adversos en entornos de UCI.De manera similar, los servicios de urgencias (SU) utilizan cada vez más el análisis predictivo para identificar a los adultos mayores en riesgo de hospitalización por caídas. Archer et al. (2024) desarrollaron y validaron externamente la herramienta eFalls, un modelo de predicción multivariable diseñado para pronosticar la asistencia o la hospitalización en SU por caídas o fracturas en un plazo de 12 meses. El modelo alcanzó un área bajo la curva característica operativa del receptor (AUC) de 0,75 en la validación interna y de 0,72 en la validación externa, lo que demuestra un rendimiento discriminatorio de moderado a bueno. El análisis de calibración mostró una fuerte concordancia entre los resultados previstos y observados en todos los estratos de riesgo, lo que respalda su utilidad clínica. Aunque el estudio no informó métricas de implementación en tiempo real, la dependencia del modelo de datos de atención primaria recopilados rutinariamente sugiere una alta viabilidad para la integración en los sistemas de triaje de SU para apoyar la intervención temprana y la planificación de recursos.Para traducir las alertas en prevención, los pacientes identificados con síntomas cognitivos o anímicos, ya sea mediante cribado clínico o herramientas predictivas, pueden ser derivados a intervenciones no farmacológicas estructuradas. El ejercicio combinado con terapia de reminiscencia representa uno de estos paquetes basados en la evidencia: esta intervención redujo significativamente la depresión y mejoró la calidad de vida en adultos mayores con enfermedad de Alzheimer leve en un estudio cuasiexperimental ( Azizan, Anum, Faisal y Karnadipa, 2023 ). Si bien estos hallazgos respaldan el valor terapéutico de las intervenciones combinadas, la investigación que examina el proceso completo desde la identificación del riesgo → respuesta clínica → ejecución de la intervención → resultados a largo plazo como la reducción de caídas sigue siendo limitada.La integración de la estratificación de riesgos de IA con intervenciones basadas en evidencia, como el ejercicio y la terapia de reminiscencia, representa una vía de prevención teórica en lugar de un sistema automatizado implementado actualmente en la literatura revisada. Si bien Azizan et al. (2023) demostraron que el ejercicio combinado con la terapia de reminiscencia redujo significativamente la depresión y mejoró la calidad de vida en adultos mayores con enfermedad de Alzheimer leve, ninguno de los sistemas de prevención de caídas de IA revisados activó automáticamente las derivaciones a estas intervenciones específicas basadas en las puntuaciones de riesgo. Los sistemas actuales generan principalmente alertas de riesgo para el personal de enfermería, que luego aplica el juicio clínico para seleccionar las intervenciones apropiadas de los protocolos de prevención de caídas específicos de la institución. El vínculo entre la evaluación de riesgos generada por IA y las intervenciones no farmacológicas específicas, incluidos los programas de ejercicio estructurados para la fragilidad ( Azizan, 2024a ) y las intervenciones cognitivas para pacientes con deterioro ( Azizan et al., 2023 ), representa una dirección futura recomendada que requiere el desarrollo de sistemas de apoyo a la toma de decisiones clínicas con integración de flujo de trabajo bidireccional. La implementación prospectiva requeriría: (1) generación automatizada de derivaciones basada en las puntuaciones de riesgo de la IA y las características de los pacientes; (2) disponibilidad de personal capacitado para implementar intervenciones estructuradas; (3) sistemas de seguimiento para supervisar la finalización de la intervención y la respuesta de los pacientes; y (4) ciclos de retroalimentación para ajustar los modelos de riesgo según la efectividad de la intervención. Se necesitan ensayos aleatorizados por conglomerados que evalúen esta vía integrada de IA a intervención para evaluar la viabilidad en situaciones reales, la aceptación del personal, la adherencia del paciente y el impacto en la reducción de las caídas.Además de los beneficios clínicos, los sistemas de prevención de caídas con IA ofrecen claras ventajas económicas, especialmente para instituciones de gran escala. Como se muestra en la Tabla 3 , los centros médicos académicos con más de 800 camas informaron el retorno de la inversión más favorable (287 % en tres años), con un período de recuperación de solo 14 meses. Estos sistemas evitaron un promedio de 145 caídas al año, generando más de $6.8 millones en ahorros de costos. Los hospitales regionales y comunitarios experimentaron períodos de recuperación más largos (18-22 meses) pero mantuvieron un ROI positivo por encima del 190 %. Por el contrario, los hospitales de acceso crítico enfrentaron las mayores barreras financieras, con un período de recuperación de 48 meses y un modesto ROI del 67 %, lo que destaca la necesidad de apoyo financiero dedicado o modelos de servicio colaborativo para garantizar el acceso equitativo a estas tecnologías en todos los entornos de atención médica.
5.3 . Implementaciones internacionales
Los esfuerzos para reducir las caídas en pacientes hospitalizados han ganado atención global, con diversas estrategias que se están probando en varios sistemas de salud. Spoon et al. (2024) revisaron 48 estudios e identificaron 350 estrategias de implementación utilizadas para apoyar las intervenciones de prevención de caídas en hospitales. Si bien la revisión no se centró en la distribución geográfica, destacó que la mayoría de los estudios carecían de informes exhaustivos sobre los detalles de la implementación, en particular en los siete prerrequisitos de Proctor. Esta falta de informes limita la reproducibilidad y la generalización en diversos entornos de salud, especialmente en sistemas con recursos limitados o una infraestructura de implementación menos desarrollada. Los estudios emplearon una mediana de seis estrategias de implementación (rango intercuartil 4-9), con un 96% que incorporaba enfoques del dominio de «capacitar y educar a las partes interesadas». Los métodos comunes incluyeron la realización de reuniones educativas, la preparación de promotores y la formación de consejos asesores para construir relaciones con las partes interesadas clave. Tras la implementación, la reducción media de la tasa de caídas fue de 0,9 por 1.000 días-paciente (RIC: –1,8 a 0,3), y la adherencia a las intervenciones varió ampliamente, con una media del 65 % (RIC: 29-87 %), según las auditorías y la documentación de los registros médicos electrónicos. Además de los países occidentales de altos ingresos, también se están desarrollando y probando sistemas innovadores de prevención de caídas en otras regiones. Por ejemplo, Alharbi et al. (2023) introdujeron un sistema de suelo inteligente basado en IoT en Arabia Saudí, incorporando etiquetas RFID en alfombras para detectar caídas en adultos mayores. Este enfoque, que preserva la privacidad y es no intrusivo, se combinó con algoritmos de aprendizaje automático y aprendizaje profundo, y el modelo K-Nearest Neighbours (KNN) logró una notable precisión del 99 %. El estudio demuestra cómo las soluciones alternativas adaptadas a las necesidades culturales y de infraestructura pueden mejorar la vida independiente y reducir los riesgos de caídas en diversos entornos internacionales. Este trabajo destaca aún más el alcance global de la IA en la prevención de caídas, ofreciendo modelos adaptables y rentables que van más allá de los sistemas convencionales portátiles o basados en cámaras.
6. Beneficios de la IA en la prevención de caídas
6.1 . Precisión de predicción mejorada
Los sistemas de IA demuestran una precisión de predicción mejorada en comparación con las herramientas tradicionales de evaluación del riesgo de caídas en muchos estudios, aunque existe una heterogeneidad sustancial. Los valores de AUROC informados para los modelos de aprendizaje automático varían de 0,72 a 0,94 en los estudios publicados ( Alharbi et al., 2023 , Nakatani et al., 2019 , Zhao et al., 2024 , Taramasco et al., 2025 ), a menudo superando el rango de 0,60 a 0,70 que suelen alcanzar las herramientas convencionales como STRATIFY o Morse Fall Scale. Sin embargo, AUROC por sí solo es insuficiente: la calibración, el acuerdo entre las probabilidades predichas y los resultados observados, es esencial para la toma de decisiones clínicas, y AUPRC (área bajo la curva de precisión-recuperación) ofrece una métrica más informativa en conjuntos de datos desequilibrados por clase comunes para la predicción de caídas. Estas métricas complementarias se informan de manera inconsistente, lo que limita la síntesis entre estudios y la evaluación comparativa.Esta mejor discriminación permite una estratificación del riesgo más precisa y una asignación de intervenciones más específica. La capacidad de procesar múltiples fuentes de datos simultáneamente permite a los sistemas de IA identificar patrones de riesgo complejos que podrían no ser evidentes mediante los métodos de evaluación tradicionales. Los modelos de aprendizaje automático pueden incorporar cientos de variables y detectar relaciones no lineales que contribuyen a la precisión de la predicción del riesgo de caídas.
6.2 . Monitoreo e intervención en tiempo real
A diferencia de las evaluaciones de riesgos tradicionales que se realizan periódicamente (normalmente una vez por turno o a diario), los sistemas de IA proporcionan capacidades de monitorización continua que pueden detectar cambios de riesgo en tiempo real. Esto permite una intervención proactiva antes de que se produzcan las caídas, en lugar de respuestas reactivas tras los incidentes. Los sistemas de alerta en tiempo real han demostrado un valor potencial en la práctica clínica, y algunos estudios sugieren reducciones en las tasas de caídas cuando el personal recibe notificaciones oportunas sobre comportamientos de alto riesgo ( Parsons et al., 2021 ). Aunque las cifras exactas varían, las mejoras notificadas van de modestas a sustanciales, según el diseño del sistema y la integración clínica. Sin embargo, rara vez se notifican métricas clave como la carga de alertas, la cantidad de alertas por cada 100 horas-paciente y el valor predictivo positivo, lo que dificulta la evaluación del riesgo de fatiga por alarmas. Los sistemas de alerta escalonados, los umbrales de tiempo de permanencia (que requieren un comportamiento de alto riesgo sostenido antes de activar las alertas) y las ventanas de suspensión durante las actividades supervisadas (p. ej., sesiones de fisioterapia) son estrategias de diseño emergentes para mitigar las falsas alarmas y mejorar la relevancia clínica. La inmediatez de las alertas impulsadas por IA permite una rápida respuesta e implementación de la intervención.
6.3 . Evaluación e intervención de riesgos personalizada
Los sistemas de IA se destacan por proporcionar evaluaciones de riesgo personalizadas que tienen en cuenta las características individuales del paciente, su historial médico y factores clínicos dinámicos. Esta personalización permite estrategias de intervención a medida con mayor probabilidad de ser efectivas para poblaciones específicas de pacientes. Los algoritmos de aprendizaje automático pueden identificar subgrupos de pacientes con perfiles de riesgo similares y recomendar intervenciones basadas en evidencia que han demostrado ser efectivas para pacientes similares. Este enfoque de medicina de precisión para la prevención de caídas representa un avance significativo con respecto a las estrategias universales. Los adultos mayores con deterioro cognitivo, una vez identificados mediante cribado clínico o herramientas predictivas, podrían ser derivados sistemáticamente a programas estructurados no farmacológicos, como el ejercicio combinado con terapia de reminiscencia. Azizan et al. (2023) demostraron que esta intervención combinada mejoró significativamente la depresión y la calidad de vida en adultos mayores con enfermedad de Alzheimer leve, lo que respalda su posible papel en estrategias de prevención personalizadas que conectan la predicción y la intervención.
6.4 . Integración y eficiencia del flujo de trabajo
Los sistemas de IA bien diseñados se integran a la perfección con los flujos de trabajo clínicos existentes, ofreciendo apoyo a la toma de decisiones sin sobrecargar al personal sanitario. Las herramientas automatizadas de evaluación del riesgo de caídas han demostrado potencial para reducir la carga de trabajo manual y mejorar la consistencia y la precisión. Por ejemplo, Khatib et al. (2025) demostraron que los modelos de aprendizaje automático podrían acortar y adaptar las evaluaciones del riesgo de caídas para adultos mayores, agilizando el proceso y manteniendo el rendimiento predictivo. Si bien algunos estudios sugieren un ahorro de tiempo de hasta un 30-40 %, estas estimaciones suelen basarse en implementaciones en un solo centro y deben contextualizarse según los tipos de unidad específicos, los protocolos de evaluación de referencia y la calidad de la integración de la HCE. Cuando se citan reducciones numéricas de la carga de trabajo, estas suelen reflejar implementaciones piloto y podrían no ser generalizables a otras instituciones. Esta mejora en la eficiencia permite al personal redirigir el tiempo hacia la atención directa al paciente y la prestación de intervenciones oportunas.
7. Desafíos y limitaciones
7.1 . Privacidad de datos y consideraciones éticas
La implementación de sistemas de prevención de caídas con IA plantea importantes preocupaciones sobre la privacidad, en particular en lo que respecta a las tecnologías de videovigilancia y monitorización continua. Los pacientes pueden sentirse incómodos con la observación constante, y las instituciones sanitarias deben equilibrar los beneficios de seguridad con los derechos a la privacidad y las preocupaciones sobre la dignidad. El cumplimiento normativo presenta desafíos constantes, en particular en jurisdicciones con estrictos requisitos de protección de datos, como el Reglamento General de Protección de Datos (RGPD) de la Unión Europea y la Ley de Portabilidad y Responsabilidad del Seguro Médico (HIPAA) de los Estados Unidos. Como se muestra en la Tabla 4 , los plazos de cumplimiento varían de 2 a 18 meses en todos los ámbitos regulatorios, con costos asociados de 10 000 a 500 000 dólares, según el requisito. Las instituciones sanitarias deben garantizar que los sistemas de IA cumplan con todas las regulaciones de privacidad aplicables, manteniendo al mismo tiempo la eficacia clínica.
Tabla 4. Marco regulatorio y de cumplimiento para sistemas de prevención de caídas con IA.
| Dominio regulatorio | Requisito específico | Norma de cumplimiento | Método de validación | Cronología | Impacto en los costos | Nivel de riesgo | Referencia |
|---|---|---|---|---|---|---|---|
| Dispositivo médico de la FDA | Software de dispositivos médicos de clase II | Notificación previa a la comercialización 510(k) | Estudios de validación clínica | 12–18 meses | $200 mil – $500 mil | Medio | FDA, 2021 |
| Protección de datos RGPD | Consentimiento para la videovigilancia | Cumplimiento de los artículos 6 y 9 del RGPD | Evaluación del impacto en la privacidad | 3–6 meses | $50 mil – $150 mil | Alto | GDPR.eu, 2018 , Price y Cohen, 2019 |
| Privacidad HIPAA | Cifrado de PHI y controles de acceso | Título 45 del Código de Reglamentos Federales, artículo 164.312 | Evaluación de riesgos de seguridad | 2–4 meses | $25 mil – $75 mil | Medio | HHS, 2013 , Gordon y Catalini, 2018 |
| Comisión Conjunta | Normas de seguridad del paciente | NPSG.09.02.01 | Medición del rendimiento | 6–12 meses | $30 mil – $100 mil | Bajo | Comisión Conjunta , 2023 |
| Normas ISO/IEC | Procesos del ciclo de vida del software | ISO 13485, IEC 62304 | Auditoría de gestión de calidad | 8–15 meses | $100 mil – $300 mil | Medio | ISO, 2016 , IEC, 2006 |
| Gobernanza clínica | Evaluación del sesgo del algoritmo | Aprobación ética institucional | Métricas de evaluación de equidad | 4–8 meses | $40 mil – $120 mil | Alto | Obermeyer et al., 2019 , Rajkomar et al., 2019 |
| Ciberseguridad | Protocolos de seguridad de red | Marco de ciberseguridad del NIST | Pruebas de penetración | 3–6 meses | $60 mil – $200 mil | Alto | NIST., 2018 , Kruse y otros, 2017 |
| Regulaciones estatales y locales | Requisitos específicos de la instalación | Variable según la jurisdicción | Auditoría de cumplimiento local | 1–6 meses | $10 mil – $50 mil | Bajo | CMS, 2019 |
| Responsabilidad profesional | Responsabilidad por el apoyo a las decisiones clínicas | Cobertura por negligencia médica | Evaluación de riesgos legales | 2–4 meses | $20 mil – $80 mil | Medio | Price y otros, 2019 , Kesselheim y otros, 2011 |
| Interoperabilidad | Intercambio de datos de salud | HL7 FHIR R4 | Pruebas de integración | 4–10 meses | $75 mil – $250 mil | Medio | HL7, 2019 , Mandel y otros, 2016 |
Las consideraciones éticas incluyen cuestiones sobre la autonomía del paciente, el consentimiento informado para la monitorización con IA y el potencial de la tecnología para sustituir el criterio humano en la toma de decisiones clínicas ( Mittelstadt, 2019 ). Es fundamental contar con marcos de gobernanza claros para abordar estas preocupaciones.
La figura 4 ilustra el marco de gobernanza de datos que sustenta los sistemas de prevención de caídas basados en IA, destacando la distribución del procesamiento entre los entornos perimetrales y de servidor, el enrutamiento estructurado de alertas a través de los flujos de trabajo clínicos y la integración de puntos de control con intervención humana que garantizan la supervisión, la seguridad y la rendición de cuentas.

7.2 . Sesgo y equidad del algoritmo
Los sistemas de IA pueden perpetuar o amplificar los sesgos existentes en los datos de entrenamiento, lo que podría generar resultados dispares para diferentes poblaciones de pacientes. Los datos históricos de atención médica pueden reflejar desigualdades sistémicas que podrían verse reforzadas por algoritmos de aprendizaje automático. Diversos estudios han identificado posibles sesgos en los modelos de predicción de caídas de IA relacionados con la edad, el género, la raza y el nivel socioeconómico ( Shah y Sureja, 2024 ; O’Connor y Liu, 2023 ). Abordar estos sesgos requiere diversos conjuntos de datos de entrenamiento, técnicas de equidad algorítmica y auditorías estratificadas continuas. Un plan mínimo debe incluir:
- •Auditorías de sesgo trimestrales estratificadas por edad, sexo, raza/etnia, idioma principal y uso de ayudas para la movilidad
- •Monitoreo semanal de la deriva mediante gráficos de control que rastrean la prevalencia, AUROC/AUPRC y métricas de calibración
- •Recalibración activada cuando el error de calibración esperado (ECE) excede un umbral predefinido, con gráficos de comparación previos y posteriores documentados
- •Control de versiones del modelo con registro de cambios completo y procedimientos de reversión
- •Sin ese seguimiento, el rendimiento del modelo puede degradarse silenciosamente con el tiempo debido a cambios en las poblaciones de pacientes, las prácticas clínicas o los patrones de ingreso de datos de EHR.
El desequilibrio de clases y la escasez de datos plantean barreras fundamentales para el entrenamiento de sistemas de detección de caídas fiables, ya que las caídas representan solo el 0,3-0,5 % de los días-paciente (desequilibrio de 200-300:1). Las técnicas de aumento tradicionales ofrecen beneficios limitados para los datos tabulares de la HCE. Las redes generativas antagónicas cuánticas (QGAN) representan una solución emergente: Pajuhanfard et al. (2024) demostraron la evolución de las QGAN desde la generación básica de imágenes 2 × 2 hasta las avanzadas GAN cuánticas de Wasserstein parametrizadas, que logran resultados de alta resolución de 28 × 28. Las QGAN aprovechan la superposición cuántica para explorar múltiples vías generativas simultáneamente y el entrelazamiento cuántico para reflejar relaciones fisiológicas complejas, lo que potencialmente genera eventos de caída sintéticos en diversos grupos demográficos sin requerir conjuntos de datos masivos del mundo real de cada subgrupo.Sin embargo, la tecnología QGAN aún se encuentra en una etapa inicial, limitada a conjuntos de datos a pequeña escala y que requiere hardware de computación cuántica aún no ampliamente disponible en el ámbito sanitario. Los retos de validación son considerables: los datos sintéticos deben demostrar realismo estadístico, verosimilitud clínica y equidad sin amplificar los sesgos. La relación coste-beneficio sigue siendo incierta; generar 10 000 eventos sintéticos podría requerir entre 50 y 100 horas y entre 500 y 2000 dólares, en comparación con el aprendizaje federado entre instituciones. A medida que la infraestructura cuántica madure, las QGAN podrían permitir modelos de detección de caídas robustos y equitativos cuando los datos del mundo real sean escasos, especialmente para los subtipos de caídas poco frecuentes.
7.3 . Integración clínica e interrupción del flujo de trabajo
Una implementación exitosa de IA requiere una cuidadosa alineación con los flujos de trabajo clínicos y atención a la aceptación del usuario. Un diseño deficiente de los sistemas puede aumentar la carga de trabajo del personal, generar un exceso de falsas alarmas o no integrarse con la infraestructura existente de registros médicos electrónicos (RME). Entre los desafíos comunes de la gestión del cambio se incluyen las exigencias de capacitación del personal, la resistencia a las nuevas tecnologías y la necesidad de modificar las rutinas clínicas establecidas. La fatiga de alarmas es una barrera crítica: las falsas alertas frecuentes pueden provocar desensibilización, respuestas tardías o la anulación de alertas. Fernandes et al. (2019) enfatizaron que los sistemas de alerta basados en IA deben equilibrar la sensibilidad con la especificidad para evitar la sobrecarga sensorial en entornos hospitalarios. De manera similar, Nanevski et al. (2025) descubrieron que las implementaciones multicéntricas de IA para la evaluación del riesgo de caídas requerían una integración personalizada del flujo de trabajo y la participación del personal para mantener la efectividad.La generación de informes de métricas como las alertas por cada 100 horas-paciente, el valor predictivo positivo en el umbral operativo y la mediana del tiempo de respuesta del personal proporciona un contexto esencial para evaluar la viabilidad de la implementación. Características de diseño como las alertas escalonadas (riesgo bajo/medio/alto con expectativas de respuesta diferenciadas), los umbrales de tiempo de permanencia (que requieren un comportamiento de alto riesgo sostenido antes de activar las alertas) y los periodos de suspensión inteligentes durante actividades supervisadas (p. ej., fisioterapia) pueden reducir la carga de alertas y, al mismo tiempo, preservar la sensibilidad clínica. Para garantizar una adopción exitosa, las instituciones sanitarias deben invertir en programas integrales de capacitación, soporte técnico continuo y ciclos de retroalimentación que permitan el perfeccionamiento iterativo de las herramientas de IA.
7.4 . Limitaciones técnicas y fiabilidad
Los sistemas de IA se enfrentan a diversas limitaciones técnicas, como errores de software, fallos de hardware e interrupciones de la red, que pueden comprometer la fiabilidad y la seguridad del paciente. Como señalan González-Castro et al. (2024) , contar con sistemas de respaldo robustos y protocolos de fallos es esencial para garantizar la continuidad de la atención cuando las herramientas de IA fallan o dejan de estar disponibles. Con el tiempo, las desviaciones del modelo causadas por cambios en las poblaciones de pacientes o las prácticas clínicas pueden reducir la precisión. El reentrenamiento regular, la monitorización de métricas como la puntuación Brier y la ECE, y la recalibración contribuyen a mantener el rendimiento ( Nanevski et al., 2025 ). La gestión del ciclo de vida debe incluir el control de versiones, procedimientos de reversión y un registro formal del modelo.
7.5 . Requisitos de costos y recursos
La implementación de sistemas de prevención de caídas basados en IA requiere una inversión sustancial en infraestructura tecnológica, licencias de software, capacitación del personal y mantenimiento continuo. Las instituciones de atención médica deben evaluar la rentabilidad de estos sistemas y desarrollar modelos de financiamiento sostenibles adaptados a su tamaño y volumen de pacientes. Según Nanevski et al. (2025) , las implementaciones multicéntricas de herramientas de riesgo de caídas de IA implicaron costos iniciales variables, y los hospitales más pequeños enfrentaron mayores desafíos para absorber los gastos de implementación. Un informe de Health Affairs (2025) estima que la integración de IA en los servicios clínicos puede variar de $200,000 a $700,000, dependiendo de la complejidad del sistema y las necesidades de personalización. Los costos operativos anuales, incluidas las actualizaciones, la monitorización y el soporte, pueden agregar entre $50,000 y $150,000, y los períodos de recuperación varían ampliamente, influenciados por las tasas de caídas de referencia, la gravedad de las lesiones y los modelos de atribución de costos. Estas proyecciones económicas dependen en gran medida de suposiciones como los cronogramas de depreciación, las proporciones de personal y los ahorros de costos relacionados con las caídas, que pueden no generalizarse en todas las instituciones. Las instalaciones más pequeñas pueden requerir financiación de subvenciones, consorcios regionales o modelos de servicios compartidos para lograr la rentabilidad y evitar tensiones financieras ( González-Castro et al., 2024 ).Los requisitos de recursos van más allá de los costos iniciales de implementación e incluyen soporte técnico continuo, actualizaciones del sistema y capacitación del personal. Los centros de salud más pequeños pueden enfrentar desafíos particulares para acceder y mantener las tecnologías de IA.El ROI varía sustancialmente según el tamaño de la instalación y las tasas de caídas de referencia ( Tabla 3 ). Los grandes centros médicos académicos (>800 camas) demuestran una economía favorable: la implementación de $750,000 y los costos anuales de $180,000 producen un ROI de tres años del 287 % con una recuperación de la inversión de 14 meses al prevenir 145 caídas anualmente a un costo promedio por caída de $47,000 ( Wong et al., 2011 , Morello et al., 2015 ), beneficiándose de economías de escala y tasas de referencia más altas (4.2 por 1,000 días-cama). Por el contrario, los hospitales de acceso crítico (<25 camas) enfrentan retornos marginales: la implementación de $150,000 y los costos anuales de $45,000 producen un ROI del 67 % con una recuperación de la inversión de 48 meses previniendo solo 2 caídas anualmente, donde el costo por caída prevenida ($97,500) se aproxima al ahorro por caída evitada ($47,000).Las proyecciones del ROI dependen de suposiciones que pueden no generalizarse: los costos relacionados con las caídas asumidos en un promedio de $47,000 ( Wong et al., 2011 , Morello et al., 2015 ) varían según la gravedad de la lesión ($2,000-$5,000 para caídas no lesivas vs. $50,000-$150,000 para fracturas); el rápido avance tecnológico puede requerir un reemplazo antes de los cronogramas de depreciación de 5 a 7 años; los modelos de personal influyen en los costos operativos ($60,000-$80,000 internamente vs. $120,000-$150,000 en soporte del proveedor); y existe incertidumbre de atribución si el 30-40 % de las reducciones reflejan tendencias seculares en lugar de efectos de IA.Para centros más pequeños, se deben considerar modelos alternativos: los consorcios regionales (3 a 5 hospitales que comparten infraestructura) reducen los costos por institución entre un 40 % y un 60 %; los modelos SaaS (5000-15 000 dólares mensuales) reducen las barreras de entrada, aunque los costos acumulados pueden superar a los de los sistemas propios en un plazo de 5 a 7 años; la financiación mediante subvenciones apoya los proyectos piloto, aunque la sostenibilidad sigue siendo incierta. La justificación económica debe abarcar un valor más amplio, como la reducción del agotamiento del personal de enfermería, una mayor cultura de seguridad, mejores calificaciones de calidad y una menor responsabilidad, beneficios que pueden justificar la inversión cuando el retorno de la inversión (ROI) parece marginal.El panorama regulatorio para los sistemas de prevención de caídas de IA abarca múltiples dominios con diferentes plazos de cumplimiento y costos asociados, como se describe en la Tabla 3. La aprobación de dispositivos médicos por parte de la FDA representa el obstáculo regulatorio más sustancial, requiriendo de 12 a 18 meses y entre $200,000 y $500,000 en costos de validación para la clasificación de software de dispositivos médicos de Clase II. Las regulaciones de protección de datos, en particular el cumplimiento del RGPD, presentan desafíos de alto riesgo con plazos más cortos pero requisitos significativos de evaluación del impacto en la privacidad. Las instituciones de salud deben presupuestar marcos de cumplimiento integrales que abarquen protocolos de ciberseguridad, estándares de interoperabilidad y requisitos de gobernanza clínica, con costos regulatorios totales que potencialmente alcanzan entre $600,000 y $1.5 millones para la implementación completa del sistema en todos los dominios.
7.6 . Responsabilidad e implicaciones legales cuando fallan los sistemas de IA
La cuestión de la responsabilidad cuando los sistemas de prevención de caídas con IA no previenen una caída representa una preocupación legal y ética crucial que sigue sin resolverse en gran medida en la jurisprudencia actual. Los marcos tradicionales de responsabilidad médica asignan responsabilidad a los profesionales clínicos que incumplen su deber de cuidado por negligencia; sin embargo, los sistemas de IA introducen complejidad en cuanto a si la responsabilidad recae en el profesional clínico que se basó en una predicción inexacta de IA, en la institución sanitaria que implementó el sistema, en el desarrollador de software que creó el algoritmo o si es compartida por múltiples partes. Tres escenarios de responsabilidad merecen especial consideración:En primer lugar, las fallas de falsos negativos ocurren cuando los sistemas de IA no identifican a un paciente con alto riesgo de caída, lo que resulta en medidas preventivas inadecuadas y una posterior caída con lesión. Si una enfermera sigue las puntuaciones de riesgo generadas por IA sin una evaluación clínica independiente y un paciente clasificado como de bajo riesgo se cae, los tribunales pueden examinar si la confianza de la enfermera en la IA constituyó un juicio clínico razonable o una abdicación negligente de la responsabilidad profesional. El precedente legal de otras tecnologías médicas sugiere que los médicos mantienen la responsabilidad final de las decisiones de atención al paciente y no pueden escudarse en los sistemas automatizados como defensa ( Price et al., 2019 ). Sin embargo, si el sistema de IA fue validado, implementado adecuadamente y generalmente confiable, los tribunales pueden considerar que la confianza de la enfermera es razonable dadas las circunstancias. Las políticas institucionales que requieren que las enfermeras documenten la evaluación independiente del riesgo de caída además de revisar las puntuaciones de IA pueden brindar protección de responsabilidad, aunque esta redundancia disminuye los beneficios de eficiencia de la IA.En segundo lugar, los escenarios de carga de falsos positivos implican que los sistemas de IA generan alertas excesivas de alto riesgo, lo que genera fatiga de alarmas, anulación de alertas y, en última instancia, la omisión de pacientes de alto riesgo reales. Si un sistema de IA genera entre 50 y 100 alertas de riesgo de caída por turno con un valor predictivo positivo del 5 al 10 % (es decir, entre el 90 y el 95 % son falsas alarmas), las enfermeras pueden desarrollar una desensibilización a las alertas, descartando o retrasando habitualmente la respuesta a las alertas. Cuando un paciente de alto riesgo real se cae porque su alerta se descartó en medio del ruido de alerta, la responsabilidad puede recaer en: (a) la institución por implementar un sistema mal calibrado que creó una fatiga de alarmas predecible, (b) el proveedor de software por una validación inadecuada del algoritmo y una optimización de la sensibilidad y especificidad, o (c) la enfermera por no responder a pesar de la alerta del sistema. La jurisprudencia emergente sugiere que las instituciones tienen la responsabilidad de garantizar que los sistemas de apoyo a la toma de decisiones clínicas funcionen con tasas de falsos positivos aceptables ( Kesselheim et al., 2011 ), y una carga de alertas > 10 por enfermera por turno podría constituir un diseño de sistema negligente.En tercer lugar, los escenarios de fallo del sistema abarcan errores de software, mal funcionamiento del hardware, cortes de red o brechas de ciberseguridad que inutilizan los sistemas de prevención de caídas de IA durante períodos críticos. Si un paciente se cae durante una interrupción del sistema de 4 horas y sufre lesiones graves, el análisis de responsabilidad examina si la institución mantuvo protocolos de respaldo adecuados (evaluación manual del riesgo de caídas, vigilancia mejorada) durante el tiempo de inactividad del sistema. Los contratos entre instituciones sanitarias y proveedores de IA suelen incluir cláusulas de limitación de responsabilidad y especificar responsabilidades durante fallos del sistema; sin embargo, estas asignaciones contractuales pueden no proteger contra demandas de terceros (pacientes). Los marcos de responsabilidad de dispositivos médicos pueden aplicarse si los sistemas de prevención de caídas de IA reciben la autorización de la FDA como dispositivos médicos de Clase II, lo que podría imponer una responsabilidad estricta a los fabricantes por defectos de diseño, independientemente de la negligencia ( FDA, 2021 ).Para mitigar los riesgos de responsabilidad, las instituciones de atención médica deben implementar marcos de gobernanza integrales que incluyan: (1) políticas claras que requieran la validación clínica de las recomendaciones de IA antes de implementar intervenciones, (2) estándares de documentación que capturen tanto las puntuaciones de riesgo de IA como la evaluación independiente del médico, (3) auditorías regulares del rendimiento de los algoritmos con sensibilidad específica del umbral, especificidad e informes de valor predictivo positivo, (4) protocolos de revisión de incidentes que examinen si las predicciones de IA fueron precisas y si la respuesta del personal a las alertas fue oportuna y apropiada, (5) procesos de consentimiento informado que garanticen que los pacientes comprendan que los sistemas de IA respaldan pero no reemplazan el juicio clínico, y (6) contratos con proveedores que especifiquen los estándares de rendimiento, la asignación de responsabilidad, la cobertura del seguro y los requisitos de remediación. Las compañías de seguros de responsabilidad profesional están comenzando a exigir a las instituciones de atención médica que utilizan el apoyo a la toma de decisiones clínicas de IA que mantengan estos elementos de gobernanza como condiciones de la póliza, lo que indica el reconocimiento por parte de la aseguradora de los riesgos de responsabilidad emergentes ( Price et al., 2019 ). A medida que los sistemas de prevención de caídas de IA se generalicen, surgirán marcos legales más claros a través de la jurisprudencia, la orientación regulatoria y los estándares profesionales, aunque los adoptantes actuales enfrentan una incertidumbre de responsabilidad que puede retrasar la implementación, particularmente en instituciones reacias al riesgo.
8. Direcciones futuras
8.1 . IA explicable y apoyo a la toma de decisiones clínicas
El desarrollo de sistemas de IA explicable (XAI) representa un avance crucial para la adopción clínica de tecnologías de prevención de caídas. Los profesionales sanitarios necesitan comprender cómo los sistemas de IA llegan a sus conclusiones para mantener la confianza y tomar decisiones informadas sobre la atención al paciente. Los futuros sistemas de IA deben proporcionar explicaciones claras de los factores de riesgo que contribuyen a la predicción de caídas, enumerando las 3 a 5 características principales que determinan la puntuación de riesgo de cada paciente, lo que permite a los profesionales sanitarios comprender y validar las recomendaciones de IA. Esta transparencia es esencial para la aprobación regulatoria, la aceptación clínica y la supervisión ética de las tecnologías de IA.
8.2 . Aprendizaje federado y colaboración multiinstitucional
El aprendizaje federado permite el desarrollo de modelos de IA en múltiples instituciones sanitarias sin necesidad de compartir datos directamente, lo que aborda las preocupaciones sobre la privacidad y mejora la generalización de los modelos. Este enfoque descentralizado ha demostrado ser prometedor en la detección de caídas y otras aplicaciones clínicas, permitiendo a las instituciones entrenar modelos de forma colaborativa, manteniendo al mismo tiempo el control sobre los datos confidenciales de los pacientes ( Mahdi Haref et al., 2025 , González-Castro et al., 2024 ). Esta colaboración puede generar sistemas de prevención de caídas más robustos y de amplia aplicación, especialmente cuando se combina con protocolos estandarizados de informes y validación.Un conjunto mínimo de informes para estudios de IA en caídas debe incluir: entorno clínico (tipo de unidad, país, nivel de ingresos), prevalencia de caídas y desequilibrio de clases, definición del resultado (por ejemplo, caídas vs. caídas lesivas vs. casi caídas), tipo de validación (validación cruzada interna, retención temporal, sitio externo), métricas primarias (AUROC, AUPRC, calibración mediante puntuación ECE o Brier, todas con intervalos de confianza del 95 %), tamaño de la muestra, carga de alertas (alertas cada 100 horas de paciente, valor predictivo positivo), puntos de control humanos en el circuito y resultados de auditoría de imparcialidad estratificados por subgrupos demográficos y clínicos.Los consorcios de investigación multiinstitucionales desarrollan activamente conjuntos de datos compartidos y marcos de validación para acelerar el desarrollo de la IA, preservando al mismo tiempo la privacidad. Estos esfuerzos deben combinar el aprendizaje federado para el entrenamiento de modelos con la recalibración a nivel de centro para tener en cuenta las variaciones locales en las poblaciones de pacientes, las prácticas de documentación y las definiciones de resultados.
8.3 . Integración con tecnologías del Internet de las Cosas (IoT)
La integración de sistemas de prevención de caídas con IA y tecnologías del IoT promete crear ecosistemas de monitorización integrales que puedan rastrear simultáneamente el estado del paciente, las condiciones ambientales y las actividades del personal. Las habitaciones de hospital inteligentes, equipadas con múltiples sensores y análisis de IA, podrían revolucionar la prevención de caídas. Los avances en tecnología wearable, como la ropa inteligente y los sensores implantables, proporcionarán capacidades de monitorización cada vez más sofisticadas, a la vez que preservan la comodidad y la dignidad del paciente.
8.4 . Enfoques de la medicina de precisión
Se espera que los futuros sistemas de IA integren datos genómicos, biomarcadores y otras herramientas de medicina de precisión para ofrecer evaluaciones de riesgo de caídas más personalizadas e intervenciones específicas. La fragilidad y la sarcopenia, contribuyentes clave al riesgo de caídas, están influenciadas por factores genéticos y biológicos, y el ejercicio sigue siendo la intervención modificable más efectiva. Los análisis bibliométricos confirman el crecimiento sostenido de la investigación en la ciencia del ejercicio y la fragilidad, lo que refleja su papel central en el envejecimiento y las estrategias de prevención de caídas (
Azizan, 2024a ). El triaje habilitado por IA para programas de ejercicio estructurados y basados en la evidencia, particularmente cuando se combina con terapia de reminiscencia para pacientes con deterioro cognitivo (
Azizan et al., 2023 ), representa una vía prometedora de prevención de precisión. Este enfoque justifica la evaluación a través de ensayos aleatorizados por conglomerados para evaluar su efectividad en diversas poblaciones y entornos de atención.
8.5 . Marcos regulatorios y de estandarización
El desarrollo de marcos regulatorios que aborden específicamente la IA en la atención médica proporcionará una guía más clara para el desarrollo e implementación de sistemas. La estandarización de las métricas de rendimiento de la IA y los protocolos de validación facilitará la comparación entre sistemas y mejorará el control de calidad. Las organizaciones profesionales y los organismos reguladores están desarrollando directrices para la implementación de la IA en la atención médica que definirán el futuro desarrollo y la adopción de tecnologías de prevención de caídas.Se necesitan urgentemente ensayos controlados aleatorizados por conglomerados (ECA-conglomerados) de intervenciones combinadas basadas en IA, que integren modelos de predicción, sistemas de alerta y respuestas clínicas protocolizadas, para evaluar su eficacia en situaciones reales. Los resultados clave deben incluir no solo las tasas de caídas y las caídas con lesiones, sino también medidas del proceso asistencial (p. ej., tiempo de intervención, adherencia al protocolo), la carga de trabajo de enfermería, la puntualidad en la respuesta a las alertas y las métricas de la experiencia del paciente. Los ensayos de implementación deben seguir las directrices CONSORT-AI y SPIRIT-AI para garantizar la transparencia de los informes, mientras que los estudios de modelos de predicción deben cumplir los estándares TRIPOD-AI de reproducibilidad y generalización.
8.6 . Prioridades de investigación específicas por entorno asistencial
Las investigaciones futuras deberían abordar las lagunas de evidencia en diversos entornos de atención sanitaria con prioridades metodológicas específicas para cada entorno:Las residencias de ancianos y los centros de atención a largo plazo requieren una investigación dedicada dada su distinta epidemiología de caídas, limitaciones de infraestructura y marcos regulatorios. Las prioridades de investigación incluyen: (1) desarrollar modelos de predicción calibrados para poblaciones de atención residencial con diferentes perfiles de factores de riesgo (mayor prevalencia de demencia, discapacidad de movilidad, polifarmacia) que los pacientes hospitalizados agudos, (2) evaluar tecnologías de sensores de bajo costo (colchonetas para camas, sensores de puertas, colgantes portátiles) adecuadas para instalaciones con infraestructura de TI y presupuestos de capital limitados, (3) examinar la viabilidad de los enfoques de aprendizaje federado donde múltiples centros de atención a largo plazo entrenan modelos de forma colaborativa sin centralizar datos confidenciales de los residentes, y (4) evaluar estrategias de implementación que tengan en cuenta las proporciones más bajas de enfermeras por residente, la mayor rotación de personal y la variabilidad en la adopción de EHR. Metodológicamente, los ensayos aleatorizados por conglomerados con residencias de ancianos como unidad de aleatorización pueden abordar la implementación a nivel de centro y, al mismo tiempo, tener en cuenta la correlación dentro del centro en las tasas de caídas.Los centros de rehabilitación, donde los pacientes que se recuperan de una cirugía, un accidente cerebrovascular o una lesión ortopédica presentan un alto riesgo de caídas debido a problemas de movilidad y función cognitiva, merecen un estudio especializado. La investigación debería evaluar: (1) la integración de la predicción de caídas mediante IA con el seguimiento del progreso de la fisioterapia, identificando cuándo las mejoras funcionales reducen el riesgo de caídas lo suficiente como para liberalizar las restricciones de movilidad; (2) sistemas de análisis de la marcha que proporcionen una doble función de evaluación del riesgo de caídas y seguimiento del progreso de la rehabilitación, reduciendo la carga de evaluación redundante; (3) la recalibración del modelo de predicción a medida que los pacientes pasan de la silla de ruedas al andador y a la deambulación independiente, abordando los perfiles de riesgo dinámicos característicos de la rehabilitación; y (4) análisis económicos que evalúen si la prevención de caídas guiada por IA reduce la duración de la estancia hospitalaria en rehabilitación mediante una movilización más temprana y menos contratiempos relacionados con las caídas. Metodológicamente, los diseños de clústeres de cuña escalonada, donde las unidades de rehabilitación adoptan secuencialmente sistemas de IA, pueden proporcionar evidencia causal sólida a la vez que abordan las curvas de aprendizaje de la implementación.Las unidades de hospitalización psiquiátrica presentan desafíos únicos, incluyendo imprevisibilidad conductual, movimiento voluntario del paciente y sensibilidades de privacidad que requieren investigación especializada. Las prioridades incluyen: (1) sistemas de visión artificial con protecciones de privacidad mejoradas (p. ej., análisis de siluetas, estimación de pose sin reconocimiento facial) aceptables para pacientes psiquiátricos a menudo preocupados por la vigilancia, (2) modelos de predicción que incorporan factores de riesgo psiquiátricos específicos (agitación, alucinaciones de comando, sedación inducida por medicamentos) utilizando escalas estandarizadas (RASS, Escala de agitación-sedación de Richmond), (3) protocolos de alerta que minimizan la re-traumatización en pacientes con antecedentes de trauma mientras se garantiza la seguridad, y (4) investigación de implementación que examina las percepciones del personal y los pacientes de la monitorización de IA en entornos terapéuticos que enfatizan la autonomía y la dignidad. Los estudios de métodos mixtos que combinan datos cuantitativos de resultados de caídas con entrevistas cualitativas que exploran las experiencias de pacientes y personal pueden informar una implementación ética y aceptable.Las unidades pediátricas, caracterizadas por su tamaño y variabilidad en el desarrollo según la edad, requieren tecnologías y validación apropiadas para cada edad. La investigación debe abordar: (1) sensores portátiles diseñados para niños y adolescentes con peso reducido y materiales hipoalergénicos; (2) sistemas de visión artificial entrenados con patrones de marcha pediátricos que consideren las etapas del desarrollo y la variabilidad del movimiento infantil; (3) modelos de predicción que incorporen factores de riesgo específicos de la edad pediátrica (retraso en el desarrollo, cirugía reciente, presencia del cuidador) en lugar de adaptar directamente los modelos para adultos; y (4) una implementación centrada en la familia que involucre a los padres/cuidadores en la prevención de caídas, respetando su autonomía y preferencias de supervisión. Los estudios de cohorte prospectivos con muestras adecuadas de eventos de caídas pediátricas (n > 500 caídas) y validación externa en hospitales infantiles pueden establecer umbrales de riesgo y parámetros de rendimiento apropiados para el desarrollo.
9. Limitaciones de esta revisión
Se deben reconocer varias limitaciones al interpretar los hallazgos de esta revisión narrativa.En primer lugar, esta revisión empleó una síntesis narrativa con búsqueda sistemática de literatura en lugar de una revisión sistemática formal o
un metaanálisis . Si bien la estrategia de búsqueda fue exhaustiva y reproducible, no registramos un protocolo, no realizamos una revisión de texto completo independiente por duplicado para todos los artículos ni completamos una evaluación formal del riesgo de sesgo utilizando herramientas estandarizadas (p. ej., PROBAST para modelos de predicción). En consecuencia, esta revisión no proporciona el mismo nivel de rigor metodológico o certeza de la evidencia que una revisión sistemática que cumple con PRISMA. La naturaleza heterogénea de los estudios incluidos con diferentes metodologías (predicción vs. detección vs. implementación), definiciones de resultados (caídas vs. caídas lesivas vs. casi caídas), métricas de rendimiento (precisión vs. AUROC vs. AUPRC, con informe inconsistente de la calibración), entornos clínicos y poblaciones de pacientes impidieron un metaanálisis formal
y limitaron nuestra capacidad para extraer conclusiones definitivas sobre la efectividad comparativa de diferentes enfoques de IA.En segundo lugar, la información inconsistente sobre las métricas clave de rendimiento representa una barrera importante para la síntesis de la evidencia. Muchos estudios solo informan sobre la «precisión» sin especificar el AUROC, el AUPRC, la calibración (puntuación ECE o Brier) ni los intervalos de confianza del 95 %. El desequilibrio de clases (la proporción de eventos de caídas y ausencia de eventos) y los umbrales de decisión rara vez se especifican explícitamente, lo que imposibilita la comparación de valores predictivos positivos entre estudios, una métrica crucial para evaluar el riesgo de fatiga por alarmas en la implementación clínica. Las investigaciones futuras deberían adoptar marcos de información estandarizados (TRIPOD-AI para modelos de predicción, CONSORT-AI para ensayos de intervención) para facilitar la síntesis de la evidencia.En tercer lugar, el sesgo de publicación puede influir en los hallazgos, ya que los estudios que informan resultados positivos tienen mayor probabilidad de publicarse que aquellos con resultados negativos o inconcluyentes. Este sesgo puede llevar a una sobreestimación de la eficacia de los sistemas de IA para la prevención de caídas y a una subestimación de los desafíos de su implementación.En cuarto lugar, el rápido ritmo de los avances tecnológicos en IA implica que algunos hallazgos podrían quedar obsoletos rápidamente. La revisión incluye estudios que abarcan casi una década, durante la cual se han producido avances significativos en algoritmos de aprendizaje automático, tecnologías de sensores y capacidades computacionales.En quinto lugar, la mayoría de los estudios incluidos se realizaron en instituciones individuales con validación interna únicamente, lo que limita la generalización de los hallazgos a diversos entornos sanitarios. La validación externa de un modelo en centros no involucrados en su desarrollo se reportó en menos del 20 % de los estudios de modelos de predicción. La mayor parte de la investigación se ha realizado en sistemas sanitarios con recursos suficientes en países de altos ingresos (63 % en EE. UU. y Canadá según
Spoon et al., 2024 ), lo que podría limitar su aplicabilidad a entornos con recursos limitados, países de ingresos bajos y medios, y hospitales de acceso crítico.En sexto lugar, muchos estudios de implementación emplearon diseños pre-post sin controles concurrentes, lo que dificulta distinguir los efectos de la IA de las tendencias seculares, las iniciativas de seguridad concurrentes o los efectos Hawthorne (cambio de comportamiento debido a la observación). Las series temporales interrumpidas o los diseños aleatorizados por conglomerados con un ajuste de tendencias adecuado ofrecen una inferencia causal más sólida, pero siguen siendo poco comunes en la literatura.En séptimo lugar, es necesario reconocer la transparencia de la financiación y los posibles conflictos de intereses. No evaluamos sistemáticamente si los estudios incluidos recibieron financiación de empresas que desarrollan tecnologías de IA para la prevención de caídas, aunque las declaraciones de conflictos de intereses publicadas sugieren varios ensayos patrocinados por la industria (p. ej., evaluaciones de la plataforma SafelyYou, sistemas patentados integrados en HCE). Los estudios financiados por la industria pueden presentar sesgo de publicación que favorece los resultados positivos, proyecciones optimistas de rendimiento y una subestimación de los desafíos o costes de implementación. En los casos en que fue posible identificarlos, se registraron las afiliaciones de los proveedores; sin embargo, un análisis exhaustivo de los conflictos de intereses requeriría contactar directamente con los autores y examinar registros de ensayos no publicados. Los lectores deben interpretar las tasas de éxito de la implementación y las afirmaciones de coste-efectividad con el debido escepticismo, a la espera de ensayos pragmáticos independientes iniciados por los investigadores.En octavo lugar, la rápida evolución de las tecnologías de IA implica que algunos hallazgos podrían tener una validez temporal limitada. Las arquitecturas de aprendizaje automático, las tecnologías de sensores y los flujos de trabajo clínicos han avanzado considerablemente durante el período de revisión (2015-2024). Los primeros estudios que emplean regresión logística básica o sensores simples basados en umbrales podrían subestimar las capacidades de los sistemas actuales de aprendizaje profundo con fusión multisensorial. Por otro lado, publicaciones recientes podrían reflejar prototipos de investigación optimizados aún no validados en diversos entornos reales. Esta heterogeneidad temporal limita la síntesis, pero refleja la realidad de revisar un campo emergente donde la tecnología y la evidencia coevolucionan.Por último, los datos de seguimiento a largo plazo son limitados en muchos estudios, lo que dificulta la evaluación de la eficacia sostenida de los sistemas de prevención de caídas con IA, la desviación del modelo a lo largo del tiempo y su impacto en los resultados de los pacientes durante períodos prolongados.
10. Conclusión
La inteligencia artificial representa un enfoque prometedor, aunque aún no plenamente desarrollado, para la prevención de caídas en hospitales. Ofrece ventajas potenciales sobre los métodos tradicionales de evaluación y monitorización de riesgos cuando se desarrolla, valida e implementa rigurosamente con una gobernanza adecuada y expectativas realistas. La evidencia demuestra que las tecnologías de IA pueden, en muchos casos, mejorar sustancialmente la precisión de las predicciones, permitir la intervención en tiempo real y proporcionar capacidades personalizadas de evaluación de riesgos que mejoran los resultados de seguridad del paciente en entornos clínicos y poblaciones de pacientes seleccionados con la infraestructura y los recursos adecuados.Los modelos predictivos de aprendizaje automático han alcanzado valores de AUROC de 0,85 a 0,97 en estudios de validación interna, superando con frecuencia, aunque no de forma universal, las herramientas convencionales de evaluación de riesgos. Sin embargo, las deficiencias persistentes en la validación externa, la evaluación de la calibración y la notificación de desequilibrios de clase y umbrales de decisión siguen constituyendo limitaciones significativas que limitan la confianza en la generalización y la disponibilidad para una implementación generalizada. Los sistemas de visión artificial ofrecen un potencial sin precedentes para la monitorización en tiempo real, a la vez que preservan la privacidad del paciente mediante enfoques tecnológicos innovadores. Sin embargo, la latencia computacional, las dependencias de la iluminación y los desafíos de oclusión requieren un perfeccionamiento técnico continuo. Las tecnologías basadas en sensores ofrecen una vigilancia continua que puede detectar cambios sutiles en el estado del paciente que pueden preceder a caídas, dependiendo de la adherencia del paciente, la carga de carga del dispositivo y la gestión de falsas alarmas. El procesamiento del lenguaje natural mejora la exhaustividad de la evaluación de riesgos al extraer información valiosa de la documentación clínica, aunque la gestión de la negación y la portabilidad entre sistemas de HCE requieren un desarrollo metodológico continuo.Implementaciones clínicas seleccionadas en diversos entornos de atención médica han informado tasas de reducción de caídas de aproximadamente 0,9 a 1,2 caídas por 1000 días-paciente (reducción relativa del 15 al 40 %) a partir de las tasas iniciales de 2,8 a 5,1 caídas por 1000 días-paciente. Sin embargo, la mayoría de los estudios emplearon diseños pre-post sin controles concurrentes, lo que dificulta la atribución causal confiable y genera inquietudes sobre tendencias seculares, efectos Hawthorne y sesgo de publicación. La heterogeneidad de la implementación, las diferencias en el enrutamiento de alertas, protocolos de respuesta, intervenciones concurrentes y tasas de caídas iniciales complican aún más la síntesis y limitan la generalización de los hallazgos. Estos sistemas han demostrado ser particularmente prometedores, aunque no universales, en entornos de alto riesgo, como unidades de cuidados intensivos y salas geriátricas, donde las estrategias tradicionales de prevención de caídas pueden ser menos efectivas, aunque las barreras económicas siguen siendo sustanciales para instalaciones más pequeñas y entornos con recursos limitados. Persisten importantes desafíos que podrían limitar la adopción generalizada a corto plazo, como la fatiga de alarmas (con una carga de alertas y un valor predictivo positivo rara vez cuantificados), el sesgo algorítmico que requiere auditorías de imparcialidad continuas, cuestiones de responsabilidad sin resolver cuando fallan los sistemas de IA, preocupaciones sobre la privacidad, complejidades de la integración clínica y importantes barreras de coste para instituciones más pequeñas, con periodos de recuperación de hasta 48 meses en hospitales de acceso crítico. El desarrollo de sistemas de IA explicables, marcos de evaluación estandarizados con informes obligatorios de AUROC, AUPRC, calibración e IC del 95 %, políticas de gobernanza integrales para la gestión del ciclo de vida de los modelos, marcos legales que aclaren la asignación de responsabilidades y una investigación de implementación específica son esenciales para avanzar en este campo hacia una implementación madura y equitativa.Los desarrollos futuros deberían priorizar:
- •Validación externa en múltiples sitios con diversas poblaciones de pacientes y entornos clínicos, incluidos hogares de ancianos, centros de rehabilitación y unidades psiquiátricas actualmente subrepresentadas en la literatura.
- •Aprendizaje federado combinado con recalibración a nivel de sitio para abordar la combinación local de pacientes y las prácticas de documentación
- •Ensayos controlados aleatorizados por grupos que examinan paquetes de atención basados en IA (predicción + alerta + intervención protocolizada) con resultados que incluyen tasas de caídas, caídas lesivas, medidas del proceso de atención, carga de alertas, experiencia del paciente y rentabilidad en diversos tipos de instalaciones.
- •Conjuntos de informes mínimos estandarizados que permiten la síntesis de evidencia y la investigación de efectividad comparativa, incluidas las tasas de caída de referencia, el desequilibrio de clases, el enfoque de validación, las métricas de calibración y las divulgaciones de financiación de la industria.
- •Los enfoques de medicina de precisión integran vías de prevención basadas en ejercicios para la fragilidad ( Azizan, 2024a ) e intervenciones cognitivas ( Azizan et al., 2023 ) después de la estratificación del riesgo de IA, reconociendo que la activación automatizada de intervenciones sigue siendo una recomendación teórica que requiere validación prospectiva.
- •Marcos legales y regulatorios que aclaran la asignación de responsabilidad, los requisitos de consentimiento informado y los estándares de gobernanza cuando los sistemas de IA no logran prevenir las caídas
- •Modelos económicos que abordan la sostenibilidad más allá de la financiación inicial de las subvenciones, en particular para hospitales de acceso crítico e instituciones de red de seguridad
La continua evolución de las tecnologías de IA, combinada con el creciente reconocimiento de su potencial valor clínico, sugiere que los sistemas de prevención de caídas basados en IA podrían volverse cada vez más comunes en entornos sanitarios, especialmente en instituciones con recursos suficientes y una infraestructura de HCE consolidada. Sin embargo, el éxito dependerá de una implementación minuciosa que priorice la validación externa rigurosa, la transparencia en la elaboración de informes, incluyendo la gestión de conflictos de intereses, la monitorización de la equidad algorítmica, marcos de responsabilidad claros y procesos de consentimiento informado, la seguridad y la protección de la privacidad del paciente, una integración fluida del flujo de trabajo y una evaluación económica realista. En lugar de una adopción generalizada inmediata, se debe proceder con cautela, con la evidencia confirmatoria de ensayos clínicos aleatorizados por conglomerados multicéntricos que demuestren no solo la reducción de caídas, sino también una carga de alerta aceptable, un rendimiento equitativo entre los subgrupos de pacientes, una rentabilidad favorable en diversos entornos sanitarios y la resolución de los problemas de responsabilidad. A medida que estos sistemas maduren y acumulen evidencia sólida con una gobernanza adecuada, tienen el potencial de contribuir significativamente a la reducción de la carga de caídas hospitalarias y a la mejora de los resultados de los pacientes a nivel mundial. Si bien aún quedan importantes lagunas en la evidencia, la ciencia de la implementación, los marcos legales y la equidad sanitaria por abordar antes de que la prevención de caídas mediante IA pueda considerarse un estándar de atención consolidado y validado.