Inteligencia artificial clínica: por qué no basta con que funcione

Adopción, continuidad, seguridad y la pregunta que nadie quiere responder: ¿quién paga?

Este trabajo sobre la aplicación de la inteligencia artificial en la práctica clínica fue realizado leyendo y analizando los dos artículos de Takagi S y Sugihara en Jama Health Forum del 17 de junio, así como otro artículo de Hassan M et al. 2024, que profundiza en la evolución y el impacto de la IA clínica en la atención médica. La investigación se llevó a cabo bajo la premisa de que la inteligencia artificial tiene el potencial de transformar la manera en que se brindan los servicios de salud, optimizando tanto el diagnóstico como el tratamiento de diversas enfermedades. Con correcciones posteriores realizadas por mí, me parece que para aquellos que seguimos con interés académico y de gestión, la inquietud sobre cómo se financia la IA clínica, esencial para asistir a los profesionales, debería ser impulsada por asociaciones profesionales no coaptadas y por financiadores públicos, de la seguridad social o privados, integrados en un modelo que priorice el bienestar de la población. El trabajo colaborativo entre diferentes sectores es fundamental, ya que el verdadero interés debe radicar en mejorar la salud de las comunidades, cumpliendo con un deber político y también respondiendo a intereses lucrativos. Sin embargo, es crucial alinear los intereses de los pacientes, las comunidades, los países y los sistemas de salud, junto con la industria del cuidado de la salud, para que trabajen en sinergia. Esto no sólo fomentaría una integración más efectiva de la IA en la práctica clínica, sino que también permitiría una gestión más eficiente de los recursos. Porque, con estas acciones, no se generará una «epidemia de salud»; al contrario, si bien las personas se enfermarán igualmente, tendrán la posibilidad de vivir más años y con mayor libertad, disfrutando de una mejor calidad de vida a pesar de los desafíos que la salud pública sigue enfrentando en el mundo contemporáneo.


Cada pocos meses aparece un nuevo algoritmo capaz de detectar un cáncer de piel con la precisión de un dermatólogo experto, de predecir un paro cardíaco horas antes de que ocurra, o de redactar la nota clínica mientras el médico simplemente conversa con el paciente. Los titulares son consistentes: la inteligencia artificial (IA) «supera» a los humanos en tal o cual tarea diagnóstica. Y sin embargo, la mayoría de esas herramientas nunca llega a usarse de forma rutinaria en un hospital o un centro de salud. Quedan atrapadas en la distancia que separa un buen estudio publicado en una revista de alto impacto de un sistema que un clínico abre todos los días, durante años, para atender pacientes reales.

Esa distancia no se explica por la tecnología. Dos investigaciones recientes —una revisión de alcance publicada en JMIR Human Factors sobre barreras y facilitadores de la adopción de IA en salud, y un artículo de opinión publicado en JAMA Health Forum en junio de 2026 sobre quién debería pagar la IA clínica— coinciden en algo incómodo: el problema rara vez es si el algoritmo funciona. El problema es todo lo que rodea al algoritmo: la confianza, la gobernanza, el sostenimiento en el tiempo, la seguridad de los datos y, sobre todo, el dinero. En este artículo recorremos esos cuatro frentes —adopción, continuidad, seguridad y financiamiento— y cerramos con la pregunta que motivó esta nota: ¿pueden los grandes financiadores públicos, como Medicare, ser la respuesta?

1. Qué entendemos por IA clínica (y por qué importa la definición)

Antes de hablar de barreras conviene aclarar de qué estamos hablando. La definición de IA más citada en la literatura sigue siendo la que acuñó John McCarthy en 1956: la ciencia y la ingeniería de crear máquinas inteligentes. En el contexto sanitario actual, esa idea se traduce sobre todo en dos familias de técnicas: el aprendizaje automático, que trabaja con datos estructurados como imágenes diagnósticas o resultados de laboratorio, y el procesamiento del lenguaje natural, que extrae sentido de datos no estructurados como las notas clínicas en texto libre. La aparición de modelos de lenguaje extenso —ChatGPT es el ejemplo más visible desde 2022— sumó una tercera capa: sistemas capaces de leer historiales electrónicos y generar resúmenes o documentación, reduciendo la carga administrativa del personal clínico.

El artículo de Takagi y Sugihara en JAMA Health Forum propone una definición operativa más estrecha y útil para esta discusión: IA clínica es aquella que afecta materialmente la documentación, la toma de decisiones, el flujo de trabajo o el pago dentro de la atención médica, incluyendo herramientas híbridas como los sistemas de documentación ambiental que escuchan la consulta y generan la nota automáticamente. Esta definición importa porque deja afuera la IA puramente administrativa de bajo riesgo y concentra la conversación donde realmente se juegan la seguridad del paciente y el dinero público: en los sistemas que tocan decisiones clínicas o ciclos de facturación.

2. La adopción no es un evento, es un proceso largo y frágil

La revisión sistemática de Hassan, Kushniruk y Borycki analizó 50 estudios publicados entre 2011 y 2023 y agrupó los hallazgos en aproximadamente 18 categorías de barreras y facilitadores. El dato que enmarca todo el trabajo es contundente: se estima que el 70% de los proyectos de tecnología de la información en salud fracasan. No por falta de presupuesto inicial ni de validación técnica, sino porque las organizaciones sanitarias son sistemas complejos, con estructuras heredadas, escasez crónica de recursos y una resistencia natural al cambio cuando la carga de trabajo ya es alta.

Los autores distinguen, citando el marco clásico de difusión de innovaciones de Everett Rogers, entre implementación —la introducción técnica de una herramienta— y adopción —su incorporación real a la práctica cotidiana. Esa distinción es clave: un hospital puede instalar perfectamente un sistema de IA y que, dos años después, nadie lo use porque no se ganó la confianza de los clínicos.

¿Qué hace que un sistema sí se adopte? La revisión identifica varios factores que se repiten en la literatura:

Gobernanza con responsabilidades claras. No alcanza con un comité de ética genérico. Los estudios revisados piden estructuras que supervisen todo el ciclo del proyecto —desde la concepción hasta la implementación y el mantenimiento— con roles explícitos: quién revisa una predicción de riesgo, quién responde si el algoritmo se equivoca, quién aprueba una actualización del modelo.

Alineación estratégica. Cuando la incorporación de IA no está conectada con los objetivos generales de la organización, los resultados son inconsistentes y la comunicación entre departamentos se fragmenta. Alemania, por ejemplo, introdujo una ley específica de apoyo financiero para que las organizaciones sanitarias pudieran incluir la IA en su estrategia sin que el costo fuera la barrera de entrada.

Un problema real detrás del algoritmo. Varios estudios advierten sobre el error de partir de los datos disponibles para «buscarle una solución», en lugar de identificar primero un problema clínico concreto que la IA pueda resolver. Los proyectos sin un caso de uso bien definido tienden a estancarse en la fase de implementación.

Participación temprana de los usuarios finales. Clínicos y pacientes deben estar involucrados desde el diseño, no solo en la fase de prueba final. Los estudios documentan que incorporar a un «líder clínico» desde el inicio —alguien que entienda tanto la tecnología como la práctica diaria— mejora sustancialmente las probabilidades de adopción exitosa.

Integración real con el flujo de trabajo. Un sistema de IA que obliga a los clínicos a salir de su rutina habitual para consultarlo está destinado al abandono. La recomendación que se repite en distintos estudios es simple en su enunciado y difícil en la ejecución: la herramienta debe encajar en cómo se trabaja hoy, no exigir que el equipo cambie su forma de trabajar para acomodarla.

Por encima de todos estos factores, los autores identifican la confianza como el catalizador central. La confianza, a su vez, depende de que se resuelvan adecuadamente el sesgo algorítmico, la transparencia de las decisiones y la seguridad clínica —temas que desarrollamos en la siguiente sección.

3. Continuidad: la IA no se instala, se sostiene

Si la revisión de Hassan et al. describe qué hace falta para que un sistema empiece a usarse, el artículo de Takagi y Sugihara pone el foco en un problema distinto y menos discutido: qué hace falta para que ese sistema siga funcionando bien con el paso del tiempo.

Su argumento central es que la IA clínica no es software estático. A diferencia de un equipo médico tradicional, que una vez calibrado se mantiene relativamente estable, un modelo de IA puede degradarse silenciosamente a medida que cambian las poblaciones de pacientes, los patrones de práctica clínica, los hábitos de documentación o el ecosistema de dispositivos con el que interactúa. Un algoritmo entrenado con los datos de un hospital en 2023 puede empezar a fallar en 2026 simplemente porque el perfil de los pacientes que llegan a urgencias cambió, o porque se actualizó el sistema de historia clínica electrónica con el que se integra.

Esto convierte el monitoreo continuo del rendimiento en parte del análisis de seguridad de la tecnología, no en un costo accesorio. Los autores señalan que las tendencias regulatorias más recientes ya reflejan esta realidad: cada vez se exige a los desarrolladores presentar planes formales para actualizar sus sistemas a lo largo del tiempo, reconociendo que el cambio es inevitable y que necesita procesos de supervisión claros.

La pregunta de fondo, entonces, no es solo «¿quién implementa este sistema?», sino «¿quién tiene la autoridad y el presupuesto para vigilar su desempeño dentro de tres años, comunicar sus limitaciones a los usuarios y financiar las actualizaciones cuando hagan falta?». Esta pregunta, según Takagi y Sugihara, casi nunca se responde antes de que un programa piloto arranque, y esa omisión es una de las razones por las que tantas herramientas técnicamente sólidas terminan abandonadas.

4. Seguridad: dos problemas distintos que suelen mezclarse

Cuando se habla de «seguridad» en IA clínica, en realidad se están discutiendo dos cuestiones diferentes que conviene separar.

Seguridad de los datos. La revisión de Hassan et al. identifica la seguridad de los datos como un factor central de vacilación entre las organizaciones sanitarias. Las preocupaciones giran en torno a la ciberseguridad de los datos de entrenamiento y de prueba, el temor a que rastreadores o spyware accedan a información no solicitada, y un riesgo particularmente delicado: la posibilidad de reidentificar pacientes a partir de datos que se suponían anonimizados. Este último punto alimenta una resistencia comprensible a compartir datos clínicos, lo que a su vez limita la cantidad y diversidad de información disponible para entrenar mejores algoritmos —un círculo que se retroalimenta.

Seguridad clínica. Es un problema distinto: qué tan seguro es el resultado que el algoritmo le entrega al clínico. Aquí aparece el sesgo algorítmico, definido en la literatura como los casos en que un algoritmo agrava desigualdades existentes de estatus socioeconómico, raza, género o discapacidad. Los ejemplos documentados son contundentes: algoritmos que no detectan correctamente el cáncer de piel en personas de piel oscura por haber sido entrenados mayoritariamente con imágenes de piel clara, o un sistema ampliamente usado en hospitales estadounidenses que, al usar el gasto histórico en salud como variable para predecir quién necesita atención adicional, terminó siendo discriminatorio hacia pacientes negros, que en promedio gastan menos en salud que los pacientes blancos por razones estructurales ajenas a su estado de salud real.

A esto se suma el riesgo de imprecisión simple: un algoritmo demasiado conservador puede generar falsos negativos que retrasan un tratamiento necesario, mientras que uno demasiado sensible puede generar falsos positivos que añaden trabajo, ansiedad y costos innecesarios. Takagi y Sugihara conectan este punto con el financiamiento de una forma que no suele discutirse: la ciberseguridad, los controles de privacidad y los registros de auditoría no son extras opcionales, sino costos recurrentes que se repiten a lo largo de toda la vida útil del sistema. Tratarlos como un gasto único en el momento de la compra es, según los autores, una de las formas más comunes en que los proyectos de IA clínica se vuelven financieramente insostenibles.

5. El nudo del financiamiento: el problema que explica todo lo demás

Llegamos al punto donde ambos artículos convergen con más fuerza. Hassan et al. identifican la falta de financiamiento y la incertidumbre financiera como una barrera central para la implementación, especialmente cuando una tecnología todavía no tiene evidencia robusta que demuestre su valor: nadie quiere pagar por algo que todavía no probó que funciona, pero probar que funciona en condiciones reales requiere, justamente, financiamiento. Citan además el caso de IBM Watson en China, donde los pacientes debían cubrir tarifas elevadas de su bolsillo, lo que limitó severamente la adopción del sistema.

Pero es el artículo de Takagi y Sugihara el que lleva esta idea a su forma más afilada. Su tesis es que quién paga no es un detalle contable, sino la variable que determina para quién se diseña realmente un sistema de IA y con qué criterios se va a evaluar su éxito. Cuando el pagador es ambiguo —y en la mayoría de los proyectos de IA clínica lo es— el beneficiario del sistema termina siendo, de forma implícita, quien pueda justificar la partida presupuestaria. Las métricas de éxito se ajustan en consecuencia, casi siempre sin que nadie lo decida explícitamente.

Esto genera lo que los autores llaman una paradoja estructural de compra: la organización a la que se le pide que financie la adquisición y el mantenimiento no siempre es la que obtiene los ahorros a largo plazo. Un pagador —una aseguradora, por ejemplo— puede valorar la reducción de hospitalizaciones o la mejora de resultados poblacionales, mientras que el hospital que adopta el sistema enfrenta de inmediato mayores costos de integración, capacitación y gestión de riesgo. No es un problema de mala negociación entre las partes: es que, cuando un mismo sistema debe generar valor para múltiples actores con intereses distintos, alguien tiene que decidir qué métrica importa más, y esa decisión suele tomarla, sin decirlo abiertamente, quien controla el dinero.

El artículo describe además lo que llama un «círculo vicioso» de evidencia: si los sistemas de salud van a pagar, exigen un retorno de inversión demostrable —ahorro de tiempo clínico, mayor eficiencia, menor carga administrativa—; si los pacientes van a pagar de su bolsillo, necesitan percibir una experiencia mejor que la habitual; y si las aseguradoras van a reembolsar, exigen pruebas sólidas de costo-efectividad, pruebas que son difíciles de generar a gran escala precisamente porque todavía no existe una cobertura sostenible que permita esa escala. Las aseguradoras, en otras palabras, suelen pedir el tipo de evidencia que solo se puede producir con la adopción masiva que se niegan a financiar hasta tener esa evidencia.

6. El caso Medicare: ¿son los grandes financiadores la solución?

Esta es la pregunta que motivó este artículo, y la respuesta que ofrece la evidencia disponible es más matizada de lo que uno desearía.

Takagi y Sugihara citan un dato revelador del informe de junio de 2024 de la Comisión Asesora de Pagos de Medicare (MedPAC, por su sigla en inglés). Entre el software incluido como servicio pagadero por separado bajo el sistema de pago prospectivo para pacientes ambulatorios en 2022, solo una herramienta diagnóstica registró un volumen y un gasto significativos: 8.665 usos y 8,4 millones de dólares. La gran mayoría de los demás elementos de software cubiertos por esa vía de pago tuvieron poco o ningún uso registrado.

Este dato es importante porque desmonta una intuición razonable —»si un gran financiador público como Medicare paga, la adopción debería despegar»— y la reemplaza por un cuadro más complejo. Tener una vía de pago no equivale a tener un mecanismo de pago suficiente. Incluso cuando Medicare cubre formalmente una tecnología, la porción de valor que cubre puede ser pequeña en relación con el costo total de una operación verdaderamente segura: el rediseño del flujo de trabajo, el monitoreo continuo, la auditabilidad y las actualizaciones —los costos de «continuidad» que describimos en la sección 3— suelen quedar fuera del reembolso. En el caso de muchas tecnologías basadas en software, el pago de Medicare puede cubrir únicamente la etapa de análisis del algoritmo, dejando toda la implementación y la supervisión continua a cargo de la organización que lo adopta.

Además, el modelo predominante en Estados Unidos exige evidencia antes de reembolsar de forma consistente, lo que genera el círculo vicioso descrito en la sección anterior: las vías de pago para software de IA siguen siendo heterogéneas entre distintos entornos de atención y distintos pagadores, lo que añade incertidumbre regulatoria a la incertidumbre financiera.

Esto no significa que los grandes financiadores públicos no puedan ser parte de la solución. Significa que serlo requiere algo más que asignar una partida presupuestaria: requiere que el modelo de pago reconozca explícitamente los costos recurrentes del ciclo de vida completo, no solo el costo de adquisición inicial.

7. Una alternativa: el modelo alemán DiGA

El artículo de Takagi y Sugihara ofrece un punto de comparación útil: la vía de Aplicaciones de Salud Digital de Alemania, conocida por su sigla en alemán, DiGA. Bajo este esquema, las aplicaciones de salud digital elegibles pueden prescribirse y reembolsarse incluso antes de contar con evidencia madura, a través de una cobertura limitada en el tiempo o condicional que permite generar esa evidencia mientras la tecnología ya está siendo reembolsada y usada en la práctica real.

La lógica es distinta a la estadounidense: en lugar de exigir certeza probatoria completa antes de pagar, el sistema alemán intercambia explícitamente una parte de esa certeza inicial por un mecanismo que financia el aprendizaje sobre la marcha. Es, en cierto sentido, una forma de reconocer que la evidencia de costo-efectividad a gran escala solo puede generarse si primero existe una vía de pago que permita esa escala —rompiendo el círculo vicioso que el propio artículo describe para el caso estadounidense.

Ningún modelo es automáticamente superior al otro; cada uno responde de forma distinta a la misma pregunta de fondo: ¿quién financia el período de incertidumbre que existe entre un prototipo clínicamente plausible y la evidencia madura que finalmente justifica su uso masivo? Lo que sí queda claro al comparar ambos sistemas es que la ambigüedad —no tener ninguna respuesta explícita a esa pregunta— es la peor opción posible para cualquier sistema de salud.

8. Cuatro preguntas antes de cualquier piloto de IA clínica

A partir de todo este análisis, Takagi y Sugihara proponen un marco simple pero exigente: antes de lanzar cualquier programa piloto de IA clínica destinado a convertirse en uso rutinario, desarrolladores y organizaciones adoptantes deberían poder responder, de forma explícita, cuatro preguntas.

La primera es quién paga, y no solo en el momento de la adquisición: quién financiará los costos recurrentes de una operación segura, incluyendo cómputo, soporte de integración, ciberseguridad, gobernanza, monitoreo y actualizaciones. Si el costo se comparte entre varias partes, hace falta definir qué activa la obligación de cada una y cómo se resuelven los desacuerdos.

La segunda es quién es el beneficiario principal: pacientes, médicos, la organización o las aseguradoras. Cuando estos intereses entran en conflicto —algo que ocurre con frecuencia— hace falta establecer de antemano cuál tiene prioridad y qué salvaguardias impiden que se manipulen las métricas de éxito, por ejemplo optimizando la velocidad de la documentación a costa de la calidad de la atención.

La tercera es la alineación de métricas: qué resultados van a definir el valor del sistema tanto para el pagador como para el beneficiario, y cuál es el plan concreto para medirlos. Los autores sugieren métricas plausibles como el tiempo recuperado por el personal clínico, el acceso y la continuidad de la atención, medidas de resultado validadas, señales de seguridad y el impacto en la equidad —junto con umbrales preestablecidos que determinen cuándo interrumpir, revisar o ampliar el programa.

La cuarta es la rendición de cuentas a lo largo del ciclo de vida: quién tiene la autoridad y la responsabilidad de supervisar los cambios de rendimiento en el tiempo, comunicar las limitaciones del sistema a los usuarios, supervisar las actualizaciones, y quién financia esas obligaciones cuando surgen tensiones en la operación real, no en el plan original.

Los autores son claros en un punto: estas cuatro preguntas no reemplazan los estudios clínicos tradicionales, sino que los hacen interpretables. Y proponen una idea final que vale la pena subrayar: la IA clínica puede tratarse como un bien público que justifica infraestructura subvencionada y supervisión compartida, o como un complemento premium cuyo beneficio debe estar contemplado dentro del reembolso existente. Ambas opciones son defendibles. Lo que no es defendible es la ambigüedad.

9. Conclusión: la pregunta correcta no es si funciona

Si hay una idea que conviene llevarse de este recorrido por ambos artículos, es que la conversación pública sobre IA en salud está, en buena medida, formulando la pregunta equivocada. Preguntar si un algoritmo es preciso, si supera a un especialista humano en una tarea específica, es relevante pero insuficiente. La pregunta que realmente determina si esa tecnología va a llegar a transformar la atención de un paciente real es otra: ¿para quién se está diseñando este sistema, quién va a financiar su seguridad a lo largo de los años, y con qué criterios se va a evaluar el valor que genera?

La evidencia disponible —tanto la revisión sistemática de barreras y facilitadores como el análisis específico sobre financiamiento— apunta en la misma dirección. La confianza no se construye solo con buenos resultados técnicos, sino con gobernanza, participación de los usuarios e integración cuidadosa en el flujo de trabajo real. La continuidad no es un detalle posterior a la implementación, sino parte central del análisis de seguridad desde el primer día. Y el financiamiento, lejos de ser un problema administrativo secundario, es la variable que termina decidiendo, en la práctica, para quién trabaja realmente cada sistema de inteligencia artificial en salud.

Los grandes financiadores públicos como Medicare pueden, eventualmente, ser parte central de la solución. Pero la experiencia documentada hasta ahora muestra que asignarles ese rol sin resolver antes las cuatro preguntas de financiamiento, beneficiario, métricas y rendición de cuentas produce justamente lo que se observó en el informe de 2024: una vía de pago que existe en el papel, pero que en la práctica casi nadie usa.


Referencias

  1. Hassan M, Kushniruk A, Borycki E. Barreras y facilitadores de la adopción de la inteligencia artificial en la atención sanitaria: Revisión del alcance. JMIR Human Factors. 2024;11:e48633. PMID: 39207831; PMCID: PMC11393514.
  2. Takagi S, Sugihara G. Inteligencia artificial clínica: ¿a quién beneficia y quién la paga? JAMA Health Forum. 2026;7(6):e261531. doi:10.1001/jamahealthforum.2026.1531.

Nota: este artículo fue elaborado por saludbydiaz como una síntesis divulgativa de los dos estudios citados. Para profundizar en la metodología, las tablas de evidencia completas y la bibliografía secundaria empleada por cada uno de los autores originales, se recomienda consultar los artículos completos en las fuentes indicadas.

Publicado por saludbydiaz

Especialista en Medicina Interna-nefrología-terapia intensiva-salud pública. Director de la Carrera Economía y gestión de la salud de ISALUD. Director Médico del Sanatorio Sagrado Corazon Argentina. 2010-hasta la fecha. Titular de gestión estratégica en salud

Deja un comentario