Autores : Dr. ThomasM. Maddox , Dr. Peter Embí , Dr. Jackie Gerhart , Dra. Jennifer Goldsack , M.Chem ., MA, MBA , Dr. Ravi B. Parikh , MPP https://orcid.org/0000-0003-2692-6306, y Troy C. Sarich , Ph.D. Publicado 10 de abril de 2025 N Engl J Med 2025 ; 392 : 2479 – 248310.1056/NEJMsb2503956 VOL. 392 NÚM. 24
La inteligencia artificial generativa (GenAI), y en particular los grandes modelos lingüísticos (LLM), se utilizan cada vez más en el ámbito sanitario. Para abordar esta tendencia, el Digital Health Action Collaborative de la Academia Nacional de Medicina (NAM) convocó un taller de expertos en salud, tecnología y regulación en octubre de 2023 para definir aplicaciones y marcos para la GenAI y los LLM en medicina y ciencias biomédicas. En una publicación especial de la NAM que acompaña a la publicación, 1
«Generative Artificial Intelligence in Health and Medicine», se describe una cadencia de preparación de aplicaciones que sitúa las aplicaciones de GenAI en una escala temporal relativa de madurez ( Figura 1 ), así como una matriz de asignación de responsabilidades para las distintas partes interesadas necesarias en el ciclo de vida de la tecnología GenAI.
Figura 1

Desde el taller, la adopción de GenAI en la atención médica ha continuado. En concreto, se han producido avances en la educación y la participación del paciente, así como en la síntesis de información, nuestras aplicaciones previstas a corto plazo. Además, se ha avanzado en la simplificación de la documentación y la codificación, una de nuestras aplicaciones a medio plazo. En cambio, otras aplicaciones en nuestros ámbitos a medio y largo plazo se encuentran en una fase inicial de desarrollo. Describimos cómo estos avances y perspectivas se basan en nuestro informe, lo que nos permite aprender de forma continua e iterativa cómo adaptar mejor la tecnología GenAI a la salud, la medicina y las ciencias biomédicas.
Educación y participación del paciente
Se han logrado grandes avances en el apoyo basado en GenAI para la educación y la participación del paciente. Estudios preliminares indican que los chatbots basados en IA pueden ayudar a los pacientes con la programación de citas, la clasificación de síntomas y las consultas relacionadas con la salud. 2 Los resúmenes de información médica generados por GenAI han mejorado la comprensión, lo que permite a los pacientes tomar decisiones informadas sobre su atención. 3 Se ha demostrado que la redacción de mensajes asistida por GenAI mejora la claridad y la empatía de la comunicación digital entre pacientes y profesionales sanitarios, fomentando una mayor interacción. 4Una capacidad prometedora de GenAI es su potencial para superar las barreras lingüísticas y de alfabetización sanitaria. Existe evidencia preliminar de que los modelos GenAI pueden traducir y simplificar el contenido médico con mayor eficacia que las herramientas de traducción tradicionales.<sup> 5 </sup> Estudios han indicado que los resúmenes en lenguaje sencillo generados por GenAI pueden facilitar la comprensión del paciente, especialmente entre aquellos con un nivel limitado de alfabetización sanitaria.<sup> 6</sup> Estos resúmenes en lenguaje sencillo pueden contribuir a la traducción de documentación con el objetivo de mejorar la comprensión del paciente sobre la evolución y el manejo de una enfermedad.<sup> 7</sup>A pesar de la creciente disponibilidad de herramientas GenAI, la evidencia sobre la interacción de los pacientes con estas herramientas sigue siendo limitada. La evidencia preliminar sugiere una adopción desigual: algunos pacientes aceptan la guía generada por GenAI, mientras que otros se muestran reticentes debido a preocupaciones sobre la fiabilidad y la transparencia. 8 Además, existe una brecha notable en la investigación sobre resultados centrados en el paciente, como la comprensión, la satisfacción y la confianza en la atención asistida por GenAI. 9
Documentación clínica y síntesis de información
GenAI ha demostrado ser prometedora en la mejora de la documentación médica y la síntesis de información para los profesionales clínicos. Estos avances pueden reducir la carga cognitiva de los profesionales sanitarios y abordar las deficiencias de la documentación generada por personas. 10 Ejemplos actuales de esta aplicación incluyen la documentación de notas clínicas, el resumen de historias clínicas y la mensajería para pacientes.
Documentación de notas clínicas
En los últimos años se han desarrollado diversas herramientas de IA para la generación de notas clínicas. Un estudio demostró que, en todas las especialidades, los profesionales clínicos que utilizaban tecnología de IA para redactar notas clínicas dedicaban un 20 % menos de tiempo a completarlas y un 30 % menos de tiempo a trabajar fuera del horario laboral que los profesionales clínicos que no utilizaban dicha tecnología.<sup> 11</sup> Otro estudio describió la capacidad de GenAI para facilitar interacciones más personales, significativas y efectivas entre pacientes y profesionales sanitarios, y para reducir la carga de trabajo administrativo fuera del horario laboral.<sup> 12 </sup> GenAI puede identificar las órdenes discutidas durante una visita y presentarlas al profesional clínico para su verificación y aprobación.<sup> 13</sup> Se necesitan estudios adicionales para evaluar la integridad y precisión de las notas, así como el efecto de estas herramientas en la eficiencia y la satisfacción del profesional clínico.
Resumen del gráfico
Varias organizaciones sanitarias estadounidenses e internacionales utilizan la función de resumen de historias clínicas basada en GenAI para agilizar su revisión, especialmente para la planificación y las rondas previas a la consulta. Se ha demostrado que los resúmenes de historias clínicas generados por GenAI son similares a los generados por médicos en cuanto a integridad, exactitud y concisión. En un estudio, los resúmenes de los LLM se consideraron equivalentes (en el 45 % de los casos) o superiores (en el 36 %) a los resúmenes de los expertos médicos y su elaboración fue más rápida, reduciéndose el tiempo promedio de compilación de 7 minutos sin el uso de LLM a tan solo unos segundos con LLM. 14
Mensajería para pacientes
Las herramientas GenAI se han desarrollado para facilitar la comunicación electrónica entre profesionales clínicos y pacientes. La herramienta genera un borrador inicial de la respuesta del profesional clínico al mensaje electrónico del paciente, que este revisa y edita antes de enviarlo. Un estudio mostró que el 72 % de los profesionales clínicos que utilizaban respuestas redactadas por GenAI para responder a los mensajes de los pacientes reportaron una reducción en la carga cognitiva.<sup> 15</sup> En otro estudio, el 92 % de las enfermeras consideró que el uso de los mensajes redactados por IA mejoró la eficiencia, la empatía y el tono.<sup> 16</sup> Sin embargo, algunos estudios no mostraron una reducción en el tiempo asociado con las respuestas, <sup>17</sup> y otros indicaron que el rol del profesional clínico podría ser importante, ya que las enfermeras son más propensas a reportar una mayor eficiencia que los médicos.<sup> 16</sup>
Optimización de la documentación y la codificación
GenAI puede mejorar la precisión y la eficiencia de la codificación, la facturación y los pagos de la atención médica. La IA puede optimizar la codificación de la evaluación y la gestión mediante el uso de notas generadas por IA, lo que puede reducir errores y aumentar la precisión de la codificación. Un estudio de Mayo Clinic de 2024 demostró que ChatGPT versión 4.0 asignó correctamente los códigos de la
Clasificación Internacional de Enfermedades , 10.ª revisión (CIE-10), en el 99 % de los casos de nefrología, superando a ChatGPT versión 3.5 (en la que los códigos CIE-10 se asignaron correctamente en el 87 % al 91 % de los casos). 18La información generada por IA también puede ayudar a identificar y abordar las causas fundamentales de las denegaciones de reclamaciones, lo que se traduce en una codificación más eficiente y procesos de gestión del ciclo de ingresos más rápidos. 19 Además, GenAI puede facilitar autorizaciones previas más rápidas, acortando así los retrasos en la atención al paciente, aumentando la participación y reduciendo la carga administrativa. Sin embargo, dado que la IA genera tanto cartas de necesidad médica de los médicos como cartas de denegación (o aprobación) de las aseguradoras, un entorno de «IA contra IA» podría aumentar el riesgo de sesgo y errores, un factor que pone de relieve la necesidad de una gobernanza y supervisión sólidas del uso de la IA en la toma de decisiones de los médicos y las aseguradoras.
Futuras aplicaciones de la IA generativa en la atención sanitaria
El progreso logrado en el uso de GenAI para apoyar la educación y la participación del paciente, la síntesis de información y la optimización de la documentación y la codificación ha sido rápido y de gran impacto. Sin embargo, existen muchas otras aplicaciones de GenAI en la atención médica, las cuales se describen en el ritmo de desarrollo de aplicaciones presentado en nuestro informe ( Figura 1 ). En general, prevemos que estas aplicaciones tardarán más en madurar, debido a su complejidad o a la gravedad de los riesgos que presentan. En particular, cuanto más cercana esté una aplicación a la toma de decisiones clínicas directas, mayor será el escrutinio y la regulación que requerirá. Describimos algunas de estas aplicaciones y sus desarrollos actuales.
Medicina de precisión
Al analizar datos de múltiples fuentes y en diversos formatos, incluyendo datos de historias clínicas electrónicas, genómica y estudios de imagen, los LLM podrían estar en camino de ayudar en la selección de tratamientos. Sin embargo, una limitación importante de los LLM actuales en el tratamiento personalizado y el apoyo a la toma de decisiones es su incapacidad para generar evidencia complementaria útil para los profesionales clínicos.
20 Además, un estudio reciente demostró que la interacción humana con la IA se ve influenciada por múltiples factores relacionados con los humanos y con el sistema de IA. Por lo tanto, el uso eficaz de GenAI en la medicina de precisión requerirá mayor experiencia humana con la IA y confianza en ella, así como en las particularidades del entrenamiento de modelos de IA.
Tratamiento de enfermedades raras
Aproximadamente 7000 enfermedades raras afectan a 300 millones de personas en todo el mundo, y GenAI puede proporcionar información y conocimiento que facilitan el diagnóstico de estas enfermedades y amplían la comprensión de los mecanismos subyacentes a su patología. Un modelo de procesamiento del lenguaje natural basado en fenotipos, desarrollado recientemente, demostró ser más preciso en el diagnóstico de enfermedades raras que los médicos expertos.
22 Además, GenAI ha acelerado la investigación para el descubrimiento de fármacos para enfermedades raras.
Minería del genoma
Los LLM del Proyecto Genoma Humano, entrenados con miles de millones de variantes genómicas, están comenzando a predecir los efectos de nuevas variantes genómicas. Estos «modelos de lenguaje de ADN» pueden complementar los estudios tradicionales de asociación genómica y producir una caracterización más precisa de variantes de significado desconocido, lo que conduce al desarrollo de nuevas opciones terapéuticas para enfermedades como el cáncer. Los avances en este campo se aceleran gracias a la mayor transparencia de los modelos, así como a la creación de nuevos modelos fundamentales preentrenados para el estudio de nuevas interacciones biomoleculares. 24
Asistentes de salud virtuales
Con la validación adecuada, los asistentes virtuales de salud con tecnología LLM pueden realizar evaluaciones de síntomas, ofrecer recomendaciones de triaje y facilitar consultas remotas, ampliando así el acceso a la atención. Estos modelos también podrían adaptarse a nuevas evidencias y enfoques de tratamiento con mayor rapidez que los profesionales médicos.
25 Muchas empresas ofrecen actualmente servicios a pacientes con asistentes virtuales de salud con tecnología de IA que brindan apoyo continuo y personalizado mediante conversaciones adaptativas que promueven hábitos saludables. Sin embargo, existe poca evidencia sobre la calidad, precisión y seguridad de estas aplicaciones, y aún queda trabajo por hacer para garantizar el uso adecuado de las capacidades de GenAI en la prestación de servicios de salud.
Vigilancia de enfermedades
Los LLM también podrían contribuir al desarrollo de herramientas para la detección y gestión de brotes de enfermedades a nivel poblacional, lo que facilitaría la identificación temprana de amenazas para la salud pública e informaría sobre intervenciones oportunas. En el caso de epidemias de enfermedades infecciosas, la GenAI (y la IA predictiva) tiene un gran potencial para mejorar la vigilancia de enfermedades; sin embargo, se necesita más trabajo para avanzar en los modelos estadísticos existentes, centrándose en la aplicabilidad, la causalidad y una base teórica rigurosa para los resultados. 26
Educación médica
A medida que GenAI y los agentes de IA se integren al equipo de atención médica, se producirá un cambio en las funciones y competencias necesarias para los profesionales clínicos. Si bien la recuperación de conocimiento médico ha sido la métrica utilizada por las facultades de medicina y las residencias para evaluar la competencia de los médicos, la implementación de GenAI podría desplazar las necesidades de competencia hacia un rol más gerencial. La Asociación de Facultades de Medicina de Estados Unidos está replanteando la evaluación y la formación de los estudiantes en la era de GenAI. 27 Algunas estrategias nuevas incluyen la integración de la alfabetización de datos y el pensamiento crítico sobre los algoritmos de IA en los planes de estudio de los estudiantes, la definición del trabajo que debe realizar un ser humano, así como el realizado por la IA, y la evaluación del reconocimiento y la mitigación de los sesgos de la IA en la atención al paciente.
El camino a seguir
En nuestra Publicación Especial NAM, describimos diversas capacidades fundamentales necesarias para la implementación segura y eficaz de GenAI en la atención médica. Al revisar el progreso que GenAI ha logrado en la atención médica desde nuestro taller, hemos comprendido aún mejor la importancia de estas capacidades críticas y cómo su integración puede transformar la práctica médica. La evidencia preliminar sobre las aplicaciones de GenAI es prometedora, pero también señala problemas en la precisión de los resultados, la relevancia y la aceptabilidad del usuario, lo que subraya la necesidad de una investigación más profunda y exhaustiva. Es evidente que un diseño cuidadoso, una evaluación rigurosa, la monitorización continua y una regulación eficaz de GenAI son cruciales para mitigar riesgos y maximizar beneficios. Existe una creciente comprensión de que los enfoques regulatorios previos para la IA y otras tecnologías probablemente sean insuficientes para abordar la complejidad y las implicaciones éticas de la GenAI. Por ejemplo, la Administración de Alimentos y Medicamentos (FDA) publicó un marco del Ciclo de Vida Total del Producto para guiar la regulación de la GenAI, que exige la validación continua y la vigilancia posterior a la comercialización de las herramientas de GenAI, reconociendo así su naturaleza dinámica y en evolución. Tradicionalmente, la FDA no ha desempeñado esta función, y no está claro si tiene la autoridad ejecutiva para hacerlo, lo que levanta preguntas sobre la estructura regulatoria existente y la necesidad de una revisión profunda. Además, la administración actual ha mostrado interés en una regulación federal más flexible de la IA, incluida la GenAI, lo que podría facilitar la adopción de innovaciones emergentes en el campo de la salud. Por lo tanto, la mayor parte de la responsabilidad regulatoria de estas tecnologías podría trasladarse a los marcos de gobernanza de la IA a nivel estatal y local, con colaboraciones público-privadas que establezcan estándares voluntarios de la industria para la equidad y la transparencia, fomentando un entorno donde todos los actores tengan la oportunidad de contribuir. Los sistemas de salud podrían necesitar interactuar proactivamente con los proveedores de IA para garantizar la auditoría de sesgos y una representación diversa en los conjuntos de datos de entrenamiento, lo cual es esencial para evitar discriminaciones y sesgos que podrían perjudicar a ciertos grupos poblacionales. Es importante ser deliberado e integral en la aplicación de GenAI a la atención médica, ya que una implementación irresponsable podría tener consecuencias devastadoras. Toda innovación en salud requiere equilibrar los nuevos enfoques con las medidas de seguridad y la infraestructura adecuadas para garantizar la preservación de la calidad y la seguridad de la atención. GenAI no es la excepción y, de hecho, su correcta implementación podría ser un punto de inflexión en la evolución del cuidado de la salud. Esperamos que las ideas presentadas en nuestro informe contribuyan a lograr ese equilibrio fundamental y sirvan de guía en este emocionante pero complejo camino hacia el futuro de la atención médica.