La contribución más significativa de la IA a la medicina hasta la fecha reside en su capacidad para producir interpretaciones más precisas y completas de imágenes médicas, validadas mediante ensayos clínicos aleatorizados. A continuación, se presenta la oportunidad de abordar el deterioro progresivo de la relación médico-paciente a lo largo de varias décadas y la crisis global de agotamiento profesional entre los médicos. Al reducir el trabajo administrativo de datos y otorgar mayor autonomía a los pacientes, la IA tiene el potencial de humanizar la medicina y la atención sanitaria. Liberar a los médicos del constante uso de pantallas podría recuperar su presencia durante las consultas y fomentar la empatía y la confianza. Además, la capacidad de la IA para recopilar y contextualizar un conjunto completo de datos de pacientes puede abrir nuevas oportunidades para la prevención de enfermedades importantes relacionadas con la edad, prolongando significativamente la esperanza de vida saludable. Apesar de este enorme potencial, la implementación de la IA médica se enfrenta a importantes desafíos, como la mitigación de sesgos, la garantía de la privacidad y la seguridad de los datos, y el establecimiento de marcos regulatorios y de reembolso adecuados.

Los pioneros y líderes en el campo de la inteligencia artificial han destacado sistemáticamente los avances en medicina y atención sanitaria como su impacto más sustancial e inequívocamente positivo.
Como dijo Geoffrey Hinton: «Siempre pongo la medicina como ejemplo de todo lo bueno que puede hacer, porque casi todo lo que hará allí será bueno».¹
De manera similar, hablando sobre el fin de las enfermedades, Demis Hassabis dijo: «Creo que está a nuestro alcance. Quizás en la próxima década, no veo por qué no».²
Luego está Dario Amodei, quien cree que la IA curará la mayoría de los cánceres, prevendrá el Alzheimer y duplicará la esperanza de vida humana, y Sam Altman, quien predijo que «veremos enfermedades curadas a un ritmo sin precedentes gracias a la IA». 3
Y está Mustafa Suleyman, quien dijo: “Una de las aplicaciones que más me entusiasma es esta búsqueda de la superinteligencia médica. Creo que es bastante evidente que en los próximos dos años vamos a construir modelos que serán mejores que la gran mayoría de los médicos expertos en cualquier disciplina a la hora de diagnosticar”. 4
Si bien estas declaraciones son alentadoras, los detalles sobre cómo la IA puede y transformará la medicina aún no están claros. Este ensayo pretende abordar estas lagunas y ofrecer una perspectiva futurista sobre cómo la IA puede lograr mejoras profundas en la práctica médica y en los resultados de salud de los pacientes, al mejorar la precisión diagnóstica, humanizar la relación médico-paciente y prevenir enfermedades.
La comunidad médica tiende a minimizar sus errores. Sin embargo, un importante informe de investigadores de Johns Hopkins estima que casi ochocientos mil estadounidenses al año sufren discapacidad permanente o fallecen debido a errores médicos de diagnóstico significativos.⁵ Y esto sin contar los errores en el tratamiento, que representan otro grave problema. Con el uso común del término «medicina de precisión», no se reconoce que, si se comete el mismo error repetidamente, de una manera perversa, resulta muy preciso. Necesitamos urgentemente promover la precisión diagnóstica en medicina.
Hoy estamos logrando avances significativos, especialmente en lo que respecta a la interpretación de imágenes médicas. El mayor ensayo aleatorizado en IA médica comparó a radiólogos que utilizaban IA con radiólogos que no la utilizaban en una muestra de más de cien mil mujeres sometidas a mamografía.⁶ Los radiólogos que trabajaban con el apoyo de la IA detectaron aproximadamente un 30 % más de casos de cáncer de mama y un 25 % más de tumores invasivos que los radiólogos que no la utilizaban. De manera similar, en cuarenta ensayos aleatorizados en gastroenterología, la colonoscopia con apoyo de visión artificial (en comparación con la colonoscopia sin visión artificial) aumentó la detección general de adenomas y pólipos en más de un 20 % .⁷
Más allá de estos ensayos aleatorios, existe evidencia que respalda una mayor precisión en todo tipo de imágenes médicas, incluyendo rayos X, ultrasonido, tomografía por emisión de positrones (PET), tomografía computarizada (TC) y resonancia magnética (RM). El siguiente paso es automatizar completamente el proceso inicial de revisión de imágenes, con sistemas de IA capaces no solo de analizar características específicas, sino también de sintetizar información para producir informes completos que puedan ser revisados por médicos supervisores. Recientemente, los investigadores lograron precisamente eso en una de las áreas más complejas de la imagen médica: la ecocardiografía. El movimiento del corazón y la necesidad de adquirir e interpretar múltiples vistas, no solo de imágenes estáticas sino también de videos de ultrasonido, crean un entorno complejo y rico en datos para desarrollar un modelo de IA fundamental. Entrenado con más de doce millones de videos ecocardiográficos e informes de texto emparejados en veintitrés puntos de referencia de la estructura y función cardíacas, el modelo EchoPrime alcanzó un rendimiento de vanguardia en la interpretación de características y diagnósticos cardíacos. 8 Se está trabajando para hacer lo mismo con todas las exploraciones médicas, con el potencial de mejorar la precisión del diagnóstico y optimizar los flujos de trabajo.
Esto nos lleva al concepto de visión sobrehumana. La interpretación convencional de imágenes médicas —responder a una pregunta específica— podría quedar obsoleta. Por ejemplo: ¿Muestra una radiografía de tórax neumonía? Con la visión artificial, ahora podemos detectar información incrustada en las radiografías de tórax sobre la presencia de diabetes tipo 2, el riesgo de aterosclerosis en los próximos diez años, la puntuación de calcio en las arterias coronarias, la fracción de eyección y la osteoporosis. Lo mismo ocurre con las mamografías, que pueden detectar con precisión el riesgo de enfermedad cardíaca, o con las tomografías computarizadas de tórax , que detectan cáncer de páncreas. Esta interpretación “oportunista” de imágenes médicas refleja el poder de los ojos digitales para “ver” cosas que los médicos expertos no pueden.
La visión sobrehumana no se limita a las exploraciones radiológicas. Quizás el ejemplo más extraordinario sea la imagen de la retina, ya sea una fotografía o una tomografía de coherencia óptica (OCT). Diversos estudios, y más recientemente modelos fundamentales de IA, que utilizan conjuntos de datos vastos y diversos para una amplia gama de tareas, han demostrado lo extraordinariamente informativa que puede ser la retina. La interpretación de imágenes retinianas mediante IA puede informarnos sobre la presión arterial, el control de la glucosa y el riesgo de enfermedades cardíacas, renales, hepáticas y de la vesícula biliar de un paciente. Las imágenes son una ventana al riesgo futuro de padecer Alzheimer y Parkinson en personas asintomáticas. En la retina, la IA también puede detectar la probabilidad de aterosclerosis subclínica (sin síntomas, sin estrechamientos que limiten el flujo sanguíneo) de las arterias coronarias y daño cerebral silencioso, así como el riesgo de accidente cerebrovascular.
El electrocardiograma de 12 derivaciones mencionado anteriormente también permite obtener información mediante IA que antes no era posible solo con imágenes. Esta información incluye la determinación de la edad y el sexo del paciente; la presencia de anemia, diabetes o enfermedad renal; la fracción de eyección del ventrículo izquierdo; la presión de llenado del corazón; la predicción de fibrilación auricular; y el riesgo de accidente cerebrovascular. Asimismo, con IA, una muestra histológica de un tejido canceroso sospechoso puede determinar las mutaciones genómicas que impulsan el tumor, su grado de malignidad, el sitio de origen y el pronóstico del paciente. Las posibilidades de todo lo que se codifica en diferentes tipos de imágenes médicas parecen ilimitadas y, sin duda, no se habían previsto antes del advenimiento del aprendizaje profundo y la IA generativa. Aún se desconoce si toda esta información pasará de las publicaciones científicas a la práctica médica, y cuándo lo hará, y requerirá una mayor validación, pero es justo decir que no dejaremos pasar tantos datos gracias al poder de la visión sobrehumana de la IA.
La IA está logrando grandes avances hacia imágenes diagnósticas más precisas y completas, pero sus contribuciones para promover la precisión van mucho más allá. Los modelos de lenguaje grandes especialmente adaptados han demostrado la capacidad de sintetizar de forma concisa y precisa todos los datos de un paciente, que pueden ser bastante extensos y provenir de múltiples fuentes. 11 El rendimiento mejorado de la IA se extiende a una mejor comunicación con el paciente y planes de manejo. En un estudio que involucró 150 escenarios de casos y actores de pacientes, la IA demostró un rendimiento superior al de los médicos especialistas en treinta de treinta y dos tareas. 12 Si bien ese estudio no es representativo del mundo real de la práctica médica, desde entonces se ha realizado un ensayo aleatorio en centros médicos reales de cuatro continentes que confirma las ventajas de usar la IA para la atención oftalmológica con respecto al diagnóstico de siete enfermedades oculares importantes y el manejo del paciente. 13 Los beneficios clínicos de la IA tampoco se limitan a los países de altos ingresos: un ensayo aleatorio de atención primaria en quince clínicas en Nairobi que involucró casi cuarenta mil visitas de pacientes mostró que el uso por parte de los médicos de una herramienta de consulta de IA redujo los errores de diagnóstico y tratamiento. Se han obtenido resultados similares en muchas otras tareas médicas, como el diagnóstico de tuberculosis, cáncer infantil, retinopatía diabética y cardiopatía reumática en países de ingresos bajos y medios. 14
Durante varias décadas, se ha producido una erosión constante de la relación médico-paciente, en parte debido al tiempo muy limitado asignado a las consultas clínicas y las rondas hospitalarias. El negocio de la medicina y la presión por la productividad clínica han dejado a los médicos con la sensación de que no pueden brindar una atención adecuada a los pacientes, la razón principal por la que eligieron esta profesión. Un encuentro típico entre médico y paciente hoy en día dura solo unos minutos, con poco o ningún contacto visual; los requisitos legales y éticos de las notas de evolución empujan a los médicos de la cabecera del paciente al teclado mientras cumplen con sus responsabilidades administrativas. Los pacientes perciben la falta de presencia del médico, lo que a su vez genera una falta de confianza, atención y preocupación. Lo que fue un vínculo humano íntimo hace décadas se ha convertido en un encuentro distante, desprovisto de compasión, a menudo con un examen físico y una imposición de manos muy limitados. En mi libro de 2019, Medicina Profunda, escribí que existía el potencial de la IA para fomentar la humanidad en la medicina. 15 Muchos encuentran esta idea contraintuitiva: ¿Cómo podría la tecnología hacer que la medicina sea más humana de nuevo?
La liberación del teclado podría mejorar notablemente las visitas de los médicos con los pacientes. Con el uso de asistentes de IA que sintetizan notas con muchas funciones posteriores, los médicos pueden redirigir su atención al paciente, recuperando la comunicación cara a cara. Al mismo tiempo, las conversaciones ambientales pueden producir excelentes notas con enlaces de audio para que el paciente las consulte después de la cita. Además, el asistente de IA puede programar análisis de laboratorio, citas de seguimiento y escáneres; realizar preautorizaciones con las compañías de seguros y enviar recetas; realizar codificación y facturación; e incluso recordar a los pacientes después de la visita si están dando seguimiento a las acciones planificadas, como medirse la presión arterial o salir a caminar. De esta manera, el uso administrativo de la IA es humanista. La automatización es un paso importante para aliviar a los médicos de su carga administrativa de datos y permitirles concentrarse más plenamente en sus pacientes. Ya se ha demostrado que estos sistemas ahorran tiempo a los médicos y reducen el agotamiento, una crisis global entre los trabajadores de la salud. 16 La adopción de esta tecnología ha sido notablemente rápida; En poco tiempo, la toma de notas automatizada y el soporte de IA para tareas administrativas que consumen mucho tiempo serán la norma.
Y los pacientes están ganando poder. Incluso antes de la IA generativa, los diagnósticos algorítmicos estaban cambiando la forma en que los pacientes controlan su salud, permitiéndoles medir ritmos cardíacos anormales con un reloj inteligente, detectar retinopatía diabética en supermercados, detectar infecciones del tracto urinario con un kit de venta libre y clasificar erupciones o lesiones cutáneas con una aplicación.<sup> 17</sup> Ahora, los pacientes utilizan chatbots de IA para realizar diagnósticos (algunos de los cuales habían pasado desapercibidos para los médicos y las pruebas diagnósticas), obtener primeras y segundas opiniones, ingresar sus datos de laboratorio, obtener consejos para un tratamiento óptimo o prepararse para una visita al médico.<sup> 18</sup> Esta tendencia se reflejó en un reciente artículo del New York Times titulado «Empático, disponible, económico: cuando la IA ofrece lo que los médicos no». <sup> 19</sup>
No había considerado que la empatía pudiera ser facilitada por máquinas. Pero en una revisión sistemática de quince estudios que comparaban la percepción de empatía por parte de los pacientes, todos menos dos mostraron que los pacientes reportaron mayores niveles de empatía en sus conversaciones de texto con chatbots basados en IA que en sus comunicaciones de texto con médicos. 20 Si bien la IA no es empática, su capacidad para fomentar un sentido de empatía a través del lenguaje apropiado es significativa, ya que la percepción de empatía promueve mejores resultados para el paciente. En el futuro, esta capacidad probablemente llevará a que la IA capacite a los médicos para ser mejores comunicadores, más empáticos. Yendo más allá, pensemos en cómo la revisión por IA de la nota automatizada del médico podría conducir a preguntas productivas: «¿Por qué interrumpió a la Sra. Jones después de nueve segundos? ¿Por qué no le dio la oportunidad de expresar sus verdaderas preocupaciones?». Si bien esto ciertamente no se concibió como un rol para la IA y muchos médicos se irritarán ante la idea, no sería sorprendente que dicha capacitación se convierta en parte de un requisito anual para la licencia para el ejercicio de la medicina. Para que los médicos puedan aprovechar los beneficios de la mayor precisión de la IA, reconocer sus inconvenientes y fomentar la confianza con los pacientes, será necesario un entrenamiento específico en el uso de estos nuevos sistemas.
Mejorar la relación médico-paciente requiere tiempo; es el punto de partida para una conversación más profunda y un examen físico minucioso. Sin embargo, la IA también ofrece la posibilidad de que los administradores de atención médica utilicen la tecnología para aumentar la productividad y la rentabilidad: en lugar de dedicar más tiempo a interacciones significativas entre médico y paciente, estas herramientas podrían simplemente permitir que los médicos atiendan a más pacientes en menos tiempo. Este enfoque sería destructivo y anularía la oportunidad de que la IA ayude a restaurar la humanidad esencial en la atención médica. Para contrarrestar este riesgo, he hecho un llamado a la solidaridad entre los médicos para que se opongan a los administradores. 21 Los médicos deberían usar su poder de negociación para aumentar el tiempo asignado a las consultas ambulatorias presenciales, reservando este valioso encuentro para asuntos importantes y aprovechando los servicios alternativos para pacientes, incluidos los chatbots de IA, la telemedicina y los asesores virtuales, cuando sea apropiado. 22
El cáncer, las enfermedades cardiovasculares y los trastornos neurodegenerativos son las tres principales enfermedades relacionadas con la edad. En conjunto, y con una aparición generalmente después de los sesenta años, son las principales causas de la disminución de la esperanza de vida saludable. Además de su creciente incidencia con la edad, comparten dos características importantes: 1) un largo período de incubación de aproximadamente dos décadas antes de que se manifiesten los síntomas y 2) una desregulación del sistema inmunitario y una pérdida de protección, con la consiguiente inflamación. Los términos «inmunosenescencia» e «inflamación asociada al envejecimiento» se utilizan para describir esta última.
La prevención primaria es un enfoque de tratamiento que consiste en tomar medidas preventivas para anticipar y abordar el riesgo de una persona y detener una enfermedad antes de que se presente. Aunque se habla con frecuencia de ella, la prevención primaria de las tres principales enfermedades relacionadas con la edad es poco común en la práctica médica. El cribado masivo de cáncer se realiza con mamografía, colonoscopia y antígeno prostático específico, pero estas pruebas, en el mejor de los casos, se utilizan para la detección, no para la prevención del cáncer. Una vez que se detecta el cáncer mediante una exploración, ya existen miles de millones de células cancerosas y una mayor probabilidad de que se haya diseminado por el cuerpo. Sin embargo, ahora existen métodos, a través de la genómica, para saber quién tiene riesgo de padecer cáncer, incluyendo puntuaciones de riesgo poligénico y secuenciación del genoma completo. Además, nuestro sistema inmunitario intacto es esencial para prevenir la aparición del cáncer y solo recientemente hemos encontrado maneras de determinar la salud y la funcionalidad de nuestra respuesta inmunitaria. Hasta ahora, sorprendentemente, no existía ninguna prueba clínica para evaluar la salud de nuestro sistema inmunitario. Pero el reciente avance de los relojes orgánicos —un panel de proteínas sanguíneas que registra el ritmo de envejecimiento de cada órgano del cuerpo y de nuestro sistema inmunitario— ofrece una vía prometedora. 23
Si bien en las últimas dos décadas se ha producido una marcada reducción de los infartos, aún se registran más de ochocientos mil al año en Estados Unidos que no se previenen. Recientemente, la atención se ha centrado en identificar a los pacientes vulnerables con placa aterosclerótica inflamada, mucho antes de que ocurra un evento potencialmente catastrófico. 24
Para la enfermedad de Alzheimer, la innovadora prueba de sangre conocida como p-tau217 ahora puede detectar el riesgo de esta afección muchos años antes de que aparezcan los primeros síntomas de deterioro cognitivo leve.<sup> 25 </sup> El riesgo de Alzheimer también aumenta en personas con antecedentes familiares, una o dos copias del alelo APOE4 y una puntuación de riesgo poligénico alta. Los biomarcadores cerebrales como el p-tau217, al igual que el colesterol LDL para las enfermedades cardíacas, cumplen una doble función: definir el riesgo y medir los cambios derivados de las modificaciones del estilo de vida y los medicamentos.
Con un amplio margen de tiempo para identificar a individuos de alto riesgo para cada una de estas enfermedades relacionadas con la edad, la oportunidad de lograr la prevención primaria nunca ha sido tan realista y alcanzable. Pero requiere tener el «conjunto completo» de datos de los pacientes, incluidos los registros médicos electrónicos, factores de estilo de vida, laboratorios, imágenes, escaneo de retina, genómica, proteínas (relojes orgánicos), biomarcadores sanguíneos relevantes, exposiciones ambientales y datos de sensores portátiles. Hemos aprendido que, si bien los médicos y los pacientes suelen descartar las pruebas de laboratorio dentro del rango normal como poco importantes, la IA puede detectar tendencias significativas y contextualizar estos resultados con los registros médicos. 26 La IA también puede extraer datos importantes de las propias notas, tanto componentes estructurados como no estructurados, como para detectar un alto riesgo de cáncer de páncreas muchos años antes de que se pudiera realizar este diagnóstico difícil y mortal. 27 He revisado las capacidades oportunistas de los escaneos médicos y las imágenes de retina para predecir el riesgo de enfermedades cardiovasculares y neurodegenerativas. Además, los modelos de IA ahora pueden diferenciar entre mamografías “normales”, reclasificando algunas como indicativas de un alto riesgo de cáncer de mama en los próximos cinco años. 28
En conjunto, estas capas de datos configuran una IA multimodal para determinar el riesgo individual de padecer una o más de las principales enfermedades relacionadas con la edad y para evaluar si dicho riesgo se ha reducido mediante intervenciones. Estas intervenciones incluyen no solo factores de un estilo de vida saludable, como una dieta antiinflamatoria, ejercicio regular y un buen descanso, sino también tratamientos farmacológicos. El campo del descubrimiento de fármacos mediante IA ha captado gran atención, con decenas de empresas activas en este sector, algunas asociadas con las principales farmacéuticas. Solemos pensar en los fármacos únicamente como tratamientos para los síntomas y la enfermedad, pero en los próximos años se observará un cambio hacia la medicación preventiva. Quizás la acción pluripotente de la familia de fármacos del péptido similar al glucagón (GLP-1), cuyos beneficios se han extendido desde el tratamiento de la diabetes y la obesidad hasta la prevención de trastornos cardíacos, renales, hepáticos y adicciones (en cierta medida independientemente de la pérdida de peso), se considere el punto de inflexión para los fármacos preventivos. Si bien la optimización del estilo de vida siempre se considerará fundamental y de bajo coste, es evidente que se necesitarán más medidas para lograr la prevención de las tres principales enfermedades relacionadas con la edad.
A las nuevas capacidades para predecir enfermedades se suma la publicación del primer modelo de salud a gran escala, conocido como Delphi-2M. 29 Investigadores construyeron y validaron Delphi-2M a partir de registros médicos electrónicos y datos de estilo de vida de cuatrocientos mil participantes del Biobanco del Reino Unido y casi dos millones de personas en Dinamarca. Al tokenizar los datos históricos de cada individuo, el modelo, basado en GPT-2, un precursor de la IA generativa temprana con parámetros relativamente bajos, fue capaz de predecir enfermedades en los próximos veinte años (tanto la enfermedad o el evento de salud como el momento en que ocurrirían ) con un nivel de precisión sorprendente. El rendimiento de la predicción aumentó cuando se introdujeron las puntuaciones de riesgo poligénico como una capa adicional de datos. En el futuro, se validarán modelos de salud a gran escala más avanzados con el conjunto completo de datos descrito anteriormente, lo que llevará la capacidad predictiva a niveles de precisión aún mayores.
También existe un potencial considerable para que un recurso de gemelos digitales prediga enfermedades. 30 Anteriormente, el científico informático e inversor Kai-Fu Lee y yo imaginamos un recurso de datos global con miles de millones de individuos y sus conjuntos completos de datos médicos y de salud, junto con todos los datos recopilados durante un período de seguimiento prolongado. Con un conjunto de datos de este tipo, cuya privacidad y seguridad deben protegerse mediante aprendizaje federado y cifrado, tendríamos la capacidad de utilizar el análisis del vecino más cercano para encontrar gemelos digitales para cualquier individuo. Este análisis de datos complementaría la IA multimodal de los individuos y los grandes modelos de salud como otro medio para pronosticar eventos de salud y riesgo de enfermedad con el mayor nivel de precisión, lo que permitiría la prevención primaria. Aún no existe tal recurso, pero el potencial para promover la longevidad saludable humana es demasiado grande como para ignorarlo, y probablemente sea inevitable. El enorme beneficio económico de reducir la carga de estas enfermedades relacionadas con la edad, junto con el marcado envejecimiento de la población estadounidense, hace que la inversión en estas herramientas y recursos de IA y el ideal de la prevención primaria sean excepcionalmente atractivos.
Si bien la IA tiene un enorme potencial para promover la precisión médica, el humanismo y la prevención en el futuro, no faltan desafíos. En este momento, los grandes modelos de lenguaje no están preparados para un uso médico generalizado, con deficiencias notables determinadas por pruebas de estrés y parámetros médicos representativos. 31 He mencionado la importancia de la privacidad y la seguridad de los datos, algo con lo que no tenemos un buen historial hasta la fecha. Pero un cambio hacia que las personas sean propietarias de sus propios datos médicos en una plataforma segura, que también podría incorporar datos de sensores y genómica que actualmente no forman parte de nuestros registros médicos electrónicos, podría conducir a una mejora. En cuanto a los sesgos culturales intrínsecos de estos y otros insumos, debemos analizarlos a fondo para evitar su propagación. He argumentado que la IA puede reducir las inequidades en salud, pero lo cierto es que, sin iniciativas deliberadas que prioricen la equidad, es probable que los sistemas de IA las exacerben. Por supuesto, los errores médicos inducidos por la IA también son una preocupación, especialmente cuando existe una conexión directa entre los sistemas de IA generativa y los pacientes con una supervisión clínica insuficiente. Debemos liderar un esfuerzo dedicado a analizar y perfeccionar cualquier modelo orientado al paciente antes de hacerlo público. Hasta la fecha, no contamos con datos objetivos sobre el impacto del acceso directo del paciente en términos de beneficios y perjuicios; esto debe recopilarse y monitorearse de forma continua. También existen riesgos y problemas significativos con un enfoque de supervisión regulatoria permisiva que se ha basado principalmente en autorizaciones poco exigentes en lugar de aprobaciones formales para las aplicaciones de algoritmos de IA. Los estándares de reembolso para la IA en los mercados de atención médica no se han adaptado al progreso alcanzado: los incentivos de las partes interesadas siguen desalineados, lo que contribuye al estancamiento y al retraso en la adopción de tecnologías útiles. Debemos actuar y desarrollar las recomendaciones que tenemos sobre la mejor manera de proceder. 32 Y lo más importante de todo, necesitamos establecer confianza en la comunidad médica y el público, lo cual surge de la transparencia y de una investigación médica convincente para identificar beneficios y perjuicios. Gran parte de la investigación actual sobre IA médica permanece compartimentada, sin que se implemente en la práctica médica. Es necesario cerrar esa enorme brecha entre la investigación y la práctica.
El impacto futuro de la IA médica será transformador, especialmente si aborda y, finalmente, supera los numerosos obstáculos y desafíos que se avecinan. Creo que la prevención de enfermedades relacionadas con la edad, y por ende, la prolongación significativa de la esperanza de vida saludable, será la contribución más importante de la IA en la medicina en las próximas décadas.
A medida que la inteligencia artificial se vuelve multimodal, las aplicaciones médicas se multiplican.
Las máquinas no tienen ojos, pero no lo sabrías si siguieras la evolución de los modelos de aprendizaje profundo para la interpretación precisa de imágenes médicas , como radiografías, tomografías computarizadas (TC) y resonancias magnéticas (RM), preparaciones histológicas y fotografías de retina. En los últimos años, se ha publicado una gran cantidad de estudios que han demostrado de forma consistente el gran potencial de los «ojos artificiales», no solo en comparación con los expertos médicos, sino también para detectar características en imágenes médicas que no son fácilmente discernibles para los humanos. Por ejemplo, una exploración de retina contiene información valiosa que las personas no pueden ver, pero las máquinas sí, lo que permite comprender múltiples aspectos de la fisiología humana, como la presión arterial, el control de la glucosa , el riesgo de padecer Parkinson, Alzheimer , enfermedades renales y hepatobiliares , y la probabilidad de sufrir ataques cardíacos y accidentes cerebrovasculares . Como cardiólogo, jamás habría imaginado que la interpretación automática de un electrocardiograma proporcionaría información sobre la edad, el sexo , la anemia , el riesgo de desarrollar diabetes o arritmias , la función cardíaca y las valvulopatías , así como afecciones renales o tiroideas . Del mismo modo, la aplicación del aprendizaje profundo a una muestra histológica de tejido tumoral también puede ofrecer información sobre el lugar de origen, las mutaciones impulsoras, las variantes genómicas estructurales y el pronóstico. Si bien estas capacidades de visión artificial para la interpretación de imágenes médicas pueden parecer impresionantes, anticipan un terreno potencialmente mucho más amplio para la inteligencia artificial (IA) en la transformación de la medicina. El gran cambio que se avecina reside en la capacidad de trascender las tareas unimodales y limitadas a las imágenes, y ampliar las capacidades de las máquinas para incluir texto y voz, abarcando todos los modos de entrada y sentando las bases para una IA multimodal.
Aunque la mayor parte del progreso en la interpretación de imágenes se atribuye al aprendizaje supervisado, que requiere entradas completamente anotadas y datos de referencia, un requisito fundamental para avanzar hacia la IA multimodal fue el uso de formas de aprendizaje auto-supervisado y no supervisado . Esto evitó la laboriosa necesidad de anotación de datos que no sería posible con la enorme escala de entradas, como se observa en los grandes modelos de lenguaje (LLM, también conocidos como IA generativa). Pero no se trataba solo de la diferencia en los tipos de aprendizaje o las entradas masivas lo que se necesitaba para lograr LLM como ChatGPT. Esto requirió una nueva arquitectura de modelo conocida como transformadores, introducida por
Vaswani y sus colegas en 2017 , para ir más allá de las redes neuronales recurrentes que dependen de la retroalimentación de un paso de tiempo al siguiente (como cada palabra en una oración), para abarcar todos los datos (por ejemplo, todas las palabras en la oración). El progreso de estos LLM finalmente condujo a GPT-4, que es multimodal y, por lo tanto, capaz de trabajar con todas las formas de datos, incluidos texto, audio, voz e imágenes. Esto no fue una hazaña menor.
Para GPT-4 , se requirieron más de un billón de parámetros del modelo (el número de conexiones entre neuronas), más de 24 000 unidades de procesamiento gráfico, más de 10²⁴ operaciones de coma flotante por segundo de rendimiento informático, 45 gigabytes de datos de entrenamiento y aprendizaje autosupervisado. Cabe destacar que los datos de entrada para GPT-4 y otros modelos base importantes actuales, como Bard, LLaMa y PALM-2, se obtuvieron de Wikipedia, Internet y decenas de miles de libros . No se utilizaron datos médicos específicos para el entrenamiento; esto requiere un ajuste fino supervisado , que se está investigando intensamente para muchos de los casos de uso que describo a continuación.Ahora que los modelos de aprendizaje automático (MLA) son multimodales y ya no se limitan a la entrada y salida de texto, su nombre debería considerarse inapropiado, al igual que el de «IA generativa», ya que estos modelos realizan y destacan en muchas otras funciones además de la generación, como la edición de texto. La dificultad para nombrar con precisión estos modelos refleja su amplia funcionalidad, un concepto que se acentúa aún más al considerar sus casos de uso en medicina. Y cualquier modelo que estemos evaluando hoy representa un trabajo en progreso, con mejoras sustanciales por venir, como la capacidad de proporcionar conocimiento médico actualizado en tiempo real y una mejora en la precisión y la calidad del rendimiento.
Los modelos Transformer poseen la capacidad, recientemente descubierta, de realizar IA multimodal en medicina, analizando en tiempo real las múltiples capas de macrodatos de una persona y nuestra base de conocimientos. Gran parte de los datos de alta dimensión que subyacen a la singularidad de cada ser humano ahora pueden capturarse . Estas capas incluyen la anatomía mediante imágenes, biomarcadores fisiológicos mediante sensores, el genoma, el microbioma, el metaboloma, el inmunoma, el transcriptoma a nivel celular, el proteoma y el epigenoma. Los datos de los registros electrónicos de salud, que incorporan resultados de laboratorio, antecedentes familiares, texto no estructurado y seguimiento longitudinal de un individuo, también constituyen una rica fuente de datos. El exposoma de la persona, como el índice de contaminación del aire y otros datos disponibles a través de sensores ambientales, junto con los determinantes sociales, añade otras dimensiones que pueden ser informativas sobre el estado de salud de un individuo. Complementando todos estos modos de datos se encuentra el corpus de conocimiento médico, que formará parte cada vez más de los modelos de aprendizaje automático (LLM) utilizados en el futuro de la atención médica.Esta IA multimodal tiene el potencial de una amplia gama de aplicaciones basadas en datos. Para las personas con riesgo de desarrollar enfermedades crónicas, un asistente virtual de salud podría proporcionar retroalimentación frecuente sobre sus datos para lograr la prevención o un mejor manejo de las afecciones preexistentes. Tomemos el ejemplo de una persona con hipertensión y diabetes, y con un alto riesgo poligénico de desarrollar enfermedades cardíacas. El asistente virtual no solo ayudaría a controlar la presión arterial y la glucosa, para disminuir el impacto de estos factores de riesgo modificables, sino que también analizaría y asesoraría a la persona en función de su actividad física, sueño, estrés, fotografías de retina, texto no estructurado de sus registros médicos y la literatura médica más reciente. Ya existen asistentes virtuales de salud con chatbot de IA para afecciones específicas como diabetes , hipertensión , obesidad y depresión , pero ninguno ha alcanzado aún un enfoque holístico o preventivo.Los datos multimodales de un individuo también pueden hacer realidad la monitorización remota, permitiendo un “hospital en casa” con captura continua de signos vitales equivalente a una unidad de cuidados intensivos. Con algoritmos validados para prever con precisión los signos de deterioro de una persona mucho antes de que aparezcan los síntomas y la necesidad de intervenir, ya sea de forma remota o mediante el envío de personal médico, muchos pacientes podrían evitar ser hospitalizados en el futuro. Existen otros casos de uso de la IA multimodal, como un gemelo digital que proporcionaría información a una persona con un nuevo diagnóstico al ofrecer una réplica digital en la que basar la búsqueda de un tratamiento eficaz. Otra aplicación es
la vigilancia de pandemias para una evaluación de riesgos espaciotemporal individualizada y en tiempo real con geolocalización, sensores portátiles, síntomas, estado de vacunación, resultados de aguas residuales y otras capas de datos.Si bien gran parte de la atención en las primeras aplicaciones de la IA multimodal en el sector sanitario se ha centrado, por ejemplo, en su capacidad para aprobar el examen de licencia médica estadounidense, responder a las preguntas médicas de los pacientes o reducir la carga administrativa de los clínicos mediante el procesamiento del lenguaje natural en las conversaciones con los pacientes, la IA multimodal supone un reto analítico más profundo. Hasta ahora se han integrado algunas capas de datos, como los historiales clínicos electrónicos y la genómica, pero nada se acerca a la complejidad, profundidad y amplitud de lo que puede ser relevante y analizado. Esto representa un desafío considerable y constante para materializar el extraordinario potencial de la IA multimodal en medicina.Existen muchas otras barreras además de la analítica. Los modelos de aprendizaje automático (MLA) suelen mostrarse demasiado confiados en sus respuestas, lo que considero una característica de «a menudo equivocados, nunca con dudas». Además de la propensión de los MLA a inventar, existen sesgos inherentes, preocupaciones sobre la privacidad y la seguridad de los datos, el posible deterioro del rendimiento del modelo con el tiempo, dudas sobre qué constituirá fundamento para la aprobación regulatoria, la resistencia de la práctica médica al cambio, la necesidad de evidencia prospectiva convincente para demostrar el beneficio, y más.Sin embargo, la convergencia de una capacidad de computación masiva sin precedentes y el aprendizaje auto-supervisado de una enorme cantidad de datos generados por humanos ha sentado las bases para aplicaciones médicas que antes eran inalcanzables. En los próximos años, la pluripotencia de los modelos de aprendizaje automático para la medicina podría dar lugar a asistentes virtuales de salud y hospitales domiciliarios que proporcionen enfoques de atención médica altamente precisos e individualizados.