INTRODUCCIÓN
Las aplicaciones de la ciencia de datos han demostrado tener un gran potencial en el área de la cardiología. Esto se debe al éxito que han demostrado las técnicas conocidas como machine learning, y en especial las redes neuronales profundas, para resolver diversas tareas de clasificación, cuantificación y detección de tejidos, alcanzando una precisión en muchos casos comparables con el error inter-observador en el área de la radiología. 1,2,3 Recientemente, en Journal of the American College of Cardiology (JACC) se ha publicado una revisión donde se enumeran los prometedores logros de la inteligencia artificial (IA) en cardiología, en especial en el campo de las imágenes cardiovasculares. 4 Sin embargo, dichas técnicas presentan un gran inconveniente respecto a su robustez y reproducibilidad, 5 haciendo muchas veces que su implementación en la práctica clínica no sea posible. Es por ello que surge la necesidad de comprender de forma objetiva las ventajas y debilidades a la hora de trasladar dichas técnicas al ámbito clínico. En este sentido, en el presente trabajo analizaremos la robustez que presentan las redes neuronales profundas para cuantificar la función cardíaca en términos de la medición volumétrica y la función sistólica, tanto para el ventrículo izquierdo (VI) como el derecho (VD) en imágenes de resonancia cardíaca (RMC).
La cuantificación manual o semiautomática de las principales estructuras cardíacas (aurículas, ventrículos y tejido miocárdico) utilizadas normalmente para diagnosticar y cuantificar diversas patologías, como infartos o hipertrofia, requieren de un trabajo intrínsecamente subjetivo, repetitivo y laborioso que debe ser realizado por un especialista. 6 El tiempo aproximado de dicho análisis se encuentra entre 3 y 10 minutos por estudio dependiendo de la experiencia del especialista. 7 Actualmente existen diferentes aplicaciones que permiten realizar una cuantificación semiautomática, 8,9,10 pero en la práctica clínica se observa que la detección de las cavidades y el tejido miocárdico es imperfecta. Esto implica, la mayoría de las veces, una intervención manual por parte de un especialista, algo que implica gran cantidad de tiempo. Es por ello, que el desarrollo de nuevas técnicas precisas, robustas y libres de subjetividad, sigue siendo un área activa de investigación. En este sentido, las técnicas de IA parecen ser las herramientas adecuadas para superar estas limitaciones y reducir los tiempos de la cuantificación a segundos.
En este trabajo se presenta una nueva aplicación de IA basada en redes neuronales profundas para cuantificar de forma automática la función cardíaca a partir de la estimación de los ventrículos (VI y VD) y el tejido miocárdico en imágenes de RMC. En primer lugar, se estudia su robustez frente a datos multicéntricos poniendo especial énfasis en los efectos y beneficios que se observan al ajustar la aplicación propuesta a las imágenes de RMC de un centro médico en particular; y en segundo lugar se busca determinar la diferencia de tiempos que requiere esta metodología con relación al método manual tradicional
MATERIAL y MÉTODOS
Se realizó un estudio retrospectivo observacional en 89 pacientes (51 ± 17 años, de los cuales el 67% son de sexo masculino) de un centro de salud de Bariloche (SSC) con diversas patologías (bloqueo de rama izquierda, infarto agudo de miocardio, miocardiopatía dilatada, miocardiopatía hipertrófica, miocardiopatía hipertensiva) y función cardíaca normal. Las imágenes se adquirieron en un periodo de 2 años con un equipo Philips Intera de 1.5 T. La delineación de las cavidades bajo estudio fue realizada por un especialista utilizando el software Segment con el cual además se estimó la fracción de eyección (FE), el volumen telediastólico (VTD) y telesistólico (VTS) de ambos ventrículos, y la masa del miocardio correspondiente al VI.
Para estudiar la robustez de la técnica propuesta se utilizó un conjunto de datos públicos provistos en el Automated Cardiac Diagnosis Challenge (ACDC) 11. Los mismos están compuestos por 100 pacientes con patologías similares a las descritas anteriormente. Las imágenes se adquirieron durante un período de 6 años utilizando dos equipos Siemens de 1.5 y 3T.
Método propuesto
La aplicación propuesta, CardIAc, se desarrolló como una extensión del software 3D Slicer. 12 Un ejemplo de la interfaz de usuario y la cuantificación obtenida para un paciente de SSC se puede observar en la Figura 1. La extensión fue desarrollada para ser utilizada en un ordenador común, disponible hoy en día en cualquier centro médico.
La cuantificación automática se realiza utilizando dos redes neuronales convolucionales (CNN) basada en una arquitectura U-Net. 13 La primer CNN se utiliza para identificar una región de interés (ROI) que contenga todo el corazón. Esta región se define en 90 mm × 90 mm (~128 × 128 pixeles). Una vez identificada la ROI alrededor del corazón, se utiliza una segunda red neuronal para estimar las distintas estructuras de interés. La segunda red neuronal incorpora información de la estructura anatómica del corazón siguiendo un enfoque variacional-autoencoder.14 De esta forma se logra reducir errores en la detección de estructuras anatómicamente no plausibles. Finalmente, se cuantifican el volumen y FE de ambos ventrículos junto con la masa del VI. Además, si el usuario ingresa la altura y peso del paciente, se normalizan los volúmenes y masa utilizando el índice de masa corporal.
Análisis estadístico
Todos los datos se recogieron como media ± desviación estándar, evaluándose las diferencias utilizando un test de Student o t-test. Se analizó además la correlación lineal entre el método propuesto y una cuantificación manual, y se calculó el coeficiente de correlación de Pearson. Para valorar el grado de concordancia y los errores sistemáticos se hizo un análisis de Bland y Altman.
Consideraciones éticas
El estudio se realizó cumplimiento con la ley Nacional de Protección de Datos Personales N° 25 326, resguardando la identidad de los pacientes y todos sus datos personales. Toda la información sensible fue debidamente anonimizada. El estudio fue conducido de acuerdo con las normas éticas nacionales y regionales, y su protocolo fue aprobado por el comité de ética de Río Negro.
RESULTADOS
Se realizaron tres conjuntos de experimentos para estudiar la precisión y robustez del método propuesto. El primer experimento, tiene como objetivo estudiar la precisión de las técnicas propuestas utilizando solamente los datos públicos ACDC, tanto para su entrenamiento como validación (Tabla 1).
Manual | IA | p | r | Bland-Altman | |
---|---|---|---|---|---|
VTD VI [mml] | 164,61 ± 73,90 | 162,22 ± 70,93 | 0.01 | 0,99 | -2,39 (-20,08 a 15,29) |
VTS VI [mml] | 99,06 ± 78,36 | 98,09 ± 75,74 | 0.314 | 0,99 | -0,97 (-19,07 a 17,76) |
VTD VD [mml] | 152,99 ± 54,88 | 151,07 ± 54,15 | 0.142 | 0,97 | -1,92 (-27,20 a 23,36) |
VTS VD [mml] | 85,88 ± 52,20 | 88,81± 55,52 | 0.091 | 0,95 | 2,92 (-30,50 a 36,35) |
FE VI [%] | 46,38 ± 19,82 | 45,79 ± 19,69 | 0.217 | 0,97 | -0,60 (-9,94 a 8,75) |
FE VD [%] | 46,73 ± 17,80 | 44,69 ± 17,89 | 0.018 | 0,89 | -2,04 (-18,60 a 14,52) |
Masa VI [g] | 129,96 ± 50,75 | 129,36 ± 49,96 | 0.441 | 0,99 | -0,60 (-15,85 a 14,64) |
IA: Inteligencia artificial
VI: ventrículo izquierdo. VD: ventrículo derecho. VTD: volumen telediastólico. VTS: volumen telesistólico. FE: fracción de eyección.
El segundo experimento se propone para analizar la precisión de la herramienta propuesta en datos de la práctica diaria, en este sentido, se utilizan únicamente los datos SSC provistos por el centro local (Tabla 2). En ambos casos se observa que la metodología propuesta logra una precisión comparable con el error interobservador reportado en la bibliografía para FE del VI (2,7 ± 6,6%) 15, siendo el mismo de 0,60 ± 4,77% y 0,89 ± 4,55% para ACDC y SSC respectivamente.
Manual | IA | p | r | Bland-Altman | |
---|---|---|---|---|---|
VTD VI [mml] | 166,97 ± 44,74 | 164,50 ± 41,87 | 0.05 | 0,98 | -1,65 (-15,56 a 12,26) |
VTS VI [mml] | 74,32 ± 44,48 | 74,54 ± 43,70 | 0.83 | 0,98 | -0,13 (-11,73 a 11,98) |
VTD VD [mml] | 149,80 ± 33,06 | 143,40 ± 35,03 | 0.002 | 0,92 | -6,41 (-43,17 a 19,61) |
VTS VD [mml] | 61,89 ± 20,55 | 64,71 ± 22,45 | 0.003 | 0,95 | 2,82 (-13,96 a 19,61) |
FE VI [%] | 58,02 ± 12,16 | 57,13 ± 15,31 | 0.07 | 0,96 | -0,89 (-9,82 a 8,04) |
FE VD [%] | 59 ± 8,61 | 54,38 ± 14,45 | <0.001 | 0,8 | -4,63 (-22,48 a 13,22) |
Masa VI [g] | 141,11 ± 36,72 | 142,84 ± 35,08 | 0.21 | 0,97 | -1,14 (-12,32 a 14,59) |
IA: Inteligencia artificial
VI: ventrículo izquierdo. VD: ventrículo derecho. VTD: volumen telediastólico. VTS: volumen telesistólico. EF: fracción de eyección.
El tercer experimento busca estudiar la precisión obtenida cuando solamente se utiliza una base de datos pública para entrenar los modelos propuestos (Tabla 3). Es importante notar, que la herramienta propuesta ha demostrado ser adecuada para cuantificar las variables bajo estudio (Tabla 1 y 2). Sin embargo, al estudiar la robustez de las técnicas propuestas en los datos del centro regionales se puede observar que la precisión disminuye sustancialmente respecto a los resultados obtenidos cuando la técnica propuesta fue entrenada con los datos regionales SSC. En particular, el error que se obtiene para estimar la FE VI aumenta a un valor de 6,27 ± 12,13% (más del doble), algo muy superior al error interobservador presentado anteriormente, e incluso no aceptables para la práctica clínica. El tiempo de procesamiento del método propuesto fue 5 segundos por paciente y 452,7 seg ± 191,9 para el operador manual, con una diferencia entre tiempos de 447,7 seg (IC95% 407,6-487,8, p <0,001).
Training ACDC | Training SSC | ||||
---|---|---|---|---|---|
Manual | IA | r | IA | r | |
VTD VI [mml] | 166,97 ± 44,74 | 150,46 ± 38,52 | 0,69 | 164,50 ± 41,87 | 0,98 |
VTS VI [mml] | 74,32 ± 44,48 | 73,35 ± 39,97 | 0,92 | 74,54 ± 43,70 | 0,98 |
VTD VD [mml] | 149,80 ± 33,06 | 129,95 ± 35,98 | 0,66 | 143,40 ± 35,03 | 0,92 |
VTS VD [mml] | 61,89 ± 20,55 | 69,35 ± 32,81 | 0,71 | 64,71 ± 22,45 | 0,95 |
FE VI [%] | 58,02 ± 12,16 | 51,75 ± 20,94 | 0,83 | 57,13 ± 15,31 | 0,96 |
FE VD [%] | 59 ± 8,61 | 46,76 ± 19,22 | 0,63 | 54,38 ± 14,45 | 0,8 |
Masa VI [g] | 141,11 ± 36,72 | 106,10 ± 30,17 | 0,60 | 142,84 ± 35,08 | 0,97 |
IA: Inteligencia artificial
VI: ventrículo izquierdo. VD: ventrículo derecho. VTD: volumen telediastólico. VTS: volumen telesistólico. EF: fracción de eyección.
DISCUSIÓN
En este estudio se demostró que las técnicas de IA, en especial las redes neuronales profundas, tienen un futuro prometedor en el área de la cardiología, en especial para clasificar diversas estructuras cardíacas en imágenes de RMC reduciendo notablemente los tiempos de cómputo (5 segundos por estudio vs 7-8 min.). Además, y es una de las principales contribuciones de este estudio, se mostró de forma objetiva la dependencia que tienen estas técnicas frente a los datos de entrenamiento, marcando una gran limitación sobre todo en el ámbito clínico. Las técnicas de aprendizaje automático supervisado, como son las propuestas en este trabajo, dependen fuertemente de la cantidad y generalidad de los datos utilizados para su entrenamiento. En este sentido, las diferencias observadas en la Tabla 3 se deben principalmente a los siguientes factores: (1) la calidad de las imágenes utilizadas en las competencia públicas, en particular en ACDC, en muchas ocasiones son muy superiores a los que aparecen en la práctica clínica; (2) es común descartar los estudios que presentan artefactos en las imágenes de RMC; y (3) es común descartar las zonas donde el miocardio no se encuentra completo, por ejemplo en la base, o directamente la zona del ápice. Es por estos factores que se observa una diferencia significativa cuando se utilizan los datos ACDC durante el entrenamiento para luego evaluar y cuantificar los datos SSC, que por ejemplo, no excluye ninguna parte del miocardio.
Limitaciones
La herramienta propuesta necesita un refinamiento para identificar correctamente los volúmenes del VD ya que dicha estructura es de mayor complejidad que la del VI. Más estudios multicéntricos son requeridos para aumentar y validar la precisión de la aplicación propuesta, en particular en centros donde se utilicen diferentes equipos y los pacientes presenten diferentes condiciones cardíacas.
CONCLUSIONES
De acuerdo a nuestro conocimiento este es el primer estudio en el país que presenta una nueva herramienta fácil de utilizar para cuantificar la función cardíaca mediante la utilización de técnicas de IA, que a su vez, puede ajustarse a las necesidades de diferentes centros nacionales para obtener en pocos segundos una cuantificación precisa en casos del mundo real.