infmed98.gif (3061 bytes)

VII CONGRESO NACIONAL DE INFORMÁTICA MÉDICA

Pamplona, 24 y 25 de Septiembre de 1998

[Objetivo] [Comité de Honor] [Comité Científico] [Comité Organizador] [Fechas] [Entidades Colaboradoras] [Areas Temáticas] [Asistentes] [Agenda] [Inauguración] [Mesas Redondas] [Comunicaciones Libres] [Clausura] [Cuotas de Inscripción]


COMUNICACIONES


Bases de datos y Aplicaciones Horizontales

Utilidad de las redes neuronales comparadas con regresión logística para el diagnóstico de las lesiones de la calota

E. Arana1, M. Chavarría2, L. Martí-Bonmatí3, R Paredes4, D. Bautista5.

Sº. Radiodiagnóstico.1Hospital Casa de Salud y 2Hospital La Fe, 3Hospital Dr. Peset. 4 Instituto Técnico de Informática. Universidad Politécnica de Valencia y 5 Sº. Med. Preventiva. Hospital Malvarrosa. Valencia

[Diapositivas] diapo.gif (481 bytes)

Introducción

La incidencia exacta de lesiones de la calota en exploraciones de imagen es desconocida. Debido a la escasa familiaridad con estas lesiones y sus síntomas generalmente inespecíficos, su diagnóstico exacto es frecuentemente difícil cuando se observan en estudios de tomografía computerizada TC (1). Este estudio compara un red neuronal artificial (RN) con un modelo de regresión logística (RL) para predecir la malignidad e histología de lesiones de la calota. Varios métodos han sido empleados para desarrollar ayudas diagnósticas para las lesiones óseas (2-4) pero sólo recientemente las RN han sido aplicadas para esta tarea (5,6).El valor principal de nuestro estudio es validar la utilidad potencial de las RN sobre la regresión logística como ayuda diagnóstica, así como identificar el conjunto mínimo de variables que proporcionaría un rendimiento diagnóstico adecuado.

Métodos

Pacientes

Todas las lesiones estaban comprobadas resultando en 167 pacientes con lesiones focales de la bóveda craneal entraron en este estudio prospectivo de cuatro años de duración. A todos los pacientes se les realizó radiografías simples y tomografía computarizada. Las lesiones fueron divididas en benignas y malignas y a su vez en grupos histológicos. Las imágenes fueron revisadas individualmente por dos de los autores. Se evaluaron diecinueve características estructurales de la imagen así como datos anatómicos y de la historia clínica sin conocimiento del diagnóstico final.

Muestra de estudio

La muestra objeto de estudio comprende 167 pacientes, 74 hombres (44,6%) y 93 mujeres (55,4%), con una media de edad de 34,11 ± 25,52 años (media ± DE), rango : 6 meses a 81 años. El número total de lesiones benignas fue de 122 (73,1%), con un rango desde 5 a 80 años (26,1 ± 22,9); y 45 malignas (27.0%) con un rango de edad desde 6 meses a 84 años (55,7 ± 18,6). Las lesiones más comunes se describen en la Tabla 1.

Regresión logística

La regresión logística se realizó con el programa estadístico informático SPSS (SPSS Inc.). Para la RL una ecuación para malignidad/benignidad se ajustó así como siete para los diagnósticos más frecuentes. Para cada una de estas variables dependientes la RL fue construida en el modo backward con todas las variables significativas (p<0.05) así como los odds ratio con un intervalo de confianza del 95% (IC).

Red neuronal

La RN utilizada tenía tres capas, con una arquitectura hacia delante, entrenada mediante el algoritmo de retropropagación con función de activación sigmoide (8). La estructura de la RN incluyó 63 unidades de entrada, que correspondían a las diferentes categorías de datos clínicos y de imagen. Estas mismas 63 categorías estaban en las 19 variables independientes usadas en las ecuaciones de RL. Dado que no existe un método teórico para la construcción de redes neuronales, se realizaron varios diseños cambiando el número de iteraciones y neuronas ocultas comparando los rendimientos de cada una mediante curvas ROC (receiver operating characteristics). La salida de la RN reflejó la probabilidad de cada uno de los siete diagnósticos más frecuentes, obtuviéndose una red para benigno/maligno con 5 neuronas ocultas y 150 iteraciones y para los diagnósticos otra con 22 neuronas ocultas y 300 iteraciones. En el diseño de las redes neuronales se asume que al menos un tercio de la base de datos debe ser usada para prueba, lo que apenas se consigue con pequeñas muestras de enfermedades infrecuentes (8).

Generalización de los modelos

La mejor prueba diagnóstica debe funcionar correctamente en la población general, es lo que se conoce por generalización y tales modelos evaluados con pacientes no usados previamente para la construcción de los mismos. Para la generalización de los mismos se empleó las técnicas de leave-one-out tanto para la RL como para la RN (9). De acuerdo a este método todos los pacientes menos uno se usan para desarrollar la ecuación o la RN y entonces el modelo resultante se prueba en ese paciente restante, obteniendo su probabilidad en los respectivos modelos. El proceso se repite reiterativamente para que cada paciente es usado para construir y probar el modelo, pero nunca simultáneamente.

Simplificación de las variables de entrada

Uno de los propósitos del estudio es identificar el conjunto mínimo de variables diagnósticas que proporcionaría un diagnóstico preciso, tanto para malignidad como para el análisis histológico. Debido al gran número de combinaciones posibles, no era posible investigar todas ellas disminuyendo el número de inputs de entrada y desarrollando un análisis leave-one-out cada vez. En vez de eso, las variables de entrada fueron ordenadas de acuerdo a la importancia y eliminadas una por una hasta que la funcionalidad de la red neuronal estaba significativamente degradada. Para conocer el orden de las variables según su importancia, una variables fue eliminada y la RN resultante entrenada usando todas las variables restantes con el método leave-one-out. Su desarrollo fue entonces medido por la Az. Se repitió el proceso eliminando una variables distinta de la RN original, hasta que todas las variables habían sido excluidas una vez. La hipótesis era que la exclusión de una variable importante degradaría el resultados más que la de una característica no tan importante. Una vez ordenadas, las variables de entrada fueron eliminadas en orden desde las menos a la más importante en una forma análogo al análisis backward de los métodos estadísticos de regresión.

Resultados

Regresión Logística

Las variables incluidas en la ecuación de RL para malignidad fueron edad, definición de bordes, masa de partes blandas y número de lesiones; todas con p<0,05. Las variables que importaron para cada uno de los diagnósticos histológicos, con significación estadística, son las siguientes. En la histiocitosis de células de Langerhans las variables incluidas en dicha ecuación fueron, lobulación, forma y edad. Osteoma tuvo como variables importantes centro, edad, diámetro y duración de los síntomas. Para quiste epidermoide la única variables seleccionada fue el hueso. En las metástasis las variables escogidas fue definición de bordes, edad y número de lesiones. El sexo del paciente y la reacción perióstica contaron para el meningioma. El diagnóstico de hemangioma se basó en la forma, masa de partes blandas y reacción perióstica. La displasia fibrosa dependió del diámetro y edad seleccionadas en la ecuación de regresión logística.

Red neuronal

En la RN para malignidad las variables fueron encabezadas por edad y definición de bordes. La exclusión de las variables desde abajo hacia arriba, proporcionó Az similares hasta la exclusión de la definición de los bordes. Cuando la ésta fue excluida, se produjo un descenso significativo de Az en la RN con edad como única variables (0,8131 ± 0,0331 vs 0,9129 ± 0,0031, p<0,05). Por tanto, las variables mínimas necesarias para un diagnóstico con confianza de malignidad y benignidad son edad y definición de los bordes. En la RN para diagnósticos, la eliminación de las variables no disminuyó el Az hasta que la edad fue eliminada. Entonces la RN mostró un descenso de la Az para: histiocitosis de células de Langerhans (p<0,001), meningioma (p<0,001) y osteoma (p<0,05) con una pérdida no significativa del área bajo la curva para los restantes diagnósticos. Esto significa que un mínimo de tres variables, edad, esclerosis de los bordes y matriz son necesarias para la RN de diagnósticos.

Comparación

La comparación de las áreas bajo las curvas ROC para los modelos de RL y RN en malignidad no fue estadísticamente significativa (0,9392 vs 0,9617, p=0,2) (Tabla 2). Por otro lado, la RN para diagnósticos estableció áreas bajo la curva significativamente mayores que la RL. Los resultados se resumen en la tabla 2. La sensibilidad y la especificidad de cada modelo en el punto de máxima eficacia diagnóstica de la curva ROC también fueron calculados.

Discusión

La importancia de una correcta clasificación en las lesiones de calota es crucial respecto a la actitud diagnóstica y terapéutica. El proceder terapéutico generalmente está determinado por la conducta biológica de las lesiones, y no por otras razones como la sintomatología, ya que en general es la tumoración (10). Al ser encontradas habitualmente estas lesiones en los exámenes radiográficos, es necesario un correcto enfoque del problema para evitar pérdidas de tiempo, económicas y preocupaciones innecesarias del paciente y personal médico. Las ayudas al diagnóstico que se sirven de instrumentos predictivos basados en reglas y sistemas expertos, hasta el momento no han demostrado un buen rendimiento (11). Hay acuerdo general de que las apariencias de la mayoría de lesiones de calota en TC y RM son difícil de interpretar, debido a apariencias radiológicas y clínicas similares (12). Al igual que otras lesiones en el esqueleto, existe una clara necesidad para un diagnóstico exacto.

Las reglas de predicción clínicas son útiles en varios campos, incluyendo el radiodiagnóstico, como ayuda en el proceso de decisión médica (13). Entre los varios métodos para el diagnóstico asistido por ordenador de lesiones óseas, uno de los pioneros fue G. Lodwick con su aproximación bayesiano (11). Los principales inconvenientes de este método es no aprende de casos nuevos, requiere un gran número de patrones para proporcionar una matriz probabilística estadísticamente válida y que funciona mejor con enfermedades comunes. Entre las distintas técnicas, la RL ha resultado como el análisis estadístico de elección para predecir eventos dicotómicos (14). Recientemente, el uso de análisis vectorial y redes neuronales ha sido utilizado para el reconocimiento de patrones radiológicos (3,4). Uno de los inconvenientes argüidos contra el uso generalizado de RN es que sus resultados son raramente comparables con métodos estadísticos para establecer su rendimiento relativo (14). El mejor método para determinar si las RN son mejores para un problema determinado es comparar con un procedimiento estadístico en los mismos grupos de entrenamiento y validación como el realizado en el presente trabajo.

Nuestros resultados muestran que una simple RN de tres capas con propagación retrógrada puede ser entrenada para distinguir prácticamente los patrones de lesiones de calota asociadas con benignidad, malignidad y las lesiones más comunes del calvario. Los similares resultados de la RN y la RL para diferenciar lesiones benignas de malignas se debe probablemente a la buena adaptación del modelo estadístico al tamaño de la muestra. Las variables más relevantes seleccionadas tanto por la RL como por la RN fue la edad y la definición de los bordes. La edad es la variable clínica más importante en el diagnóstico de las lesiones óseas focales. Dahlin observó una mayor frecuencia de lesiones malignas a partir de los 40 años afirmando que con la edad se predice correctamente el 80% de las lesiones malignas óseas (15). La definición de los bordes es una de las variables radiológicas clásicas, desde las descripciones de Lodwick (3), que determinan la agresividad de las lesiones, que mejor definen la conducta biológica de una lesión ósea y resulta extremadamente útil en la aproximación diagnóstica a estas lesiones

En el grupo de diagnósticos histológicos, según disminuía la muestra de pacientes, descendía la capacidad predictiva de la ecuación de RL. Dado que todos los métodos de clasificación dependen del entrenamiento, mejores resultados deben ser esperados según la muestra sea mayor. Por esta razón, los diagnósticos con menos de diez casos fueron descartados (4). Sorprendentemente, la RN se comportó extremadamente bien comparada con la RL incluso en los grupos más pequeños. El método leave-one-out, usado para generalizar el análisis de RL, puede ser el responsable de la baja rentabilidad del modelo estadístico.

Se necesitaron cuatro variables para el diagnóstico conjunto de malignidad y de la histologías: edad, definición de los bordes, esclerosis marginal y matriz. Estas variables son conocidas como de gran relevancia en la clasificación de lesiones óseas (11). Está más allá del objetivo de este estudio describir cuales son las variables individuales más importantes para cada diagnóstico. De hecho, no se construyeron diferentes RN para cada enfermedad. La superioridad de la RN comparada con la RL refleja la habilidad de la red neuronal para descubrir relaciones complejas entre las variables. Esta tarea es conseguida por la RN debido a su arquitectura paralela, una diferencia cardinal con los métodos estadísticos (14). La forma de procesamiento no lineal de la red neuronal permite incluso, con datos solapados o escasos para su análisis estadístico, encontrar formas de independizarlos y asociarlos a las lesiones que típicamente los presentan. El mejor rendimiento de la RN no creemos que se deba a sobre entrenamiento, ya que los métodos estadísticos son también propensos al sobre ajuste (16).

El principal problema en clasificar lesiones óseas, incluidas las del cráneo, es la considerable superposición de hallazgos de imagen haciendo inútil la mayoría de las técnicas empleadas para su clasificación, como el análisis vectorial (4). Las RN poseen ventajas potenciales sobre los métodos tradicionales multivariantes para la clasificación de datos sin límites definidos y no lineales entre diferentes clases. La superioridad de las RN sobre las aproximaciones estadísticas parece clara en el reconocimiento de patrones complejos tales como los representados en el presente estudio, incluso con pequeños conjuntos de datos.

Tabla 1. Diagnósticos histológicos más frecuentes.

Diagnósticos

n

%

Rango de edad (años)

Mediana

Histiocitosis de cél. L.

31

18.6

0.5 – 35

4

Osteoma

22

13.2

5 – 84

51.5

Quiste epidermoide

22

13.2

1 - 80

25.5

Metástasis

21

12.6

5 - 80

62

Meningioma

17

10.2

29 - 74

51

Hemangioma

15

9

20 - 63

44

Displasia fibrosa

10

6

8 - 64

18

Otros benignos

22

13.2

0.5 - 34

14

Otros maligno

7

4.2

16 - 80

43

 

Tabla 2. Comparación de regresión logística y red neuronal mediante áreas bajo la curva ROC. Az: área bajo la curva ROC. SD: desviación estándar. S / E *: Sensibilidad / Especificidad, números expresan porcentajes.

Grupos

Regresión Logística

Red Neuronal

 

Az ± SD

S / E *

Az ± SD

S / E *

Maligno

0.939 ± 0.051

79.7 / 95.2

0.951 ± 0.042

86.6 / 90.3

Histiocitosis c. Lang.

0.911 ± 0.071

92.4 / 46.9

0.985 ± 0.018

95.9 / 97.8

Osteoma

0.902 ± 0.037

81.5 / 83

0.999 ± 0.002

98.1 / 98.1

Quiste epidermoide

0.544 ± 0.781

77.7 / 12.3

0.996 ± 0.002

99.9 / 97.8

Metástasis

0.919 ± 0.091

82.7 / 85

0.994 ± 0.003

98.8 / 98.8

Meningioma

0.690 ± 0.078

39.9 / 87.2

0.977 ± 0.025

95.6 / 98.8

Hemangioma

0.721 ± 0.075

75.4 / 53.4

0.940 ± 0.004

93 / 93

Displasia fibrosa

0.837 ± 0.049

98 / 7.5

0.960 ± 0.041

98 / 91

 

Bibliografía

1. Keesling C, Eckard D, Batnitzky S. MR Imaging of osseous skull lesions. Radiology 1995;197 Suppl.(Abstract):494

2. Boone JM. ANNs at the crossroads. Radiology 1993;189:357-359.

3. Lodwick GS. A probabilistic approach to the diagnosis of bone tumors. Radiol Clin North Am 1965;3:487-497.

4. Reinus W, Wilson A. Quantitative analysis of solitary lesions of bone. Invest Radiol 1995;30:427-432.

5. Reinus WR, Wilson AJ, Kalman B, Kwasny S. Diagnosis of focal bone lesions using ANNs. Invest Radiol 1994;29:606-611.

6. Piraino D, Richmond B, Uetani M. Application of an artificial ANN in radiographic diagnosis. J Digit Imaging 1991;4:226-232.

7. Hinton G. How ANNs learn from experience. Sci Am 1992;207:144-151.

8. Miller A, Blott B. Review of ANN application in medical imaging and signal processing. Med Biol Eng Comput 1992;30:449-464.

9. Dorfman D, Berbaum K, Metz C. Receiver Operating Characteristic rating analysis. Generalization to the population of readers and patients with the jacknife method. Invest Radiol 1992;27:723-731.

10. Ruge JR, Tomita T, Naidich TP, Hahn YS, McLone, D.G. Scalp and calvarial masses of infants and children. Neurosurgery 22:1037-1042, 1988.

11. Lodwick G. Hodes P. Radiologic Concepts. In: Lodwick G, Hodes P ed. The Bones & Joints. An Atlas of Tumor Radiology. Chicago: Year Book Medical Publishers.Inc. 1973; 1-82.

12. Young H, Rothman M, Zoarski G, et al. Imaging of transcalvarial masses. Radiology 1994;193(Abstract): 455.

13. D'Orsi C, Getty D, Swets R. Reading and decision aids for improved accuracy and standardization of mammographic diagnosis. Radiology 1992;184:619-622.

14. Tu J. Advantages and disadvantages of using artificial ANNs versus logistic regression for predicting medical outcomes. J Clin Epidemiol 1996;49:1225-1231.

15. Dahlin D. Introduction and scope of study. In: Dahlin D, ed. Bone Tumors. General aspects and data on 6.221 cases. 3rd ed. Springfield: Charles C Thomas; 1978; 3-16.

16. Kattan M, Becj J. Artificial ANNs for medical classification decisions. Arch Pathol Lab Med 1995;119:672-677.

 

 

[Diapositivas] diapo.gif (481 bytes)


[Objetivo] [Comité de Honor] [Comité Científico] [Comité Organizador] [Fechas] [Entidades Colaboradoras] [Areas Temáticas] [Asistentes] [Agenda] [Inauguración] [Mesas Redondas] [Comunicaciones Libres] [Clausura] [Cuotas de Inscripción]


[Actividades de la SEIS] [Revista I+S] [Solicitud de Inscripción]

Menú

Secretaría Técnica de Informed'98:

CEFIC
C/ Olimpo, 33, 1º C
28043 - Madrid
Telfs: (91) 388 94 78 / 79
Fax: (91) 388 94 79

Enviar correo a la Secretaría cefic@seneca.net 

CopyRight SEIS© 1997, 1998.
Última actualización: 09 julio 1999 02:05