infors@alud - 98 Comunicaciones

 

Reglas de Predicción Clínica e INTERNET

AUTORES

 

Resumen

    En este trabajo se comenta la influencia que puede ejercer en la actividad investigadora que se desarrolla en el sistema de salud la comunicación de los centros mediante INTERNET. En concreto analizamos la investigación para la extracción de modelos predictivos basados en Reglas de Predicción Clínica. Se consideran los obstáculos que se encuentran actualmente en estas tareas. Posteriormente vemos como puede ayudar INTERNET a paliarlos en buena medida, comentando nuestra experiencia en este área de trabajo.

 

1. Introducción

    Uno de los primeros campos en los que se pensó que la Inteligencia Artificial (IA) [1] tendría una aplicación práctica fue la Medicina. El objetivo era la creación de sistemas informáticos que ayudasen al profesional de la Medicina en las tareas de diagnosis y recomendación de terapia. El primero de ellos fue el MYCIN [2]. La existencia de este tipo de sistemas implica la obtención del conocimiento sobre el problema que se quiere tratar y los mecanismos de razonamiento pertinentes para su empleo.

    La obtención del conocimiento que nos permitirá llegar a soluciones correctas es un paso fundamental. Dependiendo del origen de este conocimiento podemos distinguir entre dos tipos de sistemas:

Sistema Experto (SE) La información proviene de expertos del dominio, es extraída mediante diversas técnicas como entrevistas o emparrillados.

Sistema Basado en Conocimientos (SBC) La información se obtiene de fuentes públicas de conocimiento, como pueden ser libros o de otros sistemas.

    La práctica médica genera una gran cantidad de datos sobre la evolución de los pacientes. Estos datos pueden utilizarse como referencia en el seguimiento del paciente. Pero además pueden ser usados para un estudio de la enfermedad con el que obtener modelos predictivos. Estos modelos predictivos pueden expresarse en forma de Reglas de Predicción Clínica (RPC) [3] que servirán como base de conocimiento para un SBC.

    A la hora de evaluar la posible utilización de un SBC basado en RPCs hay que tener en consideración dos cuestiones muy importantes como son la validez y la generalidad del mismo. La estimación de la validez de un conjunto de RPCs proporciona una indicación de la fiabilidad de las mismas. La generalidad de un conjunto de reglas nos permitirá aplicarlas con seguridad a nuevos casos.

    El presente trabajo estudia las posibilidades que ofrece INTERNET como elemento de soporte en el proceso de extracción de información para su uso en el desarrollo de un SBC clínico. Comenzaremos analizando las circunstancias en que se desarrolla actualmente este proceso para a continuación considerar en qué modo podría beneficiarse del empleo de INTERNET.


2. Situación Actual

    Actualmente la obtención de RPCs es un proceso que dista mucho de ser eficaz. Para poder aplicar cualquier método automático de extracción de conocimiento necesitamos en primer lugar una muestra representativa del problema que se va a estudiar, disponible en un soporte informático.

    El principal obstáculo lo encontramos en la escasa disponibilidad de registros informáticos de los que obtener los casos necesarios para el proceso de aprendizaje. La información sobre la evolución de los pacientes raramente se encuentra en soporte informático, tratándose principalmente de información recogida en papel [4]. En los centros que sí cuentan con un registro informatizado, se dispone de una única base de datos formada por pacientes que proceden de ese único centro. Esta base de datos es accesible únicamente desde los sistemas informáticos del propio centro.

    La situación descrita podemos resumirla en la figura 1. Tenemos que los centros no están intercomunicados de forma que los equipos investigadores no pueden acceder a todas las fuentes de información relevantes, y que hay fuentes de información que están siendo infrautilizadas.

image1.jpg (24017 bytes)

Figura 1: Centros incomunicados

    El carácter local y aislado de las fuentes de información supone una utilización subóptima de los recursos informáticos y médicos. Podemos tener conjuntos de casos que podrían ser analizados si fuesen accesibles al mismo tiempo que podemos tener equipos de investigación sin los conjuntos de casos que necesitarían para su trabajo. Otra posible situación de desaprovechamiento de recursos se da cuando en diferentes centros se realiza un estudio similar de forma aislada e independiente.

    Otra consecuencia negativa es que el número de pacientes estudiados no sea suficiente. Para que se pueda llegar a conclusiones válidas y de carácter general en la elaboración de un modelo predictivo surge la necesidad de analizar numerosos casos. Sin un número suficiente de casos la validación prospectiva del modelo será de escasa fiabilidad. Otro problema que acarrea esta escasez es el de la sobreespecialización de las RPCs obtenidas [5]. Esto quiere decir que las reglas describirán perfectamente la pequeña muestra estudiada, pero su eficacia con el resto de la población será mucho menor ya que en lugar de captar los patrones que sigue la población general se han captado los patrones particulares de esa reducida muestra.

    Podemos decir que la calidad de la información extraída estará en proporción directa a la de la muestra empleada para obtenerla. Si nos remitimos a las consideraciones sobre validez y generalidad hechas en la sección anterior, los resultados obtenidos serán difícilmente extrapolables a pacientes de otros centros.

 

3. Mejoras aportadas por INTERNET

    Si analizamos los problemas que presenta la extracción de RPCs actualmente, veremos que un elemento común a los mismos es el aislamiento de las centros médicos. Cada centro cuenta con sus sistemas informáticos y sus bases de datos, y no se permite el acceso a los mismos desde otros centros. Uno de los principales motivos de esta situación es la falta de canales de intercambio de información adecuados. Sin embargo, esta carencia desde el punto de vista tecnológico hoy en día es fácilmente paliable. INTERNET proporciona un medio de comunicación idóneo entre centros para facilitar la interacción entre los sistemas de información.

    Si comunicamos los centros entre sí a través de INTERNET tenemos dado un primer paso para permitir el acceso a los datos sobre pacientes. Se trata de un primer paso porque lo que tenemos es el canal apropiado, pero aún hacen falta los métodos necesarios para acceder a esos datos. Actualmente se está trabajando en sistemas de acceso remoto a bases de datos heterogéneas como Armeda [6], [7] o el Virtual Repository [8]. Estos sistemas proporcionan un acceso transparente a los datos que libera al investigador de los detalles relativos al sistema informático de los otros centros.

    Esta unión de INTERNET y sistemas transparentes de acceso a bases de datos remotas heterogéneas constituye un elemento clave en la mejora del proceso de extracción de RPCs. Gracias a esto el número de casos disponibles se multiplica, y su procedencia se diversifica ya que toda la información relevante es accesible a los equipos de investigación. De este modo, aumenta la efectividad del proceso de extracción de RPCs.


    La incorporación de INTERNET al sistema de salud nos llevaría a una situación como la representada en la figura

image2.jpg (26500 bytes)

Figura 2: Centros comunicados por INTERNET

    El investigador ve multiplicado el número de casos disponibles. Esta disponibilidad le proporciona nuevas posibilidades en su trabajo. Ahora puede considerar el utilizar conjuntos de datos provenientes de distintos hospitales tanto para la extracción de RPCs como para su validación. El investigador podrá desarrollar modelos predictivos de carácter local o de carácter general sin variar los procedimientos de extracción de RPCs, bastará con seleccionar las fuentes de información a procesar.

    Actualmente nuestro trabajo está orientado en esta dirección. Contamos con una arquitectura propia de acceso transparente a bases de datos remotas heterogéneas que ha sido desarrollada dentro del proyecto Armeda y con la experiencia en la busqueda de RPCs adquirida en el proyecto PREDREUMA [9]. El próximo objetivo es combinar los resultados de ambos proyectos en el desarrollo de una metodología para la búsqueda y validación a través de INTERNET de RPCs.

4. Conclusiones

    La comunicación entre los centros médicos y de investigación es un elemento básico para lograr el éxito en la formulación automática de RPCs. El elemento fundamental para lograr esta comunicación entre centros es INTERNET. Gracias a esta red de telecomunicaciones los centros médicos dejan de ser unidades aisladas y pueden compartir de forma eficiente sus recursos de investigación.

    La comunicación entre centros a través de INTERNET permite acceder a diversos conjuntos de casos, independientemente de su origen, sin necesidad de modificar los procedimientos automáticos de extracción de conocimiento. Esto se realiza mediante sistemas de acceso transparente a bases de datos remotas heterogéneas. Esta disponibilidad de información aumenta las garantías de que tanto la extracción de las RPCs como su validación sean realizadas de forma correcta y aprovechando los recursos, tanto materiales como de información, disponibles.

    Actualmente se está trabajando dentro de nuestro grupo, aprovechando resultados de proyectos nuestros, en el desarrollo de una metodología que recoge estas ideas para hacer viable su aplicación práctica.

 

Agradecimientos :

    Esta investigación ha sido posible gracias al Fondo de Investigación Sanitaria, proyecto 95/0055-02, Ministerio de Sanidad y Consumo.

 

Referencias

[1] S. J. Russell and P. Norvig. Artificial Intelligence. A Modern Approach. Prentice-Hall, Englewood Cliffs, NJ, 1995.

[2] B. G. Buchanan and E. H. Shortliffe. Rule-Based Expert Systems: The MYCIN Experiments. Addison-Wesley, Reading, MA, 1984.

[3] J.H Wasson, H.C. Sox, R.K. Neff, and L. Goldman. Clinical prediction rules: Applications and methodological standards. The New England Journal of Medicine, 313(13):793-799, Sept 1985.

[4] E. Ciruelo, J. Crespo, A. Gómez, V. Maojo, C. Montes, and J. Sanandrés. Predreuma: Modelo de inducción constructiva en prognosis y clasificación en artritis reumatoide. Madrid, Abril 1997. INFORSALUD 97. II Congreso Nacional de Informática de la Salud.

[5] S.M. Weiss and C.A. Kulikowski. Computer Systems that Learn: classification and prediction methods from statistics, neural nets, machine and expert systems. Morgan Kaufmann, San Mateo, Ca, 1990.

[6] S. Alamo, J. Crespo, I. Fernández, V. Maojo, F. Martín, A. Pazos, L. Sáez, and J. Sanandrés. Búsqueda, acceso y recuperación de información sanitaria en bases de datos heterogéneas a través de la World Wide Web. Madrid, Abril 1997. INFORSALUD 97. II Congreso Nacional de Informática de la Salud.

[7] I. Fernández, V. Maojo, J. Crespo, S. Álamo, J. Sanandrés, and F. Martín. Armeda: Accessing remote medical databases over the World Wide Web. Proceedings of the 13th Medical Informatics Europe. Conference MIE 97. Porto Carras, Greece, 1997.

[8] L. Ohno-Machado, A.A. Boxwala, J. Ehresman, D.N.Smith, and R.A. Greenes. A virtual repository approach to clinical and utilization studies: Application in mammography as alternative to a national database. In Daniel R. Masys, editor, AMIA Annual Fall Symposium, pages 369--373, Nashville, October 1997. AMIA, Hanley and Belfus.

[9] J.A. Sanandrés, V. Maojo, J. Crespo y A. Gómez. PREDREUMA : Aplicación de técnicas constructivas de aprendizaje inductivo al estudio de una base de datos sobre Artritis Reumatoide. Informe Técnico. Facultad de Informática. Universidad Politécnica de Madrid. Enero 1998.

Comunicaciones Pagina Principal de seis Inforsalud 98