[Entrada] [Actividades] [Revista I + S] [Solicitud de Inscripción]

Informática y Salud

Nº 17. Septiembre / Octubre 1998

 

Crespo del Arco J, Maojo García Y Martin Sánchez F Rodríguez Pedrosa J, Sáez Ayerra L

Vocabularios Médicos Controlados Multipropósito

   

Para que los profesionales de la salud puedan compartir programas de informática médica entre distintos centros, estas aplicaciones médicas deben compartir un vocabulario médico común. La construcción de dicho vocabulario requiere de herramientas adecuadas para que los expertos en vocabularios puedan realizar su trabajo correctamente. En este articulo comentamos los problemas existentes con los esquemas de codificación tradicionales y proponemos un modelo basado en grafos conceptuales, con objeto de almacenar y utilizar la información semántica asociada a la terminología médica, lo que permite tener un mayor control sobre la consistencia del vocabulario y el poder ser utilizado por aplicaciones muy distintas como pueden ser sistemas de ayuda a la toma de decisión, historias clínicas computerizadas, sistemas de búsqueda bibliográfica o sistemas de información. Se presenta un primer prototipo que apoyándose sobre una red TCP/IP permite la elaboración colaborativa del vocabulario médico común y hace posible su utilización por las diferentes aplicaciones médicas.

En los últimos años ha habido una proliferación en el uso de la informática en el área de la medicina. Ha aumentado, por ejemplo, el número de sistemas de información médica, sistemas basados en el conocimiento y sistemas bibliográficos, todos los cuales hacen uso de terminologías médicas. Aplicaciones como la entrada estructurada de datos, la elaboración de informes resumen, la ayuda automática a la toma de decisiones y la investigación clínica, todos requieren almacenar los datos de una manera estándar [1].Ha sido precisamente esta necesidad de mantener la consistencia de los términos que usan las distintas aplicaciones, el motivo por el cual se han desarrollado vocabularios médicos controlados.

A menudo se toma como un hecho que existe una terminología estándar adecuada y que es de uso común. Pero la realidad es que existen numerosos sistemas de codificación como, por ejemplo, y por citar sólo algunos, ICD-9-CM línternational Classification of Diseases Ninth Edition with Clinical Modificationsí [2], DRG (Diagnosis-Related Groups)

[3], ICPC (International Classification of Primary Care) [4], CPT (Current Procedural Terminology [5] o SNOMED (Systematized Nomenclature of Human and Veterinary Medicine) [6]. En la década de los 80, esta proliferación de vocabularios controlados estaba impidiendo el avance en la integración de sistemas informáticos médicos; como respuesta, la Biblioteca Nacional de Medicina de los Estados Unidos comenzó el proyecto UMLS (Unified Medical Language System) cuyo objetivo era facilitar la traducción entre los distintos vocabularios [7]. Sin embargo, esto no ha solucionado el problema de la diversidad de vocabularios, ya que el problema principal es que los sistemas de codificación fallan en proporcionar un nivel de detalle adecuado, lo que fuerza a los desarrolladores de aplicaciones a crear para sus sistemas sus propios esquemas de codificación.

Por tanto, a medida que se informatiza el manejo de la información en la asistencia sanitaria, se incrementa la demanda de un vocabulario médico controlado y compartido que cubra adecuadamente las necesidades de las distintas aplicaciones médicas y que pueda ser integrado con otros vocabularios. Para cubrir esta demanda es necesario tener un vocabulario que pueda ser mantenido fidedignamente, así como que tenga fácil acceso a través de la red; es decir, necesitamos un servidor de vocabulario. Estos servidores permiten mantener actualizado el vocabulario y juegan un papel importante en tareas como el diseño de ventanas para la entrada estructurada de datos, la búsqueda bibliográfica, la identificación de todos los valores válidos para los parámetros de un protocolo o guía de práctica clínica y en el desarrollo de plantillas para la recuperación y resumen de los datos de pacientes.


Con objeto de paliar los problemas comentados anteriormente, se han desarrollado nuevos modelos de vocabularios controlados y se están explorando nuevas técnicas para aprovechar la información semántica sobre los términos, ya sea como marcos, redes semnánticas o grafos conceptuales.


PROBLEMAS

Uno de los incovenientes de los vocabularios médicos tradicionales es que el objetivo que ha guiado su confección es muy concreto y por lo tanto su uso es muy limitado ya que resulta muy difícil usar un código para una tarea distinta de aquella para la que ha sido diseñado. Por ejemplo, si intentamos utilizar ICD-9-CM para codificar historias clínicas, nos econtramos con que no proporciona el nivel de detalle adecuado que el médico necesita para registrar su encuentro con los pacientes.

En lineas generales, se pueden clasificar los distintos códigos en dos grupos: por un lado, aquellos códigos pensados para su uso en estadísticas o informes y, por otro, aquellos cuyo propósito es el de aportar información detallada al médico y servir para los sistemas autómaticos de ayuda a la toma de decisiones. Dentro del primer grupo se encuentran códigos como ICD-9-CM que se usa en la elaboración de informes estadísticos sobre la mortalidad mundial, DRC cuyo propósito es codificar las causas de ingreso en un hospital separando los casos clínicos en función de la severidad de la dolencia o CPT que clasifica diagnós

ticos y procedimientos terapéuticos en función de su coste y que es usado para facturación y reembolso. Dentro del segundo grupo se encuentran el diccionario de datos PTXT usado para la codificación detallada de historias clínicas y utilizado por el sistema HELP de ayuda a la toma de decisiones y el Directorio COSTAR [8] desarrollado en el Hospital General de Massachusetts que codifica un amplio rango de información en historias clínicas. El caso es que resulta muy difícil usar los vocabularios pertenecientes al primer grupo (códigos de abstracción) para la informatización de historias clínicas; la excepción está en el vocabuario ICPC que ha sido utilizado con cierto éxito por el sistema ELlAS [9] desarrollado en la Universidad Erasmus de Holanda.

Otro de los puntos donde estos vocabularios han tenido problemas ha sido el sistema de codificación empleado. En muchos casos los códigos están diseñados para reflejar la posición del término en una jerarquía. Aunque hay cierta elegancia en este enfoque, esta elegancia se rompe en la práctica, ya que al tener el código un número limitado de posiciones o dígitos, entonces se imita la profundidad de la jerarquía. Estas limitaciones pueden afectar al contenido de los vocabularios porque algunos dominios llegan a estar demasiado llenos para permitir añadir términos adicionales, siendo necesario recurrir al término "Otros casos no especificados". Además, con un único código no se pueden tener múltipíes jerarquías; si un vocabulario permite una única jerarquía, ésta reflejará indudablemente la visión de su desarroliador, la cual puede no coincidir con la del usuario, cuestión no deseable si se desea extender el uso de dicho vocabulario.

Otro asunto importante, cuando se habla de vocabularios, es su mantenimiento, ya que los vocabularios médicos no son estáticos sino que van cambiando y actualizándose. En este sentido cabe mencionar, por un lado, el modo de comunicar los cambios a los usuarios y, por otro, la forma para modificar dichos vocabularios por parte de los responsabies. El método tradicional ha sido la reunión periódica de un comité de expertos para revisar la versión actual de un vocabulario.y publicar los cambios. Esto hace que la actualización de los vocabularios sea lenta (una vez al año o menos), lo que en algunos sistemas es inaceptable como, por ejemplo, aquellos que trabajan sobre medicamentos o tipos de tests que se pueden solicitar a un laboratorio. Creemos necesario modificar este método mediante dos vías: primero, uso de servidores de vocabulario por parte de las aplicaciones médicas, ya que estos servidores facilitan la diseminación de cambios desde la autoridad central y tambien proporcionan a los usuarios un enlace con los responsables para recomendar cambios; y segundo, uso de un modelo que aproveche la información semántica sobre los términos médicos que facilite su actualización, ya que cuando la estructura de los vocabularios se hace más compleja, la tarea de dónde colocar un término llega a ser tan importante como qué término colocar [10].

 

NUEVOS MODELOS

Con objeto de paliar los problemas comentados anteriormente, se han desarrollado nuevos modelos de vocabularios controlados y se están explorando nuevas técnicas para aprovechar la información semántica sobre los términos, ya sea como marcos, redes semánticas o grafos conceptuales. Una de estas técnicas es la subsumición automática de términos, en la cual los atributos del término definen su localización. Con este enfoque se pueden conseguir vocabularios multijerárquicos ya que se despoja al código de un término de la información sobre su posición en una jerarquía.

En particular, la inclusión de conocimiento estructurado sobre los términos médicos ha sido propuesto por numerosos investigadores para propósitos tales como representación de datos de pacientes [11], indexación de literatura médica asistida por ordenador [12], traducción entre terminologías [13,14] y ayuda a la toma de decisiones [15]. Entre estos nuevos modelos se encuentran el diccionario de entidades médicas MED 1161 desarrollado por la Universidad de Columbia, Nueva York, y CALEN [17] desarrollado por la Universidad de Manchester, Reino Unido. MED consta de una red semántica basada en el UMLS y usa un grafo acíclico para representar múltiples jerarquías. Los nodos de esta red recogen los términos de cuatro sistemas hospitalarios (laboratorio, electrocardiografía, historias clínicas y farmacia). Incorpora información adicional sobre los términos mediante enlaces semánticos usados para ayudar a la integración, armonización y clasificación automática de terminologías dispares. Por otro lado, el proyecto GALEN está desarrollando un sistema de representación de conceptos independiente del idioma con la flexibilidad suficiente para tratar la diversidad que existe entre las distintas aplicaciones médicas, mientras se mantiene la coher&icia necesaria para la integración y reuso de terminologías. El lenguaje usado para la construcción del sistema se demonina GRAIL, un lenguaje formal que permite la construcción de modelos sin ambigúedades ni contradicciones.

Entre los requisitos que deben cumplir estos nuevos modelos se encuentran

· Uso de sinónimos: deben soportar múltiples términos para designar un mismo concepto.

· Compietitud en el dominio que abarcan: no deben utilizarse métodos que puedan limitar el tamaño de la terminología, como por ejemplo el incluir la clasificación jerárquica en el codigo empleado para representar un concepto.

· Consistencia: Un concepto que aparece en distintos puntos de la jerarquía, debe tener los mismos atributos y descendientes en los diferentes contextos donde aparece.

· Permitir múltiples clasificaciones: Un concepto podrá asignarse a tantas ciases o puntos de la jerarquía como sean necesarios. Por ejemplo, neumonía bacteriana puede estar en la clase neumonía y en la clase enfermedades de origen bacteriano.

· Permitir otras relaciones aparte de la jerárquica: El modelo debe tener la capacidad de expresar las distintas relaciones que aparecen entre los diferentes conceptos que forman la terminología.

· No ambigúedad: Todos los conceptos deben tener un único significado y el modelo debe prever mecanismos para tratar con los homónimos.

· No redundancia: Debe existir un mecanismo que impida la aparición en la terminología de diferentes sinónimos de un concepto como si fueran distintos conceptos.

 

ENFOQUE PROPUESTO

Partimos de la premisa de que para cubrir la demanda, por parte de distintas aplicaciones médicas, de un vocabulario controlado que abarque adecuadamente el dominio médico y que pueda ser integrado con otros vocabularios controlados, la mejor forma es mediante un servidor de vocabularios. Como se indica en la Fig.1, el servidor de vocabulario es visto como un recurso que puede ser compartido a través de una red TCP/IP por las diferentes aplicaciones médicas. La ventaja de su uso está en que las aplicaciones no tienen que preocuparse del mantenimiento del vocabulario, siendo un grupo especifico el encargado de llevar a cabo esta labor de una forma centralizada pero analizando las recomendaciones o peticiones de los distintos usuarios. La conexión al servidor seguirá un esquema cliente/servidor con intercambio de mensajes pregunta/respuesta entre las aplicaciones médicas y el servidor. Además, este servidor debe ser útil tanto para aplicaciones que reaizan búsquedas en la literatura médica como aplicaciones que hacen uso de datos clínicos sobre un paciente; es decir, debe hacer frente a aplicaciones muy dispares.

En cuanto al núcleo del servidor de vocabulario, para representar terminologías médicas, consideramos adecuado el uso de grafos conceptuales [18]. Para esta elección, partimos del hecho de que hay un componente conceptual en el lenguaje médico que puede separarse del resto de los aspectos con los que trata una aplicación médica; además, este componente puede hacerse independiente de las características de cualquier lenguaje natural. En consecuencia, se puede construir un modelo de conceptos médicos que sea único y coherente y que sea compartido por las distintas aplicaciones.

El modelo que proponemos consta de cuatro elementos principales:

(1) una jerarquía de conceptos, (2) un conjunto de designadores de individuos, (3) una relación de conformidad que relaciona los conceptos con los designadores de individuos y (4) un conjunto finito de grafos conceptuales. La jerarquía de conceptos se hace mediante un orden parcial representado mediante un grafo acíclico que permite tener multijerarquias, y que, para garantizar la consistencia, debe asegurar la inexistencia de ciclos. El conjunto de desígnadores de individuos nos permite tener términos en distintos idiomas así como variantes o sinónimos de un mismo concepto, siendo la relación de conformidad la encargada de asociar estos términos con el correspondiente concepto. Además, todo concepto debe tener asociado un grafo conceptual que representa la información semántica relativa a ese concepto; dicha información debe utilizarse para la asistencia en la colocación del concepto dentro de la jerarquía, detección de redundancias, detección de inconsistencias y para responder a preguntas hechas al modelo por parte de sistemas automáticos de ayuda a la decisión. Creemos que este modelo permite la creación de un vocabulario controlado que cumpla con los requerimientos especificados en el apartado anterior.

Se está desarrollando un primer prototipo de servidor de vocabularios; para ello estamos utilizando los vocabularios presentes en el UMLS y hemos confeccionado un modelo de datos que sigue un esquema relacional. La información proporcionada por el servidor de vocabulario es la de definición de un concepto, generación de distintas variantes o sinónimos para un término, generación de términos relativos a un concepto dado y distintos códigos correspondientes a diferentes esquemas de codificación. Para permitir la comunicación entre las aplicaciones, se está desarrollando un socket que establece un canal de comunicación sobre TCP/IP entre la aplicación cliente y el servidor de vocabulario, manteniéndose la conexión durante todo el tiempo que dura la consulta. Para el intercambio de mensajes, en un principio estamos ajustando el formato lo máximo posible al estándar HL7 aunque este estándar no es preciso en el área de terminologías. Estamos a la espera de los primeros resultados por parte de CORBAMED en este tema para estudiar su adopción. La idea es que el método usado para el intercambio de información entre las aplicaciones y el servidor se ajuste a un estándar que sea ampliamente utilizado.

 

TRABAJO FUTURO

La aplicación de los ordenadores en la medicina ha acelerado la amplitud de usos y la cantidad necesaria de detalle para la representación de los datos manejados por estas aplicaciones. El problema que se detecta es que, por un lado, el uso de texto en formato libre es inadecuado para sistemas computarizados de historias clínicas y sistemas de ayuda a la toma de decisiones y, por otro lado, los sistemas de codificación actuales tampoco cubren las necesidades de estos sistemas; además, expandiendo simplemente estos vocabularios no se ha solucionado el problema. La investigación sobre la representación de datos médicos sigue viva y se están intentando aplicar muchas de las técnicas formales de la computación. El desarrollo de mecanismos que respondan a las necesidades de mantenimiento de un vocabulario linclusión de nuevos términos, de nuevas clases de términos, inclusión de un término en una clase, adición de nuevos tipos de relaciones, e identificación de un nuevo tipo de relación entre términos es crucial para el éxito de cualquier vocabulario controlado.

Siguiendo con el modelo propuesto, nuestra línea de trabajo se centra en la construcción de un servidor de vocabulario que provea los siguientes servicios: (a) herramientas para la construcción y mantenimiento del servidor de vocabulario, que, apoyándose en grafos conceptuales, puedan detectar automáticamente inconsistencias y ayude a la clasificación de conceptos, (b) herramientas que permitan a los usuarios navegar y buscar a través del diccionario, ofreciéndoles información sobre la posición en la jerarquía del concepto buscado, así como el grafo conceptual asociado a dicho concepto y (c) protocolo e interfaz para llamadas directas al servidor de vocabulario por parte de las aplicaciones médicas.

REFERENCIAS

 

 [1] Cimino Ji: Data Storage and Knowledge Representation for Clinical Workstations. Int J Biomed Comput, 1994;34:29-44.

[2] Commission on Professional and Hospital Activities. International Classification of Diseases. Ninth Revision, with Clinical Modifications (ICD-9-CM). Ann Arbor: 1978.

[3] 3M Health Information Systems. AP-DRCs: All Patient Diagnosis Related Croups. 3M Health Care. Wallingford, CT: updated annually.

[4] Lambert H, Wood M, eds. International Classification of Primary Care. Oxford; University Press, 1987.

[5] American Medical Association. Current Procedural Terminology. Chicago, IL: the Association, updated annually.

[6] Cóté RA, Rothwell Di, Palotay IL, Beckett RS, Brochu L. The Systematized Nomenclature of Human and Veterinary Medicine - SNOMED International (4 volumes). College of American Pathologists, 1993.

[7] National Library of Medicine. Unified Medical Language System. 6th Experimental Edition. April 1995.

[8] Barnett CO, Winickoff R, Dorsey JL, Morgan MM, Luire RS. Quality assurance through automated monitoring and concurrent feedback using a computer-based medical information system. Med Care, 1978; 16 (11):962-70.

[9] Duisterhout JS, van der Meulen A, Boersma 1, Cebel R, Kjoo KH. Implementation of )CPC coding in information systems for primary care. In: Lun KC, Degoulet P Piemme TE, Rienhoff, eds. MEDINFO 92. Amsterdam: North Holland Puble Comp, 1992:1483-8.

[10] Cimino Ji. Saying what you mean and meaning what you say: coupling biomedical terminology and knowledge. Acad Med 1993; 68 (41:257-60.

[11] Nowlan WA, Rector AL, Kay 5, Horan 8, Wilson A. A patient care workstation based on user centered design and a formal theory of medical terminology: PEN&PAD and the SMK formalism. in: Clayton PD, de. Proceedings of the Fifteenth Annual Symposium on Computer Applications in Medical Care. New York: McGraw-Hill, 1992:855-7.

[12] Humphrey SM, Miller NE. Knowledge-based indexing of the medical literature: the lndexing Aid Project. l Am Soc Info Sci. 1987; 38:184-96.

[13] Masarie FE ir, Miller RA, Bouhaddou O, Ciuse NR, Warner HR. An interlingua for electronic interchange of medical information: using frames to map between clinical vocabularies. Comput Biomed Res. 1991; 24:379-400.

[14] Cimino Ji, Barnett GO. Automated transíation between medical terminologies using semantic definitions. MD Comput. 1990; 7:104-9.

[15] Huff SM, Warner HR. A comparison of Meta-1 and HELP terms: implications for clinical data. In: Miller RA, ed. Proceedings of the Fourteenth Annual Symposium on Computer Applications in Medical Care. Los Alamitos, CA: EFE Computer Society Press, 1990:166-9.

[16] Cimino Ji, Clayton PD, Hripcsak G, Johnson SR. Knowledgebased Approaches to the Maintenance of a Large Controlled Medical Terminology. J Am Med lnformatics Assoc. 1994;1 :35-50

[17] Rector AL, Nowlan WA, Glowinski A. Goals for Concept Representation in the CALEN project. In Safran C, ed. Proc of SCAMC 93. New York: McGraw-Hill, 1993: 414-418.

[18] Sowa JF Conceptual Structures: Information Processing in Mind and Machine. Reading, MA: Addison-Wesley Publishing Company, 1984.


Nº 17. Septiembre / Octubre 1998

Enviar correo a la Secretaría cefic@seneca.net  

CopyRight SEIS© 1997, 1998.
Última actualización: 09 julio 1999 02:10