infors@alud - 98 Comunicaciones

Acceso a MEDLINE usando un servidor de vocabulario con los Terminos MeSH
Juan Rodriguez, Victor Maojo, Jose Crespo, Holger Billhardt, José A. Sanandrés
Grupo de Informática Médica. Facultad de Informática.
Universidad Politécnica de Madrid. Campus de Montegancedo. Boadilla del Monte
28660 Madrid,España

 

Resumen

    MEDLINE (MEDlars onLINE) es la principal base de datos de la Biblioteca Nacional de Medicina de los EE.UU. Esta base de datos contiene citas bibliográficas y resúmenes de aproximadamente 3.900 revistas biomédicas que se editan en los EE.UU. y otros 70 países. MEDLINE cuenta con unos 9 millones de registros que recogen artículos desde el año 1966.

    Pensamos que la calidad de un sistema de recuperación bibliográfico viene determinado en gran parte por la efectividad de la selección y asignación de términos de un tesauro a los documentos presentes en el sistema, de forma que los usuarios puedan recuperar fácilmente los documentos pertinentes.

    De acuerdo con esta línea, presentamos un método para la recuperación bibliográfica computerizada utilizando servidores de vocabulario. Se ha creado un prototipo que permite el acceso a Medline usando un servidor de términos MeSH en español y en inglés.

 

Introducción

    La National Library of Medicine (NLM) de los EE.UU. cuenta con más de 40 bases de datos online que contienen más de 20 millones de registros. Para indexar los artículos de casi 4.100 revistas biomédicas, la NLM utiliza un vocabulario controlado de términos médicos y científicos denominado MeSH [1]. Cada referencia bibliográfica a un documento está asociada con un conjunto de términos MeSH que describen el contenido del documento. Estos términos proporcionan un medio consistente de recuperar información ya que permiten usar terminologías distintas para los mismos conceptos [2,3,4]. El MeSH organiza sus conceptos en una estructura jerárquica, de forma que en el nivel más alto de la jerarquía se encuentran conceptos como "anatomía", "enfermedades" y "sustancias químicas y drogas", y en un nivel más bajo se encuentran, por ejemplo, nombres de enfermedades neoplásicas, inmunológicas o virales. Esta estructura permite que la búsqueda de un concepto pueda incluir también los artículos indexados a conceptos más específicos que el concepto buscado; por ejemplo, si el usuario introduce "Corneal Diseases" el sistema buscará por "Corneal Diseases" y por términos más específicos como "Corneal Edema", "Corneal Neovascularization", "Corneal Opacity"o "Keratitis". Además, la jerarquía proporciona una manera eficaz de recorrer el MeSH con objeto de encontrar los conceptos apropiados.

    El vocabulario MeSH se actualiza continuamente por especialistas en varias áreas. Además de recibir sugerencias por catalogadores y otros, los especialistas recogen nuevos términos que aparecen en la literatura científica y en áreas de investigación emergentes, los definen y establecen sus relaciones con otros términos en el vocabulario, y recomiendan su inclusión en el MeSH. Esto permite mantener el vocabulario actualizado con los progresos que se hacen en la ciencia. Cada año se añaden cientos de nuevos conceptos y se hacen miles de modificaciones. El MeSH de 1998 incluye más de 18.000 conceptos y por encima de 80.000 referencias cruzadas. No es de extrañar por tanto que el MeSH sea una parte vital del Sistema Informático de Recuperación y Análisis de Literatura Médica de la NLM (MEDLARS).

    Una de las bases de datos de la NLM que utiliza el MeSH en su indexación, es MEDLINE. Esta es la base de datos más grande y usada de todas las de la NLM. MEDLINE contiene artículos sobre medicina, enfermería, odontología, veterinaria y el cuidado de la salud. Cada registro en MEDLINE está identifi-cado por un número único llamado MEDLINE UID. Las citaciones de MEDLINE son creadas por la NLM, los socios internacionales de MEDLARS, y por distintas organizaciones cooperantes.

    Una fecha importante para MEDLINE fue el 26 de Junio de 1997. Ese día, la NLM anunció que MEDLINE podría accederse gratuitamente sobre la World Wide Web. A partir de ese momento ha habido una proliferación de sitios en Internet que ofrecen acceso a MEDLINE [5,6,7,8]. La propia NLM ofrece dos productos Web, Internet Grateful Med y PubMed, que proporcionan este acceso. Ambos interfaces tienen una serie de características comunes: ofrecen acceso a otras bases de datos MEDLARS®, utilizan el MeSH para ayudar a los usuarios en la creación de sus consultas, pueden limitar las búsquedas por distintos criterios y ofrecen un servicio de envío de documentos a usuarios registrados.

    PubMed ofrece otras características adicionales como el poder mostrar conjuntos de artículos relacionados (criterio de vecindad). También cuenta con enlaces a editoriales de aproximadamente 100 revistas que ofrecen textos completos. Permite también buscar artículos usando información bibliográfica tal como publicación, volumen, asunto y año. Los registros de MEDLINE se incorporan en PubMed semanalmente, y se les asigna también un identificador único de PubMed (PMID).

    Pero lo más importante es que PubMed permite el acceso directo a través del motor de búsqueda Entrez. Este motor comprueba los términos introducidos por el usuario con el vocabulario controlado MeSH y la búsqueda se hace por cabeceras MeSH o por cadenas de texto según sea apropiado. Esto nos ha permitido elaborar un interfaz que se ajusta a los usuarios hispanohablantes que acceden a MEDLINE. El interfaz elaborado, permite consultar los términos MeSH en inglés y en castellano, es posible la traducción de un idioma a otro y se asiste al usuario en la construcción de la consulta. Una vez elaborada la consulta se invoca al motor de búsqueda Entrez de la NLM que devuelve los artículos presentes en MEDLINE que cumplen con los criterios establecidos.

 

Método

    Se ha construido un servidor de vocabulario siguiendo una arquitectura cliente-servidor tal y como muestra la figura 1. El servidor inicialmente establece una conexión con la base de datos y está a la escucha, por un puerto conocido por las aplicaciones cliente, en espera de peticiones de conexión. Cuando le llega una petición, crea un nuevo socket para atender todas las consultas de la aplicación cliente, mientras sigue a la espera de nuevas peticiones de otras aplicaciones. Así, el servidor puede recibir consultas de varios clientes simultáneamente; además, este enfoque permite que el cliente y el servidor puedan estar en máquinas distintas aunque conectadas mediante una red TCP/IP, es decir, las consultas pueden ser remotas. El servidor se ha codificado en Java, ya que esto presenta la ventaja de que el código generado es independiente de la máquina, por lo que en principio se podría ejecutar sobre cualquier sistema operativo.

 

Figura 1

 

    El servidor de vocabulario accede a una base de datos relacional para responder a las consultas recibidas; para ello, preprocesa las consultas que recibe y crea sus propias instrucciones de consulta; además se encarga de la conexión y desconexión de la base de datos. De esta forma, la estructura de la base de datos es transparente a la aplicación cliente. En el prototipo se ha utilizado Ó Microsoft Access pero se podría utilizar cualquier otro sistema de gestión de bases de datos relacional. Para confeccionar esta base de datos se ha utilizado la edición de 1997 del Ó Metathesaurus del Unified Medical Language System (UMLS) [9,10] que contiene unos 330.000 conceptos representados por 739.439 cadenas de texto diferentes, provenientes de más de 30 vocabularios. Nuestro servidor de vocabulario recoge información sobre cuatro vocabularios médicos controlados: CIE-9-MC [11], MESH, CPT [12] y SNOMED [13]. Para el acceso a MEDLINE todas las consultas hacen referencia a las versiones en inglés y castellano del sistema de codificación MeSH 1997.

 

Resultados

    Se ha creado una aplicación accesible a través de la Web, que permite usar los términos MeSH, en castellano y en inglés, con objeto de elaborar consultas a MEDLINE más precisas. Para ello, tal y como se muestra en la figura 2, se ha usado un applet Java, que hace llamadas al servidor de vocabulario para obtener la información que va necesitando sobre los términos MeSH; una vez que el usuario ha confeccionado la consulta a MEDLINE, el applet hace una llamada al sistema de búsqueda bibliográfica de la NLM a través de una CGI y le muestra al usuario las citas bibliográficas encontradas.

 

Figura 2

 

    El usuario puede realizar consultas a MEDLINE, utilizando términos MeSH y operadores booleanos. Para consultar términos MeSH, puede introducir un patrón de búsqueda con uso de comodines, aunque se ha establecido en 200 el número máximo de respuestas a una pregunta al servidor de vocabulario.

    En la Figura 3, se muestra el interfaz de acceso a MEDLINE. Se puede observar que existe un checkbox que permite seleccionar el idioma de consulta de los términos MeSH (español/inglés), y es posible conmutar de uno a otro a medida que se va confeccionando la consulta. Los botones a ambos lados de "BUSCAR TERMINOS MESH", etiquetados como "Ver términos más específicos" y "Ver términos más genéricos", permiten navegar por la jerarquía del MeSH. Cuando se pulsa el botón "INCLUIR TERMINO EN LA BUSQUEDA" se produce una llamada al servidor de vocabulario para traducir el concepto de un idioma al otro. En ambos casos se añade a la búsqueda el término MeSH seleccionado, representándose la consulta en castellano y en su equivalente en inglés. El usuario podrá emplear los operadores lógicos – and, or y not – para realizar una consulta avanzada, y no debe preocuparse de la sintaxis empleada por el motor de búsqueda de PubMed ya que el programa lleva a cabo la conversión a esta sintaxis así como una comprobación sintáctica de la misma.

 

Figura 3. Interfaz de acceso a MEDLINE

 

Discusión

    Existen numerosos interfaces de acceso a MEDLINE. A diferencia de todos ellos, el aquí presentado se acerca más a la comunidad hispanohablante y le facilita la construcción de consultas avanzadas en MEDLINE.

    Además, el uso de vocabularios y en concreto servicios de traducción de un vocabulario a otro, permiten no sólo dotar a los interfaces de búsqueda bibliográfica de mayores prestaciones sino que permite su integración con otros tipos de aplicaciones. Esta línea ha sido seguida en otros proyectos [14,15] pero ninguno de ellos ha considerado los vocabularios como un recurso que pueda ser compartido por las distintas aplicaciones, enfoque seguido por nuestro grupo [16] y que permite que el mantenimiento de estos vocabularios esté centralizado y no dependa de cada aplicación evitándose así la duplicación de tareas.

 

Conclusiones

    Es indudable que la búsqueda por términos MeSH es más eficiente que una búsqueda por texto, ya que hay una "explosión" de términos la cual incluye en la búsqueda términos más específicos. Este proyecto facilita el uso de estos términos en las consultas a MEDLINE al poder consultarse tanto la versión en castellano como la versión en inglés.

    En definitiva, este proyecto facilita e intenta promover el uso del ordenador e Internet, por parte de los médicos y personal sanitario, para acceder a los distintos motores de búsqueda de literatura médica existentes, con especial énfasis en aquellos que ofrece la Biblioteca Nacional de Medicina de los EE.UU.

 

Agradecimientos

    Esta investigación ha sido posible gracias al Fondo de Investigación Sanitaria, proyecto FIS 95/1952, del Ministerio de Sanidad y Consumo. España.

    Hewlett-Packard a través de la iniciativa HISE 96 (Healthcare Information Systems Engineering) ha facilitado el material informático para este trabajo.

    La National Library of Medicine de los EE.UU. ha permitido el uso del Unified Medical Language System con los términos MeSH a través de un convenio con la Universidad Politécnica de Madrid.

Referencias

[1] National Libray of Medicine. "Medical Subject Headings". Bethesda, MD : The Library, updated annually.

[2] Clarke M, Greaves L, James S; "MeSH terms must be used in Medline searches". British Medical Journal, 1997 Apr 19. Vol 314:7088.

[3] Backus JE, Davidson S, Rada R; "Searching for patterns in the MeSH vocabulary". Bull Medical Library Association. 1987 Jul. Vol 75:3

[4] Lowe HJ, Barnett GO; "Uderstanding and using the medical subject headings (MeSH) vocabulary to perform literature searches". Proceeding of the Journal of the American Medical Association. 1994 Apr 13. Vol 271:14.

[5] HealthGate Medline. Ver http://www.healthgate.com/

[6] Infotrieve Medline Service Provider. Ver http://www.infotrieve.com/freemedline

[7] BioMedNet. Ver http://biomednet.com/db/medline

[8] Avicenna Systems Corporation. Ver http://www.avicenna.com

[9] National Libray of Medicine. "Unified Medical Language System". 6th Experimental Edition. April 1995.

[10] U. S. Department of Health and Human Services. National Institutes of Health. National Library of Medicine. "Unified Medical Language System Knowledge Sources". National Library of Medicine. 8th Edition. January 1997.

[11] Commission on Professional and Hospital Activities. "International Classification of Diseases. Ninth Revision, with Clinical Modifications (ICD-9-CM)". Ann Arbor. 1978.

[12] American Medical Association. "Current Procedural Terminology". Chicago, Il: the Association, updated annually.

[13] Côté R. A., Rothwell D.J., Palotay J. L., Beckett R.S., Brochu L. "The Systematized Nomenclature of Human and Veterinary Medicine" SNOMED International (4 volumes). College of American Pathologists. 1993.

[14] Detmer WM, Barnett GO, Hersh WR; "MedWeaver: integrating decision support, literature searching, and Web exploration using UMLS Metathesaurus". Proceeding of the Journal of the American Medical Informatics Association, 1997. Annual Fall Symposium, (pg 490-494).

[15]Aronson AR,Rindflesch TC; "Query expansion using the UMLS Metathesaurus". Proceeding of the Journal of the American Medical Informatics Association, 1997. Annual Fall Symposium, (pg 485-489).

[16] Crespo, J.; Maojo, V.; Martín, F.; Rodríguez, J.;Sáez, L.: "Vocabularios Médicos Controlados Multipropósito: Un Enfoque Basado en Grafos Conceptuales". Comunicaciones del Congreso INFORSALUD 97. Sociedad Española de Informática de la Salud. Madrid, 1997.

Comunicaciones Pagina Principal de seis Inforsalud 98