Services on Demand
Journal
Article
Indicators
- Cited by SciELO
- Access statistics
Related links
- Cited by Google
- Similars in SciELO
- Similars in Google
Share
Íkala, Revista de Lenguaje y Cultura
Print version ISSN 0123-3432
Íkala vol.15 no.25 Medellín May/Aug. 2010
ARTÍCULOS DE INVESTIGACIÓN
Dinamismo conceptual en las bases de conocimiento terminológico: el caso de EcoLexicon*1
Conceptual dynamism in the foundations of terminological knowledge: the case of EcoLexicon
Pamela Faber Benítez** ; Pilar León Araúz***
** Pamela Faber Benítez. Catedrática de Universidad del Departamento de Traducción e Interpretación de la Universidad de Granada, donde imparte Terminología y Lingüística Aplicada. Obtuvo diferentes titulaciones de la Universidad de Carolina del Norte, Paris IV y la Universidad de Granada. Es autora de diversos libros y artículos sobre semántica, traducción y terminología. Correo electrónico: pfaber@ugr.es
*** Pilar León Araúz. Doctora en Traducción e Interpretación por la Universidad de Granada, donde actualmente imparte diversas asignaturas de Traducción y Lingüística. Es licenciada por la Universidad de Granada, la Université de Provence y la Northumbria University. Correo electrónico: pleon@ugr.es
RESUMEN
Introducción: la nueva orientación de la Terminología, en sentido lingüístico-conceptual, ha dado lugar al desarrollo de un nuevo enfoque centrado en el discurso y el uso real de los términos (Temmerman y Kerremans, 2003). Este cambio de paradigma ha originado una mejora sustancial del contenido de las bases de conocimiento terminológico. Sin embargo, la novedad más destacada en cuanto a la modelización del conocimiento parte del uso extensivo de las ontologías, añadiéndole un mayor grado de expresividad semántica a la Terminología.
Objetivo: presentar la base de conocimiento EcoLexicon, desarrollada en la Universidad de Granada por el grupo de investigación LexiCon. Para sacar el máximo partido de las ventajas que ofrece la aplicación de ontologías se propone la definición de un inventario de relaciones conceptuales junto con su potencial combinatorio. A su vez, éste origina una representación restringida por el contexto.
Método: según los datos extraídos del corpus recopilado para la investigación, los conceptos del dominio se dividen según su tipología y su poder relacional. Se aplican características propias del lenguaje de ontologías (Web Ontology Language) (OWL) para realizar inferencias (ej. la transitividad de la meronimia).
Resultados: la definición de las relaciones conceptuales según la naturaleza de los conceptos ofrece una solución cuantitativa para la sobrecarga de información y, a su vez, cualitativa, para la adquisición del conocimiento. Conclusiones: EcoLexicon une con éxito la Terminología y la capacidad expresiva de las ontologías, lo que ayudará en el futuro a diseñar sistemas de búsqueda adaptados a distintos usuarios.
Palabras clave: Terminología, ontología, bases de conocimiento terminológico, EcoLexicon, relaciones conceptuales
ABSTRACT
Introduction: the new conceptual-linguistic shift in Terminology has given rise to a new approach, focused on discourse and the real use of terms in texts (Temmerman and Kerremans,2003). This change of paradigm has led to a significant improvement in the content of terminological knowledge bases. However, the most innovative aspect of knowledge modeling lies in the wide-ranging use of ontologies, which provides Terminology with greater semantic expressiveness.
Objective: the presentation of the environmental knowledge base, EcoLexicon, developed at the University of Granada, by the research group, EcoLexicon. In order to obtain the maximum benefit from the application of ontologies, a closed inventory of conceptual relations is proposed along with their combinatorial potential. Accordingly, the result is a domain-specific representation, restricted by context.
Method: based on data extracted from a corpus of texts compiled for this research, the concepts in the domain are classified according to their typology and relational potential. The characteristics applied are those of the Web Ontology Language (OWL) to make inferences (e.g. the transitivity of meronymy).
Results: the definition of conceptual relations, depending on the nature of the concepts, offers a quantitative solution that limits excess information, and at the same time, offers a qualitative solution for knowledge acquisition.
Conclusions: EcoLexicon successfully combines Terminology with the expressive capacity of ontologies, which in the future will help to define search systems adapted to different user groups.
Key words: Terminology, ontology, terminological knowledge bases, EcoLexicon, conceptual relations
RÉSUMÉ
Introduction: la nouvelle orientation de la Terminologie, au sens linguistico-conceptuel du terme, a donné lieu au développement d'une nouvelle approche centrée sur le discours et sur l'usage réel des termes (Temmerman y Kerremans, 2003). Ce changement de paradigme est à l'origine d'une amélioration substantielle du contenu des bases de connaissance terminologique. Cependant, la nouveauté la plus importante en ce qui concerne la modélisation de la connaissance provient de l'usage extensif des ontologies, qui ajoute à la Terminologie un plus haut degré d'expressivité sémantique.
Objectif: présenter la base de connaissance EcoLexicon, développée à l'Université de Grenade par le groupe de recherche LexiCon. Afin de tirer le meilleur parti des avantages qu'offre l'application d'ontologies, on propose la définition d'un inventaire de relations conceptuelles avec son potentiel combinatoire. Ce dernier est à son tour à l'origine d'une représentation délimitée par le contexte.
Méthode: selon les données extraites du corpus rassemblé pour la recherche, les concepts du domaine se divisent selon leur typologie et leur pouvoir relationnel. L'on applique des caractéristiques propres au langage d'ondotologies (Web Ontology Language) (OWL) pour réaliser des inférences. (Ex : la transitivité de la méronymie) Résultats : la définition des relations conceptuelles selon la nature des concepts offre une solution quantitative à la surcharge d'information, et en même temps une solution qualitative, à l'acquisition de la connaissance. Conclusions: EcoLexicon lie avec succès la Terminologie à la capacité expressive des ontologies, ce qui permettre dans le futur de dessiner des systèmes de recherche adaptés à différents utilisateurs.
Mots-clés: Terminologie, ontologie, bases de connaissance terminologique, EcoLexicon, relations conceptuelles
1. INTRODUCCIÓN
La nueva orientación de la Terminología, desde una perspectiva lingüístico-conceptual, ha dado lugar al desarrollo de un nuevo enfoque centrado en el discurso y el uso real de los términos (Temmerman y Kerremans, 2003). Este cambio de paradigma (de lo prescriptivo a lo descriptivo), junto con los grandes avances de la lingüística de corpus, ha originado una mejora sustancial del contenido de las bases de conocimiento terminológico, fundado, a menudo, en el desarrollo de una red de relaciones conceptuales en las que se encuentra estructurado un campo de especialidad determinado.
Sin embargo, la novedad más destacada, en cuanto a la representación del conocimiento, parte del uso extensivo de las ontologías, añadiéndole mayor grado de expresividad semántica a la Terminología. Tanto éstas como aquéllas coinciden en la necesidad de consensuar criterios y restricciones de clasificación, identificar conceptos y establecer vínculos entre ellos. En las siguientes secciones se presenta la convergencia de ambos enfoques en la materialización de una base de conocimiento medioambiental: EcoLexicon (Universidad de Granada, s. f.).
2. ONTOLOGÍAS Y TERMINOLOGÍA
Una ontología puede definirse como una especificación formal y explícita para representar las entidades de un área en particular y sus relaciones (International DOI Foundation, 2006). Las ontologías de dominio pueden contribuir a eliminar la confusión terminológica y conceptual generada por las lenguas de especialidad; pero su mayor ventaja, en relación con la Terminología, reside en la posibilidad de realizar inferencias a partir del conocimiento explícito. Esto facilitaría la creación de nuevos modos de búsqueda para el usuario y la eficiencia en la gestión del conocimiento por el terminólogo.
La tarea más importante al crear una ontología consiste en identificar los conceptos y organizarlos dentro de un marco coherente y sistemático. Gillam, Tariq y Ahmad (2005) proponen extraer las clases e instancias de una ontología a través del procesamiento de los textos de especialidad. Por su parte, Meyer (2001) sugiere que los knowledge-rich contexts (contextos ricos en conocimiento) proporcionan la clave para la localización de unidades terminológicas y relaciones semánticas. En ese sentido, el punto de unión entre la Terminología y las ontologías resulta más que evidente.
En la disciplina del MedioAmbiente, existen conceptos físicos y abstractos. Los físicos suelen ser entidades naturales, accidentes geográficos, construcciones (obras marítimas, plantas de tratamiento de aguas, etc.) y todos los procesos que de algún modo inciden sobre ellos. Los conceptos abstractos incluyen teorías, ecuaciones y magnitudes relacionadas con la medición y la descripción de cada uno de los conceptos, ya sean abstractos o físicos, procesos o entidades.
Las ontologías pueden concebirse desde perspectivas muy diferentes, según sea su aplicación o el procedimiento de construcción. Esto se debe a que: 1) distintas disciplinas han acogido el concepto de ontología con objetivos muy variados, y 2) es un enfoque de aplicación práctica muy reciente, cuya metodología no siempre responde a los mismos criterios ni encuentra principios teóricos normalizados en los que basarse. El caso de la Terminología en su vertiente práctica no es diferente. Son muchos los enfoques que conviven en la elaboración de recursos terminológicos: desde el enfoque tradicional (Wüster, 1968) hasta los enfoques comunicativos (Cabré, 1999, 2000; Gaudin, 2003) y cognitivos (Temmerman, 2000, 2001; Faber, Márquez y Vega, 2005; Faber et ál., 2007, Faber, León y Prieto, 2008).
Recientemente, la terminología sociocognitiva (Temmerman, 2000) ha creado Termontography como un modo más viable de implementar representaciones conceptuales. Temmerman y Kerremans (2003) describen Termontography como un enfoque multidisciplinar, donde la teoría y la práctica del análisis terminológico y multilingüe convergen con los métodos y las recomendaciones del análisis ontológico (Fernández, Gómez-Pérez y Jurista, 1997; Sure y Studer, 2003).
Este nuevo enfoque tiene como precedente el trabajo de Meyer y sus colaboradores (Meyer, Bowker y Eck, 1992; Meyer y McHaffie, 1994; Meyer, Eck y Skuce, 1997), una de las primeras terminólogas en sostener que las bases de conocimiento serían mucho más útiles si su organización guardara cierto parecido con el modo en el que los conceptos se encuentran representados en la mente humana (Meyer, Bowker y Eck, 1992). De acuerdo con esta propuesta, además de las jerárquicas, las relaciones no jerárquicas deben empezar a recibir mayor atención, puesto que son las que contribuyen al enriquecimiento del modelado conceptual, ofreciendo verdaderas redes de conocimiento dinámicas (León y Faber, 2010).
La terminología basada en marcos (Faber, Márquez y Vega, 2005; Faber et ál., 2006; Faber et ál., 2007) es otra de las orientaciones cognitivas más recientes que confiere gran importancia al desarrollo de nuevas relaciones conceptuales. Esta teoría comparte muchas de sus premisas con las teorías comunicativa (Cabré, 1999) y sociocognitiva (Temmerman, 2000). Parte de que la distinción entre términos y palabras ha dejado de ser útil o incluso viable, ya que el mejor modo de estudiar las unidades de conocimiento especializado es a través de su comportamiento en los textos.
Como su nombre indica, la terminología basada en marcos se inspira parcialmente en la noción de marco de Fillmore (1982, 1985; Fillmore y Atkins, 1992). Los marcos son un tipo de estructuración cognitiva basada en la experiencia. Boas (2005) afirma que uno de los problemas en la creación de bases de datos multilingües es el desarrollo de una arquitectura capaz de gestionar fenómenos como la polisemia, los patrones de lexicalización y las equivalencias de traducción. En este sentido, los marcos tienen la ventaja de explicitar el comportamiento potencial, tanto semántico como sintáctico, de las unidades especializadas, lo que implica la descripción exhaustiva de las relaciones conceptuales así como de su potencial combinatorio.
La terminología basada en marcos se centra en los siguientes pilares: 1) el carácter organizacional de los conceptos; 2) la multidimensionalidad de los conceptos, y 3) la extracción de información semántica y sintáctica mediante el uso de corpus multilingües.
Su metodología descansa en un enfoque mixto de top-down y bottom-up. El enfoque bottom-up consiste en extraer información textual en varias lenguas. Por el contrario, el enfoque top-down se fundamenta en la información contenida en diccionarios especializados y otras obras de referencia, complementada con la ayuda de expertos en el dominio medioambiental.
La aplicación práctica de la terminología basada en marcos tiene como resultado el recurso terminológico EcoLexicon.
3. ECOLEXICON: UNA BASE DE CONOCIMIENTO MEDIOAMBIENTAL
EcoLexicon es una base de conocimiento multimodal, enriquecida con técnicas lingüísticas y de representación del conocimiento. Actualmente, consta de 3.042 conceptos y 10.538 términos, en español, inglés y alemán, y recientemente se han añadido griego moderno y ruso. Sus conceptos más primitivos están organizados en torno a un evento basado en marcos: el evento medioambiental (véase figura 1).
Según la información extraída del corpus elaborado para el proyecto, los roles semánticos más prototípicos dentro del dominio son agente, proceso / estado, paciente / resultado y lugar. De esta forma, el dominio medioambiental está conceptualizado como un proceso dinámico, iniciado por un agente (natural o humano) que produce un resultado en un lugar determinado.
El dinamismo global del dominio causa un alto grado de multidimensionalidad, lo que hace que las barreras intercategoriales sean difusas y se den casos de herencia múltiple. Por ejemplo, una playa puede ser el resultado de un proceso, pero también puede ser paciente de procesos costeros y un lugar determinado. Esta estructura es la base de la representación del resto de proposiciones conceptuales y de las clases de más alto nivel de la ontología.
3.1 Estructura ontológica
Las clases y las subclases de la ontología se corresponden con la estructuración jerárquica de los componentes de cada rol semántico, con el objetivo de que el usuario acceda a un conocimiento estructurado de base cognitiva y a una visión general del dominio orientada al proceso (véase figura 2).
Los datos en EcoLexicon parten, en primer lugar, de una base de datos relacional. Este modelo nos permitió desarrollar, de forma rápida y colaborativa, los primeros recursos de la aplicación. Sin embargo, esto tiene ciertas limitaciones, en cuanto a la representación de entidades del mundo real. La ventaja de las ontologías frente a las bases de datos relacionales es su grado de expresividad semántica, a partir del cual pueden aplicarse las técnicas de razonamiento y facilitar así la gestión terminológica.
Por ejemplo, las ontologías hacen posible la definición de clases disjuntas. A pesar de la gran multidimensionalidad que caracteriza al dominio medioambiental, existen ciertas restricciones de pertenencia categorial. Es decir, aquellos conceptos pertenecientes a agente nunca podrían formar parte de la clase proceso, al tratarse de conceptos de distinta naturaleza (objetos y procesos / estados). Lo mismo ocurre entre proceso y paciente, e incluso entre algunas de las subclases, como agente natural y agente artificial.
Por otra parte, y en consonancia con las recomendaciones de la Web Semántica (W3C, 2001), la reusabilidad del conocimiento y la posibilidad de compartirlo e integrar otras aplicaciones medioambientales, nos llevó a la creación de la ontología (figura 2). No obstante, para aprovechar todos los beneficios de las ontologías, el modelado conceptual debe ser coherente en todos sus niveles, y la descripción de cada concepto, así como de sus posibilidades combinatorias, responder a criterios y restricciones concretos.
3.2 Relaciones conceptuales: características y restriccionesLas clases e instancias de la ontología se visualizan, a otro nivel de representación, en forma de un sistema de conceptos articulados en torno a una red dinámica de relaciones tanto verticales como horizontales. En la figura 3 se puede observar la red conceptual a la que pertenece delta fluvial.
''Hasta hace poco, las bases de conocimiento estaban limitadas a relaciones genérico-específicas o meronímicas, dando lugar a configuraciones estáticas que no tenían en cuenta el dinamismo del conocimiento especializado'' (Barrière, 2001: 137). En este sentido, Rogers añade que ''el resto de relaciones ontológicas están muy poco documentadas'' (2004: 218).
Sin embargo, en la actualidad siguen sin existir recomendaciones metodológicas sobre el tipo o número de las distintas relaciones que pueden modelar un dominio al margen de las hiponímicas, sino que se crean según los problemas o los propósitos de cada modelo (Hovy, 2002: 91). Esto se debe a que la relación de inclusión, tradicionalmente más estudiada, es la que parece poseer características más claras frente a todas las demás, en cuanto a su poder organizativo y hereditario, ya que no sólo guía el proceso de la categorización, sino también el de la herencia de propiedades (Barrière, 2004: 244).
No obstante, esto no significa que las relaciones no jerárquicas no tengan un papel fundamental en cuanto a la representación o adquisición del conocimiento. En EcoLexicon, según los datos extraídos del corpus, se comprobó que las relaciones activadas dependían en gran medida del tipo de concepto y su poder relacional, y que el dinamismo del dominio venía sobre todo codificado en los vínculos no jerárquicos, aquellos que implicaban cambio y movimiento. Se estableció así el siguiente inventario de relaciones conceptuales, junto con una serie de criterios, en función de la naturaleza de cada concepto.
Hiponimia
Tipo_de: se utiliza en el caso de las relaciones genérico-específicas tradicionales. Por ejemplo: presa de hormigón es un tipo_de presa.
Por otro lado, muchos de los conceptos de este dominio presentan subjerarquías de subordinados, estructurados en torno a una serie de atributos diferenciados y responsables de un tipo de multidimensionalidad. Así, aunque conceptos como dique vertical, dique exento y dique tipo berma sean conceptos coordinados, es evidente que no comparten la misma relación de subordinación con dique. Por este motivo, y sólo en los casos en los que la proyección extensional de un concepto presente criterios de distinta naturaleza, proponemos una lista indefinida de atributos, según las necesidades, que reflejen la multidimensionalidad a ese nivel.
- Tipo_de (material): ej. presa de hormigón tipo_de (material) presa.
- Tipo_de (posición): ej. dique exento tipo_de (posición) dique.
- Tipo de (función): ej. espigón declinante tipo_de (función) espigón.
- Tipo de (forma): ej. espigón martillo tipo_de (forma) espigón.
Meronimia
- Parte_de: este tipo de meronimia se entiende en dos sentidos, uno concreto, para objetos físicos (manto principal parte_de dique rompeolas), y otro abstracto, para las disciplinas y ramas de la ciencia (microbiología parte_de biología); y casos como autoridad portuaria parte_de puerto, ambos objetos mentales.
- Fase_de: otro caso de meronimia abstracta serían los pasos en los que se dividen los procesos, puesto que al igual que las entidades físicas no existen por sí solas sin ninguna de sus partes (cuando son integrales), un proceso no podría considerarse como tal sin que sus pasos se llevasen a cabo. Por ejemplo, bombeo fase_de dragado.
La diferenciación entre parte_de y fase_de encuentra su justificación en el hecho de que ambos tipos de meronimia no tienen las mismas implicaciones conceptuales, debido a la distinción, según su estructura interna, entre entidades y procesos. - Compuesto de (material): esta relación sustituye a la habitual material_de y su inversa hecho_de; se añade material para evitar confusiones con par-te_de. El cambio se debe a que esta relación resulta más lógica en los casos de elementos naturales, por ejemplo, en lugar de lluvia hecha_de agua, lluvia compuesta de (material) agua. O, en lugar de aire hecho_de gas, aire compuesto de (material) gas. Así, es posible reflejar el tipo de material que compone los distintos tipos de elementos, tanto artificiales como naturales, sin que la expresión hecho de restrinja las relaciones a los conceptos que son artificialmente fabricados. Para los procesos, que no pueden estar compuestos de ningún otro concepto, se utiliza la relación tiene_ función, en casos como el siguiente: material de relleno tiene_función regeneración de playas (en lugar de una posible interpretación como regeneración de playas compuesto_de material de relleno). A pesar de que el material que compone un objeto es parte de él, esta relación se diferencia de parte_de en que el material puede ser a veces un concepto variable y no conforma una parte físicamente distinguible del todo.
- Ubicado_en: en consonancia con la tipología de Winston, Chaffin y Herrmann (1987), esta relación, a veces considerada como no jerárquica, se ha incluido como tipo de meronimia. Debe usarse en los casos en los que la ubicación de entidades físicas sea una característica fundamental en la descripción de las mismas. Ej.: espigón de encauzamiento ubicado_en canal (una obra de similares características que no se ubique en un canal, deja de ser un espigón de encauzamiento). No debe confundirse con parte_de, para no caer en la transitividad falsa señalada por Murphy (2003).
Para los casos conflictivos en los que puedan confundirse las relaciones ubicado_en o parte_de (lecho ubicado_en o parte_de río; caudal parte_de o ubicado_en río), la de parte_de tendrá prioridad, puesto que no hay lecho ni caudal que existan por sí solos sin la presencia de un río asociado a ellos. - Tiene_lugar_en: ésta se diferencia de la anterior en el mismo sentido que parte_de y fase_de, pero también se justifica porque añade un componente espacio-temporal con respecto a la de ubicado_en. En primer lugar, porque los procesos no se ubican en un espacio concreto, como los objetos, y en segundo lugar, porque los procesos tienen un componente temporal del que carecen los objetos. Así, transporte litoral tiene lugar_en mar (y no ubicado_en mar); regeneración de playas tiene lugar_en playa; y baja térmica tiene lugar_en verano.
De este modo, en lo que se refiere a las relaciones espaciales, es necesario considerar si se trata de un proceso o un objeto para asignarle la relación ubicado_en o tiene lugar_en, mientras que para las relaciones temporales, sólo tendrán cabida los procesos y se utilizará tiene lugar_en. - Delimitado_por: esta relación está también considerada como meronímica, porque supone, en ocasiones, una combinación de la de ubicación y parte_de. Sólo se encarga de unir entidades físicas cuando un concepto marque el final o el comienzo de otro. No debe utilizarse en casos como microbiología delimitado_por biología (en ese caso, se considera parte_de). Un uso correcto sería estratosfera delimitado_por estratopausa.
- Resultado_de: para eventos o entidades que se deriven de otros eventos. En este caso, atendiendo a la naturaleza de los conceptos, un evento y un objeto pueden ser el resultado_de otro evento, pero un evento nunca puede ser el resultado_de un objeto. En los casos en los que un objeto influya en un evento, debe categorizarse según la relación afecta_a. Ej.: espigón afecta_a transporte litoral. Así, agradación resultado_de sedimentación, pero no de sedimentos.
- Causa: esta relación vincula únicamente entidades con eventos, como agua causa erosión. Aunque pudiera parecer la inversa de la anterior, ésta se diferencia de resultado_de en que es la relación prototípica de los objetos que actúan como agentes. Es decir, que sólo son válidas para describir el inicio de un proceso, mientras que la anterior puede vincular un proceso u objeto que sea consecuencia de otro proceso.
Cuando los agentes son funcionales, causa se sustituye por tiene_función. Y cuando el agente actúa directamente sobre un paciente, se expresa mediante la relación afecta_a. - Afecta_a: junto con las dos anteriores, es una relación muy importante, puesto que son las encargadas de mostrar cómo se interrelacionan los conceptos en un plano distinto al exclusivamente jerárquico. Son la clave del dominio, porque incluyen dinamismo y transformación, y reflejan tres aspectos relacionados con la causalidad.
Afecta_a sirve para procesos u objetos que provoquen un cambio en otro proceso u objeto, pero que no supongan un resultado final (en cuyo caso se haría uso de resultado_de) o el inicio de un proceso (donde habría que emplear causa), sino la implicación de un objeto como paciente o la influencia de un proceso sobre otro.
En el caso de que esa influencia o cambio se encontrara codificada en el significado de algún verbo propio del dominio, se crea una subrelación específica como las siguientes: erosiona, transporta, cambia_estado, etc. Algunos de estos verbos son polivalentes y pueden surgir en contextos en los que un concepto influye sobre otro (el caso de afecta_a) o cuando un concepto posee una función sobre otro (el caso de la siguiente relación). Para evitar ambigüedades, se propone expresar las relaciones del modo siguiente: plaguicida afecta_a (contamina) agua. - Tiene_función: en este tipo de relaciones no sólo entran los objetos o los procesos que se construyen o llevan a cabo con una función concreta (proceso), sino también los elementos que se encuentren en la naturaleza y que, aunque no hayan sido creados para un fin específico, sean aprovechados por el hombre. Ej.: acuífero tiene_función abastecimiento humano. No entrarán aquí los fenómenos o los elementos naturales que no sean aprovechados por el hombre, como por ejemplo, cuenca de drenaje, tiene_ función escorrentía. En ese caso sería escorrentía tiene_lugar_en cuenca de drenaje. Al igual que en la relación afecta_a, ésta también puede presentar una jerarquía de subrelaciones:
- Se_hace_con: sólo se utilizará para vincular los instrumentos diseñados para llevar a cabo procesos: dragado se_hace_con draga. Esta relación es de tipo funcional (podría afirmarse que draga tiene_función dragado), pero se ha considerado como subrelación para distinguir entre la genérica, que puede unir todo tipo de objetos y procesos con otros procesos, de una más específica que se limita a vincular sólo objetos artificiales (instrumentos) que se hayan creado para fines concretos.
- Estudia: para las disciplinas, ramas y ciencias. Ej.: potamología estudia corrientes superficiales.
- Representa: para gráficos, mapas, etc. Ej.: rama descendente representa caudal.
- Mide: para instrumentos de medida. Ej.: mareógrafo mide marea.
- Protege, previene, reduce, etc.: espigón tiene_función (previene) erosión.
- Atributo_de: sólo para conceptos cuya designación son adjetivos especializados, como isotrópico, abisal, aluvial, etc. o sustantivos que sirvan para evaluar las propiedades de los conceptos (altitud, amplitud, capacidad, etc.).
Además de determinar el tipo de relaciones potencialmente activables según la naturaleza de los conceptos, se puede ir un paso más allá y establecer restricciones en la naturaleza del segundo concepto de la proposición. Así, un proceso podrá activar la relación se_hace_con, pero sólo si está asociado a un objeto físico, mientras que si se activa la relación afecta_a, podrá vincularse a objetos, procesos, estados y propiedades (véase figura 4).
Un ejemplo de la implementación de las relaciones anteriores en la ontología, es el que aparece en la figura 5, donde el concepto sewer (o colector) viene descrito a partir de tres de ellas (afecta_a, parte_de y tipo_de) como miembro de la subclase structure construction.
No obstante, estas relaciones, específicamente concebidas para una base de conocimiento medioambiental, pueden beneficiarse de la expresividad especificada en Web Ontology Language (OWL) a través de la definición de características adicionales (simetría, inversión, transitividad) (Smith, Welty y McGuinness, 2004), lo que haría posible las inferencias.
- Simetría: si el par (x, y) es instancia de una relación simétrica, el par (y, x) también lo será. En EcoLexicon, un ejemplo de relación simétrica sería delimitado_por, puesto que si la estratosfera (x) está delimitada_por la estratopausa (y), la estratopausa (y) también lo está por la estratosfera (x).
- Inversión: si dos propiedades son inversas, el par (x, y) será instancia de la propiedad 1 y el par (y, x) de la propiedad 2. Todas las relaciones, excepto las simétricas, cuentan con su inversa: tipo_de ↔ genérico_de; resultado_de ↔ tiene_resultado; causa ↔ tiene_causa; fase_de ↔ tiene fase; parte_de ↔ tiene_parte; compuesto de (material) ↔ material_de; tiene_lugar_en ↔ lugar_de; ubicado_en ↔ ubicación_de; tiene_función ↔ función_de; se_hace_con ↔ sirve_para, etc.
- Transitividad: si en una jerarquía de tres niveles x, y, z, el par (x, y) es una instancia de una relación transitiva al igual que el par (y, z), también lo será el par (x, z).
Además de la transitividad propia de la hiponimia y la herencia de propiedades, esta característica también afecta a la relación establecida entre ciertas partes con respecto a sus todos, lo que explica la distinción entre merónimos en el inventario anterior. Ésta sólo es aplicable a las relaciones parte_de, fase_de y ubicado_en en los casos en los que se observen fronteras espacio-temporales delimitadas.
Por ejemplo, si coronación (x) es parte_de aliviadero (y) y aliviadero (y) es parte_de presa (z), coronación (x) es también parte_de presa (z); si bombeo (x) es una fase_de dragado (y) y dragado (y) lo es de regeneración de playas (z), bombeo (x) también será una fase_de regeneración de playas (z); o si el puerto de Motril (x) está ubicado en Granada (y), y Granada (y) está ubicada en Andalucía (z), el puerto de Motril (x) está ubicado en Andalucía (z).
La aplicación de estas características puede observarse en la figura 6, donde a través del concepto sewer se recuperan los conceptos de los que forma parte por transitividad. Es decir, mientras que drainage system es extraído como merónimo directo, sewage disposal system y sewage collection and disposal system son recuperados como merónimos superiores sin haberlo especificado de forma explícita.
Además de estas características, también es posible incluir ciertas restricciones, como la de Allvaluesfrom. Esta restricción indica que una clase a puede establecer una relación cuyos valores tengan que ser los incluidos en otra clase b. Así, si una instancia x está relacionada con la instancia y, se podría inferir que y es una instancia de la clase b. Es decir, si en el inventario anterior la relación causa es exclusiva de los agentes y procesos, se podrá decir que la clase agente natural (a) sólo podrá relacionarse a través de causa con la clase proceso natural (b), lo que implicaría que si viento (x) causa erosión eólica (y), erosión eólica pertenecerá a la clase b, sin tener que especificarlo formalmente.
3.3 Dinamismo y reconceptualización
La representación del dominio del MedioAmbiente exige criterios metodológicos muy concretos y lo suficientemente generalizables como para implementar las ventajas de las ontologías. Sin embargo, pese a los esfuerzos por describir cada noción de forma sistemática y concisa, la gran envergadura del dominio, y su alto grado de multidimensionalidad, han dado lugar a una gran sobrecarga de información (véase figura 7).
Obviamente, si se mostraran todas las dimensiones de sedimento al mismo tiempo, como ilustra la figura 7, la adquisición de conocimiento por los usuarios se vería altamente comprometida. En esta figura, sedimento está vinculado en la misma medida a conceptos relacionados con la geología (morrena), con la construcción (gavión) o con el tratamiento de aguas (decantación). Sin embargo, sedimento nunca activará muchas de estas proposiciones al mismo tiempo, puesto que en el mundo real evocan situaciones completamente diferentes e incluso incompatibles en términos espacio-temporales.
Esto se explica porque el dominio Medio Ambiente, de reciente creación y de un auge exponencial en los últimos años, aúna numerosos enfoques que abarcan distintas disciplinas, como la ecología, la geología, la química, etc. Así, no es extraño encontrar cierto solapamiento conceptual de origen multidisciplinar, lo que no implica en cualquier caso que las nociones compartidas tengan que ser siempre descritas en los mismos términos.
El problema de la sobreinformación crea la necesidad de diseñar marcos de representación capaces de restringir la información según el contexto, proporcionando así una solución coherente y cercana a la organización de conceptos como referentes.
En este sentido, Barsalou (2005) señala que cualquier concepto produce múltiples conceptualizaciones situadas para cada uno de los diferentes escenarios en los que pueda intervenir, por lo que el contexto puede considerarse un constructo dinámico capaz de activar o restringir el conocimiento. En cuanto a la adquisición del conocimiento, Yeh y Barsalou (2006) afirman que cuando a una tarea cognitiva se le incorpora el contexto se convierte en una actividad mucho más fácil de procesar. Como consecuencia, cualquier sistema de representación orientada al usuario debería responder ante casos de reconceptualización contextual.
En EcoLexicon, la noción de marco también se ha aplicado a este nivel de representación, dividiendo el dominio global en diferentes dominios contextuales: hidrología, geología, meteorología, biología, química, ingeniería, tratamiento de aguas, procesos costeros y navegación. De esta forma, los conceptos de mayor multidimensionalidad son reconceptualizados en función de su pertenencia a un marco concreto, restringiendo así su comportamiento relacional.
Las restricciones contextuales no se han aplicado a conceptos individuales o a relaciones específicas, sino a cada proposición conceptual. Por ejemplo, sedimento está vinculado a decantación a través de la relación afecta_a, pero esta proposición no resultará relevante en el caso de que el usuario sólo quiera obtener información sobre sedimento como resultado de un proceso geológico. La proposición aparecerá únicamente en el contexto del tratamiento de aguas. De este modo, cuando se aplican las restricciones, sedimento pasa de mostrar todas sus relaciones potenciales (figura 7), a mostrar tan sólo las activadas por el contexto (véase figura 8).
4. CONCLUSIONES Y LÍNEAS FUTURAS
La unión de métodos ontológicos y terminográficos permite crear sistemas de representación sensibles al dinamismo inherente al conocimiento. De forma global, el evento en el que se inspira EcoLexicon parte de una orientación teórica centrada en el proceso, en el que las relaciones no jerárquicas expresan la complejidad del dominio.
En un nivel más específico, la reconceptualización contextual ofrece dos ventajas: una cuantitativa, derivada del hecho de que el gran número de conceptos pertenecientes al campo del Medio Ambiente genera gran sobreinformación; y otra cualitativa, que responde a la necesidad de añadir u ocultar dimensiones conceptuales según la parcelación de un dominio multidisciplinar, lo que consigue un modelo de representación más cercano a la realidad.
Por último, y en una dimensión más práctica, el conocimiento implícito derivado de la ontología permite al usuario filtrar las búsquedas en función de distintos criterios.
El siguiente paso en el desarrollo de EcoLexicon consiste en crear una comunidad medioambiental de conocimiento compartido y conectar el recurso con otros pertenecientes al mismo dominio, como EnvO (Morrison, 2009) y SWEET (Raskin, 2003). En lugar de aplicar técnicas de alineación de ontologías, Linked Data (Berners-Lee, 2006) parece la tecnología más apropiada, puesto que se podrían establecer vínculos entre recursos de distinto origen y propósitos, y al mismo tiempo conservarlos como independientes.
BIBLIOGRAFÍA
1. Barrière, C.(2001). Investigatingthecausalrelation ininformativetexts. Terminology, 7(2):135-154. [ Links ]
2. Barrière, C. (2004). Building a concept hierarchy from corpus analysis. Terminology, 10: 2, 241-263. [ Links ]
3. Barsalou, L.W. (2005). Situated conceptualization. En Cohen H. and Lefebvre, C. (Eds.). Handbook of Categorization in Cognitive Science (pp. 619-650). Amsterdam: Elsevier. [ Links ]
4. Berners-Lee, t. (2006). Linked Data. W3C Design Issues. Recuperado de: http://www.w3.org/DesignIssues/LinkedData.html [ Links ]
5. Boas, H. (2005). Semantic frames as interlingual representations for multilingual lexical databases. International Journal of Lexicography, 18: 445-478. [ Links ]
6. Cabré Castellvi, M. T. (1999). Terminology. Theory, Methods, Applications. Traducido por Janet Ann DeCesaris. Amsterdam, Filadelfia: John Benjamins. [ Links ]
7. Cabré Castellvi, M. T. (2000). Elements for a theory of terminology: Towards an alternative paradigm. Terminology, 6 (1): 35-57. [ Links ]
8. Faber, P., León Araúz, P., Prieto Velasco, J. A. (2008). Semantic relations, dynamicity and terminological knowledge bases. Proceedings of the XVIII FIT World Congress. Shanghai. [ Links ]
9. Faber, P., LeónAraúz, P., Prieto Velasco, J.A. y Reimerink.A. (2007). Linking images and words: The description of specialized concepts. International Journal of Lexicography, 20: 39-65. [ Links ]
10. Faber, P., Márquez Linares, C., y Vega Expósito, M. (2005). Framing Terminology: A Process-Oriented Approach. META, 50 (4): CD-ROM. [ Links ]
11. Faber, P., Montero Martínez, S., Castro Prieto, M. R., Senso Ruiz, J., Prieto Velasco, J. A., León Arauz, P., Márquez Linares, C., y Vega Expósito, M. (2006). Process-oriented terminology management in the domain of Coastal Engineering. Terminology, 12 (2): 189-213. [ Links ]
12. Fernández, M., Gómez-Pérez, A., Jurista, N. (1997). Methontology: From ontological art towards ontological engineering. Workshop on Ontological Engineering (pp. 33-40). Spring Symposium Series. AAAI97 Stanford. [ Links ]
13. Fillmore, C. J. (1982). ''Frame semantics''. In Linguistic Society of Korea (Ed.). Linguistics in the Morning Calm (pp. 111-137). Seoul: Hanshin. [ Links ]
14. Fillmore, C. J. (1985). Frames and the semantics of understanding. Quaderni di Semántica. 6 (2): 222-254. [ Links ]
15. Fillmore, C. J. y Atkins, S. (1992). Towards a frame-based organization of the lexicon: The semantics of RISK and its neighbors. In Lehrer, A. and Kittay, E. (Eds.). Frames, Fields, and Contrast: New Essays in Semantics and Lexical Organization (pp. 75-102). Hillsdale, NJ: Lawrence Erlbaum. [ Links ]
16. Gaudin, F. (2003). Socioterminologie: Une Approche Sociolinguistique de la Terminologie. Bruselas: Duculot. [ Links ]
17. Gillam, L, Tariq, M. y Ahmad, K. (2005). Terminology and the construction of ontology. Terminology, 11 (1): 55-81. [ Links ]
18. Hovy, E. H. (2002). Comparing sets of semantic relations in ontologies. En Green, R., Bean, C.A. y Myaeng, S. H. (Eds.), The Semantics of Relationships: An Interdisciplinary Perspective (pp. 91-110). Dordrecht: Kluwer. [ Links ]
19. International DOI Foundation (2005). The DOI Handbook, Version 4.2.0. Oxford: International DOI Foundation (IDF). Recuperado el 22 de febrero de 2010, de http://www.doi.org/handbook_2000/glossary.html [ Links ]
20. León Araúz, P. y Faber, P. (2010). Natural and contextual constraints. Workshop on semantic relations. Theory and applications. Malta, mayo. [ Links ]
21. Meyer, I. (2001). Extracting knowledge-rich contexts for terminography: A conceptual and methodogical framework. En Bourigault, D. Jacquemin, C. L'Homme, C. y M. C. (Eds.). Recent Advances in Computational Terminology (pp. 279-302). Amsterdam, Filadelfia: John Benjamins. [ Links ]
22. Meyer, I., Bowker, L. y Eck, K. (1992). Cogniterm:An experiment in building a knowledge-based term bank. In Hannu Tommola et ál. (Eds.), Proceedings of Euralex '92 (pp. 159-172). Tampere, Finlandia: Tampereen Yliopisto, Universidad de Tampere. [ Links ]
23. Meyer, I., Eck, K. y Skuce, D. (1997). Systematic concept analysis within a knowledge-based approach to terminology. In Wright, S. E. and Budin, G. (Eds.). Handbook of Terminology Management (pp. 98-118). Amsterdam, Filadelfia: John Benjamins. [ Links ]
24. Meyer, I. y McHaffie, B. (1994). De la focalisation à l'amplification: nouvelles perspectives de représentation des données terminologiques. In Clas, A. and Bouillon, P. (Eds.). TATAO: Recherches de Pointe et Applications Immédiates (pp. 425-440). Montreal: Les Presses de l'Université de Montréal. [ Links ]
25. Morrison, n. (2009). EnvO - Development of an Environmental Ontology. Proceedings of Towards eEnvironment. Opportunities of SEIS and SISE: Integrating Environmental Knowledge in Europe. [ Links ]
26. Murphy, L. M. (2003). Semantic Relations and the Lexicon. Cambridge: Cambridge University Press. [ Links ]
27. Raskin, r. y Pan,M. (2003). Semantic Web for Earth and Environmental Terminology (SWEET). Proceedings of the Workshop on Semantic Web Technologies for Searching and Retrieving Scientific Data (SCISW). Sanibel Island, Florida. [ Links ]
28. Rogers, M. (2004). Multidimensionality in concepts systems: a bilingual text perspective. Terminology, 10 (2): 215-240. [ Links ]
29. Smith, M., Welty, C. y McGuinness, D. (Eds.). (2004). OWL Web Ontology Language Guide. W3C Recommendations. Recuperado el 22 de febrero de 2010, de http://www.w3.org/TR/owl-guide/ [ Links ]
30. Sure, Y. y Studer, R. (2003). A methodology for ontology-based knowledge management. En Davis, J. Fensel, D. y Harmelen, F. van (Eds.). Towards the Semantic Web. Ontology-Driven Knowledge Management. Londres: John Wiley & Sons. [ Links ]
31. Temmerman, R. (2000). Towards New Ways of Terminology Description. Amsterdam, Filadelfia: John Benjamins. [ Links ]
32. Temmerman, R. (2001). ''Sociocognitive terminology theory''. En Cabré, M. T. and Feliu, J. (Eds.). Terminología y cognición (pp. 75-92). Barcelona: Universitat Pompeu Fabra. [ Links ]
33. Temmerman, R. y Kerremans, K. (2003). ''Termontography: Ontology building and the sociocognitive approach to terminology description''. Prague CIL17- conference. [ Links ]
34. Universidad de Granada (s. f.). EcoLexicon. Recuperado el 22 de febrero de 2010, de http://manila.ugr.es/visual [ Links ]
35. W3C (2001). Semantic Web Activity. Recuperado el 22 de febrero de 2010, de http://www.w3.org/2001/sw/ [ Links ]
36.Winston, M. E., Chaffin, R. y Herrmann, D. (1987). A taxonomy of part-whole relations. Cognitive Science, 11: 417-444. [ Links ]
37. Wüster, E. (1968). The Machine Tool. An Interlingual Dictionary of Basic Concepts. Londres: Technical Press. [ Links ]
38. Yeh, W. y Barsalou, L. W. (2006). The situated nature of concepts, American Journal of Psychology, 119: 349-384. [ Links ]
* Recibido: 30-01-10
Aceptado: 15-02-10
NOTES
1Este recurso terminológico es el resultado de tres proyectos de investigación: ''PuertoTerm. Ingeniería de puertos y costas: estructuración del conocimiento y generación de recursos terminológicos'' (financiado por el Ministerio de Ciencia y Tecnología, BFF2003-04720); ''Marco-Costa. Marcos de conocimiento multilingüe para la gestión integrada de las zonas costeras'' (financiado por la Junta deAndalucía, proyecto de excelencia P06-HUM-01489); y ''Ecosistema.