14
qwertyuiopasdfghjklzxcvbnmqwerty uiopasdfghjklzxcvbnmqwertyuiopasd fghjklzxcvbnmqwertyuiopasdfghjklzx cvbnmqwertyuiopasdfghjklzxcvbnmq wertyuiopasdfghjklzxcvbnmqwertyui opasdfghjklzxcvbnmqwertyuiopasdfg hjklzxcvbnmqwertyuiopasdfghjklzxc vbnmqwertyuiopasdfghjklzxcvbnmq wertyuiopasdfghjklzxcvbnmqwertyui opasdfghjklzxcvbnmqwertyuiopasdfg hjklzxcvbnmqwertyuiopasdfghjklzxc vbnmqwertyuiopasdfghjklzxcvbnmq wertyuiopasdfghjklzxcvbnmqwertyui opasdfghjklzxcvbnmqwertyuiopasdfg hjklzxcvbnmrtyuiopasdfghjklzxcvbn mqwertyuiopasdfghjklzxcvbnmqwert yuiopasdfghjklzxcvbnmqwertyuiopas dfghjklzxcvbnmqwertyuiopasdfghjklz El análisis del discurso: hacia sistemas expertos de recuperación informativa El análisis del discurso como método para la elaboración de estructuras conceptuales que alimenten sistemas de organización del conocimiento para la recuperación de información especializada dentro de un dominio temático concreto Carolina Callejo Lavado Representación y organización conceptuales del conocimiento para la recuperación de la información. Máster de Información y comunicación científica de la Universidad de Granada (UGR), curso 2014-2015.

El análisis del discurso: hacia sistemas expertos de recuperación informativa

Embed Size (px)

DESCRIPTION

El análisis del discurso como método para la elaboración de estructuras conceptuales que alimenten sistemas de organización del conocimiento para la recuperación de información especializada dentro de un dominio temático concreto.

Citation preview

Page 1: El análisis del discurso: hacia sistemas expertos de recuperación informativa

[Escribir el nombre de la compañía] | ¡Error! No hay texto con el estilo especificado en el documento.

1

qwertyuiopasdfghjklzxcvbnmqwerty

uiopasdfghjklzxcvbnmqwertyuiopasd

fghjklzxcvbnmqwertyuiopasdfghjklzx

cvbnmqwertyuiopasdfghjklzxcvbnmq

wertyuiopasdfghjklzxcvbnmqwertyui

opasdfghjklzxcvbnmqwertyuiopasdfg

hjklzxcvbnmqwertyuiopasdfghjklzxc

vbnmqwertyuiopasdfghjklzxcvbnmq

wertyuiopasdfghjklzxcvbnmqwertyui

opasdfghjklzxcvbnmqwertyuiopasdfg

hjklzxcvbnmqwertyuiopasdfghjklzxc

vbnmqwertyuiopasdfghjklzxcvbnmq

wertyuiopasdfghjklzxcvbnmqwertyui

opasdfghjklzxcvbnmqwertyuiopasdfg

hjklzxcvbnmrtyuiopasdfghjklzxcvbn

mqwertyuiopasdfghjklzxcvbnmqwert

yuiopasdfghjklzxcvbnmqwertyuiopas

dfghjklzxcvbnmqwertyuiopasdfghjklz

El análisis del discurso: hacia sistemas expertos de recuperación informativa

El análisis del discurso como método para la elaboración de estructuras conceptuales que

alimenten sistemas de organización del conocimiento para la recuperación de información especializada dentro de un dominio temático concreto

Carolina Callejo Lavado

Representación y organización conceptuales del conocimiento para la recuperación de la información.

Máster de Información y comunicación científica de la Universidad de Granada (UGR), curso 2014-2015.

Page 2: El análisis del discurso: hacia sistemas expertos de recuperación informativa

2

Índice

1. Introducción .............................................................................................................................................................................3

2. Fundamentos teóricos del método: análisis de dominio en el paradigma socio-cognitivo ..................4

3. Objetivos del método: un modelo metodológico para la construcción de estructuras conceptuales especializadas .........................................................................................................................................................................7

4. Proceso de construcción de estructuras conceptuales mediante el análisis del discurso ....................8

5. Representación del usuario en la estructura conceptual .................................................................................. 10

6. Conclusiones: hacia sistemas expertos de recuperación informativa ......................................................... 11

7. Bibliografía ............................................................................................................................................................................. 14

Page 3: El análisis del discurso: hacia sistemas expertos de recuperación informativa

3

1. Introducción

La organización y representación del conocimiento humano constituye una tradicional vía

de investigación que se enmarca en el campo de estudio de la Organización del

Conocimiento (OC o KO, por sus siglas en inglés). Desde que el hombre comenzó a registrar

la información empírica (aquella procedente de la experiencia percibida a través de los

sentidos) se ha realizado un esfuerzo continuo por representar y organizar ese

conocimiento para hacerlo accesible. Me refiero a la actividad académico-investigadora en

la organización del conocimiento para la Recuperación de Información (RI o IR, por sus

siglas en inglés), un dominio de estudio inserto en el ámbito de las Ciencias de la

Información y la Documentación (LIS, por sus siglas en inglés).

En este contexto teórico, diferentes paradigmas científicos tratan de definir la forma en

que el conocimiento humano tiene que ser representado y organizado para servir a su

recuperación informativa por parte de los usuarios interesados. La organización del

conocimiento es la base para adquirir nuevo conocimiento. Se deduce, por tanto, que esta

tarea es fundamental para la actividad investigadora, el avance de la ciencia y, por ende, el

desarrollo humano y social1.

Pero trasladar una entidad abstracta como lo es el conocimiento a algo concreto y hacerlo

accesible es una tarea difícil. Es aquí cuando entran en juego los Sistemas de Organización

del Conocimiento (SOC o KOS, por sus siglas en inglés), desarrollados con el objetivo de

estructurar y organizar formalmente el conocimiento humano.

Los sistemas de organización del conocimiento integran una serie de tecnologías

que ayudan a crear, gestionar y visualizar modelos que muestren una

perspectiva simplificada de los conceptos que forman determinado dominio y de

la estructura semántica subyacente. (Sánchez-Cuadrado, 2009)

Los sistemas de organización del conocimiento son propuestas para la

representación y organización del conocimiento en una determinada disciplina o

temática o bien propuestas universales con la finalidad de recuperar la

información de un determinado sistema. (López-Huertas, 2015: diapositiva 11)

Por tanto, el campo teórico de la organización del conocimiento encuentra su aplicación

práctica en el desarrollo de sistemas de organización del conocimiento tales como

ontologías, tesauros, encabezados de materia, clasificaciones… que pueden ser de dominio

general o especializado. Y estos sistemas constituyen la base de conocimiento de los

Sistemas de Recuperación de Información (SRI), tales como directorios, navegadores,

sistemas de búsqueda de respuestas (QA, por sus siglas en inglés), etc. De esta manera, “los

productos teóricos son las reglas para descubrir la ordenación natural del conocimiento o

para imponer una secuencia útil en el conocimiento descubierto” (Smiraglia, 2012).

1 La actividad científico-investigadora es un proceso acumulativo de obtención de conocimiento en el que el acceso a los resultados de investigación previos es vital. Pero la capacidad de recuperación informativa es también una base fundamental para el desarrollo social, no solo porque éste sea inherente al desarrollo científico, sino también porque sociedades más y mejor informadas se traduce en sociedades más evolucionadas.

Page 4: El análisis del discurso: hacia sistemas expertos de recuperación informativa

4

Pero ¿cómo representar el conocimiento y organizarlo de forma que sea accesible por parte

del usuario? Primero, mediante la representación terminológica y conceptual del dominio

(lenguaje especializado y descripción de los conceptos que caracterizan el dominio) que da

como resultado un corpus de conocimiento del dominio; segundo, mediante la organización

de este último, a través de la ordenación formal de los conceptos que definen el dominio en

una determinada estructura y el establecimiento de las relaciones semánticas entre los

conceptos que representan el dominio, lo que se traduce en una estructura conceptual del

dominio.

El objetivo de este trabajo es presentar las virtudes del análisis del discurso como método

para la elaboración de estructuras conceptuales que alimenten sistemas de organización

del conocimiento para la recuperación de información especializada dentro de un dominio

temático concreto. En otras palabras, defender que el análisis del discurso es un método

eficaz para representar y organizar el conocimiento de un dominio concreto de forma que

sirva al desarrollo de sistemas expertos de recuperación de información.

A partir de la revisión bibliográfica se describen los fundamentos teóricos y objetivos del

método, se explica el proceso de construcción de estructuras conceptuales mediante el

análisis del discurso, se realizan propuestas específicas para incorporar la representación

del usuario a la estructura conceptual resultante y se explica por qué el análisis del discurso

es un prometedor modelo metodológico para la elaboración de estructuras conceptuales

que alimenten sistemas de organización del conocimiento para la recuperación de

información especializada.

2. Fundamentos teóricos del método: análisis de dominio en el

paradigma socio-cognitivo

El análisis del discurso es un método alternativo a los enfoques tradicionales y dominantes

en el ámbito de la organización del conocimiento para la recuperación de información.

Estos enfoques han evolucionado desde un paradigma físico (modelo objetivo) de la

organización del conocimiento, hacia un paradigma cognitivo (modelo subjetivo) e incluso

socio-cognitivo (constructivista).

En el primero, la elaboración de las estructuras conceptuales se sustenta exclusivamente en

la representación del conocimiento objetivo de los documentos (los textos son la base del

diseño y construcción de las estructuras) sin tener en cuenta a los usuarios que recuperarán

la información, con las limitaciones y dificultades que esto supone para responder al

objetivo de los sistemas recuperación de información: proporcionar al usuario una

respuesta relevante a su consulta.

El enfoque cognitivo o paradigma “orientado por el usuario”, que comenzó a ganar

popularidad a partir de los años 70, introduce al usuario como novedad dando lugar a una

organización del conocimiento más cercana al usuario final de los sistemas de recuperación

informativa y basada en estudios empíricos de los usuarios (Hjørland, 2008: 13). En este

Page 5: El análisis del discurso: hacia sistemas expertos de recuperación informativa

5

modelo los textos son solo una de las bases para la elaboración de estructuras

conceptuales, que se completa con el usuario como segundo pilar básico de la misma.

Por último, el paradigma socio-cognitivo introduce, además de los textos y los usuarios, las

influencias de su esfera socio-laboral como elemento activo del modelo, que “evolucionó a

partir de la corriente cognitiva hacia el ámbito de lo social” y “es una de las últimas grandes

corrientes de pensamiento” en el campo de la organización del conocimiento (López-

Huertas, 2015: diapositiva 38).

En cualquiera de los casos, el proceso de representación y organización conceptuales del

conocimiento se fundamenta en la teoría del concepto que algunos sostienen que es el

elemento más básico o primario en el universo del conocimiento (Van den Heuvel;

Smiraglia, 2010; Szostak, 2011 en Smiraglia, 2012). El concepto es aquí entendido como una

unidad de conocimiento que comprende expresiones verificables y necesarias sobre el

referente, de manera que se convierte en la expresión relevante y representativa de un

determinado dominio a través de la definición de los conceptos que lo integran y de las

relaciones existentes entre los mismos.

Los conceptos poseen una serie de características que se derivan de su referente y que se

identifican con las categorías potenciales (cualidades de los conceptos) para representar el

conocimiento de un dominio temático. De esta manera, las estructuras conceptuales

resultantes del proceso de representación y organización del conocimiento parten de los

conceptos definitorios de una especialidad (dominio temático) para posteriormente

identificar las categorías que los describen y las relaciones semánticas que se dan entre los

mismos, con el objetivo final de establecer un orden jerárquico entre las categorías (en

función de la relevancia de las mismas en los textos) y elaborar una estructura conceptual

que represente y organice formalmente el conocimiento de esa especialidad.

El análisis del discurso como método para la elaboración de estas estructuras conceptuales

que representan el conocimiento de un determinado dominio, se enmarca dentro de la

principal vía de investigación para la organización del conocimiento: el análisis de dominio.

El análisis de dominio es un enfoque teórico formulado inicialmente por Hjørland y

Albrechtsen en la década de los 90 como una alternativa a la visión cognitiva dominante en

las Ciencias de la Información y la Documentación (Hjørland, 2008: 16).

Este enfoque teórico se sustenta en el “estudio de los dominios del conocimiento o las

comunidades de pensamiento o discursivas” (Hjørland, 2004: 17) como modelo y referente

para la elaboración de estructuras conceptuales especializadas. Parte de la idea de que la

representación de un documento se realiza para permitir al usuario realizar

discriminaciones significativas, por lo que el documento debería ser mirado con los ojos de

potenciales usuarios (Hjørland, 2008: 17).

Si esos potenciales usuarios están influidos no solo por aspectos objetivos y subjetivos, sino

también por aspectos sociales y culturales, resulta lógico que estas particularidades sean

también incorporadas a la representación y organización formal del conocimiento. De esta

manera, se obtendrán estructuras conceptuales más complejas, enriquecidas y fieles a la

Page 6: El análisis del discurso: hacia sistemas expertos de recuperación informativa

6

ordenación natural del conocimiento y, por ende, se desarrollarán sistemas de organización

del conocimiento y sistemas de recuperación de información más eficaces.

El conocimiento del dominio temático en cuestión se convierte así en la unidad de análisis

para la representación y organización del conocimiento especializado según el análisis de

dominio. Con el objetivo de obtener un conocimiento multidisciplinar y enriquecido del

dominio, los autores de esta vía teórica proponen once métodos para estudiar los dominios

desde una perspectiva socio-cognitiva (Hjørland, 2004: 17):

1. Producción de guías bibliográficas.

2. Producción de clasificaciones especializadas.

3. Indexación y recuperación de información especializada.

4. Estudios empíricos de los usuarios en los diferentes campos.

5. Estudios bibliométricos.

6. Estudios históricos de intercambio de información.

7. Estudios del documento y de género.

8. Estudios epistemológicos y críticos.

9. Estudios terminológicos, idiomas para fines especiales (IFE) y estudios del discurso.

10. Estudios de las estructuras e instituciones de la comunicación científica.

11. Análisis de dominio en la cognición profesional, el conocimiento experto y la

Inteligencia Artificial (IA).

Estos once métodos pueden ser aplicados por separado, aunque la idea del análisis de

dominio es la utilización conjunta de más de uno en el mismo dominio para proporcionar

una comprensión más profunda de la dinámica subyacente (Hjørland, 2004: 17-18).

El resultado del análisis de dominio es la descripción y el conocimiento de los dominios

temáticos en base a tres bases de teorías y conceptos que constituyen cada dominio

(Hjørland y Hartel, 2003 en López-Huertas, 2015: diapositiva 50):

1. Teorías ontológicas sobre objetos de la actividad humana.

2. Teorías epistemológicas sobre el conocimiento y las formas de obtenerlo.

3. Teorías sociológicas sobre los grupos de personas que se relacionan con los objetos.

Así, las interacciones entre los factores ontológicos, epistemológicos y sociales influyen en

el desarrollo de los campos de conocimiento (dominios temáticos) y deben ser, por tanto,

tenidos en cuenta a la hora de representar y organizar el conocimiento en un determinado

dominio.

El análisis de dominio es una perspectiva teórico-práctica muy influyente en el ámbito de la

organización del conocimiento para la recuperación de información, que ha ido ganando

terreno durante el último cuarto de siglo porque se ha pasado de la búsqueda de soluciones

universalmente aceptables, a enfoques centrados en un área concreta (Smiraglia, 2012).

Éste es un modelo teórico prometedor para entender el discurso científico y

potencialmente una herramienta muy útil para proyectar el mapa estructural del discurso

científico (Mai, 2004 en López-Huertas, 2015: diapositiva 60).

Page 7: El análisis del discurso: hacia sistemas expertos de recuperación informativa

7

El análisis del discurso puede ser entendido, por tanto, como sub-enfoque teórico dentro

del análisis de dominio del que toma (1) el estudio y análisis del discurso como herramienta

para la identificación de las categorías que representan e identifican el dominio y el peso o

relevancia de éstas en los textos y (2) la identificación de la relevancia del contenido de las

definiciones para establecer las categorías y su orden basado en una jerarquía.

La diferencia entre el análisis de dominio y el análisis del discurso es que en el primero la

unidad de análisis para la representación y organización del conocimiento es el dominio

temático, mientras que en el segundo la unidad de análisis es el concepto (el conjunto de

conceptos con los que se identifica un dominio temático, sus categorías y las relaciones

semánticas entre éstas), que se expresa formalmente mediante un descriptor.

3. Objetivos del método: un modelo metodológico para la construcción

de estructuras conceptuales especializadas

El análisis del discurso en el campo de la organización del conocimiento para la

recuperación de información pretende dar respuesta a la complejidad inherente a la tarea

de representar y organizar el conocimiento humano, que crece de manera exponencial y

que debe ser representado en entornos contextualizados, tal y como existe en la realidad.

Su principal objetivo es el de servir de base metodológica para la construcción sistemática

de estructuras conceptuales dentro de un dominio determinado a partir del estudio y el

análisis de los propios textos especializados pertenecientes a ese dominio. Este método se

fundamente en el análisis de las definiciones de los conceptos del dominio dadas por los

expertos para extraer las categorías.

Los diccionarios y las enciclopedias especializados elaborados por expertos en cada materia

se convierten así en la fuente de información (contenido) textual para identificar los

conceptos definitorios del dominio y las relaciones semánticas entre los mismos,

clasificarlos en categorías y determinar la relevancia de éstas y su ordenación en la

estructura.

De esta forma, la estructura conceptual resultante incorporaría tanto el conocimiento

objetivo de los documentos, como el conocimiento subjetivo de sus autores (también

presente en los documentos y que se desprende de las definiciones de los conceptos que

realizan cada uno de los autores). A esto hay que añadir una dimensión más, aún poco

desarrollada en la teoría de este modelo, el usuario final del sistema de recuperación de

información. Esto aportaría una dimensión socio-cultural al sistema que se traduciría en la

extracción de nuevas categorías que no están presentes en los documentos pero que son

relevantes, porque enriquecen las estructuras conceptuales resultantes y ayudan al

desarrollo de sistemas de recuperación de información que respondan de forma eficaz a las

necesidades informativas de los usuarios que van a utilizarlo.

Se pretende así objetivar y automatizar el método para la construcción de estructuras

conceptuales especializadas que sirvan a la recuperación de información inteligente

mediante sistemas expertos de recuperación informativa.

Page 8: El análisis del discurso: hacia sistemas expertos de recuperación informativa

8

4. Proceso de construcción de estructuras conceptuales mediante el

análisis del discurso2

Para ilustrar cómo el análisis del discurso puede contribuir a la tarea anterior, se me ocurre

un escenario en el que ha de elaborarse una estructura conceptual perteneciente al

dominio de la “epidemiología”, con el objetivo final de desarrollar un sistema de

organización del conocimiento que pueda servir de base a un sistema experto para la

recuperación de información especializada. La epidemiología es la disciplina médica

encargada del estudio de las enfermedades humanas, esto es, su distribución poblacional,

su frecuencia de aparición y los factores determinantes de su desarrollo, con la finalidad de

predecir y controlar las enfermedades en las sociedades humanas.

En este contexto, sería útil el desarrollo de un sistema experto que pueda ser empleado por

los científicos que investigan en esta rama médica (usuarios finales del sistema) para la

recuperación inteligente de información relevante.

¿Y qué información es relevante para los epidemiólogos? Para averiguarlo, primero hay que

identificar los conceptos que van a constituir el punto de partida del análisis del discurso

para seleccionar después las definiciones de los mismos que realizan diferentes autores en

textos especializados (enciclopedias y diccionarios). En este ejemplo, el concepto como

unidad de análisis del discurso que define al dominio temático es evidente: cada una de las

enfermedades humanas. Es decir, los conceptos que van a constituir el objeto de análisis del

discurso y que se expresan formalmente mediante descriptores son: cáncer, diabetes,

obesidad…y así cada una de las enfermedades médicas registradas. Para cada uno de estos

descriptores se crea un texto que constituye la base del análisis.

Para establecer las categorías (características) de los conceptos e identificar las relaciones

semánticas y jerárquicas entre las mismas (la relevancia de cada una dentro de la

estructura) acudiremos a las definiciones dadas por expertos en la materia presentes en

textos especializados como lo son las enciclopedias médicas. Este es el primer paso en el

análisis del discurso, seleccionar los textos especializados que van a constituir la base

informativa para la descripción de los conceptos, a partir de las definiciones que diferentes

autores realizan de los mismos.

En este caso las definiciones3 de cada uno de los conceptos, que son cada una de las

enfermedades, dadas en las enciclopedias contendrán diferentes elementos textuales

relevantes para representar cada uno de los conceptos “cáncer”, “diabetes”, “obesidad”,

etc. en el dominio de la epidemiología. Y estos elementos textuales son los que sugerirán

las categorías y su relevancia dentro de la estructura conceptual. Este es el segundo paso

en el proceso de elaboración de estructuras conceptuales mediante el análisis del discurso,

2 La información relativa a este apartado sobre el proceso de construcción de estructuras conceptuales se ha extraído de López-Huertas, 2015: dispositivas 127-140. 3 No se incluyen aquí las definiciones del ejemplo por la imposibilidad de acceso a estas enciclopedias médicas especializadas y porque esta tarea desbordaría los límites del trabajo. Se considera que la descripción del proceso de análisis del discurso es suficiente para ilustrar la aplicabilidad del método en la práctica.

Page 9: El análisis del discurso: hacia sistemas expertos de recuperación informativa

9

señalar los elementos textuales relevantes contenidos en las diferentes definiciones de

cada uno de los conceptos.

En el ejemplo que nos ocupa, tras analizar diversas enciclopedias médicas seguramente

obtendríamos elementos textuales relevantes muy similares a los recogidos en la siguiente

tabla, y las categorías se establecerían a partir de esos elementos textuales (el nombre de

las categorías viene propuesto directamente por los propios textos).

Elementos textuales relevantes Identificación de categorías

Exceso de grasas Causa

Consumo de alcohol Factor de riesgo

Tabaquismo Factor de riesgo

Sedentarismo Factor de riesgo

IMC Prueba diagnóstica

Medida de la circunferencia de la cintura Prueba diagnóstica

Cambios en el estilo de vida Tratamiento

Fármacos Tratamiento

Riesgos para la salud Tratamiento

El 13% de las personas son obesas Prevalencia

Estas categorías definitorias de las enfermedades (los conceptos) se ampliarían muchísimo

en la realidad (factores de riesgo, procesos biológicos, origen, síntomas, tratamiento,

incidencia, prevalencia, grupos de riesgo, pronóstico, etc.), pero baste con el ejemplo

anterior para entender cómo se realiza la identificación de las categorías en el análisis del

discurso (tercer paso del proceso de elaboración de la estructura conceptual).

Una vez identificadas, hay que evaluar las categorías para determinar su importancia dentro

de la estructura conceptual (cálculo del índice de relevancia, cuarto paso) y organizarlas

según un orden jerárquico (ordenación de las categorías según el índice de relevancia,

quinto paso). “El orden en que deben aparecer las categorías en la estructura y los criterios

de organización de las mismas es una decisión muy importante en la elaboración de una

estructura conceptual” (López-Huertas, 2015: diapositiva 136).

La relevancia de las categorías se convierte en el criterio de ordenación de los conceptos en

la estructura conceptual y viene dada por el número de veces que cada una de ellas aparece

en las definiciones de las enciclopedias. Durante la ordenación de las categorías éstas se

agrupan en función de su relevancia pero también se establecen grupos de categorías en

función de su semejanza.

Llegados a este punto habrá que realizar el proceso anterior con cada uno de los conceptos

del dominio de la epidemiología, esto es, con cada una de las enfermedades humanas4.

El último paso sería la propuesta de una estructura conceptual concreta para organizar y

representar el conocimiento del dominio dado con vistas al desarrollo de sistemas de

organización del conocimiento para la recuperación de información.

4 Esta sería una tarea ardua y compleja en la práctica y su mención aquí solo sirve a modo de ejemplo ilustrativo.

Page 10: El análisis del discurso: hacia sistemas expertos de recuperación informativa

10

Por tanto, los pasos a seguir para la elaboración de estructuras conceptuales dentro de un

dominio temático mediante el análisis del discurso son:

1. Selección de textos especializados.

2. Identificación de elementos textuales relevantes.

3. Establecimiento de las categorías (sugeridas por los propios textos).

4. Evaluación de la relevancia de las categorías.

5. Ordenación de las categorías en la estructura.

6. Repetición del proceso para cada concepto del dominio.

7. Propuesta de la estructura conceptual.

5. Representación del usuario en la estructura conceptual

Para obtener una estructura conceptual completa y enriquecida, digna de representar la

complejidad de un dominio temático, es vital que se represente al usuario dentro de la

misma, ya que al final será éste quien utilice los sistemas de recuperación de información

para los que ha sido desarrollada la estructura conceptual.

La representación del usuario en el marco del análisis del discurso queda excluida si solo se

tienen en cuenta las categorías sugeridas por los textos (que reflejan tanto el conocimiento

objetivo como el conocimiento subjetivo de los autores). Se me ocurre, por tanto, que una

forma de incorporar la representación del usuario en la elaboración de estructuras

conceptuales es considerar también cuestiones ajenas a los contenidos de los textos

especializados que son la base del análisis del discurso.

Me refiero a cuestiones que no están presentes en los textos pero que son relevantes para

los usuarios finales del sistema y que responderán, por tanto, a sus necesidades de

información. En el ejemplo anteriormente expuesto sobre el desarrollo de una estructura

conceptual para el dominio temático de la epidemiología, estas cuestiones ajenas a los

textos pero relevantes a los usuarios del sistema (investigadores de esta rama médica)

abarcarían, por ejemplo, el impacto psicológico de la enfermedad, su concepción social, el

control de la enfermedad que llevan a cabo las administraciones públicas, la inversión en

I+D realizada para su estudio, etc.

Esto se traduciría, en el marco del análisis del discurso, en la identificación de nuevas

categorías y su incorporación a la estructura conceptual, que incluiría así la representación

del usuario final del sistema. Pero ¿cómo identificar categorías que no están presentes en el

texto? ¿Cómo saber qué información “invisible” es relevante para los usuarios? Este

conocimiento se podría obtener con métodos de investigación cuantitativos como sondeos

a potenciales usuarios del sistema sobre sus necesidades informativas o con métodos

cualitativos, como entrevistas a estos usuarios estándar del sistema o grupos de discusión.

De esta manera, el análisis del discurso podría convertirse en un método para la elaboración

sistemática y automatizada de estructuras conceptuales para la representación y la

ordenación del conocimiento en los sistemas de organización del conocimiento. Y estos

últimos podrían servir de base de conocimiento a los sistemas de recuperación de

Page 11: El análisis del discurso: hacia sistemas expertos de recuperación informativa

11

información especializada, esto es, a sistemas expertos. Esto es lo que abordaremos a

continuación.

6. Conclusiones: hacia sistemas expertos de recuperación informativa

Los fundamentos del análisis del discurso y el proceso aquí descrito para la construcción de

estructuras conceptuales especializadas a partir de los propios textos pero incorporando

también la representación del usuario, dan como resultado estructuras conceptuales

contextualizadas, caracterizadas por una elevada representatividad conceptual y por la

potencial capacidad para establecer relaciones semánticas entre sus conceptos (López-

Huertas, 2015: dispositiva 37).

Esto se traduce en una precisión y exhaustividad elevadas en la representación y

organización del conocimiento de un dominio, ya que la realidad también es contextual y

rica a nivel conceptual y semántico. Por tanto, un sistema de organización del conocimiento

basado en una estructura conceptual de este tipo (la que proporciona el análisis del

discurso como modelo metodológico) dispone de toda la información relevante (la de los

textos y la de los usuarios) de cada concepto y su entramado semántico.

Por esto, creo que el análisis de discurso constituye una potencial vía de investigación para

el desarrollo de sistemas expertos. Los sistemas expertos son sistemas para la recuperación

inteligente de información especializada que reproducen el proceso intelectual de un

experto humano en un dominio concreto y asisten a los usuarios durante el proceso de

recuperación informativa.

Los sistemas expertos, un producto de la inteligencia artificial, “pueden considerarse como

intermediarios entre el experto humano, que transmite su conocimiento al sistema, y el

usuario que lo utiliza para resolver un problema con la eficacia del especialista. El sistema

experto utilizará para ello el conocimiento que tenga almacenado y algunos métodos de

inferencia” (Sámper).

Estos sistemas están diseñados para resolver problemas concretos y facilitar la toma de

decisiones dentro de un dominio determinado. Por ejemplo, se han desarrollado sistemas

expertos para el diagnóstico médico que se han convertido en una herramienta de trabajo

de los profesionales sanitarios porque hacen más eficiente el proceso de diagnóstico al

economizar tiempo y recursos.

¿Cómo funcionaría un sistema de este tipo? Siguiendo a María José López-Huertas (López-

Huertas, 1999) un sistema experto basado en una estructura conceptual inferida a partir del

análisis del discurso funcionaría como un sistema de búsqueda a dos niveles, con un modo

de búsqueda y un modo de pregunta.

En el primero el sistema experto devolvería la información relativa a una consulta concreta

planteada por el usuario, que representa una necesidad informativa específica. Por ejemplo,

siguiendo el ejemplo anteriormente planteado sobre el dominio de la epidemiología,

podríamos realizar al sistema la siguiente consulta: “factores de riesgo ambiental del

Page 12: El análisis del discurso: hacia sistemas expertos de recuperación informativa

12

melanoma”. Es este caso, el procesador funcionaría de la siguiente manera: extraería una

lista de todos los posibles factores de riesgo ambiental en el desarrollo de enfermedades

(productos tóxicos, rayos ultravioleta, etc.) y seleccionaría aquellos relacionados con el

melanoma. O bien, extraería una lista de todos los factores de riesgo (no solo ambiental,

sino también genético o de otro tipo) del melanoma y seleccionaría solo aquellos que le

interesan, los ambientales. En cualquiera de los dos casos devolvería al usuario la

información relativa a la consulta planteada.

Como vemos, ésta podría ser una típica expresión booleana: “factores de riesgo ambiental

y melanoma”. Una de las características de un sistema experto como el aquí referido es que

evita el uso de operadores booleanos (López-Huertas, 1999).

Si realizáramos la pregunta anterior en un buscador, por ejemplo, obtendríamos una serie

de documentos (ordenados en función de una relevancia establecida según una serie de

criterios) que contendrían la cadena de caracteres que constituye la consulta. Porque así es

precisamente como un buscador al uso “entiende” la consulta que realiza el usuario, de

manera que le devuelve documentos que incluyen esas dos cadenas de caracteres (es decir,

documentos que contienen “factores de riesgo ambiental” y que también contienen

“melanoma”) sin importar las relaciones entre las mismas.

En este caso el sistema de recuperación de información no sabe (ni le importa) si “factores

ambientales” es una característica (cualidad, categoría) referente a “melanoma”, algo que

un sistema experto sí conoce. Parece lógico, por tanto, que en el segundo caso las

necesidades informativas de los usuarios se verán más satisfechas.

En el segundo nivel de búsqueda, el modo de pregunta, la consulta planteada por el usuario

representa una necesidad informativa imprecisa, es decir, quiere recuperar una información

concreta sobre un concepto o conceptos que él no conoce, por ejemplo, cuáles son los

factores de riesgo ambiental relacionados con los tumores malignos de la piel. En este caso

el usuario quiere saber cuáles son los conceptos (cada uno de los factores de riesgo

ambiental) que responden a esas características (que se relacionan con el desarrollo de

tumores malignos de piel). Para ello, realizaría la siguiente consulta al sistema “tumores

malignos de la piel” y en la pantalla aparecerían todos los tipos de factores ambientales

relacionados con la aparición de tumores malignos de piel: contacto directo con productos

tóxicos, exposición a la luz ultravioleta, herencia genética, etc.

En un sistema experto para la recuperación inteligente de información el sistema

mantendría un diálogo continuo con el usuario y le asistiría en todo momento durante el

proceso de búsqueda, pasando del modo búsqueda al modo pregunta y viceversa cuando

así fuese necesario, por lo que va refinando la búsqueda progresivamente hasta dar con la

respuesta a la necesidad informativa del usuario.

“Se trata de una ayuda que lo conduce (al usuario) de forma inteligente a navegar por la

estructura del sistema hasta que tiene claro lo que busca y puede expresarlo

adecuadamente en la frase de búsqueda” (López-Huertas, 1999).

Page 13: El análisis del discurso: hacia sistemas expertos de recuperación informativa

13

Para concluir, vemos que el análisis del discurso como modelo metodológico para la

construcción de estructuras conceptuales es una vía de investigación académica

prometedora para el desarrollo de sistemas de organización del conocimiento más

sofisticados y cercanos a la complejidad inherente a la realidad y a la forma de expresarla a

través del lenguaje.

El análisis del discurso emplea métodos cualitativos y cuantitativos. El estudio y análisis de

los textos especializados que sirven de base son cualitativos, mientras que la decisión sobre

la relevancia de las categorías referentes a cada concepto es cuantitativa (el número de

veces que cada categoría o característica aparece en el texto). El resultado de aplicar este

método a la elaboración de estructuras conceptuales son sistemas de organización del

conocimiento más enriquecidos y contextualizados, más cercanos a la ordenación natural

del conocimiento.

Estos sistemas proporcionarían, a su vez, una base más exhaustiva y precisa para el

desarrollo de sistemas de recuperación inteligente de información, sistemas expertos

pensados para dominios temáticos concretos cuyos usuarios necesitan recuperar

información especializada.

Page 14: El análisis del discurso: hacia sistemas expertos de recuperación informativa

14

7. Bibliografía

HJØRLAND, Birger. “Domain analysis: a socio-cognitive orientation for information science

research” [en línea]. Bulletin of the American Society for Information Science. 2004, vol. 30,

no. 3, págs. 17-21. Disponible en

<http://onlinelibrary.wiley.com/doi/10.1002/bult.312/abstract>. [Consulta: 20 marzo 2015].

Traducción al español disponible en

<http://www.academia.edu/6589249/An%C3%A1lisis_de_dominio_Por_Birger_Hjorland>.

HJØRLAND, Birger. “What is Knowledge Organization (KO)?” [en línea]. Knowledge

Organization. International Journal devoted to Concept Theory, Classification, Indexing and

Knowledge Representation. 2008, vol. 35, no.2-3, págs. 86-101. Disponible en

<http://arizona.openrepository.com/arizona/handle/10150/106183>. [Consulta: 20 marzo

2015].

LÓPEZ-HUERTAS, María José. Representación y organización conceptuales del conocimiento

para la recuperación de la información [presentación Power Point]. 2015. Material de estudio

de la asignatura en el máster de Información y Comunicación científica de la Universidad de

Granada.

LÓPEZ-HUERTAS, María José. Potencialidad evolutiva del tesauro: Hacia una base de

conocimiento experto [en línea]. Granada: 1999, págs. 133-140. Ponencia (Actas de

congresos). Disponible en <dialnet.unirioja.es/descarga/articulo/1300435.pdf>. [Consulta: 20

marzo 2015].

SÁMPER MÁRQUEZ, Juan José. Introducción a los sistemas expertos [en línea]. Red científica

(Ciencia, Tecnología y Pensamiento). Disponible en

<http://www.redcientifica.com/doc/doc199908210001.html>. [Consulta: 22 marzo 2015].

SÁNCHEZ-CUADRADO, Sonia; MORATO, Jorge. Organización del conocimiento, Sistema de ||

KOS [en línea]. Sánchez-Cuadrado, Sonia: 2009. Recurso electrónico. Disponible en

<http://glossarium.bitrum.unileon.es/Home/organizacion-del-conocimiento-sistema-de>.

[Consulta: 20 marzo 2015].

SMIRAGLIA, Richard P. “Knowledge organization: some trends in an emergent domain” [en

línea]. El professional de la información. 2012, vol. 21, no. 3. Disponible en

<http://recyt.fecyt.es/index.php/EPI/article/view/epi.2012.may.01/17913>. [Consulta: 20

marzo 2015]. Traducción al español disponible en

<http://www.elprofesionaldelainformacion.com/contenidos/2012/mayo/01_esp.pdf>.