15
Indicadores Web sobre utilización de ontologías Vicente Palacios 1 , Jorge Morato 1 , Juan Lloréns 1 , José Antonio Moreiro 2 [email protected] , [email protected] , [email protected] ; [email protected] 1 Departamento de Informática, Universidad Carlos III de Madrid, Escuela Politécnica Superior, Av. Universidad 30 - 28911 Leganes (Madrid), España. 2 Departamento de biblioteconomía y documentación, Universidad Carlos III de Madrid, C/ Madrid, 126 - 28903 Getafe (Madrid), España. Resumen: Las ontologías son una pieza clave para el desarrollo de la Web Semántica. La irrupción de las ontologías en Internet es un fenómeno reciente pero de trascendental importancia para la transmisión y almacenamiento de datos en el ámbito tecnológico y empresarial. La novedad de estas representaciones conjuntamente con cierta disparidad en su expresión y la incertidumbre en su grado de implantación debido a la escasez de estudios sobre el tema, provoca cierta desorientación en empresas que pretenden incorporar estas tecnologías. El presente estudio realiza una evaluación del desarrollo y uso de las ontologías, mostrando una visión general desde distintos puntos de vista incluyendo temática, países con mayor uso y ámbitos de aplicación, tanto en entidades dedicadas a la investigación como en empresas. El objetivo es proporcionar al investigador en este campo, un punto de partida para conocer el grado de implantación de los distintos tipos de documentos semánticos en Internet. Palabras clave: Ontología; indicadores web; cibermetría; web semántica; documento semántico 1. Introducción Son varias las definiciones del término ontología propuestas en la literatura científica. Gruber (Gruber, 1993) definió ontología como “especificación explícita de una conceptualización”, la cual se convirtió en la más aceptada por la comunidad científica hasta que fue completada por Suder (Studer; Benjamins; Fensel, 1998) como “especificación explícita y formal de una conceptualización compartida”. Nicola Guarino (Guarino, 1998) complementó la propuesta de Studer, definiendo ontología como “teoría lógica que da cuenta del significado intencional de un vocabulario formal, es decir, de su compromiso ontológico hacia una

Indicadores Web sobre utilizaci'on de ontologies

  • Upload
    uc3m

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Indicadores Web sobre utilización de

ontologías

Vicente Palacios1, Jorge Morato

1, Juan Lloréns

1, José Antonio Moreiro

2

[email protected], [email protected], [email protected];

[email protected]

1Departamento de Informática, Universidad Carlos III de Madrid, Escuela Politécnica

Superior, Av. Universidad 30 - 28911 Leganes (Madrid), España. 2Departamento de biblioteconomía y documentación, Universidad Carlos III de Madrid,

C/ Madrid, 126 - 28903 Getafe (Madrid), España.

Resumen: Las ontologías son una pieza clave para el desarrollo de la Web

Semántica. La irrupción de las ontologías en Internet es un fenómeno reciente

pero de trascendental importancia para la transmisión y almacenamiento de

datos en el ámbito tecnológico y empresarial. La novedad de estas

representaciones conjuntamente con cierta disparidad en su expresión y la

incertidumbre en su grado de implantación debido a la escasez de estudios

sobre el tema, provoca cierta desorientación en empresas que pretenden

incorporar estas tecnologías. El presente estudio realiza una evaluación del

desarrollo y uso de las ontologías, mostrando una visión general desde distintos

puntos de vista incluyendo temática, países con mayor uso y ámbitos de

aplicación, tanto en entidades dedicadas a la investigación como en empresas.

El objetivo es proporcionar al investigador en este campo, un punto de partida

para conocer el grado de implantación de los distintos tipos de documentos

semánticos en Internet.

Palabras clave: Ontología; indicadores web; cibermetría; web semántica; documento

semántico

1. Introducción

Son varias las definiciones del término ontología propuestas en la literatura

científica. Gruber (Gruber, 1993) definió ontología como “especificación explícita de

una conceptualización”, la cual se convirtió en la más aceptada por la comunidad

científica hasta que fue completada por Suder (Studer; Benjamins; Fensel, 1998)

como “especificación explícita y formal de una conceptualización compartida”.

Nicola Guarino (Guarino, 1998) complementó la propuesta de Studer, definiendo

ontología como “teoría lógica que da cuenta del significado intencional de un

vocabulario formal, es decir, de su compromiso ontológico hacia una

conceptualización particular del mundo”. Guarino define, por tanto, ontología como

teoría lógica que aporta la semántica a un conjunto de términos del Universo del

Discurso, según la interpretación que su creador haga de la realidad.

Siendo esta la definición aceptada por los autores, debe tenerse en cuenta cómo

(Corcho; Fernández-López; Gómez-Pérez, 2003) ponen de manifiesto que, en la

práctica, existen distintos significados atribuidos al término ontología; la

heterogeneidad de objetivos y uso en áreas como la gestión del conocimiento,

procesamiento del lenguaje natural, comercio electrónico, Web, etc., ha propiciado las

acepciones aplicadas al término ontología.

Una de las principales ventajas que proporciona el uso de ontologías es la

potenciación de la reusabilidad. Esta propiedad permite la generación de nuevos

recursos basados en los existentes. En el caso de las ontologías, se facilita, por un

lado, la representación del conocimiento que puede ser reutilizado en el desarrollo de

distintos sistemas y, por otro, la interoperabilidad de los distintos sistemas, de acuerdo

con la representación consensuada del conocimiento.

En los últimos años, numerosas empresas tratan de potenciar técnicas de

reutilización de aplicaciones, desde el punto de vista tecnológico y más ampliamente

desde el conocimiento en general. Habiendo expuesto las ventajas que proporciona el

uso de ontologías, como base para representación de conocimiento reusable y

compatible; parece lógico pensar que las iniciativas destinadas a fomentar la

reusabilidad estén haciendo uso de las ontologías como núcleo para el desarrollo de

sistemas y representación del conocimiento.

En el presente artículo se aplican técnicas cibermétricas (OCLC, 2003; Dhyani,

2002) para el análisis cuantitativo de los documentos semánticos y sus procesos de

comunicación en Internet. Para ello se seleccionarán y estudiarán diversos indicadores

Web de la sociedad de la información, observando su posible impacto en I+D. Los

indicadores en los que se centra el estudio son relativos a la infraestructura

(cuantificación de sites y dominios) y al tamaño relativo de éstos. Por último, se

contemplan algunos factores cualitativos como son las temáticas y namespaces en los

documentos. Incluir breve introducción al campo de la cibermetría?

2. Objetivos

El objetivo del presente estudio es realizar un estudio exploratorio del uso de las

ontologías, que permita analizar y evaluar su popularidad a distintos niveles y en

distintas entidades.

Más concretamente, los objetivos específicos a alcanzar son:

Evaluar el uso de ontologías por países, con el objetivo de establecer qué

países desarrollan y utilizan más este tipo de modelos. Se realizará una

preselección de los países de acuerdo con su inversión en I+D y educación,

como aquellos que más están potenciando y desarrollando la gestión del

conocimiento.

Evaluar los países que albergan los servidores con mayor número de

documentos semánticos. El objetivo en este caso, es establecer qué países

están llevando a cabo las iniciativas más importantes en este campo y

comprobar si coinciden con los que más utilizan este tipo de modelos,

resultado del objetivo anterior.

Evaluar cuáles son los ámbitos de aplicación más comunes de los

documentos semánticos. El objetivo es establecer para qué se están

utilizando y en qué proporción.

Evaluar el uso y desarrollo de ontologías en el ámbito de las universidades

españolas, incluyendo el Consejo Superior de Investigaciones Científicas. El

objetivo es establecer qué universidades están trabajando más activamente

en el desarrollo y uso de documentos semánticos. Se realizará una

preselección de universidades de acuerdo con el número de alumnos

matriculados, y también se incluirá la Universidad Carlos III de Madrid, por

ser el ámbito del que parte este estudio.

Evaluar el uso y desarrollo de ontologías en el ámbito empresarial español.

El objetivo es establecer si las empresas más importantes están haciendo uso

de ontologías. Se realizará una selección de las empresas con mayor

facturación y se evaluará el número de documentos semánticos de cada una.

Para finalizar, se analizarán las actividades de las empresas, con el fin de

establecer una clasificación por sectores de las mismas.

3. Propuesta metodológica

Para alcanzar los objetivos de la presente evaluación, se propone el método

expuesto a continuación y que se sintetiza de la siguiente forma:

1. Evaluación del uso de ontologías en países con mayor inversión en I+D y

educación:

a. Obtener el conjunto de países con mayor inversión en conocimiento. A

partir del Factbook 2005 publicado por la OCDE (OCDE: Organización

para la Cooperación Económica y el Desarrollo, 2005), se generará un

listado con los 25 países con mayor inversión en I+D y en educación

superior. Para hacerlo comparable, el indicador se calculará de acuerdo

con el PIB de cada país.

b. Para cada país del listado anterior, se obtendrá el ccTLD (Dominio

Superior de País) correspondiente, según la norma ISO-3166-1 (ISO:

International Organization for Standarization, 1997).

c. Restringiendo la consulta por el ccTLD, se obtendrá el número de

documentos semánticos de cada país, haciendo uso del buscador

Swoogle (Swoogle, 2005).

d. Mostrar el conjunto de países, ordenados por número de documentos

semánticos.

2. Evaluación del país de origen de los 25 servidores con mayor número de

documentos semánticos:

a. Obtener el conjunto de servidores Web con mayor número de

documentos semánticos, partiendo de la información estadística

facilitada por Swoogle.

b. Acceder a cada servidor para averiguar el país donde está situado.

c. Representar el conjunto de países, ordenados por el valor total de

documentos semánticos.

3. Evaluación de las temáticas más comunes en el uso de ontologías.

a. Obtener el conjunto de servidores Web con mayor número de

documentos semánticos, partiendo de la información estadística

facilitada por Swoogle.

b. Agrupar por temática los distintos servidores.

c. Representar el agregado de documentos semánticos por tema.

4. Evaluación del uso y desarrollo de ontologías en las universidades españolas.

a. Obtener el conjunto de universidades con mayor número de alumnos

matriculados, a partir de los datos del INE (INE: Instituto Nacional de

Estadística, 2005). Se ha incluido, por su importancia en el ámbito de la

investigación, al CSIC: Consejo Superior de Investigaciones

Científicas).

b. Consultar el número de documentos semánticos del dominio de cada

universidad, perteneciente al Sistema de Nombres de Dominio,

haciendo uso del buscador Swoogle.

c. Representar el conjunto de universidades, ordenadas por número de

documentos semánticos.

5. Evaluación del uso de ontologías en las empresas españolas con mayor

facturación en el último año.

a. Obtener el conjunto de empresas con mayor facturación en el último

año, a partir de la información consultada en la base de datos SABE

(SABE: Sistema de Análisis de Balances Españoles, 2005).

b. Consultar el número de documentos semánticos del dominio de cada

entidad, perteneciente al Sistema de Nombres de Dominio, haciendo uso

del buscador Swoogle.

c. Representar el conjunto de empresas, ordenadas por número de

documentos semánticos.

d. Analizar la actividad de cada empresa y clasificarlas de acuerdo con este

criterio.

e. Representar el agregado de documentos semánticos por ámbito.

4. Desarrollo

4.1. Evaluación del uso de ontologías en países con mayor inversión en I+D y

educación

El primer paso de esta evaluación, ha consistido en obtener un listado de los

países con una mayor inversión en conocimiento, entendiendo como tal, la suma de la

inversión en Educación Superior y en I+D. Para la obtención de este listado, se ha

hecho uso del último informe de la OCDE, ver Figura 1, en el que se proporciona una

comparativa por países en función del ratio definido. Para permitir la comparación

entre países, el ratio se ha calculado como: inversión en conocimiento/PIB.

Figura 1: Países con mayor inversión en conocimiento

En la figura anterior, se sitúan los países en el eje de ordenadas, frente al

porcentaje del PIB destinado al conocimiento, situado en el eje de abscisas.

Una vez seleccionado el conjunto de países, el siguiente paso ha consistido en

asignar a cada uno su ccTLD, es decir, su dominio superior de país, según la norma

ISO-3166-1. De acuerdo con esta norma, cada país recibe un identificado de dominio

de dos letras. En la Tabla 1 se muestra el nombre de dominio de cada país.

Como siguiente paso, se ha obtenido el número de ontologías para cada país. En

el caso de Estados Unidos, se ha tenido en cuenta que la aparición del dominio „us‟ se

produjo con posterioridad, utilizándose, inicialmente, el dominio „edu‟ para adscribir

entidades relacionadas con investigación. La búsqueda se ha realizado según el

ccTLD de cada país y se ha hecho uso del buscador Swoogle, considerándose todos

los tipos de documentos semánticos: "rdf","rdfs","daml","owl","rss" y "foaf". En la

Tabla 1 pueden observarse los resultados obtenidos.

Tabla 1: Número de ontologías por país

País ccTLD Documentos Semánticos

Suecia se 2393,0

Estados Unidos us,edu 5077,0

Finlandia fi 173,0

Corea kr 206,0

Canadá ca 1283,0

Suiza ch 2502,0

Dinamarca dk 1952,0

Alemania de 3505,0

Países Bajos nl 264,0

Japón jp 88742,0

Francia fr 1068,0

Bélgica be 130,0

Inglaterra uk 19073,0

Australia au 1644,0

Austria at 1417,0

Noruega no 357,0

República Checa cz 43,0

Irlanda ie 2197,0

Hungría hu 2535,0

España es 242,0

Eslovenia si 4,0

Italia it 692,0

Portugal pt 133,0

Polonia pl 443,0

Méjico mx 62,0

Grecia gr 141

Finalmente, la Figura 2 y la Figura 3 muestran el conjunto de países

seleccionados frente al número de documentos semánticos que albergan. Para facilitar

la representación, se han separado los tres países con mayor número de documentos

semánticos, dada la diferencia de magnitud que poseen respecto al resto de países.

0,0

10000,0

20000,0

30000,0

40000,0

50000,0

60000,0

70000,0

80000,0

90000,0

100000,0

Eslov

enia

Rep

úblic

a Che

ca

Méjico

Belgica

Por

tuga

l

Gre

cia

Finland

ia

Cor

ea

Esp

aña

Paí

ses Bajos

Nor

uega

Polon

iaIta

lia

Franc

ia

Can

adá

Aus

tria

Aus

tralia

Dinam

arca

Irlan

da

Sue

cia

Suiza

Hun

gría

Alem

ania

Estad

os U

nido

s

Inglat

erra

Japó

n

Figura 2: Ontologías por país (I).

0,0

10000,0

20000,0

30000,0

40000,0

50000,0

60000,0

70000,0

80000,0

90000,0

100000,0

Estados Unidos Inglaterra Japón

Figura 3: Ontologías por país (II)

En la interpretación de los resultados obtenidos, deberá tenerse en cuenta las

limitaciones en el uso de los dominios ccTLD. El hecho de excluir los dominios

genéricos (gTLD) puede influir en el número de documentos semánticos obtenidos

para cada país. Para confirmar la clasificación de los países, obtenida en esta primera

evaluación, se realiza a continuación, una nueva clasificación por países, partiendo en

este caso de las iniciativas más masivas en este campo, representadas por los

servidores con mayor número de documentos semánticos.

4.2. Evaluación del país de origen de los 25 servidores con mayor número de

documentos semánticos

El primer paso de esta evaluación ha consistido en obtener el conjunto de

servidores con mayor número de documentos semánticos. Para ello, se ha hecho uso

de las estadísticas que proporciona Swoogle.

El segundo paso, identificar el país de origen de cada servidor, ha llevado a hacer

uso, de nuevo, de la clasificación por ccTLD. Esta decisión ha sido motivada por la

aparición de varios servidores con multitud de espejos (mirrors) en todo el mundo.

Esta característica provocaría que la asignación a un solo país desvirtuara los

resultados, generados a partir de datos incompletos. En la Tabla 2 se han incluido los

servidores con mayor número de documentos semánticos, adscritos a dominios

ccTLD.

Tabla 2: Servidores con mayor número de documentos semánticos

Servidor Nº Documentos

Semánticos País

blog.livedoor.jp 15599 Japón

www.uklug.co.uk 8717 Inglaterra

blog.goo.ne.jp 5374 Japón

yaplog.jp 4420 Japón

blogs.dion.ne.jp 3723 Japón

ameblo.jp 2983 Japón

www.mypress.jp 2891 Japón

blog.drecom.jp 2552 Japón

iw.stanford.edu 2501 Estados Unidos

tinysofa.iszerviz.hu 2471 Hungría

ftp.campus.skelleftea.se 2286 Suecia

www.helpisathand.gov.uk 2244 Inglaterra

www.boards.ie 2086 Irlanda

journal.bad.lv 1934 Letonia

nibi.jp 1765 Japón

u.2blog.jp 1758 Japón

www.wasab.dk 1756 Dinamarca

2blog.jp 1725 Japón

mykit.jp 1462 Japón

www.netsolux.ch 1396 Suiza

www.communityprogrammes.org.uk 1239 Inglaterra

ruby.cdpa.nsysu.edu.tw 1131 Taiwan

www.ksl.stanford.edu 1032 Estados Unidos

ch.kitaguni.tv 1016 Tuvalu

galileo.gamepoint.com.au 924 Australia

0

5000

10000

15000

20000

25000

30000

35000

40000

45000

50000

Japó

n

Inglat

erra

Est

ados

Uni

dos

Hun

gría

Sue

cia

Irlan

da

Leto

nia

Din

amar

ca

Suiza

Taiwan

Tuvalu

Aus

tralia

Figura 4: Ontologías en los servidores con mayor número de documentos semánticos,

agregadas por país.

Finalmente, en la Figura 4, se muestra el total de documentos semánticos,

agregado por países.

Confirmando los resultados de la evaluación anterior, esta nueva evaluación

permite estimar el peso de estas tecnologías por países.

Analizado el uso por países, el estudio explora, a continuación, los ámbitos en

los más se utilizan este tipo de técnicas.

4.3. Evaluación de las temáticas más comunes en el uso de ontologías

El primer paso de esta evaluación ha consistido en obtener el conjunto de

servidores con mayor número de documentos semánticos. Para ello, se ha hecho uso

de las estadísticas que proporciona Swoogle.

El segundo paso ha consistido en la clasificación por temática de cada uno de los

servidores, calculándose, seguidamente, el total de documentos semánticos

representados en cada categoría temática. Los resultados se muestran en la Figura 5.

A partir de los resultados, se observa que las bitácoras son el ámbito en el que

más se utilizan este tipo de tecnologías. Resultado relacionado con la popularidad que

este tipo de aplicaciones está alcanzando actualmente.

0

10000

20000

30000

40000

50000

60000

Explorador Facts Config. Inference Web Biblioteca Digital Portal Ontologías

Servidor Personal Config. Linux Noticias Web Log

Figura 5: Ontologías en los servidores con más documentos semánticos, agregadas por temática

4.4. Evaluación del uso y desarrollo de ontologías en las universidades españolas

El primer paso de esta evaluación ha consistido en obtener el listado de los

alumnos matriculados durante el curso académico 2003-2004. Haciendo uso de los

datos del Instituto Nacional de Estadística, se ha obtenido la información, para cada

universidad española.

A continuación, se ha procedido a ordenar y filtrar las 25 universidades con

mayor número de alumnos (se ha incluido, además, la U. Carlos III de Madrid y el

CSIC, como principal centro de investigación), siendo éstas el objeto de resto del

estudio.

El siguiente paso en la evaluación, ha consistido en encontrar el dominio DNS

asignado a cada universidad y obtener, haciendo uso del buscador Swoogle, el

número de documentos semánticos dentro de cada dominio. En la Tabla 3 se

muestran los resultados obtenidos.

Tabla 3: Universidades españolas seleccionadas, incluyendo dominio y número de documentos

semánticos encontrados.

Universidad Alumnos 03/04 Dominio Ontologías

U.N.E.D. 141682 uned.es 0

Complutense de Madrid 85360 ucm.es 0

Sevilla 64152 us.es 9

Granada 56459 ugr.es 37

Barcelona 55375 ub.es 0

País Vasco 50670 ehu.es 1

Valencia 48275 uv.es 0

Politécnica de Madrid 38833 upm.es 12

Málaga 37517 uma.es 0

Politécnica de Valencia 37013 upv.es 1

Autónoma de Barcelona 36657 uab.es 0

Zaragoza 35298 unizar.es 0

Oviedo 32905 uniovi.es 1

Santiago 32618 usc.es 0

Politécnica de Cataluña 31274 upc.es 5

Valladolid 30002 uva.es 0

Castilla-La Mancha 29406 uclm.es 0

Salamanca 28913 usal.es 2

Autónoma de Madrid 28664 uam.es 1

Murcia 28189 um.es 1

Alicante 27208 ua.es 0

Oberta de Catalunya 26574 uoc.es 0

Extremadura 25980 unex.es 0

Vigo 25953 uvigo.es 0

Coruña, A 25183 udc.es 0

Carlos III 15743 uc3m.es 103

CSIC --- csic.es 0

Finalmente, en la Figura 6, se muestran las universidades frente al número de

documentos semánticos.

0

20

40

60

80

100

120

Carlos III

Gra

nada

Polit

écnic

a d

e M

adrid

Sevill

a

Polit

écnic

a d

e C

ata

luña

Sala

manca

País

Vasco

Polit

écnic

a d

e V

ale

ncia

Ovie

do

Autó

nom

a d

e M

adrid

Murc

ia

U.N

.E.D

.

Com

plu

tense d

e M

adrid

Barc

elo

na

Vale

ncia

Mála

ga

Autó

nom

a d

e B

arc

elo

na

Zara

goza

Santiago

Valla

dolid

Castilla

-La M

ancha

Alic

ante

Obert

a d

e C

ata

lunya

Extr

em

adura

Vig

o

Coru

ña, A

CS

IC

Figura 6: Universidades españolas con mayor número de alumnos, frente a número de

documentos semánticos.

A partir de los resultados destaca el puesto obtenido por la U. Carlos III de

Madrid y que denota las numerosas investigaciones que esta entidad está llevando a

cabo en este campo.

4.5. Evaluación del uso de ontologías en las empresas españolas con mayor

facturación en el último año

El primer paso de esta evaluación ha consistido en obtener el listado de las

empresas con mayor facturación durante el último año registrado 2003. Haciendo uso

de la información proporcionada por la base de datos SABE, se ha obtenido el

conjunto de empresas por facturación, así como otros datos relevantes para este

estudio.

A continuación, se ha procedido a ordenar y filtrar las 25 empresas con mayor

facturación. En la Tabla 4 se muestran las 25 empresas seleccionadas.

Tabla 4: Empresas españolas con mayor facturación durante el año 2003

Empresa Últimos

Ingresos URL

REPSOL YPF SA 37206000 www.repsolypf.com

TELEFONICA SA 29219100 www.telefonica.es

ENDESA SA 16644000 www.endesa.es www.endesaonline.com

COMPANIA ESPANOLA DE PETROLEOS SA 13286719 www.cepsa.es

TELEFONICA MOVILES S.A. 10237978 www.tsm.es

IBERDROLA SA 9817574 www.iberdrola.es

ALTADIS SA 9506450 www.altadis.com

ACS ACTIVIDADES DE CONSTRUCCION Y SERVICIOS SA 9110729 www.grupoacs.com

TELEFONICA MOVILES ESPANA SA 7578285 www.tme.es

OPEL ESPANA DE AUTOMOVILES SOCIEDAD LIMITADA 6421676 www.opel.es

GRUPO FERROVIAL SA 6291655 www.ferrovial.es

FOMENTO DE CONSTRUCCIONES Y CONTRATAS SA 6202633 www.fcc.es

SEAT SA 5892629 www.seat.com

UNION FENOSA SA 5863556 www.uef.es

GAS NATURAL SDG SA 5712809 www.gasnaturalsdg.es

RENAULT ESPANA SA 5600126 www.renault.es

PEUGEOT CITROEN AUTOMOVILES ESPANA SA 5416803 www.citroen.es

IBERIA LINEAS AEREAS DE ESPANA SA 4550768 www.iberia.es

ACCIONA S.A. 4191839 www.acciona.es

AUNA OPERADORES DE TELECOMUNICACIONES SA 3857626 www.auna.es

COMPANIA DE DISTRIBUCION INTEGRAL LOGISTA S.A. 3332671 www.logista.es

PETROLEOS DEL NORTE SA 3302357 www.repsol-ypf.com

DISTRIBUIDORA INTERNACIONAL DE ALIMENTACION SA 3189332 www.dia.es

ACERINOX SA 3060837 www.acerinox.es

ALCAMPO SA 2877865 www.alcampodirect.es

El siguiente paso en la evaluación ha consistido en obtener, haciendo uso del

buscador Swoogle, el número de documentos semánticos dentro de cada dominio. Los

resultados han sido nulos en todos los casos, por lo que no se ha realizado la

representación prevista como último paso. Del mismo modo, tampoco se ha realizado

la clasificación por ámbito expuesta en la propuesta metodológica.

La ausencia de documentos semánticos denota cómo, actualmente en España, la

investigación en este campo se circunscribe al ámbito académico.

5. Conclusiones

El resultado del presente estudio proporciona una visión, a distintos niveles y en

diferentes ámbitos, del uso de las ontologías. Permite, por tanto, obtener una idea de

cuál es el uso actual de este tipo de modelos, así como cuáles son los ámbitos y

actividades en los que se están aplicando mayoritariamente.

Partiendo de los resultados de las distintas evaluaciones realizadas, pueden

extraerse las siguientes conclusiones:

Los resultados de la evaluación del uso de las ontologías por países, muestran

qué países albergan mayor número de documentos semánticos. Destacan entre todos

ellos, Japón, con aproximadamente 90000 documentos semánticos, e Inglaterra, con

cerca de 20000 documentos semánticos. Es notable la diferencia que se observa y que

revela a Japón como el país en el que, con diferencia, se realiza un mayor uso de las

ontologías. El tercer país, respecto al número de documentos semánticos, es Estados

Unidos, en torno a 10000 documentos. La posible causa de esta clasificación puede

estar motivada por la comercialización de la informática, en la que Japón, Inglaterra y

Estados Unidos son líderes actualmente.

Los resultados de los países que albergan los servidores con mayor número de

documentos semánticos, permiten conocer dónde se sitúan las iniciativas más

importantes del campo de las ontologías. Confirmando los resultados de la evaluación

del uso de ontologías por países, muestran que es Japón quien se sitúa a la cabeza, con

cerca de 45000 documentos semánticos. Inglaterra continúa en segundo lugar con,

aproximadamente, 13000 documentos semánticos. Mantiene, por tanto, la proporción

de un cuarto respecto a Japón. Comparándose con los resultados anteriores, destaca

una mayor distancia entre Estados Unidos e Inglaterra, así como la ausencia de

Alemania, lo que puede deberse, en ambos casos, a un uso y desarrollo más

numeroso, pero basado en iniciativas menos masivas en cuanto al número de

documentos semánticos.

Los resultados de la evaluación de los ámbitos de aplicación, permiten conocer

cuáles son las aplicaciones mayoritarias de los documentos semánticos, a partir del

conjunto de servidores con mayor número de documentos. Puede comprobarse cómo

los Web Logs o Bitácoras, representan el ámbito de uso mayoritario, con cerca de

55000 documentos semánticos, reflejo de la popularidad que estas aplicaciones están

teniendo en la actualidad. El segundo ámbito de aplicación importante es la

publicación de noticias, muy relacionado con el ámbito anterior en cuanto a

tecnología. La configuración de sistemas y los servidores personales serían los

siguientes ámbitos en cuanto a importancia; destacando, finalmente, los servidores

dedicados a la publicación de ontologías y la aplicación a bibliotecas digitales, siendo

este último, un campo en el que este tipo de documentos puede aportar importantes

beneficios.

Los resultados de la evaluación del uso de las ontologías en el ámbito de las

universidades españolas, permiten establecer aquellas en las que se trabaja más

activamente en iniciativas destinadas al desarrollo y uso de documentos semánticos.

A tenor de los resultados, pueden conocerse las universidades más implicadas en este

tipo de desarrollos como, por ejemplo, las universidades de Granada, Politécnica de

Madrid, Sevilla o Politécnica de Cataluña. Cabe destacar el resultado que la

Universidad Carlos III de Madrid ha obtenido en la evaluación, situándose, con

diferencia, a la cabeza en el desarrollo de este tipo de iniciativas con,

aproximadamente, 100 documentos semánticos, tres veces más que la Universidad de

Granada, situada en segundo lugar. Destacar, como dato de interés, la ausencia de

iniciativas en este campo, en el CSIC. Tratándose del principal órgano de

investigación nacional en España, hubiera sido lógico recuperar un número

significativo de documentos semánticos.

Los resultados de la evaluación del uso y desarrollo de ontologías en el ámbito

empresarial, muestran cómo las principales empresas españolas, en cuanto a

facturación, no hacen uso de las ontologías. Estos resultados ponen de manifiesto, que

el desarrollo en el campo de las ontologías se circunscribe aún en el ámbito

académico, posiblemente debido a su, relativa, novedad. No obstante, debido a las

importantes ventajas competitivas que puede proporcionar, es lógico pensar en una

implantación y desarrollo a medio plazo, dentro del ámbito empresarial.

Común a todos los resultados expuestos, debe destacarse el sesgo inherente al

uso del Sistema de Nombres de Dominio. El uso de los Dominios Superiores de País

(ccTLD) implica haber evaluado aquellos servidores adscritos a estos dominios,

dejando fuera los genéricos (gTLD), a excepción de .edu, esto es: .com, .org, etc.

De forma más general, se puede afirmar que el presente estudio puede ser un

punto de partida para conocer el uso actual de ontologías. El investigador interesado

en este campo, podrá conocer qué países lideran el desarrollo de documentos

semánticos y dónde se sitúan las principales iniciativas en cuanto a dimensiones. Del

mismo modo podrá conocer qué universidades desarrollan y utilizan en mayor medida

esta tecnología, como primer paso para establecer potenciales colaboraciones.

Respecto al ámbito de aplicación, le permite conocer cuáles son los principales usos

actuales de los documentos semánticos. En resumen, si bien no responde a todas, sí

responde a varias preguntas hasta ahora sin respuesta.

6. Futuras líneas de desarrollo

Primeramente, futuros estudios podrían formular preguntas no respondidas en

este, como por ejemplo ¿qué relación existe entre países, en función de definición/uso

de ontologías? En general, ¿qué redes de colaboración se establecen en el desarrollo y

uso de documentos semánticos?

Otra posible mejora podría encaminarse a la redefinición de los criterios de

selección de las muestras. Ejemplos:

Ampliando el número de objetos a estudio, por ejemplo, analizando el total

de las universidades españolas.

Teniendo otros dominios del Sistema de Nombres de Dominio, por ejemplo,

los más significativos dentro de los generales (gTLD).

Definir nuevos ámbitos de evaluación, por ejemplo, empresas a nivel mundial.

En este caso, se proporcionaría una visión más completa del grado de uso de las

ontologías, permitiendo constatar si, al igual que en España, el desarrollo en este

campo está circunscrito al ámbito académico. En esta línea, podrían evaluarse otras

entidades dedicadas a la investigación distintas a las universidades (y al CSIC).

Tomar aquellos países con mayor inversión en tecnología informática y

comunicaciones para comprobar si una mayor correspondencia con los resultados de

las evaluaciones realizadas.

Resolver el problema de identificación, en cuanto a país de origen, de los

dominios genéricos (gTLD), proporcionaría unos resultados más próximos aún a la

realidad, al incluir en el estudio el sector empresarial, entidades sin ánimo de lucro,

etc.

Referencias

Corcho, O.;Fernandez-López, M.; Gómez-Pérez, A. (2003). Methodologies, tools and

languages for building ontologies: Where is their meeting point?. Data &

Knowledge Engineering. Jul, vol. 46, num. 1, pp. 41-64.

Daconta, M.;Obrst, L.; Smith, K. (2003). The Semantic Web: A Guide to the Future

of XML, Web Services, and Knowledge Management, Indianapolis (EE.UU.),

John Wiley & Sons, 281p.

Dhyani, D. Keong W., & Bhowmick, S.S. (2002). A survey of web metrics. ACM

Computing Surveys, 34(4),469-503.

Gruber, T. R. (1993). A Translation Approach to Portable Ontology Specifications.

Knowledge Acquisition. Jun, vol. 5, num. 2, pp. 199-220.

Guarino, N. (1998). Formal Ontology and Information Systems. Proceedings of

FOIS'98, Trento, Italy, 6-8 Jun. IOS Press, Amsterdam, pp. 3-15.

INE: Instituto Nacional de Estadística. (2005). Página principal de la entidad.

Disponible en: <http://www.ine.es/>. [Consultado el 2 de septiembre de 2005].

ISO: International Organization for Standarization. (1997). ISO 3166-1. Disponible

en: <http://www.iso.org/iso/en/>. [Consultado el 2 de septiembre de 2005].

Jasper, R.; Uschold, M. (1999). A Framework for Understanding and Classifying

Ontology Applications. Proceedings of the IJCAI-99 workshop on Ontologies

and Problem-SolvingMethods (KRR5), Stockholm, Sweeden, 2 Ago. CEUR

Publications and University of Amsterdam, Amsterdam, vol. 18.

OCDE: Organización para la Cooperación Econóica y el Desarrollo. (2005). OCDE

Factbook 2005. [Consultado el 2 de septiembre de 2005].

OCLC Office of Research (2003). Web characterization. Available:

http://wcp.oclc.org/ [Consultado el 2 de enero de 2006].

SABE: Sistema de Análisis de Balances Españoles. (2005). Informa SA. Alcobendas

(Madrid). [Consultado el 2 de septiembre de 2005].

Studer, R.; Benjamins, V. R.; Fensel, D. (1998). Knowledge Engineering: Principles

and methods. Data & Knowledge Engineering. Mar, vol. 25, num. 1-2, pp. 161-

197.

Swoogle. (2005). Search and metadata for the Semantic Web. Disponible en:

<http://swoogle.umbc.edu/index.php>. [Consultado el 2 de septiembre de 2005].