Upload
uc3m
View
1
Download
0
Embed Size (px)
Citation preview
Indicadores Web sobre utilización de
ontologías
Vicente Palacios1, Jorge Morato
1, Juan Lloréns
1, José Antonio Moreiro
2
[email protected], [email protected], [email protected];
1Departamento de Informática, Universidad Carlos III de Madrid, Escuela Politécnica
Superior, Av. Universidad 30 - 28911 Leganes (Madrid), España. 2Departamento de biblioteconomía y documentación, Universidad Carlos III de Madrid,
C/ Madrid, 126 - 28903 Getafe (Madrid), España.
Resumen: Las ontologías son una pieza clave para el desarrollo de la Web
Semántica. La irrupción de las ontologías en Internet es un fenómeno reciente
pero de trascendental importancia para la transmisión y almacenamiento de
datos en el ámbito tecnológico y empresarial. La novedad de estas
representaciones conjuntamente con cierta disparidad en su expresión y la
incertidumbre en su grado de implantación debido a la escasez de estudios
sobre el tema, provoca cierta desorientación en empresas que pretenden
incorporar estas tecnologías. El presente estudio realiza una evaluación del
desarrollo y uso de las ontologías, mostrando una visión general desde distintos
puntos de vista incluyendo temática, países con mayor uso y ámbitos de
aplicación, tanto en entidades dedicadas a la investigación como en empresas.
El objetivo es proporcionar al investigador en este campo, un punto de partida
para conocer el grado de implantación de los distintos tipos de documentos
semánticos en Internet.
Palabras clave: Ontología; indicadores web; cibermetría; web semántica; documento
semántico
1. Introducción
Son varias las definiciones del término ontología propuestas en la literatura
científica. Gruber (Gruber, 1993) definió ontología como “especificación explícita de
una conceptualización”, la cual se convirtió en la más aceptada por la comunidad
científica hasta que fue completada por Suder (Studer; Benjamins; Fensel, 1998)
como “especificación explícita y formal de una conceptualización compartida”.
Nicola Guarino (Guarino, 1998) complementó la propuesta de Studer, definiendo
ontología como “teoría lógica que da cuenta del significado intencional de un
vocabulario formal, es decir, de su compromiso ontológico hacia una
conceptualización particular del mundo”. Guarino define, por tanto, ontología como
teoría lógica que aporta la semántica a un conjunto de términos del Universo del
Discurso, según la interpretación que su creador haga de la realidad.
Siendo esta la definición aceptada por los autores, debe tenerse en cuenta cómo
(Corcho; Fernández-López; Gómez-Pérez, 2003) ponen de manifiesto que, en la
práctica, existen distintos significados atribuidos al término ontología; la
heterogeneidad de objetivos y uso en áreas como la gestión del conocimiento,
procesamiento del lenguaje natural, comercio electrónico, Web, etc., ha propiciado las
acepciones aplicadas al término ontología.
Una de las principales ventajas que proporciona el uso de ontologías es la
potenciación de la reusabilidad. Esta propiedad permite la generación de nuevos
recursos basados en los existentes. En el caso de las ontologías, se facilita, por un
lado, la representación del conocimiento que puede ser reutilizado en el desarrollo de
distintos sistemas y, por otro, la interoperabilidad de los distintos sistemas, de acuerdo
con la representación consensuada del conocimiento.
En los últimos años, numerosas empresas tratan de potenciar técnicas de
reutilización de aplicaciones, desde el punto de vista tecnológico y más ampliamente
desde el conocimiento en general. Habiendo expuesto las ventajas que proporciona el
uso de ontologías, como base para representación de conocimiento reusable y
compatible; parece lógico pensar que las iniciativas destinadas a fomentar la
reusabilidad estén haciendo uso de las ontologías como núcleo para el desarrollo de
sistemas y representación del conocimiento.
En el presente artículo se aplican técnicas cibermétricas (OCLC, 2003; Dhyani,
2002) para el análisis cuantitativo de los documentos semánticos y sus procesos de
comunicación en Internet. Para ello se seleccionarán y estudiarán diversos indicadores
Web de la sociedad de la información, observando su posible impacto en I+D. Los
indicadores en los que se centra el estudio son relativos a la infraestructura
(cuantificación de sites y dominios) y al tamaño relativo de éstos. Por último, se
contemplan algunos factores cualitativos como son las temáticas y namespaces en los
documentos. Incluir breve introducción al campo de la cibermetría?
2. Objetivos
El objetivo del presente estudio es realizar un estudio exploratorio del uso de las
ontologías, que permita analizar y evaluar su popularidad a distintos niveles y en
distintas entidades.
Más concretamente, los objetivos específicos a alcanzar son:
Evaluar el uso de ontologías por países, con el objetivo de establecer qué
países desarrollan y utilizan más este tipo de modelos. Se realizará una
preselección de los países de acuerdo con su inversión en I+D y educación,
como aquellos que más están potenciando y desarrollando la gestión del
conocimiento.
Evaluar los países que albergan los servidores con mayor número de
documentos semánticos. El objetivo en este caso, es establecer qué países
están llevando a cabo las iniciativas más importantes en este campo y
comprobar si coinciden con los que más utilizan este tipo de modelos,
resultado del objetivo anterior.
Evaluar cuáles son los ámbitos de aplicación más comunes de los
documentos semánticos. El objetivo es establecer para qué se están
utilizando y en qué proporción.
Evaluar el uso y desarrollo de ontologías en el ámbito de las universidades
españolas, incluyendo el Consejo Superior de Investigaciones Científicas. El
objetivo es establecer qué universidades están trabajando más activamente
en el desarrollo y uso de documentos semánticos. Se realizará una
preselección de universidades de acuerdo con el número de alumnos
matriculados, y también se incluirá la Universidad Carlos III de Madrid, por
ser el ámbito del que parte este estudio.
Evaluar el uso y desarrollo de ontologías en el ámbito empresarial español.
El objetivo es establecer si las empresas más importantes están haciendo uso
de ontologías. Se realizará una selección de las empresas con mayor
facturación y se evaluará el número de documentos semánticos de cada una.
Para finalizar, se analizarán las actividades de las empresas, con el fin de
establecer una clasificación por sectores de las mismas.
3. Propuesta metodológica
Para alcanzar los objetivos de la presente evaluación, se propone el método
expuesto a continuación y que se sintetiza de la siguiente forma:
1. Evaluación del uso de ontologías en países con mayor inversión en I+D y
educación:
a. Obtener el conjunto de países con mayor inversión en conocimiento. A
partir del Factbook 2005 publicado por la OCDE (OCDE: Organización
para la Cooperación Económica y el Desarrollo, 2005), se generará un
listado con los 25 países con mayor inversión en I+D y en educación
superior. Para hacerlo comparable, el indicador se calculará de acuerdo
con el PIB de cada país.
b. Para cada país del listado anterior, se obtendrá el ccTLD (Dominio
Superior de País) correspondiente, según la norma ISO-3166-1 (ISO:
International Organization for Standarization, 1997).
c. Restringiendo la consulta por el ccTLD, se obtendrá el número de
documentos semánticos de cada país, haciendo uso del buscador
Swoogle (Swoogle, 2005).
d. Mostrar el conjunto de países, ordenados por número de documentos
semánticos.
2. Evaluación del país de origen de los 25 servidores con mayor número de
documentos semánticos:
a. Obtener el conjunto de servidores Web con mayor número de
documentos semánticos, partiendo de la información estadística
facilitada por Swoogle.
b. Acceder a cada servidor para averiguar el país donde está situado.
c. Representar el conjunto de países, ordenados por el valor total de
documentos semánticos.
3. Evaluación de las temáticas más comunes en el uso de ontologías.
a. Obtener el conjunto de servidores Web con mayor número de
documentos semánticos, partiendo de la información estadística
facilitada por Swoogle.
b. Agrupar por temática los distintos servidores.
c. Representar el agregado de documentos semánticos por tema.
4. Evaluación del uso y desarrollo de ontologías en las universidades españolas.
a. Obtener el conjunto de universidades con mayor número de alumnos
matriculados, a partir de los datos del INE (INE: Instituto Nacional de
Estadística, 2005). Se ha incluido, por su importancia en el ámbito de la
investigación, al CSIC: Consejo Superior de Investigaciones
Científicas).
b. Consultar el número de documentos semánticos del dominio de cada
universidad, perteneciente al Sistema de Nombres de Dominio,
haciendo uso del buscador Swoogle.
c. Representar el conjunto de universidades, ordenadas por número de
documentos semánticos.
5. Evaluación del uso de ontologías en las empresas españolas con mayor
facturación en el último año.
a. Obtener el conjunto de empresas con mayor facturación en el último
año, a partir de la información consultada en la base de datos SABE
(SABE: Sistema de Análisis de Balances Españoles, 2005).
b. Consultar el número de documentos semánticos del dominio de cada
entidad, perteneciente al Sistema de Nombres de Dominio, haciendo uso
del buscador Swoogle.
c. Representar el conjunto de empresas, ordenadas por número de
documentos semánticos.
d. Analizar la actividad de cada empresa y clasificarlas de acuerdo con este
criterio.
e. Representar el agregado de documentos semánticos por ámbito.
4. Desarrollo
4.1. Evaluación del uso de ontologías en países con mayor inversión en I+D y
educación
El primer paso de esta evaluación, ha consistido en obtener un listado de los
países con una mayor inversión en conocimiento, entendiendo como tal, la suma de la
inversión en Educación Superior y en I+D. Para la obtención de este listado, se ha
hecho uso del último informe de la OCDE, ver Figura 1, en el que se proporciona una
comparativa por países en función del ratio definido. Para permitir la comparación
entre países, el ratio se ha calculado como: inversión en conocimiento/PIB.
Figura 1: Países con mayor inversión en conocimiento
En la figura anterior, se sitúan los países en el eje de ordenadas, frente al
porcentaje del PIB destinado al conocimiento, situado en el eje de abscisas.
Una vez seleccionado el conjunto de países, el siguiente paso ha consistido en
asignar a cada uno su ccTLD, es decir, su dominio superior de país, según la norma
ISO-3166-1. De acuerdo con esta norma, cada país recibe un identificado de dominio
de dos letras. En la Tabla 1 se muestra el nombre de dominio de cada país.
Como siguiente paso, se ha obtenido el número de ontologías para cada país. En
el caso de Estados Unidos, se ha tenido en cuenta que la aparición del dominio „us‟ se
produjo con posterioridad, utilizándose, inicialmente, el dominio „edu‟ para adscribir
entidades relacionadas con investigación. La búsqueda se ha realizado según el
ccTLD de cada país y se ha hecho uso del buscador Swoogle, considerándose todos
los tipos de documentos semánticos: "rdf","rdfs","daml","owl","rss" y "foaf". En la
Tabla 1 pueden observarse los resultados obtenidos.
Tabla 1: Número de ontologías por país
País ccTLD Documentos Semánticos
Suecia se 2393,0
Estados Unidos us,edu 5077,0
Finlandia fi 173,0
Corea kr 206,0
Canadá ca 1283,0
Suiza ch 2502,0
Dinamarca dk 1952,0
Alemania de 3505,0
Países Bajos nl 264,0
Japón jp 88742,0
Francia fr 1068,0
Bélgica be 130,0
Inglaterra uk 19073,0
Australia au 1644,0
Austria at 1417,0
Noruega no 357,0
República Checa cz 43,0
Irlanda ie 2197,0
Hungría hu 2535,0
España es 242,0
Eslovenia si 4,0
Italia it 692,0
Portugal pt 133,0
Polonia pl 443,0
Méjico mx 62,0
Grecia gr 141
Finalmente, la Figura 2 y la Figura 3 muestran el conjunto de países
seleccionados frente al número de documentos semánticos que albergan. Para facilitar
la representación, se han separado los tres países con mayor número de documentos
semánticos, dada la diferencia de magnitud que poseen respecto al resto de países.
0,0
10000,0
20000,0
30000,0
40000,0
50000,0
60000,0
70000,0
80000,0
90000,0
100000,0
Eslov
enia
Rep
úblic
a Che
ca
Méjico
Belgica
Por
tuga
l
Gre
cia
Finland
ia
Cor
ea
Esp
aña
Paí
ses Bajos
Nor
uega
Polon
iaIta
lia
Franc
ia
Can
adá
Aus
tria
Aus
tralia
Dinam
arca
Irlan
da
Sue
cia
Suiza
Hun
gría
Alem
ania
Estad
os U
nido
s
Inglat
erra
Japó
n
Figura 2: Ontologías por país (I).
0,0
10000,0
20000,0
30000,0
40000,0
50000,0
60000,0
70000,0
80000,0
90000,0
100000,0
Estados Unidos Inglaterra Japón
Figura 3: Ontologías por país (II)
En la interpretación de los resultados obtenidos, deberá tenerse en cuenta las
limitaciones en el uso de los dominios ccTLD. El hecho de excluir los dominios
genéricos (gTLD) puede influir en el número de documentos semánticos obtenidos
para cada país. Para confirmar la clasificación de los países, obtenida en esta primera
evaluación, se realiza a continuación, una nueva clasificación por países, partiendo en
este caso de las iniciativas más masivas en este campo, representadas por los
servidores con mayor número de documentos semánticos.
4.2. Evaluación del país de origen de los 25 servidores con mayor número de
documentos semánticos
El primer paso de esta evaluación ha consistido en obtener el conjunto de
servidores con mayor número de documentos semánticos. Para ello, se ha hecho uso
de las estadísticas que proporciona Swoogle.
El segundo paso, identificar el país de origen de cada servidor, ha llevado a hacer
uso, de nuevo, de la clasificación por ccTLD. Esta decisión ha sido motivada por la
aparición de varios servidores con multitud de espejos (mirrors) en todo el mundo.
Esta característica provocaría que la asignación a un solo país desvirtuara los
resultados, generados a partir de datos incompletos. En la Tabla 2 se han incluido los
servidores con mayor número de documentos semánticos, adscritos a dominios
ccTLD.
Tabla 2: Servidores con mayor número de documentos semánticos
Servidor Nº Documentos
Semánticos País
blog.livedoor.jp 15599 Japón
www.uklug.co.uk 8717 Inglaterra
blog.goo.ne.jp 5374 Japón
yaplog.jp 4420 Japón
blogs.dion.ne.jp 3723 Japón
ameblo.jp 2983 Japón
www.mypress.jp 2891 Japón
blog.drecom.jp 2552 Japón
iw.stanford.edu 2501 Estados Unidos
tinysofa.iszerviz.hu 2471 Hungría
ftp.campus.skelleftea.se 2286 Suecia
www.helpisathand.gov.uk 2244 Inglaterra
www.boards.ie 2086 Irlanda
journal.bad.lv 1934 Letonia
nibi.jp 1765 Japón
u.2blog.jp 1758 Japón
www.wasab.dk 1756 Dinamarca
2blog.jp 1725 Japón
mykit.jp 1462 Japón
www.netsolux.ch 1396 Suiza
www.communityprogrammes.org.uk 1239 Inglaterra
ruby.cdpa.nsysu.edu.tw 1131 Taiwan
www.ksl.stanford.edu 1032 Estados Unidos
ch.kitaguni.tv 1016 Tuvalu
galileo.gamepoint.com.au 924 Australia
0
5000
10000
15000
20000
25000
30000
35000
40000
45000
50000
Japó
n
Inglat
erra
Est
ados
Uni
dos
Hun
gría
Sue
cia
Irlan
da
Leto
nia
Din
amar
ca
Suiza
Taiwan
Tuvalu
Aus
tralia
Figura 4: Ontologías en los servidores con mayor número de documentos semánticos,
agregadas por país.
Finalmente, en la Figura 4, se muestra el total de documentos semánticos,
agregado por países.
Confirmando los resultados de la evaluación anterior, esta nueva evaluación
permite estimar el peso de estas tecnologías por países.
Analizado el uso por países, el estudio explora, a continuación, los ámbitos en
los más se utilizan este tipo de técnicas.
4.3. Evaluación de las temáticas más comunes en el uso de ontologías
El primer paso de esta evaluación ha consistido en obtener el conjunto de
servidores con mayor número de documentos semánticos. Para ello, se ha hecho uso
de las estadísticas que proporciona Swoogle.
El segundo paso ha consistido en la clasificación por temática de cada uno de los
servidores, calculándose, seguidamente, el total de documentos semánticos
representados en cada categoría temática. Los resultados se muestran en la Figura 5.
A partir de los resultados, se observa que las bitácoras son el ámbito en el que
más se utilizan este tipo de tecnologías. Resultado relacionado con la popularidad que
este tipo de aplicaciones está alcanzando actualmente.
0
10000
20000
30000
40000
50000
60000
Explorador Facts Config. Inference Web Biblioteca Digital Portal Ontologías
Servidor Personal Config. Linux Noticias Web Log
Figura 5: Ontologías en los servidores con más documentos semánticos, agregadas por temática
4.4. Evaluación del uso y desarrollo de ontologías en las universidades españolas
El primer paso de esta evaluación ha consistido en obtener el listado de los
alumnos matriculados durante el curso académico 2003-2004. Haciendo uso de los
datos del Instituto Nacional de Estadística, se ha obtenido la información, para cada
universidad española.
A continuación, se ha procedido a ordenar y filtrar las 25 universidades con
mayor número de alumnos (se ha incluido, además, la U. Carlos III de Madrid y el
CSIC, como principal centro de investigación), siendo éstas el objeto de resto del
estudio.
El siguiente paso en la evaluación, ha consistido en encontrar el dominio DNS
asignado a cada universidad y obtener, haciendo uso del buscador Swoogle, el
número de documentos semánticos dentro de cada dominio. En la Tabla 3 se
muestran los resultados obtenidos.
Tabla 3: Universidades españolas seleccionadas, incluyendo dominio y número de documentos
semánticos encontrados.
Universidad Alumnos 03/04 Dominio Ontologías
U.N.E.D. 141682 uned.es 0
Complutense de Madrid 85360 ucm.es 0
Sevilla 64152 us.es 9
Granada 56459 ugr.es 37
Barcelona 55375 ub.es 0
País Vasco 50670 ehu.es 1
Valencia 48275 uv.es 0
Politécnica de Madrid 38833 upm.es 12
Málaga 37517 uma.es 0
Politécnica de Valencia 37013 upv.es 1
Autónoma de Barcelona 36657 uab.es 0
Zaragoza 35298 unizar.es 0
Oviedo 32905 uniovi.es 1
Santiago 32618 usc.es 0
Politécnica de Cataluña 31274 upc.es 5
Valladolid 30002 uva.es 0
Castilla-La Mancha 29406 uclm.es 0
Salamanca 28913 usal.es 2
Autónoma de Madrid 28664 uam.es 1
Murcia 28189 um.es 1
Alicante 27208 ua.es 0
Oberta de Catalunya 26574 uoc.es 0
Extremadura 25980 unex.es 0
Vigo 25953 uvigo.es 0
Coruña, A 25183 udc.es 0
Carlos III 15743 uc3m.es 103
CSIC --- csic.es 0
Finalmente, en la Figura 6, se muestran las universidades frente al número de
documentos semánticos.
0
20
40
60
80
100
120
Carlos III
Gra
nada
Polit
écnic
a d
e M
adrid
Sevill
a
Polit
écnic
a d
e C
ata
luña
Sala
manca
País
Vasco
Polit
écnic
a d
e V
ale
ncia
Ovie
do
Autó
nom
a d
e M
adrid
Murc
ia
U.N
.E.D
.
Com
plu
tense d
e M
adrid
Barc
elo
na
Vale
ncia
Mála
ga
Autó
nom
a d
e B
arc
elo
na
Zara
goza
Santiago
Valla
dolid
Castilla
-La M
ancha
Alic
ante
Obert
a d
e C
ata
lunya
Extr
em
adura
Vig
o
Coru
ña, A
CS
IC
Figura 6: Universidades españolas con mayor número de alumnos, frente a número de
documentos semánticos.
A partir de los resultados destaca el puesto obtenido por la U. Carlos III de
Madrid y que denota las numerosas investigaciones que esta entidad está llevando a
cabo en este campo.
4.5. Evaluación del uso de ontologías en las empresas españolas con mayor
facturación en el último año
El primer paso de esta evaluación ha consistido en obtener el listado de las
empresas con mayor facturación durante el último año registrado 2003. Haciendo uso
de la información proporcionada por la base de datos SABE, se ha obtenido el
conjunto de empresas por facturación, así como otros datos relevantes para este
estudio.
A continuación, se ha procedido a ordenar y filtrar las 25 empresas con mayor
facturación. En la Tabla 4 se muestran las 25 empresas seleccionadas.
Tabla 4: Empresas españolas con mayor facturación durante el año 2003
Empresa Últimos
Ingresos URL
REPSOL YPF SA 37206000 www.repsolypf.com
TELEFONICA SA 29219100 www.telefonica.es
ENDESA SA 16644000 www.endesa.es www.endesaonline.com
COMPANIA ESPANOLA DE PETROLEOS SA 13286719 www.cepsa.es
TELEFONICA MOVILES S.A. 10237978 www.tsm.es
IBERDROLA SA 9817574 www.iberdrola.es
ALTADIS SA 9506450 www.altadis.com
ACS ACTIVIDADES DE CONSTRUCCION Y SERVICIOS SA 9110729 www.grupoacs.com
TELEFONICA MOVILES ESPANA SA 7578285 www.tme.es
OPEL ESPANA DE AUTOMOVILES SOCIEDAD LIMITADA 6421676 www.opel.es
GRUPO FERROVIAL SA 6291655 www.ferrovial.es
FOMENTO DE CONSTRUCCIONES Y CONTRATAS SA 6202633 www.fcc.es
SEAT SA 5892629 www.seat.com
UNION FENOSA SA 5863556 www.uef.es
GAS NATURAL SDG SA 5712809 www.gasnaturalsdg.es
RENAULT ESPANA SA 5600126 www.renault.es
PEUGEOT CITROEN AUTOMOVILES ESPANA SA 5416803 www.citroen.es
IBERIA LINEAS AEREAS DE ESPANA SA 4550768 www.iberia.es
ACCIONA S.A. 4191839 www.acciona.es
AUNA OPERADORES DE TELECOMUNICACIONES SA 3857626 www.auna.es
COMPANIA DE DISTRIBUCION INTEGRAL LOGISTA S.A. 3332671 www.logista.es
PETROLEOS DEL NORTE SA 3302357 www.repsol-ypf.com
DISTRIBUIDORA INTERNACIONAL DE ALIMENTACION SA 3189332 www.dia.es
ACERINOX SA 3060837 www.acerinox.es
ALCAMPO SA 2877865 www.alcampodirect.es
El siguiente paso en la evaluación ha consistido en obtener, haciendo uso del
buscador Swoogle, el número de documentos semánticos dentro de cada dominio. Los
resultados han sido nulos en todos los casos, por lo que no se ha realizado la
representación prevista como último paso. Del mismo modo, tampoco se ha realizado
la clasificación por ámbito expuesta en la propuesta metodológica.
La ausencia de documentos semánticos denota cómo, actualmente en España, la
investigación en este campo se circunscribe al ámbito académico.
5. Conclusiones
El resultado del presente estudio proporciona una visión, a distintos niveles y en
diferentes ámbitos, del uso de las ontologías. Permite, por tanto, obtener una idea de
cuál es el uso actual de este tipo de modelos, así como cuáles son los ámbitos y
actividades en los que se están aplicando mayoritariamente.
Partiendo de los resultados de las distintas evaluaciones realizadas, pueden
extraerse las siguientes conclusiones:
Los resultados de la evaluación del uso de las ontologías por países, muestran
qué países albergan mayor número de documentos semánticos. Destacan entre todos
ellos, Japón, con aproximadamente 90000 documentos semánticos, e Inglaterra, con
cerca de 20000 documentos semánticos. Es notable la diferencia que se observa y que
revela a Japón como el país en el que, con diferencia, se realiza un mayor uso de las
ontologías. El tercer país, respecto al número de documentos semánticos, es Estados
Unidos, en torno a 10000 documentos. La posible causa de esta clasificación puede
estar motivada por la comercialización de la informática, en la que Japón, Inglaterra y
Estados Unidos son líderes actualmente.
Los resultados de los países que albergan los servidores con mayor número de
documentos semánticos, permiten conocer dónde se sitúan las iniciativas más
importantes del campo de las ontologías. Confirmando los resultados de la evaluación
del uso de ontologías por países, muestran que es Japón quien se sitúa a la cabeza, con
cerca de 45000 documentos semánticos. Inglaterra continúa en segundo lugar con,
aproximadamente, 13000 documentos semánticos. Mantiene, por tanto, la proporción
de un cuarto respecto a Japón. Comparándose con los resultados anteriores, destaca
una mayor distancia entre Estados Unidos e Inglaterra, así como la ausencia de
Alemania, lo que puede deberse, en ambos casos, a un uso y desarrollo más
numeroso, pero basado en iniciativas menos masivas en cuanto al número de
documentos semánticos.
Los resultados de la evaluación de los ámbitos de aplicación, permiten conocer
cuáles son las aplicaciones mayoritarias de los documentos semánticos, a partir del
conjunto de servidores con mayor número de documentos. Puede comprobarse cómo
los Web Logs o Bitácoras, representan el ámbito de uso mayoritario, con cerca de
55000 documentos semánticos, reflejo de la popularidad que estas aplicaciones están
teniendo en la actualidad. El segundo ámbito de aplicación importante es la
publicación de noticias, muy relacionado con el ámbito anterior en cuanto a
tecnología. La configuración de sistemas y los servidores personales serían los
siguientes ámbitos en cuanto a importancia; destacando, finalmente, los servidores
dedicados a la publicación de ontologías y la aplicación a bibliotecas digitales, siendo
este último, un campo en el que este tipo de documentos puede aportar importantes
beneficios.
Los resultados de la evaluación del uso de las ontologías en el ámbito de las
universidades españolas, permiten establecer aquellas en las que se trabaja más
activamente en iniciativas destinadas al desarrollo y uso de documentos semánticos.
A tenor de los resultados, pueden conocerse las universidades más implicadas en este
tipo de desarrollos como, por ejemplo, las universidades de Granada, Politécnica de
Madrid, Sevilla o Politécnica de Cataluña. Cabe destacar el resultado que la
Universidad Carlos III de Madrid ha obtenido en la evaluación, situándose, con
diferencia, a la cabeza en el desarrollo de este tipo de iniciativas con,
aproximadamente, 100 documentos semánticos, tres veces más que la Universidad de
Granada, situada en segundo lugar. Destacar, como dato de interés, la ausencia de
iniciativas en este campo, en el CSIC. Tratándose del principal órgano de
investigación nacional en España, hubiera sido lógico recuperar un número
significativo de documentos semánticos.
Los resultados de la evaluación del uso y desarrollo de ontologías en el ámbito
empresarial, muestran cómo las principales empresas españolas, en cuanto a
facturación, no hacen uso de las ontologías. Estos resultados ponen de manifiesto, que
el desarrollo en el campo de las ontologías se circunscribe aún en el ámbito
académico, posiblemente debido a su, relativa, novedad. No obstante, debido a las
importantes ventajas competitivas que puede proporcionar, es lógico pensar en una
implantación y desarrollo a medio plazo, dentro del ámbito empresarial.
Común a todos los resultados expuestos, debe destacarse el sesgo inherente al
uso del Sistema de Nombres de Dominio. El uso de los Dominios Superiores de País
(ccTLD) implica haber evaluado aquellos servidores adscritos a estos dominios,
dejando fuera los genéricos (gTLD), a excepción de .edu, esto es: .com, .org, etc.
De forma más general, se puede afirmar que el presente estudio puede ser un
punto de partida para conocer el uso actual de ontologías. El investigador interesado
en este campo, podrá conocer qué países lideran el desarrollo de documentos
semánticos y dónde se sitúan las principales iniciativas en cuanto a dimensiones. Del
mismo modo podrá conocer qué universidades desarrollan y utilizan en mayor medida
esta tecnología, como primer paso para establecer potenciales colaboraciones.
Respecto al ámbito de aplicación, le permite conocer cuáles son los principales usos
actuales de los documentos semánticos. En resumen, si bien no responde a todas, sí
responde a varias preguntas hasta ahora sin respuesta.
6. Futuras líneas de desarrollo
Primeramente, futuros estudios podrían formular preguntas no respondidas en
este, como por ejemplo ¿qué relación existe entre países, en función de definición/uso
de ontologías? En general, ¿qué redes de colaboración se establecen en el desarrollo y
uso de documentos semánticos?
Otra posible mejora podría encaminarse a la redefinición de los criterios de
selección de las muestras. Ejemplos:
Ampliando el número de objetos a estudio, por ejemplo, analizando el total
de las universidades españolas.
Teniendo otros dominios del Sistema de Nombres de Dominio, por ejemplo,
los más significativos dentro de los generales (gTLD).
Definir nuevos ámbitos de evaluación, por ejemplo, empresas a nivel mundial.
En este caso, se proporcionaría una visión más completa del grado de uso de las
ontologías, permitiendo constatar si, al igual que en España, el desarrollo en este
campo está circunscrito al ámbito académico. En esta línea, podrían evaluarse otras
entidades dedicadas a la investigación distintas a las universidades (y al CSIC).
Tomar aquellos países con mayor inversión en tecnología informática y
comunicaciones para comprobar si una mayor correspondencia con los resultados de
las evaluaciones realizadas.
Resolver el problema de identificación, en cuanto a país de origen, de los
dominios genéricos (gTLD), proporcionaría unos resultados más próximos aún a la
realidad, al incluir en el estudio el sector empresarial, entidades sin ánimo de lucro,
etc.
Referencias
Corcho, O.;Fernandez-López, M.; Gómez-Pérez, A. (2003). Methodologies, tools and
languages for building ontologies: Where is their meeting point?. Data &
Knowledge Engineering. Jul, vol. 46, num. 1, pp. 41-64.
Daconta, M.;Obrst, L.; Smith, K. (2003). The Semantic Web: A Guide to the Future
of XML, Web Services, and Knowledge Management, Indianapolis (EE.UU.),
John Wiley & Sons, 281p.
Dhyani, D. Keong W., & Bhowmick, S.S. (2002). A survey of web metrics. ACM
Computing Surveys, 34(4),469-503.
Gruber, T. R. (1993). A Translation Approach to Portable Ontology Specifications.
Knowledge Acquisition. Jun, vol. 5, num. 2, pp. 199-220.
Guarino, N. (1998). Formal Ontology and Information Systems. Proceedings of
FOIS'98, Trento, Italy, 6-8 Jun. IOS Press, Amsterdam, pp. 3-15.
INE: Instituto Nacional de Estadística. (2005). Página principal de la entidad.
Disponible en: <http://www.ine.es/>. [Consultado el 2 de septiembre de 2005].
ISO: International Organization for Standarization. (1997). ISO 3166-1. Disponible
en: <http://www.iso.org/iso/en/>. [Consultado el 2 de septiembre de 2005].
Jasper, R.; Uschold, M. (1999). A Framework for Understanding and Classifying
Ontology Applications. Proceedings of the IJCAI-99 workshop on Ontologies
and Problem-SolvingMethods (KRR5), Stockholm, Sweeden, 2 Ago. CEUR
Publications and University of Amsterdam, Amsterdam, vol. 18.
OCDE: Organización para la Cooperación Econóica y el Desarrollo. (2005). OCDE
Factbook 2005. [Consultado el 2 de septiembre de 2005].
OCLC Office of Research (2003). Web characterization. Available:
http://wcp.oclc.org/ [Consultado el 2 de enero de 2006].
SABE: Sistema de Análisis de Balances Españoles. (2005). Informa SA. Alcobendas
(Madrid). [Consultado el 2 de septiembre de 2005].
Studer, R.; Benjamins, V. R.; Fensel, D. (1998). Knowledge Engineering: Principles
and methods. Data & Knowledge Engineering. Mar, vol. 25, num. 1-2, pp. 161-
197.
Swoogle. (2005). Search and metadata for the Semantic Web. Disponible en:
<http://swoogle.umbc.edu/index.php>. [Consultado el 2 de septiembre de 2005].