8
TitlePromoting Strong Personalization in Content-based Recommendation Systems of Learning Objects. AbstractRecommendation technologies have a clear application in e-learning: providing support for personalized access to the Learning Objects (LOs) that exist in repositories. In this paper we describe a novel approach that fosters a strong personalized content-based recommendation of LOs. This approach gives priority to those LOs that are most similar to the student’s short-term learning goals (the concepts that the student wants to learn in the session) and, at the same time, have a high pedagogical utility in the light of the student’s cognitive state (long-term learning goals). The paper includes the definition of a flexible metric that combines the similarity with the query and the pedagogical utility of the LO. We finally describe the application of the approach to an educational repository of Computer Programming LOs. Index TermsPersonalization, Content-based Recommenders, Learning Objects. I. INTRODUCCIÓN n los últimos años, el uso de sistemas recomendadores se ha transferido del campo del comercio electrónico al ámbito académico. En este sentido, hay trabajos que plantean herramientas de recomendación de cursos y actividades de aprendizaje [8][13][15] y recomendadores que sugieren a los profesores modificaciones para mejorar la efectividad de los sistemas educativos web [9]. El uso de recomendadores en el ámbito académico tiene otra clara y todavía no muy explotada aplicación: proporcionar acceso personalizado a Objetos de Aprendizaje (LOs, del inglés Learning Objects) que se hallan en repositorios educativos. Normalmente el gran número de LOs contenidos en estos repositorios dificulta el acceso a aquellos que mejor se adaptan al conocimiento de cada estudiante, a los objetivos y/o a las preferencias de cada uno. Esta Almudena Ruiz-Iniesta, Guillermo Jiménez-Díaz y Mercedes Gómez- Albarrán desempeñan sus tareas en la Facultad de Informática de la Universidad Complutense de Madrid. c/ Prof. José García Santesmases s/n, 28040 Madrid, España. (email: [email protected]; [email protected]; [email protected]). DOI (Digital Object Identifier) Pendiente dificultad la hemos podido constatar en un repositorio de recursos docentes de la disciplina de Programación de Computadores, disponible a través del Campus Virtual de la Universidad Complutense de Madrid (España) durante los últimos tres años. Este repositorio contiene más de 400 ejemplos resueltos y ejercicios para resolver de Programación, destinados a estudiantes de “Introducción a la Programación”. Aunque los estudiantes valoraban muy bien la ayuda que estos recursos les proporcionan, el 70% de ellos echaba en falta facilidades más sofisticadas para el acceso a los recursos. En este artículo presentamos una aproximación que extiende y mejora nuestro trabajo previo en recomendación de LOs en repositorios web. En [10][11] describimos una aproximación novedosa para recomendar LOs que sigue una estrategia de recomendación híbrida en cascada [3]: un recomendador basado en contenido reactivo y single-shot actúa como recomendador inicial y sus decisiones son refinadas por uno colaborativo. La estrategia de recomendación empleada localizaba un conjunto relevante de LOs después de que el estudiante hubiera planteado una consulta al sistema. El resultado era una lista ordenada de LOs. La prioridad era para aquellos LOs más similares a la consulta del estudiante y que a la vez son los mejor valorados por otros estudiantes. Esta aproximación ha sido ejemplificada con el repositorio de LOs de Programación que actualmente se utiliza para Introducción a la Programación en la Universidad Complutense de Madrid. La estrategia de recomendación previa mostraba una desventaja: la recomendación basada en contenido, y por extensión, la estrategia entera, proporcionaba una débil personalización. La estrategia de recomendación implementaba un tipo de personalización en-sesión: sólo tenía en cuenta los objetivos a corto plazo del estudiante reflejados en la consulta. De esta manera, dos estudiantes que planteen la misma consulta en una sesión obtendrán las mismas recomendaciones, incluso si sus objetivos de aprendizaje a largo plazo y su destreza en el dominio difieren en gran parte. Con el propósito de aliviar este inconveniente hemos explorado un modelo de personalización fuerte. Como veremos, esta mejora en la estrategia de recomendación basada en contenido puede ser adaptada a los objetivos a largo plazo de los estudiantes sin comprometer los intereses que en la sesión puedan tener los LOs recomendados para el Personalización en Recomendadores Basados en Contenido y su Aplicación a Repositorios de Objetos de Aprendizaje A. Ruiz-Iniesta, G. Jiménez-Díaz y M. Gómez-Albarrán E IEEE-RITA Vol. 5, Núm. 1, Feb. 2010 31 ISSN 1932-8540 © IEEE

Personalización en Recomendadores Basados en Contenido y su …rita.det.uvigo.es/201002/uploads/IEEE-RITA.2010.V5.N1.A6.pdf · recomendador puede sacar provecho de una regla pedagógica

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Title— Promoting Strong Personalization in Content-based

Recommendation Systems of Learning Objects.

Abstract— Recommendation technologies have a clear

application in e-learning: providing support for personalized

access to the Learning Objects (LOs) that exist in repositories.

In this paper we describe a novel approach that fosters a strong

personalized content-based recommendation of LOs. This

approach gives priority to those LOs that are most similar to the

student’s short-term learning goals (the concepts that the

student wants to learn in the session) and, at the same time,

have a high pedagogical utility in the light of the student’s

cognitive state (long-term learning goals). The paper includes

the definition of a flexible metric that combines the similarity

with the query and the pedagogical utility of the LO. We finally

describe the application of the approach to an educational

repository of Computer Programming LOs.

Index Terms— Personalization, Content-based

Recommenders, Learning Objects.

I. INTRODUCCIÓN

n los últimos años, el uso de sistemas recomendadores se

ha transferido del campo del comercio electrónico al

ámbito académico. En este sentido, hay trabajos que plantean

herramientas de recomendación de cursos y actividades de

aprendizaje [8][13][15] y recomendadores que sugieren a los

profesores modificaciones para mejorar la efectividad de los

sistemas educativos web [9].

El uso de recomendadores en el ámbito académico tiene

otra clara y todavía no muy explotada aplicación:

proporcionar acceso personalizado a Objetos de Aprendizaje

(LOs, del inglés Learning Objects) que se hallan en

repositorios educativos. Normalmente el gran número de LOs

contenidos en estos repositorios dificulta el acceso a aquellos

que mejor se adaptan al conocimiento de cada estudiante, a

los objetivos y/o a las preferencias de cada uno. Esta

Almudena Ruiz-Iniesta, Guillermo Jiménez-Díaz y Mercedes Gómez-

Albarrán desempeñan sus tareas en la Facultad de Informática de la Universidad

Complutense de Madrid. c/ Prof. José García Santesmases s/n, 28040 Madrid,

España. (email: [email protected]; [email protected];

[email protected]).

DOI (Digital Object Identifier) Pendiente

dificultad la hemos podido constatar en un repositorio de

recursos docentes de la disciplina de Programación de

Computadores, disponible a través del Campus Virtual de la

Universidad Complutense de Madrid (España) durante los

últimos tres años. Este repositorio contiene más de 400

ejemplos resueltos y ejercicios para resolver de Programación,

destinados a estudiantes de “Introducción a la Programación”.

Aunque los estudiantes valoraban muy bien la ayuda que estos

recursos les proporcionan, el 70% de ellos echaba en falta

facilidades más sofisticadas para el acceso a los recursos.

En este artículo presentamos una aproximación que

extiende y mejora nuestro trabajo previo en recomendación de

LOs en repositorios web. En [10][11] describimos una

aproximación novedosa para recomendar LOs que sigue una

estrategia de recomendación híbrida en cascada [3]: un

recomendador basado en contenido reactivo y single-shot

actúa como recomendador inicial y sus decisiones son

refinadas por uno colaborativo. La estrategia de

recomendación empleada localizaba un conjunto relevante de

LOs después de que el estudiante hubiera planteado una

consulta al sistema. El resultado era una lista ordenada de

LOs. La prioridad era para aquellos LOs más similares a la

consulta del estudiante y que a la vez son los mejor valorados

por otros estudiantes. Esta aproximación ha sido

ejemplificada con el repositorio de LOs de Programación que

actualmente se utiliza para Introducción a la Programación en

la Universidad Complutense de Madrid.

La estrategia de recomendación previa mostraba una

desventaja: la recomendación basada en contenido, y por

extensión, la estrategia entera, proporcionaba una débil

personalización. La estrategia de recomendación

implementaba un tipo de personalización en-sesión: sólo tenía

en cuenta los objetivos a corto plazo del estudiante reflejados

en la consulta. De esta manera, dos estudiantes que planteen

la misma consulta en una sesión obtendrán las mismas

recomendaciones, incluso si sus objetivos de aprendizaje a

largo plazo y su destreza en el dominio difieren en gran parte.

Con el propósito de aliviar este inconveniente hemos

explorado un modelo de personalización fuerte. Como

veremos, esta mejora en la estrategia de recomendación

basada en contenido puede ser adaptada a los objetivos a largo

plazo de los estudiantes sin comprometer los intereses que en

la sesión puedan tener los LOs recomendados para el

Personalización en Recomendadores Basados en

Contenido y su Aplicación a Repositorios de

Objetos de Aprendizaje

A. Ruiz-Iniesta, G. Jiménez-Díaz y M. Gómez-Albarrán

E

IEEE-RITA Vol. 5, Núm. 1, Feb. 2010 31

ISSN 1932-8540 © IEEE

estudiante activo. En esta nueva estrategia basada en

contenido la prioridad es para aquellos LOs que son más

similares a la consulta y, al mismo tiempo, tienen una

utilidad pedagógica mayor de acuerdo a su perfil. En este

sentido, se satisfacen los objetivos a corto plazo reflejados en

la consulta del estudiante y las carencias de conocimiento

reflejadas en su perfil de estudiante. Esta nueva estrategia

basada en contenido encaja en la estrategia híbrida inicial, y

sus resultados pueden ser refinados por el recomendador

secundario (el colaborativo). Este trabajo tendrá una

aplicación directa en nuestras tareas docentes diarias en la

Facultad de Informática de la Universidad Complutense de

Madrid.

El artículo está organizado como se indica a continuación.

La sección II proporciona los detalles sobre las distintas

fuentes de conocimiento necesarias, independientemente del

ámbito educativo de aplicación. La sección III describe en

detalle las dos etapas de la recomendación, recuperación y

ordenación. La sección IV presenta una particularización de

la aproximación a un repositorio educativo de LOs de

Programación y ejemplifica una sesión de recomendación. La

última sección concluye el artículo, relaciona nuestra

aproximación con trabajos previos en el contexto de la

enseñanza de la Programación, y señala algunas líneas de

trabajo futuro.

II. LAS FUENTES DE CONOCIMIENTO

Recientemente las técnicas de recomendación se han

comenzado a utilizar en el ámbito académico y, en particular

en el contexto del aprendizaje. Coincidimos con los trabajos

descritos en [5][6] que el ámbito académico impone unos

requisitos específicos en el proceso de recomendación. Por

ejemplo, los recomendadores pueden sacar provecho del

estado cognitivo del estudiante, el cual cambia a lo largo del

tiempo. Esto permitiría incrementar el nivel de

personalización a largo plazo. Por otro lado, los itinerarios y

estrategias de aprendizaje también pueden proporcionar

información útil para el recomendador. Por ejemplo, el

recomendador puede sacar provecho de una regla pedagógica

simple como „ir de tareas fáciles a difíciles‟ o „reducir de

manera gradual la cantidad de orientación‟. Los itinerarios de

aprendizaje pueden representar rutas y secuencias diseñadas

por los profesores a partir de experiencias positivas en el aula,

o se pueden corresponder con el comportamiento de

estudiantes avanzados.

En este artículo describimos una aproximación que

proporciona un modelo de personalización fuerte para un

recomendador basado en contenido de LOs. Esta estrategia de

recomendación opera en dos etapas: recuperación y

ordenación. La etapa de recuperación busca aquellos LOs que

satisfagan, de manera aproximada, los objetivos a corto plazo

del estudiante, representados en la consulta (objetivos de

aprendizaje para la sesión). Estos LOs deben estar “listos para

ser explorados” por el estudiante de acuerdo a su nivel de

conocimiento y a los caminos de aprendizaje definidos. Una

vez que los LOs han sido recuperados, la etapa de ordenación

los ordena de acuerdo a la calidad asignada a cada LO. La

calidad se calcula de manera que la prioridad es para aquellos

LOs que son más similares a la consulta del estudiante, y al

mismo tiempo, tienen mayor utilidad pedagógica de acuerdo

al estado cognitivo del estudiante (objetivos de aprendizaje a

largo plazo).

La anterior estrategia de recomendación que proporcionaba

un modelo de personalización débil [10][11] necesitaba

conocimiento del dominio con el fin de calcular la similitud

entre la consulta y los conceptos del dominio cubiertos por los

LOs recuperados. Este nuevo modelo de personalización

fuerte impone algunos requisitos adicionales desde el punto

de vista de la representación del conocimiento. La etapa de

recuperación requiere de la existencia de caminos de

aprendizaje adecuados entre los conceptos del dominio así

como información del estado cognitivo de cada estudiante en

forma de perfiles persistentes. La etapa de ordenación

también utiliza el perfil del estudiante. Esta nueva estrategia

sigue un modelo de refuerzo de conocimiento que promueve

solventar las carencias de conocimiento del estudiante sin

dejar de lado los objetivos a largo plazo.

En esta sección detallamos las fuentes de conocimiento en

nuestra estrategia de recomendación: la ontología del dominio

(apartado A), los LOs y los metadatos que los describen

(apartado B) y el perfil del estudiante (apartado C). En la

Sección III se presenta una descripción en profundidad de las

distintas etapas de la recomendación.

A. La Ontología del Dominio

Proponemos utilizar una ontología para indexar los LOs

contenidos en el repositorio. Las ontologías proporcionan un

esquema general que permite incluir conocimiento sobre la

similitud entre los conceptos que representan los temas del

dominio. El conocimiento sobre la similitud entre los

conceptos y sobre las relaciones que existen entre ellos es

crucial en las etapas de la estrategia de recomendación.

Además las ontologías proporcionan un lenguaje común a la

hora de compartir información que puede ser utilizado por

profesores al añadir nuevos LOs y por los estudiantes cuando

realizan un consulta al recomendador. Existen otros autores

que también hacen un uso satisfactorio de las ontologías en el

ámbito académico [4].

La ontología está poblada con los conceptos del ámbito de

estudio (por ejemplo, Matemáticas, Derecho, o Programación

de Computadores). Estos conceptos se organizan en una

taxonomía utilizando la relación es_un. La ontología además

debe establecer una relación de precedencia entre conceptos.

Esta precedencia refleja el orden en el que los conceptos son

tradicionalmente estudiados en el campo correspondiente. La

precedencia ayuda a establecer los caminos de aprendizaje

32 IEEE-RITA Vol. 5, Núm. 1, Feb. 2010

ISSN 1932-8540 © IEEE

que se utilizarán en la etapa de recuperación para filtrar

aquellos LOs que ejemplifican conceptos no alcanzables a

partir del estado cognitivo de un estudiante.

B. Los Objetos de Aprendizaje

Los recomendadores cuentan con una colección de

productos que pueden ser recomendados a los usuarios del

sistema. En nuestro contexto estos productos son los LOs

contenidos en un repositorio educativo.

Nuestros LOs han sido desarrollados de acuerdo al estándar

LOM (del inglés, Learning Object Metadata). Con el fin de

describir nuestros LOs, hemos decidido utilizar en el más alto

nivel las siguientes categorías de LOM: General, Ciclo de

vida, Técnica, Educativa, Relación y Clasificación. La

categoría General veremos que juega un importante papel en

la etapa de recuperación. Esta categoría contiene palabras

clave que describen qué conceptos de la ontología están

cubiertos por el LO concreto. Estas palabras clave servirán de

punto de enlace entre los LOs contenidos en el repositorio y la

jerarquía de conceptos representada en la ontología.

El resto de las categorías permiten incluir información

descriptiva sobre el LO. Esta información no será utilizada en

las etapas de recomendación.

C. El Perfil de Estudiante

Como señalamos anteriormente, la personalización fuerte

tiene consecuencias desde el punto de vista de representación

del conocimiento. Una de estas consecuencias es la necesidad

de perfiles de estudiante persistentes.

El perfil del estudiante almacena información sobre su

historial de navegación –los LOs que ya ha explorado- y los

objetivos alcanzados en el proceso de aprendizaje. A los

conceptos que ya han sido explorados por el estudiante se les

asigna el nivel de competencia alcanzado en cada uno de

ellos. Este nivel se considera como el grado de satisfacción,

una métrica que permite al recomendador saber el nivel de

conocimiento que un estudiante tiene sobre un determinado

concepto. Como veremos, el nivel de competencia será un

elemento importante en la etapa de recuperación.

III. ESTRATEGIA DE RECOMENDACIÓN REACTIVA

COMBINANDO OBJETIVOS A CORTO Y LARGO PLAZO

Nuestra estrategia de recomendación basada en contenido

sigue una aproximación reactiva: el estudiante proporciona

una consulta y el recomendador responde con una

recomendación. El estudiante efectúa la consulta utilizando

los conceptos existentes en la ontología del dominio. Esta

consulta representa los objetivos para la sesión de

aprendizaje: los conceptos que el estudiante quiere aprender

en la sesión. La recomendación se compone de dos pasos,

recuperación y ordenación, que describimos en los siguientes

apartados.

A. Etapa de Recuperación

La etapa de recuperación busca un conjunto inicial de LOs

que satisfagan, de manera aproximada, la consulta planteada

por el estudiante. La etapa de recuperación primero intenta

encontrar LOs indexados exactamente por los conceptos de la

consulta. Si no hay LOs que satisfagan esta condición o si

estamos interesados en una localización más flexible, los LOs

indexados por un subconjunto de los conceptos (iguales o

similares) especificados en la consulta del estudiante serán

recuperados.

Este conjunto inicial de LOs es filtrado y sólo aquellos LOs

que cubren conceptos de la ontología “listos para ser

explorados” por el estudiante serán finalmente considerados

en la etapa de ordenación. Decimos que un concepto está

“listo para ser explorado” por un estudiante si de acuerdo a su

perfil y al itinerario de aprendizaje definido, cumple

cualquiera de las siguientes condiciones:

Es un concepto ya explorado por el estudiante, así que

aparecerá en el perfil con el correspondiente nivel de

competencia.

Es un concepto que el estudiante todavía no ha explorado

pero puede descubrirlo: si un concepto c1 precede a un

concepto c2 en la ontología, un estudiante puede

descubrir c2 si el nivel de competencia del estudiante

alcanzado en c1 supera un cierto “umbral de progreso”.

Si varios conceptos c1, c2, ..., ck son predecesores directos

de un concepto cx, cx puede ser descubierto si el nivel de

competencia de todos los predecesores directos supera el

“umbral de progreso” dado.

En resumen, el objetivo del proceso de filtrado es descartar

aquellos LOs indexados en la ontología por conceptos no

alcanzables para el estudiante activo. Esta etapa de filtrado

añadida a la etapa de recuperación presentada en [10][11],

proporciona una manera de personalización a largo plazo en

esta primera fase de la estrategia de recomendación. De esta

manera, ante una misma consulta formulada por dos

estudiantes distintos, el conjunto de LOs recuperados podría

variar significativamente en función del dominio de la

materia que tenga cada uno

B. Etapa de Ordenación

Recientemente se ha hecho evidente que las tradicionales

nociones de similitud no siempre son ideales, inspirando a

muchos investigadores a buscar alternativas para juzgar la

utilidad de un elemento en un contexto dado.

En el presente trabajo, proponemos reemplazar la métrica

de similitud pura utilizada en [10][11] con una métrica

basada en la calidad. Una vez que los LOs han sido

recuperados, la etapa de ordenación los ordena de acuerdo a

INIESTA, JIMÉNEZ Y ALBARRÁN: PERSONALIZACIÓN EN RECOMENDADORES BASADOS EN CONTENIDO... 33

ISSN 1932-8540 © IEEE

la calidad asignada a cada uno de ellos. La calidad se calcula

de manera que la prioridad es para aquellos LOs que son más

similares a la consulta del estudiante, y al mismo tiempo,

tienen mayor utilidad pedagógica de acuerdo al perfil del

estudiante.

A fin de calcular la calidad de un LO L para un estudiante

S que ha proporcionado una consulta Q hemos seleccionado

una métrica de calidad definida como la suma ponderada de

dos términos: la similitud (Sim) entre Q y los conceptos

cubiertos por L, y la utilidad pedagógica (UP) de L con

respecto al estudiante S:

Calidad(L,S,Q) Sim(L,Q) (1 ) UP(L,S), [0,1] (1)

A fin de calcular los dos resultados parciales, Sim y UP,

pueden utilizarse diferentes aproximaciones y métricas. De

esta manera, el modelo de ordenación aquí presentado ofrece

un marco de trabajo que puede ser instanciado desde distintas

estrategias de recomendación. A continuación presentamos

las decisiones tomadas.

El cómputo de la similitud Sim(L,Q) entre los conceptos

recogidos en la consulta Q y los conceptos que L cubre

requiere calcular la similitud entre dos conjuntos de

conceptos. Existen diferentes métricas que pueden usarse en

casos como éste. En concreto, nos hemos decidido por una

simplificación de la similitud entre conjuntos de conceptos

que consiste en comparar los conceptos individuales que

resultan de la conjunción de cada uno de los conjuntos de

conceptos –el concepto que resulta de la conjunción de los

conceptos de la consulta (Q_CC) y el concepto que resulta de

la conjunción de los conceptos que cubre L (L_CC)– en lugar

de comparar directamente dos conjuntos de conceptos.

Asumiendo esta simplificación, podemos emplear cualquiera

de las métricas aceptadas para comparar dos valores

jerárquicos. Por nuestra parte, hemos decidido utilizar la

métrica de similitud definida en [12]:

super( _ ) super( _ )( , )

super( _ ) super( _ )

Q CC L CCSim L Q

Q CC L CC

(2)

donde super(Q_CC) representa el conjunto de todos los

conceptos contenidos en la ontología que son superconceptos

de Q_CC y super(L_CC) contiene todos los conceptos

contenidos en la ontología que son superconceptos de L_CC.

En consecuencia, el valor de Sim(L,Q) se encuentra en el

intervalo [0, 1].

En resumen, esta métrica de similitud calcula la relevancia

de un LO debida a los objetivos de la sesión (reflejados en la

consulta propuesta por el estudiante) que L satisface, lo que

hemos llamado los objetivos a corto plazo. Cuanto mayor es

el número de conceptos de la consulta que L permite

aprender, mayor será el valor de la similitud. Cuanto más

similares sean los conceptos que cubre L y los conceptos

explicitados en la consulta, mayor será el valor de similitud.

Como podemos observar, el conocimiento de la similitud

entre los conceptos representados en la ontología es crucial en

nuestro contexto.

A fin de medir la utilidad pedagógica que el LO L muestra

para un estudiante S dado, UP(L,S), hemos adoptado una

estrategia pedagógica que promueve completar las carencias

de conocimiento del estudiante incluyendo conocimientos de

refuerzo [17]. El objetivo es asignar una utilidad pedagógica

mayor a L si éste cubre conceptos en los cuales el estudiante

ha demostrado tener un bajo nivel de competencia. De esta

manera, L puede ayudar al estudiante a reforzar sus

conocimientos sobre esos conceptos y así alcanzar sus

objetivos de aprendizaje a largo plazo. Este refuerzo de

conocimiento podría asignar prioridad a LOs que el

estudiante todavía no ha explorado, o puede repartirla de una

manera igualitaria entre los LOs explorados y no explorados.

Hemos optado por calcular la utilidad pedagógica de

acuerdo a la siguiente fórmula:

UP(L,S) 1 MAN(L,S) (3)

donde MAN(L, S) es la media aritmética normalizada de los

niveles de competencia alcanzados por el estudiante S en los

conceptos cubiertos por L, de modo que MAN(L, S) estará en

el intervalo [0, 1]. UP(L, S) también toma valores en el

intervalo [0, 1].

Resumiendo, (3) calcula valores bajos para la UP(L,S) si el

estudiante ha demostrado buen conocimiento en los conceptos

cubiertos por L. Por el contrario se obtienen valores altos de

UP(L,S) si el estudiante tiene un bajo nivel de conocimiento

en la mayor parte de los conceptos que cubre L. Además (3)

trata de igual manera los LOs explorados y no explorados.

La medida de calidad resultante definida en (1), junto con

la Similitud (2) y la utilidad pedagógica expuesta en (3),

permite introducir un considerable grado de personalización

en la etapa de ordenación. La calidad de un LO finalmente

propuesto para un estudiante depende parcialmente de la

utilidad pedagógica que el LO tiene para conseguir los

objetivos a largo plazo del estudiante. La influencia final de la

utilidad pedagógica y, como consecuencia, el nivel de

personalización conseguido en la lista final de LOs

recomendados puede ser controlado por medio del valor

asignado al peso utilizado en (1). Valores bajos de le dan

la prioridad a la utilidad pedagógica en contra de la similitud

con la consulta. En particular, = 0 representa el nivel más

alto de personalización a largo plazo, y en este caso, la

consulta (objetivos para la sesión) sólo se utiliza en la etapa

de recuperación. Esto asegura que el recomendador propone

LOs que cumplan con los objetivos de la sesión a un nivel

mínimo, aunque el orden en el cual son propuestos al

estudiante está totalmente influenciado por los objetivos a

largo plazo que permiten alcanzar (su capacidad de refuerzo

de conocimientos ya manejados). Por el contrario, valores

altos de α dan prioridad a la similitud con la consulta frente a

la utilidad pedagógica.

Una vez que el valor de utilizado en (1) se fija, el

recomendador muestra el mismo comportamiento, en lo que

respecta al tipo de personalización que ofrece, para todos los

34 IEEE-RITA Vol. 5, Núm. 1, Feb. 2010

ISSN 1932-8540 © IEEE

estudiantes. Podemos obtener un comportamiento más

flexible si, en un recomendador dado, puede tomar

diferentes valores. De esta manera, el recomendador muestra

una mayor adaptabilidad para los potenciales usuarios. Por

ejemplo, el valor de puede depender del tipo de estudiante

que utiliza el recomendador. Valores altos de puede ser

apropiados para los buenos estudiantes, aquellos cuyos

perfiles muestran un buen rendimiento. Estos estudiantes rara

vez necesitaran reforzar conocimientos y el recomendador

podría centrarse en sus objetivos de aprendizaje de la sesión

dando prioridad a aquellos LOs que están más

correlacionados con la consulta. Por el contrario, valores

bajos de α pueden ser apropiados para estudiantes con bajo

rendimiento, de tal manera que el recomendador fomente

solventar sus carencias de conocimiento sin comprometer

significativamente los intereses del estudiante reflejados en la

consulta.

IV. APLICACIÓN DE LA ESTRATEGIA A UN REPOSITORIO DE

RECURSOS EDUCATIVOS DE PROGRAMACIÓN

En esta sección, describimos el proceso de aplicación de la

aproximación general a un repositorio de recursos educativos

de Programación que en la actualidad se utiliza como

material de apoyo en las asignaturas de “Introducción a al

Programación” en nuestra centro docente. Comenzaremos

detallando las fuentes de conocimiento: la ontología, los LOs

y el perfil del estudiante. A continuación, ejemplificaremos

una sesión de recomendación y compararemos los diferentes

resultados obtenidos para distintos valores del parámetro α en

(1).

Utilizamos una ontología de conceptos de programación

que nos permite indexar los LOs contenidos en el repositorio.

Esta ontología está basada en otras ontologías existentes sobre

Programación [18]. En la Fig. 1 se muestra un fragmento de

la ontología. Por ejemplo, vemos que en la ontología se

encuentra definido el concepto Bucle que subsume aquellos

conceptos relacionados con las estructuras iterativas en C++

como, por ejemplo, while y do_while (véase la relación es que

se muestra en la figura). La relación de precedencia definida

trata de reflejar la secuenciación tradicional utilizada en la

enseñanza de la programación (véase la relación sec mostrada

en la figura). Observamos que el concepto Bucle debería

aprenderse después del concepto Condicional y antes que

Array.

En nuestro repositorio existen distintos LOs de

Programación: notas teóricas, ejemplos de código, ejercicios

de programación resueltos, preguntas de examen, exámenes

(conjuntos de preguntas de exámenes) y ejercicios de

programación.

En la Fig. 1 también se encuentra reflejado los niveles de

competencia mostrados por el estudiante utilizado en el

ejemplo de recomendación. Por supuesto, en la práctica esta

información no está incluida en la ontología, pero la hemos

incluido en la Fig. 1 con el fin de que al lector le resulte fácil

visualizar el estado cognitivo del estudiante tomado como

ejemplo.

El perfil de estudiante refleja el valor del nivel de

competencia alcanzado en cada concepto en el que el

estudiante ha sido evaluado. Estos son los conceptos que

consideramos “ya explorados”. En este caso, los conceptos

Array y Registro no han sido explorados por el estudiante.

Podemos observar que el concepto Array está “listo para ser

explorado” por el estudiante, de acuerdo a las condiciones

mencionadas en la sección III.A, si consideramos que el

“umbral de progreso” toma un valor en el intervalo (0, 5]: el

nivel de competencia para el concepto Bucle es 5 por lo que el

concepto Array puede ser descubierto.

El perfil del estudiante se actualiza mediante unos test que

el estudiante puede realizar en cualquier momento para

evaluar sus niveles de competencia. Si el perfil de estudiante

no ha sido actualizado en un periodo largo de tiempo, el

sistema puede sugerir al estudiante que realice un test con el

fin de actualizar su perfil.

Los test permiten calcular el conocimiento del estudiante

sobre los conceptos de más bajo nivel de la ontología. El nivel

de competencia de los conceptos de alto nivel en la ontología

Tabla 1. Un conjunto de LOs del repositorio junto con los

conceptos que cubren, su similitud con la consulta, la media

aritmética normalizada (MAN) y la utilidad pedagógica (UP),

así como la calidad para distintos valores de en (1).

LOs y Conceptos Sim MAN UP Calidad

α=1 α=0.5 α=0.25 α=0

L01 (if, for) 1 6.5 0.35 1 0.67 0.51 0.35

L02 ( if, while,

registro)

-- -- -- -- -- -- --

L03 (switch, for) 0.75 4.5 0.55 0.75 0.65 0.6 0.55

L04 (switch, while,

array)

0.45 3 0.7 0.45 0.57 0.64 0.7

L05 (if, while) 0.75 4 0.6 0.75 0.67 0.64 0.6

L06 (if, for) 1 6.5 0.35 1 0.67 0.51 0.35

L07 (if, for, while) 0.89 4.3 0.57 0.89 0.73 0.65 0.57

L08 (if, for,

do_while)

0.89 7.6 0.24 0.89 0.57 0.4 0.24

L09 (if, for, array) 0.89 6 0.4 0.89 0.65 0.52 0.4

L10( if, for, switch) 0.89 5.6 0.44 0.89 0.67 0.55 0.44

Fig. 1. Una parte de la ontología y una esquematización de los niveles de

competencia de un estudiante.

INIESTA, JIMÉNEZ Y ALBARRÁN: PERSONALIZACIÓN EN RECOMENDADORES BASADOS EN CONTENIDO... 35

ISSN 1932-8540 © IEEE

se calculan de acuerdo a la media aritmética de los niveles de

competencia de aquellos conceptos que subsumen.

A. Una Sesión de Recomendación

Comencemos señalando los compromisos adoptados en el

ejemplo. Con respeto a la etapa de recuperación:

Consideramos un proceso de recuperación flexible que

busca LOs indexados por los conceptos de la consulta y

sus hermanos en la ontología. Por ejemplo, si la consulta

contiene el concepto if, el conjunto inicial de LOs que

satisfacen esta condición serán todos aquellos que cubran

algún subconcepto de Condicional.

Asumimos que el umbral de progreso está fijado en 5, el

valor medio del intervalo [0, 10]. El nivel de competencia

de cada concepto toma un valor en el intervalo [0, 10].

Con respecto a la etapa de ordenación debemos señalar que

para calcular el valor de MAN(L,S) cuando L cubre conceptos

que todavía no han sido explorados (es decir, no tienen un

nivel de competencia asociado) se ha adoptado el criterio de

asignar a dichos conceptos un valor de nivel de competencia

intermedio en la escala considerada. De esta manera los

resultados de las valoraciones no se verán influenciados por

estos conceptos que carecen de nivel de competencia.

Una vez que los LOs han sido ordenados, sólo cuatro de

ellos serán mostrados al estudiante. Necesariamente el

número de recursos que se le muestran al estudiante debe ser

limitado para no sobrecargar de trabajo al estudiante en cada

sesión de aprendizaje.

Supongamos que los conceptos que el estudiante quiere

aprender en la sesión son if y for. Entonces seleccionará estos

conceptos en la consulta, quedando ésta definida como Q = if

+ for. La columna izquierda de la Tabla 1 muestra un

subconjunto de LOs contenidos en el repositorio y los

conceptos que cubren cada uno de ellos. Todos estos LOs

serán recuperados excepto L02. L02 cubre el concepto

Registro, que no puede ser explorado por el estudiante actual

de acuerdo a su perfil: todavía no ha explorado el concepto

Array que es el predecesor de Registro.

En la Tabla 1 también se muestra la Similitud con la

consulta, el valor de MAN y la utilidad pedagógica UP para

cada LO recuperado. También se muestra una comparación

de la Calidad calculada para distintos valores de α en (1).

Si α = 1 (ver Tabla 1, Columna α = 1), la métrica de

calidad es igual a la similitud entre el LO y la consulta. Con

este valor obtenemos una personalización en-sesión, debido a

que UP no es tenida en cuenta. Sólo aquellos LOs que están

altamente relacionados con la consulta del estudiante –

aquellos LOs que cubren exactamente los mismos conceptos

especificados en la consulta, seguidos de aquellos LOs que

cubran los conceptos de la consulta y alguno más– son los

candidatos a ser recomendados. De este modo, las principales

recomendaciones apenas diferirán entre sí. Como

consecuencia, si a un estudiante no le gustan las primeras

recomendaciones probablemente tampoco estará satisfecho

con las siguientes. Esto se conoce como el problema de la

sobreespecialización o la falta de diversidad.

Si α = 0.5 (ver Tabla 1, Columna α = 0.5), la similitud con

la consulta y la utilidad pedagógica tienen el mismo peso en

(1). Los LOs que están altamente relacionados con la consulta

siguen siendo los propuestos. Sin embargo, son reordenados

de manera que la prioridad en este caso es para L07 que, al

mismo tiempo, cubre conceptos que tienen bajos niveles de

competencia en el perfil del estudiante. Podemos observar que

L05, que cubre un concepto que tiene un bajo nivel de

competencia en el perfil de estudiante, también es propuesto

en la recomendación.

Si α = 0.25 (ver Tabla 1, Columna α = 0.25), la utilidad

pedagógica tiene mayor peso que la similitud con la consulta.

En este caso, el recomendador proporciona aquellos LOs que

mejor se adaptan al perfil del estudiante. Estos LOs serán

aquellos que promuevan solventar las carencias de

conocimiento del estudiante. El concepto switch tiene un nivel

de competencia igual a 4; L03 y L04 tratan de remediar esa

carencia. El concepto while tiene un nivel de competencia

igual a 0; L04, L05 y L07 tratan de solventar esta carencia.

En esta estrategia los LOs recomendados son más diversos.

Cada LO refuerza diferentes conceptos. Este valor de α

proporciona una personalización fuerte y una diversidad

adecuada en los LOs recuperados, sin comprometer

significativamente el interés que para la sesión puedan tener

los LOs.

Por último, si consideramos α = 0 (Tabla 1, Columna α =

0) sólo la utilidad pedagógica es considerada. Podemos

observar que el primer LO propuesto es el más diferente a la

consulta. Desde nuestro punto de vista, creemos que estos

resultados pueden resultar confusos para el estudiante.

A la vista de los resultados que hemos obtenido explorando

distintos valores de α, distintas partes de la ontología y

diferentes perfiles de estudiante, considerados que debe

adoptarse un compromiso en la elección de α y en la

flexibilidad de la etapa de recuperación. Asumiendo una

estrategia de recuperación como la aquí propuesta,

consideramos que el valor de α debería estar en el rango que

va desde 0.25 hasta 0.5. Por ejemplo, α = 0.5 puede ser

utilizado para aquellos estudiantes cuyos perfiles muestran un

buen rendimiento. En cambio, α = 0.25 puede ser apropiado

para estudiantes con bajo rendimiento.

V. CONCLUSIONES, TRABAJO RELACIONADO Y TRABAJO

FUTURO

En este artículo hemos describo una aproximación

novedosa en recomendación basada en contenidos de LOs que

fomenta altos niveles de personalización. Hemos mostrado su

aplicación en el dominio de la Programación pero la

estrategia puede ser aplicada en cualquier otro dominio

educativo.

36 IEEE-RITA Vol. 5, Núm. 1, Feb. 2010

ISSN 1932-8540 © IEEE

Los primeros sistemas dedicados a la enseñanza de la

Programación basados en ejemplos tenían una interfaz

sencilla que seleccionaba ejemplos relevantes y proporcionaba

búsquedas a partir de palabras claves que aparecían en el

enunciado del problema o en el código del mismo [7]. Estas

herramientas no tenían en cuenta el conocimiento actual del

estudiante, así que podían recuperar ejemplos que trataban

conceptos que el estudiante todavía no sabía, o incluso

conceptos que todavía no estaba preparado para aprender.

Otros entornos dejaban en manos del estudiante la

responsabilidad de buscar los ejemplos permitiéndole explorar

el repositorio completo a su gusto. WebEx [1], un sistema

para explorar ejemplos de programación comentados

desarrollados en el lenguaje C, es un ejemplo de este tipo de

entornos.

Recientes investigaciones en recursos educativos han

señalado la necesidad de la adaptación en los entornos

educativos. NavEx [19], una evolución de WebEx, clasifica

ejemplos de acuerdo al estado actual de los conocimientos del

estudiante y su historia pasada de interacciones con el

sistema. Este sistema aplica navegación adaptada para: (a)

distinguir nuevos ejemplos de ejemplos que han sido parcial o

totalmente explorados y (b) categorizar ejemplos que están

“listos para” o “todavía no preparados para” ser explorados de

acuerdo al estado actual de los conocimientos del estudiante.

Las aproximaciones empleadas en WebEx y NavEx

proporcionan un gran nivel de flexibilidad desde el punto de

vista del estudiante. Sin embargo los problemas aparecen

cuando estas aproximaciones se utilizan en repositorios con

un gran número de recursos disponibles. En este caso, los

estudiantes pueden llegar a perderse entre los recursos. Por

este motivo, consideramos necesario la inclusión de algún

mecanismo que ayude al estudiante a localizar aquellos LOs

relevantes para él.

Algunos repositorios educativos utilizan navegación social

para resolver el problema de encontrar el siguiente ejemplo a

explorar. Este es el caso de Knowledge Sea [2], una

plataforma de acceso electrónico a documentos sobre el

lenguaje de programación C que incorpora navegación social.

El motor de búsqueda de Knowledge Sea utiliza un vector de

valoraciones para ordenar los LOs recuperados de acuerdo a

su relevancia expresada mediante indicaciones visuales.

La mayoría de las bibliotecas digitales de recursos

educativos se basan principalmente en la recuperación basada

en contenido [14]. Los LOs son consideradors como

documentos y los motores de búsqueda aplican métodos de

recuperación de información, como el modelo del espacio

vectorial, para recuperar aquellos LOs que satisfagan la

consulta del estudiante. Los métodos de filtrado híbrido que

combinan técnicas basadas en contenido con aspectos

colaborativos se están utilizando en los sistemas

recomendadores. Sin embargo, constituyen una novedad en el

acceso a repositorios de recursos educativos. El trabajo aquí

presentado constituye un avance en este sentido. Hemos

diseñado una sofisticada estrategia de recomendación basada

en contenido que encaja perfectamente en la estrategia

híbrida presentada en [10][11].

Actualmente, utilizamos la información sobre la historia de

navegación almacenada en el perfil con el fin de marcar

visualmente que el LO ya ha sido explorado. Un refinamiento

de la métrica de calidad podría tener en cuenta esta

característica con el fin de penalizar los LOs ya explorados.

Para finalizar, en la estrategia reactiva aquí presentada el

estudiante debe proponer una consulta al sistema que

represente sus objetivos de aprendizaje a corto plazo en

términos de los temas en los que está interesado. Plantear esta

consulta impone una curva de uso para aquellos estudiantes

que tienen poco conocimiento del domino. Con el fin de

aliviar esta desventaja, tenemos la intención de complementar

la aproximación reactiva con una estrategia de

recomendación proactiva que proponga al estudiante LO que

le puedan resultar interesantes en una sesión de aprendizaje,

sin necesidad de que éste realice una consulta al sistema. El

trabajo preliminar sobre la estrategia proactiva aparecen en

[16].

AGRADECIMIENTOS

Este trabajo ha sido parcialmente desarrollado y financiado

por el proyecto TIN2009-13692-C03-03 del Ministerio de

Ciencia e Innovación.

REFERENCES

[1] P. Brusilovsky, “WebEx: Learning from Examples in a Programming

Course”, in Proc. World Conf. of the WWW and Internet, AACE,

Orlando, FL, 2001, pp. 124-129.

[2] P. Brusilovsky, R. Farzan and J-w. Ahn, “Comprehensive personalized

information access in an educational digital library”, in Proc. ACM/IEEE-

CS Joint Conf. on Digital libraries, ACM, Denver, CO, USA, 2005, pp.

9-18.

[3] R. Burke, “Hybrid Web Recommender Systems”, in The Adaptive Web,

LNCS, Vol. 4321, 2007, pp.377-408.

[4] J.M. Dodero, P. Díaz, ,I. Dodero, A. Sarasa, “Integrating Ontologies into

the Collaborative Authoring of Learning Objects”, in J. of Universal

Computer Science, vol. 11 no. 9, pp.1568-1575, 2005.

[5] H. Draschler, H. Hummel, and R. Koper, “Recommendations for learners

are different: Applying memory-based recommender systems techniques to

lifelong learning”, in Workshop on Social Information Retrieval for

Technology-Enhanced Learning, 2007.

[6] H. Draschler, H. Hummel, and R. Koper, “Personal Recommender

Systems for learners in lifelong learner networks: the requirements,

techniques and model”, in Int. J. of Learning Technologies, vol 3, no 4,

pp. 404-423, 2008.

[7] J.M. Faries, and B.J. Reiser, “Access and Use of Previous Solutions in a

Problem Solving Situation”, in Procs. 10th Annual Conference of the

Cognitive Science Society, Lawrence Erlbaum Associates, Montreal,

1998, pp. 433-439.

[8] R. Farzan, and P. Brusilovsly, “Social navigation support in a course

recommender system”, in Proc. Int. Conf. on Adaptive Hypermedia and

Adaptive Web-based Systems, Springer Verlag, Berlin, 2006, pp. 91-100.

[9] E. García-Salcines, C. Romero-Morales, S. Ventura-Soto, and C. Castro-

Lozano, “Sistema recomendador colaborativo usando minería de datos

distribuida para la mejora continua de cursos e-learning”. IEEE-RITA, vol.

3, no. 1, pp. 19-30, 2008.

[10] M. Gómez-Albarrán, and G. Jiménez-Díaz, “Recommendation and

Students‟ Authoring in Repositories of Learning Objects: A Case-Based

INIESTA, JIMÉNEZ Y ALBARRÁN: PERSONALIZACIÓN EN RECOMENDADORES BASADOS EN CONTENIDO... 37

ISSN 1932-8540 © IEEE

Reasoning Approach”, in Int. J. on Emerging Technologies in Learning,

vol. 4 no. Special Issue, pp. 35-40, 2009.

[11] M. Gómez-Albarrán, S. Bautista-Blasco, and J. Carrillo de Albornoz,

“Personalized Access and Students‟ Coauthoring in Repositories of

Learning Objects: The Case of a Repository of Programming Examples”,

in Proc. Int. Conf. on Advanced Learning Technologies, IEEE, Los

Alamitos, CA, 2008, pp. 693-695.

[12] P. González-Calero, B. Díaz-Agudo, and M. Gómez-Albarrán, “Applying

DLs for Retrieval in Case-Based Reasoning”, in Int. Workshop on

Description Logics, 1999, pp. 51-55.

[13] H. Hummel, B. Van den Berg, A. Berlanga, H. Drachsler, J. Jansenn, R.

Nadolski, and R. Koper, “Combining social-based and information-based

approaches for personalised recommendation on sequencing learning

activities”, in Int. J. of Learning Technology, vol. 3, no. 2, pp. 152-168,

2007.

[14] C. Lagoze, W. Arms, S. Gan, D. Hillmann, C. Ingram, D. Krafft, R.

Marisa, J. Phipps, J. Saylor, C. Terrizzi, W. Hoehn, D Millman, J. Allan,

S. Guzman-Lara, T. Kalt, “Core services in the architecture of the national

science digital library (NSDL)”, in Proc. 2nd ACM/IEEE-CS Joint Conf.

on Digital libraries, ACM, Portland, Oregon, USA, 2002, pp. 201-209.

[15] M. O' Mahony, and B. Smyth, “A Recommender System for On-line

Course Enrolment: An Initial Study”, in Proc. ACM Conf. on

Recommender Systems, ACM, Minneapolis MN, USA, 2007, pp.133-136.

[16] A. Ruiz-Iniesta, G. Jiménez-Díaz, and M. Gómez-Albarrán,

“Recommendation in Repositories of Learning Objects: A Proactive

Approach that Exploits Diversity and Navigation-by-Proposing”, in Proc

9th IEEE International Conference on Advanced Learning

Technologies, IEEE Computer Society, Riga, Latvia, 2009, pp. 543-545.

[17] J. Siemer, and M.C. Angelides, “Towards an Intelligent Tutoring System

Architecture that Supports Remedial Tutoring”, in Artificial Intelligence

Review, vol. 12, no. 6, pp. 469-511, 1998.

[18] S. Sosnovsky, and T. Gavrilova, “Development of educational ontology for

C-programming”, in Int. J. Information, Theories & Applications, vol. 13,

no. 4, pp. 303-307, 2006.

[19] M. Yudelson, and P. Brusilovsky, “NavEx: Providing Navigation Support

for Adaptive Browsing of Annotated Code Examples”, in Proc. Int. Conf.

on Artificial Intelligence in Education, IOS Press, Amsterdam, 2005, pp.

710-717.

Almudena Ruiz Iniesta es Ingeniera en

Informática por la Universidad Complutense de

Madrid. Actualmente realiza su tesis doctoral en el

Departamento de Ingeniería del Software e

Inteligencia Artificial de la Universidad

Complutense de Madrid sobre la aplicación de

técnicas de recomendación al dominio del e-

learning.

Guillermo Jiménez Díaz es Ingeniero en

Informática y Doctor en Informática por la

Universidad Complutense de Madrid. En la

actualidad es Ayudante Doctor del Departamento de

Ingeniería del Software e Inteligencia Artificial de

la Universidad Complutense de Madrid. También es

miembro del Grupo de Aplicaciones en Inteligencia

Artificial, grupo de investigación consolidado en la

UCM. Su tesis doctoral trató sobre el traslado de

técnicas de aprendizaje activo a entornos virtuales

para la enseñanza de Programación Orientada a

Objetos. Su interés investigador actual se centra en

el estudio y uso de técnicas de recomendación en distintos dominios como son el

e-learning, la recomendación para grupos y el matchmaking en videojuegos.

Mercedes Gómez-Albarrán es Licenciada en

Ciencias Físicas y Doctora en Informática por la

Universidad Complutense de Madrid. En la

actualidad es Profesora Titular del Departamento

de Ingeniería del Software e Inteligencia Artificial

de la Universidad Complutense de Madrid y

desempeña el cargo de Secretaria de la Facultad de

Informática de la misma universidad. Inició su

labor investigadora en la confluencia de la

Ingeniería del Software y las técnicas de

Inteligencia Artificial (especialmente, el

Razonamiento Basado en Casos). Actualmente

trabaja en temas relacionados con técnicas

personalizadas de recomendación y su aplicación al ámbito del e-learning. Su

interés investigador también se centra en el uso de videojuegos y entornos

virtuales en el ámbito educativo. Ha sido investigadora responsable de varios

proyectos de innovación educativa y es autora de más de 40 trabajos publicados

en revistas y actas de conferencias internacionales.

38 IEEE-RITA Vol. 5, Núm. 1, Feb. 2010

ISSN 1932-8540 © IEEE