20
Multimedia Content Enrichment as a service di: Audio, Video, Documenti [email protected]

SyNTHEMA multimedia content enrichment

Embed Size (px)

Citation preview

Multimedia Content Enrichment

as a service di: Audio, Video, Documenti

[email protected]

La tecnologia semantica

Le aree tecnologiche

[email protected]

Modelli del Dictionaries Grammatiche

BACK-END

Knowledge Base & s

Na

tura

l Lan

gu

ag

eU

nd

ersta

nd

ing

Trascriz

ion

e

Au

tom

atica

Content enrichmentPlatform as a service

INPUTTV/Video

Analisi Lessicale & Semantica

Modelli del linguaggio

Base & Ontologie

Dictionaries

Na

tura

l Lan

gu

ag

eU

nd

ersta

nd

ing

Dizionari

Se

ma

ntic

Pro

cessin

g

Trascriz

ion

e

Au

tom

atica

Fo

nti in

form

ative

mu

ltime

dia

li: au

dio

, vid

eo

,

OUTPUT

Trascrizione Audio/Video

Sincronizzazione trascrizione/video& sottotitolazione

Radio/Audio

4

Categorizzazione

Estrazione Concetti e relazioni

Estrazione entità/data mining

Se

ma

ntic

Pro

cessin

g

Fo

nti in

form

ative

mu

ltime

dia

li: au

dio

, vid

eo

, do

csSentiment/reputation analysis

[email protected]

& sottotitolazione

Docs

Web

Social

Speech Technology

• Speech to Text: speaker independent ASR (Automatic SpeechRecognition) engineRecognition) engine

• Audio indexing: produce automaticamente la trascrizione integrando timecode e confidence score a livello di singola parola

• Prestazioni real time: in sync con live o streamed audio. Dispone di un vasto vocabolario customizzabile

• Identificazione speaker e lingua: identifica lo speaker in condizioni audio variabili (broadcast video, meeting recording, telephone audio). Riconosce audio speech e non speechtelephone audio). Riconosce audio speech e non speech(musica, silenzi). Identifica lingua parlata e genere

• Sincronizzazione automatica: match della trascrizione con i contenuti audio/video (script e sottotitoli). Assegna timecodead ogni parola dell’audio

[email protected] 5

Semantic technology

• Comprensione semantica: fornisce accesso di tipo deep semantic alle informazioni. Funzionalità di categorizzazione dinamica per grandi quantità distribuite di testo, audio e video.quantità distribuite di testo, audio e video.

• Ricerca semantica: sintassi semplificata delle query di ricerca. Espande i risultati, escludendo quelli non rilevanti rispetto al profilo utente

• Brand reputation: consente agli analisti di identificare e comprendere la percezione dei prodotti e servizi di un’azienda da parte dei consumatori. Indica quali aspetti della comunicazione devono essere messi in risalto

• Sentiment analysis: analizza i documenti per far comprendere chi sta parlando di cosa, quando e in quale senso, misurando la polarità dei parlando di cosa, quando e in quale senso, misurando la polarità dei commenti

• Categorizzazione e clustering automatico: assegna le informazioni a categorie predefinite e/o custom oppure identifica i cluster di informazioni omogenee che descrivono un set di documenti

[email protected]

La piattaforma Kms/Synuosa

[email protected]

il Metodo: dalle Parole ai Concetti, ai loro Ruoli

Analisi e comprensione automatica del

linguaggio attraverso la sua

• Trascrizione automatica

• Analisi Morfo-sintattica

• Analisi Logica

[email protected] 8

• Analisi Semantica

• Analisi di Sentiment

• Analisi Statistica

Un esempio, i Telegiornali come Fonti informative: la Trascrizione Automatica Speaker – Independent

[email protected] 9

E’ possibile ricercare nel corpus le informazioni di interesse mediante una forma di

interrogazione facilitata, quella del linguaggio colloquiale. Il sistema trasforma

l’interrogazione espressa in forma libera, colloquiale, in chiavi concettuali di ricerca: il

sistema identifica cioè nella frase «la riforma del lavoro della Fornero» i concetti

principali e le relazioni logiche intercorrenti fra questi, usandoli come chiavi di ricerca.

Non è necessario conoscere la logica degli operatori booleani per scoprire le

informazioni più rilevanti e pertinenti ai propri interessi.

La Ricerca Semantica sui video

informazioni più rilevanti e pertinenti ai propri interessi.

Il sentiment e la radicalizzazione del

commento sono calcolati automaticamente.

Il sistema calcola il «sentiment generale», Il sistema calcola il «sentiment generale»,

che identifica il tono – il «mood» - del

commento, e il «sentiment tematico», che

descrive invece la polarità del commento

rispetto ad aspetti di interesse per il cliente

(ad esempio, sicurezza, soddisfazione

generale, leadership)Cliccando sul link ipertestuale si

accede direttamente al video, nel

punto esatto in cui viene detto

quanto specificato nello snippet

risultato della ricerca

[email protected] 10

Il Cloud dei Concetti, il colpo d’occhio sui risultati

E’ possibile esplorare il concetto e l’insieme

delle sue occorrenze nel testo, potendone

visualizzare la rete delle relazioni logico-

funzionali con altri concetti

Il Cloud Concettuale contiene i concetti più ricorrenti all’interno

dei risultati della ricerca. E’ possibile filtrare il Cloud secondo le

diverse parti del discorso (nome comune, nome proprio, verbo,

etc), oppure secondo le diverse categorie semantiche (persone,

aziende, luoghi, etc). Il Cloud crea un’associazione spontanea di

idee utile per una successiva ricerca, per la selezione di materiale

e/o suo approfondimento investigativo.

[email protected] 11

Il «ministro» «Elsa Fornero» «ribatte» in «Senato» alle «critiche» sul«nodo» degli «esodati». C’è una «mozione di sfiducia» del «Carroccio»

Lo Spazio delle Relazioni,

capire il perché delle cose

[email protected] 12

La Dashboard Quantitativa visualizza la distribuzione dei

contributi informativi per canale di comunicazione, per

fonte, rilevando il sentiment/radicalizzazione per le fonti

più autorevoli, rilevando il buzz. Permette di capire chi

parla di SOGEI, dove se ne parla, coglie nel tempo gli

eventi che hanno avuto un’incidenza virale tra le

Il modulo _ANALISI QUANTITATIVA

Il modulo _ANALISI QUANTITATIVA

eventi che hanno avuto un’incidenza virale tra le

persone

Il sistema registra sia il sentiment generale, il mood

del post, sia il giudizio espresso dalle persone rispetto

agli attributi di marca del cliente (efficienza,

auterevolezza, etc). Il sistema coglie le sfumature del

linguaggio colloquiale (ironia, sarcasmo, etc),

gestendo la comunicazione gergale di Twitter

[email protected] 13

Il Cloud Concettuale contiene i concetti più ricorrenti all’interno dei risultati

della ricerca. E’ possibile filtrare il Cloud secondo le diverse parti del discorso

(nome comune, nome proprio, verbo, etc), oppure secondo le diverse

categorie semantiche (persone, aziende, luoghi, etc). Il Cloud crea

un’associazione spontanea di idee utile per una successiva ricerca, per la

selezione di materiale e/o suo approfondimento investigativo. Il Cloud rende

Il modulo _ANALISI QUALITATIVAIl cloud concettuale

l’esempio SOGEI

Il modulo _ANALISI QUALITATIVA:

Il Cloud Concettuale

selezione di materiale e/o suo approfondimento investigativo. Il Cloud rende

conto della distanza di un prodotto dai suoi attributi di marca: quali

termini, verbi o aggettivi sono maggiormente associati ad un prodotto

nell’insieme dei commenti?

Marco Milanese, le indagini e la P4 rappresentano per SOGEI una

potenziale crisi reputazionale

[email protected] 14

E’ possibile esplorare il concetto e l’insieme delle

sue occorrenze nel testo, potendone visualizzare

la rete delle relazioni logico-funzionali con altri

concetti

E’ possibile ricercare nel corpus le informazioni di

interesse mediante una forma di interrogazione

facilitata, quella del linguaggio colloquiale. Il sistema

trasforma l’interrogazione espressa in forma libera,

colloquiale, in chiavi concettuali di ricerca: il sistema

identifica cioè nella frase i concetti principali e le

Il modulo _ANALISI QUALITATIVA

identifica cioè nella frase i concetti principali e le

relazioni logiche intercorrenti fra questi, usandoli come

chiavi di ricerca. Non è necessario conoscere la logica

degli operatori booleani per scoprire le informazioni più

rilevanti e pertinenti ai propri interessi.

[email protected] 15

Il sentiment e la radicalizzazione del commento sono

calcolati automaticamente. Il sistema calcola il

«sentiment generale», che identifica il tono – il «mood»

- del commento, e il «sentiment tematico», che descrive

invece la polarità del commento rispetto ad aspetti di

interesse per il cliente)

Il Cloud Concettuale dell’Analisi Live contiene i concetti e le

espressioni di sentiment raccolti ed analizzati in tempo reale.

Il modulo _ANALISI LIVEl’esempio RAI

espressioni di sentiment raccolti ed analizzati in tempo reale.

Il Cloud crea un’associazione spontanea di idee utile per

capire quali siano gli elementi che hanno determinato il

sentiment positivo e quali quello negativo, il successo o meno

della puntata.

E’ il «colpo d’occhio» per capire subito che cosa

funziona nella trasmissione e che cosa no, per

cogliere al volo gli elementi di criticità o di forza.

[email protected] 16

Analisi di contesto: il sentiment, la radicalizzazione

vengono valutati automaticamente rispetto ad alcuni

attributi di marca/interessi del cliente, quali – ad

esempio - Sicurezza, Soddisfazione generale, Design

e Qualità

Il modulo _ANALISI CONTESTOL’esempio Chicco

Il modulo _ANALISI CONTESTUALE,

l’esempio Chicco

[email protected] 17

Evidenze di negatività rispetto alla pericolosità/nocività

dei prodotti, evidenziate in automatico dal sistema: «il

passeggino non è stabile», «si ribaltava», «le creme

sono nocive per la pelle del piccolo», …. «Il bimbo quasi

soffoca per aver ingerito un pezzo di plastica»

ALERTINGl’esempio Chicco

I moduli _MONITORING & ALERTING, l’esempio ChiccoAlert monitoring: 399 mention rispetto alla

soddisfazione generale dei clienti

Alert monitoring: 58 mention rispetto alla

sicurezza dei prodotti

[email protected] 18

ALERTINGL’esempio RAI

MONITORING & ALERTING

[email protected] 19

Monitoring & Alerting: 175 documenti negativi

rispetto al coach Raffaella Carrà. Gli alert vengono

notificati via e-mail, RSS

DOMANDE?

Siro MassariaSiro MassariaSiro MassariaSiro MassariaVP Sales

20

Siro MassariaSiro MassariaSiro MassariaSiro Massaria

[email protected]@[email protected]@synthema.it

+39.335.53.50.849+39.335.53.50.849+39.335.53.50.849+39.335.53.50.849