Motivation and Objectives:
In the context of three problem areas identified as critical for the
future development of the Internet, WebFAQ aims at addressing the
problem of the analysis and representation of the information
content. More specifically, the project concentrates on:
- the access to information contained in very large, unstructured,
heterogeneous repositories;
- the multimodal presentation of information;
- the assessment of the quality of information.
From the access/presentation perspective, the research focuses on
content-based indexing methods for managing large multimedia data
repositories, such as texts, images, video and audio recordings, as
well as on methods able to support multimedia, multimodal and
multilingual integration. Different user languages are considered in
combination with various ways to present information (e.g., question
answering, machine translation, summarisation), interaction modalities
(e.g., spoken and written natural language), and Web-enabled
communication devices (e.g., UMTS, mobile phones). As for quality
assessment, the project addresses the analysis of the structure and
the evolution over time of Web sites, with the primary objective of
developing methods and tools to support maintenance interventions
during their life cycle. To this end, analysis of the information
content plays a crucial role in complementing the purely structural
information extracted with simpler techniques. Methods for the
analysis of multilingual content will also turn out essential to
improve the maintenance of multilingual sites.
The project is designed to run over a time span of three years
(2002-2004). At the end of the first year, preliminary results will be
demonstrated. Selected showcases based on the methods being developed
shall be also implemented in more advanced phases of the project.
At the end of the project, we expect to have achieved a better
comprehension of the structure of the information on the Web, and to
have enabled more advanced user-user and user-information interaction
paradigms.
|
Motivazione ed Obiettivi: nel contesto di tre aree problematiche identificate
come critiche per lo sviluppo futuro di Internet, WebFAQ mira a
studiare metodi per l'analisi e la rappresentazione del contenuto
dell'informazione. In particolare, il
progetto si concentrerà:
- sull'accesso all'informazione contenuta in grandi archivi, non
strutturati ed eterogenei;
- sulla presentazione multimodale dell'informazione;
- sulla valutazione della qualitą dell'informazione.
Per quanto concerne l'accesso e la presentazione, la ricerca si
concentra su metodi di indicizzazione basati sul contenuto in grado di
gestire grandi archivi di dati multimediali, contenenti testi,
immagini e registrazioni audio/video, e su metodi in supporto alla
integrazione di funzionalità multimediali, multimodali e
multilingua. Vengono considerate lingue diverse in combinazione con
vari modi di presentazione dell'informazione (e.g., question
answering, traduzione automatica, generazione automatica di
rassegne e di riassunti), diverse modalità di interazione
(linguaggio naturale, scritto e parlato, modalità basate su
esempi), e vari dispositivi di comunicazione per il Web (e.g.,
telefoni UMTS). Per quanto concerne la valutazione della
qualità, la ricerca si concentra sulla analisi della struttura e
sull'evoluzione temporale dei siti Web, con l'obiettivo primario di
fornire metodi e strumenti in grado di supportare gli interventi di
manutenzione durante il ciclo di vita dei siti. A questo scopo i
metodi per l'analisi del contenuto dell'informazione giocano un ruolo
cruciale nel complementare l'informazione puramente strutturale
estratta mediante tecniche più semplici. Metodi per l'analisi di
contenuti multilinguistici saranno altresí essenziali nel
migliorare la manutenzione di siti multilingua.
Il progetto ha una durata prevista di tre anni (2002-2004). Alcuni
risultati preliminari saranno dimostrati già al termine del
primo anno. Alcuni prototipi dimostrativi saranno inoltre realizzati
in fasi più avanzate del progetto. I progressi che ci
aspettiamo di ottenere porteranno a una migliore comprensione della
struttura e delle caratteristiche dell'informazione sul Web, e
renderanno possibili paradigmi di interazione utente-utente e
utente-informazione pił avanzati.
|