Anar a: Buscar
FIB > Els estudis > Pàgines de les assignatures > Departament LSI > RI Castellano | English
RI
P1
LI
ALG
A
IA
BD
COM
DABD
SIO
GSI
ASAI
PESBD
SGBDO
CL
PGPSI
VIG
DSBW
VA
ER
AIA
ES2
IL
TC
ES1
ALCC
PCD
ADA
PRAP
PROP
PS
LP
PLN
PRED
SGI



Recuperació de la Informació ( RI )

Crèdits: Departament: Tipus: Requisits:
7.5 LSI
  • Optativa per l'EI
  • Optativa per l'ETIG
  • Optativa per l'ETIS
  • PRED - Pre-requisit per l' EI , ETIG
    PS - Pre-requisit per l' ETIS

    Professors

    Responsable:  Joaquim Gabarró Vallés (gabarrolsi.upc.edu).
    Altres:M Jose Serna Iglesias (mjsernalsi.upc.edu)
    Ricard Gavaldà Mestre (gavaldalsi.upc.edu)
    Xavier Messeguer Peypoch (messeguerlsi.upc.edu).

    Objectius Generals

    Entendre el problema de la recuperació de la informació. Entendre els diferents components de un sistema de recuperació de la informació i els factors i tècniques que poden optimitzar el procés.
    Conèixer algunes aplicaciones d'aquests sistemes, com a mínim a la bioinformatica i a la Web.

    Objectius Específics

    Coneixements

    1. Conèixer els problemes associats a l'emmagatzemament i recuperació de la informació , sobretot de tipus textual.
    2. Entendre que la efectivitat en la cerca i recuperació de la informació està molt relacionada amb la organització i descripció d'aquesta informació.
    3. Conèixer els algorismes i tècniques més importants de cerca de patrons en informació textual.
    4. Descriure les aplicacions en bioinformàtica i en la web de les tècniques de recuperació de la informació.

    Habilitats

    1. Poder decidir les tècniques de recuperació de la informació que poden ser efectives en un sistema d'informació concret, sobretot de tipus textual.
    2. En particular, poder decidir les tècniques de cerca i recuperació de la informació a emprar en aplicacions senzilles de l'àmbit de la bioinformàtica i de la Web.
    3. Poder avaluar l'efectivitat i utilitat, d'acord amb diversos criteris, d'un sistema de recuperació de la informació.
    4. Poder implementar les tècniques bàsiques (algorismes i estuctures de dades) de recuperació de la informació.

    Competències

    1. Capacitat d'aplicar els coneixements de matemàtiques i lògica a la resolució de problemes.
    2. Capacitat per crear i utilitzar models de la realitat.
    3. Capacitat per dissenyar i dur a terme experiments, i d'analitzar-ne els resultats.
    4. Capacitat per dissenyar sistemes, components o processos que s'ajustin a unes necessitats, utilitzant els mètodes, tècniques i eines més adients en cada cas.
    5. Capacitat per prendre decisions en presència d'incertesa o de requisits contradictoris
    6. Capacitat d'actuar autònomament: Saber treballar de forma independent, rebent només la informació indispensable i un mínim de guiatge.
    7. Capacitat d'aprendre autònomament.

    Continguts

    Hores estimades de:

    T P L Alt L Ext. Est A Ext.
    Teoria Problemes Laboratori Altres activitats Laboratori extern Estudi Altres hores fora d'horari fixat

    1. Introducció
      T     P     L    Alt  L Ext  Est  A Ext Total
     2,0   2,0   1,0   0   1,0   4,0   0   10,0 
    Recuperació versus navegació. Documents. Visió lògica. Procés de recuperació de l'informació.

    2. Models de recuperació de la informació
      T     P     L    Alt  L Ext  Est  A Ext Total
     6,0   6,0   3,0   0   3,0   14,0   0   32,0 
    Caracterització formal i conceptes bàsics. Model booleà.
    Model vectorial. Model probabilista. Altres models.
    Llenguatges d'interrogació. Components principals i models. Anàlisi de relevància, models i algorismes.

    3. Avaluació
      T     P     L    Alt  L Ext  Est  A Ext Total
     2,0   2,0   1,0   0   1,0   4,0   0   10,0 
    Recall i precisió. Altres mesures de rendiment. Col·leccions de referències. Tests.

    4. Cerca seqüèncial i indexada
      T     P     L    Alt  L Ext  Est  A Ext Total
     6,0   6,0   3,0   0   3,0   14,0   0   32,0 
    Cerca de patrons. Algorismes per la cerca exacta i aproximada.
    Tries. Fitxers invertits, arbre de sufixos. Algorismes de construcció i utilització, anàlisi i complexitat.

    5. Clustering
      T     P     L    Alt  L Ext  Est  A Ext Total
     2,0   2,0   1,0   0   1,0   4,0   0   10,0 
    Introducció al problema del clustering, clustering jeràrquic.
    Aplicacions.

    6. Aplicacions a la Web
      T     P     L    Alt  L Ext  Est  A Ext Total
     6,0   6,0   3,0   0   3,0   12,0   0   30,0 
    Ranking i relevancia per a models Web. XML retrieval. Detecció de comunitats.

    7. Aplicacions a la bioinformàtica
      T     P     L    Alt  L Ext  Est  A Ext Total
     4,0   4,0   2,0   0   2,0   8,0   0   20,0 
    Patrons en cadenes d'ADN. Similaritat de seqüències.
    Seqüènciació d'ADN. Bases de dades per a ADN.


    - Total per tipus
      T     P     L    Alt  L Ext  Est  A Ext Total
     28,0   28,0   14,0   0   14,0   60,0   0   144,0 
    - Hores addicionals dedicades a l'avaluació:
    6,0
    - Total hores de treball per l'estudiant
    150,0

    Metodologia docent

    En les classes de laboratori s'implementaran (variacions dels) algorismes vistos a teoria i problemes, o bé s'aplicaran les tècniques en situacions relativament reals de cerca d'informació.

    Algunes sessions de laboratori poden exigir una estona
    de preparació prèvia. En algunes sessions (orientativament, dos) es demanarà la redacció d'un informe curt o bé el lliurament del codi desenvolupat, que comptaran per a l'avaluació de l'assignatura.

    Mètode d'avaluació

    Hi haurà una prova parcial no eliminatòria de matèria i l'examen final, global.
    La nota de laboratori es calcularà en base als informes o els programes
    lliurats després de les sessions de laboratori designades.

    La nota de l'assignatura es calcularà com:

    0.2*nota laboratori +
    maxim (0.2*prova parcial + 0.6*examen final, 0.8*examen final)

    Bibliografía bàsica

    • Baeza-Yates, Ricardo; Ribeiro-Neto, Berthier Modern Information Retrieval, Addison Wesley , 1998.
    • Witten, I. H; Moffat, A.; Bell, T. Managing Gigabytes, Morgan Kaufmann, 1999.

    Bibliografía complementària

    • Finding Out About: Perspective on Search Engine Technology and the WWW Richard K. Belew, Cambridge University Press, 2001.

    Enllaços web

    (Informació no introduïda)

    Capacitats prèvies

    Capacitat per fer programes mitjans, preferentment amb orientació a objectes

    Capacitat d'estructures de dades senzilles.

    Se suggereix com a prerequisit l'assignatura de programació de 3r quadrimestre.



    versió per imprimir