Recuperació de la Informació ( RI )
| Crèdits: |
Departament: |
Tipus: |
Requisits: |
| 7.5 |
LSI |
Optativa per l'EI
Optativa per l'ETIG
Optativa per l'ETIS
|
|
PRED
- Pre-requisit per l' EI , ETIG
|
|
|
PS
- Pre-requisit per l' ETIS
|
|
|
Professors
| Responsable: | Joaquim Gabarró Vallés (gabarro lsi.upc.edu). |
| Altres: | M Jose Serna Iglesias (mjserna lsi.upc.edu) Ricard Gavaldà Mestre (gavalda lsi.upc.edu) Xavier Messeguer Peypoch (messeguer lsi.upc.edu). |
Objectius Generals
Entendre el problema de la recuperació de la informació. Entendre els diferents components de un sistema de recuperació de la informació i els factors i tècniques que poden optimitzar el procés.
Conèixer algunes aplicaciones d'aquests sistemes, com a mínim a la bioinformatica i a la Web.
Objectius Específics
Coneixements
- Conèixer els problemes associats a l'emmagatzemament i recuperació de la informació , sobretot de tipus textual.
- Entendre que la efectivitat en la cerca i recuperació de la informació està molt relacionada amb la organització i descripció d'aquesta informació.
- Conèixer els algorismes i tècniques més importants de cerca de patrons en informació textual.
- Descriure les aplicacions en bioinformàtica i en la web de les tècniques de recuperació de la informació.
Habilitats
- Poder decidir les tècniques de recuperació de la informació que poden ser efectives en un sistema d'informació concret, sobretot de tipus textual.
- En particular, poder decidir les tècniques de cerca i recuperació de la informació a emprar en aplicacions senzilles de l'àmbit de la bioinformàtica i de la Web.
- Poder avaluar l'efectivitat i utilitat, d'acord amb diversos criteris, d'un sistema de recuperació de la informació.
- Poder implementar les tècniques bàsiques (algorismes i estuctures de dades) de recuperació de la informació.
Competències
- Capacitat d'aplicar els coneixements de matemàtiques i lògica a la resolució de problemes.
- Capacitat per crear i utilitzar models de la realitat.
- Capacitat per dissenyar i dur a terme experiments, i d'analitzar-ne els resultats.
- Capacitat per dissenyar sistemes, components o processos que s'ajustin a unes necessitats, utilitzant els mètodes, tècniques i eines més adients en cada cas.
- Capacitat per prendre decisions en presència d'incertesa o de requisits contradictoris
- Capacitat d'actuar autònomament: Saber treballar de forma independent, rebent només la informació indispensable i un mínim de guiatge.
- Capacitat d'aprendre autònomament.
Continguts
Hores estimades de:
| T |
P |
L |
Alt |
L Ext. |
Est |
A Ext. |
| Teoria |
Problemes |
Laboratori |
Altres activitats |
Laboratori extern |
Estudi |
Altres hores fora d'horari fixat |
|
1. Introducció
|
| T |
P |
L |
Alt |
L Ext |
Est |
A Ext |
Total |
| 2,0 |
2,0 |
1,0 |
0 |
1,0 |
4,0 |
0 |
10,0 |
|
|
Recuperació versus navegació. Documents. Visió lògica. Procés de recuperació de l'informació.
|
|
2. Models de recuperació de la informació
|
| T |
P |
L |
Alt |
L Ext |
Est |
A Ext |
Total |
| 6,0 |
6,0 |
3,0 |
0 |
3,0 |
14,0 |
0 |
32,0 |
|
Caracterització formal i conceptes bàsics. Model booleà.
Model vectorial. Model probabilista. Altres models.
Llenguatges d'interrogació. Components principals i models. Anàlisi de relevància, models i algorismes.
|
|
3. Avaluació
|
| T |
P |
L |
Alt |
L Ext |
Est |
A Ext |
Total |
| 2,0 |
2,0 |
1,0 |
0 |
1,0 |
4,0 |
0 |
10,0 |
|
|
Recall i precisió. Altres mesures de rendiment. Col·leccions de referències. Tests.
|
|
4. Cerca seqüèncial i indexada
|
| T |
P |
L |
Alt |
L Ext |
Est |
A Ext |
Total |
| 6,0 |
6,0 |
3,0 |
0 |
3,0 |
14,0 |
0 |
32,0 |
|
Cerca de patrons. Algorismes per la cerca exacta i aproximada.
Tries. Fitxers invertits, arbre de sufixos. Algorismes de construcció i utilització, anàlisi i complexitat.
|
|
5. Clustering
|
| T |
P |
L |
Alt |
L Ext |
Est |
A Ext |
Total |
| 2,0 |
2,0 |
1,0 |
0 |
1,0 |
4,0 |
0 |
10,0 |
|
Introducció al problema del clustering, clustering jeràrquic.
Aplicacions.
|
|
6. Aplicacions a la Web
|
| T |
P |
L |
Alt |
L Ext |
Est |
A Ext |
Total |
| 6,0 |
6,0 |
3,0 |
0 |
3,0 |
12,0 |
0 |
30,0 |
|
|
Ranking i relevancia per a models Web. XML retrieval. Detecció de comunitats.
|
|
7. Aplicacions a la bioinformàtica
|
| T |
P |
L |
Alt |
L Ext |
Est |
A Ext |
Total |
| 4,0 |
4,0 |
2,0 |
0 |
2,0 |
8,0 |
0 |
20,0 |
|
Patrons en cadenes d'ADN. Similaritat de seqüències.
Seqüènciació d'ADN. Bases de dades per a ADN.
|
| - Total per tipus |
T |
P |
L |
Alt |
L Ext |
Est |
A Ext |
Total |
| 28,0 |
28,0 |
14,0 |
0 |
14,0 |
60,0 |
0 |
144,0 |
- Hores addicionals dedicades a l'avaluació:
|
6,0 |
- Total hores de treball per l'estudiant |
150,0 |
|
Metodologia docent
En les classes de laboratori s'implementaran (variacions dels) algorismes vistos a teoria i problemes, o bé s'aplicaran les tècniques en situacions relativament reals de cerca d'informació.
Algunes sessions de laboratori poden exigir una estona
de preparació prèvia. En algunes sessions (orientativament, dos) es demanarà la redacció d'un informe curt o bé el lliurament del codi desenvolupat, que comptaran per a l'avaluació de l'assignatura.
Mètode d'avaluació
Hi haurà una prova parcial no eliminatòria de matèria i l'examen final, global.
La nota de laboratori es calcularà en base als informes o els programes
lliurats després de les sessions de laboratori designades.
La nota de l'assignatura es calcularà com:
0.2*nota laboratori +
maxim (0.2*prova parcial + 0.6*examen final, 0.8*examen final)
Bibliografía bàsica
- Baeza-Yates, Ricardo; Ribeiro-Neto, Berthier Modern Information Retrieval, Addison Wesley , 1998.
- Witten, I. H; Moffat, A.; Bell, T. Managing Gigabytes, Morgan Kaufmann, 1999.
Bibliografía complementària
- Finding Out About: Perspective on Search Engine Technology and the WWW Richard K. Belew, Cambridge University Press, 2001.
Enllaços web
(Informació no introduïda)
Capacitats prèvies
Capacitat per fer programes mitjans, preferentment amb orientació a objectes
Capacitat d'estructures de dades senzilles.
Se suggereix com a prerequisit l'assignatura de programació de 3r quadrimestre.
|