Saltar ao contido principal
Inicio  »  Centros  »  Facultade de Filoloxía  »  Información da Materia

P5211213 - Deseño e desenvolvemento de tecnoloxías lingüísticas (Linguas e tecnoloxías) - Curso 2013/2014

Información

  • Créditos ECTS
  • Créditos ECTS: 3.00
  • Total: 3.0
  • Horas ECTS
  • Clase Expositiva: 9.00
  • Clase Interactiva Seminario: 6.00
  • Horas de Titorías: 3.00
  • Total: 18.0

Outros Datos

  • Tipo: Materia Ordinaria Máster RD 1393/2007
  • Departamentos: Literatura Española, Teoría da Literatura e Lingüística Xeral, Lingua Española
  • Áreas: Lingüística Xeral, Lingua Española
  • Centro: Facultade de Filoloxía
  • Convocatoria: 1º Semestre de Titulacións de Grao/Máster
  • Docencia e Matrícula: Primeiro Curso (1º 1ª vez)

Profesores

NomeCoordinador
GAMALLO OTERO, PABLO.SI

Horarios

NomeTipo GrupoTipo DocenciaHorario ClaseHorario exames
Grupo /CLE_01OrdinarioClase ExpositivaSINON
Grupo /CLIS_01OrdinarioClase Interactiva SeminarioSINON
Grupo /TI-ECTS01OrdinarioHoras de TitoríasNONNON
Grupo /TI-ECTS02OrdinarioHoras de TitoríasNONNON

Programa

Existen programas da materia para os seguintes idiomas:

  • Castelán
  • Galego


  • Obxectivos da materia
    A materia ten o seguintes obxectivos específicos:

    1. Introducir metodoloxías computacionais na área das tecnoloxías lingüísticas, concretamente nos campos do Procesamento da Linguaxe Natural (etiquetación e análise de texto) e da Extracción de Información a partir de corpus.
    2. Axudar a utilizar ferramentas de Procesamento da Linguaxe Natural e de Extracción de Información.
    3. Ter capacidade para operar nas áreas do Procesamento da Linguaxe Natural e da Extracción de Información, aplicando as ferramentas automáticas adecuadas na resolución de problemas específicos.
    4. Axudar a comprender como se deseñan e constrúen as ferramentas utilizadas.
    Contidos
    1. Etiquetadores morfolóxicos e analizadores sintácticos: concepto, deseño e explotación
    1.1 Léxicos computacionais
    1.2 Corpus de entrenamento
    1.3 Gramáticas formais

    2. Técnicas de extracción de unidades multipalabra e entidades mencionadas
    2.1 Uso de etiquetadores morfolóxicos para a extracción de multipalabras
    2.2 Recoñecemento e clasificación de entidades mencionadas

    3. Estratexias de construcción de ontoloxías e extracción semántica
    3.1. Uso de analizadores sintácticos na extracción semántica
    3.2 Extracción de relacións semánticas entre palabras
    3.3 Técnicas de resolución de anáfora e correferencia para mellorar a extracción.

    4. Aplicacións de Procesamento da Linguaxe Natural
    4.1 Traducción automática
    4.2 Resumen automático
    4.3 Minería de opinión
    4.4 Búsqueda de respuestas

    Bibliografía básica e complementaria
    Armstrong, Susan, Natural language processing using very large corpora, Dordrecht : Kluwer Academic Publishers, 1999.

    Barnabas Jozef van Bakel, A Linguistic approach to automatic information extraction. Holanda: Bas van Bakel, 1997.

    Berber Sardinha, Tony, Lingüística de Corpus, Editora Manole, Brasil., 2004.

    Civit, Monserrat, Criterios de etiquetación y desambiguación morfosintáctica de corpus en español. Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural, 3, 2003.

    Clark, Alexander, Chris Fox, Shalom Lappin, The Handbook of Computational Linguistics and Natural Language Processing, Wiley-Blackwell, 2010.

    Cruz Mata, Fermín, Extracción de Opiniones sobre Características: Un Enfoque Práctico Adaptable al Dominio, Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural, 11, 2012.

    Gamallo, Pablo, González, Isaac: Una gramática de dependencias basada en patrones de etiquetas" , Procesamiento del Lenguaje Natural, 43, 2009, p. 315-324.

    Gamallo, Pablo, González, Isaac: “A Grammatical Formalism Based on Patterns of Part-of-Speech Tags“, International Journal of Corpus Linguistics, 16 (1), 2011, p. 45-71.

    Gamallo, Pablo, “Tutorial of DepPattern: How to write a grammar with DepPattern”, http://gramatica.usc.es/pln/tools/deppattern.html, 2009.

    García Cumbreras, Miguel Ángel, BRUJA: Un Sistema de Búsqueda de Respuestas Multilingüe,Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural, 9, 2010.

    Gelbukh, Alexander e Grigori Sidorov, Procesamiento automático del español con enfoque en recursos léxicos grandes, México, D. F. : Instituto Politécnico Nacional, Centro de Investigación en Computación, Direción de Publicaciones, 2006.

    Llisterri, J. “Lingüística y tecnologías del lenguaje”. Lynx. Panorámica de Estudios Lingüísticos 2, 2003, 9-71.

    Moreno, L, Palomar, M. Molina, A, Fernández, A., Introducción al Procesamiento del Lenguaje Natural, Servicio de Publicaciones Universidad de Alicante, 1999.

    Peñas, Anselmo, Técnicas lingüísticas aplicadas a la búsqueda textual multilingüe. Ambigüedad, variación terminológica y multilingüismo, Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural, 4, 2004.

    Ruiz Antón, Juan Carlos: “Algunas reflexiones sobre la aplicación computacional de la gramática de dependencias”, Homenaje al profesor A. Roldán Pérez, 2, 1997, p. 523-536.

    Competencias
    A principal competencia específica que os estudantes deberán adquirir é a seguinte:

    - Capacidade no manexo de diferentes tecnoloxías lingüísticas que conforman a actual sociedade do coñecemento, concretamente ferramentas de análise textual (etiquetadores morfosintácticos e parsers sintácticos), así como sistemas de extracción de información a partir de texto: extractores de termos, de multipalabras, de relacións semánticas, etc.

    En ralación ás competencias básicas, salientamos as seguintes:

    - Posuír e comprender coñecementos que permitan seren orixinais no desenvolvemento e/ou apliación de ideas nun contexto de investigación.
    - Aplicar os coñecementos adquiridos e a capacidade de resolución de problemas a novas contornas (ou pouco coñecidas) dentro de contextos máis amplos (ou multidisciplinares) relacionados coa área de estudo.
    - Integrar coñecementos e enfrontarse á complexidade de formular xuizos a partir dunha información que, sendo incompleta ou limitada, inclúa reflexións sobre as responsabilidades sociais e éticas.
    - Saber comunicar conclusións -e os coñecementos e razóns últimas que os sustentan- a un público especializado dun xeito claro e sin ambigüedades.
    - Posuír habilidades de aprendizaxe para continuar estudando dun xeito autodirixido e autónomo.

    Por último, enumerarmos as principais competencias transversais que deberán adquirir os estudiantes:

    - Compresión da importancia da cultura emprendedora e coñecemento dos medios ao alcance das persoas emprendedoras.
    - Valoración crítica do coñecemento, a tecnoloxía e a información dispoñíbel para resolver os problemas aos que deben enfrontarse.
    - Valoración da importancia que ten a investigación, a innovación e o desenvolvemento tecnolóxico no avance socio-económico e cultural da sociedade.
    - Utilización das ferramentas básicas das tecnoloxías da información e da comunicación (TIC) necesarias para o exercicio da súa profesión e para a aprendizaxe ao longo da súa vida.

    Metodoloxía da ensinanza
    As sesións terán un dobre compoñente, expositivo e interactivo, sendo este último o máis importante dados os contidos do curso.

    A metodoloxía docente basearase fundamentalmente en sesións presenciais interactivas que fomenten tanto o traballo individual como o traballo colaborativo. Dado que se requirirá o manexo de diferentes aplicacións para a análise lingüística e a extracción de información, os estudantes desenvolverán a capacidade instrumental correspondente ao dominio de aplicacións informáticas dentro da área das tecnoloxías da linguaxe.

    O curso consistirá basicamente na realización dun conxunto de actividades prácticas descritas con detalle no material didáctico. O estudante deberá levar a cabo as actividades individualmente ou/e en grupo, potenciando especialmente a capacidade instrumental para a resolución de problemas.

    Cada estudante proporá, ademais, a descrición e realización dun traballo final tutelado, que consistirá no desenvolvemento en profundidade dalgunha das actividades levadas cabo durante as sesións presenciais.

    Utilizarase o Campus Virtual para a distribución de materiais e guías ou tutoriais para a realización das actividades requiridas.
    Sistema de evaluación
    A avaliación terá en conta a asistencia e participación en clase e, en particular, a implicación na realización das actividades guiadas propostas nas sesións interactivas. Terase en conta tamén para a avaliación a calidade do traballo final desenvolvido.

    Na seguinte táboa recóllense os aspectos avaliabeis e os criterios de avaliación:

    - Traballo final tutelado: 70% da nota final
    - Actividades guiadas en sesións presenciais: 20% da nota final
    - Asistencia: 10% da nota final.

    2.ª oportunidade (mes de xullo)
    Limitarase á entrega do traballo tutelado (cun peso do 70%). Ao respecto do 30% restante, mantense a nota obtida na primeira oportunidade.
    Tempo de estudo e traballo persoal
    Para seguir a materia, ademais das sesións presenciais, 15 horas, son precisas outras 60 horas, das cales o 50% debe reservarse para a elaboración do traballo ou proxecto final.
    Recomendacións para o estudo da materia
    É importante adquirir algúns mecanismos e automatismos básicos para o uso do sistema operativo Linux, sistema sobre o que se executarán as ferramentas utilizadas no curso. Por este motivo, recoméndase repetir e ampliar de xeito individual -na casa ou nas salas de informática da Facultade- as prácticas realizadas nas sesións interactivas.