G5041608 - Lingüística computacional (Lingüística e procesamento das linguas. Aplicacións) - Curso 2013/2014
Información
- Créditos ECTS
- Créditos ECTS: 6.00
- Total: 6.0
- Horas ECTS
- Clase Expositiva: 16.00
- Clase Interactiva Laboratorio: 32.00
- Horas de Titorías: 3.00
- Total: 51.0
Outros Datos
- Tipo: Materia Ordinaria Grao RD 1393/2007
- Departamentos: Literatura Española, Teoría da Literatura e Lingüística Xeral
- Áreas: Lingüística Xeral
- Centro: Facultade de Filoloxía
- Convocatoria: 2º Semestre de Titulacións de Grao/Máster
- Docencia e Matrícula: null
Profesores
Horarios
Programa
Existen programas da materia para os seguintes idiomas:
CastelánGalegoObxectivos da materia• Desenvolver destrezas para abordar os múltiples problemas que presenta a linguaxe natural para o seu tratamento computacional nos seus diferentes niveis, atendendo de xeito integrado ás perspectivas lingüística, lóxica, matemática e informática.
• Coñecer os diferentes modelos de procesamento computacional das linguas naturais co fin de convertelas en linguaxes automáticas.
• Achegarse aos métodos e ferramentas de traballo empírico da Lingüística actual que permitan ao estudante manexar datos lingüísticos reais procedentes de diversos corpus para o seu posterior tratamento informático e computacional.
• Coñecer os recursos relacionados co tratamento computacional da linguaxe (bases de datos, ferramentas de análise textual, programas de tradución automática, sistemas de ditado automático, etc.).
• Analizar estes recursos e os resultados obtidos a partir do seu manexo e aplicación co fin de poder valoralos criticamente de acordo cos coñecementos teóricos e metodolóxicos adquiridos.
ContidosTEMA 1. Lingüística Computacional: evolución historiográfica e principais liñas de investigación.
1. Introdución ao campo da Lingüística Computacional
1.1. Lingüística e Informática; Lingüística e Intelixencia artificial.
1.2. A Lingüística Computacional no seo da Lingüística aplicada: caracterización e historiografía.
2. O carácter transdisciplinar da Lingüística Computacional: vertentes de estudo
2.1. Lingüística informática: ferramentas de manipulación e análise de datos, dicionarios automáticos, deseño e explotación de corpus lingüísticos.
2.2. Procesamento da linguaxe natural e tradución automática.
2.3. Tecnoloxías (do texto e da fala) e Industrias da lingua.
TEMA 2. Utilidades informáticas en Lingüística e desenvolvementos da Lingüística de Corpus como metodoloxía de base empírica.
1. Introdución
1.1. Ubicación do campo da Lingüística informática dentro dos estudos en Lingüística computacional.
1.2. Panorámica das utilidades informáticas en Lingüística.
2. Transcrición de interaccións comunicativas (o sistema CHILDES)
2.1. Linguaxe adulta (de interese para Pragmática, Análise do discurso, Dialectoloxía, Sociolingüística, Ensino/Aprendizaxe de linguas, Planificación lingüística).
2.2. Linguaxe infantil (de interese para Psicolingüística evolutiva, Lingüística clínica, Ensino/Aprendizaxe de linguas, Planificación lingüística).
3. Ferramentas de manipulación e análise de datos
3.1. Índices e frecuencias.
3.2. Concordancias e colocacións.
4. Desenvolvementos da Lingüística de Corpus como metodoloxía de base empírica:
4.1. Recursos, ferramentas e aplicacións en Lingüística computacional.
4.2. Tipos e utilidade dos corpus.
4.3. Procesos de enriquecimento e extracción de información dun corpus: segmentación, análise, tipificación, etiquetado.
5. Lexicografía computacional:
5.1. Bancos de datos lexicográficos.
5.2. Dicionarios electrónicos.
TEMA 3. Procesamento da linguaxe natural e Tradución automática.
1. Introdución
1.1. O tratamento computacional das linguas: do natural ao automático.
2. A tradución automática
2.1. Historiografía do ámbito da tradución automática.
2.2. Tradución automática fronte a tradución asistida por ordenador.
2.3. Clasificación dos sistemas de tradución automática: criterios e tipoloxía.
2.4. A tradución automática en liña.
3. Procesamento da linguaxe natural (oral e escrita)
3.1. Introdución ao procesamento da linguaxe natural. Os procesos de recoñecemento e síntese. Os sistemas de diálogo.
3.2. Procesamento da linguaxe natural escrita: as tecnoloxías do texto.
3.3. Procesamento da linguaxe natural oral: as tecnoloxías da fala.
3.4. Aplicacións do procesamento da linguaxe natural: presente e futuro.
TEMA 4. Tratamento da lingua –falada e escrita– e desenvolvemento de produtos comerciais: lingüística e tecnoloxía.
1. Introdución
1.1. Situación do campo das Tecnoloxías e Industrias lingüísticas no seo da Lingüística Computacional. Relación destas dúas vertentes cos eidos da Tecnoloxía de comunicacións e da Enxeñaría lingüística.
1.2. Panorámica actualizada das vertentes de aplicación en Tecnoloxías da fala e Industrias da lingua.
2. Tecnoloxías da fala
2.1. Introdución.
2.2. Aplicacións: Síntese da fala, Recoñecemento da fala. Tradución oral automática,. Identificación e/ou verificación da identidade dos interlocutores.
2.4. Sistemas de diálogo persoa-máquina.
3. Industrias da lingua
3.1. Introdución.
3.2. Aplicacións: Conversión de texto a fala; ditado automático; recuperación, procura e extracción de información; produción asistida por ordenador (PAO) e edición electrónica, e produtos multimedia; tradución automática e asistida; correctores (ortográficos, gramaticais e estilísticos) e verificadores; tesauros e dicionarios electrónicos; tratamento multilingüe de textos; ELAO (Ensino de Linguas Asistido por Ordenador); aplicacións da Enxeñaría lingüística á axuda a discapacitados (tratamento da escritura, lectura óptica, sistemas alternativos de comunicación), Tecnoloxía e xestión do multilingüismo.
Bibliografía básica e complementariaBIBLIOGRAFÍA BÁSICA (DE LECTURA OBRIGATORIA)
LLISTERRI, J. (2007), "El español y las nuevas tecnologías", en M. Lacorte (ed.) Lingüística aplicada del español. Madrid: Arco/Libros (Biblioteca Philologica), 483-520.
LLISTERRI, J. et alii (2003), “El papel de la lingüística en el desarrollo de las tecnologías del habla”, en M. Casas (dir.) e C. Varo (ed.), VII Jornadas de Lingüística, Cádiz: Servivio de Publicaciones Universidad de Cádiz, 137-191.
MARTÍ, M.ª A. (coord..), Tecnologías del Lenguaje, Barcelona: UOC (selec.)
MORENO FERNÁNDEZ, F. (1990), “Lingüística informática e informática lingüística”, Lingüística Española Actual, 12/1, 5-16.
MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis. (pp. selecc.)
MOURE, T. e J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la lingüística computacional”, en M. Fernández Pérez (coord.), Avances en Lingüística Aplicada, Santiago: USC, 147-227.
PARODI, Giovanni (2008), “Lingüística de Corpus: una introducción al ámbito”, Revista de Lingüística Teórica y Aplicada, 46/1, 93-119.
PERIÑAN, C. (2005) “Procesamiento del lenguaje natural: de lingüista a ingeniero del conocimiento”, en I. K. Brady, M. Navarro e C. Periñán (eds.), Nuevas Tendencias en Lingüística Aplicada, Murcia: Quaderna, 293-317.
ROJO, G. (2005-2006), “Informática y Lingüística: Las lenguas en la sociedad del conocimiento”, Boletín de RedIRIS, 74-75. [http://www.rediris.es/rediris/boletin/74-75/ponencia1.pdf]
RUIZ, J. C. (2005), “Lenguaje e informática/Lenguaje y ordenadores”, en Á. López e B. Gallardo (eds.), Conocimiento y lenguaje, València: Universitat, 401-436.
TORDERA YLLESCAS, J.C. (2012), El abecé de la Lingüística computacional, Madrid: Arco/Libros, S.L.
TORRUELLA, J. e J. LLISTERRI (1999), "Diseño de corpus textuales y orales", en J.M. Blecua et alii (eds.) Filología e informática. Nuevas tecnologías en los estudios filológicos. Barcelona: UAB / Milenio, 45-77.
BIBLIOGRAFÍA COMPLEMENTARIA
ABAITUA, J. (1997-2001), “Presente y futuro de la traducción automática” [http://paginaspersonales.deusto.es/abaitua/konzeptu/ta/ta97.htm]
ABRIL, D., C. Delgado e Á. Vigara (2009), Comunicación Aumentativa y Alternativa. Guía de referencia, Madrid: CEAPAT [http://sid.usal.es/idocs/F8/FDO21102/com_aumentativa.pdf].
ADOLPHS, S. (2006): Introducing Electronic Text Analysis. A practical guide for language and literary studies, London/New York: Routledge.
AERES, F. (2008), El robot enamorado. Una historia de la Inteligencia Artificial, Barcelona: Ariel.
CANTOS, P. e A. Sánchez (eds.), A Survey of Corpus-based Research. Panorama de investigaciones basadas en corpus, AELINCO: Murcia.
HUTCHINS, J. (2003), “Machine Translation: General Overview”, en Ruslan Mitkov, (ed.) The Oxford Handbook of Computational Linguistics. New York/Oxford: OUP, 501-511.
LAVID, J. (2005), Lenguaje y nuevas tecnologías: nuevas perspectivas, métodos y herramientas para el lingüista del siglo XXI, Madrid: Cátedra.
LLISTERRI, J. e M.J. MACHUCA (eds.) (2006), Los sistemas de diálogo, Bellaterra/Soria: UAB, Servei de Publicacions-Fundación Duques de Soria (Manuals de la UAB, Lingüística, 45).
MARTÍ, M.ª A. e J. Llisterri (eds.) (2002), Tratamiento del lenguaje natural: tecnología de la lengua oral y escrita, Soria: Fundación Duques de Soria; Barcelona: Edicions UAB (selec.).
CompetenciasAdemais das competencias xerais propias dos estudos universitarios e especificadas nos títulos de Grao, os estudantes desta materia deberan acadar as seguintes competencias específicas:
4.1.1.Competencias disciplinares cognitivas (saber)
(1) Capacidade de reflexión crítica sobre as relacións entre as linguas e as novas tecnoloxías.
(2) Adquisición das bases teórico-metodolóxicas da Lingüística Computacional.
(3) Coñecemento das ferramentas, aplicacións e recursos de natureza diversa desenvolvidas por e para o estudo computacional das linguas.
(4) Comprensión, avaliación e aproveitamento destas ferramentas e recursos.
4.1.2. Competencias profesionais procedimentais (saber facer)
(1) Manexo eficaz dos recursos técnicos sobre linguas e comunicación –incluídos os accesibles en liña– en particular os orientados á investigación e á formación en ámbitos lingüísticos, literarios, de creación ou de investigación filolóxica.
(2) Capacidade para poñer en práctica algúns dos coñecementos adquiridos en ámbitos como: tradución automática, confección e explotación de corpora lingüísticos, e recoñecemento e síntese de fala.
4.1.3. Competencias académicas actitudinais (ser)
(1) Capacidade para poñer en relación as distintas disciplinas nas que se sustenta o estudo computacional das linguas.
(2) Interese pola diversidade lingüística e cultural e sensibilidade na valoración das súas repercusións no manexo e deseño de ferramentas computacionais para o estudo dos fenómenos comunicativos.
(3) Capacidade para analizar, valorar e promover as aplicacións técnicas de comunicación multimodal naqueles casos de trastornos comunicativos derivados de lesións motoras e/ou sensoriais.
(4) Desenvolvemento dunha actitude crítica perante o manexo e xestión das TIC e da Internet nos ámbitos académico, investigador e profesional.
Metodoloxía da ensinanza A materia adoptará unha metodoloxía de ensino presencial que garanta a interacción entre a profesora e os estudantes sen que isto supoña minusvalorar o proceso de aprendizaze autónoma. Así, o curso de Lingüística Computacional desenvolverase a través das clases presenciais (3 h. semanais) e do traballo persoal dos estudantes en horas non presenciais (estudo do temario a través das lecturas obrigatorias e preparación dos exercicios de aplicación).
As clases presenciais serán de tres tipos:
1. Sesións expositivas (1 hora), nas que a profesora proporcionará a información teórica básica dos temas do programa, reforzada coa presentación de diversos materiais representativos dos conceptos estudados. Máis concretamente, asignamos a cada tema desta materia unha serie de lecturas oblrgatorias que presentan con claridade os contidos teórico-prácticos sobre o procesamento lingüístico e as súas aplicacións informáticas.
2. Sesións seminario (2 horas), dedicadas, dun lado, á posta en común e discusión das lecturas obrigatorias do programa para comprobar a asimiliación dos contidos e, doutro, á presentación e avaliación dos exercicios de aplicación propostos.
3. Titorías programadas (hora e media) en grupos reducidos co obxectivo de guiar o traballo autónomo dos estudantes.
Os exercicios de aplicación que os estudantes elaborarán nas horas non presenciais responderán aos seguintes tipos:
a) Resposta a cuestións breves relacionadas co contido dos temas, que obriguen a enfrontarse cos aspectos de máis difícil comprensión para aclarar as posibles dúbidas ou que sirvan de aplicación práctica de conceptos explicados nas sesións expositivas.
b) Revisión crítica de distintas fontes documentais relacionadas cos contidos da materia.
Tamén elaborarán un traballo sobre algunha das aplicacións existentes no terreo das tecnoloxías lingüísticas (estudadas ao longo de todo o curso e dun xeito máis específico no Tema 4), que será presentado na última sesión de seminario. Se ben todos os detalles deste tipo de proba serán presentados pola profesora ao comezo do semestre, os estudantes deberán ser quen de demostrar a asimilación dos contidos e o dominio das destrezas que contribúan ao desenvolvemento de competencias profesionais a través da redacción dun proxecto persoal que non so estimule a reflexión crítica sobre o material estudado, senón que ademais esixa a necesidade de tomar decisións motivadas, anticipe problemas potenciais e propoña posibles solucións desde a perspectiva dun investigador en Lingüística Computacional.
Sistema de evaluación1ª OPORTUNIDADE (MES DE MAIO): Realizarase por avaliación continuada: o 50% da cualificación corresponderá ás actividades, exercicios e traballos realizados e/ou programados nas sesións expositivas e interactivas. O 50% restante corresponderá á elaboración dun proxecto persoal.
Aqueles estudantes que ou ben teñan concedida polo Decanato a dispensa de asistencia a clase e, polo tanto, non poidan seguir a avaliación continuada, ou ben decidan non seguir o sistema de avaliación continuada, poderán avaliarse de toda a materia mediante un exame que incluirá cuestións teóricas e prácticas (correspondentes ás sesións expositivas e ás sesións interactivas) e que terá lugar o 14/05/2014.
Os aspectos, criterios e instrumentos de avaliación aparecen reflectidos no seguinte cadro:
ASPECTO
Asistencia, participación e aproveitamento das clases presenciais
CRITERIOS
- Participación activa nas clases
- Calidade científica dos traballos: asimilación de contidos, comprensión dos textos, análises e interpretacións adecuadas
INSTRUMENTO
- Traballos entregados e/ou expostos nos seminarios e nas titorías programadas
VALOR
- 50%
ASPECTO
Conceptos, métodos e ferramentas aprendidos durante todo o curso
CRITERIOS
- Dominio dos coñecementos teóricos e operativos da materia
- Aproveitamento das lecturas
- Calidade científica dos traballos
INSTRUMENTO
- Presentación oral e entrega por escrito dun proxecto persoal.
VALOR
- 50%
2ª OPORTUNIDADE (XULLO): Efectuarase exclusivamente a través dun exame que incluirá cuestións teóricas e prácticas (correspondentes ás sesións expositivas e ás sesións interactivas). Este exame realizarase na aula de informática na data establecida pola Secretaría da Facultade (10/07/2014).
Tempo de estudo e traballo persoalTendo en conta o calendario oficial aprobado pola USC, a distribución temporal da materia ao longo do semestre queda como segue:
DISTRIBUCIÓN DA CARGA ECTS
SESIÓNS EXPOSITIVAS: 13 (horas presenciais) + 67 (horas non presenciais) = Total 80 horas
SESIÓNS SEMINARIO: 28 (horas presenciais) + 36 (horas non presenciais) = Total 64 horas
SESIÓNS TITORÍA GRUPO: 3 (horas presenciais) + 3 (horas non presenciais) = Total 6 horas
TOTAL: 44 (horas presenciais) + 106 (horas non presenciais) = Total 150 horas
Recomendacións para o estudo da materiaNon se requiren coñecementos previos, máis aló da formación básica adquirida ata este momento nas materias de contido lingüístico cursadas nos diferentes Graos; a materia está planificada para que poida ser cursada por calquera estudante da Facultade. Recoméndase que o estudantado posúa habilidades para a lectura (con capacidade de síntese) e comprensión crítica da información recollida en diferentes soportes.
Tamén convén posuír un nivel medio-alto de comprensión escrita das linguas española, galega e inglesa, xa que os materiais de consulta recomendados así como os empregados nas sesións de clase inclúen textos publicados nestes idiomas.
Por outra banda, debe terse moi en conta que para superar a materia, ademais de acadar o nivel requirido en canto a contidos e prácticas, será requisito indispensable amosar na realización das diferentes probas –orais e/ou escritas– un nivel de dominio (exposición e argumentación, redacción e ortografía) conforme coa situación académica do estudante.
Por último, recoméndase posuír coñecementos de informática a nivel de usuario e manexo básico da rede Internet.
Observacións(1) TITORÍAS: HORARIO, LUGAR E INFORMACIÓN DE CONTACTO
Horario: Fixado ao comezo do 2.º semestre
Lugar: Gabinete 122
Teléfono: 881 811 776
Enderezo electrónico: ana.codesido@usc.es
(2) Lingua vehicular de docencia: galego
(3) Máis información: cfr. ‘Guía docente de Lingüística Computacional 2013/2014’ (na Web da Facultade de Filoloxía)