Guía docente de Los Corpus Lingüísticos: Aplicaciones (M70/56/3/19)
Curso
2024/2025
Fecha de aprobación por la Comisión Académica
04/07/2024
Máster
Máster Universitario en Estudios Superiores de Lengua Española
Módulo
IV. Aplicaciones
Rama
Artes y Humanidades
Centro Responsable del título
International School for Postgraduate Studies
Semestre
Primero
Créditos
3
Tipo
Optativa
Tipo de enseñanza
Presencial
Profesorado
- Inmaculada González Sopeña
- Gael Vaamonde Dos Santos
Tutorías
Inmaculada González Sopeña
Email- Primer semestre
- Lunes 11:00 a 14:00 (Facultad de Filosofía y Letras)
- Miércoles 11:00 a 14:00 (Facultad de Filosofía y Letras)
- Miercoles 11:00 a 14:00 (Facultad de Filosofía y Letras)
- Segundo semestre
- Lunes 11:00 a 14:00 (Facultad de Filosofía y Letras)
- Miercoles 11:00 a 14:00 (Facultad de Filosofía y Letras)
- Miércoles 11:00 a 14:00 (Facultad de Filosofía y Letras)
Gael Vaamonde Dos Santos
Email- Primer semestre
- Lunes 9:30 a 12:30 (Facultad de Filosofía y Letras)
- Miercoles 9:30 a 12:30 (Facultad de Filosofía y Letras)
- Miércoles 9:30 a 12:30 (Facultad de Filosofía y Letras)
- Segundo semestre
- Lunes 9:30 a 12:30 (Facultad de Filosofía y Letras)
- Miercoles 9:30 a 12:30 (Facultad de Filosofía y Letras)
- Miércoles 9:30 a 12:30 (Facultad de Filosofía y Letras)
Breve descripción de contenidos (Según memoria de verificación del Máster)
- Un corpus es un "conjunto de documentos lingüísticos de cualquier tipo, que se toma como modelo de un estado o nivel de lengua predeterminado, al cual representa o se pretende que represente" (Alvar Ezquerra y otros 1994). En la actualidad, es difícil concebir un trabajo de investigación lingüística sin un corpus documental previo. Tenemos a nuestra disposición abundantes corpus en línea (CORDE, CREA, Corpus del español, Corpus del Nuevo Diccionario Histórico, CORDIAM, CORLEXIN (Corpus léxico de inventarios), corpus CHARTA, COREECOM (Corpus electrónico del español colonial mexicano), Post-Scriptum, Skecth Engine, etc. y herramientas informáticas para analizar corpus de diseño propio (WordSmith, AntConc, etc.).
- El objetivo de este curso es mostrar las aplicaciones de los corpus digitales y de sus herramientas de análisis para la investigación lingüística de diversa naturaleza: estudios normativos, lexicográficos, descriptivos, de carácter sincrónico o diacrónico.
Prerrequisitos y/o Recomendaciones
- Recomendaciones:
- Nivel C1 de español.
- Haber cursado asignaturas de grado relacionadas con la gramática del español.
Competencias
Competencias Básicas
- CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
- CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
- CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
- CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
- CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
Resultados de aprendizaje (Objetivos)
- El alumnado sabrá:
- Aplicar los conocimientos necesarios para configurar el corpus base de su investigación lingüística.
- Formular hipótesis y preguntas de investigación sobre aspectos sincrónicos y diacrónicos a partir de la consulta o elaboración de corpus lingüísticos.
- Utilizar corpus lingüísticos, bases de datos y técnicas computacionales para analizar fenómenos lingüisticos de naturaleza diacrónica o sincrónica.
- Buscar las fuentes bibliográficas y recursos para el análisis y la elaboración de corpus.
- Diseñar una posible investigación a partir de corpus relacionada con algún aspecto lingüístico de índole sincrónica o diacrónica.
Programa de contenidos Teóricos y Prácticos
Teórico
- Tema 1. Términos y conceptos básicos de la lingüística de corpus. XML-TEI, tokenización, normalización, lematización y etiquetado morfosintáctico. Lenguaje CQP, Expresiones regulares y comandos UNIX.
- Tema 2. Tipos de corpus lingüísticos.
- Tema 3. Los corpus en línea: CORDE, CREA, Corpes XXI, Corpus del español, CorLexIn, CORDIAM, Post Scriptum, etc.
- Tema 4. Herramientas para la elaboración y diseño de corpus de investigación lingüistica diacrónica y sincrónica: AntConc, Sketch Engine, TEITOK, etc.
- Tema 5. Análisis cualitativo y cuantitativo de datos a partir de corpus. Introducción a la estadística básica aplicada a los corpus lingüísticos.
Práctico
- Seminario 1. Lectura y análisis de artículos de investigación lingüística basados en análisis cualitativo o cuantitativo de corpus.
- Seminario 2. Microdiseños de investigaciones diacrónicas o sincrónicas basadas en corpus.
- Seminario 3. Prácticas de tokenización, normalización, etiquetado de corpus. Lenguaje CQP, expresiones regulares y comandos UNIX.
Bibliografía
Bibliografía fundamental
- Calderón Campos, Miguel. 2019. "La edición de corpus lingüísticos en la plataforma TEITOK. El caso de Oralia diacrónica del español", Chimera: Romance Corpora and Linguistic Studies, 6, 21-36
- Rojo, Guillermo. 2021. Introducción a la lingüística de corpus en español. London: Routledge.
- Vaamonde, Gael. 2015. “P.S. Post Scriptum. Dos corpus diacrónicos de escritura cotidiana. Procesamiento del lenguaje natural”, 55, 57-64.
Bibliografía complementaria
- Allés Torrent, Susanna (2019). “El lenguaje XML y algunos conceptos generales”. TTHUB. Text Technologies Hub: Recursos sobre tecnologías del texto y edición digital. https://tthub.io/aprende/l2-xml/ DOI: 10.5281/zenodo.3530805
- Bertolotti, Virginia, y Concepción Company (2014), "El corpus diacrónico y diatópico del español de América (CORDIAM). Propuesta de tipología documental", Cuadernos de la ALFAL, 6, 130-148.
- Clavería Nadal, Gloria (2012): “Corpus diacrónicos: nuevas perspectivas para el estudio de la historia de la lengua”, en Emilio Montero Cartelle (ed.), Actas del VIII Congreso Internacional de Historia de la Lengua Española, vol. I, Santiago de Compostela, Meubook, pp. 405-420.
- Gries, Stefan Th. & Magali Paquot (2020). “Writing up a corpus-linguistic paper”. In Magali Paquot & Stefan Th. Gries (eds.). A practical handbook of corpus linguistics. Berlin & New York: Springer.
- Rojo, Guillermo (2010), "Sobre codificación y explotación de corpus textuales: otra comparación del Corpus del español con el CORDE y el CREA", Lingüística, 24, 11-50.
- Rojo, Guillermo (2011), "Frecuencia de inventario y frecuencia de uso", Revista española de lingüística, 41/1, 5-43.
Enlaces recomendados
- CREA http://corpus.rae.es/creanet.html
- CORDE http://corpus.rae.es/cordenet.html
- CORPUS DEL ESPAÑOL http://www.corpusdelespanol.org/
- Programa de concordancias AntConc http://www.laurenceanthony.net/software.htm
- Portal de Archivos Españoles. Pares http://pares.mcu.es
- Corpus Post-Scriptum http://teitok.clul.ul.pt/postscriptum/
- ODE (Oralia diacrónica del español): http://corpora.ugr.es/ode
- CORDIAM: http://www.cordiam.org/
- LancsBox: http://corpora.lancs.ac.uk/lancsbox/
Metodología docente
Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)
Evaluación Ordinaria
- El artículo 17 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que la convocatoria ordinaria estará basada preferentemente en la evaluación continua del estudiante, excepto para quienes se les haya reconocido el derecho a la evaluación única final.
- La evaluación continua estará basada en la realización de, al menos, tres pruebas a lo largo del curso:
- Trabajo individual: 50-60% de la calificación
- Trabajo colectivo (pequeño grupo): 20-30% de la calificación
- Cuestionario: 10-20% de la calificación
- Para garantizar la objetividad y en función del número de asistentes, podrán realizarse pruebas escritas, trabajos o exposiciones orales, que se concretarán con la suficiente antelación.
Evaluación Extraordinaria
- El artículo 19 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que los estudiantes que no hayan superado la asignatura en la convocatoria ordinaria dispondrán de una convocatoria extraordinaria. A ella podrán concurrir todos los estudiantes, con independencia de haber seguido o no un proceso de evaluación continua.
- De esta forma, el estudiante que no haya realizado la evaluación continua tendrá la posibilidad de obtener el 100% de la calificación mediante la realización de un examen sobre los contenidos teóricos y prácticos de la asignatura.
Evaluación única final
- El artículo 8 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que podrán acogerse a la evaluación única final, el estudiante que no pueda cumplir con el método de evaluación continua por causas justificadas.
- Para acogerse a la evaluación única final, el estudiante, en las dos primeras semanas de impartición de la asignatura o en las dos semanas siguientes a su matriculación si ésta se ha producido con posterioridad al inicio de las clases, lo solicitará, a través del procedimiento electrónico, a la Coordinación del Máster, quien dará traslado al profesorado correspondiente, alegando y acreditando las razones que le asisten para no poder seguir el sistema de evaluación continua.
- La evaluación en tal caso consistirá en dos pruebas escritas, una de carácter teórico, que supondrá el 70% de la calificación y otra de carácter práctico, que supondrá el 30% de la calificación
Información adicional
- En todo caso, se tendrá en cuenta el nivel de corrección ortográfica, morfosintáctica y léxica, tanto de los trabajos y exámenes escritos como de las presentaciones orales.