Guía docente de Los Corpus Lingüísticos: Aplicaciones (M70/56/2/19)

Curso 2022/2023
Fecha de aprobación por la Comisión Académica 29/06/2022

Máster

Máster Universitario en Estudios Superiores de Lengua Española

Módulo

IV. Aplicaciones

Rama

Artes y Humanidades

Centro Responsable del título

International School for Postgraduate Studies

Semestre

Primero

Créditos

3

Tipo

Optativa

Tipo de enseñanza

Presencial

Profesorado

  • Inmaculada González Sopeña
  • Gael Vaamonde Dos Santos

Tutorías

Inmaculada González Sopeña

Email
  • Primer semestre
    • Martes 10:30 a 13:30 (Fac. Filosofía y Letras)
    • Miercoles 10:30 a 13:30 (Fac. Filosofía y Letras)
    • Miércoles 10:30 a 13:30 (Fac. Filosofía y Letras)
  • Segundo semestre
    • Martes 8:30 a 14:30 (Fac. Filosofía y Letras)

Gael Vaamonde Dos Santos

Email
  • Primer semestre
    • Miercoles 10:30 a 13:30 (Fac. Filosofía y Letras)
    • Miércoles 10:30 a 13:30 (Fac. Filosofía y Letras)
    • Jueves 9:30 a 12:30 (Fac. Filosofía y Letras)
  • Segundo semestre
    • Miércoles 10:30 a 13:30 (Fac. Filosofía y Letras)
    • Miercoles 10:30 a 13:30 (Fac. Filosofía y Letras)
    • Jueves 9:30 a 12:30 (Fac. Filosofía y Letras)

Breve descripción de contenidos (Según memoria de verificación del Máster)

  • Un corpus es un "conjunto de documentos lingüísticos de cualquier tipo, que se toma como modelo de un estado o nivel de lengua predeterminado, al cual representa o se pretende que represente" (Alvar Ezquerra y otros 1994). En la actualidad, es difícil concebir un trabajo de investigación lingüística sin un corpus documental previo. Tenemos a nuestra disposición abundantes corpus en línea (CORDE, CREA, Corpus del español, Corpus del Nuevo Diccionario Histórico, CORDIAM, CORLEXIN (Corpus  léxico de inventarios), corpus CHARTA, COREECOM (Corpus electrónico del español colonial mexicano), Post-Scriptum, Skecth Engine, etc. y herramientas informáticas para analizar corpus de diseño propio (WordSmith, AntConc, etc.).
  • El objetivo de este curso es mostrar las aplicaciones de los corpus digitales y de sus herramientas de análisis para la investigación lingüística de diversa naturaleza: estudios normativos, lexicográficos, descriptivos, de carácter sincrónico o diacrónico.

Prerrequisitos y/o Recomendaciones

  • Recomendaciones:
    • Nivel C1 de español.
    • Haber cursado asignaturas de grado relacionadas con la gramática del español.

Competencias

Competencias Básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Resultados de aprendizaje (Objetivos)

  • El alumnado sabrá:
    • Aplicar los conocimientos necesarios para configurar el corpus base de su investigación lingüística.
    • Formular hipótesis y preguntas de investigación sobre aspectos sincrónicos y diacrónicos a partir de la consulta o elaboración de corpus lingüísticos.
    • Utilizar corpus lingüísticos, bases de datos y técnicas computacionales para analizar fenómenos lingüisticos de naturaleza diacrónica o sincrónica.
    • Buscar las fuentes bibliográficas y recursos para el análisis y la elaboración de corpus.
    • Diseñar una posible investigación a partir de corpus relacionada con algún aspecto lingüístico de índole sincrónica o diacrónica.

 

Programa de contenidos Teóricos y Prácticos

Teórico

  • Tema 1. Términos y conceptos básicos de la lingüística de corpus. XML-TEI, tokenización, normalización, lematización y etiquetado morfosintáctico. Lenguaje CQP, Expresiones regulares y comandos UNIX.
  • Tema 2. Tipos de corpus lingüísticos.
  • Tema 3. Los corpus en línea: CORDE, CREA, Corpes XXI, Corpus del español, CorLexIn, CORDIAM, Sketch Engine, Post Scriptum, etc.
  • Tema 4. Herramientas para la elaboración y diseño de corpus de investigación lingüistica diacrónica y sincrónica: AntConc, LancsBox, TEITOK, etc.
  • Tema 5. Análisis cualitativo y cuantitativo de datos a partir de corpus. Introducción a la estadística básica aplicada a los corpus lingüísticos.

Práctico

  • Seminario 1. Lectura y análisis de artículos de investigación lingüística basados en análisis cualitativo o cuantitativo de corpus.
  • Seminario 2. Microdiseños de investigaciones diacrónicas o sincrónicas basadas en corpus.
  • Seminario 3. Prácticas de tokenización, normalización, etiquetado de corpus. Lenguaje CQP, expresiones regulares y comandos UNIX.

Bibliografía

Bibliografía fundamental

  • Calderón Campos, Miguel. 2019. "La edición de corpus lingüísticos en la plataforma TEITOK. El caso de Oralia diacrónica del español", Chimera: Romance Corpora and Linguistic Studies, 6, 21-36
  • Rojo, Guillermo. 2021. Introducción a la lingüística de corpus en español. London: Routledge.
  • Vaamonde, Gael. 2015. “P.S. Post Scriptum. Dos corpus diacrónicos de escritura cotidiana. Procesamiento del lenguaje natural”, 55, 57-64.

Bibliografía complementaria

  • Allés Torrent, Susanna (2019). “El lenguaje XML y algunos conceptos generales”. TTHUB. Text Technologies Hub: Recursos sobre tecnologías del texto y edición digital. https://tthub.io/aprende/l2-xml/ DOI: 10.5281/zenodo.3530805
  • Bertolotti, Virginia, y Concepción Company (2014), "El corpus diacrónico y diatópico del español de América (CORDIAM). Propuesta de tipología documental", Cuadernos de la ALFAL, 6, 130-148.
  • Clavería Nadal, Gloria (2012): “Corpus diacrónicos: nuevas perspectivas para el estudio de la historia de la lengua”, en Emilio Montero Cartelle (ed.), Actas del VIII Congreso Internacional de Historia de la Lengua Española, vol. I, Santiago de Compostela, Meubook, pp. 405-420.
  • Gries, Stefan Th. & Magali Paquot (2020). “Writing up a corpus-linguistic paper”. In Magali Paquot & Stefan Th. Gries (eds.). A practical handbook of corpus linguistics. Berlin & New York: Springer.
  • Rojo, Guillermo (2010), "Sobre codificación y explotación de corpus textuales: otra comparación del Corpus del español con el CORDE y el CREA", Lingüística, 24, 11-50.
  • Rojo, Guillermo (2011), "Frecuencia de inventario y frecuencia de uso", Revista española de lingüística, 41/1, 5-43.

Enlaces recomendados

Metodología docente

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)

Evaluación Ordinaria

  • El artículo 17 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que la convocatoria ordinaria estará basada preferentemente en la evaluación continua del estudiante, excepto para quienes se les haya reconocido el derecho a la evaluación única final.
  • La evaluación continua estará basada en la realización de, al menos, tres pruebas a lo largo del curso:
    • Trabajo individual: 50-60% de la calificación
    • Trabajo colectivo (pequeño grupo): 20-30% de la calificación
    • Cuestionario: 10-20% de la calificación
  • Para garantizar la objetividad y en función del número de asistentes, podrán realizarse pruebas escritas, trabajos o exposiciones orales, que se concretarán con la suficiente antelación.

Evaluación Extraordinaria

  • El artículo 19 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que los estudiantes que no hayan superado la asignatura en la convocatoria ordinaria dispondrán de una convocatoria extraordinaria. A ella podrán concurrir todos los estudiantes, con independencia de haber seguido o no un proceso de evaluación continua.
    • De esta forma, el estudiante que no haya realizado la evaluación continua tendrá la posibilidad de obtener el 100% de la calificación mediante la realización de un examen sobre los contenidos teóricos y prácticos de la asignatura.

Evaluación única final

  • El artículo 8 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que podrán acogerse a la evaluación única final, el estudiante que no pueda cumplir con el método de evaluación continua por causas justificadas.
  • Para acogerse a la evaluación única final, el estudiante, en las dos primeras semanas de impartición de la asignatura o en las dos semanas siguientes a su matriculación si ésta se ha producido con posterioridad al inicio de las clases, lo solicitará, a través del procedimiento electrónico, a la Coordinación del Máster, quien dará traslado al profesorado correspondiente, alegando y acreditando las razones que le asisten para no poder seguir el sistema de evaluación continua.
  • La evaluación en tal caso consistirá en dos pruebas escritas, una de carácter teórico, que supondrá el 70% de la calificación y otra de carácter práctico, que supondrá el 30% de la calificación

Información adicional

  • En todo caso, se tendrá en cuenta el nivel de corrección ortográfica, morfosintáctica y léxica, tanto de los trabajos y exámenes escritos como de las presentaciones orales.