CALLISTO: The basics of corpora and NLP for low-resource languages.
National Centre for Scientific Research (CNRS), University of Vienna
Eva Vetter, Universität Wien
About
General Course Information
¡Bienvenidos a este curso dirigido a interesados en las humanidades, ciencias sociales y lingüística que desean aprender sobre el trabajo con corpus de lenguas minoritarias! Descubre y comprende cómo se puede crear este tipo de corpus y aprende las condiciones importantes para trabajar en ellos y con ellos.
Este breve curso introductorio ofrece una visión de cómo los corpus lingüísticos pueden apoyar el desarrollo de la investigación y la sociedad, y cómo contribuyen a la supervivencia digital de lenguas con corpus restringido.
«En el campo de la informática, cada comunidad lingüística debe disponer de tecnología y productos informáticos en su propio idioma para tener acceso completo a las ventajas que estas tecnologías aportan en términos de autoexpresión, educación, comunicación, publicación, traducción y, en general, el manejo de la información y la difusión cultural.»
UNESCO – Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura, Declaración Universal de Derechos Lingüísticos (Barcelona, 1996). [Consultado el 29.12.2023 en https://www.gfbv.it/3dossier/barcelona96-dt.html]
Content
Course Content
¡Este curso consta de 4 lecciones y está diseñado para ser llevado a cabo de manera lineal y progresiva! Se cubrirán los siguientes temas principales:
Lección 1: El procesamiento del lenguaje natural (= Natural Language Processing, NLP) y el futuro de las lenguas
Lección 2: Corpus adecuados para NLP
Lección 3: Intercambio de corpus y los principios FAIR
Lección 4: El manejo cuidadoso de cuestiones legales y éticas
Course Goals
- Reconocer los desafíos asociados con el uso compartido de corpus para lenguas minoritarias.
- Comprender la cadena de desarrollo para el procesamiento del lenguaje natural (aplicaciones NLP/ Natural Language Processing (Procesamiento del Lenguaje Natural), NLP).
- Diferenciar entre los diversos tipos de corpus que pueden ser utilizados para el desarrollo de NLP.
- Identificar las características de un buen corpus para NLP.
- Integrar los principios FAIR en las prácticas de uso compartido de corpus.
- Examinar el marco legal aplicable a un corpus.
Previous Knowledge
Dado que se trata de una introducción al tema del trabajo con corpus de lenguas minoritarias, no se requieren conocimientos previos específicos para poder seguir este curso.
Course Procedure
El curso consta de las cuatro lecciones breves mencionadas, que incluyen contenidos escritos, elementos interactivos y un cuestionario final. Las lecciones se desbloquean en función del rendimiento: cuando se completa con éxito una lección, incluido el cuestionario, se obtiene acceso inmediato a la siguiente lección.
Certificate
Por participar activamente en el curso recibirá un certificado automático que incluye su nombre, el nombre del curso así como las lecciones completadas. Queremos señalar que este certificado se limita a confirmar que el usuario ha respondido correctamente al menos al 75% de las preguntas de autoevaluación.Course Instructor
Eva Vetter, Universität Wien
Desarrolladoras de curso
Mélanie Jouitteau, IKER (CNRS)
Mélanie Jouitteau es investigadora en linguística en el CNRS, especializada en bretón, lenguas minoritarias e investigación participativa. Consciente del frágil futuro de la diversidad lingüística humana en el contexto de la tecnologización de las relaciones humanas, centra su investigación en la creación de soluciones de adquisición de datos para apoyar el desarrollo de NLP de lenguas con corpus restringidos.
Lynda Kehli, Inist – DoRANum (CNRS)
Lynda Kehli es responsable de ingeniería pedagógica y formación en ICT (Información Científica y Técnica) en el Inist-CNRS. Con el equipo Formation-DoRANum, está desarrollando una nueva generación de cursos semipresenciales que combinan el aprendizaje digital, los seminarios web y otros métodos como los juegos serios. El objetivo es ayudar a la comunidad científica a abrirse y compartir.
Organizacíon
Lena Kratochwil, Universidad de Viena
Lena Kratochwil estudia para profesora de francés y alemán y trabaja como ayudante en el equipo de investigación sobre enseñanza y aprendizaje de idiomas (Centro de Formación del Profesorado / Instituto de Lingüística).
Eva Vetter, Universidad de Viena
Eva Vetter es catedrática de Investigación sobre la Enseñanza y el Aprendizaje de Lenguas. En sus investigaciones sociolingüísticas, sitúa la cuestión de la minorización lingüística en el contexto de la equidad (en la educación) y los derechos humanos.
http://orcid.org/0000-0003-0504-6991
Login & Enrol Currently: 268 Participants
Free for all € 0.00
Partners
El Centro de Investigación de Lengua y Textos Vascos (IKER) - una unidad conjunta de investigación (Unité Mixte de Recherche – UMR5478) administrada por el Centre National de la Recherche Scientifique (CNRS), la Universidad Bordeaux Montaigne y la Universidad de Pau y Pays de l’Adour (UPPA).
National Centre for Scientific Research (CNRS)
University of Vienna
Wien