CALLISTO: The basics of corpora and NLP for low-resource languages.
CALLISTO: The basics of corpora and NLP for low-resource languages.
DE, EN, ES, FR
Self-study
CALLISTO: The basics of corpora and NLP for low-resource languages.

CALLISTO: The basics of corpora and NLP for low-resource languages.

National Centre for Scientific Research (CNRS), University of Vienna

Eva Vetter, Universität Wien

About

Duration 4 units
Unit 1 hour/unit
Licence CC BY-NC-ND 4.0
Participants 268
Availability Unlimited
Start Date 30 de septiembre de 2024
Costs € 0.00

General Course Information

¡Bienvenidos a este curso dirigido a interesados en las humanidades, ciencias sociales y lingüística que desean aprender sobre el trabajo con corpus de lenguas minoritarias! Descubre y comprende cómo se puede crear este tipo de corpus y aprende las condiciones importantes para trabajar en ellos y con ellos.

Este breve curso introductorio ofrece una visión de cómo los corpus lingüísticos pueden apoyar el desarrollo de la investigación y la sociedad, y cómo contribuyen a la supervivencia digital de lenguas con corpus restringido.

«En el campo de la informática, cada comunidad lingüística debe disponer de tecnología y productos informáticos en su propio idioma para tener acceso completo a las ventajas que estas tecnologías aportan en términos de autoexpresión, educación, comunicación, publicación, traducción y, en general, el manejo de la información y la difusión cultural.»

UNESCO – Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura, Declaración Universal de Derechos Lingüísticos (Barcelona, 1996). [Consultado el 29.12.2023 en https://www.gfbv.it/3dossier/barcelona96-dt.html]

 

Content

Course Content

¡Este curso consta de 4 lecciones y está diseñado para ser llevado a cabo de manera lineal y progresiva! Se cubrirán los siguientes temas principales:

Lección 1:         El procesamiento del lenguaje natural (= Natural Language Processing, NLP) y el futuro de las lenguas

Lección 2:         Corpus adecuados para NLP

Lección 3:         Intercambio de corpus y los principios FAIR

Lección 4:         El manejo cuidadoso de cuestiones legales y éticas

Course Goals

  • Reconocer los desafíos asociados con el uso compartido de corpus para lenguas minoritarias. 
  • Comprender la cadena de desarrollo para el procesamiento del lenguaje natural (aplicaciones NLP/ Natural Language Processing (Procesamiento del Lenguaje Natural), NLP). 
  • Diferenciar entre los diversos tipos de corpus que pueden ser utilizados para el desarrollo de NLP.
  • Identificar las características de un buen corpus para NLP. 
  • Integrar los principios FAIR en las prácticas de uso compartido de corpus. 
  • Examinar el marco legal aplicable a un corpus.

Previous Knowledge

Dado que se trata de una introducción al tema del trabajo con corpus de lenguas minoritarias, no se requieren conocimientos previos específicos para poder seguir este curso.

Course Procedure

El curso consta de las cuatro lecciones breves mencionadas, que incluyen contenidos escritos, elementos interactivos y un cuestionario final. Las lecciones se desbloquean en función del rendimiento: cuando se completa con éxito una lección, incluido el cuestionario, se obtiene acceso inmediato a la siguiente lección.

Certificate

Por participar activamente en el curso recibirá un certificado automático que incluye su nombre, el nombre del curso así como las lecciones completadas. Queremos señalar que este certificado se limita a confirmar que el usuario ha respondido correctamente al menos al 75% de las preguntas de autoevaluación.

Licence

Este trabajo está licenciado bajo CC BY-NC-ND 4.0

Course Instructor

Eva Vetter, Universität Wien


Desarrolladoras de curso


Vetter & Jouitteau

Mélanie Jouitteau, IKER (CNRS)
Mélanie Jouitteau es investigadora en linguística en el CNRS, especializada en bretón, lenguas minoritarias e investigación participativa. Consciente del frágil futuro de la diversidad lingüística humana en el contexto de la tecnologización de las relaciones humanas, centra su investigación en la creación de soluciones de adquisición de datos para apoyar el desarrollo de NLP de lenguas con corpus restringidos.


LyndaKehli 


Lynda Kehli, Inist – DoRANum (CNRS)
Lynda Kehli es responsable de ingeniería pedagógica y formación en ICT (Información Científica y Técnica) en el Inist-CNRS. Con el equipo Formation-DoRANum, está desarrollando una nueva generación de cursos semipresenciales que combinan el aprendizaje digital, los seminarios web y otros métodos como los juegos serios. El objetivo es ayudar a la comunidad científica a abrirse y compartir.



Organizacíon

Lena Kratochwil, Universidad de Viena
Lena Kratochwil estudia para profesora de francés y alemán y trabaja como ayudante en el equipo de investigación sobre enseñanza y aprendizaje de idiomas (Centro de Formación del Profesorado / Instituto de Lingüística).

Vetter & Kratochwil

Eva Vetter, Universidad de Viena
Eva Vetter es catedrática de Investigación sobre la Enseñanza y el Aprendizaje de Lenguas. En sus investigaciones sociolingüísticas, sitúa la cuestión de la minorización lingüística en el contexto de la equidad (en la educación) y los derechos humanos.
http://orcid.org/0000-0003-0504-6991

Login & Enrol Currently: 268 Participants

Free for all € 0.00

Partners

El Centro de Investigación de Lengua y Textos Vascos (IKER) - una unidad conjunta de investigación (Unité Mixte de Recherche – UMR5478) administrada por el Centre National de la Recherche Scientifique (CNRS), la Universidad Bordeaux Montaigne y la Universidad de Pau y Pays de l’Adour (UPPA).

National Centre for Scientific Research (CNRS)

National Centre for Scientific Research (CNRS)

273 Participants
1 Courses
Average rating
University of Vienna

University of Vienna

Wien

15976 Participants
25 Courses
Average rating

Rating

CALLISTO: The basics of corpora and NLP for low-resource languages.

5 stars
0
4 stars
0
3 stars
0
2 stars
0
1 stars
0