Proyecto Tsu̱nkua

¿Qué es?

Tsu̱nkua es un corpus paralelo, en línea, español-otomí que permite búsquedas de palabras o frases dentro de una colección de documentos bilingües digitalizados .

Un corpus paralelo es un conjunto de textos en una lengua fuente con sus respectivas traducciones en una lengua destino, es decir, cada texto posee su traducción correspondiente en otra lengua.

Este tipo de sistemas nos permite hacer búsquedas de palabras o frases en español u otomí y ver cómo diversas fuentes han traducido esa palabra.

Por ejemplo, si buscamos la palabra “gracias” en español, podemos ver aquellos fragmentos que contienen la palabra buscada, así como su fragmento asociado en otomí, dependiendo de la fuente (podemos observar que “gracias” se traduce diferente en el prontuario otomí, que en libro otomí de Toluca):

Ejemplo de búsqueda de una palabra en español.

Visita Tsunkua https://tsunkua.elotl.mx/

¿Para quiénes está pensado este tipo de sistemas?

Este tipo de sistemas es útil para estudiosos, aprendices y hablantes de otomí (hñahñu) que quieran observar cómo se traduce cierta palabra o frase dependiendo del contexto y de la fuente.

Adicionalmente, es un recurso útil para los lingüistas computacionales que deseen utilizar este tipo de corpus para realizar sistemas de traducción automática y otro tipo de estudios

¿De qué recursos bilingües se alimenta Tsu̱nkua?

Actualmente Tsu̱nkua está en desarrollo, continuamos en la tarea de seguir agregando contenido bilingüe para enriquecer al corpus. Las fuentes recopiladas pertenecen a diferentes dominios, por ejemplo, libros de historia, cuentos, prontuarios. Al hacer una búsqueda se puede consultar información de la fuente de donde fue extraído el texto.

El corpus actualmente contiene materiales bibliográficos bilingües como La Visión de los Vencidos traducida al Hñahñu, prontuarios del INALI, elicitaciones del Otomí de Toluca hechas por la Dra. Yolanda Lastra, entre otros.

Estos textos representan, hasta ahora, sólo las variantes del Mezquital y del Estado de México, en específico de la región de San Andrés Cuexcontitlán, municipio de Toluca.

¿Por qué se llama Tsu̱nkua?

Tsu̱nkua es la palabra para referirse al axolote en la región otomí-ñatho de las montañas del Nevado de Toluca (Amanalco/Nzábi). Agradecemos a Caritina de la Cruz, y a su familia, originarios de esta región, por compartir este saber con nosotros.

¿Quiénes hacen Tsu̱nkua?

El proyecto Tsu̱nkua, corpus paralelo otomí-español, se lleva a cabo gracias a los colaboradores y voluntarios de la Comunidad Elotl. Una comunidad, sin fines de lucro, interesada en el desarrollo de tecnologías del lenguaje. Difundimos cuestiones lingüísticas, sociales y tecnológicas de las lenguas mexicanas

En particular, agradecemos la asesoría y participación de los siguientes investigadores y estudiantes (primordialmente de la UNAM):

  • Mtro. en Lingüística Víctor Mijangos (doctorante en el posgrado en lingüística)
  • Dra. Ximena Gutierrez-Vasques (lingüista computacional)
  • M. en C. Javier Santillán
  • Diego Alberto Barriga (estudiante de Ingeniería en computación)
  • Ing. José Luis Olivares Castillo
  • Yael Hermenegildo (estudiante de licenciatura en letras)
  • Mtra en Estudios Amerindios y Educación Bilingüe Cynthia Montaño


Si tienes más preguntas o te gustaría colaborar con textos bilingües, contáctanos:

[email protected]

Ayúdanos a poder seguir desarrollando este tipo de proyectos. Donaciones

About the author: Elotl