Quiero compartir con ustedes el emocionante viaje que me ha llevado a desarrollar un proyecto, una iniciativa que combina mi formación en antropología con mi experiencia en el desarrollo de productos digitales, todo impulsado por mi creciente interés en la inteligencia artificial. Permítanme llevarlos atrás en el tiempo para descubrir cómo nació esta idea.
Un camino culebrero
Mi historia profesional se ha centrado en el desarrollo de productos digitales, especialmente en el ámbito del cuidado de las personas mayores. Sin embargo, últimamente, mi camino me llevó a adentrarme en el fascinante mundo de la inteligencia artificial como parte de mi trabajo. Este viaje de autodescubrimiento y aprendizaje me hizo reflexionar sobre mi formación como antropólogo, una faceta de mi vida que había quedado un poco en segundo plano.
El despertar de una Idea
Un día, impulsado por una intensa curiosidad, me embarqué en una investigación para conocer cuántos hablantes de lenguas indígenas había en mi país de origen, Colombia. Para responder a esta pregunta, recopile algunos datos y los plasmé en un mapa de Colombia, un territorio que siempre ha sido el epicentro de mi curiosidad antropológica. Lo que entendí, algo quizas no muy raro para un etnolingüsta profesional, me sorprendio.
En la vasta región del Vaupés colombiano, en pleno corazón de la cuenca del Amazonas, me encontré con una sorprendente sinfonía de diversidad lingüística. En este territorio relativamente pequeño, convivían cerca de 25 lenguas diferentes. Algunas de estas lenguas eran tan distintas entre sí que las poblaciones que vivían en áreas geográficamente cercanas apenas podían entenderse. A pesar de que ya estaba familiarizado con la diversidad lingüística en Colombia, este revelación me impactó profundamente.
Inspirado, desempolvé algunos de mis libros de antropología y me aventuré por los cauces de los ríos Apaporis y Vaupés en busca de pistas adicionales sobre esta fascinante diversidad lingüística. A lo largo de mi viaje, me crucé con exploradores, testimonios de la explotación del caucho, novelas y conocimientos sobre plantas medicinales. Este periplo también me brindó una lección esencial: la usurpación del territorio amazónico ha sido una empresa de larga data, marcada por las misiones religiosas, los colonos y los forasteros, y el vehículo para esta usurpación ha sido, en gran medida, la supresión de la lengua y su uso con fines de dominación cultural.
Es hora de revertir este ciclo, devolviendo a los pueblos lo que les fue arrebatado para que ellos hagan uso de ello en sus propios términos. En este punto de mi travesía, comprendí que la transcripción era mucho más que una simple traducción; era una cuestión ética y un paso vital hacia la preservación de culturas y lenguas que merecen florecer en su plenitud aceptando que no son piezas de museo, sino que son entidades vivas y dinámicas.
Una profunda fascinación
Esta revelación desencadenó un ferviente interés en el estudio de estas lenguas indígenas. A medida que profundizaba en mis investigaciones, me quedé absorto y fascinado por las historias, los conocimientos y las expresiones artísticas únicas que estas lenguas representan. La diversidad cultural y lingüística que redescubrí me recordó la importancia de preservar estos tesoros culturales para las generaciones futuras y mis motivaciones por estudiar antropología en mi juventud.
Un cambio de enfoque crucial
Viviendo en Finlandia como colombiano, experimento el multilingüismo a diario, y esto ha enriquecido mi vida de maneras invaluables. Fue entonces cuando reafirmé la idea de que, para preservar una lengua, es esencial contar con registros sonoros y escritos para su divulgación y estudio. Sin embargo, comprend que uno de los mayores obstáculos radicaba en el proceso de transcripción, que resulta ser tedioso y complejo.
Fue en ese punto cuando decidí explorar soluciones tecnológicas y me topé con los sistemas de reconocimiento de voz. Tras una profunda reflexión, llegué a la conclusión de que centrar mis esfuerzos en lenguas tan minoritarias de la familia del Tucano del Vaupés podría poner en riesgo el proyecto en sí. Fue entonces cuando tuve otro hallazgo crucial en mi prospección: el Wayuunaiki es la lengua indígena más hablada en Colombia.
La encrucijada del Wayuunaiki
Este giro en mi camino me condujo a un punto crucial. Por un lado, me encontré ante el desafiante cometido de recopilar y almacenar datos de las lenguas minoritarias del Vaupés, un propósito loable pero potencialmente abrumador dada su extrema rareza. Sin embargo, al mismo tiempo, me revelé ante la sorprendente realidad de que el Wayuunaiki era la lengua indígena predominante en Colombia.
Mientras no abandonaba mi compromiso de explorar y preservar las lenguas del Vaupés, me dispuse a enfrentar con determinación este nuevo desafío. El Wayuunaiki, un tesoro cultural y lingüístico de incalculable valor, es hablado por una gran comunidad en Colombia y Venezuela, con un estimado de alrededor de 400.000 personas. Además de su profunda significancia cultural e identitaria, su preservación y promoción revisten importancia en los ámbitos políticos y sociales, respaldados por organizaciones consolidadas.
La existencia de bases previamente establecidas allanó el camino para llevar a cabo una primera prueba de concepto, que, con suerte, podría extenderse a otras lenguas en el futuro.
Un propósito claro
Con estas revelaciones en mente, el proyecto tomó forma. Decidí concentrar mis esfuerzos en desarrollar un modelo de reconocimiento de voz capaz de transcribir el Wayuunaiki hablado en texto. Esta tecnología no solo preservaría la riqueza de las conversaciones y narrativas orales en Wayuunaiki, sino que también contribuiría al estudio, la enseñanza y la preservación de la lengua para las generaciones venideras, una actividad que ha sido impulsada incansablemente por la comunidad de hablantes de Wayuunaiki desde diversos frentes.
El camino no ha sido fácil y hemos enfrentado desafíos técnicos y logísticos, pero estamos comprometidos con nuestra misión. Nos encontramos en las primeras etapas de colaboración con organizaciones y personas que han mostrado un interés inicial en este proyecto, y esperamos recibir su valiosa retroalimentación. Actualmente, disponemos de una primera versión del modelo que puede ser utilizada y aprovechada por individuos con cierto nivel de conocimientos técnicos y lingüísticos. Sin embargo, aún queda un camino por recorrer para hacer que sea más accesible y preciso.
- Prueba de concepto de Transcriptor de voz en wayuunaiki.
- Para más información sobre el modelo de transcripción de wayunaiki visite esta página (está en inglés).
- En este momento hemos entrado en contacto con el proyecto Common Voice de Mozilla, para en primera instancia incluir el Wayuunaiki como lengua dentro de su proyecto de consolidar una base de datos de acceso público de lenguas de bajos recursos. Es a través de ellos como planeamos crear las nuevas bases de datos para seguir trabajando con esta lengua.
Un futuro colaborativo
Nuestro proyecto es de código abierto, lo que significa que creemos en la colaboración y en el poder de la comunidad. Invitamos a todos aquellos que compartan nuestra pasión por la preservación de lenguas indígenas a unirse a nosotros. Nuestra mayor necesidad en este momento es generar más ejemplos de habla y transcripción para construir una base de datos sólida.
Juntos, podemos hacer una diferencia significativa en la preservación y promoción del Wayuunaiki y otras lenguas indígenas. Si deseas obtener más información sobre nuestro proyecto o unirte a nuestra causa, no dudes en contactarnos.