(17 de marzo de 2024) En las pintorescas montañas de Himachal Pradesh hay un valle fluvial, Kangra, hogar de un cálido pueblo Himachali que aprecia su idioma y sus costumbres. Este hermoso idioma extiende su influencia al norte de Punjab, donde el adolescente de Delhi Navvye Anand tiene sus raíces familiares. Aunque su familia se estableció en Delhi, su conexión con su cultura y herencia sigue siendo fuerte a través del idioma Kangri. Al descubrir que la lengua kangri figuraba en la lista de las 10 lenguas en peligro de extinción de la UNESCO, se sintió llamado a actuar. “Empecé a buscar formas de revitalizar el lenguaje y me centré principalmente en aprovechar el medio oral. Al reconocer la escasez de literatura escrita en Kangri, recurrí al ASR (reconocimiento automatizado de voz), que convierte el habla humana en texto escrito”, cuenta. India global.
Tradicionalmente, la lingüística pasaba horas interactuando con la población local para transcribir manualmente las tradiciones orales, encontrando a menudo obstáculos debido a la enorme cantidad de tiempo y esfuerzo necesarios, junto con la posibilidad de error humano. “ASR se puede utilizar para agilizar el proceso de transcripción. Los recientes avances en IA hicieron posible utilizar ASR a un nivel mucho más alto que antes”, añade Navvye, cuyo proyecto, Reconocimiento automático de voz entre idiomas para lenguas en peligro de extinción, le valió la beca The Spirit of Ramanujan, valorada en 4800 dólares. Cada año, la Universidad de Virginia y la Templeton World Charity Organization otorgan conjuntamente una subvención a estudiantes de secundaria que demuestran un talento excepcional en matemáticas y ciencias.
Con la beca, Navvye asistió al programa de verano de Wolfram High School en Estados Unidos. “Aprendí del Dr. Steven Wolfram, un científico informático y lingüista pionero, y tuve la oportunidad de perfeccionar mis habilidades lingüísticas y aprender más sobre lingüística”, dice el adolescente, que también asistió al Programa Euler Circle sobre teoría de números. "Utilicé la subvención para financiar mi educación".
Amor por las palabras y los idiomas.
Al crecer con un abuelo políglota que hablaba con fluidez siete idiomas, Navvye se sentía atraído por las palabras y los idiomas como una polilla a la llama. "Mi amor por los idiomas es heredado, jugó un papel crucial en mi educación", dice el adolescente, y agrega: "Nos unimos por nuestro amor común por el idioma, y cada vez que encontraba una nueva caja de Pandora en un idioma desconocido, Me acercaría a él y discutiría. Me encantaba hablar de idiomas con él. A menudo nos obsesionamos con ciertas peculiaridades de un idioma, como el parecido entre shakkar (jaggery), una palabra urdu, y azúcar en inglés. Mi amor por la lingüística estaba innato en mí”.
Después de que su abuelo falleciera en 2022, Navvye decidió rendirle homenaje trabajando para revitalizar un dialecto de su lengua materna. Además, su visita a la región del Valle de Kangra en 2018 lo enamoró de la calidez de la gente. “Siempre tenían algo de folklore o una historia que contar y estaban orgullosos de su cultura y herencia. Pensé que era paradójico que el kangri fuera una lengua en peligro de extinción porque esta gente ama su cultura y su herencia. Pensé que si podía unir su amor con los avances en IA, entonces sería un gran proyecto para comenzar”, revela.
Usando IA para preservar Kangri
Esto lo llevó a leer artículos de investigadores anteriores que habían utilizado ASR para otros idiomas. Un estudio particularmente intrigante fue el de Emily Prud'hommeaux, profesora asistente del Boston College, que intentó revitalizar el séneca, una lengua en peligro de extinción en Estados Unidos. "Sus trabajos de investigación me ayudaron a comprender la metodología y cómo los investigadores utilizan ASR". Más tarde, se acercó al Dr. Shweta Chauhan, investigador del Instituto Nacional de Tecnología Hamirpur, quien había curado un corpus de texto para el idioma Kangri. "Ella me invitó a hacer una pasantía en su laboratorio y desde entonces ha sido una mentora invaluable".
La innovación en ASR permite a los lingüistas grabar conversaciones en su entorno natural y capturar su esencia sin digitalizar manualmente ningún medio oral. Al explicar el proceso, Navvye explica que se puede introducir un micrófono normal en el modelo ASR, lo que ayuda a obtener una transcripción precisa. El audio se está convirtiendo en texto a través de ASR. "Actualmente, la precisión es del 85 por ciento y, con el tiempo, mi objetivo es recopilar datos adicionales y mejorar el sistema para lograr una precisión objetivo del 95 por ciento". El proyecto opera en dos frentes: uno, donde Navvye recopila datos personalmente grabando conversaciones usando ASR, y segundo, donde se conecta con traductores locales que le envían transcripciones de audio usando ASR. “Esto me permite crear un repertorio de audio sólido. Además, me estoy asociando con el gobierno indio a través de su programa Bhashini, aprovechando sus recursos para recopilar más datos de Kangri. Estoy deseando ampliar el repertorio de audio, ya que proporcionará un amplio conjunto de datos para perfeccionar aún más el modelo con mayor precisión”.
Cuando Navvye comenzó, tenía solo 15 años, pero su pasión por convertir su sueño en realidad lo mantuvo adelante con el apoyo de sus padres y la gente de Kangra. Sin embargo, en el camino encontró algunos contratiempos técnicos, principalmente relacionados con la recopilación de datos, la limpieza, la selección del modelo y el ajuste. “Después de experimentar con otros modelos, me conformé con Whisper de Open AI, que es el modelo de reconocimiento de voz de última generación. Es difícil hacer realidad una idea sencilla pero cuando la causa es noble la gente te apoya”, añade.
LEA TAMBIÉN | IA inducida a Karya: nuevas empresas de IA que esperamos en 2024
Creando un impacto
En los últimos dos años, el trabajo de Navvye ha empoderado a varios traductores al conectarlos con multinacionales que operan en el dominio Kangri. "Ayudé a un par de traductores a reunir la información necesaria para ponerse en contacto con Lenovo, creé su perfil de LinkedIn y llené documentos técnicos para ellos", dice Navvye, quien también está creando conciencia sobre la importancia del idioma Kangri entre los niños en edad escolar. Si le preguntan la posible razón por la que el kangri es una lengua en peligro de extinción, responde rápidamente: “Ahora hay más personas que hablan hindi en comparación con el kangri, ya que la globalización los disuade de hablar su dialecto nativo. No se considera lo suficientemente bueno, algo que debemos contrarrestar”, dice el adolescente.
Orgulloso de preservar el idioma descolorido de sus antepasados, Navvye dice que el fruto del trabajo ha sido inmenso, pero que el trabajo aún no ha terminado. “Queda un largo camino por recorrer pero estoy contento con cómo ha ido. Es un honor para mí unir los esfuerzos para la preservación de mi lengua, que es una rica amalgama de historia y discurso”, añade Navvye. Como planea unirse al Instituto de Tecnología de California este otoño, quiere seguir comprometido con el proyecto, confiando en su capacidad para utilizar el poder de la tecnología para seguir trabajando en el proyecto de forma remota. “Tendré un sistema de apoyo adecuado para mejorar mis conocimientos. Ya tengo una nueva idea sobre cómo clasificar dialectos mediante incrustaciones que pueden ayudar a agrupar diferentes dialectos e identificarlos”, revela Navvye, y agrega que puede usarse como modelo para otros idiomas.
Navvye, que imparte consejos a sus compañeros adolescentes, les pide que dejen de tener miedo de dar un acto de fe. “Tener miedo al fracaso es una señal del fracaso en sí mismo”, dice, y añade: “No te preocupes si funcionará o no, encontrarás el camino. En caso de que no funcione, aprenderá algo nuevo en el proceso. Quizás puedas modificarlo para que funcione mejor en el futuro”.
- Siga a Navvye Anand en Etiqueta LinkedIn