(3 월 17, 2024) 히마찰 프라데시의 경치 좋은 산에는 강 계곡인 캉그라(Kangra)가 있으며, 이곳에는 언어와 관습을 소중히 여기는 따뜻한 히마찰리 사람들의 고향입니다. 아름다운 언어는 델리의 10대 Navvye Anand가 가족의 뿌리를 두고 있는 북부 펀자브까지 영향력을 확장합니다. 그의 가족은 델리에 정착했지만 그의 문화 및 유산과의 관계는 Kangri 언어를 통해 여전히 강렬하게 남아 있습니다. 강리어가 유네스코가 선정한 멸종 위기 언어 XNUMX개 목록에 포함되어 있다는 사실을 알게 된 그는 조치를 취해야 한다는 사명감을 느꼈습니다. “저는 언어에 활력을 불어넣는 방법을 찾기 시작했고 주로 구어 매체를 활용하는 데 중점을 두었습니다. Kangri 지역에 문자 문학이 부족하다는 사실을 인식하고 저는 인간의 말을 문자 텍스트로 변환하는 ASR(자동 음성 인식)을 선택했습니다.”라고 그는 말합니다. 글로벌 인디언.
전통적으로 언어학자는 구전 전통을 수동으로 필사하기 위해 현지 사람들과 협력하는 데 몇 시간을 소비했으며, 인적 오류의 범위와 함께 필요한 막대한 시간과 노력으로 인해 종종 병목 현상에 직면했습니다. “ASR은 전사 프로세스를 간소화하는 데 사용될 수 있습니다. 최근 AI의 발전으로 이전보다 훨씬 더 높은 수준에서 ASR을 사용할 수 있게 되었습니다.”라고 Navvye는 덧붙였습니다. Navvye는 멸종 위기 언어에 대한 교차 언어 자동 음성 인식 프로젝트로 $4800 상당의 The Spirit of Ramanujan Grant를 받았습니다. 매년 버지니아 대학교와 템플턴 세계자선기구(Templeton World Charity Organization)는 수학과 과학 분야에서 탁월한 재능을 보이는 고등학생에게 공동으로 보조금을 수여합니다.
또한 읽어보세요 | 마누 초프라(Manu Chopra): AI 스타트업을 통해 인도 시골 지역 30,000만 명에게 품격 있는 디지털 작업 제공
보조금을 통해 Navvye는 미국의 Wolfram 고등학교 여름 프로그램에 참석했습니다. "저는 선구적인 컴퓨터 과학자이자 언어학자인 Steven Wolfram 박사에게서 배웠으며, 언어 능력을 향상하고 언어학에 대해 더 많이 배울 수 있는 기회를 가졌습니다."라고 정수론에 관한 오일러 서클 프로그램에 참석한 10대 소녀는 말합니다. “저는 교육 지원을 위해 보조금을 사용했습니다.”
단어와 언어에 대한 사랑
7개 국어에 능통한 다국어를 구사하는 할아버지 밑에서 자란 Navvye는 마치 불길에 휩싸인 나방처럼 단어와 언어에 매료되었습니다. "언어에 대한 나의 사랑은 물려받았고, 그것은 나의 성장에 중요한 역할을 했습니다."라고 십대 소녀는 덧붙입니다. "우리는 언어에 대한 공통된 사랑으로 결속을 맺었고, 알 수 없는 언어로 된 새로운 판도라의 상자를 발견할 때마다 나는 그에게 다가가서 토론을 해보세요. 나는 그와 언어에 관해 이야기하는 것을 좋아했습니다. 우리는 우르두어 단어인 shakkar(재거리)와 영어의 설탕 사이의 유사성과 같은 언어의 특정 특성에 종종 집착했습니다. 언어학에 대한 나의 사랑은 선천적으로 내 안에 자리잡고 있었습니다.”
2022년 할아버지가 돌아가신 후 Navvye는 그의 모국어 방언을 활성화하기 위해 노력하여 그에게 경의를 표하기로 결정했습니다. 더욱이 2018년에는 강라밸리 지역을 방문하면서 사람들의 따뜻함에 반하게 됐다. “그들은 항상 전할 이야기나 민속 이야기를 갖고 있었고 자신들의 문화와 유산을 자랑스러워했습니다. 저는 Kangri가 그들의 문화와 유산을 사랑하기 때문에 멸종 위기에 처한 언어라는 것이 역설적이라고 생각했습니다. AI의 발전과 그들의 사랑을 결합할 수 있다면 그것은 시작하기에 좋은 프로젝트가 될 것이라고 생각했습니다.”라고 그는 밝혔습니다.
AI를 사용하여 Kangri 보존
이로 인해 그는 다른 언어에 ASR을 사용한 이전 연구자들의 논문을 읽게 되었습니다. 특히 흥미로운 연구 중 하나는 Boston College의 조교수인 Emily Prud'hommeaux가 미국에서 멸종 위기에 처한 언어인 Seneca를 재활성화하려고 시도한 것입니다. “그녀의 연구 논문은 연구자들이 ASR을 어떻게 사용하는지와 방법론을 이해하는 데 도움이 되었습니다.” 나중에 그는 Kangri 언어에 대한 텍스트 코퍼스를 큐레이팅한 National Institute of Technology Hamirpur의 연구원인 Shweta Chauhan 박사에게 연락했습니다. "그녀는 저를 자신의 연구실에 인턴으로 초대했고 그 이후로 그녀는 귀중한 멘토가 되었습니다."
ASR의 혁신을 통해 언어학자는 자연스러운 환경에서 대화를 녹음하고 구두 매체를 수동으로 디지털화하지 않고도 대화의 본질을 포착할 수 있습니다. Navvye는 프로세스를 설명하면서 일반 마이크를 ASR 모델에 공급하여 정확한 녹음을 제공할 수 있다고 설명합니다. 오디오는 ASR을 통해 텍스트로 변환됩니다. "현재 정확도는 85%이며 시간이 지남에 따라 추가 데이터를 수집하고 시스템을 개선하여 95%의 목표 정확도를 달성하는 것이 목표입니다." 이 프로젝트는 두 가지 측면에서 진행됩니다. 하나는 Navvye가 ASR을 사용하여 대화를 녹음하여 개인적으로 데이터를 수집하는 것이고, 두 번째는 ASR을 사용하여 오디오 녹취록을 그에게 보내는 현지 번역가와 연결하는 것입니다. “이를 통해 강력한 오디오 레퍼토리를 구축할 수 있습니다. 또한 저는 Bhashini 프로그램을 통해 인도 정부와 협력하여 더 많은 Kangri 데이터를 수집하기 위해 자원을 활용하고 있습니다. 향상된 정확도로 모델을 더욱 미세 조정할 수 있는 방대한 데이터 세트를 제공하므로 오디오 레퍼토리를 확장할 수 있기를 기대합니다.”
Navvye가 시작했을 때 그는 고작 15세였지만 꿈을 현실로 옮기려는 그의 열정은 부모님과 Kangra 사람들의 지원과 함께 계속해서 성장할 수 있었습니다. 그러나 그 과정에서 그는 주로 데이터 수집, 정리, 모델 선택 및 미세 조정과 관련된 몇 가지 기술적인 문제에 직면했습니다. “다른 모델을 실험한 끝에 최첨단 음성 인식 모델인 Open AI의 Whisper를 선택했습니다. 단순한 생각이 결실을 맺는 것은 어렵지만, 그 대의가 숭고하면 사람들이 지지해 줄 것입니다.”라고 덧붙였습니다.
또한 읽어보세요 | Karya에 AI 도입 : 2024년에 기대되는 AI 스타트업
영향 만들기
지난 2년 동안 Navvye의 작업은 다양한 번역가를 Kangri 도메인에서 운영되는 다국적 기업에 연결함으로써 이들에게 힘을 실어주었습니다. Navvye는 "저는 두 명의 번역가가 Lenovo에 연락하는 데 필요한 정보를 수집하고 LinkedIn 프로필을 만들고 기술 문서를 작성하도록 도왔습니다."라고 학교 어린이들 사이에서 Kangri 언어의 중요성에 대한 인식을 높이고 있는 Navvye는 말합니다. 그에게 Kangri가 멸종 위기에 처한 언어가 된 잠재적인 이유를 묻자 그는 즉시 이렇게 대답합니다. “세계화로 인해 모국어를 사용하는 것을 포기한 Kangri에 비해 이제 더 많은 사람들이 힌디어를 사용하고 있습니다. 이는 충분히 멋진 것으로 간주되지 않습니다. 우리가 대응해야 할 문제입니다.”라고 십대는 말합니다.
조상의 사라져가는 언어를 보존하는 것을 자랑스럽게 생각하는 Navvye는 노동의 결실이 엄청났지만 그 일은 아직 끝나지 않았다고 말합니다. “갈 길이 멀지만 지금까지의 길에 만족합니다. 역사와 담론의 풍부한 융합인 내 언어를 보존하려는 노력에 동참하게 된 것을 영광으로 생각합니다.”라고 Navvye는 덧붙입니다. 올 가을에 캘리포니아 공과대학에 합류할 계획인 그는 기술의 힘을 활용하여 원격으로 프로젝트를 진행하는 데 자신의 능력을 확신하면서 프로젝트에 계속 전념하고 싶어합니다. “내 지식을 향상시킬 수 있는 적절한 지원 시스템을 갖추겠습니다. 나는 이미 다양한 방언을 클러스터링하고 식별하는 데 도움이 될 수 있는 임베딩을 사용하여 방언을 분류하는 것에 대한 새로운 아이디어를 가지고 있습니다.”라고 Navvye는 밝히며 다른 언어의 모델로 사용할 수 있다고 덧붙였습니다.
Navvye는 동료 십대들에게 조언을 전하면서 믿음의 도약을 두려워하지 말라고 요청합니다. “실패를 두려워하는 것은 실패 그 자체의 신호입니다.”라고 그는 덧붙였습니다. “잘될지 안 될지는 걱정하지 마세요. 자신만의 길을 찾을 것입니다. 만약 잘 되지 않는다면, 그 과정에서 새로운 것을 배우게 될 것입니다. 어쩌면 나중에 더 잘 작동하도록 조정할 수도 있습니다.”
- Navvye Anand를 팔로우하세요. 링크드인