Cidadania

Twi ganês adicionado ao projeto de linguagem de voz comum da Mozilla — Quartz Africa

Em Gana, onde o inglês é a língua oficial para educação e comércio, quatro em cada cinco pessoas falam Twi como primeira ou segunda língua. Diferentes variações espalharam seu uso para outras cidades da África Ocidental no Benin e na Costa do Marfim, elevando o número estimado de falantes para 18 milhões de pessoas.

Esse número pode aumentar em breve.

A Mozilla, empresa de navegadores da web, diz que adicionou o Twi ao Common Voice, seu banco de dados de código aberto de idiomas obtidos de pessoas reais que os falam. O objetivo é alimentar os dados em softwares de reconhecimento de fala e aumentar a disponibilidade de vários idiomas locais na Internet, desconstruindo um mundo onde as línguas coloniais europeias são o meio padrão (em alguns casos, apenas) de comunicação online.

Lingüistas africanos reclamam há anos que a internet está deletando histórias inteiras porque “se uma máquina não entender sua língua, será como se nunca tivesse existido”, disse Vukosi Marivate, chefe de ciência de dados da Universidade de Pretória, no sul do país. África. . o ano passado. Isso se deve principalmente à falta de esforço das plataformas baseadas na Internet que não fornecem as funções de suporte necessárias: a maioria não fornece suporte de interface na primeira língua para mais de 90% de todos os africanos, de acordo com uma pesquisa realizada pela OxfordInternet Institute. Pesquisa endossada encontrada.

Mesmo o Google e a Wikipedia, com recursos de suporte relativamente bons, “excluem quase metade da população africana com base no idioma principal”.

Twi junta-se a outras grandes línguas africanas

Twi é o 100º idioma a ser adicionado ao Common Voice da Mozilla. Ele se junta a outras línguas africanas Kiswahili, Luganda, Hausa, Tigrinya, Tigre, Igbo e Kinyarwanda no projeto, embora cada uma esteja em um nível diferente de validação, dependendo do volume de amostras de voz contribuídas pelos usuários.

A adição desses idiomas permitirá que as comunidades que os falam “aproveitem as possibilidades da tecnologia de fala, criando um ecossistema de IA mais saudável e aberto”, disse EM Lewis-Jong, líder de produto da Common Voice, em comunicado.

Até 2.000 línguas são faladas na África, das quais 75 têm pelo menos 1 milhão de falantes. Embora não seja necessariamente possível tê-los todos online, a coleção de apenas sete do Common Voice até agora mostra que há um caminho a percorrer para que as línguas africanas ganhem uma presença madura na Internet.

Dito isso, a adição do Twi se une a esforços inclusivos recentes nessa direção: no ano passado, o aplicativo de aprendizado de idiomas Duolingo iniciou planos para oferecer Zulu e Xhosa, dois dos idiomas mais populares da África do Sul.

E quanto ao desafio por vezes citado para justificar a ausência de línguas africanas na Internet, nomeadamente que a maioria é oral com pouco corpus escrito, mais universidades oferecem cursos de línguas africanas para alargar a experiência. Twi, por exemplo, é ensinado na Rutgers em Nova Jersey. No ano passado, o departamento de línguas modernas da Universidade de Oxford começou formalmente a ensinar Igbo (falado por cerca de 25 milhões de pessoas no sudeste da Nigéria) como um curso com manual de instruções e professor aprovado.

Source link

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Verifique também
Fechar
Botão Voltar ao topo