Em busca do sentido comum na Babel digital

Quando foi a última vez que você navegou por sites chineses, turcos, finlandeses ou nigerianos?

  • Foto do(a) author(a) Andre Stangl
  • Andre Stangl

Publicado em 7 de abril de 2024 às 05:00

  Crédito: Prompt design com DALL-E por Andre Stangl, 2024

A narrativa que conta a história da construção da Torre de Babel fala do sonho de construir uma ligação (ou link) entre a terra e o céu, entre o humano e o divino. Um sonho que só era viável porque a humanidade compartilhava um significado comum para suas palavras. A narrativa, contada no Antigo Testamento, é frequentemente interpretada como uma advertência contra a arrogância humana. E a punição da humanidade por tamanha ambição teria sido a multiplicação das línguas, o que tornou o projeto (da torre) algo impossível, pois deixamos de compartilhar um sentido comum.

Também existe uma outra forma de interpretar essa história, afinal, a diversidade cultural pode ser vista como uma bênção, que enriquece a experiência humana. Nesse contexto, os tradutores são construtores de pontes que aproximam os seres humanos. O trabalho de tradução é uma arte, pois um bom tradutor transporta o sentido de lugar ou contexto para outro, sem perder as informações e a beleza do original.

Hoje em dia, existem diversos serviços de tradução, como: DeepL, Microsoft Translator, Linguee, Babylon etc. Mas, sem dúvida, o mais popular é o serviço do Google. Esse mês, o Google Translate (ou Tradutor) completa 17 anos e a ferramenta já se tornou parte da rotina de muita gente. Estima-se que seja utilizado por mais de 610 milhões de pessoas diariamente e traduza mais de 100 bilhões de palavras por dia. O sistema já suporta 133 idiomas, incluindo, recentemente, línguas como a indiana Mizo, a africana Lingala, e as indígenas Quechua, Guarani e Aymara.

A ferramenta pode ser acessada pela página (https://translate.google.com/). Lá, é possível traduzir trechos de textos, documentos inteiros ou até mesmo livros. Mas só são suportados arquivos com no máximo 10MB. Por exemplo, a Bíblia inteira tem mais ou menos 8MB. Não deixa de ser impressionante saber que em poucos segundos e com apenas um clique um livro do tamanho da Bíblia pode ser inteiramente traduzido. Nunca testei com a Bíblia, mas já fiz isso com vários livros. E pensar que [a tradução da Bíblia do hebraico para o latim, conhecida como Vulgata, realizada por São Jerônimo, foi um projeto que levou aproximadamente 23 anos para ser concluído, iniciando por volta de 382 d.C. e finalizando em 405 d.C.] via gpt4.

Mas será que essas traduções automáticas, além de serem mais rápidas, também são confiáveis? Ou será que, como se dizia na Itália renascentista, “traduttore, traditore” (tradutor, traidor)? Essas traduções estariam traindo o verdadeiro significado daquilo que está sendo dito?

No caso do Google Tradutor, é importante destacar que, no começo, a ferramenta lançada em 2006 usava uma estratégia baseada em estatística para fazer as traduções. Usando uma quantidade monumental de documentos e transcrições da ONU e do Parlamento Europeu que foram traduzidos por humanos, nos idiomas: árabe, chinês, inglês, francês, russo e espanhol. Isso explica por que, no começo, as traduções para português deixavam a desejar. [Originalmente, o sistema traduzia textos para o inglês antes de traduzi-los para a língua alvo, analisando padrões em milhões de documentos para escolher palavras e arranjá-las corretamente.] Porém, em 2016, o Google Tradutor passou [a usar um motor de tradução neural, traduzindo sentenças inteiras de uma vez, ajustando-as para parecer mais com a fala humana.] via gpt4.

Desde então, as traduções ficaram mais precisas e menos estranhas, pois o sistema também usa o feedback dos usuários para fazer ajustes finos. É fácil observar que, quanto mais objetivo for o texto, mais tranquila será a tradução. Por isso, traduções de poesias e textos muito específicos, como é o caso de alguns textos filosóficos, ainda não são satisfatórias. Nesses casos, para não ser um traidor, o tradutor precisaria compreender o sentido dos termos.

Nenhum tradutor é completamente isento de erros. Um exemplo notório é [a tradução feita por São Jerônimo da Bíblia, que incluiu uma interpretação equivocada da palavra hebraica "qaran", que significa "emitir raios" ou "brilhar", traduzida erroneamente como "qeren", que significa "chifre". Esse equívoco levou a várias representações artísticas ao longo dos séculos em que Moisés é retratado com chifres, um erro que até mesmo Michelangelo perpetuou em sua famosa escultura.] via gpt4.

Na era inicial da tradução automática, os sistemas dependiam de correspondências diretas entre palavras, baseando-se em extensos dicionários para encontrar equivalentes nos idiomas de destino. Essa abordagem, embora funcional para textos simples, muitas vezes tropeçava na complexidade e riqueza semântica das línguas. Avançando para o presente, os sistemas modernos de tradução, alimentados por algoritmos de inteligência artificial, buscam superar essas limitações ao analisar grandes volumes de texto para identificar padrões de uso linguístico. Contudo, mesmo com esses avanços, eles ainda lutam para capturar o pleno significado semântico das palavras e expressões, especialmente aquelas carregadas de cultura e contexto, como gírias e expressões regionais.

Um exemplo emblemático dessa limitação é a expressão “calma, calabreso", que ganhou popularidade recente no Big Brother Brasil. Essa frase, carregada de nuances culturais e humorísticas, desafia a tradução automática, que falha em capturar seu verdadeiro espírito. Mesmo tradutores humanos experientes podem se ver em apuros para transmitir seu significado em outra língua, podendo recorrer a notas de rodapé ou explicações extensas para elucidar sua essência. Esse exemplo sublinha a complexa interseção entre linguagem, cultura e significado, um território em que a tradução automática ainda tem caminho a percorrer.

Pierre Lévy é um dos autores mais importantes da cultura digital, um precursor da cibercultura e o formulador do conceito de inteligência coletiva na era digital. Não bastasse isso tudo, nos últimos anos Lévy tem se dedicado a desenvolver um ambicioso projeto, por fim ao caos digital (ou a reconstrução da Torre de Babel). O projeto de Lévy é o desenvolvimento de uma nova (meta) língua, o IMEL (Information Economy Meta-Language), uma espécie de esperanto para máquinas, capacitando-as a entender o significado por trás dos dados, além de transcender as abordagens tradicionais baseadas em estatísticas para tradução. O IMEL seria [um sistema de código aberto que visa tornar os dados do mundo real legíveis por máquinas, propondo uma representação padrão que permite o mapeamento de representações semânticas com os dados de uma maneira amigável aos computadores (...) pois a web semântica atual baseia-se em ligações lógicas entre dados e modelos algébricos de lógica, sem um verdadeiro modelo semântico. O IEML, no entanto, propõe simular ecossistemas de ideias baseados nas atividades das pessoas, refletindo a inteligência coletiva e transformando dados em conhecimento.] via gpt4

Nas mais de 500 páginas do livro “A Esfera Semântica”, lançado em 2011, Lévy apresenta os fundamentos conceituais do projeto. No seu site (https://pierrelevyblog.com/) é possível acompanhar seus desdobramentos atuais, incluindo o uso de IA. Para alguns, o projeto de Lévy soa demasiadamente utópico, ou mesmo meio platônico, além de existirem diversos obstáculos práticos para sua implementação. Mas, se ele estiver certo, as possibilidades oferecidas pelo IEML seriam, sem dúvida, revolucionárias.

No mundo de hoje, mesmo com os diversos recursos de tradução automática, estamos sempre olhando para o nosso umbigo cultural. Exploramos pouco a riqueza da diversidade das culturas do mundo. Quando foi a última vez que você navegou por sites chineses, turcos, finlandeses ou nigerianos? Mesmo que a tradução não seja perfeita, a experiência é interessante. Que tal olhar as diferentes versões de um verbete na Wikipédia? Por exemplo, como será que o verbete sobre a Terra fica em árabe, guarani, yorubá ou chinês? Será que todos entendem e percebem a Terra do mesmo jeito? Já deixamos de compartilhar o sentido de palavras importantes em nosso próprio idioma comum. Quem lembra o que significa escutar, perdoar, agradecer, respeitar, conviver e tolerar? Buscar alguma forma de entendimento comum - como o projeto de Lévy ou usar as ferramentas de tradução para ampliar nossos horizontes - são formas de reconstruir o nosso projeto comum.

Andre Stangl é professor e educador digital, cresceu em Brotas, estudou Filosofia e fez doutorado na USP