sábado, 17 de março de 2018

4326) Os problemas da tradução automática (17.3.2018)




Em 28 de janeiro passado publiquei neste blog o artigo “Um teste com o tradutor automático”, em que examinei e comparei alguns textos curtos que fiz passar no tradutor automático do Google, às vezes com resultados medianos, outras com resultados grotescos.

Agora me deparei com um artigo de 30 de janeiro em que uma experiência semelhante é relatada por Douglas Hofstadter, autor do clássico Godel, Escher, Bach: an Eternal Golden Braid (1979) e também de Le Ton Beau de Marot (1997), um dos melhores e mais extensos ensaios que já vi sobre a arte da tradução.

O artigo de Hofstadter, “The Shallowness of Google Translate” está aqui:

https://www.theatlantic.com/technology/archive/2018/01/the-shallowness-of-google-translate/551570/

Ele faz experiências de ida e volta de alguns parágrafos do inglês para o francês, o alemão e o chinês. O artigo é longo, com exemplos minuciosamente dissecados, e não vou traduzi-lo aqui. Vou somente comentar algumas das idéias de Hofstadter, com as quais concordo.

Ele diz que o Google Translate na verdade não traduz, ele apenas substitui séries de palavras. Traduzir, para DH, é entender, e uma máquina como as do Google não “entende” um texto da mesma maneira que um tradutor humano entende. O Google apenas substitui cegamente algumas frases por outras. Quando é necessária uma compreensão profunda, por todos os ângulos, daquilo que o texto está dizendo, o tradutor mecânico falha miseravelmente.

Ele é incapaz (para citar apenas o primeiro exemplo dado no artigo) de identificar corretamente o gênero das pessoas mencionadas num texto, a partir dos pronomes possessivos. O primeiro teste feito por Hostadter foi com este trecho, vertido do inglês para o francês:

Na casa deles, todas as coisas eram aos pares. Havia o carro dele e o carro dela, as toalhas dele e as toalhas dela, a biblioteca dele e a dela.

Como em francês o gênero dos pronomes possessivos se refere à coisa possuída, e não ao possuidor, o texto francês ficava sem sentido:

Dans leur maison, tout vient en paires. Il y a sa voiture et sa voiture, ses serviettes e ses serviettes, sa bibliothèque et les siennes.

Por que? DH explica que um tradutor humano percebe imediatamente todo o contexto pessoal e social que está sendo descrito, e traduz de acordo. Um tradutor automático não percebe nada. Ele apenas substitui palavras na língua A pela palavra estatisticamente mais próxima na língua B.

E por aí vai. Diz o autor:

Nós, humanos, sabemos todo tipo de coisas a respeito de casais, residências, objetos pessoais, orgulho, rivalidade, ciúme, privacidade e muitos outros fatores intangíveis que desembocam numa tal situação: um casal que possui toalhas onde está bordado “Dele” e “Dela”. O Google Translate não tem a menor familiaridade com tais situações. O Google Translate não tem familiaridade com situação nenhuma, e ponto final. A única familiaridade que ele tem é com cadeias de palavras compostas por cadeias de letras.

Falta ao tradutor do Google aquilo que a jornalista Maria do Rosário Caetano chama de “Nossa Senhora do Contexto”. O computador (por enquanto, 2018) não enxerga o contexto de nada do que está traduzindo. Não compõe uma imagem mental da situação descrita; não tem uma memória pessoal de situações análogas, com a qual possa compará-la, e que possa tomar como base para uma interpretação.

Diz Hofstadter:

É quase irresistível para as pessoas presumir que um software que usa as palavras com tanta fluência deve saber, certamente, o que elas significam. (...) [Mas] o uso do Google Translate é na verdade um processo de passar ao largo ou de rodear o ato de compreender a linguagem.

E ele descreve, de uma maneira que me parece adequada (pelo menos é o que corresponde à minha experiência pessoal), o que acontece no momento da tradução humana:

Quando eu traduzo, primeiro leio o texto original cuidadosamente, e internalizo as idéias tão claramente quanto possível, deixando que elas fiquem se agitando de um lado para outro na minha mente. Não são as palavras do original que se agitam, mas as idéias, que despertam os mais variados tipos de associações, criando um halo muito rico de cenários na minha mente. Nem preciso dizer que a maior parte deste halo é inconsciente. Somente quando este halo foi evocado o bastante na mente eu começo a tentar expressá-lo – a “pressioná-lo para fora” – na segunda língua.

É justamente essa fase que os tradutores automáticos são (por enquanto) incapazes de realizar, embora nada indique que essa incapacidade seja permanente. Um conjunto de computadores como os nossos não tem memória afetiva, não tem percepção de fatores como ironia ou sarcasmo, não avalia (ou o faz apenas mecanicamente) a implicação social contida em palavras de gíria, arcaísmos, neologismos, nonsense, etc.

Douglas Hofstadter está longe de ser um ludita ou um inimigo das máquinas: Godel, Escher e Bach (ganhador do Prêmio Pulitzer) tem 700 páginas de maciça fascinação pelas possibilidades da Inteligência Artificial. Mas enquanto grande parte dos entusiastas da A. I. concentram sua atenção no lado “artificial” (como produzir esses processos?), ele investiga o lado “inteligência” (em que consistem os processos?).

Diz ele no artigo:

Não quero deixar nos leitores a impressão de que acredito que inteligência e compreensão serão para sempre inacessíveis aos computadores. Se neste artigo pareço afirmar isto, é porque a tecnologia aqui discutida não faz nenhuma tentativa de reproduzir a inteligência humana. Muito pelo contrário: ela tenta apenas dar a volta ao problema, e os trechos aqui exibidos mostram claramente suas lacunas gigantescas. (...) Do meu ponto de vista, não há nenhuma razão fundamental para que uma máquina não possa um dia, em princípio, pensar, ser criativa, engraçada, nostálgica, excitada, amedrontada, extasiada, resignada, esperançosa, e, como corolário disto, capaz de traduzir admiravelmente de uma língua para outra. (...) [Mas] eu acredito que isso ainda está extremamente longe de acontecer.

A verdade é que não traduzimos apenas com os centros linguísticos do cérebro. Se o que estamos traduzindo é um texto puramente abstrato, impessoal, meramente enunciativo, até que vai. Mas na literatura, principalmente, há fatores animais e sociais envolvidos, e digo animais da maneira mais respeitosa possível, para lembrar que o fato de termos um corpo condiciona nosso medo, nossa raiva, nossa afetividade, nossos (des)confortos, nossa relação com o ambiente e com outras pessoas.

Grande parte da literatura e da poesia se refere a contextos físicos, corporais, psicológicos, emotivos, sociais etc. que nem sempre vêm claramente expostos, mas constituem uma camada “subterrânea” do texto, algo que mesmo um leitor jovem, um leitor recente, é capaz de entender, porque tem em si um contexto de comparação.

É esse contexto humano que evocamos ao traduzir. E a máquina não tem (por enquanto) o que evocar, nem como.