domingo, 28 de janeiro de 2018

4309) Um teste com tradutor automático (28.1.2018)




É cada vez mais generalizado o uso dos tradutores automáticos na Internet. Tempos atrás, passei uma tarde numa biblioteca pública, porque estava em outra cidade e precisei acessar a web. Todos os computadores de lá estavam programados para traduzir automaticamente todos os saites estrangeiros.

O resultado muitas vezes era bem razoável. Basta dizer que só vim me tocar depois de uns cinco minutos, quando acessei um saite bem obscuro e pensei: “Peraí. Esse saite tem versão em português?”.

Mas o fato é que continua vigorando o velho princípio de que a cada tradução se multiplica o “ruído informacional”, ou seja, as palavras não traduzíveis vão ficando como verdadeiros “caroços” no texto, enquanto outras são entendidas erradamente pelo robô e viram surrealismo puro.

Para comprovar (ou desprovar) esta minha opinião, vou pegar estes quatro parágrafos iniciais deste post e traduzi-los sucessivamente no seguinte percurso:

Português -> Inglês -> Francês -> Italiano -> Espanhol -> Alemão -> Português.

O resultado final em português, depois dessas passagens sucessivas, ficou assim:

O uso de tradutores automáticos pela Internet está se tornando mais generalizado. Há algum tempo passei uma tarde em uma biblioteca pública porque estava em outra cidade e tinha acesso à internet. Todos os computadores foram programados para traduzir automaticamente para todos os estrangeiros.
O resultado foi muitas vezes bastante razoável. Estou apenas dizendo que não posso jogar até depois de cerca de cinco minutos quando recebi um quarto muito escuro e pensei: "Aguarde, você tem uma versão em português?"
Mas o fato é que o antigo princípio continua a multiplicar que toda tradução do "ruído informacional", o que significa que as palavras não "core" reais são traduzidas no texto, outras incógnitas do robô e viram o puro surrealismo.
Para provar (ou refutar) essa visão, vou levar esses quatro primeiros parágrafos desta publicação e, em seguida, traduzir a próxima marcha (4 que vem diretamente abaixo dos parágrafos abaixo):


Como se vê acima, mesmo depois de passar por cinco traduções intermediárias, visitando dois grupos distintos de idiomas (inglês/alemão de um lado, e os latinos francês/italiano/espanhol do outro), dá para ter uma idéia muito boa do texto original, e metade das frases não parecem sequer ter sido traduzidas.

Agora, peguei esta última versão e fiz o seguinte percurso, saltando entre línguas de origem e estrutura muito diferentes:

Português / Árabe / Gaélico-escocês / Latim / Iorubá / Português.

E o texto final em Português ficou muito diferente:

Para o uso da tradução on-line tornou-se vantajoso. Mais uma vez, passei a tarde em uma biblioteca pública que estava em outros países e as capacidades da internet. Isso ocorre porque cada cartão de memória significa uma vez um estranho

Resultados positivos. Como sofremos cinco minutos depois, você pode jogar quando você tem um quarto muito escuro, e eu acho, 'versão em português sua manhã? "

Mas o princípio ainda é verdade que as classificações de tradução antigas têm o "ruído da mídia" duas vezes. Essas palavras são traduzidas para o texto não-core e sente que não é branco.

Pode (ou não) Primeiros quatro parágrafos e o processo enviado (imediatamente abaixo do parágrafo 4 abaixo)

Isso sugere que os tradutores automáticos – o que utilizei foi o Google Translator – estão avançando muito na questão do vocabulário, mas ainda patinam quando têm que transpor para línguas de estrutura sintática muito diferente.

É curioso que um trecho como “Todos os computadores de lá estavam programados para traduzir automaticamente todos os saites estrangeiros” acabe resultando em “Isso ocorre porque cada cartão de memória significa uma vez um estranho”.

Há também a questão de certas expressões idiomáticas que em línguas próximas têm equivalentes próximos, mas em línguas distantes acabam sendo traduzidas ao pé da letra e geram um “samba do crioulo doido”.

Uma expressão coloquial nossa como “só vim me tocar” (=só vim perceber) rapidamente perde o sentido depois de algumas transposições.

“E viram puro surrealismo” acabou resultando no surrealista “e sente que não é branco”. Nota-se que de salto em salto a frase passou por um dicionário onde “surrealismo”, um termo muito específico, provavelmente não estava registrado – digamos que tenha sido o Latim ou o Yorubá.

Tudo isto tem uma grande importância quando se torna cada vez maior o acesso a publicações de outras línguas com a possibilidade de filtrá-las através de um tradutor automático. Faço isso às vezes quando me deparo com links interessantes (cinema, FC, etc.) em japonês ou russo – mas só para ter uma idéia do que se aborda no saite. Nunca para saber "o que o texto está dizendo".

Mas já vi exemplos de livros em PDF totalmente traduzidos dessa maneira, obras literárias (romances, contos) cujo resultado está sendo lido com perplexidade por jovens leitores brasileiros, atônitos diante de livros de Philip K. Dick em PDF que parecem traduzidos por Zé Limeira.