Começa a batalha das máquinas contra as fake news

Ferramentas contra as notícias falsas começam a ser desenvolvidas, inclusive na USP, mas estamos longe do combate automático de notícias falsas

Por Bruna Diseró e Thais Navarro

Dias após assumir o mandato, em janeiro de 2017, Donald Trump, presidente dos Estados Unidos, lançou a um jornalista uma frase que ficaria na História: “You are Fake News!”. Mais do que outra manifestação da briga sem fim com os jornalistas, Trump popularizou a expressão que, nos últimos anos, circulou no mundo e encontrou no Brasil, sobretudo na eleição presidencial, espaço propício à proliferação.

O termo é novo, mas notícias falsas sempre existiram. Com a expansão das redes sociais, qualquer um pode produzir conteúdo enganoso e encontrar pessoas que acreditem por falta de informação, de acesso a ela ou porque as notícias falsas são uma “verdade” conveniente.

Como o Jornal do Campus tratou na edição anterior, nas recentes eleições presidenciais cresceu a preocupação sobre como combater fake news. Profissionais e pesquisadores buscam a melhor maneira de combatê-las, embora o trabalho ainda não dê conta do volume gigantesco de conteúdos falsos. Agências de checagem de fatos são o exemplo mais claro desta mobilização.

Combate virtual

Em conjunto com a UFSCar, duas unidades da USP desenvolveram uma ferramenta de inteligência artificial para detectar se notícias são verdadeiras ou falsas a partir de sua própria linguagem. A iniciativa envolve pesquisadores do Instituto de Ciências Matemáticas e de Computação, em São Carlos, e do Departamento de Computação e Matemática, em Ribeirão Preto.

Usando a ferramenta, o usuário pode, através de um navegador ou WhatsApp, mandar uma notícia e o software tentará dizer se ela é verdadeira ou falsa. Ao entrar na ferramenta, o usuário lê como a ferramenta foi batizada: o detector de fake news do NILC( Núcleo Interinstitucional de Linguística Computacional)-USP – Detecção Automática de Notícias Falsas para o Português. “Na última década, os textos da internet chegaram com muito peso. Queremos lidar apenas com informação de qualidade, verdadeira, e esbarramos com o conteúdo enganoso”, explica Thiago Pardo, professor do ICMC-USP.

A enxurrada de falsidades virtuais “alinhou-se com o que estávamos fazendo: tentando juntar os textos de qualidade e jogar fora os ruins. Aí, chegamos nas fake news”. Os pesquisadores coletaram 7200 notícias, metade falsas, metade verdadeiras, sobre os mesmos assuntos.

A partir delas, selecionaram características textuais e gramaticais como pontuação, tamanho médio de palavras e frases, erros ortográficos. Então o algoritmo da ferramenta de detecção pondera a frequência de cada dado, tanto nas notícias verdadeiras, quanto nas falsas.

Roney Santos, do ICMC, explica que, “com a base das notícias coletada, buscamos fazer uma análise dos padrões linguísticos de cada tipo”. A base metodológica vem de um estudo de 2015 para a língua inglesa. “Pegamos todos os atributos que foram feitos no inglês e transformamos para o português”.

Diferenciando o verdadeiro do falso?

“Dentre atributos de padrões linguísticos que achamos que podem diferenciar os dois tipos de notícia, estão erros gramaticais, a média de adjetivos de um texto, que podem deixá-lo mais ou menos emotivo, e também o uso de verbos auxiliares: dizer que um acidente ‘aconteceu’ é diferente de dizer que ‘pode ter acontecido’ ”.

Apesar dos resultados, os autores da pesquisa reconhecem que a inteligência artificial deve ser vista como uma ferramenta auxiliar. “Essas medidas podem ajudar o ser humano a decidir, fazendo uma primeira análise do que seria uma potencial notícia falsa. Deixar a máquina sozinha, ainda não”, pondera Evandro Ruiz, ex-aluno do ICMC e professor da FFLCH Ribeirão Preto, rindo.

Sobre o que deve ser aprimorado, uma das características das fake news é que a mentira está embasada em fatos reais. Muitos textos são parcialmente falsos e a máquina não consegue separar isso completamente. “Esse é um dos próximos passos. Eventualmente, nós queríamos que se grifassem as frases mentirosas e não a notícia toda”, diz Thiago Pardo.

Para o jornalista Armindo Ferreira, consultor em novas tecnologias, a iniciativa é boa, mas está longe de, sozinha, resolver o problema. “Com o surgimento da internet, as pessoas tendem a confiar na informação porque a consideram um meio de comunicação de massa, que portanto, é confiável. E temos uma sociedade que ainda tem problemas de interpretação de texto. Uma discussão sobre credibilidade das fontes (isto é, a orientação mais comum para que o usuário confira se a origem da informação é confiável) é ainda mais difícil. É um longo caminho a percorrer”.