Algoritmo detecta cenas de abuso sexual infantil
Cientista da computação desenvolve programa que obtém resultados de forma mais ágil e econômica
Uma tecnologia popularizada pelo ChatGPT – chamada vision transformers (ou transformadores visuais) – serviu de base para que a cientista da computação Thamiris Coelho desenvolvesse um programa capaz de, com pouquíssimos dados, identificar em um conjunto de imagens cenas de abuso sexual infantil. O algoritmo se mostrou eficaz para obter resultados de forma ágil e, portanto, mais econômica, poupando policiais de um contato prolongado com conteúdos perturbadores. O trabalho, que conferiu à pesquisadora o título de mestra em ciência da computação pela Unicamp, recebeu o Prêmio de Reconhecimento Acadêmico em Direitos Humanos (Pradh), na área de Ciências Exatas, Engenharia e Tecnologia, edição 2024.
Sua pesquisa, realizada no Laboratório de Inteligência Artificial (Recod.ai, na sigla em inglês) do Instituto de Computação (IC) da Universidade, contou com o apoio do Becas Santander e com uma bolsa Alumni do IC. Trata-se da segunda dissertação de mestrado do grupo laureada com o Pradh, iniciativa do Instituto Vladimir Herzog e da Unicamp para destacar trabalhos acadêmicos que contribuam com a proteção e a defesa do direito à vida, da dignidade humana e da justiça social. Em 2023, foi premiado o trabalho de mestrado do pesquisador Pedro Valois, criador do primeiro algoritmo que automatizava a classificação de imagens de abuso sexual infantil, considerando a identificação de cenas suspeitas.
O reconhecimento vindo do Pradh reforça a importância do trabalho desenvolvido pela linha de pesquisa do laboratório, que no fim de 2023 transformou-se no Projeto Araceli. Uma parceria da Unicamp com a Universidade Federal de Minas Gerais (UFMG) e a Universidade de Sheffield (Reino Unido), a iniciativa procura desenvolver ferramentas de inteligência artificial que permitam a análise de mídias sensíveis envolvendo cenas de abuso sexual. O projeto conta com o financiamento da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp) e da Fundação de Desenvolvimento da Unicamp (Faepex), via Programa de Incentivo a Novos Docentes da instituição, e é coordenado pela professora Sandra Avila, do IC, e pelo professor Jefersson Alex dos Santos, atualmente em Sheffield.
Coelho foi orientada por Avila, em parceria com Santos. Sua pesquisa, que teve a colaboração da pesquisadora de pós-doutorado Leo Sampaio Ferraz Ribeiro, do IC, iniciou-se antes do boom do ChatGPT no mercado – e de outros programas similares. Entre os pesquisadores da área, porém, estudos utilizando diferentes tecnologias de aprendizado de máquina como transformadores visuais já estavam bastante disseminados. Foi nesse contexto que a cientista da computação decidiu trabalhar com a arquitetura de rede, uma categoria de inteligência artificial do tipo few-shot learning (ou FSL), em que o processo de aprendizado de máquina envolve a utilização de poucos dados. “Hoje, ela é o estado da arte para várias tarefas. E é definida por relacionar os dados inseridos, dando peso para cada um deles. Assim, o algoritmo consegue prever o que se quer em seguida”, explica.
Para se certificar de que os transformadores visuais eram de fato a melhor alternativa para seu projeto, Coelho antes realizou experimentos opondo seu desempenho ao de outra tecnologia de aprendizado de máquina do tipo FSL, conhecida como redes convolucionais, à época bastante usada para a análise de imagens digitais. Após os testes, a pesquisadora concluiu que os transformadores visuais eram, de fato, a melhor opção.
A partir de então, concentrou-se em desenvolver um programa que utilizasse esse modelo, capaz de aprender comparando poucos dados (no seu caso, imagens). O primeiro passo foi ajustar o algoritmo para classificar apenas imagens que não eram do interesse do seu mestrado, ou seja, cenas externas, como jardins, praias e pátios. “Ainda que o abuso sexual infantil ocorra geralmente em locais internos, dentro das casas, como quartos de crianças e de adultos, salas e banheiros, a ideia foi treinar um modelo mais geral, que funcione com tudo, para que ele aprenda a comparar imagens sem correr o risco de enviesar. Então se consegue, usando esse modelo treinado para qualquer amostra, contrapor melhor o que se quer.”
Para tanto, Coelho contou com a curadoria de um perito da Polícia Federal, também pesquisador do Projeto Araceli e pós-graduando pela UFMG. “Utilizamos um banco de imagens público. Ele fez a seleção de uma série de imagens do nosso interesse, que foram excluídas da primeira fase dos testes”, detalha a pesquisadora. O próximo passo consistiu em passar pelo programa as fotos com as cenas que traziam cenas internas de casas (como quarto, banheiro e sala). Após um treinamento extensivo, o algoritmo foi testado pelo policial em seu local de trabalho, com um material pertencente a um banco de dados de ambientes e também de cenas de abuso sexual infantil reais.
“A realização dessas pesquisas somente foi possível porque contamos com peritos da polícia em nosso projeto, pois o acesso a essas imagens é totalmente proibido. Trata-se de um material que apenas pode ser visualizado por policiais nos computadores de seus locais de trabalho”, pontua Avila. Por esse motivo, Coelho teve apenas uma chance de testar a eficácia do seu programa. “Foram feitos muitos testes antes de rodar esse experimento final, para assegurar que tínhamos o melhor modelo em mãos e que os resultados obtidos eram realmente relevantes”, ressalta a orientadora.
Primeiro, o programa elaborado pela pesquisadora foi testado com um banco de dados público, a fim de classificar cenas onde costumam ocorrer casos de abuso sexual infantil (quarto de criança e de adulto, banheiro e sala). O resultado foi surpreendente: um índice de acerto de 73%. Em seguida, realizou-se o experimento definitivo, com imagens de cenas suspeitas e também de abuso sexual infantil, todas selecionadas por um perito da Polícia Federal e pertencentes a um arquivo da instituição. “Essa tarefa foi mais complexa, porque a maioria dos dados de teste não tinha pessoas envolvidas. Ainda assim, nesse contexto, a precisão foi de 63,38%, um resultado bastante promissor”, diz a mestra em ciência da computação.
Seu mestrado foi o primeiro trabalho a aplicar a abordagem de aprendizado por poucas amostras em um contexto de cenas suspeitas de abuso sexual. Além disso, a pesquisa de Coelho comprovou a superioridade dos transformadores visuais como ferramenta para o reconhecimento de imagens utilizando poucos dados. “A principal importância desse prêmio é mostrar para outras pessoas, de fora, que o que a universidade pública faz tem qualidade e impacta diretamente a sociedade. Ou seja, pode ajudar as pessoas. Nosso papel é exatamente esse. Portanto, acredito que esse reconhecimento faz com que todos descubram sobre nosso trabalho e valorizem as universidades”, destaca a orientadora.
Surpresa com o reconhecimento junto ao Pradh, Coelho acredita que o prêmio contribuirá para dar relevância ao trabalho desenvolvido no Projeto Araceli. “Sempre foi uma das prioridades, para mim, ao ingressar no mestrado, fazer algo que tivesse um impacto social. Ter sido contemplada mostra que fomos pelo caminho certo e conseguimos acessar esse papel de realmente ajudar a população”, afirma a pesquisadora, que também desenvolveu o primeiro protocolo de testes para ser empregado em futuros trabalhos com essa técnica. “Ao conseguirmos classificar esse material, uma imagem anotada em um conjunto [de dados] poderia ser identificada em outros, porque uma criança pode estar sendo revitimizada, e isso é um problema muito sério. O ano de 2023 registrou um número recorde de denúncias de abuso”, diz Avila.