Conteúdo principal Menu principal Rodapé
Gonçalves demonstra o processamento das imagens: modelo classificou com sucesso traços como extroversão e abertura a experiências

IA identifica personalidade por meio de análise facial

Tecnologia dissecou vídeos de 15 segundos para extrair informações a partir do rosto das pessoas analisadas

Gonçalves demonstra o processamento das imagens: modelo classificou com sucesso traços como extroversão e abertura a experiências

IA identifica personalidade por meio de análise facial

Gonçalves demonstra o processamento das imagens: modelo classificou com sucesso traços como extroversão e abertura a experiências
Gonçalves demonstra o processamento das imagens: modelo classificou com sucesso traços como extroversão e abertura a experiências

Tecnologia dissecou vídeos de 15 segundos para extrair informações a partir do rosto das pessoas analisadas

Cientistas da Unicamp desenvolveram um modelo de inteligência artificial (IA) para identificar traços de personalidade por meio da análise de imagens faciais em vídeos de cerca de 15 segundos. A pesquisa, conduzida pelo analista de sistemas Alan Gonçalves como dissertação de mestrado em tecnologia, sob a orientação do professor Marco Antonio Garcia de Carvalho, da Faculdade de Tecnologia (FT), integra técnicas de visão computacional, inteligência artificial e conceitos da psicologia.

O estudo fundamenta-se no modelo Ocean, também denominado Big Five (cinco grandes), um quadro conceitual psicológico que estrutura a personalidade humana em cinco dimensões: abertura a experiências (opennes), conscienciosidade (conscientiousness) – traço de pessoas diligentes e responsáveis –, extroversão (extraversion), amabilidade (agreeableness) e neuroticismo (neuroticism) – característica de indivíduos propensos a sentimentos negativos como ansiedade, depressão, inveja e medo. Para alcançar os resultados, o pesquisador empregou redes neurais Transformers, a arquitetura computacional que sustenta sistemas como o ChatGPT.

Gonçalves relata que a primeira tentativa de identificar os traços de personalidade em vídeos, utilizando métodos de processamento de imagens por meio de redes convolucionais – tipo de rede neural amplamente empregada em tarefas de reconhecimento facial –, não apresentou os resultados esperados. “O desempenho foi praticamente equivalente a jogar cara ou coroa”, explica o pesquisador, destacando que o modelo não conseguia, por exemplo, estabelecer distinções entre pessoas extrovertidas e introvertidas.

O orientador da dissertação avalia que as dificuldades encontradas nessa etapa devem estar relacionadas com o volume de informações: “Supomos que a quantidade de informação obtida via deep learning [aprendizado profundo] era muito grande e a tecnologia não conseguiu identificar um padrão”. Diante do desafio, os dois decidiram reformular a metodologia da pesquisa, contando com o apoio de pesquisadores da Universidade de Calgary (Canadá).

O docente Marco Antonio de Carvalho, que orientou o estudo: principal desafio foi a obtenção de dados disponíveis publicamente
O docente Marco Antonio de Carvalho, que orientou o estudo: principal desafio foi a obtenção de dados disponíveis publicamente
O docente Marco Antonio de Carvalho, que orientou o estudo: principal desafio foi a obtenção de dados disponíveis publicamente
O docente Marco Antonio de Carvalho, que orientou o estudo: principal desafio foi a obtenção de dados disponíveis publicamente

A solução consistiu em abandonar o processamento de imagens como um todo, focando os chamados “pontos fiduciais” – coordenadas que demarcam partes do rosto, como os cantos dos olhos, a linha das sobrancelhas e o contorno da boca. Esses pontos, extraídos quadro a quadro, transformaram-se em sequências numéricas que alimentaram o modelo: a arquitetura Transformers. Essa tecnologia usa uma sequência de entrada para obter uma sequência de saída, aprendendo o contexto e rastreando as relações entre os componentes da sequência.

“Cada vídeo de 15 segundos nos proporciona cerca de 400 frames [quadros], e cada frame contém informações que são processadas do início ao fim”, detalha o pesquisador. Essas imagens passam então pelo processamento do modelo Transformers.

Essa segunda abordagem obteve resultados mais promissores. Ao término do estudo, o modelo conseguiu classificar com grau de sucesso traços como extroversão e abertura a experiências, embora tenha apresentado desempenho inferior nos outros aspectos, como o neuroticismo.

Fonte e infraestrutura

A pesquisa utilizou uma amostra do dataset First Impressions V2, uma base de dados aberta que contém cerca de 10 mil vídeos de 15 segundos previamente analisados e classificados por seres humanos que tiveram acesso tanto às imagens quanto ao áudio das gravações. Esse material serviu como fundamento tanto para as etapas de treinamento quanto para os testes do modelo, permitindo analisar a acurácia das respostas fornecidas pelo algoritmo.

Utilizando a biblioteca de programação (conjunto de códigos pré-escritos para reutilização em projetos de software) MediaPipe Face Mesh, foram extraídos 468 pontos faciais, posteriormente organizados em grupos menores, de 68, 96 e 136 pontos. Esses pontos passaram pelo processo de classificação binária da arquitetura Transformers, respondendo a questões como: “A pessoa é extrovertida?”. O modelo atribuiu a cada indivíduo um valor 0 ou 1 – não e sim – para cada traço de personalidade analisado.

O processamento desse volume de dados demandou recursos computacionais disponibilizados por meio de uma parceria com o Centro de Tecnologia da Informação Renato Archer, localizado em Campinas.

O analista de sistemas Alan Gonçalves: pesquisa integra técnicas de visão computacional, inteligência artificial e conceitos de psicologia
O analista de sistemas Alan Gonçalves: pesquisa integra técnicas de visão computacional, inteligência artificial e conceitos de psicologia
O analista de sistemas Alan Gonçalves: pesquisa integra técnicas de visão computacional, inteligência artificial e conceitos de psicologia
O analista de sistemas Alan Gonçalves: pesquisa integra técnicas de visão computacional, inteligência artificial e conceitos de psicologia

Desafios, limitações e potenciais

Segundo Carvalho, um dos desafios enfrentados ao longo do mestrado consistiu na obtenção de dados para a realização da pesquisa. Existe uma escassez de bases de dados referentes à área disponíveis publicamente. Embora haja outras bases de dados, essas são privadas, o que envolveria custos financeiros para sua utilização. Apesar dessa limitação, o orientador considera que o uso do First Impressions oferece um benefício. “A vantagem desse dataset é a possibilidade de comparar nosso método com um conjunto amplo da literatura existente, conferindo mais fundamentos à nossa pesquisa”, observa Carvalho.

Na dissertação, Gonçalves esclarece que sua pesquisa possui caráter experimental e exploratório, constituindo-se como um primeiro passo para o desenvolvimento de estudos mais aprofundados. “Não posso afirmar que 15 segundos são suficientes para uma análise. Essa foi a amostra disponível para trabalhar”, explica o pesquisador.

Vale ressaltar que o modelo desenvolvido no mestrado analisa somente os dados visuais, diferentemente das pessoas que rotularam os vídeos originais baseando-se também no áudio e nas legendas disponíveis. Segundo o orientador, não está descartada a possibilidade de, em pesquisas futuras, incorporar esses elementos com o objetivo de investigar se a acurácia do modelo pode ser melhorada.

Um dos desafios para fazer avançar a tecnologia é formar conjuntos de dados adequados para cada realidade. No dataset utilizado pelo estudo, por exemplo, os vídeos apresentaram pessoas falando inglês e não o português brasileiro, algo que pode gerar vieses nos resultados.

“O dataset que temos disponível foi rotulado baseando-se em mais informações do que aquelas utilizadas em nossa análise”, esclarece Carvalho. Isso significa que, para uma aplicação comercial efetiva, seria necessário desenvolver um conjunto de dados mais robusto e diversificado.

A obtenção de tais conjuntos, segundo os pesquisadores, representa uma tarefa que demanda recursos financeiros e tempo. “Não se trata apenas de capturar a imagem da pessoa. Eu não sou psicólogo. Seria necessário contratar profissionais da área de psicologia para realizar essa análise. Porque, sem essa informação, torna-se impossível treinar o modelo”, explica Gonçalves.

Para o analista de sistemas, a pesquisa possui potencial para ser aplicada em processos de recrutamento e seleção de pessoas, auxiliando na contratação de acordo com os traços de personalidade identificados pelo sistema. Carvalho, por sua vez, enxerga possibilidades de aplicação na área educacional.

O modelo desenvolvido funciona dentro de um cenário controlado, de acordo com o orientador. Para que a tecnologia alcance o status de confiável, fazem-se necessários mais dados, mais pesquisas e mais suporte humano.

Ir para o topo