banner

Notícias

Nov 25, 2023

A complexa matemática dos contrafactuais pode ajudar o Spotify a escolher sua próxima música favorita

Um novo tipo de modelo de aprendizado de máquina está definido para melhorar a tomada de decisão automatizada em finanças, assistência médica, segmentação de anúncios e muito mais.

Um novo tipo de modelo de aprendizado de máquina construído por uma equipe de pesquisadores da empresa de streaming de música Spotify captura pela primeira vez a matemática complexa por trás da análise contrafactual, uma técnica precisa que pode ser usada para identificar as causas de eventos passados ​​e prever o efeitos dos futuros.

O modelo, descrito no início deste ano na revista científica Nature Machine Intelligence, pode melhorar a precisão da tomada de decisão automatizada, especialmente recomendações personalizadas, em uma variedade de aplicações, desde finanças até assistência médica.

A ideia básica por trás dos contrafactuais é perguntar o que teria acontecido em uma situação se certas coisas tivessem sido diferentes. É como rebobinar o mundo, mudar alguns detalhes cruciais e, em seguida, apertar o play para ver o que acontece. Ajustando as coisas certas, é possível separar a causa verdadeira da correlação e coincidência.

“Entender causa e efeito é super importante para a tomada de decisões”, diz Ciaran Gilligan-Lee, líder do Laboratório de Pesquisa de Inferência Causal do Spotify, que co-desenvolveu o modelo. "Você quer entender o impacto que uma escolha que você faz agora terá no futuro."

No caso do Spotify, isso pode significar escolher quais músicas mostrar ou quando os artistas devem lançar um novo álbum. Spotify ainda não está usando contrafactuais, diz Gilligan-Lee. "Mas eles podem ajudar a responder perguntas com as quais lidamos todos os dias."

Os contrafactuais são intuitivos. As pessoas geralmente entendem o mundo imaginando como as coisas teriam acontecido se isso tivesse acontecido em vez daquilo. Mas eles são monstruosos colocados em matemática.

"Os contrafactuais são objetos estatísticos de aparência muito estranha", diz Gilligan-Lee. "São coisas estranhas de se contemplar. Você está perguntando a probabilidade de algo ocorrer dado que não ocorreu."

Gilligan-Lee e seus co-autores começaram a trabalhar juntos depois de ler sobre o trabalho um do outro em uma história do MIT Technology Review. Eles basearam seu modelo em uma estrutura teórica para contrafactuais chamada redes gêmeas.

As redes gêmeas foram inventadas na década de 1990 pelos cientistas da computação Andrew Balke e Judea Pearl. Em 2011, Pearl ganhou o Prêmio Turing – o Prêmio Nobel da ciência da computação – por seu trabalho sobre raciocínio causal e inteligência artificial.

Pearl e Balke usaram redes gêmeas para trabalhar com alguns exemplos simples, diz Gilligan-Lee. Mas aplicar manualmente a estrutura matemática a casos reais maiores e mais complicados é difícil.

É aí que entra o aprendizado de máquina. As redes gêmeas tratam contrafactuais como um par de modelos probabilísticos: um representando o mundo real, o outro representando o fictício. Os modelos estão ligados de tal forma que o modelo do mundo real restringe o modelo do ficcional, mantendo-o igual em tudo, exceto nos fatos que você deseja alterar.

Gilligan-Lee e seus colegas usaram a estrutura de redes gêmeas como um modelo para uma rede neural e a treinaram para fazer previsões sobre como os eventos aconteceriam no mundo fictício. O resultado é um programa de computador de propósito geral para fazer raciocínio contrafactual. "Ele permite que você responda a qualquer pergunta contrafactual sobre um cenário que você deseja", diz Gilligan-Lee.

A equipe do Spotify testou seu modelo usando vários estudos de caso do mundo real, incluindo um analisando a aprovação de crédito na Alemanha, um analisando um ensaio clínico internacional para medicação para derrame e outro analisando a segurança do abastecimento de água no Quênia.

Em 2020, pesquisadores investigaram se a instalação de canos e recipientes de concreto para proteger as nascentes da contaminação bacteriana em uma região do Quênia reduziria os níveis de diarreia infantil. Eles encontraram um efeito positivo. Mas você precisa ter certeza do que causou isso, diz Gilligan-Lee. Antes de instalar paredes de concreto em torno de poços em todo o país, é preciso ter certeza de que a queda na doença foi de fato causada por essa intervenção e não um efeito colateral dela.

COMPARTILHAR