O novo estudo foi publicado na revista Nature Computational Science, e aponta que o modelo de algoritmo chamado life2vec acertou em cerca de 78% das vezes.
Os pesquisadores alimentaram o modelo com todo o tipo de informações sobre mais de seis milhões de pessoas reais, de um registro de dados da Dinamarca no período de 2008 a 2016, que incluíam rendimentos, profissão, local de residência, lesões e gravidez, por exemplo.
As histórias de vida foram processadas com técnicas de processamento de linguagem, gerando um vocabulário para eventos de vida. O life2vec interpreta frases detalhadas para mapear uma constelação de fatores que compõem a vida de um indivíduo. Isso permite ao algoritmo fazer previsões sobre diversos aspectos da vida, incluindo a probabilidade de morte nos próximos anos.
Para testar sua precisão, os pesquisadores usaram dados de mais de 2,3 milhões de pessoas entre 35 e 65 anos de idade, prevendo a probabilidade de sobrevivência quatro anos após 2016.
Em um grupo de 100 mil pessoas, o life2vec acertou corretamente em 78% das vezes. Diferenças de gênero e fatores socioeconômicos foram identificados, indicando que, por exemplo, homens tinham maior probabilidade de morte precoce, enquanto posição de gestão e renda elevada frequentemente correlacionavam-se com maior expectativa de vida.