Pandas: 3 Passos para Converter Data de Nascimento em Idade

Aprenda com apenas 3 passos como converter Data de nascimento em Idade utilizando o pandas no pyhton.

Se você já se deparou com a necessidade de calcular a idade a partir de uma data de nascimento em um conjunto de dados usando Python e Pandas, este artigo é para você. A criação desse tipo de cálculo é essencial em diversas análises de dados, fornecendo uma perspectiva temporal valiosa para entender padrões, comportamentos e tendências.

Ao calcular a idade, você não apenas obtém informações demográficas cruciais, mas também enriquece seus dados, permitindo análises mais profundas e personalizadas. Essa abordagem é especialmente útil em áreas como marketing, onde entender a demografia dos clientes é vital, ou em pesquisas sociais, onde a idade pode desempenhar um papel fundamental na compreensão de certos fenômenos.

Neste artigo, vamos explorar de maneira prática e simples como realizar esse cálculo, aproveitando a potência do Pandas para manipulação de dados. Vamos lá?

Passo 1: Importando o Pandas

Antes de começarmos, certifique-se de ter o Pandas instalado em seu ambiente Python. Caso ainda não tenha, você pode instalá-lo utilizando o comando pip install pandas. Clique aqui para obter orientações passo a passo. Além disso, importe as bibliotecas necessárias no seu script ou notebook.

import pandas as pd
from datetime import datetime

Passo 2: Convertendo para o Formato Datetime

Suponhamos que você tenha um DataFrame com uma coluna contendo as datas de nascimento. Vamos criar um exemplo simples para ilustrar:

# Criação do dataframe de exemplo
data = {'Nome': ['Leandro', 'Daniele', 'Marina'],
        'DataNascimento': ['1990-05-15', '1985-09-20', '1995-02-10']}
df = pd.DataFrame(data)

# Aplicando a conversão na variável DataNascimento
df['DataNascimento'] = df['DataNascimento'].astype('datetime64[ns]')

Saída:

Vantagens da Conversão da Coluna para o Formato Datetime

Ao enfrentar conjuntos de dados que envolvem informações de datas, a conversão da coluna para o formato de data é de extrema importância. Essa adaptação traz consigo uma série de benefícios notáveis. Por exemplo:

  1. Padronização: Elimina inconsistências e ambiguidades causadas por diferentes formatos de datas.
  2. Operações Temporais: Permite cálculos eficientes de idade e outras operações temporais.
  3. Compatibilidade: Facilita o uso de bibliotecas otimizadas para manipulação de dados temporais, como o Pandas.
  4. Visualização Clara: Torna a apresentação e interpretação das datas mais intuitivas.
  5. Ordenação e Filtragem: Simplifica a ordenação e filtragem de dados com base em datas, facilitando análises exploratórias.

No código fornecido, essa conversão é essencial para garantir a precisão nos cálculos de idade e prevenir erros. A padronização das datas potencializa análises de dados, proporcionando consistência e eficiência.

Passo 3: Calculando a Idade

Agora, podemos calcular a idade usando a data de nascimento e a data atual.

# Cria nova coluna no dataframe chamado Idade
df['idade'] = (pd.to_datetime('today') - df['DataNascimento']).astype('<m8[Y]')

# Transforma idade em número inteiro
df['idade'] = df['idade'].astype('int64')

Este código em Pandas serve para calcular a idade a partir da data de nascimento em um DataFrame. Aqui está o que cada parte faz:

  1. pd.to_datetime('today'): Obtém a data e hora atuais.
  2. df['data_nascimento']: Acessa a coluna de datas de nascimento no DataFrame.
  3. (pd.to_datetime('today') - df['data_nascimento']): Calcula a diferença entre a data atual e as datas de nascimento.
  4. .astype('<m8[Y]'): Converte essa diferença para anos.
    • Obs: É possível também converter a data utilizando o atributo .astype(‘timedelta64[Y]’)

No final, o resultado é uma nova coluna chamada ‘idade’ no DataFrame, contendo as idades calculadas em anos. Esse código simplifica o processo de cálculo da idade usando o Pandas.

Saída:

Conclusão

Neste artigo, aprendemos a realizar o cálculo de idade a partir de datas de nascimento utilizando a a biblioteca Pandas em apenas alguns passos simples. Ao explorar essas funcionalidades, você pode enriquecer suas análises de dados, adicionando uma dimensão crucial, a idade, aos seus conjuntos de dados.

O uso do Pandas simplifica consideravelmente tarefas que envolvem manipulação de datas e tempo, tornando-as acessíveis mesmo para aqueles que estão dando os primeiros passos na ciência de dados com Python.

Espero que este guia tenha sido útil para você! Se tiver alguma dúvida ou sugestão, não hesite em compartilhar nos comentários.

Agradeço por dedicar seu tempo em aprender. Fique à vontade para compartilhar este post com seus colegas e nas redes sociais, ajudando a disseminar conhecimento sobre o uso eficiente do Pandas para cálculos de idade em Python.

Até a próxima.🚀✨

Compartilhe!

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *