Clique Aqui e Compre pelo Whatsapp
Olá, estudante!
Nesta atividade, você aplicará técnicas de análise preditiva e classificação usando o famoso conjunto de dados do Titanic. Seu desafio será explorar os dados, identificar padrões e construir modelos capazes de prever se um passageiro sobreviveu ao naufrágio. Por meio da análise exploratória e da avaliação dos modelos, você desenvolverá habilidades essenciais para trabalhar com dados reais e tomar decisões baseadas em informações concretas.
Objetivo Geral:
Aplicar técnicas de análise preditiva e classificação utilizando o conjunto de dados do Titanic, com foco em análise exploratória, construção de modelos supervisionados e avaliação de desempenho.
Conjunto de Dados:
Dados disponíveis publicamente em: https://www.kaggle.com/competitions/titanic/data
Arquivos utilizados: train.csv (dados de treino) e test.csv (dados de teste).
Tarefa do Estudante:
Você atuará como um cientista de dados responsável por prever se um passageiro sobreviveu ou não ao naufrágio do Titanic com base em características como idade, sexo, classe da passagem, número de familiares a bordo, entre outras.
Etapas da Atividade:
Análise Exploratória dos Dados (train.csv)
Quantidade de sobreviventes x não sobreviventes.
Distribuição por sexo, idade, classe da cabine, porto de embarque.
Cruzamentos úteis (exemplo: sobrevivência por sexo e classe).
Pré-processamento
Tratamento de valores nulos (como Age, Cabin, Embarked).
Conversão de variáveis categóricas em numéricas (exemplo: Sex, Embarked).
Criação de Modelo Preditivo
Escolher um modelo (árvore de decisão, regressão logística, KNN etc.).
Treinar com train.csv (com separação treino/validação se desejar).
Testar com test.csv e prever coluna Survived.
Avaliação e Entrega
Apresentar as principais métricas: acurácia, matriz de confusão e classificação.
Gerar um gráfico com os principais resultados.
Enviar um relatório com a metodologia utilizada, análise, código em Python e considerações finais.
Critérios de Avaliação:
Clareza na análise e visualização dos dados.
Correção na implementação dos modelos.
Justificativa da escolha do algoritmo.
Qualidade das interpretações e recomendações.
Observação: os estudantes podem utilizar bibliotecas como Pandas, Scikit-learn, Matplotlib, Seaborn, NumPy etc.
Segue um auxílio de código Python para conseguir 
# MAPA - Análise Preditiva e Classificação - Titanic
 
# =======================
# 1. Importação de Bibliotecas
# =======================
# Importe aqui as bibliotecas principais para manipulação de dados, visualização e machine learning
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
 
# sklearn será usado para modelo preditivo e métricas
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
 
# =======================
# 2. Leitura dos Dados
# =======================
# Carregue os arquivos 'train.csv' e 'test.csv' utilizando o pandas
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
 
# =======================
# 3. Análise Exploratória
# =======================
# Verifique informações iniciais do dataset
print("Informações gerais:")
Escrever aqui o seu código -> 
 
# Gere gráficos que mostrem:
# - Distribuição de sobreviventes
# - Sobrevivência por sexo
# - Sobrevivência por classe do ticket
# Dica: use sns.countplot()
 
# Exemplo:
Escrever aqui o seu código -> 
 
# =======================
# 4. Pré-processamento
# =======================
# Preencha valores nulos, especialmente nas colunas Age, Embarked e Fare
# Use .fillna() com média, mediana ou moda conforme apropriado
 
# Converta variáveis categóricas para numéricas (Sex, Embarked)
# Utilize LabelEncoder ou pandas .map()
 
# Exemplo para Sex:
# le = LabelEncoder()
# train['Sex'] = le.fit_transform(train['Sex'])
 
# =======================
# 5. Seleção de Atributos e Criação do Modelo
# =======================
# Defina X com as colunas relevantes e y com a coluna alvo
# Divida os dados em treino e validação com train_test_split
 
# Crie o modelo com DecisionTreeClassifier e faça o treinamento com .fit()
 
# =======================
# 6. Avaliação do Modelo
# =======================
# Realize a previsão com .predict()
# Calcule a acurácia, matriz de confusão e exiba o classification_report
 
# =======================
# 7. Previsão Final para Submissão
# =======================
 
# =======================
# 8. Considerações Finais
# =======================
IMPORTANTE:
1. Acesse o link com um vídeo tutorial para ajudá-lo nesse processo de criação e desenvolvimento. O acesso deverá ser realizado em: Materiais >> Material da Disciplina.
2. Responda a todos os itens, seguindo como roteiro os tópicos elencados anteriormente, e coloque em um único arquivo.
3. A entrega deve ser feita por meio do Template de entrega da atividade MAPA, disponível no material da disciplina.
4. Antes de enviar sua atividade, certifique-se de que respondeu a todas as perguntas e realize uma cuidadosa correção ortográfica.
5. Após o envio não são permitas alterações, ou modificações. Logo, você tem apenas uma chance de enviar o arquivo corretamente. Revise bem antes de enviar!
6. Lembre-se de que evidências de cópias de materiais, incluindo de outros estudantes, sem devidas referências, serão inquestionavelmente zeradas. As citações e referências, mesmo que do livro da disciplina, devem ser realizadas conforme normas da Instituição de Ensino.
7. Não são permitidas correções parciais no decorrer do módulo, ou seja, o famoso: “professor, veja se minha atividade está certa?”. Isso invalida seu processo avaliativo. Lembre-se de que a interpretação da atividade também faz parte da avaliação.
8. Procure sanar suas dúvidas junto à mediação em tempo hábil sobre o conteúdo exigido na atividade, de modo que consiga realizar sua participação.
9. Atenção ao prazo de entrega, evite envio de atividade em cima do prazo. Você pode ter algum problema com internet, computador, software etc., e os prazos não serão flexibilizados, mesmo em caso de comprovação.
 
Bons estudos!
Clique Aqui e Compre pelo Whatsapp
    