CONECTA 60+

Sistema Inteligente de Triagem Geriátrica com Machine Learning

Turma: [42] | Curso: [Ciência da Computação] | Período: Noturno | Ano: 2025

👥 Equipe e Papéis

Integrante	RA	Papel Principal	Principais Entregas
[Eduardo Daniel Alves Sampaio]	`[2224104694]`	Engenharia de Dados	`data_prep.py`, Jupyter Notebooks
[Eduardo Matheus Correia Santos ]	`[2224107415]`	Modelagem ML	`model.py`, `train.py`
[João Paulo Nunes de Jesus Araujo Leitão ]	`[2224107083]`	Avaliação & Gráficos	`evaluate.py`, reports/
[Diogo Neves Oliveira ]	`[2224102999]`	Documentação	README.md, docs/
[João Vitor Arce de Araujo ]	`[2224106223]`	Apresentação	Vídeo, slides
[Eduardo Daniel]	`[2224104694]`	Gerência	Integração, testes

Por Que Este Projeto Existe?

O Desafio do Envelhecimento Populacional

O Brasil está envelhecendo rapidamente. Segundo o IBGE, em 2030 teremos mais idosos do que crianças e adolescentes. Essa transformação demográfica traz desafios imensos ao sistema de saúde: filas intermináveis, especialistas sobrecarregados, e idosos perdidos em um labirinto burocrático em busca do atendimento adequado.

A Realidade que Nos Motivou

Durante pesquisas sobre saúde geriátrica, nos deparamos com situações reais que nos tocaram profundamente:

Exemplo 1: Uma idosa de 68 anos passou por 4 consultas diferentes até descobrir que seu problema era ortopédico, não cardíaco. Resultado: meses de dor, gastos desnecessários e frustração.

Exemplo 2: Um senhor de 72 anos foi encaminhado ao cardiologista quando na verdade precisava de um geriatra para avaliação multidimensional. O resultado? Diagnósticos fragmentados que não enxergavam o paciente como um todo.

graph LR
    A[😔 Idoso com sintomas] --> B[ Consulta 1: Clínico]
    B --> C[ Consulta 2: Especialista errado]
    C --> D[ Consulta 3: Outro especialista]
    D --> E[ Consulta 4: Finalmente correto]
    
    A2[😊 Idoso com sintomas] --> F[ Conecta 60+]
    F --> G[Especialista correto]
    
    style A fill:#ffcccc
    style E fill:#ffcccc
    style A2 fill:#ccffcc
    style G fill:#ccffcc

A Solução: Tecnologia a Serviço da Longevidade

E se pudéssemos usar Inteligência Artificial para guiar esses pacientes ao profissional certo logo na primeira vez?

Foi assim que nasceu o Conecta 60+: um sistema que, através de um questionário estruturado baseado no protocolo AMPI (Avaliação Multidimensional do Paciente Idoso), utiliza Machine Learning para recomendar a especialidade médica mais adequada com 89% de acurácia.

O Impacto Real no Cotidiano

Para o Idoso

✅ Menos consultas desnecessárias
✅ Atendimento direcionado
✅ Dignidade preservada
✅ Visão integrada da saúde

Para o Sistema

✅ Redução de filas
✅ Otimização de recursos
✅ Triagem inteligente (89%)
✅ Atende milhares simultaneamente

Para a Família

✅ Tranquilidade
✅ Economia de tempo e dinheiro
✅ Menos deslocamentos
✅ Mais tempo de qualidade

Por Que o Protocolo AMPI?

O AMPI não olha apenas para doenças isoladas. Ele enxerga o idoso como um ser integral:

Dimensão	Avaliação
🚶 Mobilidade	Capacidade de andar, quedas, equilíbrio
🧠 Cognição	Memória, orientação, raciocínio
❤️ Cardiovascular	Coração, pressão arterial, circulação
🍽️ Nutrição	Alimentação, peso, apetite
😊 Emocional	Humor, ansiedade, depressão
😴 Sono	Qualidade do descanso, insônia
👁️ Sentidos	Visão e audição
💊 Medicamentos	Polifarmácia, adesão ao tratamento
👨‍👩‍👧 Social	Rede de apoio, isolamento

Essa visão 360° é o que faz a diferença entre encaminhar para o especialista correto ou perpetuar um ciclo de consultas frustrantes.

Nossa Missão

"Transformar dados em cuidados"

Queremos que cada idoso brasileiro tenha acesso a uma triagem inteligente, rápida e precisa.
Que nenhum paciente precise sofrer meses até o diagnóstico correto.
Que cada pessoa seja vista de forma integral, não fragmentada.

Esta não é apenas uma aplicação de IA.
É nossa resposta a um problema real que afeta milhões de brasileiros todos os dias.

Sobre o Projeto

Sistema web que utiliza Machine Learning para triagem automatizada de pacientes idosos (60+), recomendando especialidades médicas baseado em questionário estruturado de 100 perguntas do protocolo AMPI (Avaliação Multidimensional do Paciente Idoso).

Destaques

graph LR
    A[ Paciente 60+] --> B[ 100 Perguntas]
    B --> C[ Random Forest]
    C --> D[ Especialidade]
    C --> E[ Urgência]
    C --> F[ Relatório PDF]
    
    style A fill:#e1f5ff
    style B fill:#fff4e1
    style C fill:#e1ffe1
    style D fill:#ffe1e1
    style E fill:#f0e1ff
    style F fill:#ffe1f0

❓ Problema

Contexto

O envelhecimento populacional brasileiro demanda sistemas eficientes de triagem médica. Atualmente:

❌ Situação Atual	✅ Nossa Solução
Avaliação manual e demorada	Sistema automatizado (2 minutos)
Sujeita a viés humano	ML com 89% de acurácia
Encaminhamentos inadequados	Predição baseada em 1000 casos
Sobrecarga de especialistas	Triagem inteligente por urgência

Objetivo

Desenvolver um sistema de IA que, através de questionário estruturado, prediz automaticamente:

Especialidade médica mais adequada
Nível de urgência do atendimento
Áreas de risco identificadas

Métricas Alvo

Principal: F1-Score = 0.87 ✅
Secundária: Acurácia = 89% ✅

Tecnologias de IA

Arquitetura em 3 Camadas

flowchart TB
    subgraph Layer1["🔵 CAMADA 1: RAG"]
        A1[PDF AMPI] --> A2[PyPDF2]
        A2 --> A3[LangChain]
        A3 --> A4[HuggingFace<br/>Embeddings 384D]
        A4 --> A5[ChromaDB]
    end
    
    subgraph Layer2["🟢 CAMADA 2: ML"]
        B1[100 Features] --> B2[StandardScaler]
        B2 --> B3[Random Forest<br/>100 árvores]
        B3 --> B4[Predição]
    end
    
    subgraph Layer3["🟡 CAMADA 3: Sistema"]
        C1[Análise Híbrida] --> C2[Ranking<br/>Especialidades]
        C2 --> C3[Cálculo<br/>Urgência]
        C3 --> C4[Relatório PDF]
    end
    
    A5 --> B1
    B4 --> C1
    
    style Layer1 fill:#e3f2fd
    style Layer2 fill:#e8f5e9
    style Layer3 fill:#fff3e0

📚 Stack Tecnológico

Categoria	Tecnologia	Função
ML	scikit-learn	Random Forest Classifier
Deep Learning	HuggingFace Transformers	Embeddings (1B parâmetros)
Banco Vetorial	ChromaDB	Armazenamento semântico
Orquestração	LangChain	Pipeline de IA
Interface	Streamlit	Web App
Visualização	Plotly, Matplotlib, Seaborn	Gráficos interativos
Relatórios	ReportLab	Geração de PDF

Modelo: Random Forest

Por que Random Forest?

✅ Robusto a overfitting (ensemble de 100 árvores)
✅ Não requer normalização extensiva
✅ Interpretabilidade (feature importance)
✅ Excelente para dados tabulares
✅ Rápido em produção

Hiperparâmetros:

RandomForestClassifier(
    n_estimators=100,      # 100 árvores de decisão
    max_depth=10,          # Profundidade máxima
    min_samples_split=5,   # Mínimo para split
    min_samples_leaf=2,    # Mínimo por folha
    random_state=42        # Reprodutibilidade
)

Dados

Origem

Tipo	Fonte	Quantidade
Perguntas	PDF Protocolo AMPI	100 perguntas
Treino	Dados sintéticos	1000 amostras
Categorias	10 áreas médicas	9 especialidades

Estrutura dos Dados

Features (X): 100 dimensões

[mobilidade, cognitivo, cardiovascular, nutricional, emocional, 
 sono, visão, audição, quedas, medicamentos, urinário, equilíbrio, 
 peso, digestivo, pele, social]

Target (y): 9 classes

{
    0: "Geriatria",
    1: "Cardiologia", 
    2: "Neurologia",
    3: "Ortopedia",
    4: "Psiquiatria",
    5: "Nutrição",
    6: "Urologia",
    7: "Oftalmologia",
    8: "Otorrinolaringologia"
}

Cuidados Éticos

✅ Dados sintéticos para treinamento inicial
✅ Dados reais anonimizados (sem CPF/nome/endereço)
✅ Consentimento informado em produção
✅ Armazenamento local (sem cloud)
✅ Conformidade com LGPD

Arquitetura do Sistema

Estrutura de Pastas

Conecta_60Plus/
├── 📄 README.md                    ← Você está aqui!
├── 📄 requirements.txt             ← Dependências
├── 📄 .gitignore                   ← Arquivos ignorados
│
├── 🖼️ assets/                      ← Imagens e logos
│   └── logo_conecta60.jpg
│
├── 📚 base/                        ← Documentos base
│   └── questionario_conecta_60.pdf
│
├── 💾 data/                        ← Dados
│   ├── raw/                        ← Dados brutos
│   └── processed/                  ← Dados processados
│
├── 🤖 models/                      ← Modelos ML
│   ├── classificador.pkl           ← Random Forest
│   ├── scaler.pkl                  ← Normalizador
│   └── metadata.json               ← Hiperparâmetros
│
├── 📊 reports/                     ← Resultados
│   ├── figures/                    ← 5 gráficos
│   │   ├── confusion_matrix.png
│   │   ├── feature_importance.png
│   │   ├── roc_curves.png
│   │   ├── learning_curve.png
│   │   └── class_distribution.png
│   └── tables/                     ← Métricas CSV
│       └── classification_report.csv
│
├── 💻 src/                         ← Código-fonte
│   ├── config.py                   ← Configurações
│   ├── data_prep.py                ← Preparação de dados
│   ├── model.py                    ← Definição do modelo
│   ├── train.py                    ← Treinamento
│   ├── evaluate.py                 ← Avaliação
│   ├── main.py                     ← Interface Streamlit
│   ├── analise_respostas.py        ← Sistema híbrido
│   ├── perguntas_conecta60.py      ← Banco de perguntas
│   ├── database.py                 ← Persistência
│   ├── gerar_pdf.py                ← Geração de PDF
│   └── vector_store.py             ← ChromaDB
│
├── 📓 notebooks/                   ← Jupyter Notebooks
├── 🧪 tests/                       ← Testes
└── 📖 docs/                        ← Documentação

🔄 Fluxo de Dados

sequenceDiagram
    participant U as 👤 Usuário
    participant S as 🖥️ Streamlit
    participant Q as 📋 Perguntas
    participant ML as 🤖 Random Forest
    participant R as 📄 Relatório
    
    U->>S: Inicia avaliação
    S->>Q: Seleciona 10 perguntas
    Q->>S: Exibe questionário
    U->>S: Responde perguntas
    S->>ML: Envia respostas (100D)
    ML->>ML: Normaliza (StandardScaler)
    ML->>ML: Predição (RF)
    ML->>S: Especialidade + Confiança
    S->>R: Gera PDF
    R->>U: Download relatório
    
    Note over ML: Acurácia: 89%<br/>Confiança: 87%

⚙️ Como Reproduzir

📋 Pré-requisitos

Python 3.11+
Git
4GB RAM mínimo
500MB espaço em disco

🚀 Instalação Completa

1️⃣ Clonar Repositório

git clone https://github.com/Eduardodanield/Conecta_60Plus.git
cd Conecta_60Plus

2️⃣ Criar Ambiente Virtual

# Windows
python -m venv venv
venv\Scripts\activate

# Linux/Mac
python3 -m venv venv
source venv/bin/activate

3️⃣ Instalar Dependências

pip install -r requirements.txt

4️⃣ Treinar Modelo ML

python src/train.py

Saída esperada:

🤖 CONECTA 60+ - TREINAMENTO ML
============================================================
📊 Gerando 1000 amostras sintéticas...
✅ Dados gerados: (1000, 100)
🌲 Treinando Random Forest...
✅ Acurácia Treino: 95.00%
✅ Acurácia Teste: 89.00%
🔄 Cross-validation: 88.30% (±2.10%)
💾 Salvando modelo em models/
✅ TREINAMENTO CONCLUÍDO!

5️⃣ Gerar Gráficos de Avaliação

python src/evaluate.py

Saída esperada:

CONECTA 60+ - AVALIAÇÃO E GRÁFICOS
============================================================
[1/5] Gerando Matriz de Confusão...
✅ confusion_matrix.png salvo
[2/5] Gerando Importância de Features...
✅ feature_importance.png salvo
[3/5] Gerando Curvas ROC...
✅ roc_curves.png salvo
[4/5] Gerando Curva de Aprendizado...
✅ learning_curve.png salvo
[5/5] Gerando Distribuição de Classes...
✅ class_distribution.png salvo
✅ TODOS OS GRÁFICOS GERADOS!

Executar Aplicação Web

streamlit run src/main.py

Acesse: (https://conecta60plus25.streamlit.app/)

Interface do Sistema

Tela Inicial

Página inicial com objetivos, método e resultados do Conecta 60+

A interface apresenta de forma clara:

Objetivo: Avaliar riscos de saúde em idosos
Método: Questionário adaptativo inteligente
Resultado: Encaminhamento médico personalizado

Questionário Interativo

Sistema de perguntas com barra de progresso e navegação intuitiva

Características:

✅ Barra de progresso visual (9 de 10)
✅ Perguntas claras e objetivas
✅ Opções de resposta baseadas no protocolo AMPI
✅ Navegação entre perguntas (Anterior/Próxima)

🎯 Resultado da Avaliação

Análise detalhada com especialidade recomendada, nível de urgência e áreas de atenção

Informações apresentadas:

🏥 Especialidade Recomendada: Otorrinolaringologia
🔴 Nível de Urgência: Alta (pontuação 15)
⚠️ Áreas que requerem atenção: Social, equilíbrio, sono, cardiovascular, mobilidade, nutricional
💡 Recomendação: Agendar consulta o mais breve possível
📊 Análise Detalhada: Top especialidades recomendadas

📊 Dashboard Administrativo

Painel de controle com estatísticas gerais do sistema

Métricas em tempo real:

👥 Total de Pacientes: 18
📅 Atendimentos Hoje: 3
📈 Idade Média: 71.6 anos
🚨 Urgências Altas: 9

Dados Completos dos Pacientes

Tabela completa com histórico de todos os atendimentos

Funcionalidades:

🔍 Filtros: Por especialidade, urgência e cidade
📊 Dados detalhados: Timestamp, nome, idade, cidade, filhos, especialidade, urgência, pontuação, categorias de risco
💾 Exportação: Download dos dados para análise
🔒 Privacidade: Dados anonimizados conforme LGPD

📈 Resultados

🎯 Métricas do Modelo

Métrica	Valor	Status
Acurácia	89.00%	✅ Excelente
F1-Score (macro)	0.87	✅ Ótimo
Precisão (macro)	0.88	✅ Alta
Recall (macro)	0.86	✅ Bom
AUC-ROC (macro)	0.94	✅ Excelente
CV Score (5-fold)	88.3% ±2.1%	✅ Estável

📊 Desempenho por Especialidade

%%{init: {'theme':'base', 'themeVariables': { 'primaryColor':'#4CAF50'}}}%%
pie title Distribuição de Predições
    "Geriatria" : 25
    "Cardiologia" : 15
    "Neurologia" : 15
    "Ortopedia" : 15
    "Psiquiatria" : 15
    "Nutrição" : 15

⏱️ Performance

Métrica	Tempo
Treino do modelo	~30 segundos
Predição (1 paciente)	<100ms
Geração de gráficos	~45 segundos
Carregamento da interface	~3 segundos

📊 Gráficos e Visualizações

5 Gráficos Obrigatórios

Gráfico	Descrição	Arquivo
🟦 Matriz de Confusão	Avalia predições vs real	`confusion_matrix.png`
🟩 Importância de Features	Top 20 perguntas mais relevantes	`feature_importance.png`
🟨 Curvas ROC	Performance multiclasse (AUC)	`roc_curves.png`
🟪 Curva de Aprendizado	Convergência do modelo	`learning_curve.png`
🟧 Distribuição de Classes	Balanceamento do dataset	`class_distribution.png`

📊 Interpretação dos Resultados

✅ Pontos Fortes:

Boa separação entre classes (matriz confusão diagonal forte)
Perguntas cardiovasculares e mobilidade são mais importantes
AUC > 0.90 para todas as classes
Modelo converge com ~600 amostras (sem overfitting)

⚠️ Limitações Identificadas:

Confusão entre Geriatria e Cardiologia (overlap clínico esperado)
Dados sintéticos (necessita validação clínica real)
Não considera histórico temporal do paciente

🎥 Vídeo Demonstração

🎬 Assista à Demonstração Completa

Duração: 8:08 minutos
Formato: Demonstração do Projeto

Conteúdo do vídeo:

Apresentação da equipe e motivação do projeto
Demonstração do código e estrutura
Treinamento do modelo ML ao vivo
Geração dos 5 gráficos obrigatórios
Aplicação funcionando (questionário + resultado)
Geração de relatório PDF
Navegação pelo repositório GitHub

💡 Decisões Técnicas

🔧 Pré-processamento

Etapa	Técnica Aplicada
Nulos	Imputação com valor neutro (índice 0)
Normalização	StandardScaler (μ=0, σ=1)
Features	Vetorização de respostas ordinais
Split	Stratified 80/20 (mantém proporção classes)

🎯 Validação

✅ Cross-validation 5-fold: 88.3% (±2.1%)
✅ Seed fixo (42): Reprodutibilidade garantida
✅ Stratified split: Mantém balanceamento

Melhorias Futuras

mindmap
  root((Melhorias<br/>Futuras))
    Dados
      Validação clínica real
      Dados longitudinais
      Integração FHIR
    Modelo
      SHAP values
      Ensemble stacking
      Deep Learning LSTM
    Produto
      App mobile
      Integração prontuário
      Dashboard médico
      API REST

📚 Referências e Créditos

🎓 Acadêmicas

Orientação:

Prof. Felipe Santos de Jesus
Disciplina: Inteligência Artificial
4º Semestre - Ciência da Computação
Instituição: [Universidade Nove de Julho]

📖 Livros

HUYEN, Chip. AI Engineering: Building Applications with Foundation Models.
O'Reilly Media, 2024.

Referência fundamental para construção de aplicações com modelos de IA

🎥 Vídeos e Tutoriais

Canal HashTag Programação:

Tutorial Python + IA
Disponível em: https://www.youtube.com/watch?v=NsjA-c8596k
Acesso em: 2025
Machine Learning na Prática
Disponível em: https://www.youtube.com/watch?v=0M8iO5ykY-E&t=1045s
Acesso em: 2025

🎓 Cursos

AMARAL, Fernando. Streamlit: Crie 12 Aplicações Web de Inteligência Artificial.
Plataforma: Udemy, 2024.

Base para desenvolvimento da interface web do projeto

🤖 Ferramentas de IA Utilizadas

Durante o desenvolvimento deste projeto, foram utilizadas as seguintes IAs assistivas para auxílio em código, depuração e documentação:

Ferramenta	Uso Principal	Website
Claude.ai	Desenvolvimento de código e arquitetura	claude.ai
Gemini	Pesquisa e validação técnica	gemini.google.com
ChatGPT	Debug e otimização de código	chat.openai.com

Nota de Transparência: Todas as IAs foram utilizadas como ferramentas assistivas. O código final, arquitetura e decisões técnicas são de autoria da equipe do projeto.

🛠️ Tecnologias Open Source

Python Software Foundation - Python 3.11
Streamlit - Framework de interface web
scikit-learn - Biblioteca de Machine Learning
HuggingFace - Modelos de transformers
ChromaDB - Banco de dados vetorial
LangChain - Framework de orquestração de IA
Matplotlib, Seaborn, Plotly - Visualização de dados

📋 Protocolos Médicos

AMPI - Avaliação Multidimensional do Paciente Idoso
Protocolo de avaliação geriátrica multidimensional utilizado como base para as 100 perguntas do sistema

📄 Licença

Este projeto está sob a licença MIT. Veja o arquivo LICENSE para mais detalhes.

MIT License - Copyright (c) 2025 Conecta 60+ Team

Agradecimentos

Nossos sinceros agradecimentos a todos que contribuíram para este projeto:

🎓 Prof. Felipe Santos de Jesus
Disciplina de Inteligência Artificial - 4º Semestre
Orientação técnica, revisão da arquitetura e validação do modelo de ML
🏫 [Universidade Nove de Julho]
Suporte acadêmico e infraestrutura para desenvolvimento
👨‍💻 Fernando Amaral
Curso Udemy: Streamlit - 12 Aplicações Web de IA
Base para desenvolvimento da interface web
📺 Canal HashTag Programação
Tutoriais fundamentais para implementação de Python e ML
🏥 Profissionais de Saúde UBS Orion e o serviço Centro Dia para Idoso Santa Clara
Validação clínica do protocolo AMPI e das perguntas
🤖 Comunidade Open Source
Desenvolvimento das ferramentas: Python, scikit-learn, HuggingFace, Streamlit
💡 Ferramentas de IA Assistiva
Claude.ai, Gemini e ChatGPT pelo suporte no desenvolvimento

Este projeto não seria possível sem o apoio e conhecimento compartilhado por toda a comunidade!

📞 Contato

Dúvidas ou sugestões?

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
assets		assets
base		base
db		db
models		models
reports		reports
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
dados_pacientes.csv		dados_pacientes.csv
requirements.txt		requirements.txt
teste_100_perguntas.py		teste_100_perguntas.py

License

Eduardodanield/Conecta_60Plus

Folders and files

Latest commit

History

Repository files navigation