Skip to content

GabrielFerrante/Data-Mining

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

50 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

💡 Repositório de Técnicas em Aprendizado de Máquina e Mineração de Dados não estruturados e estruturados.

Este repositório reúne uma ampla variedade de técnicas de aprendizado de máquina, mineração de dados e ciência de dados aplicadas em diferentes domínios e contextos. Ele está organizado por tópicos, cada um contendo códigos, exemplos práticos e anotações que facilitam o entendimento e aplicação dos conceitos.

📂 Estrutura do Repositório

📊 Aprendizado de Máquina e Modelos Preditivos

  • Classificacao: Técnicas de classificação supervisionada como SVM, Decision Trees, k-NN, etc.
  • Regressao: Modelos de regressão linear, regressão polinomial e outras variações.
  • RedesNeuraisRecorrentes: Modelos sequenciais como RNN, LSTM e GRU.
  • GAN: Redes Adversárias Generativas.
  • GNNs: Graph Neural Networks para aprendizado sobre grafos.

🧠 Aprendizado Especializado

  • AprendizadoPorReforco: Métodos de aprendizado por reforço (Q-learning, Deep Q-Networks, etc.).
  • AprendizadoPorMetrica: Técnicas baseadas em aprendizado por similaridade, como k-NN adaptativo.
  • Fuzzy: Sistemas de inferência fuzzy e lógica nebulosa.
  • ReconhecimentoFaces: Algoritmos para detecção e reconhecimento facial.

🔍 Mineração de Dados

  • MineracaoTextos: Técnicas de NLP, como bag-of-words, TF-IDF e embeddings.
  • MineracaoAudios: Análise e classificação de dados de áudio.
  • MineracaoImagens: Extração e análise de características em imagens.
  • MineracaoRedesHeterogeneas: Mineração em grafos heterogêneos com múltiplos tipos de nós e arestas.

📈 Séries Temporais e Dados Complexos

  • SeriesTemporais: Modelos para previsão temporal (ARIMA, Prophet, etc.).
  • RedesComplexas: Análise e modelagem de redes complexas e sistemas interconectados.

🧪 Pré e Pós-Processamento

  • PreProcessamento: Técnicas de normalização, redução de dimensionalidade, limpeza e transformação.
  • PosProcessamento: Ajustes e refinamentos pós-modelagem.
  • DadosDesbalanceados: Estratégias para lidar com dados desbalanceados como oversampling e undersampling.

📚 Técnicas Avançadas e Tópicos Complementares

  • Agrupamento: Métodos não supervisionados como k-means, DBSCAN, etc.
  • MedidasProximidade: Distâncias e similaridades (Euclidiana, Cosseno, etc.).
  • BigDataSpark: Processamento de grandes volumes de dados com Apache Spark.
  • RegrasAssociacao: Descoberta de padrões com algoritmos como Apriori e FP-Growth.
  • TopicModelling-LDA: Modelagem de tópicos com Latent Dirichlet Allocation (LDA).

📁 Outros

  • Bases de dados: Conjunto de bases utilizadas nos exemplos e testes.

🧭 Objetivo

O objetivo principal é fornecer uma base prática e acessível para estudantes e pesquisadores que desejam aprofundar seus conhecimentos em aprendizado de máquina, mineração de dados e inteligência artificial.

🛠️ Requisitos

  • Python 3.x
  • Jupyter Notebook
  • Scikit-learn, TensorFlow, PyTorch, Numpy, Pandas, Matplotlib, etc.

Consulte os arquivos individuais para dependências específicas.


About

Conceitos e algoritmos de mineração de textos, imagens e áudios.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •