Introdução ao Data Mining (Mineração de Dados)

Esta obra cobre cinco tópicos principais: dados, classificação, análise de associação, agrupamento e detecção de anomalias. Exceto pela detecção de anomalias, cada uma destas áreas é coberta em um par de capítulos. Para classificação, análise de associação e agrupamento, o capítulo introdutório cobre conceitos básicos, algoritmos representativos e técnicas de avaliação, enquanto que o capítulo mais avançado discute conceitos e algoritmos avançados. O objetivo é fornecer ao leitor uma compreensão dos fundamentos da mineração de dados, embora ainda assim cobrindo muitos tópicos avançados importantes. Devido a esta abordagem, o livro é útil tanto como ferramenta de aprendizagem quanto como referência.
+-

Quem viu este produto , comprou

  • Projeto de Banco de Dados e Teoria Relacional - Formas Normais e Tudo o Mais

    O que torna este livro diferente dos outros sobre projeto de banco de dados? Muitos recursos sobre a prática de projetos fazem pouco para explicar a teoria subjacente, e livros sobre teoria de projetos têm como objetivo principal os teóricos da área. Neste livro, o renomado especialista C. J. Date preenche a lacuna, apresentando a teoria de projetos de forma que quem atua na área possa entendê-la – apoiando-se em lições aprendidas em quatro décadas de experiência para demonstrar o porquê de um projeto apropriado de bancos de dados ser tão crítico, em primeiro lugar. ... Ler mais +

    QUERO VER
  • Datamining - A Mineração de Dados no Marketing, Medicina, Economia, Engenharia e Administração

    O livro pretende levar ao leigo em Inteligência Artificial e também ao estudante e ao profissional de Ciência da Computação ou Engenharia um texto auto-contido, capaz de começar desde o princípio; mostrar usos, vantagens e desvantagens de cada técnica, e desmistificar o assunto. Desta forma, o Datamining poderá ser utilizado com bases mais sólidas, sem enganos, fornecendo ao usuário a capacidade de decidir conscientemente qual das ferramentas pode ser útil em cada caso específico. ... Ler mais +

    QUERO VER
  • OpenSQL Banco de Dados Relacional - Versão 3.6

    PROMOÇÃO LOGITECH BEATS E OUTROS

    Único banco de dados relacional brasileiro, o OpenSQL é veloz e robusto. Suporta aplicações desenvolvidas em PHP, C# , C, Opus, TCL e Java. Cada tabela pode ter mais de quatro bilhões de registros e ocupar mais de 1 exabyte. ... Ler mais +

    QUERO VER
  • Atualização de Views e Teoria Relacional - Solucionando o Problema da Atualização de Views

    Views são tabelas virtuais. Isto significa que devem ser atualizáveis, da mesma forma que as tabelas de base ou “reais” o são. Na verdade, a capacidade de atualização de views não é apenas desejável, é crucial, por motivos práticos e teóricos. Todavia, a atualização de views tem sido um tópico controverso. Desde que o modelo relacional surgiu, tem havido um ceticismo amplo quanto a se (de modo geral) a atualização de views é até mesmo possível.
    Em total contraste com a sabedoria popular, este livro mostra como views, assim como tabelas de base, sempre podem ser atualizadas (desde que as atualizações não violem alguma restrição de integridade). De modo mais geral, mostra como a atualização sempre deve funcionar, independentemente de o alvo ser uma tabela de base ou uma view. ... Ler mais +

    QUERO VER
  • Introdução ao MongoDB

    Você precisa de uma introdução rápida e fácil aos bancos de dados MongoDB e NoSQL? O livro Introdução ao MongoDB, mostra como um sistema de banco de dados orientado a documentos difere de um banco de dados relacional, explica como instalá-lo e começar a usá-lo. Você também conhecerá o básico sobre o design do MongoDB, incluindo a indexação geoespacial, aprenderá a navegar, a visualizar e a fazer consultas em seu banco de dados e a usar o GridFS com um pouco de Python. ... Ler mais +

    QUERO VER
  • Modelagem Lógica de Dados: Construção Básica e Simplificada

    Modelar dados organizacionais necessários para a geração de informações requeridas é etapa fundamental no processo de construção de sistemas de informações. O estudo de modelagem de dados requer domínio de conceitos teóricos e prática sob a forma de problemas ou casos que simulem situações reais. Neste livro, o autor foca no aspecto prático, utilizando-se de exercícios e estudo de casos. Como forma de efetivamente auxiliar o leitor no processo de aprendizagem, para cada exercício ou estudo de caso é apresentada uma proposta de solução e respectiva análise. ... Ler mais +

    QUERO VER
  • Banco de Dados e Interface Gráfica C/C ++ Direto ao Ponto

    Além de apresentar algumas das sinuosidades das linguagens C/C++ e como contorná-las, este livro apresenta um conteúdo mais amplo com relação à linguagem C++; já que são abordados, além da linguagem, assuntos como interface gráfica, conexão e manipulação de banco de dados; ... Ler mais +

    QUERO VER
  • Desvendando o mongoDB - Do Mongo Shell ao Java Driver

    O objetivo deste livro é ser um guia para aqueles que desejam obter conhecimento sobre o banco de dados não relacional MongoDB (versão 2.6.3), um banco de dados NoSQL orientado a documentos. Ao leitor, serão apresentados os conceitos e a prática das operações de CRUD via Mongo Shell e Mongo Java Driver. ... Ler mais +

    QUERO VER
  • SPSS Básico para Análise de Dados

    O SPSS - Statistical Package for the Social Sciences - é um dos softwares mais utilizados na análise e tratamento de dados estatísticos nas diversas áreas do conhecimento e aplicações, tais como Marketing, Psicologia, Administração, Educação, Ciências Sociais, Serviço Social, Economia, Finanças, Saúde Pública, Pesquisa de Mercado, Pesquisa Social, Pesquisa Eleitoral, Pesquisa de Opinião, Pesquisa de Mídia etc. Com o SPSS é possível criar, definir, modificar e realizar cruzamentos de variáveis; gerar os mais diversos tipos gráficos; verificar a existência de associações e/ou correlações entre variáveis, executar análises de variância, análise fatorial e análise de correspondência, testes não-paramétricos, regressão linear, análise de cluster, séries temporais, análise de sobrevivência, análise de dados faltantes e muito mais. ... Ler mais +

    QUERO VER
  • Aprenda Mineração de Dados - Teoria e prática

    Normalmente livros de Mineração de Dados são gigantescos, carregados de muita teoria e fórmulas mirabolantes. Se o leitor conseguir chegar ao final da leitura, pouco terá entendido sobre as fórmulas ou mesmo como associar a teoria com a prática; a final, como isso tudo se aplica no meu dia a dia? Aprenda Mineração de Dados é um livro escrito pensando em outra abordagem: primeiro: a teoria é vista nos seus fundamentos, sem a necessidade de discutir funções matemáticas, que na prática, não terão nenhuma utilidade. Toda a teoria é detalhadamente explicada e bem ilustrada, sempre que possível. Depois, o leitor vê na prática como funciona aquilo que aprendeu no capitulo passado, sempre com dados de casos reais e usando uma ferramenta simples e didática: o Weka. ... Ler mais +

    QUERO VER

Quem viu este produto , também se interessou

  • OpenSQL Banco de Dados Relacional - Versão 3.6

    PROMOÇÃO LOGITECH BEATS E OUTROS

    Único banco de dados relacional brasileiro, o OpenSQL é veloz e robusto. Suporta aplicações desenvolvidas em PHP, C# , C, Opus, TCL e Java. Cada tabela pode ter mais de quatro bilhões de registros e ocupar mais de 1 exabyte. ... Ler mais +

    QUERO VER
  • Atualização de Views e Teoria Relacional - Solucionando o Problema da Atualização de Views

    Views são tabelas virtuais. Isto significa que devem ser atualizáveis, da mesma forma que as tabelas de base ou “reais” o são. Na verdade, a capacidade de atualização de views não é apenas desejável, é crucial, por motivos práticos e teóricos. Todavia, a atualização de views tem sido um tópico controverso. Desde que o modelo relacional surgiu, tem havido um ceticismo amplo quanto a se (de modo geral) a atualização de views é até mesmo possível.
    Em total contraste com a sabedoria popular, este livro mostra como views, assim como tabelas de base, sempre podem ser atualizadas (desde que as atualizações não violem alguma restrição de integridade). De modo mais geral, mostra como a atualização sempre deve funcionar, independentemente de o alvo ser uma tabela de base ou uma view. ... Ler mais +

    QUERO VER
  • Introdução ao MongoDB

    Você precisa de uma introdução rápida e fácil aos bancos de dados MongoDB e NoSQL? O livro Introdução ao MongoDB, mostra como um sistema de banco de dados orientado a documentos difere de um banco de dados relacional, explica como instalá-lo e começar a usá-lo. Você também conhecerá o básico sobre o design do MongoDB, incluindo a indexação geoespacial, aprenderá a navegar, a visualizar e a fazer consultas em seu banco de dados e a usar o GridFS com um pouco de Python. ... Ler mais +

    QUERO VER
  • Projeto de Banco de Dados e Teoria Relacional - Formas Normais e Tudo o Mais

    O que torna este livro diferente dos outros sobre projeto de banco de dados? Muitos recursos sobre a prática de projetos fazem pouco para explicar a teoria subjacente, e livros sobre teoria de projetos têm como objetivo principal os teóricos da área. Neste livro, o renomado especialista C. J. Date preenche a lacuna, apresentando a teoria de projetos de forma que quem atua na área possa entendê-la – apoiando-se em lições aprendidas em quatro décadas de experiência para demonstrar o porquê de um projeto apropriado de bancos de dados ser tão crítico, em primeiro lugar. ... Ler mais +

    QUERO VER
  • Desvendando o mongoDB - Do Mongo Shell ao Java Driver

    O objetivo deste livro é ser um guia para aqueles que desejam obter conhecimento sobre o banco de dados não relacional MongoDB (versão 2.6.3), um banco de dados NoSQL orientado a documentos. Ao leitor, serão apresentados os conceitos e a prática das operações de CRUD via Mongo Shell e Mongo Java Driver. ... Ler mais +

    QUERO VER
  • Banco de Dados e Interface Gráfica C/C ++ Direto ao Ponto

    Além de apresentar algumas das sinuosidades das linguagens C/C++ e como contorná-las, este livro apresenta um conteúdo mais amplo com relação à linguagem C++; já que são abordados, além da linguagem, assuntos como interface gráfica, conexão e manipulação de banco de dados; ... Ler mais +

    QUERO VER
  • SPSS Básico para Análise de Dados

    O SPSS - Statistical Package for the Social Sciences - é um dos softwares mais utilizados na análise e tratamento de dados estatísticos nas diversas áreas do conhecimento e aplicações, tais como Marketing, Psicologia, Administração, Educação, Ciências Sociais, Serviço Social, Economia, Finanças, Saúde Pública, Pesquisa de Mercado, Pesquisa Social, Pesquisa Eleitoral, Pesquisa de Opinião, Pesquisa de Mídia etc. Com o SPSS é possível criar, definir, modificar e realizar cruzamentos de variáveis; gerar os mais diversos tipos gráficos; verificar a existência de associações e/ou correlações entre variáveis, executar análises de variância, análise fatorial e análise de correspondência, testes não-paramétricos, regressão linear, análise de cluster, séries temporais, análise de sobrevivência, análise de dados faltantes e muito mais. ... Ler mais +

    QUERO VER
  • Aprenda Mineração de Dados - Teoria e prática

    Normalmente livros de Mineração de Dados são gigantescos, carregados de muita teoria e fórmulas mirabolantes. Se o leitor conseguir chegar ao final da leitura, pouco terá entendido sobre as fórmulas ou mesmo como associar a teoria com a prática; a final, como isso tudo se aplica no meu dia a dia? Aprenda Mineração de Dados é um livro escrito pensando em outra abordagem: primeiro: a teoria é vista nos seus fundamentos, sem a necessidade de discutir funções matemáticas, que na prática, não terão nenhuma utilidade. Toda a teoria é detalhadamente explicada e bem ilustrada, sempre que possível. Depois, o leitor vê na prática como funciona aquilo que aprendeu no capitulo passado, sempre com dados de casos reais e usando uma ferramenta simples e didática: o Weka. ... Ler mais +

    QUERO VER
  • Modelagem Lógica de Dados: Construção Básica e Simplificada

    Modelar dados organizacionais necessários para a geração de informações requeridas é etapa fundamental no processo de construção de sistemas de informações. O estudo de modelagem de dados requer domínio de conceitos teóricos e prática sob a forma de problemas ou casos que simulem situações reais. Neste livro, o autor foca no aspecto prático, utilizando-se de exercícios e estudo de casos. Como forma de efetivamente auxiliar o leitor no processo de aprendizagem, para cada exercício ou estudo de caso é apresentada uma proposta de solução e respectiva análise. ... Ler mais +

    QUERO VER
  • Datamining - A Mineração de Dados no Marketing, Medicina, Economia, Engenharia e Administração

    O livro pretende levar ao leigo em Inteligência Artificial e também ao estudante e ao profissional de Ciência da Computação ou Engenharia um texto auto-contido, capaz de começar desde o princípio; mostrar usos, vantagens e desvantagens de cada técnica, e desmistificar o assunto. Desta forma, o Datamining poderá ser utilizado com bases mais sólidas, sem enganos, fornecendo ao usuário a capacidade de decidir conscientemente qual das ferramentas pode ser útil em cada caso específico. ... Ler mais +

    QUERO VER
  • Descrição
    Introdução ao Data Mining (Mineração de Dados)

    Esta obra cobre cinco tópicos principais: dados, classificação, análise de associação, agrupamento e detecção de anomalias. Exceto pela detecção de anomalias, cada uma destas áreas é coberta em um par de capítulos. Para classificação, análise de associação e agrupamento, o capítulo introdutório cobre conceitos básicos, algoritmos representativos e técnicas de avaliação, enquanto que o capítulo mais avançado discute conceitos e algoritmos avançados. O objetivo é fornecer ao leitor uma compreensão dos fundamentos da mineração de dados, embora ainda assim cobrindo muitos tópicos avançados importantes. Devido a esta abordagem, o livro é útil tanto como ferramenta de aprendizagem quanto como referência.
  • Sobre o Autor
  • Especificação

    Características

    Tipo de LivroLivro Físico

    Especificações

    Sobre o AutorPang-Ning Tan

    Pang-Ning Tan, É professor assistente no departamento de Ciência da Computação e Engenharia na Universidade Estadual de Michigan. Tem certificado de PHD em Ciência da Computação pela Universidade de Minnesota. Suas Pesquisas focam o desenvolvimento e aplicacações em algoritmos na mineração de dados para uma grande variedade de aplicações incluindo informações médicas.

    Michael Steinbach

    Michael Steinbach graduado em Matemática, Estatistica e PHD em Ciência da Computação na Universidade de Minnesota. É atualmente um pesquisador associado ao Departamento de Ciência da Computação e Engenheiro na Universidade de Minnesota. Anteriormente, desenvolveu uma variedade de softwares de engenharia, análise e design para Silicon Biology, Racotek e NCR. Sua pesquisa é direcionada a área de mineração de dados, bioinformática e estatística. Foi autor de mais de 20 artigos de pesquisa e é co-autor do livro Data Mining. É membro do Instituto de Engenharia Eletro e Eletrônicos(IEEE) e o Associação para Marquinária Computacional.

    Vipin Kumar

    Vipin Kumar, atualmente é chefe do Departamento de Ciência da Computação e Engenharia da Universidade de Minnesota. Kumar foi organizador e co-organizador para várias conferências e workshops internacionais na área de mineração de dados. Em 2001 foi um dos fundadores da SIAM (Sociedade para Matemáticos Industriais e Aplicados), ficou como diretor em 2007.
    Informações Técnicas1 INTRODUÇÃO -
    1 1.1 O Que É Mineração de Dados? - 3
    1.2 Desa?os Motivadores - 5
    1.3 As Origens da Mineração de Dados - 7
    1.4 Tarefas de Mineração de Dados - 8
    1.5 Escopo e Organização do Livro - 13
    1.6 Notas Bibliográficas - 15
    1.7. Exercícios - 21

    2 DADOS - 23
    2.1 Tipos de Dados - 26
    2.1.1. Atributos e Medidas - 27
    2.1.2. Tipos de Conjuntos de Dados - 34
    2.2 Qualidade dos Dados - 43
    2.2.1 Questões de Medição e Coleta de Dados - 44
    2.2.2 Questões Relacionadas a Aplicações - 52
    2.3 Pré-Processamento de Dados - 53
    2.3.1 Agregação - 54
    2.3.2 Amostragem - 56
    2.3.3 Redução da Dimensionalidade - 60
    2.3.4 Seleção de Subconjunto de Característica - 62
    2.3.5 Criação de Recursos (Características) - 66
    2.3.6 Discretização e Binarização - 69
    2.3.7 Transformação de Variáveis - 75
    2.4 Medidas de Semelhança e Diferença - 78
    2.4.1 Fundamentos - 78
    2.4.2 Semelhança e Diferença entre Atributos Simples - 81
    2.4.3 Diferenças Entre Objetos de Dados - 82
    2.4.4 Semelhanças Entre Objetos de Dados - 86
    2.4.5 Exemplos de Medidas de Proximidade - 87
    2.4.6 Questões Relacionadas ao Cálculo de Proximidade - 95
    2.4.7 Selecionando a Medida de Proximidade Correta - 98
    2.5 Notas Bibliográficas - 100
    2.6 Exercícios - 105

    3 EXPLORANDO OS DADOS - 115
    3.1 O Conjunto de Dados Íris - 116
    3.2 Estatísticas de Resumo - 117
    3.2.1 Frequencias e o Modo - 118
    3.2.2 Porcentagens - 119
    3.2.3 Medidas de Localização: Média e Mediana - 120
    3.2.4 Medidas de Dispersão: Faixa e Variância - 121
    3.2.5 Estatísticas de Resumo com Múltiplas Variáveis - 123
    3.2.6 Outras Formas de Resumir os Dados - 124
    3.3 Visualização - 125
    3.3.1 Motivações para a Visualização - 125
    3.3.2 Conceitos Gerais - 126
    3.3.3 Técnicas - 131
    3.3.4 Visualizando Dados de Dimensões Maiores - 147
    3.3.5 O Que Deve e o Que Não Deve Ser Feito -154
    3.4 OLAP e Análise de Dados Multidimensionais - 155
    3.4.1 Representando Dados da Íris como uma Matriz Multidimensional - 156
    3.4.2 Dados Multidimensionais: O Caso Geral - 158
    3.4.3 Analisando Dados Multidimensionais - 161
    3.4.4 Comentários Finais Sobre a Análise de Dados Multidimensionais - 165
    3.5 Notas Bibliográficas - 165
    3.6 ExercÌcios - 168

    4 CLASSIFICAÇÃO: CONCEITOS BÁSICOS, ÁRVORES DE DECISÃO E AVALIAÇÃO DE MODELOS - 171
    4.1 Preliminares - 172
    4.2 Abordagem Geral para a Resolução de um Problema de Classi?cação - 174
    4.3 Indução da Árvore de Decisão - 176
    4.3.1 Como uma árvore de Decisão Funciona - 176
    4.3.2 Como Construir uma Árvore de Decisão - 179
    4.3.3 Métodos para Expressar Condições de Teste de Atributos - 183
    4.3.4 Métricas para Selecionar a Melhor Divisão - 186
    4.3.5 Algoritmo para Indução de Árvore de Decisão - 195
    4.3.6 Um Exemplo: Detecção de Robô Web - 197
    4.3.7 Características de Indução de Árvore de Decisão - 200
    4.4 Over?tting de Modelo - 204
    4.4.1 Over?tting Devido à Presença de Ruído - 207
    4.4.2 Over?tting Devido a Falta de Amostras Representativas - 209
    4.4.3 Over?tting e o Procedimento de Comparação Múltipla - 211
    4.4.4 Estimativa de Erros de Generalização - 212
    4.4.5 Lidando com Over?tting na Indução de Árvores de Decisão - 218
    4.5 Avaliando o Desempenho de um Classificador - 220
    4.5.1 Método Holdout - 221
    4.5.2 Sub-Amostragem Aleatória - 222
    4.5.3 Validação Cruzada - 222
    4.5.4 Bootstrap - 223
    4.6 Métodos para Comparar Classificadores - 224
    4.6.1 Avaliando um Intervalo de Con?ança Quanto a Precisão - 224
    4.6.2 Comparando o Desempenho de Dois Modelos - 226
    4.6.3 Comparando o Desempenho de Dois Classificadores - 228
    4.7 Notas Bibliográficas - 229
    4.8 Exercícios - 235

    5 CLASSIFICAÇÃO: TÉCNICAS ALTERNATIVAS - 245
    5.1 Classificador Baseado em Regras - 245
    5.1.1 Como um Classificador Baseado em Regras Funciona - 248
    5.1.2 Esquemas de Ordenação de Regras - 250
    5.1.3 Como Construir um Classificador Baseado em Regras - 252
    5.1.4 Métodos Diretos de Extração de Regras - 252
    5.1.5 Métodos Indiretos de Extração de Regras - 261
    5.1.6 Características de Classi?cadores Baseados em Regras - 264
    5.2 Classi?cadores de Vizinho Mais Próximo - 264
    5.2.1 Algoritmo - 266
    5.2.2 Características de Classi?cadores de Vizinho mais Próximo - 268
    5.3 Classi?cadores Bayesianos - 269
    5.3.1 O Teorema de Bayes - 270
    5.3.2 Usando o Teorema de Bayes para Classi?cação - 271
    5.3.3 O Classi?cador de Bayes Simples - 273
    5.3.5 Redes de Crenças Bayesianas - 284
    5.4 Rede Neural Artificial (ANN) - 291
    5.4.1 Perceptron - 291
    5.4.2 Rede Neural Arti?cial Multicamadas - 296
    5.4.3 Características da ANN - 302
    5.5 Support Vector Machine (SVM) - 303
    5.5.1 Hiperplanos de Margem Máxima - 303
    5.5.2 SVM Linear: Caso Separável - 306
    5.5.3 SVM Linear: Caso n„o Separável - 314
    5.5.4 SVM Não Linear - 319
    5.5.5 Características de SVM - 326
    5.6 Métodos de Grupos - 327
    5.6.1 Raciocínio do Método de Grupo - 327
    5.6.2 Métodos para Criar um Classi?cador de Grupo - 329
    5.6.3 Decomposição de Variância na Tendência - 332
    5.6.4 Bagging - 335
    5.6.5 Boosting - 338
    5.6.6 Florestas Aleatórias - 344
    5.6.7 Comparação Empírica entre Métodos de Conjunto - 349
    5.7 O Problema do Desequilíbrio de Classes - 350
    5.7.1 Métricas Alternativas - 351
    5.7.2 A Curva Característica de Operação de um Receptor - 354
    5.7.3 Aprendizagem Sensível ao Custo - 358
    5.7.4 Abordagens Baseadas em Amostragens - 362
    5.8 O Problema de Múltiplas Classes - 363
    5.9 Notas Bibliográficas - 367
    5.10 Exercícios - 375

    6 ANÁLISE ASSOCIATIVA:ALGORITMOS E CONCEITOS BÁSICOS - 389
    6.1. De?nição do Problema - 391
    6.2 Geração de Conjuntos de Itens Frequentes - 395
    6.2.1 O Princípio Apriori - 397
    6.2.2 Geração de Conjuntos de Itens Frequentes no Algoritmo Apriori - 399
    6.2.3. Geração de Candidatos e Poda - 402
    6.2.4 Contagem de Suporte - 407
    6.2.5 Complexidade Computacional - 411
    6.3 Geração de Regras - 416
    6.3.1 Poda Baseada em Con?ança - 416
    6.3.2 Geração de Regras no Algoritmo Apriori - 417
    6.3.3 Um Exemplo: Registros de Votos em Congresso - 419
    6.4 Representação Compacta de Conjuntos de Itens Frequentes - 421
    6.4.1 Conjuntos Máximos de Itens Frequentes - 422
    6.4.2 Conjuntos Fechados de Itens Frequentes - 423
    6.5 Métodos Alternativos para Geração de Conjuntos de Itens Frequentes - 428
    6.6 Algoritmo FP-Grow - 433
    6.6.1 Representação Árvore FP - 434
    6.6.2 Geração de Conjuntos de Itens Frequentes no Algoritmo FP-Growth - 437
    6.7 Avaliação dos Padrões de Associação - 442
    6.7.1 Medidas Objetivas de Interesse - 443
    6.7.2 Medidas Além de Pares de Variáveis Binárias - 456
    6.7.3 Paradoxo de Simpson - 458
    6.8 Efeito da Distribuição Irregular do Suporte - 460
    6.9 Notas Bibliográ?cas - 465
    6.10 Exercícios - 481

    7 ANÁLISE DE ASSOCIA«ÃO: CONCEITOS AVAN«ADOS - 495
    7.1 Lidando com Atributos Categorizados - 495
    7.2.1 Métodos Baseados em Discretização - 499
    7.2.2 Métodos Baseados em Estatísticas - 504
    7.2.3 Métodos sem Discretização - 506
    7.3 Lidando com uma Hierarquia de Conceitos - 509
    7.4 Padrões Sequenciais - 512
    7.4.1 Formulação de Problemas - 512
    7.4.1 Descoberta de Padrões Sequenciais - 515
    7.4.3 Restrições de Tempo - 520
    7.4.4 Esquemas Alternativos de Contagem - 524
    7.5 Padrões de Subgrafos - 527
    7.5.1 Grafos e Subgrafos - 528
    7.5.2 Mineração de Subgrafos Frequentes - 530
    7.5.3 Método do tipo Apriori - 533
    7.5.4 Geração de Candidatas - 534
    7.5.5 Poda de Candidatos - 541
    7.5.6 Contagem de Suporte - 544
    7.6 Padrões Infrequentes - 545
    7.6.1 Padrões Negativos - 546
    7.6.2 Padrões Correlacionados Negativamente - 546
    7.6.3 Comparações Entre Padrões Infrequentes, Padrões Negativis e Padrões Correlacionados Negativamente - 548
    7.6.4 Técnicas para Minerar Padrões Infrequentes Interessantes - 550
    7.6.5 Técnicas Baseadas em Mineração de Padrões Negativos - 552
    7.6.6 Técnicas Baseadas em Expectativa de Suporte - 554
    7.7 Notas Bibliográ?cas - 559
    7.8 Exercícios - 564

    8 ANÁLISE DE GRUPOS: CONCEITOS BÁSICOS E ALGORITMOS - 581
    8.1 Visão Geral - 584
    8.1.1 O Que É Análise de Grupos? - 585
    8.1.2 Diferentes Tipos de Grupos - 586
    8.1.3 Diferentes Tipos de Agrupamentos - 589
    8.2 K-means - 593
    8.2.1 O Algoritmo K-means Básico - 593
    8.2.2 K-means: Questões Adicionais - 603
    8.2.3 Dividindo K-means - 606
    8.2.4 K-means e Diferentes Tipos de Grupos - 608
    8.2.5 Pontos Fortes e Fracos - 609
    8.2.6 K-means como um Problema de Otimização - 611
    8.3 Agrupamento Hierárquico Aglomerativo - 614
    8.3.1 Algoritmo de Agrupamento Hierárquico Aglomerativo Básico - 615
    8.3.2 Técnicas Específicas - 618
    8.3.3 A Fórmula Lance-Williams para Proximidade de Grupos - 623
    8.3.4 Questões Chave no Agrupamento Hierárquico - 624
    8.3.5 Pontos Fortes e Fracos - 626
    8.4 DBSCAN - 626
    8.4.1 Densidade Tradicional: Abordagem Baseada em Centro - 627
    8.4.2 O Algoritmo DBSCAN - 628
    8.4.3 Pontos Fortes e Fracos - 632
    8.5 Avaliação de Grupos - 634
    8.5.1 Visão Geral - 635
    8.5.2 Avaliação de Grupos não Supervisionados Usando Coesão e Separação - 637
    8.5.3 Avaliação de Grupos não Supervisionada Usando a Matriz de Proximidade - 645
    8.5.4 Avaliação Não Supervisionada de Agrupamentos Hierárquicos - 648
    8.5.6 Tendência de Agrupamento - 651
    8.5.7 Medidas Supervisionadas de Validade de Grupos - 652
    8.5.8 Avaliando a Significância de Medidas de Validade de Grupos - 658
    8.6 Notas Bibliográficas - 660
    8.7 Exercícios - 665

    9 ANÁLISE DE GRUPOS: QUEST’ES ADICIONAIS E ALGORITMOS - 677
    9.1 Características de Dados, Grupos e Algoritmos de Agrupamento - 678
    9.1.1 Exemplo: Comparando K-means com DBSCAN - 678
    9.1.2 Características de Dados - 680
    9.1.3 Características de Grupos - 682
    9.1.4 Características Gerais de Algoritmos de Agrupamento - 684
    9.2 Agrupamentos Baseados em Protótipos - 686
    9.2.1 Agrupamento Difuso - 688
    9.2.2 Agrupamentos Usando Modelos de Mistura - 694
    9.2.3 Mapas Auto-Organizados (SOM) - 707
    9.3 Agrupamentos Baseados em Densidade - 714
    9.3.1 Agrupamentos Baseados em Grades - 715
    9.3.2 Agrupamento de Subespaços - 719
    9.3.3 DENCLUE: Um Esquema Baseada no Núcleo para Agrupamentos Baseados em Densidade - 724
    9.4 Agrupamento Baseado em Grafos - 729
    9.4.1 Dispersão - 730
    9.4.2 Agrupamento de Árvore de Dispersão Mínima (MST) - 732
    9.4.3 OPOSSUM: Particionamento Ótimo de Semelhanças Usando METIS - 733
    9.4.4 Chameleon: Agrupamento Hierárquico com Modelagem Dinâmica - 734
    9.4.5 Semelhança de Vizinhos Compartilhados Mais Próximos - 742
    9.4.6 O Algoritmo de Agrupamento de Jarvis-Patrick - 746
    9.4.7 Densidade SNN - 748
    9.4.8 Agrupamento Baseado em Densidade SNN - 749
    9.5 Algoritmos de Agrupamento Escalável - 752
    9.5.1 Escalabilidade: Abordagens e Questões Gerais - 752
    9.5.2 BIRCH - 756
    9.5.3 CURE - 758
    9.6 Qual Algoritmo de Agrupamento? - 763
    9.7 Notas Bibliográ?cas - 767
    9.8 Exercícios - 773

    10 DETECÇÃO DE ANOMALIAS - 777
    10.1 Preliminares - 779
    10.1.1 Causas de Anomalias - 779
    10.1.2 Abordagens para a Detecção de Anomalias - 781
    10.1.3 O Uso de Rótulos de Classes - 782
    10.1.4 Questões - 783
    10.2 Abordagens Estatísticas - 786
    10.2.1 Detectar Elementos Estranhos em uma Distribuição Normal Univariada - 787
    10.2.2 Elementos Estranhos em uma Distribuição Normal Multivariável - 789
    10.2.3 Uma Abordagem de Mistura de Modelos para Detecção de Anomalias - 791
    10.2.4 Pontos Fortes e Fracos - 794
    10.3 Detecção de Elementos Estranhos Baseada em Proximidade - 794
    10.3.1 Pontos Fortes e Fracos - 795
    10.4 Detecção de Elementos Estranhos Baseada em Densidade - 797
    10.4.1 Detecção de Elementos Estranhos Usando Densidade Relativa - 798
    10.4.2 Pontos Fortes e Fracos - 800
    10.5 Técnicas Baseadas em Agrupamento - 801
    10.5.1 Avaliando a Extensão na Qual um Objeto Pertence a um Grupo - 802
    10.5.2 Impacto dos Elementos Estranhos sobre o Agrupamento Inicial - 804
    10.5.3 O N?mero de Grupos a Usar - 805
    10.5.4 Pontos Fortes e Fracos - 805
    10.6 Notas Bibliográ?cas - 806
    10.7 Exercícios - 813

    A ÁLGEBRA LINEAR - 819
    A.1 Vetores - 819
    A.1.1 De?nição - 819
    A.1.2 Adição de Vetores e Multiplicação por um Escalar - 820
    A.1.3 Espaços de Vetores - 821
    A.1.4 O Produto de Ponto, Ortogonalidade e Projeções Ortogonais - 822
    A.1.5 Vetores e Análise de Dados - 824
    A.2 Matrizes - 826
    A.2.1 Matrizes: De?nições - 826
    A.2.2 Matrizes: Adição e Multiplicação por um Escalar - 827
    A.2.3 Matrizes: Multiplicação - 829
    A.2.4 Transformações Lineares e Matrizes Inversas - 830
    A.2.5 Eigenvalue e Decomposição de Valor Singular - 833
    A.2.6 Matrizes e Análises de Dados - 835
    A.3 Notas Bibliográ?cas - 837

    B REDUÇÃO DA DIMENSIONALIDADE - 839
    B.1 PCA e SVD - 839
    B.1.1 Análise dos Componentes Principais (PCA) - 840
    B.1.2 SVD - 845
    B.2 Outras Técnicas de Redução de Dimensionalidade - 848
    B.2.1 Análise de Fatores - 848
    B.2.2 Locally Linear Embedding (LLE) - 850
    B.2.3 Escala Multidimensional, FastMap e ISOMAP - 852
    B.2.4 Questões Comuns - 856
    B.3 Notas Bibliográ?cas - 857

    C PROBABILIDADE E ESTATÕSTICA - 861
    C.1 Probabilidade - 861
    C.1.1 Valores Esperados - 864
    C.2 Estatística - 866
    C.2.1 Avaliação de Ponto - 866
    C.2.2 Teorema do Limite Central - 867
    C.2.3 Avaliação de Intervalo - 868
    C.3 Teste de Hipóteses - 869

    D REGRESSÃO - 873
    D.1 Preâmbulo - 873
    D.2 Regressão Linear Simples - 874
    D.2.1 Método de Menos Quadrados - 875
    D.2.2 Analisando Erros de Regressão - 878
    D.2.3 Analisando a Qualidade do Ajuste - 880
    D.3 Regressão Liner Multivariável .881
    D.4 Métodos de Regressão Alternativos ao de Menos Quadrados - 882

    E OTIMIZAÇÃO - 885
    E.1 Otimização sem Restrições - 885
    E.1.1 Métodos Numéricos - 889
    E.2 Otimização com Restrições - 892
    E.2.1 Restrições de Igualdade - 893
    E.2.2 Restrições de Desigualdade - 894
    ÍNDICE REMISSIVO - 897

    Informações Técnicas

    Nº de páginas:978
    Origem:Nacional
    Editora:Editora Ciência Moderna
    Idioma:Português
    Edição:1ª Edição
    Ano:2009
    ISBN:9788573937619
    Encadernação:Brochura
    Autor:Pang-Ning Tan, Michael Steinbach, Vipin Kumar
  • Informações

Avaliação técnica sobre o livro

Olá! Seja Bem Vindo (a)!

Eu sou o Moderninho , o Mascote da Ciência Moderna Online!
Além de bonito, o novo site tem Minhas Dicas :) #ficaadica

A 1ª Dica é -> Deixe aqui seu contato para receber nossas
NOVIDADES, PROMOÇÕES E CUPONS DE DESCONTOS ;)

Navegue SEM Moderação!