Analítica de dados com Hadoop - Uma introdução para cientistas de dados

Pronto para usar técnicas estatísticas e de aprendizado de máquina (machine learning) em grandes conjuntos de dados? Este guia prático mostra por que o ecossistema do Hadoop é perfeito para essa tarefa. Em vez de ter como foco a implantação, as operações ou o desenvolvimento de softwares geralmente associados à computação distribuída, você se concentrará nas análises particulares que poderá fazer, nas técnicas de armazém de dados (data warehousing) oferecidas pelo Hadoop e em fluxos de trabalho de alta ordem que esse framework é capaz de gerar.

De: R$ 95,00Por: R$ 69,90

Preço a vista: R$ 69,90

Economia de R$ 25,10

+-
Comprar
Opções de Parcelamento:
  • à vista R$ 69,90
Outras formas de pagamento

Quem viu este produto , comprou

  • Pense em Python - Pense como um cientista da computação

    Se você quer aprender como programar, usar Python é uma ótima forma de começar. Este guia prático apresenta a linguagem passo a passo, começando com conceitos de programação básicos antes de chegar a funções, recursividade, estruturas de dados e design orientado a objeto. Esta edição e seu código de apoio foram atualizados para o Python 3. ... Ler mais +

    QUERO VER
  • 13 Ferramentas para Controle, Monitoramento e Defesa de Redes de Dados

    Este livro a princípio tentou dividir em tipos de serviços, mas você verá que por vezes uma ferramenta trabalha de forma mais completa se instalada em conjunto com outra, ou mesmo uma ferramenta pode fazer serviço de várias outras, sendo assim teremos treze capítulos que tentei fechar com o máximo de detalhes para facilitar a implementação no seu dia a dia. ... Ler mais +

    QUERO VER
  • Analítica de dados com Hadoop - Uma introdução para cientistas de dados

    Pronto para usar técnicas estatísticas e de aprendizado de máquina (machine learning) em grandes conjuntos de dados? Este guia prático mostra por que o ecossistema do Hadoop é perfeito para essa tarefa. Em vez de ter como foco a implantação, as operações ou o desenvolvimento de softwares geralmente associados à computação distribuída, você se concentrará nas análises particulares que poderá fazer, nas técnicas de armazém de dados (data warehousing) oferecidas pelo Hadoop e em fluxos de trabalho de alta ordem que esse framework é capaz de gerar. ... Ler mais +

    QUERO VER
  • mongoDB - Uma Abordagem Prática

    Sem dúvida, uma abordagem mais do que prática! O leitor poderá aplicar por meio de exemplos, utilizando uma das versões (2.x.x) estáveis do MongoDB, as principais funcionalidades que esse banco de dados não relacional oferece.
    Tópicos como: manipulação (inserção, alteração, exclusão e consultas) de documentos, agreggation (consultas complexas) framework, replicação e escalabilidade de dados serão demonstrados de forma objetiva e principalmente prática. Também, será desenvolvida uma aplicação Java para web com tolerância a falhas, passo a passo, além de mostrar funcionalidades avançadas de conversão de Replica Set em Replica Sharding Cluster. Por fim, o leitor aprenderá a integrar o MongoDB ao iReport e ao Java para a geração de relatórios em PDF. ... Ler mais +

    QUERO VER
  • Gamification em Help Desk e Service Desk - Promovendo engajamento e motivação no século 21 em centros de suporte, Help Desk e Service Desk

    Aprenda a usar a jornada do herói, emblemas, pontos, rankings, avatares, moedas virtuais e um completo arsenal para chegar lá. Conheça também o conceito de fluxo; os mecanismos de onboarding e scaffolding; as diferenças entre serious games, teoria dos jogos, videogames e Gamification; motivação intrínseca e extrínseca e muito mais ... Ler mais +

    QUERO VER
  • Pentest em aplicações web

    VITRINE Os Livros mais Vendidos !

    Aplicações web têm um histórico extenso de vulnerabilidades, que têm sido exploradas pelos hackers. A lista de ataques conhecidos é extensa, envolvendo Cross-site Scripting, SQL Injection, unrestricted file upload, Code Injection, Command Injecion, Remote/Local File Inclusion e Cross-site Request Forgery, somente para citar alguns. ... Ler mais +

    QUERO VER

Quem viu este produto , também se interessou

  • Pense em Python - Pense como um cientista da computação

    Se você quer aprender como programar, usar Python é uma ótima forma de começar. Este guia prático apresenta a linguagem passo a passo, começando com conceitos de programação básicos antes de chegar a funções, recursividade, estruturas de dados e design orientado a objeto. Esta edição e seu código de apoio foram atualizados para o Python 3. ... Ler mais +

    QUERO VER
  • Introdução à Ciência de Dados - Mineração de dados e Big Data

    Esta obra está dividida em duas grandes partes: A primeira parte é uma introdução ao mundo da Ciência de Dados e Big Data, abordando questões que envolvem os modelos pré-relacionais, relacionais e pós-relacionais, como NoSQL, processos de transformação de dados, armazenamento analítico, como o Data Warehouse, e HDFS, sem deixar de tratar de maneira clara a Mineração de Dados e outras técnicas analíticas. A segunda parte é prática, onde o leitor pode implementar os conceitos estudados, desenvolvendo diversas técnicas de análise de dados como Classificação, Agrupamentos, Lei de Benford, entre outras. ... Ler mais +

    QUERO VER
  • Análise Multivariada com o Uso do SPSS

    São poucos os modelos da vida real que podem ser explicados com propriedade por meio de uma única variável. Os fenômenos sociais, a exemplo do modo como ocorrem as decisões dos consumidores ou os eventos que influenciam o comportamento dos mercados, apenas podem ser interpretados por meio de diversas variáveis, cujos relacionamentos ocorrem de maneira complexa. Este livro apresenta técnicas essenciais no tratamento de ambientes multivariados, as quais são largamente utilizadas por pesquisadores e especialistas que atuam em institutos de pesquisa e universidades. .. ... Ler mais +

    QUERO VER
  • Python RAD (Rapid Application Development) Aplicações para Web e Desktop

    Além da abordagem essencial da linguagem Python, serão demonstrados exemplos passo a passo do desenvolvimento de módulos/telas para aplicações desktop, bem como exemplos e o desenvolvimento de uma aplicação completa de upload com banco de dados (PostgreSQL) para web. ... Ler mais +

    QUERO VER
  • Python para análise de dados: Tratamento de dados com Pandas, NumPy e IPython

    VITRINE Os Livros mais Vendidos !

    Obtenha instruções completas para manipular, processar, limpar e extrair informações de conjuntos de dados em Python. Atualizada para Python 3.6, este guia prático está repleto de casos de estudo práticos que mostram como resolver um amplo conjunto de problemas de análise de dados de forma eficiente. Você conhecerá as versões mais recentes do pandas, da NumPy, do IPython e do Jupyter no processo. ... Ler mais +

    QUERO VER
  • Aprendendo Node - Usando JavaScript no servidor

    Reúna o conhecimento de programação que você já usa no navegador e empregue no servidor com o Node! Aprenda a criar aplicações em rede de alto desempenho e plenamente escalonáveis nesta plataforma baseada em JavaScript. O conteúdo deste livro é bastante prático, “mão na massa”, e fará com que o programador de JavaScript, acostumado a lidar apenas com processamento no navegador, domine com maestria os fundamentos do Node no servidor. ... Ler mais +

    QUERO VER
  • Expressões Regulares Cookbook

    Este livro oferece mais de 100 receitas que vão ajudá-lo a manipular dados e textos usando expressões regulares. Todo programador deve entender um pouco de expressões regulares, mas aproveitá-las plenamente não é tão simples assim. Mesmo os usuários mais experientes, muitas vezes, sofrem com baixo desempenho, falsos positivos, falsos negativos ou defeitos imprevisíveis. Expressões Regulares Cookbook oferece orientação detalhada para algumas das tarefas mais comuns envolvendo essa ferramenta, com receitas para C#, Java, JavaScript, Perl, PHP, Python, Ruby e VB.NET. ... Ler mais +

    QUERO VER
  • O Algoritmo Mestre - Como a busca pelo algoritmo de machine learning definitivo recriará nosso mundo

    Se hoje o dataísmo é a filosofia em ascensão, este livro será sua bíblia. A busca pelo aprendizado universal é um dos progressos mais significativos, fascinantes e revolucionários de todos os tempos. Livro inovador, O Algoritmo Mestre é o guia essencial para qualquer pessoa que queira saber não só como a revolução ocorrerá, mas como estar na dianteira. ... Ler mais +

    QUERO VER
  • Gamification em Help Desk e Service Desk - Promovendo engajamento e motivação no século 21 em centros de suporte, Help Desk e Service Desk

    Aprenda a usar a jornada do herói, emblemas, pontos, rankings, avatares, moedas virtuais e um completo arsenal para chegar lá. Conheça também o conceito de fluxo; os mecanismos de onboarding e scaffolding; as diferenças entre serious games, teoria dos jogos, videogames e Gamification; motivação intrínseca e extrínseca e muito mais ... Ler mais +

    QUERO VER
  • Construindo uma Aplicação Web Completa com PHP e MySQL

    Este livro oferece ao leitor o conhecimento necessário para desenvolver aplicações para a internet utilizando o servidor web Apache, o servidor de banco de dados MySQL e a linguagem PHP. Com uma linguagem simples e objetiva e capítulos repletos de figuras e exercícios, a obra proporciona fácil entendimento acerca dos fundamentos de gestão de projeto, dos conceitos de HTML e do processo de instalação do Apache, MySQL e PHP no ambiente Windows. Você será capaz de desenvolver um projeto de aplicação para uma rede de hotéis, da concepção à implantação. ... Ler mais +

    QUERO VER
  • Python Cookbook - Receitas para dominar Python 3

    Se precisar de ajuda para escrever programas em Python 3 ou desejar atualizar códigos antigos que estejam em Python 2, este livro é seu passaporte para isso. Cheio de receitas práticas, escritas e testadas com Python 3.3, este cookbook único está voltado para programadores experientes de Python que querem focar em ferramentas e recursos modernos.
    Neste livro, você encontrará receitas completas para mais de uma dúzia de tópicos que abordam a parte essencial da linguagem Python, bem como tarefas comuns a uma ampla variedade de áreas de aplicação. Toda receita contém exemplos de código que podem ser utilizados imediatamente em seus projetos, juntamente com uma discussão sobre como e por que a solução funciona. ... Ler mais +

    QUERO VER
  • Joomla! para Iniciantes

    O leitor vai se deparar com os principais comandos e técnicas para se criar site usando o framework Joomla, bem como saber como hospedar seu site em um provedor on-line. Administrar usuários e conteúdos. Deixar seu site em evidência, usando técnicas de Web Marketing. ... Ler mais +

    QUERO VER
  • Data Science para Negócios - O que você precisa saber sobre mineração de dados e pensamento analítico de dados

    Este guia amplo, profundo, porém não muito técnico, apresenta a você os princípios fundamentais do Data Science e orienta-o através do “pensamento analítico” necessário para extrair conhecimento útil e valor de negócios a partir dos dados que você obtém. Ao aprender os princípios do Data Science, você compreenderá as diversas técnicas de mineração de dados usadas hoje. Mais importante ainda, esses princípios sustentam os processos e as estratégias necessárias para resolver problemas de negócios por meio das técnicas de mineração de dados. ... Ler mais +

    QUERO VER
  • NoSQL Essencial - Um Guia Conciso para o Mundo Emergente da Persistência Poliglota

    A necessidade de se lidar com volumes cada vez maiores de dados é um fator que motiva adotar uma nova classe de bancos de dados não relacionais, NoSQL. Os defensores dos bancos de dados NoSQL alegam que estes podem ser utilizados para criar sistemas com melhor desempenho, escalabilidade e mais fáceis de programar. NoSQL Essencial é uma introdução concisa, porém completa, a essa tecnologia emergente em rápida ascensão.
    Pramod J. Sadalage e Martin Fowler explicam como bancos de dados NoSQL funcionam e as formas pelas quais podem ser uma alternativa superior a um sistema tradicional de gerenciamento de banco de dados relacional. Os autores apresentam um guia rápido sobre os conceitos que você precisa conhecer para avaliar se os bancos de dados NoSQL são apropriados a suas necessidades e, se forem, quais tecnologias você deve explorar mais detalhadamente. ... Ler mais +

    QUERO VER
  • Descrição
    Analítica de dados com Hadoop - Uma introdução para cientistas de dados


    Pronto para usar técnicas estatísticas e de aprendizado de máquina (machine learning) em grandes conjuntos de dados? Este guia prático mostra por que o ecossistema do Hadoop é perfeito para essa tarefa. Em vez de ter como foco a implantação, as operações ou o desenvolvimento de softwares geralmente associados à computação distribuída, você se concentrará nas análises particulares que poderá fazer, nas técnicas de armazém de dados (data warehousing) oferecidas pelo Hadoop e em fluxos de trabalho de alta ordem que esse framework é capaz de gerar.

    Os cientistas e os analistas de dados aprenderão a usar diversas técnicas que variam da escrita de aplicações MapReduce e Spark com Python ao uso de modelagem avançada e gerenciamento de dados com Spark MLlib, Hive e HBase. Você também conhecerá os processos analíticos e os sistemas de dados disponíveis para desenvolver e conferir eficácia aos produtos de dados capazes de lidar com – e que, na verdade, exigem – quantidades enormes de dados.

    Entenda os conceitos principais do Hadoop e do processamento em cluster.
    Utilize padrões de projeto e algoritmos analíticos paralelos para criar jobs de análise de dados distribuídos.
    Adquira conhecimentos sobre gerenciamento de dados, mineração e armazém de dados em um contexto distribuído usando Apache Hive e HBase.
    Utilize Sqoop e Apache Flume para entrada de dados a partir de bancos de dados relacionais.
    Programe aplicações Hadoop e Spark complexas com Apache Pig e Spark DataFrames
    .
    Utilize técnicas de aprendizado de máquina, como classificação, clustering e filtragem colaborativa, com a MLib do Spark.
  • Sobre o Autor
  • Especificação

    Características

    Tipo de LivroLivro Físico

    Especificações

    Sobre o Autor Benjamin Bengfort

    Benjamin Bengfort é cientista de dados e trabalha para terminar seu doutorado na Universidade de Maryland, onde estuda aprendizado de máquina e computação distribuída. Programador profissional por ofício, escreve sobre uma grande variedade de assuntos, de Processamento de Linguagem Natural e ciência de dados com Python a analítica (analytics) com Hadoop e Spark.

    Jenny Kim

    Jenny Kim é engenheira sênior de big data e trabalha tanto com softwares comerciais quanto em ambientes acadêmicos. Tem experiência significativa em trabalhos com dados de larga escala, aprendizado de máquina e implementações de Hadoop em ambientes de produção e de pesquisa. Atualmente, trabalha com a equipe de Hue, na Cloudera.

    Informações Técnicas

    Nº de páginas:352
    Origem:Importado
    Editora:Editora Novatec
    Idioma:Português
    Edição:1ª Edição
    Ano:2016
    ISBN:9788575225219
    Encadernação:Brochura
    Autor:Benjamin Bengfort , Jenny Kim
  • Informações

Avaliação técnica sobre o livro

Olá! Seja Bem Vindo (a)!

Eu sou o Moderninho , o Mascote da Ciência Moderna Online!
Além de bonito, o novo site tem Minhas Dicas :) #ficaadica

A 1ª Dica é -> Deixe aqui seu contato para receber nossas
NOVIDADES, PROMOÇÕES E CUPONS DE DESCONTOS ;)

Navegue SEM Moderação!