Big Data : Apache Spark

Le logiciel Big Data de demain !
big data
13
Mar
Certifiant
Durée estimée de 22 heures
Niveau Avancé
Thématique Big data
Apache Spark est un moteur de traitement de données dédié au Big Data. Il permet de réaliser un traitement de larges de données de manière distribuée (cluster computing). Très populaire, ce Framework est en passe de remplacer Hadoop. Il est reconnu pour sa vitesse, sa simplicité d’usage, et sa polyvalence.
Afficher la description entière
Objectifs
  • Objectif du framework et cas d’utilisation
  • Histoire du framework
  • Proximité avec Hadoop et comparaison
  • Les différents modules de Spark
  • Intégration dans l’écosystème
  • Initiation au MapReduce
Savoirs
  • Lorem ipsum dolor sit amet sit amet
  • Lorem ipsum dolor sit amet
  • Lorem ipsum dolor sit amet sit amet
  • Lorem ipsum dolor sit amet
  • Lorem ipsum dolor sit amet
Pré-requis
  • Connaissances de base en programmation ou en scripting (Python/Scala)
  • Expérience basique en ligne de commande
  • Connaissances de base sur Hadoop
  • Connaissances en SQL et conception d'application temps réel utiles mais non obligatoire

Programme

Total learning: 14 lessons / 3 quizzes Time: 22 heures
  • Big Data : Apache Spark
    Big Data : Introduction  Dans ce module d'introduction, nous allons tout d'abord définir ce concept, et en évoquer les grands principes de base.Nous évoquerons alors quels peuvent être les usages réels dans notre vie, que l'on en soit d'ailleurs conscients, ou non, acteurs, ou bien tributaires. Ce module évoquera aussi, au global les technologies principales à mettre en oeuvre pour installer pleinement un système BigData.
    0 vues
    Débutant
    Détails du cours
    0/1

    • 1
      Introduction Générale Lancer la démo
    • 2
      Introduction au module Lancer la démo
    • 3
      Définition et principes de base Lancer la démo
    • 4
      Usages, champs d’application, et impacts Lancer la démo
    • 5
      Les technologies du Big Data Lancer la démo
    • Questions 0 question10 min
  • Big Data : Apache Spark
    Introduction à l'architecture et à l'infrastructure  Dans ce module, nous allons voir ensemble les concepts de base des principales typologies d'infrastructures et d'architectures mise en œuvre. il faut bien avoir à l'esprit qu'il n'existe pas une architecture type, mais bien un ensemble de solutions fournies par les éditeurs, et correspondant à des besoins variés.
    0 vues
    Intermédiaire
    Détails du cours
    0/1

    • 1
      Introduction au module
    • 2
      Infrastructure Cloud Lancer la démo
    • 3
      Architecture Xaas Lancer la démo
    • 4
      Architecture technique Lancer la démo
    • 5
      Architecture distribuée Lancer la démo
    • Questions 0 question10 min
  • Big Data : Apache Spark
    Panorama des outils Big Data 
    0 vues
    Débutant
    Détails du cours
    0/5

    • 1
      Les fonctionnalités recherchées
    • 2
      Les différents types d’outils
    • 3
      Overview des outils Big Data
    • 4
      Les bases de données NoSQL
    • Questions 0 question10 min
  • Big Data : Apache Spark
    Analyse de données avec Apache Spark 
    0 vues
    Détails du cours
    0/0

    • No items in this section

  • Certifiant Big Data : Apache Spark
  • Big Data : Introduction

     

    90% des données dans le monde ont été créées au cours des deux dernières années. Les outils de Big Data permettent de les sauvegarder, de les analyser et de les traiter pour proposer des solutions business aux entreprises.

     

    Panorama des outils Big Data

     

    De nouvelles opportunités économiques pour les entreprises ont émergées grâce au Big Data. La possibilité d’analyser ces quantités de données représente un avantage non négligeable en termes de performance, sans oublier les métiers 2.0 qui ont été créer  comme celui de Data Scientist. Toute la chaîne du décisionnel est impactée par ces « big data », de la collecte des données à leur analyse et leur visualisation, en peu de temps.

     

    Analyse de données avec Apache Spark

     

    Spark présente plusieurs avantages par rapport aux autres technologies big data et MapReduce comme Hadoop et Storm. D’abord, Spark propose un framework complet et unifié pour répondre aux besoins de traitements Big Data pour divers jeux de données, divers par leur nature (texte, graphe, etc.) aussi bien que par le type de source (batch ou flux temps-réel). Ensuite, Spark permet à des applications sur clusters Hadoop d’être exécutées jusqu’à 100 fois plus vite en mémoire, 10 fois plus vite sur disque. Il vous permet d’écrire rapidement des applications en Java, Scala ou Python et inclut un jeu de plus de 80 opérateurs haut-niveau. De plus, il est possible de l’utiliser de façon interactive pour requêter les données depuis un shell.

     

    Refermer la description

    Avis clients

    4.8/5
    (5 avis)
      5/5
      Génial méthode pour apprendre de chez sois
      Génial méthode pour apprendre de chez sois, les cours sont supers !!
      5/5
      c'est très bien fait.
      On y apprend vraiment beaucoup. Je n'aurai pas penser qu'il y aurait eu autant d'infos, c'est très bien fait.
      4/5
      Parfait
      C'est parfait et très bien expliqué
      5/5
      J'ai appris enormement
      J'ai appris enormement grace a ce cours un grand merci pour se partage :)
      5/5
      Cours très bien structuré
      Cours très bien structuré permettant une bonne compréhension. Très bonne préparation à la certification !!

    Ecrire un avis

    Big Data : Apache Spark
    S'ABONNER
    Certifiant
    Niveau Avancé
    22 heures
    0 vues
    Accès illimité
    14 vidéos
    14 modules
    Parcours Big Data : Apache Spark
    Big Data : Apache Spark Big Data : Apache Spark
    Introduction Générale Introduction Générale
    Introduction au module Introduction au module
    Définition et principes de base Définition et principes de base
    Usages, champs d’application, et impacts Usages, champs d’application, et impacts
    Les technologies du Big Data Les technologies du Big Data
    Infrastructure Cloud Infrastructure Cloud
    Architecture Xaas Architecture Xaas
    Architecture technique Architecture technique
    Architecture distribuée Architecture distribuée
    Vous êtes une entreprise et vous souhaitez faire
    monter en compétences vos collaborateurs ?
    2,500 €
    (0 vote)
    Gestion de projet
    Certification CAPM®
    50 heures
    Gestion de projet
    La professionnalisation et la reconnaissance des pratiques projet constituent un enjeu majeur des entreprises, en particulier dans le cas d’une relation client/fournisseur. Que vous cherchiez à faire reconnaître vos pratiques, développer vos connaissances des outils de pilotage ou des processus projet, cette formation vous permettra d’acquérir les bonnes pratiques reconnues et de vous préparer à la certification Certified Associate in Project Management (CAPM) © du PMI©.
    Certification CAPM®
    50 heures
    Intermédiaire
    (0 vote)
    2,500 €
    2,500 €
    (0 vote)
    Agile
    Certification Project Management Practitioner AgilePM®
    55 heures
    Agile
    Dans un contexte de plus en plus concurrentiel caractérisé par l’évolution du besoin (nouveaux services, nouvelles fonctionnalités…), les méthodes Agiles révolutionnent la gestion de projet et apportent des réponses claires aux enjeux actuels. Elles sont de plus en plus utilisées et les personnes capables d’évoluer, d’optimiser ou de déployer un cadre de travail agile sont aujourd’hui très recherchées. Cette formation vous donnera toutes les connaissances nécessaires pour maîtriser scrum avec un double objectif à l’issue de la formation : Faire de vous un collaborateur pleinement opérationnel pour le travail en mode agile Vous préparer dans les meilleures conditions au passage de la certification Project Management Practitioner AgilePM® La certification Project Management Practitioner AgilePM® est très valorisée sur le marché du travail et l’avoir est une garantie de pouvoir vous positionner plus facilement sur les postes qui évoluent dans un contexte agile.
    Certification Project Management Practitioner AgilePM®
    55 heures
    Débutant
    (0 vote)
    2,500 €
    1,999 €
    (0 vote)
    Gestion de projet
    Certificat de conseil en organisation et en management du changement
    60 heures
    Gestion de projet
    Dans le contexte actuel où la digitalisation des entreprises, quel que soit leur domaine d’activité, est en enjeu concurrentiel critique, maîtriser sa transition digitale est une des clés de réussite des entreprises actuelles et de demain.
    Certificat de conseil en organisation et en management du changement
    60 heures
    Débutant
    (0 vote)
    1,999 €
    1,999 €
    (5 votes)
    IT management
    PRINCE2® Foundation et Practitioner
    40 heures
    IT management
    PRINCE2® (PRojet IN Controlled Environments) est une méthode de gestion de projet structurée basée sur les bonnes pratiques. Cette méthode normée s’appuie sur 3 axes principaux : La Gestion, l’Organisation et le Contrôle du projet. PRINCE2 propose une approche très structurante depuis l’initialisation jusqu’à la clôture du projet. La double certification PRINCE2® Foundation et Practitioner démontre compréhension théorique de la méthode ainsi qu’une capacité à appliquer la méthode PRINCE2 dans un contexte projet exigeant.
    PRINCE2® Foundation et Practitioner
    40 heures
    Intermédiaire
    (5 votes)
    1,999 €
    1,999 €
    (6 votes)
    Big data
    Certification Exin CCC Big Data Foundation
    50 heures
    Big data
    Le Chef de projet est un acteur essentiel de la réussite de tout projet. Véritable chef d'orchestre il doit proposer une stratégie gagnante et livrer un produit à haute valeur ajoutée. Aussi à l'aise sur l'aspect méthodologique que sur la gestion du facteur humain, le Chef de Projet a une vision à la fois macro et micro du projet. La spécialité Big Data répond aux collaborateurs en charges des projets informatiques dans les environnements Big Data et qui souhaitent avoir les compétences et connaissances pour maîtriser le pilotage de ces projets.
    Certification Exin CCC Big Data Foundation
    50 heures
    Intermédiaire
    (6 votes)
    1,999 €

    Nous travaillons avec les startups les plus innovantes dans leur domaine.



    Nous nous engageons à vous apporter des formations de qualité référencées.

    Une question ? Vous souhaitez vous lancer ?
    N’hésitez pas à nous contacter