Bootcamp

Automatiser le nettoyage des données en Python

Data Wrangling with Python Bootcamp à la demande gratuit

La programmation en Python est l'un des outils les plus performants et les plus utilisés par les data scientist aujourd'hui. Ce cours à la demande, enregistré, abordera la manière de profiter des capacités de Python pour manipuler et explorer les données. À la fin de ce programme, les participants seront en mesure de présenter des cas d'utilisation de Python, d'automatiser des processus de données complexes et de nettoyer les données pour l'analyse.

Soyez prêts d'apprendre et lancez-vous dans 4 sessions de formation interactive sur Python proposées par Skillsoft & Data Society.

Lorsque vous aurez terminé, vous serez en mesure de:

  • Identifier ce qu'est la science des données et pourquoi elle est importante
  • Programmer avec succès en Python
  • Automatiser le nettoyage et le traitement des données
  • Comprendre les Pandas et NumPy pour l'exploration des données
  • Et plus encore!

Outline:

Première session

  1. Programming across industries and core functions of data scientists
  2. Cas d'utilisation de la science des données pour Python
  3. Fonctions en Python
  4. Introduction à NumPy

Deuxième session

  1. Réseaux : filtrage et remodelage
  2. Travailler avec les pandas
  3. Opérations de base sur les séries

Troisième session

  1. Trames de données et opérations de base
  2. Chargement de données en Python à l'aide de Pandas

Quatrième session

  1. Résumer les données à l'aide de Pandas
  2. Remodelage des données à l'aide de Pandas.

Préparation et enregistrements:

Pour compléter et vous aider à préparer le Bootcamp, tous les inscrits bénéficient d'un accès gratuit pendant 60 jours à Percipio, y compris...

    • Séances de Bootcamp enregistrées
    • 8+ Virtual Practice Labs couvrant Data Wrangling with Python, Machine Learning et plus encore
    • Les laboratoires offrent un accès préinstallé à plusieurs outils couramment utilisés en science des données, notamment Microsoft Excel 2016, Visual Studio Code, Anaconda, Jupyter Notebook + JupyterHub, Pandas, NumPy, SiPy, Seaborn Library et Spyder IDE.
    • Plus de 7 000 cours techniques à la demande dans Percipio. 
    • Des livres et des livres audio sur la data science et l'apprentissage automatique, leaders sur le marché

Pré-requis :

  • Un ordinateur portable Anaconda et Jupyter sera nécessaire. Vous aurez accès aux deux par le biais des laboratoires d'entraînement virtuels de Percipio lors de votre inscription.
  • Les participants doivent être familiarisés avec la programmation Python et être capables d'exécuter des fonctions telles que :
  1. Variables: defining, swapping, printing and deleting variables
  2. Principaux types de données : chiffres, logiques, chaînes de caractères
  3. Structures de data de base : listes, ensembles, dictionnaires, tuples
  4. Structures de flux de contrôle et code modulaire
  5. Conditional statements
  6. “For” loops et compréhension des listes
  7. “While” loops et break/continue statements


Martin Skarzynski

Martin Skarzynski aime utiliser les langages de programmation Python et R et les Command Line Tools pour explorer, analyser, visualiser et présenter des données. Il est convaincu que toute personne, quelle que soit son origine, peut apprendre et tirer profit de ses compétences techniques. Martin Skarzynski est titulaire d'une maîtrise en méthodes épidémiologiques et biostatistiques pour la santé publique et la recherche clinique et d'un certificat en science des données de l'université Johns Hopkins. Il est également titulaire d'un doctorat en biologie des tumeurs de l'université de Georgetown, d'un master en biotechnologie de l'université Jagiellonian en Pologne et d'une licence en biologie du St. Mary's College of Maryland.

Data Society est une société de formation et de conseil en analyse basée à Washington, D.C., qui propose une formation en sciences des données aux cadres et aux data scientists afin d'éliminer les lacunes en matière de communication, d'améliorer la qualité des données et d'accroître l'efficacité grâce à une prise de décision fondée sur les données.

Parmi ses clients figurent la NASA, Discover, Amtrak, CapitalOne, l'armée de l'air américaine, l'armée de terre américaine, le département d'État américain et bien d'autres encore.

Return to Resources