Un guide pratique pour packager un projet Python
Un tour d'horizon pratique du packaging Python : organisation du projet, pyproject.toml, publication sur PyPI, tests avec pytest, documentation avec Sphinx et CI/CD avec GitHub...
Lire la suite →Pipelines ETL, traitement de données, infrastructure, analyse, visualisation et découverte d'insights
Un tour d'horizon pratique du packaging Python : organisation du projet, pyproject.toml, publication sur PyPI, tests avec pytest, documentation avec Sphinx et CI/CD avec GitHub...
Lire la suite →
Après des années de construction de plateformes ML internes, nous avons migré vers Databricks en décembre 2024. Ce manuel partage des astuces et conseils pratiques...
Lire la suite →
J'ai récemment décidé d'expérimenter avec des conteneurs Docker pour construire des applications autonomes afin d'optimiser le flux d'opération de mes différents pipelines de données/scraper. J'ai...
Lire la suite →
Récemment, j'ai entendu parler d'un package développé par Facebook research (META research !?) appelé KATS, publié par l'équipe Infrastructure Data Science de Facebook fin de...
Lire la suite →
Bonjour, dans cet article, je vais vous faire un rapide tour d'un projet que j'ai récemment ressuscité pour collecter les données en ligne de l'élection...
Lire la suite →
Bonjour lecteurs, je voulais depuis longtemps écrire un article sur un service AWS que j'utilise dans mon travail quotidien appelé EMR. Ce service permet de...
Lire la suite →
Cet article fera partie de ma plongée annuelle en R ; l'idée sera d'utiliser deux bibliothèques R en prévision de séries temporelles et inférence causale....
Lire la suite →
Dans cet article, je vais présenter un pipeline que j'ai construit il y a quelques semaines pour collecter des données (texte et images) du site...
Lire la suite →
Bonjour, dans cet article, je vais détailler un jeu de données que j'ai construit il y a quelques semaines sur le jeu Hearthstone.
Lire la suite →
Pour cet article, je vais commencer l'analyse des données extraites avec le pipeline expliqué dans cet article. L'objectif de cet article est de:
Lire la suite →
J'ai démarré ce projet en écho à la compétition Kaggle liée à PUBG, où l'objectif était de prédire le classement du joueur dans la partie,...
Lire la suite →
Apprenez à créer un système de web scraping pour collecter et analyser les données du Crossfit Open, incluant les profils d'athlètes, les informations sur les...
Lire la suite →
Apprenez à créer un tableau de bord interactif en utilisant Dash (Plotly) pour visualiser des données personnelles de fitness et de santé provenant d'appareils Nokia,...
Lire la suite →
Bonjour, l'objectif de cet article est d'offrir une description claire de l'ensemble de données que j'ai téléchargé en novembre 2017 sur Kaggle, suivi de quelques...
Lire la suite →
Bonjour lecteurs, pour cet article je vais expliquer mon approche pour créer un système de prévision de la consommation énergétique française (métropolitaine). Ce type de...
Lire la suite →
Bonjour lecteur, dans cet article je vais expliquer mon approche pour déployer un chatbot en Python sur la plateforme Messenger.
Lire la suite →