Nach Genre filtern
Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français
Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts. Dans ce podcast IA & Data (https://datadriven101.tech/) 100% en français, Marc Sanselme reçoit des professionnels de fonctions et d’horizons variés pour nous parler de leurs aventures, leurs succès, leurs échecs, leurs espoirs, leurs techniques, leurs astuces, leurs histoires et leurs convictions. De la Business Intelligence à la Generative AI (LLM, RAG, Agents...) ou à la Computer Vision, toutes les thématiques liées à l'IA sont décortiquées épisode après épisode par Marc Sanselme et ses invités issus de la French tech et d'ailleurs. Marc Sanselme est un spécialiste en Intelligence artificielle (https://scopeo.ai/marc-sanselme/) et dirige la société Scopeo, agence d'Intelligence Artificielle (https://scopeo.ai/). Équipe : Clémence Reliat, Marie Malet, Jean-Christophe Corvisier, Marc Sanselme Hébergé par Ausha. Visitez ausha.co/fr/politique-de-confidentialite pour plus d'informations.
- 67 - Finetuner des Large Language Models - Pierre-Carl Langlais (CTO et cofondateur @ Pleias) - #61
Pierre-Carl Langlais, CTO et cofondateur de Pleias, est l'invité de l’épisode 61 de Data Driven 101.
Il nous plonge dans l'univers du fine-tuning, expliquant comment il adapte ses modèles pour des tâches spécifiques.
Cet épisode est un concentré d’astuces et d’expertise technique dans le domaine de l’entrainement de LLM.
🔑 MOTS CLÉS
Fine-tuning : Processus de personnalisation et d'adaptation des modèles de langage aux besoins spécifiques, en les entraînant pour accomplir des tâches précises.RAG (Retrieval-Augmented Generation) : Méthodologie combinant la recherche de sources fiables et la génération de texte pour offrir un contenu plus pertinent.
OCR (Reconnaissance optique de caractères): Technologie d'identification des caractères dans les documents numérisés, permettant de les convertir en texte exploitable.
Projet Albert :Initiative visant à créer une gamme de modèles IA spécialisés pour l'administration publique française, optimisant la génération de réponses fiables et documentées.
🎙 SOUTENEZ LE PODCAST
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 59 :IA dans la consultation médicale - Samuel Humeau (Lead Machine Learning @ Nabla)
Épisode 38:Stanislas Polu (Co-fondateur @ Dust) : Assistant personnel basé sur l’Intelligence Artificielle
Épisode 33 :Guillaume Lample (Co-fondateur & Chief Scientist @ Mistral AI) : Les secrets des Large Language Models
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions :
Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité
IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 09 Jun 2024 - 45min - 66 - La Data et l’IA au service du bien commun - Ronan Sy (responsable projet @ Data for Good) - #60
Ronan Sy, responsable projet chez Data for Good, est l'invité de l’épisode 60 de Data Driven 101.
Il nous plonge dans la diversité des projets traités, de la lutte contre les “carbon bombs” à la gestion des incendies de forêt en passant par la surveillance de la sur-pêche.
Ronan nous apprend que les équipes abordent ces problématiques avec des missions variées : migration des données vers le cloud, visualisation des données ou machine learning. Il nous donne ses conseils pour agir avec pragmatisme dans le cadre associatif.
🔑 MOTS CLÉS
POC (Proof of Concept) :Développement d'une solution technique expérimentale pour valider une idée avant sa mise en production complète.
Carbon Bombs : Projets d'extraction de combustibles fossiles ayant un impact significatif sur les émissions mondiales de CO2.
Carbon Bombs :Projets d'extraction de combustibles fossiles ayant un impact significatif sur les émissions mondiales de CO2.
AIS (Système d'Identification Automatique) : Système utilisé par les navires pour transmettre leur position en temps réel.
🎙 SOUTENEZ LE PODCAST
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 50:RSE, Data et greenwashing - Léa Caen (cofondatrice @ Kiosk)
Épisode 39Marie Ramon-Daré (Cheffe de projet design & innovation @ Ecolab) : L’open Data au service de la santé et de l’environnement
Épisode 31Fabrice Bonnifet (Directeur du Développement Durable @ Bouygues ) : Data et Transition énergétique
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions :
Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité
IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 02 Jun 2024 - 35min - 65 - IA dans la consultation médicale - Samuel Humeau (Lead Machine Learning @ Nabla) - #59
Samuel Humeau, Lead Machine Learning chez Nabla, est l'invité de l’épisode 59 de Data Driven 101.
Il nous explique comment Nabla vise à soulager les médecins des tâches comme la prise de notes et la synthèse de consultation.
Il nous parle des défis techniques liés à la transcription, la diarization et à la génération automatique de résumés grâce à des petits LLM finetunés.
🔑 MOTS CLÉS
Scribe Ambiant :Outil automatisé qui écoute et transcrit les échanges entre médecins et patients pour générer des documents de consultation complets.
Fine-Tuning : Optimisation spécifique de modèles d'IA pour améliorer leur performance sur des tâches précises, comme la codification médicale.
Taxonomie ICD-10: Classification internationale de maladies utilisée pour documenter les diagnostics médicaux.
Diarisation : Processus qui consiste à identifier et distinguer les différentes voix dans un enregistrement audio.
Retrieval Augmented Generation :Méthode consistant à compléter la génération de texte par des extraits spécifiques de documents sources.
🎙 SOUTENEZ LE PODCAST> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 53 :IA médicale : Cancérologie et consultation - Jean-Emmanuel Bibault (Chercheur en IA appliquée à la médecine @ l'Inserm)
Épisode 41Christophe Lanternier (Head of Data @ Ubble) : Bâtir un pionnier de la vérification de documents d’identité
Épisode 33Guillaume Lample (Co-fondateur & Chief Scientist @ Mistral AI) : Les secrets des Large Language Models
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions :
Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité
IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 26 May 2024 - 35min - 64 - État des lieux, inspections, immobillier : la place de l’IA - Sylvain Duchêne (co-fondateur & CTO @ Check & Visit) - #58
Sylvain Duchêne, co-fondateur et CTO de Check & Visit est l’invité de l’épisode 58 de Data Driven 101.
Sylvain nous plonge dans les défis de la transition numérique du secteur, en décrivant les innovations techniques qui leur permettent de standardiser et d'automatiser les inspections.
Il nous révèle aussi comment ils utilisent la computer vision et l'intelligence artificielle pour scanner les logements, tout en s'aventurant dans d'autres secteurs comme l'automobile.
🔑 MOTS CLÉS
Fine-tuning :Optimisation des modèles d'IA pour améliorer la reconnaissance et la classification des dégradations.🎙 SOUTENEZ LE PODCAST
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 54 :3D et marketing: révolutionner le visuel des marques - Hugo Borensztein (cofondateur @ OMI)
Épisode 22 :Alexandre Hannebelle ( Head of Data @ Inarix ) : La mesure de qualité grâce à l’IA
Épisode 56 :IA et Fraude documentaire - Marc de Beaucorps (CEO@ Finovox)
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions :
Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité
IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 19 May 2024 - 42min - 63 - Faire pénétrer l’IA dans un grand groupe - Bruno Daunay (AI lead @ Leonard) #57
Bruno Daunay, IA Lead chez Léonard, est l'invité de l'épisode 57 de Data Driven 101.
Il nous plonge dans les coulisses de l'innovation au sein du groupe Vinci, où l'intelligence artificielle n'est pas seulement une technologie, mais un pivot central pour réinventer les processus et booster l'entrepreneuriat.
Bruno nous parle de la manière dont Léonard, incubateur d'innovation, façonne l'avenir en bridant l'intelligence artificielle avec les opérationnels pour créer des solutions sur mesure qui transforment l'industrie.
🔑 MOTS CLÉS
IA Lead :Leader en Intelligence Artificielle, coordonne les initiatives IA au sein d'une organisation, en s'assurant que les projets soient alignés avec les stratégies business.Optimisation des processus: Amélioration des processus existants grâce à des analyses et des technologies avancées pour accroître l'efficacité et réduire les coûts.
🎙 SOUTENEZ LE PODCAST
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 36Quentin Dubois (CTO @ OSS venture) : Data et manufacturing
Épisode 39Marie Ramon-Daré (Cheffe de projet design & innovation @ Ecolab) : L’open Data au service de la santé et de l’environnement
Épisode 41Christophe Lanternier (Head of Data @ Ubble) : Bâtir un pionnier de la vérification de documents d’identité
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions :
Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité
IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 05 May 2024 - 37min - 62 - IA et Fraude documentaire - Marc de Beaucorps (CEO@ Finovox) - #56
Marc de Beaucorps, CEO de Finovox, est l'invité de l’épisode 56 de Data Driven 101.
Avec Finovox spécialisé dans la détection de fraudes documentaires grâce à l'intelligence artificielle, il nous plonge dans un univers où IA et sécurité se rencontrent pour contrer des menaces toujours plus sophistiquées.
Il nous parle de la manière dont Finovox aborde :
la constitution d’un dataset de fraude documentaire
la construction de pipelines complexes d’analyse
les cycles de ventes auprès de grand groupes et institutions
🔑 MOTS CLÉS
Fraude Documentaire :Acte de falsifier des documents officiels dans le but de tromper ou de réaliser un gain illégal.
Computer Vision :Branche de l'intelligence artificielle qui permet aux machines d'interpréter et de comprendre le contenu visuel des images ou des vidéos.
🎙 SOUTENEZ LE PODCAST
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 47 :Renaud Allioux (cofondateur @ Preligens) : IA et l’imagerie satellite au service du renseignement
Épisode 21 :Édouard d'Archimbaud (CTO @ Kili Technology) : L'annotation de données
Épisode 27: Valentin Geffrier (Senior Data Scientist @ Spotify) - Data, musique et streaming audio
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions :
Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité
IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 28 Apr 2024 - 43min - 61 - Netflix, Lyft et 360 Learning : Machine Learning et LLM - Marie Douriez (Machine learning engineer @ 360 learning) #55
Marie Douriez, data scientist chez Lyft puis chez Netflix, et maintenant machine learning engineer chez 360 Learning , est l'invitée de l'épisode 55 de Data Driven 101.
Au cœur de l'innovation en IA, elle nous plonge dans l'évolution de l'apprentissage machine à travers son expérience chez des géants de la technologie et maintenant chez 360 Learning, une plateforme pionnière dans l'éducation collaborative pour entreprises.
Elle nous présente comment l'intelligence artificielle façonne les méthodes d'apprentissage moderne, nous parle de l’utilité croissante de l'IA générative pour personnaliser le contenu éducatif, et partage les défis techniques et les progrès réalisés dans la création automatique de cours et de contenus interactifs.
🔑 MOTS CLÉS
Apprentissage collaboratif :Méthode d'apprentissage où les participants travaillent ensemble pour résoudre des problèmes, augmentant l'engagement et la rétention d'informations.
Optimisation de contenu :Utilisation de techniques d'IA pour améliorer la pertinence et l'efficacité du contenu éducatif basé sur l'analyse de données d'utilisation et des préférences utilisateur.
🎙 SOUTENEZ LE PODCAST> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 12Laurent Jolie (Directeur des opérations @ Lalilo) : L’apprentissage de la lecture grâce à l’IA
Épisode 45Laetitia Jumel (Head of Data @ Electra) : AirBnB et stations de recharge électrique
Épisode 49Eloi Morlaàs (Software Engineer @ WhatsApp) : Messagerie, flux de données et chiffrement
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions :
Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité
IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 21 Apr 2024 - 34min - 60 - 3D et marketing: révolutionner le visuel des marques - Hugo Borensztein (cofondateur @ OMI) #54
Hugo Borensztein, cofondateur de OMI, est l'invité de l'épisode 54 de Data Driven 101. Avec une passion pour l'innovation et une vision stratégique, Hugo nous plonge dans l'univers de la production automatisée de visuels en 3D pour les marques. OMI apporte une solution révolutionnaire permettant d'automatiser une partie de la création de visuels photos et vidéos, une nécessité quotidienne pour les marques sur divers canaux de distribution.
Il souligne l'importance de la modélisation 3D et de la technologie open source dans l'évolution rapide de son entreprise, partageant comment une approche centrée sur l'utilisateur et une constante réévaluation du marché ont été cruciales pour leur succès.
Hugo nous fait également part de la transition stratégique audacieuse qu'ils ont dû opérer, passant d'une solution initiale à une plateforme entièrement basée sur la 3D, illustrant la flexibilité et la vision nécessaires pour innover dans le secteur de la data et de l'IA.
🔑 MOTS CLÉS
Modélisation 3D :Processus de création d'un modèle numérique en trois dimensions utilisant des logiciels spécialisés. Essentiel pour générer des visuels réalistes et interactifs pour le marketing et la vente en ligne.🎙 SOUTENEZ LE PODCAST
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 47Renaud Allioux (cofondateur @ Preligens) : IA et l’imagerie satellite au service du renseignement
Épisode 42Samuel Fillon (Fondateur @ Sommelier du parfum) : La data et l'IA au service de la parfumerie
Épisode 41Christophe Lanternier (Head of Data @ Ubble) : Bâtir un pionnier de la vérification de documents d’identité
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions :
Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité
IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 14 Apr 2024 - 46min - 59 - IA médicale : Cancérologie et consultation - Jean-Emmanuel Bibault (Chercheur en IA appliquée à la médecine @ l'Inserm) #53
Jean-Emmanuel Bibault, professeur en cancérologie à l'Université Paris-Cité et chercheur en IA appliquée à la médecine à l'Inserm, est l'invité de l'épisode 53 de Data Driven 101.
Il nous plonge dans l'univers de l'IA en cancérologie, nous présentant comment l'intelligence artificielle révolutionne le diagnostic, le traitement, et le suivi des patients atteints de cancer.
De l'utilisation des données satellitaires pour prédire l'épidémiologie du cancer à l'optimisation de la radiographie par l'IA, le Pr.Bibault partage des insights précieux sur le potentiel transformateur de la data science en médecine.
Il nous partage son opinion tranchée sur les freins à l’adoption de l’IA en médecine d’une part et sur les obstacles réglementaires à la recherche.
🔑 MOTS CLÉS
Données satellitaires en épidémiologie: Emploi d'images capturées par des satellites pour étudier la distribution et les déterminants des maladies au sein de populations spécifiques.
Analyse de biopsie automatisée: Processus où l'IA examine les échantillons de tissus pour détecter la présence de cellules cancéreuses, augmentant précision et efficacité du diagnostic.
Modèles prédictifs en cancérologie:Systèmes d'IA qui analysent de grandes quantités de données pour prédire l'évolution du cancer chez les patients, contribuant à personnaliser le traitement.
Patient-facing AI:Technologies d'IA conçues pour interagir directement avec les patients, par exemple en fournissant des diagnostics préliminaires basés sur les symptômes rapportés.
🎙 SOUTENEZ LE PODCAST
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 23 :Hamza Tajmouati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments
Épisode 47Renaud Allioux (cofondateur @ Preligens) : IA et l’imagerie satellite au service du renseignement
Épisode 39Marie Ramon-Daré (Cheffe de projet design & innovation @ Ecolab) : L’open Data au service de la santé et de l’environnement
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions :
Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité
IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 24 Mar 2024 - 48min - 58 - Météo, océan et climat : prédire et modéliser grâce à l’intelligence artificielle - Louis Thiry (chercheur @ INRIA) #52
Louis Thiry, docteur en machine learning et chercheur à l'INRIA, est l’invité de l’épisode 52 de Data Driven 101.
Il nous plonge au cœur de la modélisation environnementale de l'océan et de la météorologie, en intégrant l'intelligence artificielle L'objectif ? Décoder les mystères des profondeurs marines et améliorer significativement les prédictions météorologiques.
🎙 SOUTENEZ LE PODCAST
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 47 :Renaud Allioux (cofondateur @ Preligens) : IA et l’imagerie satellite au service du renseignement
Épisode 35 :Nataniel Ruiz (Research Scientist @ Google Search) : Dreambooth, faire apprendre de nouveaux objets à une IA générative
Épisode 17 :Alexandre Haag (Tesla, Audi et Ford) : La voiture autonome
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?Scopeo vous accompagne de A à Z dans vos projets IA, découvrez nos solutions :
Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité
IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 17 Mar 2024 - 40min - 57 - Qualité de l’IA, qualité de la data - Jean-Marie John Matthew (Cofondateur @ Giskard) #51
Jean-Marie John Matthew, Cofondateur de Giskard, est l’invité de l’épisode 51 de Data Driven 101.
Il nous parle de l’importance des tests pour l'intelligence artificielle, tant dans l’IA générative que dans l’IA “old school”.
Il nous détaille les vulnérabilités des IA, comme les hallucinations et fuites de données, et la nécessité d'adopter des stratégies de tests exhaustives et ciblées.
L’aventure entrepreneuriale, le positionnement open source et l’évolution du monde face aux Large Language Models viennent étoffer son témoignage.
🔑 MOTS CLÉS
Taxonomies de vulnérabilité :Référence aux classifications systématiques des faiblesses potentielles dans les modèles d'IA, comme les hallucinations (créations de fausses informations), omissions, et prompt injections (injections de commandes qui détournent le fonctionnement de l'IA).Data leakage : Décrit une situation où des informations sensibles ou confidentielles sont accidentellement révélées par un modèle d'IA, souvent à cause d'une mauvaise gestion des données d'entraînement ou de défauts dans le modèle lui-même.
🎙 SOUTENEZ LE PODCAST
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 33Guillaume Lample (Co-fondateur & Chief Scientist @ Mistral AI) : Les secrets des Large Language Models
Épisode 38Stanislas Polu (Co-fondateur @ Dust) : Assistant personnel basé sur l’Intelligence Artificielle
Épisode 46Pierre Vannier (CEO @ Flint) : Buy or build ? Externaliser l’IA et la Data Science
🚀 BESOIN D’EXPERTISE IA & DATA ?
Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions :
Diagnostic IA & Data : évaluation du potentiel de l'Intelligence Artificielle pour votre entreprise, compréhension de ce qui est réalisable avec les technologies actuelles, et mesure des risques et des opportunités associés à l'IA pour votre activité
IA sur mesure : création d'une Intelligence Artificielle sur mesure, adaptée à vos besoins spécifiques, développement et intégration des meilleures solutions sur mesure pour répondre à vos problématiques uniques
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 10 Mar 2024 - 35min - 56 - RSE, Data et greenwashing - Léa Caen (cofondatrice @ Kiosk) #50
Léa Caen, ancienne “product manager” chez Amazon et cofondatrice de Kiosk, une entreprise qui aide les sociétés à se conformer à la CSRD (Corporate Sustainability Reporting Directive) est l'invitée de l’épisode 50 de Data Driven 101.
Elle aborde l'importance de chiffrer la responsabilité sociale des entreprises (RSE), la nécessité pour les entreprises de mesurer leur impact environnemental d’une part et social d’autre part.
Elle nous raconte comment Kiosk facilite ce processus grâce à la consolidation de données et souligne l'évolution des attentes sociétales autour de la durabilité et l'impact de la technologie, y compris concernant l'IA.
🎙 SOUTENEZ LE PODCAST> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 31 :Fabrice Bonnifet (Directeur du Développement Durable @ Bouygues ) : Data et Transition énergétique
Épisode 17 :Alexandre Haag (Tesla, Audi et Ford) : La voiture autonome
Épisode 39 :Marie Ramon-Daré (Cheffe de projet design & innovation @ Ecolab) : L’open Data au service de la santé et de l’environnement
🚀 BESOIN D’EXPERTISE IA & DATA ?
Scopeo vous accompagne de A à Z dans vos projets IA : découvrez nos solutions !
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 03 Mar 2024 - 34min - 55 - Best of - Opinions 3
Best of des épisodes de Data Driven 101 par thématiques.
Dans cet épisode, les opinions de :
David El Kaim, Sales director chez Bright Data
Paul Maher, Directeur général de Coudac
Hamza Tajmouati, Head of Data & IA chez Iktos
Hugo Lime, Head of data Chez Matera
Arthur André, Co- fondateur de Praiz
Nataniel Ruiz, Research Scientist chez Google search
Quentin Dubois, CTO de OSS Venture
Hugo Palmer, Manager data chez Blablacar
Marie Ramon Daré, Chef de projet design et innovation chez Eco lab
Jean-Philippe Couturier, Fondateur de Whoz
Samuel Fillion, Fondateur de Sommelier du Parfum
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Wed, 28 Feb 2024 - 15min - 54 - Best of - Anecdotes 3
Best of des épisodes de Data Driven 101 par thématiques.
Dans cet épisode, les anecdotes de :
Victor Cluzel, Administrateur de l'INSEE détaché à la cour des comptes
Édouard D'Archimabaud, CTO de Kili Technology
Hamza Tajmouati, Head of IA & Data chez Iktos
David El Kaim - Sales Director chez Bright Data
Arthur André, Co-fondateur de Praiz
Robin Conquet, Fondateur de Data Gen
Pierre Guio, Head of Data chez Ad's up
Fabrice Bonnifet, Directeur du développement durable chez Bouygues
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 25 Feb 2024 - 13min - 53 - Best of - Opinions 2
Best of des épisodes de Data Driven 101 par thématiques.
Dans cet épisode, les opinions de :
Charles Sutton, CTO de Data Scientest
Nicolas Marchais, Head of sales chez Spendesk
Victor Azria, Global data director chez JCDecaux
Victor Cluzel, Administrateur de l'Insee détaché à la cour des comptes
Coralie Betbeder-Déchelette, Data Lead chez Joko
Édouard d'Archambaud, CTO de Kili Technology
Alexandre Hannebelle, Head of Data chez Inarix
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Wed, 21 Feb 2024 - 10min - 52 - Best of - Anecdotes 2
Best of des épisodes de Data Driven 101 par thématiques.
Dans cet épisode, les anecdotes de :
Arnaud Delaunay Head of computer vision chez Farmwise
Edouard Neuville, Directeur académique de Albert School
Jeremy Cheradame, Data scientist pour l'équipe de France de Rugby
Alexandre Miny de Tornaco, co-fondateur de DataBird
Vincent Otto, CTO de SportDynamics
Chloé Dupuy, Manager analytics retail chez Catalina
Victor Azria, Global data director chez JCDecaux
Alexandre Hannebelle, Head of Data chez Inarix
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 18 Feb 2024 - 10min - 51 - #49 Eloi Morlaàs (Software Engineer @ WhatsApp) : Messagerie, flux de données et chiffrement
Eloi Morlaàs, software engineer chez WhatsApp est l’invité de l’épisode 49 de Data Driven 101.
Il aborde la croissance massive de l'application, le traitement des données et la sécurité des messages, mettant en avant la complexité de la gestion des clés de chiffrement et la confidentialité.
Il évoque également l'application de Machine learning pour améliorer l'intégrité et la performance des appels chez WhatsApp.
🔑 MOTS CLÉS
Parameter Tuning: Processus d'ajustement des paramètres d'un algorithme pour optimiser sa performance.
Data Center : Installation utilisée pour héberger des systèmes informatiques et des composants associés, comme les systèmes de télécommunications et de stockage de données.
Forecasting (Prévision) : Processus d'estimation ou de prédiction de futurs événements ou tendances basé sur des données historiques.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 27 :Valentin Geffrier (Senior Data Scientist @ Spotify) - Data, musique et streaming audio
Épisode 28 :Hugo Lime (Head of Data @ Matera) : Data et syndic de copropriété
Épisode 45 :Laetitia Jumel (Head of Data @ Electra) : AirBnB et stations de recharge électrique
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 11 Feb 2024 - 39min - 50 - #48 Antoine Buat (Dirigeant @ Digdash) : Business Intelligence, l’UX et la souveraineté
Antoine Buat, dirigeant de DigDash, est l’invité de l’épisode 48 de Data Driven 101.
Il nous partage ses insights sur l'évolution de l'IA et son application dans le domaine de la business intelligence, insistant sur l'utilisation judicieuse de ces technologies.
Il nous dévoile ses astuces et bonnes pratiques concernant l’utilisation d’outils de BI.
Enfin, il souligne également l'importance de la souveraineté des données dans un contexte où les entreprises cherchent à protéger leurs données sensibles des lois américaines comme le Cloud Act.
🔑 MOTS CLÉS
Data Mesh : Un concept architectural dans la gestion des données où la responsabilité est décentralisée.Data Exploration : Le processus d'analyse des données pour en extraire des informations ou découvrir des tendances.
Vector Database : Une base de données qui utilise des vecteurs pour représenter les données, permettant des requêtes et des analyses plus rapides et efficaces.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 4 :Guillaume Jouffre (CEO @ GreenGo) - Data et hébergement touristique
Épisode 5 :Laure Lapostolle (DG adjointe @ Quitoque) - Data et paniers repas
Épisode 7 :Nicolas Marchais (Head of sales @ Spendesk) - Orienter l'effort de vente
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 04 Feb 2024 - 38min - 49 - #47 Renaud Allioux (cofondateur @ Preligens) : IA et l’imagerie satellite au service du renseignement
Renaud Allioux, cofondateur de Preligens, société qui développe des solutions d'IA pour l'aérospatiale, la défense et les institutions gouvernementales, est l’invité de l’épisode 47 de Data Driven 101. Il nous parle notamment de :
La genèse du projet et leurs aventures
L’impact des évolutions de l'IA avec un focus sur les modèles de fondation et l'IA générative.
La gestion de données sensibles et les contraintes strictes du secteur.
🔑 MOTS CLÉS
Modèles de fondation :Modèles d'apprentissage profond qui ont été pré-entraînés sur une large variété de données et peuvent être ajustés ou affinés pour des tâches spécifiques.Données sensibles et classifiées : Informations qui, si elles étaient divulguées, pourraient potentiellement causer un préjudice.
Test d'intrusion (Pen Test) :Un test d'intrusion, aussi connu sous le nom de "Pen Test", est une méthode autorisée et proactive pour évaluer la sécurité d'un système informatique ou d'un réseau en simulant une attaque de la part d'utilisateurs malveillants ou de cybercriminels.
SAM :Le modèle Segment Anything, ou SAM, est un modèle de segmentation d'image de pointe qui permet une segmentation rapide, offrant une polyvalence inégalée dans les tâches d'analyse d'image.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 33 :Guillaume Lample (Co-fondateur & Chief Scientist @ Mistral AI) : Les secrets des Large Language Models
Épisode 8 :Arnaud Delaunay (Head of computer vision @ Farmwise) - Un robot agriculteur
Épisode 22 :Alexandre Hannebelle ( Head of Data @ Inarix ) : La mesure de qualité grâce à l’IA
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Mon, 29 Jan 2024 - 38min - 48 - #46 Pierre Vannier (CEO @ Flint) : Buy or build ? Externaliser l’IA et la Data Science
Pierre Vannier, CEO de Flint, est l’invité de l’épisode 46 de Data Driven 101.
Il nous parle des enjeux de l'IA dans la transformation des entreprises et notamment :
Des prérequis pour se lancer dans l’IA
De l'importance de ne pas faire rentrer les différentes situations dans des cases
Des défis éthiques et pratiques de l'IA.
🔑 MOTS CLÉS
Gouvernance des Données:Ensemble de processus, de politiques, de normes et de métriques qui assurent l'efficacité et la protection des informations gérées par une organisation.
Liens et sources :
https://aibusiness.com/nlp/github-copilot-loses-20-a-month-per-user
🎙 SOUTENEZ LE PODCAST GRATUITEMENT> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 44: Ismael Goulani (CTO @ Modeo) : comment s'offrir une Modern Data Stack ?
Épisode 30 :Robin Conquet (Fondateur @ DataGen) : Data et média spécialisé
Épisode 18 :Victor Azria (Global Data Director @ JCDecaux) : Les panneaux d’affichages face à la data
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 21 Jan 2024 - 45min - 47 - #45 Laetitia Jumel (Head of Data @ Electra) : AirBnB et stations de recharge électrique
Laetitia Jumel, Data Scientist pour AirBnb et maintenant Head of Data chez Electra, une société spécialisée dans les bornes de recharge rapide pour véhicules électriques, est l'invitée de l’épisode 45 de Data Driven 101.
Elle revient sur la méthode statistique du contrôle synthétique permettant d’anticiper des comportements utilisateurs et son utilisation chez AirBnb
Elle nous explique en quoi la valorisation des données est cruciale pour les décisions business chez Electra
Elle nous parle de l'utilisation des données pour améliorer l'expérience utilisateur, de l'importance de la qualité des données, et les défis auxquelles fait face Electra notamment en matière de prédiction de la performance des stations de recharge et de politique de prix.
🔑 MOTS CLÉS
Valorisation des données : Le processus d'amélioration de la valeur commerciale et opérationnelle d'une entreprise par l'utilisation efficace des données.
Prédiction de la performance : Utilisation des données pour anticiper et modéliser la performance future de systèmes ou de produits, souvent à l'aide d'algorithmes d'apprentissage automatique.
🎙 SOUTENEZ LE PODCAST GRATUITEMEN> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 27 :Valentin Geffrier (Senior Data Scientist @ Spotify) - Data, musique et streaming audio
Épisode 28 :Hugo Lime (Head of Data @ Matera) : Data et syndic de copropriété
Épisode 37 :Hugo Palmer (Manager Data @ Blablacar) : Data Mesh chez Blablacar
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 14 Jan 2024 - 35min - 46 - #44 Ismael Goulani (CTO @ Modeo) : comment s'offrir une Modern Data Stack ?
Ismael Goulani, CTO de Modeo, est l'invité de l'épisode 44 de Data Driven 101.
Il nous explique les récentes évolutions de paradigme dans le domaine du Data Engineering et nous partage ses choix techniques, ses bonnes pratiques et ses trucs et astuces pour faire fonctionner la fonction Data d'une entreprise.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 07 Jan 2024 - 34min - 45 - Best of - Opinions 1
Best of des épisodes de Data Driven 101 par thématiques.
Dans cet épisode, les opinions de :
Antoine Sauvage de Ovrsea
Victor Billette de Villemeur de L'Oréal
Nikolaj Groeneweg de Every.me
Édouard Neuville de Albert School
Jérémy Chéradame de la FFR
Alexandre Miny de Tornaco de DataBird
Vincent Ottow de SportsDynamics
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Tue, 02 Jan 2024 - 09min - 44 - Best of - Anecdotes 1
Best of des épisodes de Data Driven 101 par thématiques.
Dans cet épisode, les anecdotes de :
Guillaume Jouffre de GreenGo
Laure Lapostolle de Quitoque
Adrien Fenech de Estimeo
Nikolaj Groeneweg de Every.me
Charles Sutton de DataScientest
Arnaud Delaunay de Farmwise
Alexis frentz de Elaia
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 24 Dec 2023 - 09min - 43 - #43 Paul Maher (Directeur Général @ Coudac) : La “patate chaude” de la responsabilité des données
Paul Maher, Directeur Général de Coudac, un groupe de 6 agences marketing, est l’invité de l'épisode 43 de Data Driven 101.
Il nous parle de Coudac, entreprise full-remote depuis sa création, aborde l’'importance du tracking server-side face aux restrictions des navigateurs, ou encore l'optimisation data-driven des campagnes publicitaires.Il souligne également l'avenir de la data chez eux, visant une gestion complète et efficace des données pour maximiser l'impact des dépenses marketing.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 17 Dec 2023 - 38min - 42 - #42 Samuel Fillon (Fondateur @ Sommelier du parfum) : La data et l'IA au service de la parfumerie
Samuel Fillon, fondateur de Sommelier du Parfum, une start-up de machine learning dans la parfumerie, est l’invité de l'épisode 42 de Data Driven 101.
Il nous explique :
👉 Comment ils fournissent des outils data driven aux consommateurs et professionnels pour prendre des décisions rationnelles dans l'achat et la création de parfums.
👉 Comment ils développent des intelligences artificielles à partir de données olfactives et d’avis clients pour améliorer la recommandation de parfums.
👉 Quelles différences il y a entre des algorithmes de recommandation B2B et B2C.
🔑 MOTS CLÉS
Norme L2 : Mesure mathématique utilisée en statistiques et en apprentissage automatique pour quantifier la différence entre deux éléments.Espace Sparse :Concept en science des données et en machine learning où la plupart des éléments d'un ensemble de données sont des zéros ou des valeurs non significatives.
Factorisation de Matrice : Technique mathématique utilisée en machine learning pour décomposer une matrice complexe en produits de matrices plus simples.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 5 :Laure Lapost olle (DG adjointe @ Quitoque) - Data et paniers repas
Épisode 16 : Chloé Dupuy (Manager Analytics Retail @ Catalina) : Comprendre le client
Épisode 27: Valentin Geffrier (Senior Data Scientist @ Spotify) - Data, musique et streaming audio👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 10 Dec 2023 - 42min - 41 - #41 Christophe Lanternier (Head of Data @ Ubble) : Bâtir un pionnier de la vérification de documents d’identité
Christophe Lanternier, Head of Data chez Ubble, start-up de vérification de documents d’identité en ligne, est l’invité de l’épisode 41 de Data Driven 101.
Il nous raconte l’histoire du début, nous parle des défis techniques comme le manque de données et du développement des algorithmes en décomposant la pipeline algorithmique en détail, allant du cropping aux hologrammes en passant par la détection de visages.
Post-acquisition par Checkout.com, il nous parle également de l'amélioration de ses produits et des défis de l’international, en particulier la variété des documents internationaux.
🔑 MOTS CLÉS
Data Set: ensemble de données collectées et organisées pour une utilisation spécifique.
Computer Vision: domaine de l'informatique qui se concentre sur le développement de systèmes capables de traiter, analyser et comprendre des images numériques.
Feature Matching: Une technique en vision par ordinateur pour trouver des correspondances entre des éléments similaires (comme des points, des lignes, des formes) dans différentes images. C'est essentiel pour des tâches telles que la reconnaissance d'objets et la reconstruction 3D.
OCR (Optical Character Recognition): Une technologie qui permet de convertir différents types de documents, tels que des documents scannés, des images de texte, en texte modifiable et recherchable.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 8 :Arnaud Delau nay (Head of computer vision @ Farmwise) - Un robot agriculteur
Épisode 22 :Alexandre Han nebelle ( Head of Data @ Inarix ) : La mesure de qualité grâce à l’IA
Épisode 38 : Stanislas Po lu (Co-fondateur @ Dust) : Assistant personnel basé sur l’Intelligence Artificielle
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 03 Dec 2023 - 39min - 40 - #40 Jean-Philippe Couturier (fondateur @ Whoz) : Matcher des personnes et des projets grace à l’IA :
Jean-Philippe Couturier, fondateur de Whoz, est l’invité de l'épisode 40 de Data Driven 101.
Depuis le COVID 19, le télétravail s’est démocratisé et les ESN et cabinets de conseils font maintenant beaucoup de choses à distance.
Dans ces conditions, staffer des consultants sur des missions, change d’échelle.
Comment structurer les compétences et les besoins et comment utiliser l’IA pour proposer le meilleur staffing ?
Jean-Philippe Couturier nous explique comment ils abordent le problème chez Whoz et comment la compétence est devenue une monnaie dans le monde du travail.
🔑 MOTS CLÉS
DeepMind (Google) : Une entreprise spécialisée dans l'intelligence artificielle, connue pour ses avancées dans le domaine du deep learning et de l'IA en général, notamment avec son IA AlphaGo qui a battu tous les humains au jeu du Go.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 34 : Patrick Bar rabé (Consultant et conférencier) : Data, IT et retail “Brick and mortar”
Épisode 36 : Quentin Dubois (CTO @ OSS venture) : Data et manufacturing
Épisode 24 : David E l Kaïm (Sales director @ Bright Data) : Web scraping
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 26 Nov 2023 - 43min - 39 - #39 Marie Ramon-Daré (Cheffe de projet design & innovation @ Ecolab) : L’open Data au service de la santé et de l’environnement
Marie Ramon-Daré , cheffe de projet design et innovation au sein d’Ecolab, est l'invitée de l’épisode 39 de Data Driven 101.
Elle décrit les efforts pour structurer et optimiser l'utilisation des données dans le domaine de la santé environnementale, en abordant les défis techniques, légaux et politiques.
🔑 MOTS CLÉS
Épidémiologie environnementale : Branche de l'épidémiologie qui se concentre sur l'étude des facteurs environnementaux affectant la distribution et la fréquence des maladies et autres conditions de santé dans les populations.Découvrabilité de la donnée : Facilité avec laquelle les utilisateurs peuvent trouver des données pertinentes.
Métadonnées : Ensemble de données qui décrivent et donnent des informations sur d'autres données.
Table de correspondance : Outil ou document qui permet de relier des informations ou des données de deux sources différentes, facilitant ainsi leur intégration et leur comparaison.
Catalogue de données : Répertoire organisé de données disponibles, souvent avec des informations sur la source, la qualité, et la manière d'accéder aux données.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 31 : Fabrice Bonnifet (Directeur du Développement Durable @ Bouygues ) : Data et Transition énergétique
Épisode 37 : Hugo Palmer (Manager Data @ Blablacar) : Data Mesh chez Blablacar
Épisode 19 : Victor Cluze l (Cour des comptes) : La data au service du contrôle des dépenses publiques👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenantHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 19 Nov 2023 - 34min - 38 - #38 Stanislas Polu (Co-fondateur @ Dust) : Assistant personnel basé sur l’Intelligence Artificielle
Stanislas Polu est notre invité de l’épisode 38 de Data Driven 101. Après avoir revendu sa start-up à Stripe et passé 3 ans chez OpenAI, il fonde Dust, un outil qui permet aux entreprises de déployer des assistants d'intelligence artificielle au sein de leurs équipes avec des intégrations simples.
Il partage avec nous sa vision concernant les défis et les opportunités liés à l'adoption de la technologie LLM au sein des entreprises.
🔑 MOTS CLÉS
Fine tuning : processus d'ajustement d'un modèle pré-entraîné pour l'adapter à une tâche spécifique.Data Mesh : Concept architectural dans la gestion des données qui favorise une approche décentralisée, permettant à différentes équipes de gérer leurs propres données comme un produit.
Processing : Traitement de données ou de transactions, souvent utilisé dans le contexte des opérations de paiement ou de traitement de données en masse.
Scale (Scaler) : L'expansion rapide d'une entreprise ou d'une technologie, souvent utilisée pour décrire la croissance rapide d'une start-up technologique.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 33 : Guillaume Lample (Cofounder & Chief Scientist @ Mistral AI) : Les secrets des Large Language Models
Épisode 29 : Arthur André ( Co-fondateur @ Praiz ) : Synthétiser ses réunions grâce à l'IA
Épisode 21 :Édouard d'Archimbaud (CTO @ Kili Technology) : L'annotation de données👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenantHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 12 Nov 2023 - 44min - 37 - #37 Hugo Palmer (Manager Data @ Blablacar) : Data Mesh chez Blablacar
Hugo Palmer, Manager Data, chez Blablacar depuis 7 ans, est notre invité de l’épisode 37 de Data Driven 101. Il nous explique comment Blablacar utilise les données pour prendre des décisions business et opérationnelles, ainsi que pour améliorer l'expérience de ses utilisateurs.Il développe avec pédagogie ce qu’est le data mesh et ce qu’il apporte selon lui.
🔑 MOTS-CLÉS
Data mesh : une architecture de données décentralisée qui organise les données par domaine d'activité spécifique (par exemple, le marketing, les ventes, le service client, etc.).
🎙 SOUTENEZ LE PODCAST GRATUITEMENT> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 28 : Hugo Lime (Head of Data @ Matera) : Data et syndic de copropriété
Épisode 27 :Valentin Geffrier (Senior Data Scientist @ Spotify) - Data, musique et streamingÉpisode 1 :Antoine Sauvage (CTO @ Ovrsea ) - Data, transport et logistique
👋 PLUS DE CONTENU DATA?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenantHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 05 Nov 2023 - 26min - 36 - #36 Quentin Dubois (CTO @ OSS venture) : Data et manufacturing
Quentin Dubois, CTO de OSS Venture, start-up studio spécialisé dans le manufacturing pour créer des start-up dans un milieu encore peu digitalisé, est l’invité de l’épisode 36 de Data Driven 101. Il nous parle notamment du fond d’investissement, comment ils recrutent et aident les start-up, ou encore de leur thèse de digitalisation de l'industrie Franco européenne.
SGBD : Un système de gestion de base de données (SGBD) est le logiciel qui permet à un ordinateur de stocker, récupérer, ajouter, supprimer et modifier des données.
🔑 MOTS CLÉS
Data mining : processus qui consiste à extraire des informations à partir de données, en utilisant des techniques statistiques et informatiques.
Data warehouse : système informatique qui permet de stocker et d'organiser des données provenant de différentes sources, pour faciliter leur analyse et leur exploitation.
ERP ou Enterprise resource planning : logiciel pour organiser la vie de l’entreprise.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 2 : Victor Billette de Villemeur (Product Manager @ L'Oréal ) - Rester agile
Épisode 5 : Laure Lapos tolle (DG adjointe @ Quitoque) - Data et paniers repas
Épisode 9 : Alexis Frentz (Investment Manager @ Elaia) - Investir dans la data👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenantHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 22 Oct 2023 - 35min - 35 - #35 Nataniel Ruiz (Research Scientist @ Google Search) : Dreambooth, faire apprendre de nouveaux objets à une IA générative
Une photo de votre chien en train de faire du surf.
Voilà ni plus ni moins ce que permet de faire la méthode “dreambooth” co-inventée par ce chercheur.
Nataniel Ruiz, premier auteur du papier “Dreambooth” et Research Scientist chez Google Research au département creative camera, est l’invité de l’épisode 35 de Data Driven 101.
Il nous parle notamment des techniques génératives pour les images et les vidéos, et en particulier sur le papier Dreambooth. Il nous parle également de ses travaux sur les large languages models, ainsi que de l'importance de l'interaction entre la recherche et l'application pratique.
Références mentionnées dans le podcast :
GCP DreamBooth: https://cloud.google.com/vertex-ai/docs/generative-ai/image/fine-tune-modelGCP StyleDrop: https://cloud.google.com/vertex-ai/docs/generative-ai/image/fine-tune-style
DB SDXL Repo: https://github.com/replicate/cog-sdxl
🔑 MOTS CLÉS
Fine tuning : Il s'agit d'une technique d'apprentissage automatique qui consiste à ajuster un modèle pré-entraîné sur une tâche spécifique en utilisant un ensemble de données plus petit et plus spécifique. GANs ou Réseaux antagonistes génératifs : en intelligence artificielle, les réseaux antagonistes génératifs parfois aussi appelés réseaux adverses génératifs sont une classe d'algorithmes d'apprentissage non supervisé. Dataset : Un jeu de données, ou dataset, regroupe plusieurs données ayant un lien cohérent entre elles.
🎙 SOUTENEZ LE PODCAST GRATUITEMENT> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 33 : Guillaume Lample (Cofounder & Chief Scientist @ Mistral AI) : Les secrets des Large Language Models Épisode HS1 : Nikolaj Groeneweg (Founder @ Everyme.ai) - Générer des images grâce à l'IA👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenantHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 15 Oct 2023 - 44min - 34 - #34 Patrick Barrabé (Consultant et conférencier) : Data, IT et retail “Brick and mortar”
"J'ai fait, j’ai fait faire et maintenant j'aide à faire"
Patrick Barrabé, consultant et conférencier, invité de l’épisode 34 de Data Driven 101 nous donne du recule sur le retail "Brick and mortar".
Une carrière passée dans le retail et l'IT et une farandole d'exemples pour comprendre la réalité du terrain et les évolutions de mentalités au fil des décennies.
🔑 MOTS CLÉS
Solution IT : Ensemble de technologies et de services informatiques qui répondent à un besoin spécifique d'une entreprise ou d'une organisation. Data Analyse : Processus qui consiste à examiner des données pour en tirer des conclusions ou des recommandations. Data Engineering : Domaine qui se concentre sur la conception, la construction et la maintenance de systèmes de données à grande échelle.🎙 SOUTENEZ LE PODCAST GRATUITEMENT
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
Épisode 5 : Laure Lapostolle (DG adjointe @ Quitoque) - Data et paniers repas
Épisode 16: Chloé Dup uy (Manager Analytics Retail @ Catalina) : Comprendre le clientÉpisode 32 : Pierre Guio (Head of Data @ Ad's Up) : Data et Stratégie publicitaire
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenantHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 08 Oct 2023 - 44min - 33 - #33 Guillaume Lample (Co-fondateur & Chief Scientist @ Mistral AI) : Les secrets des Large Language Models
Guillaume Lample, Cofounder & Chief Scientist chez Mistral AI est l’invité de l’épisode 33 de Data Driven 101. Mistral AI entraîne des modèles de langues à destination des entreprises avec un accès open source. Il nous explique notamment :
les difficultés et subtilités pour entraîner un LLM les découvertes inattendues faites sur le chemin les caractéristiques de leur premier modèle à destination du grand public🔑 MOTS CLÉS
Dataset : un ensemble de données utilisé pour entraîner un modèle d'apprentissage automatique. Token : un morceau de mot utilisé pour entraîner un modèle de langage. Un mot peut être découpé en plusieurs tokens. Embedding : une représentation vectorielle d'un mot ou d'une phrase utilisée pour entraîner un modèle de langage. Open source : un logiciel dont le code source est disponible pour tout le monde et peut être modifié et distribué librement. Fine-tuning : une technique d'entraînement de modèles de langage qui consiste à ajuster un modèle pré-entraîné sur un ensemble de données spécifique à une tâche donnée. NLP (Natural Language Processing) : un domaine de l'informatique qui se concentre sur l'interaction entre les ordinateurs et le langage humain.🎙 SOUTENEZ LE PODCAST GRATUITEMENT
> Abonnez-vous 🔔
> Laissez 5 étoiles et un avis 🥰
Sur Spotify : ici
Sur Apple Podcast : ici
Sur Deezer : ici
Sur Google Podcast :ici
🧐 DANS LA MÊME THÉMATIQUE
👉🏼Episode 29 : Arthur André ( Co-fondateur @ Praiz ) : Synthétiser ses réunions grâce à l'IA👉🏼 Episode 23 : Hamza Tajmo uati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments
👉🏼Episode HS1: Nikolaj Groeneweg (Founder @ Everyme.ai) - Générer des images grâce à l'IA
👋 PLUS DE CONTENU DATA ?
> Suivez-moi sur LinkedIn (tips/réflexions)ici 🤳
> Suivez-nous sur Tiktok📳
> Abonnez-vous à notre chaîne Youtube
🚀 BESOIN D’EXPERTISE IA & DATA ?
Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.
Réservez votre séance de 30 minutes maintenant
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 01 Oct 2023 - 38min - 32 - #32 Pierre Guio (Head of Data @ Ad's Up) : Data et Stratégie publicitaire
Pierre Guio, Head of data chez Ad's Up, est l’invité de l’épisode 32 de Data Driven 101
Il nous parle de l'utilisation de la data pour améliorer les résultats des clients, ainsi que des obstacles rencontrés par l'équipe data pour y arriver.
Mots clésMix marketing modelling : une méthode d'analyse qui permet de déterminer l'impact de différents canaux marketing sur les ventes d'une entreprise.
Attribution contribution : une méthode d'analyse qui permet de déterminer la contribution de chaque canal marketing à une conversion.
Insights : des informations ou des connaissances précieuses qui peuvent être tirées de l'analyse de données.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 24 Sep 2023 - 29min - 31 - #31 Fabrice Bonnifet (Directeur du Développement Durable @ Bouygues ) : Data et Transition énergétique
TOUT LE MONDE est concerné par cet épisode. 🌍
Le podcast Data Driven 101 sort de la "tech” cette semaine et s’intéresse à une question de société :
👉 les politiques RSE (Responsabilité Sociétale des Entreprises) et en particulier les politiques de décarbonation 🏭
Si la data a un rôle central dans l’évaluation quantitative des politiques RSE, les questions qu’on se pose aujourd’hui sont beaucoup plus larges.
Fabrice Bonnifet,
- directeur développement durable de Bouygues Group,
- président du Collège des Directeurs du Développement Durable (C3D),
- et administrateur de The Shift Project,
est l’invité de l’épisode 31 de Data Driven 101.
Il nous parle de l'importance de la data dans la transition énergétique et de la nécessité des mesures quantitatives pour s’assurer qu’une entreprise est sur une trajectoire crédible vis-à-vis de ses engagements publics.
Mots clésSupply chain : ce terme désigne l'ensemble des étapes nécessaires à la production et à la distribution d'un produit, depuis l'approvisionnement en matières premières jusqu'à la livraison au client final.
Poids carbone : fait référence à la quantité de gaz à effet de serre émise lors de la production ou de l'utilisation d'un produit. Il est souvent mesuré en tonnes équivalent CO2.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 17 Sep 2023 - 43min - 30 - #30 Robin Conquet (Fondateur @ DataGen) : Data et média spécialisé
Robin Conquet, fondateur de DataGen, qui vise à aider les entreprises à mieux comprendre et utiliser leurs données, est l’invité de l’épisode 30 de Data Driven 101.
Il nous partage son recul sur plus de 2 ans de podcast et nous explique comment il est passé de consultant en data à entrepreneur en évoquant les défis de l'entrepreneuriat dans le domaine de la data.
Mots clés
Data Engineering : domaine de l'informatique qui se concentre sur la conception, la construction, la maintenance et l'optimisation des systèmes de gestion de données.
Data Warehouse : un système de stockage de données qui permet de regrouper des données.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 10 Sep 2023 - 43min - 29 - #29 Arthur André (Co-fondateur @ Praiz ) : Synthétiser ses réunions grâce à l'IA
Arthur André, Co-fondateur de Praiz est l’invité de l’épisode 29 de Data Driven 101. Il nous parle de l'émergence de solutions comme Whisper pour la transcription et l'analyse conversationnelle, et comment Praiz s’en sert pour enregistrer des appels visio.
Il nous raconte ses péripéties dans le développement d’un produit IA utilisant les dernières technologies de l’état de l’art, avec un objectif : remplacer la prise de note et les follow-up lors de réunions.
Mots clésToken : unité de base pour la segmentation de texte, utilisée pour la transcription
Overlap : chevauchement de voix dans un enregistrement audio
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 03 Sep 2023 - 32min - 28 - #28 Hugo Lime (Head of Data @ Matera) : Data et syndic de copropriété
Hugo Lime, Head of Data chez Matera est l’invité de l’épisode 28 de Data Driven 101 . Il nous parle de comment ils utilisent la data pour accompagner les propriétaires dans la gestion de copropriété, de leurs investissements locatifs grâce à des outils automatisés mais également en leur donnant des conseils sur les économies à faire ou encore sur la renégociation de contrats.
Mots clésStack Data : ensemble de technologies et d'outils pour gérer et analyser les données.
Apprentissage non supervisé : méthode de machine learning qui consiste à entraîner un modèle à partir de données non étiquetées pour découvrir des modèles et des relations cachées.
Apprentissage par renforcement : méthode de machine learning qui consiste à entraîner un modèle à partir de récompenses et de punitions pour prendre des décisions optimales.
Données structurées : données organisées dans un format tabulaire avec des colonnes et des lignes.
Données non structurées : données qui ne sont pas organisées dans un format tabulaire, telles que des images, des vidéos ou des textes.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 27 Aug 2023 - 31min - 27 - #27 Valentin Geffrier (Senior Data Scientist @ Spotify) - Data, musique et streaming audio
L'épisode bonus de l'été : Valentin Geffrier nous parle de la data et du Machine Learning chez Spotify.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 30 Jul 2023 - 36min - 26 - #24 : David El Kaïm (Sales director @ Bright Data) : Web scraping
David El Kaïm, sales Director France Benelux chez Bright Data est l’invité de l’épisode 24 de Data Driven 101.
Il nous parle de la collecte et de la vente de données en ligne et des défis qui y sont liés notamment la légalité du scraping ou encore les limites des données personnelles.
Scraping: Collecte de données sur des sites web à grande échelle en utilisant des scripts automatisés RGPD: Règlement général sur la protection des données, un ensemble de règles de l'UE sur la protection des données personnelles VPN: Réseau privé virtuel, un moyen de sécuriser et de protéger les données en ligne en créant un tunnel chiffré entre l'utilisateur et le serveur VPN Données concurrentielles: Données sur les produits, les prix et les performances des concurrents Pricing: Stratégie de fixation des prix d'une entreprise Insights: Informations exploitables obtenues à partir de l'analyse de données
Mots clés :
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 18 Jun 2023 - 38min - 25 - #23 : Hamza Tajmouati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments
Hamza Tajmouati, Head of AI & Data chez Iktos est l’invité de l’épisode 23 de Data Driven 101.
Il nous parle de l'utilisation de l’IA dans la chimie, et en particulier l’industrie pharmaceutique.
Ils nous expliquent avec beaucoup de clarté comment un réseau de neurones peut servir à créer de nouvelles molécules.
Mots clés :
Formulation chimique: création de nouveaux matériaux ou parfums à partir de compositions chimiques spécifiques. Pipeline de préparation de données: ensemble de processus pour nettoyer, transformer et préparer les données pour l'analyse. GPU: unité de traitement graphique utilisée pour accélérer les calculs informatiques. Itération: processus de développement itératif qui consiste à publier un produit, à recevoir des commentaires et à améliorer le produit en conséquence. Graphes moléculaires: représentation graphique des molécules pour faciliter leur analyse et leur conception. Lean: méthode de gestion de projet visant à maximiser l'efficacité et à minimiser le gaspillage de ressources. Le Scoring : technique qui consiste à affecter un score pour la prédiction d’un phénomène binaire. Il permet, par exemple, d’attribuer un score à un client, un prospect ou un produit dans un contexte marketing
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 11 Jun 2023 - 39min - 24 - #22 : Alexandre Hannebelle ( Head of Data @ Inarix ) : La mesure de qualité grâce à l’IA
Alexandre Hannebelle, Head of Data chez Inarix est l’invité de l’épisode 22 de Data Driven 101. Il nous parle des défis liés à l'utilisation de l'apprentissage automatique pour l'analyse d'images agricoles mais aussi :
l’importance de rester proche de l’état de l’art d’utiliser des solutions génériques pour commencer la nécessité de prendre le temps de poser les choses proprement.Mots clés
Etat de l'art: La situation actuelle de l'ensemble des connaissances et des techniques dans un domaine particulier.
Data set: Un ensemble de données, généralement structuré en tableaux, qui peut être utilisé pour l'analyse statistique ou l'apprentissage automatique.
Deep learning : Une technique d'apprentissage automatique qui permet aux machines de comprendre des données complexes en utilisant des réseaux de neurones artificiels.
DevOps: Une méthode de développement logiciel qui vise à raccourcir le cycle de développement et à améliorer la qualité des applications en intégrant étroitement les équipes de développement et d'exploitation.
Sprint: Une période de temps fixe, souvent deux semaines, pendant laquelle une équipe de développement de logiciels travaille sur un ensemble de tâches spécifiques.
Stack: Un ensemble de technologies logicielles utilisées pour réaliser une tâche particulière, souvent en combinaison avec d'autres technologies logicielles.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 04 Jun 2023 - 25min - 23 - #21 : Édouard d'Archimbaud (CTO @ Kili Technology) : L'annotation de données
Edouard d'Archimbaud ingénieur en machine learning et CTO fondateur de Kili Technology , est l’invité de l’épisode 21 de #DataDriven101. Il nous parle des difficultés liées à l'annotation de données pour le machine learning et explique pourquoi la qualité de la donnée est essentielle pour obtenir des modèles fiables.
Garbage in -> Garbage out !
Mots clés :
Dataset: un ensemble de données qui est utilisé pour entraîner, tester et évaluer des modèles de machine learning. Métadonnées: des données qui décrivent les caractéristiques des données, telles que leur format, leur source, leur qualité et leur provenance. Batch: un ensemble de données qui est traité en même temps, souvent divisé en lots plus petits pour faciliter l'annotation et le traitement. Plateforme d'annotation: une plateforme logicielle conçue pour faciliter l'interaction entre les humains et les données, permettant de visualiser, de naviguer et d'annoter des données de manière efficace et précise.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 28 May 2023 - 33min - 22 - #20 : Coralie Betbeder-Déchelette (Data Lead @ Joko) : Data et Shopping
Coralie Betbeder-Déchelette, Data Lead chez Joko est l’invité de l’épisode 20 de #Datadriven101.
Elle nous parle de data model, de bilan carbone et de l'importance de la culture de l'entreprise en matière de données, et comment cela peut affecter l'impact de l'équipe data sur le reste de l'entreprise.
Mots clés :Monitoring: l'observation et l'analyse régulière des performances d'un système ou d'un processus afin de détecter tout écart par rapport aux objectifs et de prendre des mesures correctives si nécessaire.
Taux de Churn: le taux de désabonnement d'un produit ou service. Il est calculé en divisant le nombre de clients ayant résilié leur abonnement par le nombre total de clients.
Data Warehouse: un système de stockage de données qui permet de regrouper des données provenant de diverses sources en un seul endroit afin de faciliter la gestion et l'analyse des données.
Data model : Modèle de données qui représente la structure des données d'un système.
SQL : acronyme de Structured Query Language, langage informatique utilisé pour communiquer avec les bases de données relationnelles.Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 21 May 2023 - 29min - 21 - #19 : Victor Cluzel (Cour des comptes) : La data au service du contrôle des dépenses publiques
Victor Cluzel, administrateur de l'Insee détaché à la Cour des comptes, est l’invité de l’épisode 19 de Data Driven 101. Il nous parle du rôle de la data science à la Cour des comptes et des défis liés à l'utilisation des données dans ce contexte.
Mots clés :
Collégialité : Processus par lequel un groupe de personnes (généralement des magistrats) examine, valide ou modifie les rapports rédigés par les rapporteurs. Ce processus garantit que les rapports sont justes et précis avant d'être soumis aux administrations concernées.Crawling : Technique utilisée pour naviguer automatiquement sur le web et récupérer des informations sur les sites web, leurs liens et leurs relations.
Clustering : Méthode d'analyse de données qui consiste à regrouper des objets similaires en fonction de certaines caractéristiques ou mesures de similarité
Computer vision : Il s'agit d'un domaine de l'IA qui se concentre sur l'acquisition, l'analyse et la compréhension d'images ou de vidéos pour permettre aux machines de traiter et d'interpréter visuellement le monde qui les entoure.
RGPD (Règlement Général sur la Protection des Données) : Le RGPD est un règlement de l'Union Européenne qui vise à renforcer la protection des données personnelles des citoyens européens
Data mining (extraction de données) : C'est le processus d'analyse de grands ensembles de données pour en extraire des informations cachées, des tendances ou des modèles
Big Data : Il s'agit d'ensembles de données si volumineux, variés et complexes qu'ils nécessitent des approches et des outils de traitement avancés pour être analysés et exploités.
Data Lake : vaste référentiel centralisé de données brutes provenant de diverses sources et stockées sous leur format natif.
Peer learning : ou apprentissage par les pairs en français, est une méthode d'enseignement et d'apprentissage dans laquelle les participants apprennent les uns des autres en partageant leurs connaissances, compétences et expériences.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 14 May 2023 - 34min - 20 - #18 : Victor Azria (Global Data Director @ JCDecaux) : Les panneaux d’affichages face à la data
Victor Azria , Global Data Director chez JCDecaux est l’invité de l’épisode 18 de Data driven 101.
Il nous parle de l'utilisation des données chez JCDecaux et nous explique comment la division data a été créée pour répondre aux défis posés par la transformation de l'écosystème des médias et l'arrivée d'acteurs émergents dans le domaine du marketing digital.
Mots clés
KPI (Key Performance Indicator) : Un indicateur clé de performance est une mesure quantifiable utilisée pour évaluer la réussite d'une entreprise ou d'un projet par rapport à ses objectifs.
DevOps : Une approche de développement logiciel qui intègre étroitement le développement et les opérations informatiques pour améliorer la collaboration et la communication.
Heatmap : Représentation graphique des données où les valeurs individuelles sont représentées par des couleurs, généralement utilisée pour visualiser des données complexes ou volumineuses.
Data marketplace : Plateforme où les fournisseurs de données peuvent vendre ou échanger des ensembles de données avec d'autres organisations ou individus.
Forecast (prévision) : Estimation ou prédiction de futurs événements ou tendances basée sur des données historiques ou des analyses statistiques.
Data Warehouse: un système centralisé et structuré de stockage et de gestion des données provenant de différentes sources.Dashboard: un panneau de visualisation qui présente les indicateurs clés de performance (KPI) et d'autres informations utiles pour les utilisateurs.
Dataviz : abréviation de "data visualization", c'est la représentation visuelle des données pour faciliter leur compréhension et leur interprétation.
MOA (Maîtrise d'Ouvrage) : il s'agit de la partie prenante d'un projet qui définit les besoins, les objectifs et les exigences fonctionnelles, et qui assure le suivi et la validation du projet.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 07 May 2023 - 41min - 19 - #17 : Alexandre Haag (Tesla, Audi et Ford) : La voiture autonome
Alexandre Haag est l’invité de l’épisode 17 de Data Driven 101.
Après 10 ans dans la robotique, il a travaillé 8 ans dans le monde de la conduite autonome, notamment chez Tesla & Argo.AI (Audi et Ford).
Aujourd'hui, il lance son projet FutuRail, visant à développer des trains autonomes pour offrir un meilleur service de transport ferroviaire et réduire les émissions de CO2.
Il nous parle de sa vision du monde de la voiture autonome, du travail dans une entreprise comme Tesla, des méthodes de travail d'Elon Musk et des différences USA/europe.
Mots clésLoi de Moore : Prédiction selon laquelle le nombre de transistors sur un microprocesseur doublera environ tous les deux ans, augmentant ainsi la puissance de calcul. (définition de chatGPT)
Dataset : Ensemble de données structurées, généralement utilisé pour l'analyse, la modélisation ou la formation d'un algorithme.
Motion planning : Processus de détermination des mouvements et des actions nécessaires pour qu'un objet ou un robot atteigne un état ou une position spécifique.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 16 Apr 2023 - 44min - 18 - #16 : Chloé Dupuy (Manager Analytics Retail @ Catalina) : Comprendre le client
Chloé Dupuy, Manager analytic retail chez Catalina est l'invitée de l’épisode 16 de Data Driven 101.
Elle nous explique comment l'entreprise Catalina utilise des algorithmes et du machine learning pour personnaliser les campagnes de promotion et analyser les comportements les clients.
Mots clés
KPI : KPI, ou indicateur clé de performance, est une mesure utilisée pour évaluer la réussite ou l'efficacité d'une organisation, d'un projet ou d'un processus dans l'atteinte de ses objectifs.
Data Viz (Data Visualization) : La visualisation de données, ou data viz, est une technique qui consiste à représenter des données sous forme graphique ou visuelle
Power BI : Power BI est un outil de Business Intelligence développé par Microsoft qui permet de transformer des données brutes en informations significatives et exploitables.
Stack logicielle : Ensemble des logiciels utilisés par une équipe.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 09 Apr 2023 - 34min - 17 - #15 : Vincent Ottow (CTO @ SportsDynamics) : Data et sport analytics
Vincent Ottow, CTO de SportsDynamics, start-up de sport analytics est l’invité de l’épisode 15 de #DataDiven101.
Il nous parle de l’utilisation de la data pour aider les clubs de football à améliorer leurs performances.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 02 Apr 2023 - 41min - 16 - #HS2 : Maxence Ernoult (chercheur @ Rain) : S’inspirer du vivant
Faire tourner chatGPT sur un téléphone, en local, sans serveur, sans partager ses données à personne et sans faire exploser son bilan carbone.
C'est la promesse de l'approche qui s'inspire du vivant pour construire des algorithmes sobres en calculs et en énergie.
Rencontre avec Maxence Ernoult , chercheur chez Rain, dans le deuxième épisode Hors Série spécial IA du podcast #Datadriven101.
Il nous parle de ses travaux dans le domaines de l'IA mais aussi de l'état de la recherche et des croyances existantes.Mots clés
Substrat: un matériau sur lequel les circuits électroniques sont construits. Synapse: un point de contact entre deux neurones ou entre un neurone et une cellule musculaire ou glandulaire, où les signaux sont transmis. Rétropropagation (ou backpropagation) : une méthode d'apprentissage supervisée pour les réseaux de neurones, dans laquelle l'erreur est propagée de la sortie vers l'entrée. Gradient: une mesure de la pente de la courbe d'une fonction à un point donné. Dans le contexte de l'apprentissage, il est utilisé pour ajuster les paramètres du modèle pour minimiser l'erreur. Neuromorphique: une approche de l'informatique inspirée par le cerveau, dans laquelle les systèmes informatiques sont conçus pour imiter les neurones et les synapses biologiques. Inférence : Tâche réalisée par l’algorithme comme par exemple prédiction, déduction, classification, estimation…Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 26 Mar 2023 - 34min - 15 - #14 : Alexandre Miny de Tornaco (Fondateur @ Data Bird) : La data pour tous
Alexandre Miny de Tornaco, fondateur de Data Bird, organisme de formation upskilling et formation continue dans la data pour le business, est l’invité de l’épisode 14 de Data Driven 101. Il nous parle notamment de :
👉La philosophie de continuer à apprendre car la technologie évolue rapidement.
👉L’évolution des mentalités en seulement 3 ans
👉L'importance de comprendre les enjeux éthiques et moraux de l'utilisation de la data.
Mot clés
SQL : SQL est un langage informatique normalisé servant à exploiter des bases de données relationnellesPower BI : solution d'analyse de données de Microsoft.
Looker : Looker est une plateforme de Business Intelligence appartenant au Google Cloud qui permet une analyse avancée de toutes les données d'une entreprise
Data Studio : outil en ligne de conversion de données en rapports et tableaux de bord informatifs personnalisables
BigQuery : service web intégré à Google Cloud qui permet l'analyse interactive massive de grands ensembles de données en collaboration avec l'espace de stockage Google
Data warehouse : base de données relationnelle hébergée sur un serveur dans un Data Center ou dans le Cloud.
Une data clean room : environnement qui permet à plusieurs entreprises de partager des données de manière sécurisée et anonyme
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 19 Mar 2023 - 25min - 14 - #13 : Olivier Gabriel (Head of Data @ WeMaintain) : Maintenance prédictive et gestion de la consommation
Olivier Gabriel, Head of Data chez We Maintain, est l’invité de l’épisode 12 de Data Driven 101.
Il nous parle de l'utilisation de la data dans le secteur des ascenseurs et notamment de l’utilisation des algorithmes de machine learning pour améliorer la maintenance des ascenseurs, prédire les pannes et économiser de l’énergie.
Mot clés
IOT : Internet des objets, réseau d'objets connectés qui permettent de collecter des données
On edge : qui est exécuté sur le capteur directement, par opposition à dans des serveurs distants
Interopérabilité: capacité de différents systèmes informatiques à interagir entre eux
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 12 Mar 2023 - 30min - 13 - #12 : Laurent Jolie (Directeur des opérations @ Lalilo) : L’apprentissage de la lecture grâce à l’IA
Laurent Jolie, fondateur et directeur des opérations chez Lalilo, est l’invité de l’épisode 12 de Data Driven 101.
Il nous explique comment Lalilo utilise l'intelligence artificielle pour améliorer l'apprentissage de la lecture, mais nous parle aussi :
👉🏼 de la nécessité de faire fonctionner les algorithmes et les professeurs ensemble.
👉🏼 de la personnalisation de la méthode
👉🏼 de l’importance de mesurer la progression
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 05 Mar 2023 - 31min - 12 - #11 : Jérémy Cheradame (Data Scientist @ Équipe de France de rugby) - Data et rugby
Jérémy Cheradame, Data Scientist pour l'équipe de France de rugby est l’invité de de l’épisode 11 de Data Driven 101.
Il nous révèle les usages actuels de la data au plus haut niveau sportif, notamment :
👉🏼 Quelles règles simples peuvent être données aux joueurs pour prendre un avantage statistique sur l’équipe adverse ?
👉🏼 Que peut-on apprendre d’un adversaire pendant une compétition grâce à la data ?
👉🏼 Comment s’articule la charnière Data Scientist - Sport Scientist et quelle est la relation avec le coach ?
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 12 Feb 2023 - 37min - 11 - #10 : Édouard Neuville (Directeur académique @ Albert School) - Une business School de la data
Albert school est la première business school spécialisée dans la data. Édouard Neuville, directeur académique de Albert School, est l’invité dans l’épisode 10 de Data driven 101 et nous parle notamment de :
👉🏼La pénurie des profils data et business
👉🏼Mieux apprendre en faisant comme en entreprise
👉🏼La compatibilité entre professionnalisation et excellence
Mots clés
upskilling : Formation destinée à augmenter les compétences existantes afin de permettre la continuation du même métier, ou du même domaine d’activité
reskilling : formation qui est destinée à aider les personnes à acquérir de nouvelles compétences pour changer de métier.
IDE : Un environnement de développement intégré (IDE) est une application logicielle qui aide les programmeurs à développer efficacement le code logiciel
CRM : Le CRM ou gestion de la relation client (Customer Relationship Management) est une stratégie de gestion des relations et interactions d'une entreprise
cloud computing : Fourniture de services informatiques (notamment les serveurs, le stockage, les bases de données) via Internet (le cloud)
Data warehouse : Infrastructure de stockage des données sous forme structurées
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 05 Feb 2023 - 28min - 10 - #9 : Alexis Frentz (Investment Manager @ Elaia) - Investir dans la data
Comment un Venture Capitalist choisit-il ses investissements ?
Alexis Frentz, investment manager du fond de venture capital Elaia, est l’invité dans l’épisode 9 de Data Driven 101.Il nous partage à la fois les usages internes de la data chez Elaia mais aussi ce qui motive leurs choix d’investissements dans les startups du domaine.
Vous en apprendrez notamment :
👉🏼 Les critères d'investissement
👉🏼 Les bons et mauvais signaux
👉🏼 Comment se passe une due diligence côté data
Mot clésFond d'investissement: Un fonds d'investissement est une structure de placement collectif qui permet aux investisseurs de se regrouper pour investir dans des actifs financiers diversifiés.
Deep tech: La deep tech est un terme utilisé pour décrire les technologies avancées ou innovantes qui utilisent des concepts scientifiques et technologiques uniques, tels que l'intelligence artificielle, l'informatique quantique et la biotechnologie.
Simulation de Monte-Carlo: Une simulation de Monte-Carlo est une méthode statistique utilisée pour modéliser et analyser des systèmes complexes et prévoir leur comportement.
Bootstrapper: démarrer et développer une entreprise en utilisant un minimum de ressources, souvent en s'autofinançant et en faisant preuve de créativité.
Due diligence: La due diligence est le processus d'analyse minutieuse d'un investissement ou d'une collaboration potentielle pour évaluer les risques et les avantages potentiels.
Workflow: séquence des tâches et de processus
RGPD : Le Règlement Général sur la Protection des Données (RGPD) est un règlement de l'Union européenne en matière de protection des données et de vie privée pour toutes les personnes physiques à l'intérieur de l'Union européenne.
Scrapper : extraire des données à partir de sites web ou d'autres sources en ligne.
Travail de curation : Le travail de curation désigne le processus de sélection, d'organisation et de présentation de l'information ou du contenu, comme les contenus numériques, les patrimoines culturels et les données scientifiques.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 29 Jan 2023 - 31min - 9 - #8 : Arnaud Delaunay (Head of computer vision @ Farmwise) - Un robot agriculteur
L’intelligence artificielle peut-elle résoudre les problèmes environnementaux et sanitaires de l’agriculture ?
Farmwise propose un désherbage mécanique entièrement automatisé grâce à un tracteur-robot intelligent.
👉 Arnaud Delaunay, head of Computer Vision chez Farmwise, nous dévoile les dessous d’un projet d’ultra pointe technologique.
Il est l'invité de Marc Sanselme dans l’épisode 8 de Data Driven 101.
Définitions / références
MLOps : Gestion de la maintenance, du déploiement et de l’utilisation en production des modèles de Machine Learning
SDK : Software Development Kit): Un ensemble d'outils logiciels, de bibliothèques et de documentation qui permettent aux développeurs de créer des applications sur un framework donné
API (Application Programming Interface): Une interface de programmation qui permet à des applications de communiquer entre elles
Développeur backend : Développeur qui travaillent sur la partie du serveur d'une application.
Deep learning :Il s'agit d'une branche de l'apprentissage automatique qui utilise des réseaux de neurones multi-couches pour apprendre à partir de données. Il est utilisé pour des tâches telles que la reconnaissance d'images, la reconnaissance de la parole, la traduction automatique ou la génération de texte.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 22 Jan 2023 - 36min - 8 - #7 : Nicolas Marchais (Head of sales @ Spendesk) - Orienter l'effort de vente
L'effort commercial d'une entrepise doit être piloté. C'est pourquoi un "head of sales" est aujourd'hui avant tout un professionnel de la data.
👉 Comment trancher entre l’intuition et l’analyse quantitative pour prendre des décisions ?
👉 Comment “diviser pour régner” dans la data ?
👉 Comment faire évoluer les usages de la data avec l’hypercroissance de l’entreprise ?
Nicolas Marchais, ancien Head of Sales et employé numéro 1 de Spendesk, est l’invité de Marc Sanselme dans l’épisode 7 de Data Driven 101. Il nous parle des stratégies pour mieux consommer les données, orienter l’effort de vente et piloter la croissance dans une entreprise.Définitions / références
Pipeline de vente : Processus méthodique de suivi des clients potentiels dans le cycle de vente.
A/B testing: L'A/B testing, est une méthode qui permet de comparer l'efficacité de 2 options en testant les deux options sur une population regroupées aléatoirement en deux cohortes et comparant les résultats obtenus sur chaque cohorte.
Alphas user : Premiers utilisateurs d’un logiciel, faisant partie de l’équipe qui le construit.
KPI : Key Performance Indicator, ensemble des indicateurs qui permettent de mesurer les performances
Query : Requête faite sur une base de données pour obtenir un extrait de ces données.
data warehouse : Infrastructure de stockage des données sous forme structurées
User Flow : parcours des utilisateurs
ROI : retour sur investissement
Insight : perception
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 15 Jan 2023 - 34min - 7 - #6 : Charles Sutton (CTO @ DataScientest) - La pédagogie de la data
Ils ont voulu développer une petite plateforme de test pour le recrutement en Data Science et ils ont fini par créer un énorme organisme de formation continue en data.
👉 Quelle place pour les autodidactes dans le monde de la Data ?
👉 Comment s’adapter efficacement aux profils très différents qui souhaitent se former ?
👉 Comment rester au courant des pratiques d’entreprise dans ce monde en constante évolution ?
Charles Sutton, CTO de DataScientest, est l’invité de Marc Sanselme dans l’épisode 6 de Data Driven 101.
Il nous partage le recul que lui offre sa position d’entrepreneur qui a vu passer plus de 7000 apprenants.
Définitions / références
Skill assessment : Évaluation de compétence (recrutement)
Python : langage de programmation
Coursera : plate-forme de cours en ligne
IT : technologie de l’information (ordinateurs, stockage, réseaux…)
B to B : business to business, commerce d’entreprise à entreprise
Boot camp : programme intensif
MOOC (Massive Open Online Course) : Cours en ligne via une plateforme
Notebook : interface de programmation très utilisée en Data Science
Computer Vision : Branche de l’algorithmique qui concerne le traitement des images et de leur signification
NLP (Natural Language Processing) : Branche de l’algorithmique qui concerne le traitement du texte et de sa signification
Flagship : Produit phare
Deep learning (réseaux de neurones profonds) : Type d’algorithme de Machine Learning
MLOps : Gestion de la maintenance, du déploiement et de l’utilisation en production des modèles de Machine Learning
ML engineering (Machine Learning Engineering) : Ingéniérie autour du Machine Learning
PhD : doctorat
BI (Business Intelligence) : Analyse de donnée destinée à une meilleure compréhension du business
Doers : « faiseurs » , ce qui font
Software: logiciel
PoC : Proof of Concept, Démonstration de faisabilité
Data Warehouse : Infrastructure de stockage des données sous forme structurées
Data Lake : Infrastructure de stockage des données sous forme non-structurées
BU : BUSINESS UNIT, sous partie d’une organisation dédiée à un marché spécifique
Power BI (Microsoft) : Logiciel de Business Intelligence
DBT : Logiciel de Data Engineering
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 08 Jan 2023 - 36min - 6 - #HS1 : Nikolaj Groeneweg (Founder @ Everyme.ai) - Générer des images grâce à l'IA
Loin des applications les plus courantes, il y a la ligne de front technologique. Dans ce numéro hors série à vocation pédagogique, nous cherchons à démystifier un des domaines technologiques ou l'IA a le plus progressé récemment : la génération d'image.
Dans cet épisode, Marc Sanselme reçoit Nikolaj Groeneweg pour un tour d'horizon de la génération d'image grâce à l'intelligence artificielle.
👉 Il nous dévoile les ficelles de la génération d'image et nous apprend avec beaucoup de pédagogie comment démarrer sur ce sujet.
👉 Vous y apprendrez comment écrire vos "prompts", c'est à dire murmurer à l'oreille des Intelligences Artificielles.
Références :
DALL-E : https://openai.com/dall-e-2/ Stable Diffusion : https://stability.ai/blog/stable-diffusion-public-release LAION5B : https://laion.ai/blog/laion-5b/ La chaise avocat : https://www.technologyreview.com/2021/01/05/1015754/avocado-armchair-future-ai-openai-deep-learning-nlp-gpt3-computer-vision-common-sense/ DreamBooth :https://dreambooth.github.io/ ChatGPT : https://chat.openai.com/ Exemple de prompt très long : https://prompthero.com/prompt/f8383320123 Applications de retouche d'image : https://clipdrop.co/ https://www.photoroom.com/ Labs Open AI : https://labs.openai.com/ Hugging Face : https://huggingface.co/spaces/stabilityai/stable-diffusion Mid Journey : https://midjourney.com/home/?callbackUrl=%2Fapp%2F Prompt Hero : https://prompthero.com/Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Mon, 02 Jan 2023 - 38min - 5 - #5 : Laure Lapostolle (DG adjointe @ Quitoque) - Data et paniers repas
👉 Comment doit-on faire évoluer ses indicateurs avec sa croissance et quels sont les pièges à éviter ?
👉 Qu'est-ce que le Machine Learning peut faire pour aider la planification ?
👉 Qu'est-ce que le RGPD peut avoir de positif pour une entreprise ?
Laure Lapostolle, DG adjointe de Quitoque, vient répondre aux questions de Marc Sanselme et nous dévoile les usages surprenants de la data dans une entreprise de livraison de repas en kit.
Dans cet épisode de Data Driven 101, Laure nous offre un tableau complet des applications efficaces de la Data Science et du Machine Learning mises en œuvre par ses équipes.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 11 Dec 2022 - 31min - 4 - #4 : Guillaume Jouffre (CEO @ GreenGo) - Data et hébergement touristique
👉 Comment créer une boite 100% Data Driven dès le début ?
👉 Qu'est-ce que ça change concrètement au quotidien ?
👉 Comment un bon set-up technique permet-il d'être ultra-réactifs ?
Vous l'apprendrez dans le quatrième épisode de Data Driven 101, où Marc Sanselme reçoit Guillaume Jouffre, CEO de GreenGo.
A travers des cas concrets, anecdotes et prise de recul sur l'organisation de sa startup, Guillaume nous livre sa vision de la maturité technique.
Vocabulaire et références :
Metabase : Logiciel d'analyse de données et visualisation Google Analytics : Outil de suivit statistique des fréquentations web GA4 : version 4 de l'outil ci-dessus Mixed Panel : Outil d'analyse statistique d'un produit web Marketplace : Plateforme web de commerce agile : Méthode de développement software engagement : interaction avec un post sur un réseau social naas.io : outil de notebooks SaaS. Référence faite au notebook suivant : https://github.com/jupyter-naas/awesome-notebooks/blob/master/LinkedIn/LinkedIn_Get_stats_from_post.ipynb conversion : se dit pour décrire le passage de l'état de prospect à l'état de client (vente) panier moyen : montant moyen dépensé par un client à chaque achat growth hacking : methode marketing quick win : les points de résolution d'un problème demandant le moins d'effort Clarity : logiciel d'analyse de données Hotjar : outil d'analyse des interactionq sur un site web Power BI, Tableaux, Google Data Studio : outils d'analyse de données et visualisation CRM : outil de gestion des clients Pipedrive : logiciel de CRM Salesforce : logiciel de CRMHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 04 Dec 2022 - 37min - 3 - #3 : Adrien Fenech (Président & Fondateur @ Estimeo) - Agence de notation pour startupOù trouve-t-on les signaux faibles pour évaluer la valeur d'une startup ? Comment faire du software dans un secteur (la finance) ou Excel est roi ? Quelles sont les bonnes pratiques de sécurité pour se mettre à l'abri des attaques ?
Adrien Fenech, président et fondateur de Estimeo vient répondre aux questions de Marc Sanselme pour le podcast Data Driven 101.
Il nous décortique les contraintes du secteur financier, leurs impacts sur la gestion des données et la particularité du monde des startups.
Vocabulaire technique et références faites dans l'épisode :
OVH : Hébergeur web français Grand compte : un client qui est une grande entreprise pre-seed : nom donné à la levée de fond d'une entreprise précédant tout développement produit serie A : nom donné à la levée de fond d'une entreprise destiné au développement déploiement à plus grande échelle d'un produit ayant fait ses premières preuves Docker : logiciel de conteneurisation MongoDB : logiciel de base de données SQL : Langage de programmation de requête en base de données RGPD : Règlement Général sur la Protection des Données Back up : Sauvegarde de secours Hacker : Pirater Ransomware : "Ransongiciel", logiciel pirate de chantage aux données Roll back : revenir à la version précédente ANSSI : Agence nationale de la sécurité des systèmes d'information Stackoverflow : site web faisant référence pour échanger sur les problèmes de programmation Arnaque au président : Type d'arnaque consitant à se faire passer pour le président d'une entreprise auprès des employés afin d'abuser de l'autorité hierarchique et obtenir des informations clésHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 27 Nov 2022 - 42min - 2 - #2 : Victor Billette de Villemeur (Product Manager @ L'Oréal ) - Rester agilePourquoi la data est au cœur de la stratégie d'une entreprise de cosmétique ? Comment s'assurer du retour sur investissement des projets data ? Comment se transposent les principes de l'agile à la data ?
Victor Billette de Villemeur, product manager chez L'Oréal, vient répondre aux questions de Marc Sanselme pour le podcast Data Driven 101.
A travers un regard transverse des différents métiers, il déchiffre l'univers data d'un grand groupe.
Vocabulaire technique utilisé dans l'épisode :
PM : product manager, garrant du développement d'un porduit B2E : Business to employee, autrement dit, le produit est destiné à un employé de la même société GCP : Google Cloud Platform, service d'hébergement cloud de Google SAP : Logiciel d'entreprise de planification/gestion de resources Salesforce : Logiciel d'entreprise de gestion des clients et processus de vente CI/CD : Integration continue, déploiement continu. Ensemble des processus orchestrant les évolutions d'un produit logiciel Pyhton, Javascript : langages de programmation React : Framework de Javascript pour créer des applications web et mobile Streamlit : Bibliothèque python simplifié à l'extrême pour créer des applications web Trends : tendances Natural Language Processing (NLP) : Traitement du langage humain (algorithmique) Back office : Ensemble des activités de soutien, de contrôle et d'administration des opérations au sein d'une entrepriseHébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Sun, 20 Nov 2022 - 40min - 1 - #1 : Antoine Sauvage (CTO @ Ovrsea ) - Data, transport et logistiqueComment une bonne structuration data permet-elle de prioriser les problèmes à résoudre ? Comment le Machine Learning "tactique" peut-il débrider la création de valeur ? Comment choisit-on les Data Scientists dans une startup tech au parcours aussi fulgurant ?
Antoine Sauvage, CTO de Ovrsea, vient répondre aux questions de Marc Sanselme pour le podcast Data Driven 101.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Wed, 09 Nov 2022 - 34min
Podcasts ähnlich wie Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français
- Au Cœur de l'Histoire - Des récits pour découvrir et apprendre l'Histoire Europe 1
- Hondelatte Raconte - Christophe Hondelatte Europe 1
- La libre antenne - Olivier Delacroix Europe 1
- Les Récits extraordinaires de Pierre Bellemare Europe 1 Archives
- Les pieds sur terre France Culture
- Affaires sensibles France Inter
- Grand bien vous fasse ! France Inter
- C dans l'air France Télévisions
- Le Coin Du Crime La Fabrique Du Coin
- CRIMES • Histoires Vraies Minuit
- Franck Ferrand raconte... Radio Classique
- L'After Foot RMC
- Rothen s'enflamme RMC
- Super Moscato Show RMC
- Faites entrer l'accusé RMC Crime
- Confidentiel RTL
- Enquêtes criminelles RTL
- Entrez dans l'Histoire RTL
- Laurent Gerra RTL
- Les Grosses Têtes RTL
- Les histoires incroyables de Pierre Bellemare RTL
- L'Heure Du Crime RTL
- L’heure du crime : les archives de Jacques Pradel RTL
- Parlons-Nous RTL