Consulter les offres d’emploi

Méthodes statistiques et data-mining appliquées à un dispositif de jeu vidéo
Publiée le 22/12/2025 09:39.
Référence : Stage M2 Tactile Game.
Stage, 2 rue Conté, 75003 Paris.
Entreprise/Organisme :Conservatoire National des Arts et Métiers (CNAM) - Laboratoire Cédric
Niveau d'études :Master
Date de début :Février 2026
Durée du contrat :5 mois
Rémunération :Gratification de stage
Description :Ce stage de M2 en statistique s’inscrit dans le projet Tactile Game Lab : un atelier d’initiation à la création de jeux vidéo combinant numérique et objets physiques. L’atelier a déjà fait l’objet de plusieurs expérimentations qui ont permis de recueillir des données hétérogènes et multimodales. Le ou la stagiaire contribuera à l’analyse des données existantes, à l’évaluation critique des indicateurs mobilisés et à la réflexion méthodologique sur les dispositifs de collecte, notamment en vue de l’automatisation des traces d’activités.
En savoir plus :https://cedricnuage.cnam.fr/nextcloud/index.php/s/SyB9LQA5NcokT2M
Fiche de poste_stage_MSDMA_CEDRIC_CNAM.pdf
Contact :feriel.bouhadjera@lecnam.net
PhD position: environmental footprint of food products
Publiée le 18/12/2025 14:12.
Thèse, Montpellier.
Entreprise/Organisme :INRAE
Niveau d'études :Master
Date de début :premier trimestre 2026
Durée du contrat :36 mois
Rémunération :2300€brut/mois
Description :You will be working in FOODTURE, a European research and innovation project redefining how we understand and improve our food systems. FOODTURE brings together 20 partners from 9 different countries (https://foodture-project.eu). It develops and validates enhanced Life Cycle Assessment (LCA) methodologies, moving beyond generic data to deliver more reliable results on the environmental impact of food products consumed in Europe. The environmental impact of a food product results from all stages involved: agriculture, processing, transport, packaging, consumption, and waste management. The objective of this PhD is to quantify the footprints of products at a large scale and to explore variability between and within food product categories.
En savoir plus :https://jobs.inrae.fr/en/ot-28022
env footprint of food products.pdf
Contact :arnaud.helias@inrae.fr
Ingénieur.e de recherche en calcul numérique H/F
Publiée le 18/12/2025 14:12.
CDI, Evry-Courcouronnes.
Entreprise/Organisme :CNRS, laboratoire LaMME UMR 8071
Niveau d'études :Doctorat
Durée du contrat :CDI
Rémunération :IRG3 BAP : E - Informatique, Statistiques et Calcul scientifique
Secteur d'activité :Ingénieur.e de recherche en calcul numérique H/F
Description :Réservé aux agents CNRS (fonctionnaires et CDI) et aux fonctionnaires et CDI de droit public Intitulé de l'offre : Ingénieur.e de recherche en calcul numérique H/F Référence : UMR8071-MOBINT-P59007 Lieu de travail : EVRY COURCOURONNES Institut : INSMI - Institut national des sciences mathématiques et de leurs interactions Date de publication : mardi 2 décembre 2025 Session : Campagne Hiver 2026 Groupe de Fonction : IRG3 BAP : E - Informatique, Statistiques et Calcul scientifique Emploi type : Experte ou expert en calcul scientifique
En savoir plus :https://emploi.cnrs.fr/Offres/MOBINT/UMR8071-MOBINT-P59007/Default.aspx
Contact :stephane.menozzi@univ-evry.fr
Modélisation prédictive par intelligence artificielle de la formation des sous-produits de désinfect
Publiée le 17/12/2025 09:53.
CDD, EDF R&D, Laboratoire National d'Hydraulique et Environnement, Chatou (78).
Entreprise/Organisme :EDF/CNRS
Niveau d'études :Master
Durée du contrat :6 mois
Description :Le stage débutera par une revue bibliographique visant à identifier les principaux paramètres de qualité de l’eau influençant la formation de sous-produits et à analyser les méthodologies employées pour étudier leur évolution temporelle, notamment dans le contexte du changement climatique. La phase suivante consistera à collecter les données disponibles et à les organiser selon un format approprié en vue de leur analyse. Une d'exploration approfondie des données historiques collectées sur plusieurs années sera ensuite réalisée. Cette étape cruciale permettra d'identifier les tendances temporelles et spatiales dans l'évolution de la qualité de l'eau, en portant une attention particulière aux variations de la matière organique dissoute (DOM) qui constitue le précurseur principal des DBPs. Le stagiaire devra gérer les problématiques classiques des données environnementales telles que les valeurs manquantes, les changements de protocoles de mesure ou de localisation des stations, en appliquant des méthodes d'imputation adaptées comme les moyennes mobiles pondérées ou les techniques d'interpolation temporelle. Une phase d’analyse et de classification de données sera ensuite réalisée à l’aide de modèles linéaires généralisés à effets mixtes (GLMM) ou modèles de type carte auto adaptative. La phase de modélisation constituera le coeur du stage. Le stagiaire pourra d'abord développer des modèles de séries temporelles classiques (ARIMA, ARIMAX) pour prédire l'évolution des paramètres de qualité d'eau, puis explorera des approches d'apprentissage profond, notamment les réseaux de neurones récurrents de type LSTM ou GRU, particulièrement adaptés aux séries temporelles longues s’il y a lieu. La perspective à termes est de construire des modèles capables de prédire la formation potentielle de DBPs en fonction des conditions physico-chimiques de l'eau et des paramètres de traitement (concentration initiale d'oxydant, temps de réaction, température). Une attention particulière sera portée à la validation des modèles et à leur capacité de généralisation sur différents sites.
En savoir plus :https://www.linkedin.com/company/edf/
Proposition sujet de stage 2026 Biocide-Watch WP6.pdf
Contact :benoit.teychene@univ-poitiers.fr
Master’s Internship (MSc – M2)
Publiée le 17/12/2025 09:53.
Stage, MIA Paris-Saclay - AgroParisTech.
Entreprise/Organisme :INRAE
Niveau d'études :Master
Sujet :Multivariate Change Point Detection and Curve Clustering for Metabolite Kinetics Analysis
Date de début :~03/2026
Durée du contrat :5/6 months
Rémunération :4,35 €/h
Description :This internship is part of the HepatoTwin research project (2024–2028), coordinated by INRAE and conducted in collaboration with the TOXALIM research unit, a leading laboratory in food toxicology. The HepatoTwin project aims to investigate the impact of food contaminants and dietary imbalances on liver metabolism using advanced experimental and computational approaches. Within this project, high-frequency multivariate time series data are collected from human hepatic cell cultures, monitoring the real-time dynamics of dozens to hundreds of metabolites. Cells are exposed to different stress conditions mimicking food contaminant exposure or unbalanced diets, potentially inducing either abrupt metabolic disruptions or more gradual changes in metabolic dynamics.
En savoir plus :https://mia-ps.inrae.fr/node/904
Sujet de stage de Master_0.pdf
Contact :julien.chiquet@inrae.fr
Théorie minimax pour les contraintes de forme et de régularité
Publiée le 16/12/2025 09:25.
Thèse, Saint-Etienne.
Entreprise/Organisme :Université Jean Monnet / Institut Camille Jordan
Niveau d'études :Master
Secteur d'activité :Statistiques mathématiques
Description :Ce sujet de thèse en statistiques mathématiques, financé, devrait probablement être mis au concours de l'école doctorale pour un démarrage en septembre 2026. Il s'adresse aux étudiants de niveau M2 ayant un solide parcours en mathématiques et souhaitant s'intéresser à la théorie des statistiques. Un encadrement en stage de M2 est possible. Les personnes intéressées sont invitées à prendre contact dès que possible.
En savoir plus :No link
sujetEDsfds.pdf
Contact :mathieu.sart@univ-st-etienne.fr
Data Scientist – Entrepôt de données de santé - CHU de Saint Etienne
Publiée le 12/12/2025 10:24.
CDI, Saint Etienne.
Entreprise/Organisme :CHU de Saint Etienne
Niveau d'études :Master
Rémunération :Selon les grilles de l'établissement
Secteur d'activité :Médecine
Description :Le CHU de Saint-Etienne, dans le cadre d’un groupement avec les 3 autres CHU de la région Auvergne-Rhône-Alpes, déploie un entrepôt de données de santé qui vise à valoriser les données cliniques, biologiques et médico-administratives issues des systèmes d’information hospitaliers pour soutenir la recherche, l’évaluation des pratiques et l’innovation en santé. La gestion de cette activité est assurée par la Direction de la Recherche et de l’Innovation qui cherche à constituer une équipe pour exploiter cet entrepôt Dans ce cadre, le Data Scientist contribue à la conception, à la mise en œuvre et à l’exploitation des modèles d’analyse avancée et d’intelligence artificielle appliqués aux données de santé. Le travail est réalisé en étroite collaboration avec les équipes du service d’informatique, les cliniciens et les chercheurs. Le data scientist est membre de la cellule d’ingénierie des données de santé et participe au comité de sélection et d’orientation des projets de recherche sur données de santé
En savoir plus :https://www.chu-st-etienne.fr
Profil de poste EDS Data Scientist CHU St-Etienne 12122025.pdf
Contact :maggy.cino@chu-st-etienne.fr
Analyse statistique des infections des personnes âgées
Publiée le 03/12/2025 18:53.
Référence : Stage M2 - biostatistique appliquée.
Stage, Lille, France.
Entreprise/Organisme :Université de Lille, METRICS - ULR 2694
Niveau d'études :Master
Sujet :Chez les personnes âgées, la perte d’autonomie après hospitalisation est souvent associée à un risque accru de réhospitalisation ou de décès. Le stage vise à modéliser les trajectoires de perte d’indépendance fonctionnelle et leur lien avec ces événements. Une attention particulière sera portée à l’impact des infections aiguës, facteur clé pouvant accélérer cette perte d’autonomie. L’analyse reposera sur des modèles d’événements récurrents, intégrant la présence d’infections et d’autres covariables. Pour mieux tenir compte de l’hétérogénéité entre patients, des modèles à classes latentes seront explorés afin d’identifier des profils de risque distincts selon la dynamique de perte d’autonomie et la fréquence des événements indésirables. Des modèles joints pourront également être utilisés pour relier l’évolution de la perte fonctionnelle dans le temps au risque d’événement terminal. Les données proviennent de la cohorte multicentrique DAMAGE (N = 3509 patients ≥ 75 ans hospitalisés suivis sur un an), contenant des informations riches sur les hospitalisations, les décès et la dépendance fonctionnelle. Compétences attendues : programmation avancée sous R, bonnes bases en modélisation statistique ; des connaissances en analyse de survie sont un atout.
Date de début :April/may 2026
Durée du contrat :6 mois
Secteur d'activité :biostatistique
Description :L’objectif du projet est de déterminer des profils de perte d’indépendance fonctionnelle chez des patients âgés à la sortie d’hospitalisation, et d’étudier leur association avec le risque de survenue d’un évènement clinique et/ou de décès. Une attention particulière sera portée à l’impact des infections aiguës, considérées comme un facteur explicatif potentiel de la perte d’indépendance fonctionnelle et des événements indésirables. Pour cela, les modèles pour les données longitudinales avec les classes latentes seront utilisés. La survenue d’évènement sera prise en compte via les modèles de durée (type modèle de Cox). Les modèles joints seront envisagés afin de modéliser le lien entre la perte d’indépendance fonctionnelle au cours du temps et la survenue d’un évènement. Donneés : Les données disponibles sont de haute qualité car elles comprennent de nombreuses informations des personnes âgées de 75 ans hospitalisés en médecine aigue gériatrique, et suivi sur une période d’un an (cohorte multicentrique DAMAGE, N = 3509 patients). Les données de suivi comprennent de nombreuses informations sur les hospitalisations, le décès et la perte d’indépendance fonctionnelle. Compétences nécessaires : - Programmation R avancée - Modélisation statistique de base - Analyse de survie serait un plus - Modèle linéaire mixte - Rédaction scientifique Informations pratiques : Durée : 6 mois Localisation : ULR2694 METRICS – Pôle recherche de la faculté de médecine – 1 place de Verdun, 59000 Lille
En savoir plus :https://metrics.univ-lille.fr/
sujet_stage.pdf
Contact :genia.babykina@univ-lille.fr
Comparaison de méthodes de classification multivues à l’aide du logiciel R
Publiée le 28/11/2025 09:06.
Stage, Tours.
Entreprise/Organisme :UMR CITERES-LAT et UMR 6285 Laboratoire Lab-STICC
Niveau d'études :Master
Sujet :Comparaison de méthodes de classification multivues à l’aide du logiciel R : application à des données archéologiques
Date de début :à discuter
Durée du contrat :2 mois
Rémunération :gratification selon le tarif en vigueur
Secteur d'activité :statistique appliquée à l'archéologoie
Description :Depuis de nombreuses années, le Laboratoire Archéologie et Territoires (CITERES-LAT , UMR 7324, CNRS – Université de Tours) collabore avec des équipes de statistique afin de concevoir des outils statistiques destinés à l’étude de la chronologie. Une méthode de Classification Ascendante Hiérarchique (CAH) par compromis a notamment été proposée afin de déterminer une partition consensuelle entre deux sources d’information (ex. céramique et stratigraphie) (Bellanger, Coulon, Husi 2021). Cette méthode est désormais implémentée dans le package R SPARTAAS (Statistical Pattern Recognition and daTing using Archeological Artefacts assemblageS) (Coulon, Bellanger, Husi 2023). Le stage volontaire de niveau M1 proposé s’inscrit dans le cadre du projet Arctools (OPEN CNRS) dont l’objectif est d’enrichir le package R SPARTAAS en finalisant sa brique chronologique. Le stage sera encadré en collaboration avec le laboratoire Lab-STICC (UMR 6285, Université Bretagne Sud) pour l’aspect méthodologique en statistique. L’objectif du stage est de mettre en œuvre sous R différentes méthodes de classification non supervisée multivues, puis de les évaluer et de les comparer à l’approche CAH par compromis développée. Les méthodes seront appliquées à des jeux de données simulés ainsi qu’à des données archéologiques réelles, en particulier un corpus céramique d’Angkor Thom (Cambodge, 9ᵉ–15ᵉ s.), déjà organisé au sein d’une base de données.
En savoir plus :No link
Stage_M1_Artools_2026.pdf
Contact :lise.bellanger@univ-ubs.fr
Classification Ascendante Hiérarchique par compromis
Publiée le 28/11/2025 09:06.
Stage, Tours.
Entreprise/Organisme :UMR CITERES-LAT et UMR 6285 Laboratoire Lab-STICC
Niveau d'études :Master
Sujet :Classification Ascendante Hiérarchique par compromis : extension, étude de robustesse et application à des données archéologiques
Date de début :A discuter
Durée du contrat :6 mois
Rémunération :gratification selon le tarif en vigueur
Secteur d'activité :statistique appliquée à l'archéologie et à la santé
Description :Depuis de nombreuses années, le Laboratoire Archéologie et Territoires (CITERES-LAT1, UMR 7324, CNRS – Université de Tours) collabore avec des équipes de statistique afin de concevoir des outils statistiques destinés à l’étude de la chronologie. Une méthode de Classification Ascendante Hiérarchique (CAH) par compromis a notamment été proposée afin de déterminer une partition consensuelle entre deux sources d’information (ex. céramique et stratigraphie) (Bellanger, Coulon, Husi 2021). Cette méthode est désormais implémentée dans le package R SPARTAAS (Statistical Pattern Recognition and daTing using Archeological Artefacts assemblageS) (Coulon, Bellanger, Husi 2023). Le stage de niveau M2 proposé s’inscrit dans le cadre du projet Arctools (OPEN CNRS) dont l’objectif est d’enrichir le package R SPARTAAS en finalisant sa brique chronologique. Les missions confiées à la personne recrutée porteront sur l’extension de la CAH par compromis à plus de deux sources d’informations et incluront : (i) la validation d’une méthode d’optimisation du critère permettant l’obtention du compromis, ainsi que l’étude des propriétés et de la robustesse de cette approche ; (ii) la comparaison avec différentes méthodes de classification non supervisée multivues ; (iii) l’intégration de cette extension dans une fonction R dédiée du package SPARTAAS. Différents corpus de données archéologiques, provenant de l’étude de la céramique - source matérielle omniprésente en archéologie - pourront être mobilisés (fouilles archéologiques réalisées à Angkor Thom, capitale de l’empire khmer (9e et le 15e s.) ou dans le bassin de la Loire Moyenne).
En savoir plus :No link
Stage_M2_Arctools_2026.pdf
Contact :lise.bellanger@univ-ubs.fr
Tests d'adéquation pour les modèles de dégradation
Publiée le 26/11/2025 14:26.
Stage, Pau.
Entreprise/Organisme :Université de Pau et des Pays de l'Adour
Niveau d'études :Master
Sujet :Le but du stage est d'étudier et d'implémenter les tests d'adéquation aux modèles de dégradation existant, et d'étudier leur généralisation aux modèles de maintenance imparfaite. Le stage commencera par l'implémentation des tests d'adéquation aux processus Gamma proposés par Grall-Maës et Verdier. On étudiera ensuite la possibilité d'adapter ces procédures aux processus de Wiener. Dans un deuxième temps, on étudiera l'approche non-paramétrique proposée par Zheng et al. La statistique de test est basée sur une mesure de similarité entre des trajectoires de dégradation observée et des trajectoires de dégradation simulées. Les valeurs critiques utilisées pour le test sont obtenues par bootstrap paramétrique. L'avantage de ce type de méthode est d'être valable pour n'importe quel processus de dégradation. Dans un troisième temps, on étudiera l'adaptation de ces méthodes aux modèles de maintenance imparfaite, comme les mode les ARD1 et ARD infini. La qualité des tests proposés sera évaluée sur des données simulées grâce à des simulations intensives. Enfin, l'ensemble des méthodes précédentes seront appliquées à des données de dégradation de systèmes de production d'électricité d'EDF.
Date de début :février/mars 2026
Durée du contrat :5 ou 6 mois avec possibilité de financement pour une poursuite en thèse
Rémunération :4.35€ par heure de stage soit environ 670€ par mois
Secteur d'activité :Recherche
Description :Le projet de recherche PADAWAN (Physical Asset management : DAta, models, health aWAre-decisioN) financé par l’ANR (Agence Nationale pour la Recherche) regroupe 5 laboratoires de recherche des Universités de Grenoble, Bordeaux, Marseille, Troyes et Pau sur la thématique de la modélisation stochastique, les méthodes statistiques et les stratégies de prise de décision pour la gestion de l’état de santé d’actifs industriels, plus particulièrement en lien avec les problématiques de dégradation et de maintenance. Les applications industrielles du projet PADAWAN s’appuieront sur des données d’EDF (dégradation de gros composants de centrales de production d’électricité), mais aussi des grands acteurs de la gestion des réseaux d’eau (pompes de stations d’épuration). Dans ce cadre, PADAWAN fait une offre de stage de fin d’études de Master ou écoles d’ingénieur sur la thématique des tests d'adéquation pour les modèles de dégradation. Le projet PADAWAN dispose d’ores et déjà de 3 financements de thèse, dont l’un sera ouvert sur un sujet connexe au stage et avec les mêmes encadrants pour un démarrage à la rentrée universitaire 2026.
En savoir plus :https://cparoiss.perso.univ-pau.fr/
Stage-UPPA-UGA.pdf
Contact :christian.paroissin@univ-pau.fr
Ingénieur de formation orienté Intelligence Artificielle
Publiée le 24/11/2025 10:06.
Référence : Ingénieur formation IA.
CDD, Troyes.
Entreprise/Organisme :Université de Technologie de Troyes
Niveau d'études :Doctorat
Date de début :Dès que possible
Durée du contrat :4 ans
Secteur d'activité :Enseignement supérieur
Description :Missions de l’agent : Rattaché à la Direction de la formation et de la pédagogie, l’ingénieur de formation orienté IA fera partie d’une équipe projet impliquant la formation initiale, la formation continue, la coopérative pédagogique (le centre d’innovation pédagogique de l’UTT). Il/elle jouera un rôle clé dans la conception, la structuration et la mise en œuvre de ce nouveau programme de formation, en collaboration avec des experts du domaine, des enseignants, des ingénieurs pédagogiques et des partenaires académiques. Il/elle pourra être amené(e) à organiser et animer des sessions de formation (CM, TD, TP, webinaire, …) en soutien au déploiement de nouveaux contenus. Enfin, il/elle pourra contribuer aux comptes rendus, rapports d’activité et constitution de pièces justificatives éventuellement demandées par le financeur H!Paris.
En savoir plus :https://www.utt.fr
F_H Ingénieur_Formation_IA.pdf
Contact :drh-recrutement@utt.fr
Stage M2 (2026, 6 mois) : Approches statistiques de bioéquivalence pour médicaments injectables
Publiée le 21/11/2025 13:20.
Stage, Lille.
Entreprise/Organisme :ULR 2694 Metrics, Université de Lille
Niveau d'études :Master
Sujet :Évaluation d’approches de bioéquivalence par modélisation pour le développement de génériques de médicaments injectables à libération prolongée
Date de début :A partir de Janvier 2026
Durée du contrat :6 mois
Rémunération :610€/mois (4.35€ net/h)
Secteur d'activité :Statistique, Pharmacométrie
Description :Garantir l’accès à des génériques sûrs et abordables reste un défi, notamment pour les formes injectables à libération prolongée (LAI), dont les essais de bioéquivalence (BE) sont souvent complexes. L’approche Model-Based BioEquivalence (MBBE), fondée sur la modélisation pharmacocinétique (PK) de population, est adaptée aux échantillons peu denses, fréquents dans ce contexte. Elle est ainsi recommandée par la FDA depuis 2022 pour l’évaluation de la BE des LAIs. Une première stratégie MBBE, développée par l’équipe Moclid (Paris), a ensuite fait l’objet de développements complémentaires en collaboration avec l’équipe Metrics (Lille). Elle repose sur trois étapes : ajustement du modèle, estimation de l’incertitude, puis test de BE basé sur une hypothèse de normalité des paramètres PK d’intérêt. Une équipe du département de Pharmacie de l'université d'Uppsala propose une stratégie alternative, intégrant une étape de simulation de population, suivie d’une évaluation de la BE à partir de la distribution empirique des rapports de moyennes géométriques, sans hypothèse de distribution. L’objectif du stage est de comparer les deux stratégies MBBE décrites ci-dessus, à partir d’essais simulés de BE de LAI. La génération d’essais réalistes reposera sur une revue systématique des publications concernant un médicament LAI, suivie de la simulation des essais de BE selon différents scénarios.
En savoir plus :No link
M2_2026_MBBE_LAI.pdf
Contact :florence.loingeville@univ-lille.fr
Mesure et modélisation teneur en eau du sol – Application à des chênaies en cours de dépérissement
Publiée le 17/11/2025 07:37.
Référence : Stage M2 teneur en eau du sol forêt Troncais.
Stage, UMR PIAF, INRAE de Crouelle, 5 chemin de Beaulieu, 63000 Clermont-Ferrand.
Entreprise/Organisme :INRAE UMR PIAF
Niveau d'études :Master
Sujet :Informations générales L’UMR de Physique et Physiologie Intégratives de l’Arbre en environnement Fluctuant (PIAF) basé à Clermont-Ferrand (63) et associant INRAE et Université Clermont Auvergne, s’intéresse aux réponses des arbres aux facteurs physiques de l’environnement affectés par le bouleversement climatique (hydrique, thermique, mécanique) et déterminant leur acclimatation ou survie. Description de l’offre L’état général sanitaire des forêts se dégrade. Le dépérissement, voire la mortalité des arbres, deviennent une observation courante. La cause primaire de ces dépérissements est à chercher du côté des changements de climat que nous subissons, bien que des attaques parasitaires ne soient pas à écarter. Depuis la célèbre sécheresse de 1976, d’autres lui ont succédé, toujours plus fortes et rapprochées, laissant peu de répit aux arbres. Le manque d’eau est renforcé par des températures en constante augmentation qui accentuent la sécheresse atmosphérique et donc l’évapotranspiration des arbres. Dans ce contexte, il devient donc crucial d’avoir des outils fiables de mesures de la teneur en eau du sol, afin de mieux quantifier le réservoir en eau dont dispose les arbres, et donc les risques de rupture hydraulique en dessous d’une certaine quantité. Nous savons en effet qu’une des composantes majeures du dépérissement des forêts repose sur la disponibilité en eau du sol. Différentes techniques sont disponibles pour mesurer la teneur en eau du sol, depuis la pesée d’échantillons de sol prélevés in situ à des sondes plus ou moins sophistiquées (Time Domain Reflectometry, TDR, par exemple). Cependant ces mesures assez chronophages sont aussi très ponctuelles et limitées dans l’espace. Les méthodes géophysiques émergent en milieu forestier pour caractériser les propriétés du sol dans un espace plus grand et apprécier les variations spatio-temporelles en 3D. La tomographie de résistivité électrique (ERT) ou l’induction électromagnétique (EMI) permettent de mesurer la résistivité électrique du sol de façon non-destructive. Cette propriété est reliée, entre autres variables, à la teneur en eau du sol. Cependant la relation n’est pas immédiate et nécessite un étalonnage par d’autres mesures plus directes (TDR par exemple).
Date de début :Flexible janvier à mars 2026
Durée du contrat :~ 6 mois
Rémunération :Gratification environ 600 €/mois
Secteur d'activité :Physique du sol, Géophysique, Hydrologie, Ecologie
Description :Le stage proposé vise à traiter et comparer diverses méthodes géophysiques et in-situ permettant d’estimer la teneur en eau du sol par des techniques directs (TDR) et indirectes (ERT, EMI) dans un réseau de placettes forestières installé en forêt tempérée de chêne (Tronçais, Allier). Ces placettes présentent diverses structures et densités d’arbres. Des capteurs autonomes suivent le microclimat (température, eau) et la croissance des arbres ainsi que leur état sanitaire. Dans ce cadre, le stage propose d’investiguer la pertinence de ces différentes techniques à quantifier et modéliser en 3D l’évolution de la teneur en eau du sol en fonction de la densité des arbres et du climat. Plusieurs années de données sont disponibles à cet effet qui seront complétées par des mesures directes durant le stage. Profil : - Stage de fin d’études d’Ingénieur ou Master II - Profil physicien(ne) du sol ou géophysicien(ne), notions en hydrologie et en écologie seraient un plus - Rigueur dans la démarche - Qualités relationnelles - Intérêt pour les mesures en extérieur (forêt) - Analyses statistiques et modélisation mathématique - Bonnes capacités en programmation (R, python)
En savoir plus :No link
OffreStage_Eau_Sol_Troncais.pdf
Contact :philippe.balandier@inrae.fr
Développement de méthodes statistiques en causalité
Publiée le 13/11/2025 12:02.
Référence : Stage recherche en causalité.
Stage, Paris, 6ème arrondissement ou Lille, Cité scientifique.
Entreprise/Organisme :Université Paris Cité ou Université de Lille
Niveau d'études :Master
Sujet :1) Causalité en présence d'une exposition multiple Dans les cours introductifs de causalité, le premier type d’effet causal à être présenté est en général l'``effet causal moyen'' (ATE) pour une exposition binaire A et une réponse continue Y. Dans ce cas, l'ATE est défini comme la différence entre les valeurs attendues de la réponse sous l’exposition et en absence de l’exposition : ATE = E[Y(1)] - E[Y(0)]. Pour certaines applications, il est intéressant de considérer l’effet d’une exposition vectorielle A dans un espace euclidien de dimension d. Dans ce contexte, le paramètre cible E[Y(a_1,…,a_d)] définit une fonction ``dose-réponse'' de R^d vers R. Pour identifier ce paramètre, on peut utiliser une approche basée sur les scores de propension multivariés. La difficultés consiste alors à estimer des fonctions de densités conditionnelles multivariées. Une méthode simple consiste à modéliser ces densités par régression linéaire multivariée (Fong 2018, Williams 2020). Nous souhaiterions explorer d’autres approches pour estimer ces densités multivariées conditionnelles à l’aide de méthodes non paramétriques ou paramétrique mais flexibles. Dans cette deuxième classe de méthodes, on trouve les approches basées sur des réseaux de neurones. Par exemple, Shi et al. (2019) décrivent une architecture pour l’estimation du score de propension pour une exposition réelle. Il serait intéressant d’étudier la généralisation à une exposition multivariée. Une autre piste intéressante est celle des flots génératifs (voir Papamakarios 2021). Le stage pourrait porter sur l’étude d’une, ou plusieurs de ces approches, avec une validation par simulations. Nous aurons aussi la possibilité d’appliquer ces méthodes à des données réelles issues d’une cohorte française pour étudier les effets d’un mélange de polluants organiques persistants sur un événement de santé. 2) Causalité en analyse de survie En analyse de survie causale, on s’intéresse à l'effet causal d’une exposition sur le temps avant un événement d’intérêt T en présence de données censurées. Le correspondant de l'ATE dans ce contexte est donné par la différence P(T(1)>t) - P(T(0)>t), ou son intégrale par rapport à t sur un intervalle limité. Les résultats d’identification de l’ATE sur données non-censurées peuvent s’étendre à ce cadre, en considérant des poids qui prennent en compte non seulement la probabilité conditionnelle du traitement mais aussi la fonction de survie conditionnelle de la censure (Cheng 2022). Cette approche donne un estimateur consistant si les modèles utilisés pour estimer les probabilités conditionnelles définissant les poids sont bien spécifiés. Des estimateurs doublement robustes qui sont consistants sous des hypothèses moins restrictives ont également été proposés (Rytgaard 2023). Ces estimateurs, appelés estimateurs ``d'apprentissage ciblé'' sont issus de la théorie de l’efficacité semi-paramétrique (voir par exemple le lien Github ``Introduction to modern causal inference'' de Schuler et van der Laan). La théorie mathématique sous-jacente à ces estimateurs est particulièrement riche et élégante mais demande un peu d’investissement. Le stage pourrait porter sur un travail bibliographique pour comprendre et présenter de façon accessible ces approches et, si possible, sur une validation par simulations. Il sera aussi possible d’appliquer les méthodes étudiées à des données de vie réelle pour étudier l’effet d’un traitement hormonal sur le cancer du sein.
Date de début :A n'importe quel moment à partir du mois de février
Durée du contrat :4 à 6 mois
Rémunération :660 euros par mois
Secteur d'activité :Statistique
Description :1) Causalité en présence d'une exposition multiple Dans les cours introductifs de causalité, le premier type d’effet causal à être présenté est en général l'``effet causal moyen'' (ATE) pour une exposition binaire A et une réponse continue Y. Dans ce cas, l'ATE est défini comme la différence entre les valeurs attendues de la réponse sous l’exposition et en absence de l’exposition : ATE = E[Y(1)] - E[Y(0)]. Pour certaines applications, il est intéressant de considérer l’effet d’une exposition vectorielle A dans un espace euclidien de dimension d. Dans ce contexte, le paramètre cible E[Y(a_1,…,a_d)] définit une fonction ``dose-réponse'' de R^d vers R. Pour identifier ce paramètre, on peut utiliser une approche basée sur les scores de propension multivariés. La difficultés consiste alors à estimer des fonctions de densités conditionnelles multivariées. Une méthode simple consiste à modéliser ces densités par régression linéaire multivariée (Fong 2018, Williams 2020). Nous souhaiterions explorer d’autres approches pour estimer ces densités multivariées conditionnelles à l’aide de méthodes non paramétriques ou paramétrique mais flexibles. Dans cette deuxième classe de méthodes, on trouve les approches basées sur des réseaux de neurones. Par exemple, Shi et al. (2019) décrivent une architecture pour l’estimation du score de propension pour une exposition réelle. Il serait intéressant d’étudier la généralisation à une exposition multivariée. Une autre piste intéressante est celle des flots génératifs (voir Papamakarios 2021). Le stage pourrait porter sur l’étude d’une, ou plusieurs de ces approches, avec une validation par simulations. Nous aurons aussi la possibilité d’appliquer ces méthodes à des données réelles issues d’une cohorte française pour étudier les effets d’un mélange de polluants organiques persistants sur un événement de santé. 2) Causalité en analyse de survie En analyse de survie causale, on s’intéresse à l'effet causal d’une exposition sur le temps avant un événement d’intérêt T en présence de données censurées. Le correspondant de l'ATE dans ce contexte est donné par la différence P(T(1)>t) - P(T(0)>t), ou son intégrale par rapport à t sur un intervalle limité. Les résultats d’identification de l’ATE sur données non-censurées peuvent s’étendre à ce cadre, en considérant des poids qui prennent en compte non seulement la probabilité conditionnelle du traitement mais aussi la fonction de survie conditionnelle de la censure (Cheng 2022). Cette approche donne un estimateur consistant si les modèles utilisés pour estimer les probabilités conditionnelles définissant les poids sont bien spécifiés. Des estimateurs doublement robustes qui sont consistants sous des hypothèses moins restrictives ont également été proposés (Rytgaard 2023). Ces estimateurs, appelés estimateurs ``d'apprentissage ciblé'' sont issus de la théorie de l’efficacité semi-paramétrique (voir par exemple le lien Github ``Introduction to modern causal inference'' de Schuler et van der Laan). La théorie mathématique sous-jacente à ces estimateurs est particulièrement riche et élégante mais demande un peu d’investissement. Le stage pourrait porter sur un travail bibliographique pour comprendre et présenter de façon accessible ces approches et, si possible, sur une validation par simulations. Il sera aussi possible d’appliquer les méthodes étudiées à des données de vie réelle pour étudier l’effet d’un traitement hormonal sur le cancer du sein.
En savoir plus :https://obouaziz.github.io/supervision.html
Stage_Causalite.pdf
Contact :olivier.bou-aziz@univ-lille.fr

Page précédente  1  <2>  3  Page suivante

 
 
©2026 SFdS
Société Française de Statistique
Institut Henri Poincaré
11 rue Pierre et Marie Curie
75231 Paris cedex 5
Tél. : +33 (0)1 44 27 66 60
Notre site a été supporté par :