Consulter les offres d’emploi

Développement de méthodes statistiques en causalité
Publiée le 13/11/2025 12:02.
Référence : Stage recherche en causalité.
Stage, Paris, 6ème arrondissement ou Lille, Cité scientifique.
Entreprise/Organisme :Université Paris Cité ou Université de Lille
Niveau d'études :Master
Sujet :1) Causalité en présence d'une exposition multiple Dans les cours introductifs de causalité, le premier type d’effet causal à être présenté est en général l'``effet causal moyen'' (ATE) pour une exposition binaire A et une réponse continue Y. Dans ce cas, l'ATE est défini comme la différence entre les valeurs attendues de la réponse sous l’exposition et en absence de l’exposition : ATE = E[Y(1)] - E[Y(0)]. Pour certaines applications, il est intéressant de considérer l’effet d’une exposition vectorielle A dans un espace euclidien de dimension d. Dans ce contexte, le paramètre cible E[Y(a_1,…,a_d)] définit une fonction ``dose-réponse'' de R^d vers R. Pour identifier ce paramètre, on peut utiliser une approche basée sur les scores de propension multivariés. La difficultés consiste alors à estimer des fonctions de densités conditionnelles multivariées. Une méthode simple consiste à modéliser ces densités par régression linéaire multivariée (Fong 2018, Williams 2020). Nous souhaiterions explorer d’autres approches pour estimer ces densités multivariées conditionnelles à l’aide de méthodes non paramétriques ou paramétrique mais flexibles. Dans cette deuxième classe de méthodes, on trouve les approches basées sur des réseaux de neurones. Par exemple, Shi et al. (2019) décrivent une architecture pour l’estimation du score de propension pour une exposition réelle. Il serait intéressant d’étudier la généralisation à une exposition multivariée. Une autre piste intéressante est celle des flots génératifs (voir Papamakarios 2021). Le stage pourrait porter sur l’étude d’une, ou plusieurs de ces approches, avec une validation par simulations. Nous aurons aussi la possibilité d’appliquer ces méthodes à des données réelles issues d’une cohorte française pour étudier les effets d’un mélange de polluants organiques persistants sur un événement de santé. 2) Causalité en analyse de survie En analyse de survie causale, on s’intéresse à l'effet causal d’une exposition sur le temps avant un événement d’intérêt T en présence de données censurées. Le correspondant de l'ATE dans ce contexte est donné par la différence P(T(1)>t) - P(T(0)>t), ou son intégrale par rapport à t sur un intervalle limité. Les résultats d’identification de l’ATE sur données non-censurées peuvent s’étendre à ce cadre, en considérant des poids qui prennent en compte non seulement la probabilité conditionnelle du traitement mais aussi la fonction de survie conditionnelle de la censure (Cheng 2022). Cette approche donne un estimateur consistant si les modèles utilisés pour estimer les probabilités conditionnelles définissant les poids sont bien spécifiés. Des estimateurs doublement robustes qui sont consistants sous des hypothèses moins restrictives ont également été proposés (Rytgaard 2023). Ces estimateurs, appelés estimateurs ``d'apprentissage ciblé'' sont issus de la théorie de l’efficacité semi-paramétrique (voir par exemple le lien Github ``Introduction to modern causal inference'' de Schuler et van der Laan). La théorie mathématique sous-jacente à ces estimateurs est particulièrement riche et élégante mais demande un peu d’investissement. Le stage pourrait porter sur un travail bibliographique pour comprendre et présenter de façon accessible ces approches et, si possible, sur une validation par simulations. Il sera aussi possible d’appliquer les méthodes étudiées à des données de vie réelle pour étudier l’effet d’un traitement hormonal sur le cancer du sein.
Date de début :A n'importe quel moment à partir du mois de février
Durée du contrat :4 à 6 mois
Rémunération :660 euros par mois
Secteur d'activité :Statistique
Description :1) Causalité en présence d'une exposition multiple Dans les cours introductifs de causalité, le premier type d’effet causal à être présenté est en général l'``effet causal moyen'' (ATE) pour une exposition binaire A et une réponse continue Y. Dans ce cas, l'ATE est défini comme la différence entre les valeurs attendues de la réponse sous l’exposition et en absence de l’exposition : ATE = E[Y(1)] - E[Y(0)]. Pour certaines applications, il est intéressant de considérer l’effet d’une exposition vectorielle A dans un espace euclidien de dimension d. Dans ce contexte, le paramètre cible E[Y(a_1,…,a_d)] définit une fonction ``dose-réponse'' de R^d vers R. Pour identifier ce paramètre, on peut utiliser une approche basée sur les scores de propension multivariés. La difficultés consiste alors à estimer des fonctions de densités conditionnelles multivariées. Une méthode simple consiste à modéliser ces densités par régression linéaire multivariée (Fong 2018, Williams 2020). Nous souhaiterions explorer d’autres approches pour estimer ces densités multivariées conditionnelles à l’aide de méthodes non paramétriques ou paramétrique mais flexibles. Dans cette deuxième classe de méthodes, on trouve les approches basées sur des réseaux de neurones. Par exemple, Shi et al. (2019) décrivent une architecture pour l’estimation du score de propension pour une exposition réelle. Il serait intéressant d’étudier la généralisation à une exposition multivariée. Une autre piste intéressante est celle des flots génératifs (voir Papamakarios 2021). Le stage pourrait porter sur l’étude d’une, ou plusieurs de ces approches, avec une validation par simulations. Nous aurons aussi la possibilité d’appliquer ces méthodes à des données réelles issues d’une cohorte française pour étudier les effets d’un mélange de polluants organiques persistants sur un événement de santé. 2) Causalité en analyse de survie En analyse de survie causale, on s’intéresse à l'effet causal d’une exposition sur le temps avant un événement d’intérêt T en présence de données censurées. Le correspondant de l'ATE dans ce contexte est donné par la différence P(T(1)>t) - P(T(0)>t), ou son intégrale par rapport à t sur un intervalle limité. Les résultats d’identification de l’ATE sur données non-censurées peuvent s’étendre à ce cadre, en considérant des poids qui prennent en compte non seulement la probabilité conditionnelle du traitement mais aussi la fonction de survie conditionnelle de la censure (Cheng 2022). Cette approche donne un estimateur consistant si les modèles utilisés pour estimer les probabilités conditionnelles définissant les poids sont bien spécifiés. Des estimateurs doublement robustes qui sont consistants sous des hypothèses moins restrictives ont également été proposés (Rytgaard 2023). Ces estimateurs, appelés estimateurs ``d'apprentissage ciblé'' sont issus de la théorie de l’efficacité semi-paramétrique (voir par exemple le lien Github ``Introduction to modern causal inference'' de Schuler et van der Laan). La théorie mathématique sous-jacente à ces estimateurs est particulièrement riche et élégante mais demande un peu d’investissement. Le stage pourrait porter sur un travail bibliographique pour comprendre et présenter de façon accessible ces approches et, si possible, sur une validation par simulations. Il sera aussi possible d’appliquer les méthodes étudiées à des données de vie réelle pour étudier l’effet d’un traitement hormonal sur le cancer du sein.
En savoir plus :https://obouaziz.github.io/supervision.html
Stage_Causalite.pdf
Contact :olivier.bou-aziz@univ-lille.fr
Modélisation de la décroissance des anticorps anti-HLA chez les patients hyperimmunisés
Publiée le 10/11/2025 16:41.
Référence : Modelisation_Decroissance_antiHLA.
Stage, Grenoble.
Entreprise/Organisme :Université-Grenoble-Alpes, laboratoire TIMC
Niveau d'études :Master
Sujet :Modélisation de la décroissance des anticorps anti-HLA chez les patients hyperimmunisés suivis en protocole de désimmunisation
Date de début :février - mars 2026
Durée du contrat :5-6 mois
Rémunération :environ 630 Euros nets/mois
Secteur d'activité :biostatistiques
Description :L’insuffisance rénale chronique constitue un enjeu majeur de santé publique. En France, plusieurs dizaines de milliers de patients dépendent d’un traitement de suppléance rénale, par dialyse ou transplantation. Cependant, certains patients dits hyperimmunisés présentent un taux de greffons incompatibles (TGI) supérieur à 80%, rendant l’accès à la greffe extrêmement difficile. Le CHU Grenoble-Alpes propose, pour ces patients, un protocole de désimmunisation par immunoabsorption (IA) visant à réduire la quantité d’anticorps anti-HLA circulants et ainsi abaisser le TGI. La compréhension et la modélisation de la dynamique de décroissance des anticorps anti-HLA (classes I et II) au cours de ces séances sont essentielles pour optimiser les protocoles et anticiper le moment où un patient devient éligible à la greffe. L'objectif principal est de décrire et modéliser la décroissance des anticorps anti-HLA au cours des protocoles d’immunoabsorption.
En savoir plus :No link
StageMaster2_Modelisation.pdf
Contact :caroline.bazzoli@univ-grenoble-alpes.fr
Intern in Biostatistics & Data Science - Python pipeline to generate biomarker signature candidates
Publiée le 10/11/2025 10:06.
Stage, 30 rue de Campo Formio 75013 PARIS.
Entreprise/Organisme :Brain&Mind
Niveau d'études :Master
Sujet :In clinical trials, a panel of biomarkers is often investigated in combination with few clinical covariates & baseline characteristics to discover (see BEST guidance for more information): • predictive signatures: to identify responders/non-responders of a drug • prognostic signatures: to identify fast/slow progressors of a disease • diagnostic signatures: to distinct a condition from another The main objective of this internship is to provide a tool to the biostatistician community to accelerate biomarker signature discovery. The idea is to implement a framework within which as many steps as possible are automated with optional settings, while providing tailored outputs. In particular, it will include: - a data science pipeline: sequence of elements including resampling, reformating, dimension reduction, implementation of various ML/DL algorithms and prediction for a new patient. - a HTLM report with key outputs (e.g., performance, algo choice, interpretability of results)
Date de début :mars-avril 2026 (négociable)
Durée du contrat :6 mois
Secteur d'activité :Médecine/Pharma/Santé
Description :Brain&Mind is a French non-profit association, created by l'Institut du Cerveau de Paris, la Fondation Voir&Entendre and la Fondation FondaMental, whose objective is to accelerate innovation in Neuroscience (Neurology, Psychiatry, Sensory Disorders). The production launch of a new proteomics platform dedicated to Neuroscience is planned by Q4 2026. The technology and the panel of neurological biomarkers (proteomics here) were deeply discussed with various experts, ensuring this platform to be highly sensitive to a large set of biomarkers (proteins here) identified as major in Neuroscience. In practice, as already performed in clinical trials, a panel of biomarkers is investigated in combination with few clinical covariates & baseline characteristics to discover (see BEST guidance for more information): • predictive signatures: to identify responders/non-responders of a drug • prognostic signatures: to identify fast/slow progressors of a disease • diagnostic signatures: to distinct a condition from another The main objective of this internship is to provide a tool to the biostatistician community to accelerate biomarker signature discovery. All the definitions above have some commonalities and specificities. The idea is to implement a framework within which as many steps as possible are automated with optional settings, while providing tailored outputs. Main deliverables: • Flexible, user-friendly & automated pipeline with the following steps: o Merging of clinical & biomarker datasets o Data science pipeline: sequence of elements including resampling, reformating, dimension reduction, implementation of various ML/DL algorithms and prediction for a new patient. • Associated HTML reporting with: o Summary of potential QC steps o Summary of performance metrics for several algorithms o Best combinations for biomarker signature candidates o Interpretability (at local and/or global level) o Descriptive statistics & involved pathways Qualifications : • M2 or engineering schools (e.g. ENSAI, ENSAE, ISUP, Centrale-Supelec, …) specialized in Applied Mathematics, Statistics or Data Science • A previous experience with Python: scikit-learn, lime, PyTorch or TensorFlow, … • A previous experience with Git and Github or GitLab • Fluent English • Team spirit, curious, rigorous, autonomous Optional knowledge considered a plus: • R packages: mlr3, caret, tidymodels, DALEX, … • Cloud Data Processing • Bioinformatics • Object-oriented programming
En savoir plus :https://brainandmind.sharepoint.com
Internship_Brain&Mind_Biostatistics_DataScience.pdf
Contact :hr@brainandmind.fr
Caractérisation des lactations longues chez la chèvre laitière
Publiée le 03/11/2025 11:47.
Référence : ESCaLL_CaracLL.
Stage, Paris.
Entreprise/Organisme :Institut de l'Elevage
Niveau d'études :Master
Sujet :Caractérisation des lactations longues chez la chèvre laitière et identification de facteurs précoces de réussite
Date de début :à partir de janvier - mars 2026
Durée du contrat :6 mois
Rémunération :Gratification brute : 659,76€/mois ; Repas : 5,35€/jour ; Avantages CSE
Description :Dans les élevages caprins, la stratégie de lactation longue consiste à laisser une chèvre en production au-delà de 485 jours. Cette conduite, utilisée dans de nombreux élevages, répond à différents objectifs : réduire le nombre de mises bas, limiter les périodes improductives, pérenniser l’offre en lait tout au long de l’année et participe ainsi à une meilleure durabilité des élevages. Toutefois, la variabilité des réponses individuelles des chèvres reste encore mal comprise, et l’absence de critères précoces robustes et facilement mobilisables, pour identifier les animaux les plus aptes à soutenir une production laitière prolongée, constituent un frein à sa généralisation ou au choix adapté afin d’éviter des échecs de lactations longues. Les choix empiriques pour déterminer les candidates à la lactation peuvent être conforté par l’étude fine de prédicteurs issus du début de la lactation ou de la carrière des chèvres favorisant ainsi le choix de la conduite adaptée à chaque animal. Ces avancées pourraient favoriser l’émergence d’outils d’aide à la décision pour les éleveurs, contribuant à une gestion plus fine et individualisée des animaux et à la valorisation des trajectoires animales les plus efficientes. L’objectif principal du stage est de définir les caractéristiques des lactations longues performantes et d’identifier des indicateurs précoces pour anticiper leur réussite. Le travail s’appuiera sur un jeu de données comprenant plus de 450 lactations longues, issues de 5 élevages caprins. Une modélisation des courbes de lait a permis d’isoler une courbe du potentiel théorique de l’animal à partir de données de production perturbées. Une perturbation est définie comme une modification brutale, temporaire ou prolongée, de la courbe de lactation d’une chèvre en réponse à des facteurs environnementaux (alimentation, stress thermique, sanitaire, changements de pratique d’élevage…) ou physiologiques (facteurs d’ordre hormonaux). Chaque courbe de lait est donc décrite par un ensemble de 11 paramètres décrivant le potentiel de l’animal (pics, rebonds, persistances…) et par d’autres paramètres décrivant les perturbations (durée, intensité…). Plusieurs étapes permettront de répondre à l’objectif du stage : • Décrire la variabilité des profils de lactations longues à partir des paramètres issus de la modélisation en s’intéressant à la persistance, aux pics, aux rebonds… • Décrire les perturbations (nombre, intensité, moment d’apparition, caractère collectif ou individuel…) et les caractériser en fonction du stade physiologique des animaux et de caractéristiques animales (niveau de production, parité, concentrations cellulaires…) • Evaluer dans quelle mesure les perturbations influencent l’interprétation des performances de production des lactations longues, en comparant le potentiel théorique à la production effective (comparaison des productions au pic, des cumuls de production…) • Identifier les facteurs précoces permettant d’anticiper une bonne lactation longue en s’appuyant sur les données disponibles avant 200 jours (production, état corporel, conformation de la mamelle, présence de perturbation...) En complément, une exploration pourra être conduite sur des données du contrôle laitier à fréquence mensuelle, afin d’évaluer dans quelle mesure les facteurs précoces de réussite en lactation longue peuvent être estimés en routine pour appuyer le conseil technique en élevage caprin.
En savoir plus :No link
20240924_OffreStage_CaracterisationLL (Stage 1).pdf
Contact :maxime.legris@idele.fr
Estimation des paramètres synthétiques de lactation longue
Publiée le 03/11/2025 11:47.
Référence : ESCaLL_ParamLL.
Stage, Paris.
Entreprise/Organisme :Institut de l'Elevage
Niveau d'études :Master
Sujet :Estimation des paramètres synthétiques de lactation longue à partir de données mensuelles en élevage caprin
Date de début :à partir de janvier - mars 2026
Durée du contrat :6 mois
Rémunération :Gratification brute : 659,76€/mois ; Repas : 5,35€/jour ; Avantages CSE
Description :En France, le suivi des productions laitières des chèvres est basé sur des enregistrements mensuels, effectués dans le cadre du contrôle de performance. Classiquement, la durée d’une lactation de chèvres est de l’ordre de 300 jours et sur cette période les performances sont relativement bien décrites au travers de paramètres tels que le pic et la persistance de la lactation. Or, de nouvelles pratiques ont émergé dans les élevages caprins. Parmi elles, la stratégie de lactation longue (LL) consiste à laisser une chèvre en production au-delà de 485 jours. Cette conduite, utilisée dans de nombreux élevages, répond à différents objectifs : réduire le nombre de mises bas, limiter les périodes improductives, pérenniser l’offre en lait tout au long de l’année et participe ainsi à une meilleure durabilité des élevages. Pour ces chèvres en lactation longue, l’analyse des courbes de production est confrontée à des difficultés de deux ordres : la spécificité de la courbe de lactation encore insuffisamment décrite et d’autre part la fréquence mensuelle de l’information. L’exploration de données issues de stations expérimentales permet de disposer d’informations précises à des fréquences supérieures (hebdomadaires voire journalières) permettant de caractériser les performances animales au travers de paramètres synthétiques (pics, rebonds, persistances…). Ces données très détaillées sur peu de fermes sont essentielles à la compréhension fine des mécanismes physiologiques mais ne rendent pas compte de la variabilité des performances des 2000 élevages suivis au niveau national. En s’appuyant sur les données des stations expérimentales, l’objectif principal du stage est de définir et tester une méthode permettant d’estimer, de manière suffisamment précise, les paramètres synthétiques de la courbe de lait d’un animal, à partir des données mensuelles du contrôles laitier. Le travail s’appuiera sur un jeu de données comprenant 1500 lactations dont 450 lactations longues, issues de 5 élevages expérimentaux caprins. Une modélisation des courbes journalières de lait a permis de déterminer un ensemble de 11 paramètres décrivant le potentiel de l’animal (pics, rebonds, persistances…). Les informations mensuelles du contrôle laitier sont également disponibles pour ces mêmes lactations. Plusieurs étapes permettront de répondre à l’objectif du stage : •Décrire la variabilité des profils des 450 lactations longues à partir des paramètres issus de la modélisation en s’intéressant à la persistance, aux pics, aux rebonds… • Comparer ces profils à ceux de leurs congénères en lactation classique en prenant en compte différents facteurs individuels (parité, niveau de production, race…) • Etablir un ou des modèles d’estimation des paramètres synthétiques à partir des données mensuelles du contrôles laitier. Selon les performances des modèles, on pourra soit les appliquer à l’ensemble des lactations de la base nationale et décrire la variabilité des performances obtenues ; soit faire des simulations sur la granularité optimale des données pour obtenir des estimations fiables.
En savoir plus :No link
20240924_OffreStage_ModelisationLL (Stage 2).pdf
Contact :maxime.legris@idele.fr
Biostatisticien(ne) / Data scientist en santé
Publiée le 03/11/2025 11:47.
CDD, Paris 12e.
Entreprise/Organisme :Sorbonne Université - Inserm
Niveau d'études :Master
Date de début :01/01/2025
Durée du contrat :12 mois renouvellables
Description :Ce poste est à pourvoir au sein de la faculté de santé – site Saint-Antoine, au sein de l’Institut Pierre Louis d’Épidémiologie et de Santé Publique (Iplesp), https://iplesp.fr CONTEXTE L’équipe Sentinelles fait partie de l'équipe « Surveillance et Modélisation des maladies transmissibles » (SUMO) au sein de l’Institut Pierre Louis d’Épidémiologie et de Santé Publique (Iplesp), sous la tutelle de l’Inserm et de Sorbonne Université. Elle effectue des travaux de veille sanitaire et de recherche en épidémiologie, principalement dans les champs des maladies infectieuses et des soins primaires. Deux réseaux y sont coordonnés en France métropolitaine en partenariat avec Santé publique France : - le réseau Sentinelles (www.sentiweb.fr), composé de 1300 médecins généralistes et d’une centaine de pédiatres libéraux, permet la surveillance d’une dizaine d’indicateurs de santé et la mise en place d’études épidémiologiques ; - et le réseau Grippenet/Covidnet (https://www.grippenet.fr) en population générale, composé de 7 000 personnes, permet la surveillance des infections respiratoires et la mise en place d’études épidémiologiques. DENOMINATION DU POSTE Poste : Biostaticien(ne) au sein du réseau Sentinelles Localisation : Faculté de santé Sorbonne Université, site Saint-Antoine, Paris 12ème Rattachement : Iplesp - Equipe 1 « Surveillance et modélisation des maladies infectieuses » (SUMO) Date de prise de fonction : 1er janvier 2026 Rémunération : Selon l’expérience et le niveau de formation (grilles salariales de Sorbonne Université) Type de contrat : CDD temps plein d’un an renouvelable Sous la direction de la responsable du pôle « Biostatistique » de l’équipe SUMO, la personne recrutée aura plusieurs missions décrites ci-dessous. Analyse et exploitation des données de surveillance collectées par les réseaux Sentinelles et Grippenet/Covidnet • Traiter et analyser de données hebdomadaires • Interpréter les résultats et contribuer à la diffusion des indicateurs de surveillance, en collaboration avec les épidémiologistes • Développer et améliorer les outils et analyses statistiques (principalement sous R) • Optimiser l’analyse automatisée des données annuelles afin de faciliter la production d’indicateurs et de rapports. Contribution aux travaux de recherche biostatistiques sur la surveillance des maladies infectieuses • Participer activement à des projets de recherche appliquée exploitant les données du réseau Sentinelles, de Grippenet/Covidnet et d’autres sources de surveillance. • Contribuer à toutes les étapes des travaux : revue de littérature, choix et mise en œuvre des méthodes, analyses des résultats, rédaction de synthèses et d’articles scientifiques. • Les axes de recherche principaux concernent : o La prévision des incidences, en particulier des infections respiratoires aiguës (grippe, Covid, VRS) o L’inférence spatiale des incidences (production de cartes) o L’amélioration de l’estimation des incidences à partir des données disponibles • Mobiliser des méthodes issues de l’inférence bayésienne et d’autres approches modernes de la modélisation statistique. Missions transversales • Apporter un appui méthodologique et statistique sur d’autres projets de l’équipe • Contribuer à la diffusion des bonnes pratiques de traitement, d’analyse et de visualisation des données au sein de l’équipe. Postuler : adresser votre candidature (lettre de motivation + CV) à « recrutement@sentiweb.fr » par courriel, en précisant « Biostatisticien / Data scientist en santé » dans le titre du mail.
En savoir plus :https://www.sentiweb.fr/
Fiche_Poste_Biostatisticien_RS_2026.pdf
Contact :recrutement@sentiweb.fr
Proximité résidentielle aux espaces verts et dépression du post-partum
Publiée le 03/11/2025 11:47.
Stage, Rennes, France.
Entreprise/Organisme :INSERM/Irset
Niveau d'études :Master
Sujet :Projet VERDE : Proximité résidentielle aux espaces VErts et DEpression du post-partum : médiation par la pollution atmosphérique et rôle du contexte socio-économique
Durée du contrat :6 mois
Description :La dépression du post-partum (DPP) touche entre 10 et 20 % des femmes, avec un pic de fréquence observé entre deux et quatre mois après l’accouchement (1). Elle peut entraîner des difficultés dans la mise en place de l’allaitement et des interactions précoces avec le nouveau-né, ayant des répercussions durables sur le lien d’attachement entre le parent et l’enfant ainsi que sur le développement neurocognitif et socioaffectif de ce dernier. Parmi les complications les plus préoccupantes figurent les idées suicidaires, rapportées chez 7 à 10 % des femmes en post-partum. Il existe de plus en plus de preuves épidémiologiques que les expositions environnementales urbaines peuvent influencer le risque de dépression chez l’adulte, mais peu d’études se sont intéressées spécifiquement à la DPP. En particulier, la proximité aux espaces naturels (verts et bleus) serait susceptible d’avoir un effet protecteur sur le risque de DPP, via la réduction du stress, de la tension artérielle, ainsi qu’en favorisant la pratique d’une activité physique et les contacts sociaux (2,3). Les effets positifs des espaces verts pourraient également être expliqués par une réduction des expositions au bruit lié au trafic routier et à la pollution atmosphérique. Les femmes enceintes présentent en effet une vulnérabilité accrue aux polluants atmosphériques : les modifications physiologiques de la grossesse – augmentation du volume sanguin, métabolisme renforcé, modulation du système immunitaire – peuvent amplifier la sensibilité aux particules fines (PM2.5), au dioxyde d’azote (NO₂) ou à l’ozone. Une récente méta-analyse utilisant les données de 12 cohortes de naissance Européennes retrouvait un risque plus élevé de dépression du post-partum associée à l’exposition aux PM10. D’autres études retrouvaient également un lien avec l’exposition au NO2 (4). Au total, les données actuelles ne permettent pas de faire la preuve d’une association entre la proximité aux espaces naturels et la dépression du post partum, et aucune étude à ce jour n’a évalué dans quelle mesure une telle association serait expliquée par une réduction des niveaux de polluants atmosphériques.
En savoir plus :https://www.irset.org/fr
Offre de stage M2_projetVERDE_IRSET_nov2025.pdf
Contact :anne-claire.binter@inserm.fr
Classification supervisée de données spatio-temporelles avec application aux capteurs tactiles
Publiée le 03/11/2025 10:01.
Référence : Stage M2 SmartSkin.
Stage, 2 rue Conté, 75003 Paris.
Entreprise/Organisme :Conservatoire National des Arts et Métiers (CNAM) - Laboratoire Cédric
Niveau d'études :Master
Sujet :Les capteurs visent à reproduire les capacités sensorielles de la peau humaine afin de détecter simultanément la pression, la température, la texture et d’autres propriétés des objets en contact. Ce stage s'inscrit dans le cadre du projet exploratoire SmartSkin dédié au développement de capteurs tactiles artificiels. Ce domaine de recherche, en plein essor, présente de nombreuses applications en robotique, en interaction homme-machine et en médecine. Un prototype fonctionnel a été développé en s'appuyant sur une technique appelée tomographie par impédance électrique. Celui-ci est en mesure de collecter des données de nature variée, telles que des signaux périodiques ou la pression exercée par un objet et cherche à reconnaître le type de matériau en contact (par exemple : main humaine, métal, fruit, etc.). D'un point de vue statistique, la modélisation des données issues de ces capteurs constitue un problème de classification supervisée qui revêt plusieurs défis méthodologiques liés à la nature des données. D'une part, les signaux mesurés sont de nature fonctionnelle (signaux périodiques). D'autre part, les données présentent une composante spatiale, liée à la position du contact sur la surface du capteur. De plus, une autre difficulté réside dans le fait que les signaux sont collectés à différentes fréquences et à des instants non synchrones. Dans ce contexte, l'objectif est de développer une méthodologie de classification supervisée capable de prendre en compte ces différents aspects de complexité.
Date de début :Entre janvier et avril 2026
Durée du contrat :5 à 6 mois
Rémunération :Gratification de stage
Description :Les capteurs visent à reproduire les capacités sensorielles de la peau humaine afin de détecter simultanément la pression, la température, la texture et d’autres propriétés des objets en contact. Ce stage s'inscrit dans le cadre du projet exploratoire SmartSkin dédié au développement de capteurs tactiles artificiels. Ce domaine de recherche, en plein essor, présente de nombreuses applications en robotique, en interaction homme-machine et en médecine. Un prototype fonctionnel a été développé en s'appuyant sur une technique appelée tomographie par impédance électrique. Celui-ci est en mesure de collecter des données de nature variée, telles que des signaux périodiques ou la pression exercée par un objet et cherche à reconnaître le type de matériau en contact (par exemple : main humaine, métal, fruit, etc.). D'un point de vue statistique, la modélisation des données issues de ces capteurs constitue un problème de classification supervisée qui revêt plusieurs défis méthodologiques liés à la nature des données. D'une part, les signaux mesurés sont de nature fonctionnelle (signaux périodiques). D'autre part, les données présentent une composante spatiale, liée à la position du contact sur la surface du capteur. De plus, une autre difficulté réside dans le fait que les signaux sont collectés à différentes fréquences et à des instants non synchrones. Dans ce contexte, l'objectif est de développer une méthodologie de classification supervisée capable de prendre en compte ces différents aspects de complexité.
En savoir plus :https://cnam-my.sharepoint.com/:b:/g/personal/feriel_bouhadjera_lecnam_net/EXybYeem38dKlYviiFE-EIABy
Sujet_Stage_M2_Stat_SmartSkin.pdf
Contact :feriel.bouhadjera@lecnam.net
Apprentissage frugal de modèles génératifs multimodaux en contexte industriel
Publiée le 31/10/2025 08:53.
Référence : Offre de thèse en Science des Données et IA à l'IRT SystemX — UPSaclay.
CDD, Palaiseau.
Entreprise/Organisme :IRT SystemX — Université Paris-Saclay
Niveau d'études :Master
Sujet :L'IRT SystemX propose une thèse sur l’apprentissage frugal de modèles génératifs multimodaux en contexte industriel. La thèse s'inscrit dans le cadre d'un projet collaboratif sur l'IA Générative pour l'Industrie, mené en partenariat avec notamment Air Liquide et Michelin, et son volet applicatif vise à adresser des cas d'usage industriels liés à la gestion de connaissances techniques en ingénierie de systèmes complexes. Le poste est basé à Palaiseau et la thèse sera inscrite à l'école doctorale STIC de l'Université Paris-Saclay. La thèse est financée pour une durée de 36 mois, avec une rémunération de 2784 € brut/mois, pour un démarrage souhaité début 2026. N'hésitez pas à partager autour de vous et à me contacter pour toute question.
Date de début :01 janvier 2026 (flexible)
Durée du contrat :36 mois
Rémunération :2784€ brut/mois
Secteur d'activité :Recherche
Description :Le poste est basé à Palaiseau
En savoir plus :https://www.irt-systemx.fr/recrutement/
Offre-de-These-IRTSystemX-DIT-2-2026-IAG1.pdf
Contact :faicel.chamroukhi@irt-systemx.fr
Causally Interpretable Network Meta-Analysis (CI-NMA)
Publiée le 31/10/2025 08:52.
Référence : Postdoc position in biostatistics & causal inference.
Postdoc, Team EPIDERME, Université Paris-Est Créteil.
Entreprise/Organisme :University Paris-Est Créteil & Pharmaceutical company Novo Nordisk
Niveau d'études :Doctorat
Sujet :Causally Interpretable Network Meta-Analysis (CI-NMA): Fit-For-Purpose Methods For Decision Making In Health Technology Assessment
Date de début :Flexible, preferably before March 01 2025
Durée du contrat :3 ans
Rémunération :Based on official pay scales of University Paris-Est Creteil
Secteur d'activité :Biostatistiques, Inference causale, Evaluation des technologies en santé
Description :Network meta-analysis (NMA) has become a cornerstone methodology for the assessment of innovative health technologies, in the absence of direct head-to-head comparisons between the interventions of interest. It provides valuable information to prescribing physicians, regulatory agencies and payers on the relative efficacy and safety of drugs and has a crucial impact on market and patient access. This project will develop fit-for-purpose NMA methods that are flexible, bias-robust and produce causally interpretable results in specific target populations. Such methods are increasingly attractive for pharmaceutical companies, regulators and reimbursement agencies worldwide. Policy decisions are made for specific healthcare settings and require treatment effect estimates that are maximally relevant to the target population for decision-making. Within the context of health technology assessment (HTA), the landscape is being disrupted by the new European Union HTA Regulation, which demands: (1) a dramatic increase in the use of NMA due to unavailable head-to-head comparisons between all competitors; (2) considerable analytical complexity with respect to the type of NMAs being conducted; and (3) the generation of comparative effectiveness results in many different member state populations. The aim of CI-NMA is to develop novel methods for case-mix standardization that are bias-robust and allow for causally interpretable network meta-analysis, in the context of both full access and restricted access to individual participant data (IPD). CI-NMA includes three work packages (WPs). In WP1, we will develop robust and powerful approaches for case-mix standardization under limited access to IPD, which enable the use of machine learning methods in the estimation process, reducing the dependence on modeling assumptions and potential for bias while maintaining valid inference. In WP2, we will develop novel methods for CI-NMA under full access to IPD aiming to: (1) compare and rank different treatment options for specific target populations; and (2) quantify the importance of case-mix heterogeneity in the trial network. Finally, in WP3, we propose a new strategy to include aggregate data from trials without IPD into CI-NMA, integrating the methods developed in WP1 and WP2. Across all WPs, new methods will be evaluated by numerically simulated data, and illustrated by real data of randomized controlled trials previously conducted by the Danish multinational pharmaceutical company Novo Nordisk. Successful implementation of the project will lead to at least three publications in statistical journals acknowledged as top-tier, and presentations in key statistical conferences. The project receives full funding from Novo Nordisk, and is planned to run for three years from 2025 to 2028.
En savoir plus :https://www.linkedin.com/posts/activity-7389248867495723008-PnmS?utm_source=share&utm_medium=member_
Postdoc offer UPEC-NN.pdf
Contact :tat-thang.vo@u-pec.fr
Master's degree internship in Causal Inference and Transportability
Publiée le 31/10/2025 08:52.
Référence : Master's degree internship in Causal Inference and Transportability.
Stage, Université Paris Est Créteil Campus Centre de Créteil.
Entreprise/Organisme :EPIDERME Université Paris-Est Créteil
Niveau d'études :Master
Sujet :Causal Inference and Transportability with Limited Access to Individual-Level Data
Durée du contrat :6 Months
Secteur d'activité :Biostatistics
Description :The internship will be hosted by the Epiderme research team, affiliated with INSERM and based at Universit´e Paris-Est Créteil. The project will be jointly supervised by: • Dr. Marie-F´elicia Beclin (Postdoctoral Researcher in Biostatistics) • Dr. Antonio Remiro-Azocar (Statistical Methodologist, Novo Nordisk) • Dr. Tat-Thang Vo (Junior Professor in Biostatistics, https://tatthangvo.com/)
En savoir plus :https://www.linkedin.com/posts/marie-f%C3%A9licia-b-141680145_offre-de-stage-master-2-statistiques-a
Master_internship_position.pdf
Contact :mariefelicia.beclin@gmail.com
Quantifier et objectiver l’effort de butinage et les miellées à partir des variations journalières d
Publiée le 30/10/2025 09:18.
Stage, Avignon/Montpellier.
Entreprise/Organisme :INRAE, Avignon & IMAG, Montpellier
Niveau d'études :Master
Date de début :février/mars 2026
Durée du contrat :6 mois
Rémunération :selon gratification en vigeur (environ 600€/mois)
Description :Stage de recherche niveau M2 portant sur l'analyse statistique de données de capteurs pour quantifier l'activité de butinage d'abeilles mellifères. Tous les détails se trouvent dans le fichier pdf joint à cette offre. Stage encadré par Cédric Alaux (INRAE, Avignon) et Élodie Brunel-Piccinini (IMAG, Montpellier).
En savoir plus :https://imag.umontpellier.fr/
Stage M2 Abeilles - INRAE Avignon IMAG Montpellier.pdf
Contact :elodie.brunel-piccinini@umontpellier.fr
Incertitudes associées aux trajectoires d’évolution du stockage de carbone dans les sols
Publiée le 30/10/2025 09:18.
Stage, Rennes.
Entreprise/Organisme :INRAE
Niveau d'études :Master
Sujet :Evaluation des incertitudes associées aux trajectoires d’évolution du stockage de carbone dans les sols et la végétation arborée estimées à une échelle territoriale
Date de début :entre janvier et avril 2026
Durée du contrat :6 mois
Secteur d'activité :Recherche agronomique
Description :Afin d’accompagner leur objectif d’atteinte de la neutralité carbone en 2050, de nombreuses collectivités sollicitent des études prospectives visant à évaluer différents scénarios d’évolution des usages des sols et de la végétation arborée favorables au stockage de carbone. Ces travaux reposent sur le couplage de modèles simulant les trajectoires des stocks de carbone dans les sols et de la biomasse arborée à l’horizon 2050. La quantification et l’identification des incertitudes associées à ces trajectoires sont complexes, qu’elles proviennent des modèles eux-mêmes, des données utilisées ou des représentations spatiales. Déjà soulignée dans les travaux à l’échelle mondiale (Canadel et al., 2021 ; IPCC AR6) et nationale (Pellerin et al., 2020), cette difficulté s’accentue à l’échelle territoriale, où l’absence de modèle générique complique l’analyse. Ainsi, les approches classiques d’évaluation des incertitudes, comme les simulations Monte-Carlo, sont difficiles à appliquer pour évaluer la robustesse des trajectoires d’évolution modélisées.
En savoir plus :https://umrsas.rennes.hub.inrae.fr/
2025-stageM2-INRAE-UMR SAS Rennes-incertitudes trajectoires evolution sols.pdf
Contact :christian.walter@institut-agro.fr
Clustering de valeurs extrêmes sur des séries chronologiques
Publiée le 29/10/2025 09:53.
Référence : Thèse en statistique.
Thèse, Vannes.
Entreprise/Organisme :Université Bretagne Sud
Niveau d'études :Doctorat
Date de début :janvier 2026
Durée du contrat :3 années
Rémunération :2400€ brut mensuel + frais de transport (dont ceux vers les bureaux d’Aldecis) + avantages annexes
Secteur d'activité :Statistique
Description :Dans le cadre d’une première thèse CIFRE, nous avons engagé une modélisation des données de performance des organisations, dans le but d’y détecter des anomalies structurelles et con- joncturelles. Cette démarche a permis de développer des modèles stochastiques de priorisation des signaux atypiques, afin de se focaliser sur les cas les plus critiques. L’objectif de cette thèse CIFRE est d’identifier et d’anticiper les causes profondes de ces anomalies rares, dans une perspective d’analyse prédictive et de prévention. L’estimation des probabilités et des risques associés à des événements rares joue un rôle essentiel dans des domaines tels que la climatologie, la santé publique, l’assurance ou la mesure de performance. Nous proposerons une méthode d’estimation des probabilités rares, ainsi que des quantiles extrêmes, basée sur un ajustement automatique du seuil de localisation d’un modèle statistique en adéquation avec les données observées. Nous développerons également une procédure statistique automatique de détection des anomalies extrêmes, s’inscrivant dans une approche combinant apprentissage automatique (Machine Learning) et apprentissage profond (Deep Learning). Cette méthode aura pour objectif d’identifier les observations atypiques et de les regrouper en clusters selon leurs similarités structurelles, en vue de mutualiser l’application cohérente de traitements correctifs ciblés et de proposer des mesures préventives (soit par risques de propagation, soit par faiblesses structurelles identiques). Les propriétés asymptotiques des procédures proposées seront rigoureusement analysées, tant sur le plan théorique que par le biais de simulations numériques, avant leur mise en œuvre sur les données réelles issues d’ALDECIS, une organisation constituée d’experts en IA, chargée d’aider ses clients à améliorer leurs performances.
En savoir plus :https://www-facultesciences.univ-ubs.fr/fr/index.html
Annonce_Thèse_CIFRE_Diffusion.pdf
Contact :gilles.durrieu@univ-ubs.fr
18-month full-time post-doctoral grant
Publiée le 29/10/2025 09:52.
CDD, Louvain-la-Neuve (Belgium).
Entreprise/Organisme :Université catholique de Louvain (Belgium)
Niveau d'études :Doctorat
Date de début :Starting anywhere in 2026
Durée du contrat :18 months
Rémunération :around 3000 euros net per month
Description :Post-doctoral position in the field of multivariate extreme-value theory. See the attached file for a detailed description.
En savoir plus :https://akiriliouk.github.io/
Postdoc-grant-MIS.pdf
Contact :anna.kiriliouk@uclouvain.be

Page précédente  1  <2>  3  4  5  Page suivante

 
 
©2025 SFdS
Société Française de Statistique
Institut Henri Poincaré
11 rue Pierre et Marie Curie
75231 Paris cedex 5
Tél. : +33 (0)1 44 27 66 60
Notre site a été supporté par :