Consulter les offres d’emploi

Ingénieur Chimiométricien – H/F – CDD
Publiée le 23/03/2026 12:46.
CDD, BOIGNEVILLE (91).
Entreprise/Organisme :ARVALIS
Niveau d'études :Master
Date de début :à partir de juillet 2026
Durée du contrat :12 mois
Rémunération :selon profil
Secteur d'activité :R&D agricole
Description :ARVALIS, Institut technique spécialisé en recherche et développement agricole, recherche un(e) ingénieur(e) chimiométricien(ne) / machine learning en contrat à durée déterminée. Il (elle) sera intégré(e) au sein du Pôle Analytique d’ARVALIS parmi des experts en spectroscopie proche infrarouge, imagerie hyperspectrale et chimiométrie. Le laboratoire, composé de 18 personnes, met en œuvre et développe des méthodes d’analyse et plus particulièrement en spectroscopie proche infrarouge et imagerie hyperspectrale pour la caractérisation des matières premières agricoles en vue de leurs utilisations dans les domaines de l’alimentation humaine et animale, en appui aux projets de recherche de l’Institut et en réponse aux demandes des clients et d’autres partenaires ainsi qu’aux propres besoins du Pôle. L’objectif de ce poste est d’avancer plus rapidement sur le développement de calibrations NIRS et/ou de modèles IHS sur des matrices variées.
En savoir plus :https://www.arvalis.fr/
2025_07_CDD_Chimiometricien.pdf
Contact :m.faure@arvalis.fr
Analyse statistique de séries temporelles multimodales pour l’évaluation d’un outil en santé animale
Publiée le 10/03/2026 13:58.
Stage, BIOEPAR, INRAE Oniris, La Chantrerie, 44307 Nantes.
Entreprise/Organisme :INRAE
Niveau d'études :Master
Sujet :cf description
Date de début :fin avril à début mai
Durée du contrat :4 mois
Rémunération :oui (légale)
Secteur d'activité :épidémiologie animale ; données de capteurs ; modélisation
Description :M1 — Analyse statistique de séries temporelles multimodales collectées pour l’évaluation d’un outil d’aide à la gestion des maladies respiratoires des bovins Équipe et encadrement o Encadrants et contact : Sébastien Picault, Sébastien Assié (INRAE/Oniris), prenom.nom@inrae.fr o L’accueil sera assuré par l’équipe Dynamo, UMR 1300 BIOEPAR (INRAE, Oniris), Nantes o Le stagiaire travaillera en interaction avec l’équipe ImmunoCare (BIOEPAR) o Période du stage : 4 mois, de mai à août 2026 o Mots-clefs : séries temporelles multivariées ; données cliniques ; données de capteurs ; aide à la décision Description du stage Les maladies respiratoires des bovins (Bovine Respiratory Disease, BRD) posent un défi majeur en raison de leur étiologie multifactorielle (virus et bactéries, stress, facteurs environnementaux…), de la difficulté de détection précoce en élevage et de leurs impacts sanitaires, économiques et en usage d’antibiotiques. Le projet SEPTIME vise à développer des outils d’aide à la décision pour la maîtrise des BRD chez les jeunes bovins en atelier d’engraissement. Il s’appuie sur l’intégration de données issues du terrain et de modèles mécanistes, en combinant des capteurs individuels commerciaux en élevage (colliers accéléromètres) qui donnent une indication de l’activité des animaux utilisée pour prédire leur état de santé, et simulations de scénarios d’intervention en élevage pour identifier les recommandations les plus pertinentes. La phase de terrain conduite en 2024-2025 a permis la collecte de données longitudinales multimodales sur environ 550 jeunes bovins suivis pendant les quatre premières semaines de la période d’engraissement : • données de capteurs (activité, comportement) chaque heure ; • prédictions et recommandations issues des outils développés (max. 3 fois par jour) ; • observations cliniques (2 fois par semaine) ; • traitements administrés (occasionnel) ; • données environnementales (bâtiment : température, hygrométrie, NH3, CO2, quotidien) ; • données zootechniques (âge, poids, race, qualité : à la mise en lot et à l’abattage). Au-delà d’une analyse descriptive globale, l’enjeu est ici de comparer explicitement les trajectoires temporelles afin d’identifier des motifs dynamiques associés à l’apparition de signes cliniques ou à la décision de traitement. Les données présentent plusieurs défis méthodologiques : échantillonnages hétérogènes (horaire, bihebdomadaire, quotidien, événementiel) ; synchronisation des séries ; variabilité inter-individuelle forte ; événements rares et décalés dans le temps. Objectifs du stage Le stage vise à développer une analyse comparative des séries temporelles multimodales afin de caractériser des profils dynamiques associés aux BRD et aux décisions thérapeutiques, et évaluer l’efficacité de l’outil d’aide à la décision en termes de pertinence et de précocité des recommandations. Les activités incluront notamment : 1. Préparation et structuration des séries : alignement temporel des différentes sources, agrégation ou lissage des données d’activité, gestion des données manquantes et des événements ponctuels 2. Analyse des dynamiques individuelles : visualisation et comparaison de trajectoires individuelles, détection de ruptures, changements de régime ou anomalies comportementales, construction d’indicateurs dynamiques 3. Comparaison entre groupes : comparaison de trajectoires entre animaux traités/non traités, cas/non cas…, analyse des décalages temporels entre variation d’activité, signes cliniques et traitement 4. Méthodes statistiques avancées : analyse fonctionnelle de données, mesures de similarité entre séries, clustering de trajectoires 5. Restitution et valorisation : production de rapports reproductibles (R Markdown), visualisations dynamiques et synthétiques à destination des partenaires du projet et pour préparer des publications scientifiques (auxquelles le stagiaire sera associé), recommandations méthodologiques pour l’intégration des résultats dans les modèles mécanistes de l’outil. Compétences requises o Niveau M1 statistiques ou équivalent o Bonnes compétences sur les méthodes d’analyse de séries temporelles multivariée o Intérêt pour l’épidémiologie / les sciences du vivant ainsi que pour un contexte de travail interdisciplinaire o Capacités de travail en équipe o Capacités rédactionnelles, lecture d’articles scientifiques en anglais Indemnités de stage : OUI (réglementaire) Pour candidater : Envoyer CV + lettre de motivation à : sebastien.picault@inrae.fr, sebastien.assie@oniris-nantes.fr
En savoir plus :https://bioepar.angers-nantes.hub.inrae.fr/equipes/dynamo-modelisation-en-dynamique-de-population-et-epidemiologie-animale2
2026-M1-Statistiques_SEPTIME2.pdf
Contact :sebastien.picault@inrae.fr
Biostatisticien / Bioinformaticien (H/F)
Publiée le 03/03/2026 16:43.
CDD, Hôpital Européen Georges-Pompidou (HEGP) Paris.
Entreprise/Organisme :Assistance Publique - Hôpitaux de Paris (AP-HP)
Niveau d'études :Master
Date de début :avril 2026
Durée du contrat :1 an renouvelable (3 ans)
Rémunération :Grille salariale adaptée au profil du candidat
Secteur d'activité :Recherche translationnelle en Immuno-Cancérologie
Description :La structure translationnelle d'immunomonitoring des cancers située sein de HEGP à Paris, dirigée par le Pr F. Pagès, est spécialisée dans l’analyse du microenvironnement tumoral. Les travaux menés au sein de la structure ont pour objectif l’identification des biomarqueurs pronostiques et prédictifs de réponse aux traitements dans les tumeurs solides. Les recherches s’appuient sur des données cliniques initiales et de suivi, associées à des résultats issus d’explorations en pathologie digitale, transcriptomiques et génomiques. La personne recrutée participera à l’analyse biostatistique et bio-informatique des données cliniques et biologiques générées au sein de la structure sous la supervision d’un bio-informaticien senior. Elle sera notamment en charge du développement de modèles statistiques adaptés à des données longitudinales comportant un grand nombre de variables cliniques et biologiques.
En savoir plus :https://crcordeliers.fr/equipes/laboratory-of-integrative-cancer-immunology/
Fiche de poste_biostatisticien_HEGP.pdf
Contact :amos.kirilovsky@aphp.fr
Poste ATER en Statistique - IUT d'Avignon - Département Science des données
Publiée le 02/03/2026 16:48.
CDD, Avignon, Campus Jean-Henri Fabre (Agroparc).
Entreprise/Organisme :Avignon Université (IUT)
Niveau d'études :Doctorat
Description :La personne recrutée pourra intervenir sur les 3 années de formation BUT SD et sera intégrée à l'équipe de Statistique du Laboratoire de Mathématiques d'Avignon pour la recherche. Les modalités de candidature sont décrites sur le lien ci-dessous : https://univ-avignon.fr/acces-rapide/recrutement-concours/personnels-enseignants/ater/
En savoir plus :http://recrutement.univ-avignon.fr/poste/ATER_26_2026
FOPC_65984.pdf
Contact :delphine.blanke@univ-avignon.fr
Postdoc: Mathematical Statistics & Functional Data
Publiée le 02/03/2026 09:34.
Référence : Postdoc: Mathematical Statistics & Functional Data.
CDD, Rennes Métropole.
Entreprise/Organisme :CREST Ensai
Niveau d'études :Doctorat
Date de début :à partir de fin mai 2026
Durée du contrat :jusqu'à 24 mois
Description :We invite applications for a postdoctoral position focusing on the mathematical aspects of modeling functional data, with particular emphasis on adaptive methods for estimation and inference. The successful candidate will join the ANR FUNStatMath project team at Ensai. FUNStatMath is a collaborative research initiative in Functional Data Analysis, bringing together researchers in mathematical and applied statistics. The position does not involve teaching duties. It is available starting in May 2026 (with flexibility regarding the starting date) for a period up to 24 months. Applications, including a CV (with the contact details of two or three academic references), a research statement, and a cover letter, should be sent by email to funmathstat@ensai.fr. The deadline for applications is March 31, 2026.
En savoir plus :https://ensai.fr/wp-content/uploads/2026/02/postdoctoral_position_CREST-Ensai2026.pdf
postdoctoral_position_CREST-Ensai2026.pdf
Contact :valentin.patilea@ensai.fr
Ingénieur Data Scientist
Publiée le 26/02/2026 13:46.
CDD, 2 Av. de la Source de la Bièvre, 78180 Montigny-le-Bretonneux.
Entreprise/Organisme :Université de Versailles Saint-Quentin-en-Yvelines
Niveau d'études :Master
Date de début :01/04/2026
Secteur d'activité :Bio-informatique
Description :Le SEPSIS Comprehensive Center (IHU SEPSIS) est le premier centre au monde intégrant recherche, formation et soins dans une approche unifiée pour lutter contre le sepsis, principale cause de mortalité liée aux infections. Au sein de cet institut d’excellence, plusieurs programmes de recherche translationnelle s’appuient sur de vastes cohortes cliniques afin de réaliser un endotypage multi-omique (métabolomique, transcriptomique, génomique, etc.) et d’identifier de nouveaux biomarqueurs diagnostiques et théranostiques, en vue d’un transfert clinique rapide. Des milliers d’échantillons biologiques humains sont actuellement en cours d’analyse, générant des volumes massifs de données complexes. Leur traitement exige la mise en oeuvre de workflows analytiques avancés, combinant prétraitement du signal, normalisation, standardisation et modélisation statistique. L’objectif est de développer et d’appliquer des approches d’apprentissage automatique (machine learning) adaptées à des données de haute dimension, et d’intégrer des modèles longitudinaux pour la compréhension dynamique des réponses biologiques. Objectif du poste : Nous recherchons un(e) Data Scientist passionné(e) par la modélisation de données biomédicales complexes pour mettre en oeuvre des méthodes de data science appliquées à la métabolomique et à la transcriptomique dans le cadre de plusieurs projets cliniques du centre. Il s’agira en particulier de développer des méthodes d’apprentissage statistique et des workflows de traitement de données métabolomiques et transcriptomiques. Vos missions : • Exploiter et améliorer les codes existants développés au sein de l’équipe pour finaliser les analyses statistiques. • Concevoir, développer et automatiser des workflows pour le traitement des données métabolomiques et transcriptomiques. • Appliquer et comparer des modèles d’apprentissage automatique pour l’identification de biomarqueurs pertinents. • Contribuer à la valorisation scientifique des résultats. • Participer à la structuration et documentation des pipelines analytiques pour assurer leur reproductibilité et leur transfert au sein des équipes. Pourquoi nous rejoindre ? • Intégrer un projet scientifique ambitieux et interdisciplinaire, à l’interface entre data science, biologie, chimie analytique et santé. • Évoluer au sein d’une équipe dynamique, collaborative et hautement qualifiée regroupant chercheurs, cliniciens, bioinformaticiens et ingénieurs. • Contribuer directement à des projets à fort impact clinique et sociétal, soutenus par un institut hospitalo-universitaire de rang international. Profil recherché : • Formation : Bac+5 minimum (école d’ingénieurs, Master en data science, mathématiques appliquées, bioinformatique ou discipline équivalente) ou thèse • Compétences techniques : ▪ Excellente maîtrise de R et/ou Python ▪ Solides connaissances en statistiques appliquées, traitement du signal, apprentissage supervisé et non supervisé, sélection de variables et analyse multivariée. ▪ Une connaissance des données omiques (transcriptomique, métabolomique) serait un atout. Qualités attendues : ▪ Rigueur scientifique, autonomie et sens de l’initiative. ▪ Intérêt marqué pour les applications biomédicales et le travail collaboratif. ▪ Excellente communication écrite et orale, maîtrise de l’anglais (niveau B2–C1). Contrat : CDD rentre 9 et 12 mois, démarrage dès que possible Lieu : UFR Simone Veil - Santé, Université Versailles Saint-Quentin-en-Yvelines Contact : Pr Stanislas Grassin Delyle, Département de Biotechnologie de la Santé : stanislas.grassin-delyle@uvsq.fr
En savoir plus :https://www.linkedin.com/posts/ihu-sepsis-comprehensive-sepsis-center_profil-de-poste-ugcPost-7391124299195097089-9Se2?utm_source=share&utm_medium=member_desktop&rcm=ACoAABc6HqQBd4bWfuBeNiB1odfDPOV-6x-5FQI
Contact :stanislas.grassin-delyle@uvsq.fr
Epidémiologiste / Biostatisticien avec expertise SNDS
Publiée le 21/02/2026 10:54.
CDI, Toulouse.
Entreprise/Organisme :Oncopole Claudius Regaud
Niveau d'études :Doctorat
Description :Description du poste L'Oncopole Claudius Regaud recherche un EPIDEMIOLOGISTE (BIOSTATISTICIEN avec expertise SNDS) (H-F) en CDI temps plein. Le poste est à pourvoir dès que possible. Au sein de la Direction de la Recherche et de l'Innovation (DRI), la cellule Biostatistics & Health Data Science apporte son expertise et prend en charge les aspects biostatistiques, épidémiologie et data-management des projets de recherches cliniques et épidémiologiques. L’épidémiologiste participe aux différentes phases des projets de recherche notamment ceux basés sur les données du Système National des Données de Santé, depuis la conception jusqu’à l’analyse et la valorisation des résultats. Il met en œuvre les démarches et interprète les analyses nécessaires à la conduite des études cliniques et épidémiologiques dans le respect de la confidentialité et de la règlementation en vigueur Vos missions : Participer à l’élaboration de la stratégie méthodologique et épidémiologique/statistique pour répondre aux questions de recherche concernant les projets impliquant notamment les données du Système National des Données de Santé Organiser et exploiter des bases de données complexes, notamment en lien avec les données du SNDS Réaliser les analyses épidémiologique/statistique dans le cadre des projets de recherche (rétrospectif ou prospectif) Assurer un support à la valorisation scientifique dans le cadre de la communication de résultats Contribuer à la démarche qualité notamment dans le traitement des données issues du SNDS Réaliser la veille scientifique et participer à des développements méthodologiques. Suivre la mise en œuvre du projet et informer l’équipe et le responsable scientifique et du service des dysfonctionnements et avancées. Le tout selon la règlementation en vigueur Avantages sociaux : CSE (chèques vacances, remboursement activités sportives, colis fin d'année...) Restaurant d'entreprise Crèche d'entreprise Remboursement des frais de transport à hauteur de 50% (accessibilité bus + Teleo) Nous rejoindre c'est intégrer un institut au coeur de l'innovation, de l'excellence, de la solidarité et de l'humanisme. Profil recherché / compétences requises Formations/Diplômes : Master 2 ou école d’ingénieur ou Thèse en science Expérience : Minimum 3 ans Expertise et habilitation SNDS requise Un profil de biostatisticien(ne) disposant d’une expertise avérée sur le SNDS est pleinement éligible pour ce poste Connaissance des exigences réglementaires et juridiques concernant notamment l’utilisation des données SNDS Anglais (lu, écrit, parlé) Maitrise des logiciels statistiques : SAS, Stata, R.
En savoir plus :https://recrutement-icr.iuct-oncopole.fr/web/guest/home?p_p_id=com_beorntech_hrms_portal_web_GuestJo
Contact :filleron.thomas@iuct-oncopole.fr
Stage M2 prévisions des impacts des covariables extrêmes
Publiée le 21/02/2026 10:54.
Référence : Stage M2 prévisions des impacts des covariables extrêmes.
Stage, AgroParisTech, MIA Paris-Saclay.
Entreprise/Organisme :MIA Paris-Saclay
Niveau d'études :Master
Durée du contrat :6 mois
Description :Ce stage vise à améliorer les prévisions des impacts des covariables extrêmes sur une réponse. L’étude de cas sur les impacts des vitesses du vent sur les conditions cycloniques en Guadalupe sera traité. Tous les détails sont disponibles ici : https://mia-ps.inrae.fr/node/955
En savoir plus :https://mia-ps.inrae.fr/node/955
stage_2026_impacts.pdf
Contact :gloria.buritica@agroparistech.fr
Méthodes statistiques et data-mining appliquées à un dispositif de jeu vidéo
Publiée le 22/12/2025 09:39.
Référence : Stage M2 Tactile Game.
Stage, 2 rue Conté, 75003 Paris.
Entreprise/Organisme :Conservatoire National des Arts et Métiers (CNAM) - Laboratoire Cédric
Niveau d'études :Master
Date de début :Février 2026
Durée du contrat :5 mois
Rémunération :Gratification de stage
Description :Ce stage de M2 en statistique s’inscrit dans le projet Tactile Game Lab : un atelier d’initiation à la création de jeux vidéo combinant numérique et objets physiques. L’atelier a déjà fait l’objet de plusieurs expérimentations qui ont permis de recueillir des données hétérogènes et multimodales. Le ou la stagiaire contribuera à l’analyse des données existantes, à l’évaluation critique des indicateurs mobilisés et à la réflexion méthodologique sur les dispositifs de collecte, notamment en vue de l’automatisation des traces d’activités.
En savoir plus :https://cedricnuage.cnam.fr/nextcloud/index.php/s/SyB9LQA5NcokT2M
Fiche de poste_stage_MSDMA_CEDRIC_CNAM.pdf
Contact :feriel.bouhadjera@lecnam.net
Ingénieur de formation orienté Intelligence Artificielle
Publiée le 24/11/2025 10:06.
Référence : Ingénieur formation IA.
CDD, Troyes.
Entreprise/Organisme :Université de Technologie de Troyes
Niveau d'études :Doctorat
Date de début :Dès que possible
Durée du contrat :4 ans
Secteur d'activité :Enseignement supérieur
Description :Missions de l’agent : Rattaché à la Direction de la formation et de la pédagogie, l’ingénieur de formation orienté IA fera partie d’une équipe projet impliquant la formation initiale, la formation continue, la coopérative pédagogique (le centre d’innovation pédagogique de l’UTT). Il/elle jouera un rôle clé dans la conception, la structuration et la mise en œuvre de ce nouveau programme de formation, en collaboration avec des experts du domaine, des enseignants, des ingénieurs pédagogiques et des partenaires académiques. Il/elle pourra être amené(e) à organiser et animer des sessions de formation (CM, TD, TP, webinaire, …) en soutien au déploiement de nouveaux contenus. Enfin, il/elle pourra contribuer aux comptes rendus, rapports d’activité et constitution de pièces justificatives éventuellement demandées par le financeur H!Paris.
En savoir plus :https://www.utt.fr
F_H Ingénieur_Formation_IA.pdf
Contact :drh-recrutement@utt.fr
Stage M2 (2026, 6 mois) : Approches statistiques de bioéquivalence pour médicaments injectables
Publiée le 21/11/2025 13:20.
Stage, Lille.
Entreprise/Organisme :ULR 2694 Metrics, Université de Lille
Niveau d'études :Master
Sujet :Évaluation d’approches de bioéquivalence par modélisation pour le développement de génériques de médicaments injectables à libération prolongée
Date de début :A partir de Janvier 2026
Durée du contrat :6 mois
Rémunération :610€/mois (4.35€ net/h)
Secteur d'activité :Statistique, Pharmacométrie
Description :Garantir l’accès à des génériques sûrs et abordables reste un défi, notamment pour les formes injectables à libération prolongée (LAI), dont les essais de bioéquivalence (BE) sont souvent complexes. L’approche Model-Based BioEquivalence (MBBE), fondée sur la modélisation pharmacocinétique (PK) de population, est adaptée aux échantillons peu denses, fréquents dans ce contexte. Elle est ainsi recommandée par la FDA depuis 2022 pour l’évaluation de la BE des LAIs. Une première stratégie MBBE, développée par l’équipe Moclid (Paris), a ensuite fait l’objet de développements complémentaires en collaboration avec l’équipe Metrics (Lille). Elle repose sur trois étapes : ajustement du modèle, estimation de l’incertitude, puis test de BE basé sur une hypothèse de normalité des paramètres PK d’intérêt. Une équipe du département de Pharmacie de l'université d'Uppsala propose une stratégie alternative, intégrant une étape de simulation de population, suivie d’une évaluation de la BE à partir de la distribution empirique des rapports de moyennes géométriques, sans hypothèse de distribution. L’objectif du stage est de comparer les deux stratégies MBBE décrites ci-dessus, à partir d’essais simulés de BE de LAI. La génération d’essais réalistes reposera sur une revue systématique des publications concernant un médicament LAI, suivie de la simulation des essais de BE selon différents scénarios.
En savoir plus :No link
M2_2026_MBBE_LAI.pdf
Contact :florence.loingeville@univ-lille.fr
Développement de méthodes statistiques en causalité
Publiée le 13/11/2025 12:02.
Référence : Stage recherche en causalité.
Stage, Paris, 6ème arrondissement ou Lille, Cité scientifique.
Entreprise/Organisme :Université Paris Cité ou Université de Lille
Niveau d'études :Master
Sujet :1) Causalité en présence d'une exposition multiple Dans les cours introductifs de causalité, le premier type d’effet causal à être présenté est en général l'``effet causal moyen'' (ATE) pour une exposition binaire A et une réponse continue Y. Dans ce cas, l'ATE est défini comme la différence entre les valeurs attendues de la réponse sous l’exposition et en absence de l’exposition : ATE = E[Y(1)] - E[Y(0)]. Pour certaines applications, il est intéressant de considérer l’effet d’une exposition vectorielle A dans un espace euclidien de dimension d. Dans ce contexte, le paramètre cible E[Y(a_1,…,a_d)] définit une fonction ``dose-réponse'' de R^d vers R. Pour identifier ce paramètre, on peut utiliser une approche basée sur les scores de propension multivariés. La difficultés consiste alors à estimer des fonctions de densités conditionnelles multivariées. Une méthode simple consiste à modéliser ces densités par régression linéaire multivariée (Fong 2018, Williams 2020). Nous souhaiterions explorer d’autres approches pour estimer ces densités multivariées conditionnelles à l’aide de méthodes non paramétriques ou paramétrique mais flexibles. Dans cette deuxième classe de méthodes, on trouve les approches basées sur des réseaux de neurones. Par exemple, Shi et al. (2019) décrivent une architecture pour l’estimation du score de propension pour une exposition réelle. Il serait intéressant d’étudier la généralisation à une exposition multivariée. Une autre piste intéressante est celle des flots génératifs (voir Papamakarios 2021). Le stage pourrait porter sur l’étude d’une, ou plusieurs de ces approches, avec une validation par simulations. Nous aurons aussi la possibilité d’appliquer ces méthodes à des données réelles issues d’une cohorte française pour étudier les effets d’un mélange de polluants organiques persistants sur un événement de santé. 2) Causalité en analyse de survie En analyse de survie causale, on s’intéresse à l'effet causal d’une exposition sur le temps avant un événement d’intérêt T en présence de données censurées. Le correspondant de l'ATE dans ce contexte est donné par la différence P(T(1)>t) - P(T(0)>t), ou son intégrale par rapport à t sur un intervalle limité. Les résultats d’identification de l’ATE sur données non-censurées peuvent s’étendre à ce cadre, en considérant des poids qui prennent en compte non seulement la probabilité conditionnelle du traitement mais aussi la fonction de survie conditionnelle de la censure (Cheng 2022). Cette approche donne un estimateur consistant si les modèles utilisés pour estimer les probabilités conditionnelles définissant les poids sont bien spécifiés. Des estimateurs doublement robustes qui sont consistants sous des hypothèses moins restrictives ont également été proposés (Rytgaard 2023). Ces estimateurs, appelés estimateurs ``d'apprentissage ciblé'' sont issus de la théorie de l’efficacité semi-paramétrique (voir par exemple le lien Github ``Introduction to modern causal inference'' de Schuler et van der Laan). La théorie mathématique sous-jacente à ces estimateurs est particulièrement riche et élégante mais demande un peu d’investissement. Le stage pourrait porter sur un travail bibliographique pour comprendre et présenter de façon accessible ces approches et, si possible, sur une validation par simulations. Il sera aussi possible d’appliquer les méthodes étudiées à des données de vie réelle pour étudier l’effet d’un traitement hormonal sur le cancer du sein.
Date de début :A n'importe quel moment à partir du mois de février
Durée du contrat :4 à 6 mois
Rémunération :660 euros par mois
Secteur d'activité :Statistique
Description :1) Causalité en présence d'une exposition multiple Dans les cours introductifs de causalité, le premier type d’effet causal à être présenté est en général l'``effet causal moyen'' (ATE) pour une exposition binaire A et une réponse continue Y. Dans ce cas, l'ATE est défini comme la différence entre les valeurs attendues de la réponse sous l’exposition et en absence de l’exposition : ATE = E[Y(1)] - E[Y(0)]. Pour certaines applications, il est intéressant de considérer l’effet d’une exposition vectorielle A dans un espace euclidien de dimension d. Dans ce contexte, le paramètre cible E[Y(a_1,…,a_d)] définit une fonction ``dose-réponse'' de R^d vers R. Pour identifier ce paramètre, on peut utiliser une approche basée sur les scores de propension multivariés. La difficultés consiste alors à estimer des fonctions de densités conditionnelles multivariées. Une méthode simple consiste à modéliser ces densités par régression linéaire multivariée (Fong 2018, Williams 2020). Nous souhaiterions explorer d’autres approches pour estimer ces densités multivariées conditionnelles à l’aide de méthodes non paramétriques ou paramétrique mais flexibles. Dans cette deuxième classe de méthodes, on trouve les approches basées sur des réseaux de neurones. Par exemple, Shi et al. (2019) décrivent une architecture pour l’estimation du score de propension pour une exposition réelle. Il serait intéressant d’étudier la généralisation à une exposition multivariée. Une autre piste intéressante est celle des flots génératifs (voir Papamakarios 2021). Le stage pourrait porter sur l’étude d’une, ou plusieurs de ces approches, avec une validation par simulations. Nous aurons aussi la possibilité d’appliquer ces méthodes à des données réelles issues d’une cohorte française pour étudier les effets d’un mélange de polluants organiques persistants sur un événement de santé. 2) Causalité en analyse de survie En analyse de survie causale, on s’intéresse à l'effet causal d’une exposition sur le temps avant un événement d’intérêt T en présence de données censurées. Le correspondant de l'ATE dans ce contexte est donné par la différence P(T(1)>t) - P(T(0)>t), ou son intégrale par rapport à t sur un intervalle limité. Les résultats d’identification de l’ATE sur données non-censurées peuvent s’étendre à ce cadre, en considérant des poids qui prennent en compte non seulement la probabilité conditionnelle du traitement mais aussi la fonction de survie conditionnelle de la censure (Cheng 2022). Cette approche donne un estimateur consistant si les modèles utilisés pour estimer les probabilités conditionnelles définissant les poids sont bien spécifiés. Des estimateurs doublement robustes qui sont consistants sous des hypothèses moins restrictives ont également été proposés (Rytgaard 2023). Ces estimateurs, appelés estimateurs ``d'apprentissage ciblé'' sont issus de la théorie de l’efficacité semi-paramétrique (voir par exemple le lien Github ``Introduction to modern causal inference'' de Schuler et van der Laan). La théorie mathématique sous-jacente à ces estimateurs est particulièrement riche et élégante mais demande un peu d’investissement. Le stage pourrait porter sur un travail bibliographique pour comprendre et présenter de façon accessible ces approches et, si possible, sur une validation par simulations. Il sera aussi possible d’appliquer les méthodes étudiées à des données de vie réelle pour étudier l’effet d’un traitement hormonal sur le cancer du sein.
En savoir plus :https://obouaziz.github.io/supervision.html
Stage_Causalite.pdf
Contact :olivier.bou-aziz@univ-lille.fr
Apprentissage frugal de modèles génératifs multimodaux en contexte industriel
Publiée le 31/10/2025 08:53.
Référence : Offre de thèse en Science des Données et IA à l'IRT SystemX — UPSaclay.
CDD, Palaiseau.
Entreprise/Organisme :IRT SystemX — Université Paris-Saclay
Niveau d'études :Master
Sujet :L'IRT SystemX propose une thèse sur l’apprentissage frugal de modèles génératifs multimodaux en contexte industriel. La thèse s'inscrit dans le cadre d'un projet collaboratif sur l'IA Générative pour l'Industrie, mené en partenariat avec notamment Air Liquide et Michelin, et son volet applicatif vise à adresser des cas d'usage industriels liés à la gestion de connaissances techniques en ingénierie de systèmes complexes. Le poste est basé à Palaiseau et la thèse sera inscrite à l'école doctorale STIC de l'Université Paris-Saclay. La thèse est financée pour une durée de 36 mois, avec une rémunération de 2784 € brut/mois, pour un démarrage souhaité début 2026. N'hésitez pas à partager autour de vous et à me contacter pour toute question.
Date de début :01 janvier 2026 (flexible)
Durée du contrat :36 mois
Rémunération :2784€ brut/mois
Secteur d'activité :Recherche
Description :Le poste est basé à Palaiseau
En savoir plus :https://www.irt-systemx.fr/recrutement/
Offre-de-These-IRTSystemX-DIT-2-2026-IAG1.pdf
Contact :faicel.chamroukhi@irt-systemx.fr

Page précédente  1  <2> 

 
 
©2026 SFdS
Société Française de Statistique
Institut Henri Poincaré
11 rue Pierre et Marie Curie
75231 Paris cedex 5
Tél. : +33 (0)1 44 27 66 60
Notre site a été supporté par :