Consulter les offres d’emploi

Classification Ascendante Hiérarchique par compromis

Publiée le 28/11/2025 09:06.

Stage, Tours.

Entreprise/Organisme :	UMR CITERES-LAT et UMR 6285 Laboratoire Lab-STICC
Niveau d'études :	Master
Sujet :	Classification Ascendante Hiérarchique par compromis : extension, étude de robustesse et application à des données archéologiques
Date de début :	A discuter
Durée du contrat :	6 mois
Rémunération :	gratification selon le tarif en vigueur
Secteur d'activité :	statistique appliquée à l'archéologie et à la santé
Description :	Depuis de nombreuses années, le Laboratoire Archéologie et Territoires (CITERES-LAT1, UMR 7324, CNRS – Université de Tours) collabore avec des équipes de statistique afin de concevoir des outils statistiques destinés à l’étude de la chronologie. Une méthode de Classification Ascendante Hiérarchique (CAH) par compromis a notamment été proposée afin de déterminer une partition consensuelle entre deux sources d’information (ex. céramique et stratigraphie) (Bellanger, Coulon, Husi 2021). Cette méthode est désormais implémentée dans le package R SPARTAAS (Statistical Pattern Recognition and daTing using Archeological Artefacts assemblageS) (Coulon, Bellanger, Husi 2023). Le stage de niveau M2 proposé s’inscrit dans le cadre du projet Arctools (OPEN CNRS) dont l’objectif est d’enrichir le package R SPARTAAS en finalisant sa brique chronologique. Les missions confiées à la personne recrutée porteront sur l’extension de la CAH par compromis à plus de deux sources d’informations et incluront : (i) la validation d’une méthode d’optimisation du critère permettant l’obtention du compromis, ainsi que l’étude des propriétés et de la robustesse de cette approche ; (ii) la comparaison avec différentes méthodes de classification non supervisée multivues ; (iii) l’intégration de cette extension dans une fonction R dédiée du package SPARTAAS. Différents corpus de données archéologiques, provenant de l’étude de la céramique - source matérielle omniprésente en archéologie - pourront être mobilisés (fouilles archéologiques réalisées à Angkor Thom, capitale de l’empire khmer (9e et le 15e s.) ou dans le bassin de la Loire Moyenne).
En savoir plus :	No link Stage_M2_Arctools_2026.pdf
Contact :	lise.bellanger@univ-ubs.fr

Ingénieur de formation orienté Intelligence Artificielle

Publiée le 24/11/2025 10:06.

Référence : Ingénieur formation IA.

CDD, Troyes.

Entreprise/Organisme :	Université de Technologie de Troyes
Niveau d'études :	Doctorat
Date de début :	Dès que possible
Durée du contrat :	4 ans
Secteur d'activité :	Enseignement supérieur
Description :	Missions de l’agent : Rattaché à la Direction de la formation et de la pédagogie, l’ingénieur de formation orienté IA fera partie d’une équipe projet impliquant la formation initiale, la formation continue, la coopérative pédagogique (le centre d’innovation pédagogique de l’UTT). Il/elle jouera un rôle clé dans la conception, la structuration et la mise en œuvre de ce nouveau programme de formation, en collaboration avec des experts du domaine, des enseignants, des ingénieurs pédagogiques et des partenaires académiques. Il/elle pourra être amené(e) à organiser et animer des sessions de formation (CM, TD, TP, webinaire, …) en soutien au déploiement de nouveaux contenus. Enfin, il/elle pourra contribuer aux comptes rendus, rapports d’activité et constitution de pièces justificatives éventuellement demandées par le financeur H!Paris.
En savoir plus :	https://www.utt.fr F_H Ingénieur_Formation_IA.pdf
Contact :	drh-recrutement@utt.fr

Stage M2 (2026, 6 mois) : Approches statistiques de bioéquivalence pour médicaments injectables

Publiée le 21/11/2025 13:20.

Stage, Lille.

Entreprise/Organisme :	ULR 2694 Metrics, Université de Lille
Niveau d'études :	Master
Sujet :	Évaluation d’approches de bioéquivalence par modélisation pour le développement de génériques de médicaments injectables à libération prolongée
Date de début :	A partir de Janvier 2026
Durée du contrat :	6 mois
Rémunération :	610€/mois (4.35€ net/h)
Secteur d'activité :	Statistique, Pharmacométrie
Description :	Garantir l’accès à des génériques sûrs et abordables reste un défi, notamment pour les formes injectables à libération prolongée (LAI), dont les essais de bioéquivalence (BE) sont souvent complexes. L’approche Model-Based BioEquivalence (MBBE), fondée sur la modélisation pharmacocinétique (PK) de population, est adaptée aux échantillons peu denses, fréquents dans ce contexte. Elle est ainsi recommandée par la FDA depuis 2022 pour l’évaluation de la BE des LAIs. Une première stratégie MBBE, développée par l’équipe Moclid (Paris), a ensuite fait l’objet de développements complémentaires en collaboration avec l’équipe Metrics (Lille). Elle repose sur trois étapes : ajustement du modèle, estimation de l’incertitude, puis test de BE basé sur une hypothèse de normalité des paramètres PK d’intérêt. Une équipe du département de Pharmacie de l'université d'Uppsala propose une stratégie alternative, intégrant une étape de simulation de population, suivie d’une évaluation de la BE à partir de la distribution empirique des rapports de moyennes géométriques, sans hypothèse de distribution. L’objectif du stage est de comparer les deux stratégies MBBE décrites ci-dessus, à partir d’essais simulés de BE de LAI. La génération d’essais réalistes reposera sur une revue systématique des publications concernant un médicament LAI, suivie de la simulation des essais de BE selon différents scénarios.
En savoir plus :	No link M2_2026_MBBE_LAI.pdf
Contact :	florence.loingeville@univ-lille.fr

Développement de méthodes statistiques en causalité

Publiée le 13/11/2025 12:02.

Référence : Stage recherche en causalité.

Stage, Paris, 6ème arrondissement ou Lille, Cité scientifique.

Entreprise/Organisme :	Université Paris Cité ou Université de Lille
Niveau d'études :	Master
Sujet :	1) Causalité en présence d'une exposition multiple Dans les cours introductifs de causalité, le premier type d’effet causal à être présenté est en général l'``effet causal moyen'' (ATE) pour une exposition binaire A et une réponse continue Y. Dans ce cas, l'ATE est défini comme la différence entre les valeurs attendues de la réponse sous l’exposition et en absence de l’exposition : ATE = E[Y(1)] - E[Y(0)]. Pour certaines applications, il est intéressant de considérer l’effet d’une exposition vectorielle A dans un espace euclidien de dimension d. Dans ce contexte, le paramètre cible E[Y(a_1,…,a_d)] définit une fonction ``dose-réponse'' de R^d vers R. Pour identifier ce paramètre, on peut utiliser une approche basée sur les scores de propension multivariés. La difficultés consiste alors à estimer des fonctions de densités conditionnelles multivariées. Une méthode simple consiste à modéliser ces densités par régression linéaire multivariée (Fong 2018, Williams 2020). Nous souhaiterions explorer d’autres approches pour estimer ces densités multivariées conditionnelles à l’aide de méthodes non paramétriques ou paramétrique mais flexibles. Dans cette deuxième classe de méthodes, on trouve les approches basées sur des réseaux de neurones. Par exemple, Shi et al. (2019) décrivent une architecture pour l’estimation du score de propension pour une exposition réelle. Il serait intéressant d’étudier la généralisation à une exposition multivariée. Une autre piste intéressante est celle des flots génératifs (voir Papamakarios 2021). Le stage pourrait porter sur l’étude d’une, ou plusieurs de ces approches, avec une validation par simulations. Nous aurons aussi la possibilité d’appliquer ces méthodes à des données réelles issues d’une cohorte française pour étudier les effets d’un mélange de polluants organiques persistants sur un événement de santé. 2) Causalité en analyse de survie En analyse de survie causale, on s’intéresse à l'effet causal d’une exposition sur le temps avant un événement d’intérêt T en présence de données censurées. Le correspondant de l'ATE dans ce contexte est donné par la différence P(T(1)>t) - P(T(0)>t), ou son intégrale par rapport à t sur un intervalle limité. Les résultats d’identification de l’ATE sur données non-censurées peuvent s’étendre à ce cadre, en considérant des poids qui prennent en compte non seulement la probabilité conditionnelle du traitement mais aussi la fonction de survie conditionnelle de la censure (Cheng 2022). Cette approche donne un estimateur consistant si les modèles utilisés pour estimer les probabilités conditionnelles définissant les poids sont bien spécifiés. Des estimateurs doublement robustes qui sont consistants sous des hypothèses moins restrictives ont également été proposés (Rytgaard 2023). Ces estimateurs, appelés estimateurs ``d'apprentissage ciblé'' sont issus de la théorie de l’efficacité semi-paramétrique (voir par exemple le lien Github ``Introduction to modern causal inference'' de Schuler et van der Laan). La théorie mathématique sous-jacente à ces estimateurs est particulièrement riche et élégante mais demande un peu d’investissement. Le stage pourrait porter sur un travail bibliographique pour comprendre et présenter de façon accessible ces approches et, si possible, sur une validation par simulations. Il sera aussi possible d’appliquer les méthodes étudiées à des données de vie réelle pour étudier l’effet d’un traitement hormonal sur le cancer du sein.
Date de début :	A n'importe quel moment à partir du mois de février
Durée du contrat :	4 à 6 mois
Rémunération :	660 euros par mois
Secteur d'activité :	Statistique
Description :	1) Causalité en présence d'une exposition multiple Dans les cours introductifs de causalité, le premier type d’effet causal à être présenté est en général l'``effet causal moyen'' (ATE) pour une exposition binaire A et une réponse continue Y. Dans ce cas, l'ATE est défini comme la différence entre les valeurs attendues de la réponse sous l’exposition et en absence de l’exposition : ATE = E[Y(1)] - E[Y(0)]. Pour certaines applications, il est intéressant de considérer l’effet d’une exposition vectorielle A dans un espace euclidien de dimension d. Dans ce contexte, le paramètre cible E[Y(a_1,…,a_d)] définit une fonction ``dose-réponse'' de R^d vers R. Pour identifier ce paramètre, on peut utiliser une approche basée sur les scores de propension multivariés. La difficultés consiste alors à estimer des fonctions de densités conditionnelles multivariées. Une méthode simple consiste à modéliser ces densités par régression linéaire multivariée (Fong 2018, Williams 2020). Nous souhaiterions explorer d’autres approches pour estimer ces densités multivariées conditionnelles à l’aide de méthodes non paramétriques ou paramétrique mais flexibles. Dans cette deuxième classe de méthodes, on trouve les approches basées sur des réseaux de neurones. Par exemple, Shi et al. (2019) décrivent une architecture pour l’estimation du score de propension pour une exposition réelle. Il serait intéressant d’étudier la généralisation à une exposition multivariée. Une autre piste intéressante est celle des flots génératifs (voir Papamakarios 2021). Le stage pourrait porter sur l’étude d’une, ou plusieurs de ces approches, avec une validation par simulations. Nous aurons aussi la possibilité d’appliquer ces méthodes à des données réelles issues d’une cohorte française pour étudier les effets d’un mélange de polluants organiques persistants sur un événement de santé. 2) Causalité en analyse de survie En analyse de survie causale, on s’intéresse à l'effet causal d’une exposition sur le temps avant un événement d’intérêt T en présence de données censurées. Le correspondant de l'ATE dans ce contexte est donné par la différence P(T(1)>t) - P(T(0)>t), ou son intégrale par rapport à t sur un intervalle limité. Les résultats d’identification de l’ATE sur données non-censurées peuvent s’étendre à ce cadre, en considérant des poids qui prennent en compte non seulement la probabilité conditionnelle du traitement mais aussi la fonction de survie conditionnelle de la censure (Cheng 2022). Cette approche donne un estimateur consistant si les modèles utilisés pour estimer les probabilités conditionnelles définissant les poids sont bien spécifiés. Des estimateurs doublement robustes qui sont consistants sous des hypothèses moins restrictives ont également été proposés (Rytgaard 2023). Ces estimateurs, appelés estimateurs ``d'apprentissage ciblé'' sont issus de la théorie de l’efficacité semi-paramétrique (voir par exemple le lien Github ``Introduction to modern causal inference'' de Schuler et van der Laan). La théorie mathématique sous-jacente à ces estimateurs est particulièrement riche et élégante mais demande un peu d’investissement. Le stage pourrait porter sur un travail bibliographique pour comprendre et présenter de façon accessible ces approches et, si possible, sur une validation par simulations. Il sera aussi possible d’appliquer les méthodes étudiées à des données de vie réelle pour étudier l’effet d’un traitement hormonal sur le cancer du sein.
En savoir plus :	https://obouaziz.github.io/supervision.html Stage_Causalite.pdf
Contact :	olivier.bou-aziz@univ-lille.fr

Classification supervisée de données spatio-temporelles avec application aux capteurs tactiles

Publiée le 03/11/2025 10:01.

Référence : Stage M2 SmartSkin.

Stage, 2 rue Conté, 75003 Paris.

Entreprise/Organisme :	Conservatoire National des Arts et Métiers (CNAM) - Laboratoire Cédric
Niveau d'études :	Master
Sujet :	Les capteurs visent à reproduire les capacités sensorielles de la peau humaine afin de détecter simultanément la pression, la température, la texture et d’autres propriétés des objets en contact. Ce stage s'inscrit dans le cadre du projet exploratoire SmartSkin dédié au développement de capteurs tactiles artificiels. Ce domaine de recherche, en plein essor, présente de nombreuses applications en robotique, en interaction homme-machine et en médecine. Un prototype fonctionnel a été développé en s'appuyant sur une technique appelée tomographie par impédance électrique. Celui-ci est en mesure de collecter des données de nature variée, telles que des signaux périodiques ou la pression exercée par un objet et cherche à reconnaître le type de matériau en contact (par exemple : main humaine, métal, fruit, etc.). D'un point de vue statistique, la modélisation des données issues de ces capteurs constitue un problème de classification supervisée qui revêt plusieurs défis méthodologiques liés à la nature des données. D'une part, les signaux mesurés sont de nature fonctionnelle (signaux périodiques). D'autre part, les données présentent une composante spatiale, liée à la position du contact sur la surface du capteur. De plus, une autre difficulté réside dans le fait que les signaux sont collectés à différentes fréquences et à des instants non synchrones. Dans ce contexte, l'objectif est de développer une méthodologie de classification supervisée capable de prendre en compte ces différents aspects de complexité.
Date de début :	Entre janvier et avril 2026
Durée du contrat :	5 à 6 mois
Rémunération :	Gratification de stage
Description :	Les capteurs visent à reproduire les capacités sensorielles de la peau humaine afin de détecter simultanément la pression, la température, la texture et d’autres propriétés des objets en contact. Ce stage s'inscrit dans le cadre du projet exploratoire SmartSkin dédié au développement de capteurs tactiles artificiels. Ce domaine de recherche, en plein essor, présente de nombreuses applications en robotique, en interaction homme-machine et en médecine. Un prototype fonctionnel a été développé en s'appuyant sur une technique appelée tomographie par impédance électrique. Celui-ci est en mesure de collecter des données de nature variée, telles que des signaux périodiques ou la pression exercée par un objet et cherche à reconnaître le type de matériau en contact (par exemple : main humaine, métal, fruit, etc.). D'un point de vue statistique, la modélisation des données issues de ces capteurs constitue un problème de classification supervisée qui revêt plusieurs défis méthodologiques liés à la nature des données. D'une part, les signaux mesurés sont de nature fonctionnelle (signaux périodiques). D'autre part, les données présentent une composante spatiale, liée à la position du contact sur la surface du capteur. De plus, une autre difficulté réside dans le fait que les signaux sont collectés à différentes fréquences et à des instants non synchrones. Dans ce contexte, l'objectif est de développer une méthodologie de classification supervisée capable de prendre en compte ces différents aspects de complexité.
En savoir plus :	https://cnam-my.sharepoint.com/:b:/g/personal/feriel_bouhadjera_lecnam_net/EXybYeem38dKlYviiFE-EIABy Sujet_Stage_M2_Stat_SmartSkin.pdf
Contact :	feriel.bouhadjera@lecnam.net

Apprentissage frugal de modèles génératifs multimodaux en contexte industriel

Publiée le 31/10/2025 08:53.

Référence : Offre de thèse en Science des Données et IA à l'IRT SystemX — UPSaclay.

CDD, Palaiseau.

Entreprise/Organisme :	IRT SystemX — Université Paris-Saclay
Niveau d'études :	Master
Sujet :	L'IRT SystemX propose une thèse sur l’apprentissage frugal de modèles génératifs multimodaux en contexte industriel. La thèse s'inscrit dans le cadre d'un projet collaboratif sur l'IA Générative pour l'Industrie, mené en partenariat avec notamment Air Liquide et Michelin, et son volet applicatif vise à adresser des cas d'usage industriels liés à la gestion de connaissances techniques en ingénierie de systèmes complexes. Le poste est basé à Palaiseau et la thèse sera inscrite à l'école doctorale STIC de l'Université Paris-Saclay. La thèse est financée pour une durée de 36 mois, avec une rémunération de 2784 € brut/mois, pour un démarrage souhaité début 2026. N'hésitez pas à partager autour de vous et à me contacter pour toute question.
Date de début :	01 janvier 2026 (flexible)
Durée du contrat :	36 mois
Rémunération :	2784€ brut/mois
Secteur d'activité :	Recherche
Description :	Le poste est basé à Palaiseau
En savoir plus :	https://www.irt-systemx.fr/recrutement/ Offre-de-These-IRTSystemX-DIT-2-2026-IAG1.pdf
Contact :	faicel.chamroukhi@irt-systemx.fr

Page précédente 1 2 <3>