Consulter les offres d’emploi

Détection non-supervisée d’anomalies dans des flux continus de séries temporelles multivariées
Publiée le 18/02/2025 11:02.
Référence : Thèse CIFRE EDF R&D 2025-127650.
Thèse, EDF R&D Lab Chatou.
Entreprise/Organisme :EDF R&D / Inria
Niveau d'études :Master
Date de début :A partir de mi-2025, en fonction de la date de recrutement du candidat
Secteur d'activité :Recherche, énergie
Description :Dans le contexte du suivi en continu des matériels des installations de production d’électricité d’EDF, la détection d’anomalies en temps réel dans les séries temporelles issues des capteurs de surveillance représente un enjeu crucial : plus elle est précoce et efficace, plus on est en mesure de réagir tôt et à bon escient pour tenter d’atténuer les impacts, voire d’éviter la survenue, de tout événement potentiellement critique, comme un dysfonctionnement ou une défaillance d’un équipement. Disposer de méthodes performantes de détection non-supervisée de sous-séquences anormales en streaming, adaptées à des flux continus de séries temporelles multivariées (l’anomalie pouvant être caractérisée par l’évolution simultanée de plusieurs paramètres physiques, ou observée uniquement au travers des mesures conjointes de différents capteurs), revêt donc un intérêt de tout premier ordre pour aider à la décision en appui à l’exploitation et à la maintenance des matériels. Les verrous scientifiques et techniques associés à cet objectif sont multiples, parmi lesquels la gestion de l’hétérogénéité entre les dimensions d’une même série temporelle multivariée (longueurs ou fréquences d’échantillonnage différentes, séries de données discrètes vs. continues, présence ou absence de corrélations entre plusieurs dimensions…), le développement de mesures de similarité adaptées à des sous-séquences temporelles multivariées, la définition de mesures de performance adaptées à la détection de sous-séquences anormales, la construction d’un recueil de jeux de données appropriés pour que les résultats des études comparatives aient du sens, le choix de la famille d’algorithmes la plus adaptée pour répondre au problème et la calibration optimale du paramétrage, en visant un compromis entre « précision » / « adaptativité » / « robustesse à une dérive conceptuelle » / « temps d’exécution » / « taille mémoire » imposé par le cadre non-supervisé et en flux continu de données. La dimension « interprétabilité » du modèle est également importante. Dans ce contexte, la thèse visera à produire des algorithmes génériques, performants et testés avec succès sur des jeux de données simulées, issues de la littérature et réelles provenant de cas d’usage EDF. Elle mènera à la production d’articles scientifiques (communications en conférences, articles de journaux) et dépôts de brevets, si pertinent. Les méthodes développées feront l’objet d’implémentations informatiques (librairies Python / R / Julia) pour faciliter leur utilisation en interne EDF R&D et leur transfert à l’ingénierie d’EDF. Elle sera dirigée par deux chercheurs de l’équipe Valda d’Inria Paris et encadrée par trois chercheurs du département PRISME d’EDF R&D (site Lab Chatou).
En savoir plus :https://www.edf.fr/edf-recrute/offre/detail/2025-127650
Sujet-thèse-CIFRE_anomalies-séries-temporelles_EDF-INRIA_SFdS.pdf
Contact :emmanuel.remy@edf.fr
Chargé d’étude scientifique – Data manager SNDS (f/h)
Publiée le 18/02/2025 10:56.
Référence : DATA-CDI-2024-10.
CDI, 12 rue du Val d'Osne 94410 Saint-Maurice.
Entreprise/Organisme :Santé publique France
Niveau d'études :DUT/Licence ou équivalent
Description :Présentation de l'agence : Santé publique France est l’agence nationale de santé publique française. Etablissement public de l’Etat sous tutelle du ministre chargé de la santé créé par l’ordonnance 2016-246 du 15 avril 2016, elle intervient au service de la santé des populations. Agence scientifique et d’expertise du champ sanitaire. ACTIVITES : Sous l’autorité du responsable d’unité et en lien étroit avec ses collègues de l’équipe SNDS, le chargé d’études F/H sera plus particulièrement chargé des activités suivantes : . Contribuer à la conception d’études à partir des données du SNDS, en lien avec les directions métiers de l’agence : - Participer à l’équipe projet et au(x) groupe(s) de travail dédié(s), contribuer à la rédaction du protocole et aux choix méthodologiques . Assurer la gestion et le traitement des données du SNDS : - Développer des programmes et réaliser des requêtes sur le portail SNDS ou les bases de données historiques détenues par l’agence ; - Préparer les données : créer des fichiers de données, créer de nouvelles variables d’analyse, construire et mettre à jour des indicateurs, organiser les données sur le réseau de façon sécurisée ; - Contribuer au développement d’algorithmes de sélection pour des pathologies données ; - Contribuer aux analyses statistiques des données ; - Contribuer à la veille méthodologique ; - Faciliter l’accès, l’utilisation et l’analyse des données SNDS en interne à l’agence : suivi des actualités, mise à disposition de documents de référence, de banques de programmes, rédaction de guides méthodologiques ; - Veiller au respect des conditions d’accès au portail SNDS : contribuer au suivi et à la mise à jour des demandes d’habilitation et d’accès aux données, assurer la revue annuelle des habilitations et projets, tenir à jour les registres ad hoc ; - Participer aux permanences hebdomadaires SNDS assurées par l’équipe ; - Participer aux formations réalisées par l’équipe sur le périmètre SNDS ainsi qu’a leur préparation et à l’organisation - Participer à l’animation et au développement des partenariats interne et externe (HDH, REDSIAM …) développés autour de l’écosystème SNDS. . Contribuer à la mise à disposition et à la valorisation des résultats en lien avec les épidémiologistes et les statisticiens : - Proposer des sujets et approches innovantes pour l’exploitation du SNDS - Encadrer des stagiaires dans le cadre de l’internat de santé publique ou en Master - Communiquer des résultats ; - Rédiger des rapports d’études et des articles scientifiques. Le chargé d’études pourra également être amené à apporter son soutien pour le traitement, l’analyse et la restitution à partir d’autres données épidémiologiques de l’agence. Profil recherché : - Bac +3 à Bac +5 dans le domaine des statistiques ou de la gestion et du traitement de données (formation universitaire ou diplôme d’ingénieur) - Une expérience préalable sur l’analyse des données du SNDS (données de l’assurance maladie (DCIR), données hospitalières (PMSI) ou données de mortalité (CépiDc)) est souhaitée. Aptitudes et compétences : - Maîtrise des logiciels SAS et R. - Etre à l'aise sur des techniques et outils statistiques et informatiques de traitement de données : - Rigueur scientifique - Capacités d’analyse et de synthèse - Qualités relationnelles, aptitude à la discussion, au partage et au travail d’équipe - Curiosité intellectuelle, esprit d’initiative et autonomie - Organisation, capacité à gérer un portefeuille de projets - Qualités rédactionnelles
En savoir plus :https://www.santepubliquefrance.fr/offres-d-emploi/charge-d-etude-scientifique-data-manager-snds
DATA-CDI-2024-10 CES data manager SNDS unité Abiss.pdf
Contact :recrut@santepubliquefrance.fr
Analyse entre les facteurs environnementaux et le développement de l'enfant
Publiée le 18/02/2025 10:56.
Stage, Laboratoire Jean Kuntzmann, 150 place du Torrent, 38400 Saint Martin d’Hères.
Entreprise/Organisme :Laboratoire Jean Kuntzmann - Université Grenoble Alpes
Niveau d'études :Master
Sujet :La santé humaine peut être affectée par de nombreuses expositions environnementales, parmi lesquelles un grand nombre de preuves ont démontré l'impact de la pollution de l'air ambiant, des températures ambiantes élevées et des vagues de chaleur sur la morbidité et la mortalité (Schwartz, 1994). Les expositions au début de la vie sont particulièrement préoccupantes : la vie intra-utérine est une période critique de plasticité au cours de laquelle les agressions environnementales peuvent modifier les programmes de développement avec des effets immédiats visibles à la naissance ou des effets différés qui apparaissent pendant l'enfance, à la puberté ou à l'âge adulte. Ces travaux sont liés au domaine de recherche DOHaD (Developmental Origins of Health and Diseases), qui affirme que plusieurs maladies fréquentes peuvent avoir une origine pendant la période de développement (Sinclair et al. 2007). Chez les animaux, un large corpus de recherche soutient cette hypothèse (Hanson and Gluckman 2011) y compris pour la pollution de l'air (Veras et al. 2009) et l'exposition à la chaleur pendant la gestation (van Wettere et al. 2021). Chez l'homme, des études épidémiologiques ont démontré les effets néfastes de la pollution atmosphérique et de la chaleur sur l'issue de multiples naissances (par exemple, diminution du poids à la naissance, augmentation des naissances prématurées, mortes et néonatales) (Jakpor et al. 2020; Chersich et al. 2020; Song et al. 2023). Plus tard dans la vie, le faible poids du bébé à la naissance contribue de manière significative à la morbidité et à la mortalité périnatales (Pallotto and Kilbride 2006). Au-delà de la période néonatale, le retard de croissance intra-utérin peut avoir des ramifications tout au long de la vie en augmentant le risque de plusieurs maladies cardiovasculaires, respiratoires et métaboliques (Fowden et al. 2006). Du point de vue de l'exposition, les études examinent de plus en plus l'ensemble de la trajectoire d'exposition d'un individu, en tenant compte de chaque semaine, de la conception à la naissance (Gasparrini et al. 2010; Jakpor et al. 2020), en tirant parti de modèles d'exposition de pointe dotés d'une résolution spatiale et temporelle fine (Hough et al. 2020; Hough et al. 2021). Du point de vue du développement, le poids de naissance est une mesure a posteriori qui ne reflète pas nécessairement les différentes trajectoires de croissance au cours de la vie fœtale. Certaines études ont examiné la contribution de l'échographie à la détection d'éventuels effets précoces et de phénomènes de croissance de rattrapage (Iñiguez et al. 2016). En outre, l'identification des fenêtres critiques d'exposition à l'environnement pendant la grossesse présente un intérêt considérable pour mieux prévenir les effets sur la santé du fœtus. Cependant, aucune étude n'a évalué les effets de l'ensemble de la trajectoire d'exposition sur la trajectoire de croissance du fœtus, en tenant compte des aspects longitudinaux de l'exposition et du résultat. Objectifs L'objectif du stage de Master 2 est de développer des modèles statistiques et des méthodes d'estimation prenant en compte la nature longitudinale des données d'exposition et de résultats. La première étape consistera à revoir les packages existants dlnm, nlme et à identifier leurs limites. La seconde étape consistera à développer un nouveau package incluant l'extension aux effets aléatoires et aux interactions entre variables. Ce projet de Master 2 est la première étape d'un projet de doctorat plus général visant à produire de nouvelles connaissances sur les effets de la pollution de l'air et de l'exposition à la chaleur pendant la grossesse sur la croissance du fœtus (dans un contexte de données répétées à la fois pour l'exposition et le résultat). Le CV et la lettre de motivation (y compris les perspectives de carrière) doivent être envoyés aux adresses suivantes adeline.leclercq-samson@univ-grenoble-alpes.fr, vincent.brault@univ-grenoble-alpes.fr, johanna.lepeule@univ-grenoble-alpes.fr Ces documents peuvent être rédigés en français ou en anglais.
Durée du contrat :5 à 6 mois
Rémunération :Indemnités suivant grille officielle
Secteur d'activité :Recherche - Epidémiologie
Description :La santé humaine peut être affectée par de nombreuses expositions environnementales, parmi lesquelles un grand nombre de preuves ont démontré l'impact de la pollution de l'air ambiant, des températures ambiantes élevées et des vagues de chaleur sur la morbidité et la mortalité (Schwartz, 1994). Les expositions au début de la vie sont particulièrement préoccupantes : la vie intra-utérine est une période critique de plasticité au cours de laquelle les agressions environnementales peuvent modifier les programmes de développement avec des effets immédiats visibles à la naissance ou des effets différés qui apparaissent pendant l'enfance, à la puberté ou à l'âge adulte. Ces travaux sont liés au domaine de recherche DOHaD (Developmental Origins of Health and Diseases), qui affirme que plusieurs maladies fréquentes peuvent avoir une origine pendant la période de développement (Sinclair et al. 2007). Chez les animaux, un large corpus de recherche soutient cette hypothèse (Hanson and Gluckman 2011) y compris pour la pollution de l'air (Veras et al. 2009) et l'exposition à la chaleur pendant la gestation (van Wettere et al. 2021). Chez l'homme, des études épidémiologiques ont démontré les effets néfastes de la pollution atmosphérique et de la chaleur sur l'issue de multiples naissances (par exemple, diminution du poids à la naissance, augmentation des naissances prématurées, mortes et néonatales) (Jakpor et al. 2020; Chersich et al. 2020; Song et al. 2023). Plus tard dans la vie, le faible poids du bébé à la naissance contribue de manière significative à la morbidité et à la mortalité périnatales (Pallotto and Kilbride 2006). Au-delà de la période néonatale, le retard de croissance intra-utérin peut avoir des ramifications tout au long de la vie en augmentant le risque de plusieurs maladies cardiovasculaires, respiratoires et métaboliques (Fowden et al. 2006). Du point de vue de l'exposition, les études examinent de plus en plus l'ensemble de la trajectoire d'exposition d'un individu, en tenant compte de chaque semaine, de la conception à la naissance (Gasparrini et al. 2010; Jakpor et al. 2020), en tirant parti de modèles d'exposition de pointe dotés d'une résolution spatiale et temporelle fine (Hough et al. 2020; Hough et al. 2021). Du point de vue du développement, le poids de naissance est une mesure a posteriori qui ne reflète pas nécessairement les différentes trajectoires de croissance au cours de la vie fœtale. Certaines études ont examiné la contribution de l'échographie à la détection d'éventuels effets précoces et de phénomènes de croissance de rattrapage (Iñiguez et al. 2016). En outre, l'identification des fenêtres critiques d'exposition à l'environnement pendant la grossesse présente un intérêt considérable pour mieux prévenir les effets sur la santé du fœtus. Cependant, aucune étude n'a évalué les effets de l'ensemble de la trajectoire d'exposition sur la trajectoire de croissance du fœtus, en tenant compte des aspects longitudinaux de l'exposition et du résultat. Objectifs L'objectif du stage de Master 2 est de développer des modèles statistiques et des méthodes d'estimation prenant en compte la nature longitudinale des données d'exposition et de résultats. La première étape consistera à revoir les packages existants dlnm, nlme et à identifier leurs limites. La seconde étape consistera à développer un nouveau package incluant l'extension aux effets aléatoires et aux interactions entre variables. Ce projet de Master 2 est la première étape d'un projet de doctorat plus général visant à produire de nouvelles connaissances sur les effets de la pollution de l'air et de l'exposition à la chaleur pendant la grossesse sur la croissance du fœtus (dans un contexte de données répétées à la fois pour l'exposition et le résultat). Le CV et la lettre de motivation (y compris les perspectives de carrière) doivent être envoyés aux adresses suivantes adeline.leclercq-samson@univ-grenoble-alpes.fr, vincent.brault@univ-grenoble-alpes.fr, johanna.lepeule@univ-grenoble-alpes.fr Ces documents peuvent être rédigés en français ou en anglais.
En savoir plus :https://svh.imag.fr/
sujet M2 Developpement enfant.pdf
Contact :vincent.brault@univ-grenoble-alpes.fr
Poste Maître de Conférences "Probabilités numériques, statistique et optimisation stochastique"
Publiée le 18/02/2025 10:56.
Référence : Poste MC Université de Bordeaux.
CDI, Bordeaux (Talence).
Entreprise/Organisme :Université de Bordeaux, Institut de Mathématiques de Bordeaux, équipe Inria Astral
Niveau d'études :Doctorat
Description :La personne candidate sera rattachée à l’IMB et sera invitée à intégrer l’équipe commune Inria/Université ASTRAL avec un profil principal en probabilités numériques, statistique et optimisation stochastique. Son ouverture scientifique doit lui permettre d’envisager des collaborations académiques locales au sein de l’IMB, de l’Inria et des autres laboratoires du site telle que l’Inrae ou l’Inserm.
En savoir plus :https://www.math.u-bordeaux.fr/imb/l-imb-recrute-1-pr-et-3-mcf-en-2025
5. MCF - 26 Proba-Stat.pdf
Contact :marie.chavent@u-bordeaux.fr
Stage M2/ingénieur.e - Dynamique spatio-temporelle d'une maladie du bananier au Mozambique
Publiée le 18/02/2025 10:56.
Référence : Dynamique spatio-temporelle d'une maladie du bananier au Mozambique.
Stage, Montpellier, Campus International de Baillarguet.
Entreprise/Organisme :CIRAD - Equipe FORISK, UMR Plant Health Institute of Montpellier
Niveau d'études :Master
Sujet :Dynamique spatio-temporelle de la fusariose race tropicale 4 au Mozambique : comprendre et modéliser la propagation d’une maladie majeure du bananier
Date de début :A partir d'avril 2025
Durée du contrat :6 mois
Rémunération :Gratification selon les standards réglementaires
Secteur d'activité :Agriculture ; Epidemiologie végétale ; Auto-suffisance alimentaire
Description :La fusariose race tropicale 4 (Foc TR4) est une maladie dévastatrice du bananier qui entraîne la mort de la plante. Alors que 80 % des variétés cultivées sont vulnérables, aucune méthode de lutte efficace n'existe actuellement pour limiter les dégâts occasionnés par la maladie. Foc TR4 représente un risque économique mais aussi pour l'auto-suffisance alimentaire de nombreux pays. Ce stage a pour objectif de développer des connaissances essentielles pour l’épidémiosurveillance de Foc TR4 à partir de données documentant l’émergence de cette maladie au Mozambique. En s’appuyant sur des observations épidémiologiques réalisées sur près de 3000 plantes pendant 2 ans, le ou la stagiaire développera un modèle retraçant la propagation de la maladie en fonction de la présence ou non de mesures de contention de la maladie ainsi que de variables climatiques. Ce travail sera essentiel pour développer de nouvelles connaissances sur l'épidémie de Foc TR4, ainsi que pour déterminer la fréquence optimale d’échantillonnage sur le terrain et pour concevoir des méthodes de détection exploitables sur le terrain.
En savoir plus :https://www.linkedin.com/posts/mathilde-chen-38916b65_stage-foc-tr4-mozambique-activity-729537113643
Contact :mathilde.chen@cirad.fr
Chargé d’études « méthodes et statistiques d’enquêtes » (f/h)
Publiée le 11/02/2025 14:36.
Référence : DATA-CDD-2025-01.
CDD, Saint-Maurice (94).
Entreprise/Organisme :Santé publique France
Niveau d'études :Master
Date de début :Dès que possible
Durée du contrat :3 ans
Rémunération :Selon l’expérience et le niveau de formation par référence aux grilles des agences sanitaires
Secteur d'activité :Santé publique, épidémiologie, Statistique
Description :Le chargé d’études sera placé au sein de l’unité Enquêtes de la DATA et travaillera au sein de l’équipe projet interdirection constituée pour concevoir et mettre en oeuvre l’enquête SaMarOya – Enquête de santé en Guyane intérieure. La Guyane française, département et région d’outre-mer situé sur le continent sud-américain et recouvert à 97 % de forêt amazonienne, est un vaste territoire, vulnérable et hétérogène où 53 % de sa population, qui se concentre sur le littoral atlantique, vit sous le seuil de pauvreté. Dans les huit communes les plus isolées de Guyane, communément regroupées sous le terme « Guyane intérieure », vivent environ 50 000 personnes d’origines diverses, en majorité amérindiennes, bushinenguées et créoles, dans des villages ou petites villes le long des fleuves Maroni et Oyapock et au coeur de la forêt (Saül). Dans ces zones isolées géographiquement et uniquement accessibles par voie fluviale et aérienne, les indicateurs socioéconomiques sont plus dégradés que dans le reste de la région, l’accès aux services essentiels et plus spécifiquement aux services de santé est limité et les données actuellement disponibles pour décrire l’état de santé de la population sont insuffisantes. En réponse à ce manque de données, Santé publique France a conçu une méthode, originale et adaptée au terrain complexe, d’enquête transversale multithématique en population générale (échantillon aléatoire d’environ 3000 personnes) avec administration de questionnaire en face à face par un médiateur en santé issu de la communauté et formé au métier d’enquêteur et la réalisation de prélèvements biologiques et de mesures anthropométriques par un infirmier diplômé d’état (IDE). Le déploiement de cette enquête, nommée SaMarOya, en partenariat avec le CH de Cayenne et ses Centres Délocalisés de Prévention et de Soins se fera en trois phases : une phase de préparation en 2025, une phase de terrain pour la collecte des données en 2026 et une phase d’analyse, valorisation et restitution des résultats en 2027. Sous l’autorité du responsable de l’Unité Enquêtes, la personne recrutée participe, au sein de l’équipe projet et en lien avec la biostatisticienne de l’équipe projet, aux différentes étapes de conception et de mise en oeuvre opérationnelle de cette enquête. À ce titre, la personne recrutée est plus particulièrement chargée de :  Participer aux réunions internes et externes nécessaires à la mise en oeuvre de l’enquête : réunions de l’équipe projet, réunions de l’équipe projet élargie, réunions avec les prestataires et partenaires de l’enquête  Aider à la préparation des dossiers d’autorisations règlementaires et au dossier pour le comité du Label, pour la mise en oeuvre de l’enquête  Participer au choix de la méthodologie et du protocole de collecte  En lien avec l’Unité enquêtes, la Division Sondages de l’Insee, l’équipe projet et le prestataire de collecte, définir le plan de sondage le plus adapté à cette étude  Participer au cadrage et au suivi du prestataire en charge de la collecte : préparation des questionnaires et autre matériel d’enquête (courriers, mails, site internet, hotline etc.) ; validation des datamaps (format des questions programmées) ; soutien à la formation des enquêteurs ainsi qu’à la définition des outils de gestion et de suivi de terrain ; contribution à la supervision du déroulement du pilote et du terrain d’enquête, y compris volet IDE et prélèvement biologique, etc.  En phase post-collecte : o Participer au nettoyage des données ainsi qu’à la mise en oeuvre des traitements statistiques de correction de la non-réponse (totale et partielle), pondération et redressement, traitements des données aberrantes. Participer à la production de la documentation des enquêtes sur ces points : bilan méthodologique, guides d’utilisation o Contribuer à l’exploitation des données d’enquêtes, en lien avec l’équipe projet et les épidémiologistes : analyses statistiques, rédaction de rapports et valorisations scientifiques (articles scientifiques, communications à des colloques, séminaires, conférences, participation à des groupes d’échanges interinstitutionnels etc) A noter que des déplacements sur le terrain pourront être nécessaires à différentes phases du projet. Le chargé d’études pourra également être amené à participer à d’autres activités de l’unité Enquêtes, notamment : veille scientifique et échanges scientifiques, participation aux réunions d’unité et de Direction etc. En outre, il pourra participer à toute activité entrant dans les missions de l’Agence si cela s’avère nécessaire en situation d’urgence ou de crise.
En savoir plus :https://www.santepubliquefrance.fr/offres-d-emploi/charge-d-etudes-methodes-et-statistiques-d-enquet
DATA-CDD-2025-01 CES SaMarOya.pdf
Contact :jean-baptiste.richard@santepubliquefrance.fr
Poste PU Statistique - Science des données CNAM
Publiée le 11/02/2025 14:36.
Référence : PU Statistique CNAM.
CDI, Paris.
Entreprise/Organisme :Conservatoire National des Arts et Métiers
Niveau d'études :Autre
Description :Un poste de Professeur des Universités sera ouvert au concours pour la campagne 2025 au Conservatoire National des Arts et Métiers en Statistique - Science des données. Ce poste renforcera l'équipe MSDMA du laboratoire CEDRIC (https://cedric.cnam.fr/lab/equipes/msdma/) dont les travaux concernent le traitement de données complexes à travers des méthodes d’apprentissage supervisé et non supervisé: statistique en grande dimension, modélisation prédictive, classification, données complexes caractérisées par une structure hétérogène des observations ou des variables, par la présence de données manquantes, censurées ou tronquées, ou par leur dimension évolutive. La recherche de la personne recrutée viendra renforcer une des thématiques actuelles de l'équipe à travers le développement de méthodes avancées pour l’analyse de données de diverses natures que ce soit des données fonctionnelles, des données textuelles, en flux ou incrémentales ou encore des données mixtes. Un accent particulier sera mis sur les aspects interprétabilité et explicabilité en lien avec le concept XAI. Les informations complémentaires sont fournies en pièce jointe.
En savoir plus :https://presentation.cnam.fr/medias/fichier/pr-statistique-science-des-donne-es-epn06_1738675658173-
PR_Statistique- Science des donnees_EPN06.pdf
Contact :n-deye.niang_keita@cnam.fr
IECL (Institut Elie Cartan de Lorraine), laboratoire de mathématiques
Publiée le 11/02/2025 12:11.
Référence : Jérémie Unterberger.
Thèse, Nancy.
Entreprise/Organisme :Université de Lorraine
Niveau d'études :Master
Sujet :Inference of kinetics of large multi-scale chemical reaction networks
Date de début :end 2025 - beginning 2026, depending also on funding
Durée du contrat :3 years
Rémunération :about 2000€ net/month
Secteur d'activité :scientific research
Description :The aim of the project is to develop a specific inference method adapted to a class of meta-models developed to describe large chemical reaction networks. The projet is articulated with exploratory experimental research programs in chemistry, biology and astrochemistry, concerned with a quantitative quest for origins of life on Earth or elsewhere in the universe. We are looking for a candidate skilled in probability theory and statistical inference techniques, interested in collaborating with scientists from very different backgrounds, and competent in Python programming.
En savoir plus :https://jeremieunterberger.wixsite.com/monsite
PhD proposal inference CRN kinetics.pdf
Contact :jeremie.unterberger@univ-lorraine.fr
Biostatisticien
Publiée le 07/02/2025 09:11.
CDD, Pierre-Bénite.
Entreprise/Organisme :LYSARC
Niveau d'études :Master
Durée du contrat :18 mois
Secteur d'activité :Lifescience
Description :Rejoignez le LYSARC, expert européen reconnu dans le domaine de la recherche clinique ! Notre équipe multidisciplinaire œuvre au quotidien avec une ambition commune : développer des thérapies innovantes contre le lymphome - premier cancer du sang - et améliorer la qualité de vie des patients. Le LYSARC promeut et conduit des études cliniques internationales de phase I à IV dans le domaine du lymphome et des études de vie réelle, reconnues par la communauté scientifique internationale. Vous souhaitez contribuer à faire avancer la recherche dans un environnement bienveillant et stimulant ? Participez à une véritable aventure humaine et scientifique ! Dans le cadre de son développement méthodologique, l’équipe statistique (composée d’une vingtaine de personnes, statisticiens et programmeurs SAS) recherche pour une durée de 18 mois (CDD) afin de travailler sur les comparaisons indirectes, valoriser les bases de données du LYSARC et proposer de nouveaux projets scientifiques à nos partenaires du LYSA et/ou industriels. Biostatisticien (H/F) Missions • Développer et/ou appliquer des méthodes statistiques pertinentes d’inférence causale pour la réalisation de comparaisons indirectes avec bras de contrôle externes • Partager des connaissances techniques sur la thématique de l’inférence causale au sein de l’équipe biométrie • Contribuer à l’écriture et à la standardisation des programmes d’analyse statistique sur cette thématique • Proposer des stratégies d’analyse pour exploiter au mieux les données en étroite collaboration avec l’équipe et les médecins hématologues • Participer aux choix méthodologiques et participer à la réalisation des plans d’analyses statistiques • Réaliser ou superviser la réalisation des analyses statistiques en lien avec les programmeurs • Valider la cohérence des résultats, et assurer la validité de l’interprétation des résultats • Servir de support pour toutes les questions statistiques relatives aux études sur lesquelles le biostatisticien est impliqué • Participer à la rédaction de rapports statistiques, de publications et de présentations de résultats auprès des parties prenantes internes (Pôle méthodo) et/ou externes
En savoir plus :https://experts-recherche-lymphome.org/nous-rejoindre/biostatisticien-h-f/
Biostatisticien LYSARC_CDD 18 mois.pdf
Contact :eryn.beatini@lysarc.org
Graduate Assistant Position in Applied Statistics
Publiée le 07/02/2025 09:11.
Référence : Prof. Laurent Donzé.
Thèse, Fribourg (Switzerland).
Entreprise/Organisme :ASAM, Department of Informatics, University of Fribourg (Switzerland)
Niveau d'études :Doctorat
Sujet :Fuzzy statistics inferences
Date de début :1st August 2025 or date to be agreed.
Durée du contrat :4 years
Secteur d'activité :Economics
Description :Graduate Assistant Position in Applied Statistics (ASAM Group) The Applied Statistics and Modelling (ASAM) group at the University of Fribourg (Switzerland), specialising in Fuzzy Statistics, offers a PhD position. The role involves supporting courses (Bachelor and Master levels), assisting students, contributing to exam preparation, engaging in scientific research, and performing administrative tasks. The successful candidate will prepare and complete a PhD thesis in Fuzzy Statistics under the supervision of Prof. Dr. Laurent Donzé. The position has a 100% workload and starts on August 1, 2025, or as agreed. Requirements: • A Master’s degree in Statistics or Mathematics, with strong knowledge of quantitative methods and programming (especially R). • Proficiency in German or French and English. • Interest in empirical statistical analysis and alignment with the group’s focus on Fuzzy Statistics. Application: Send a CV, motivation letter, and references to laurent.donze@unifr.ch by April 30, 2025. For more details, visit ASAM’s website.
En savoir plus :https://www.unifr.ch/inf/asam
Offre poste assistant_en_20250124.pdf
Contact :laurent.donze@unifr.ch
Stage M2 - Prévision de la direction locale du vent par Deep-learning
Publiée le 05/02/2025 10:40.
Référence : Stage M2 - Prévision de la direction locale du vent par Deep-learning.
Stage, Cadarache- Saint Paul Lez Durance.
Entreprise/Organisme :ASNR
Niveau d'études :Master
Durée du contrat :6 mois
Description :Le STAAR est un service de recherche qui étudie la dispersion des radionucléides dans les milieux aquatiques et atmosphériques. Au sein du STAAR, le ou la stagiaire sera accueillie au LRTA à Cadarache pour travailler sur des méthodes de deep learning. Le STAAR/LMDA (à Fontenay-aux-Roses) fournira un appui sur la modélisation atmosphérique, et le STAAR/LERTA (à Cherbourg) apportera ses compétences expérimentales sur l'atmosphère. Lorsque l'on souhaite prédire la direction principale de la dispersion d'éléments chimiques rejetés dans l'atmosphère à un endroit donné, il est nécessaire de s'appuyer sur une prévision fiable de la direction du vent. Cette prédiction est le résultat d'un modèle de prévision numérique du temps. Il s'agit d'une valeur moyenne calculée pour une maille géographique de plusieurs centaines de mètres à plusieurs kilomètres de côté. Localement, la direction du vent est influencée par des obstacles (bâtiments, talus, végétation, …) et autres paramètres environnementaux qui ne sont pas pris en compte dans les modèles météorologiques, entrainant un écart entre la direction observée et la direction modélisée. Cet écart peut être à l'origine d'erreurs dans le calcul d'impact des éléments chimiques à l'homme et l'environnement. Pour réduire les erreurs liées à ces écarts, des méthodes d'intelligence artificielle pourraient offrir une solution plus précise. En traitant de grandes quantités de données recueillies localement par des stations d'observation météo
En savoir plus :https://irsn-career.talent-soft.com/offre-de-emploi/emploi-stage-m2-prevision-de-la-direction-locale
ASNR - stage M2 - Prévision de la direction locale du vent par Deep-learning H_F.pdf
Contact :kathleen.pele@asnr.fr
Stage M1 ou M2 Machine Learning à l'intersection de PAC-Bayes et prédiction conforme
Publiée le 05/02/2025 10:40.
Stage, Laboratoire ERIC - Bron.
Entreprise/Organisme :Université Lyon 2 - Laboratoire ERIC
Niveau d'études :Master
Sujet :Conformal Prediction from a PAC-Bayesian Perspective
Durée du contrat :4 à 6 mois
Rémunération :600 euros/month
Secteur d'activité :Recherche universitaire en Machine Learning
Description :Machine learning algorithms are becoming increasingly widespread in our society. With the rapid expansion of these algorithms, many questions arise concerning their reliability and the generalisation performance when the algorithms under study are applied to new data. For this reason, a deep mathematical analysis of the most widely used algorithms is playing an increasingly important rôle in current research. New tools appear at a fast pace that help investigate why these algorithms generalise well. To derive relevant statistical guarantees, a number of approaches have been developed, such as the notion of uniform stability, the complexity measure of hypothesis spaces or the PAC-Bayesian theory. The PAC-Bayesian approach has recently lead to successive breakthroughs in the discovery of novel generalisation bounds that could not until now be produced using alternative theories. It has also been used to derive new algorithms for minimizing such bounds (known as self-bounding algorithms). Other approaches have also be used to produce different kinds of statistical guarantees in prediction and risk control, which are various applications to the concept of Conformal Prediction. Unlike traditional models that output only a single prediction, conformal prediction assigns a set of possible outcomes associated to each input, ensuring that the true outcome is included in this set with a user-specified probability (e.g., 95%). Hence, Conformal Prediction is a statistical framework that provides reliable uncertainty estimates for predictions made by machine learning models. As a particular instance of Conformal Prediction, split Conformal Prediction works by splitting data into a training set and calibration set. The calibration set is used to adjust the prediction sets to statistically guaranteed coverage at the desired confidence level. The strengths of Split Conformal Prediction lies in its inherent simplicity, flexibility, and statistical guarantees. Other approaches have also been developed with narrower prediction sets, such as Jackknife+. In another direction, the fundamental problem of producing conditional coverage was investigated in recent new works. Indeed, traditional Conformal Prediction techniques usally provide what is called "marginal coverage" guarantees, meaning that the interval length does not depend of the input. Several methods use the quantile regression trick to overcome this issue, thereby ensuring that the prediction intervals contain the true outcome on average across the entire population, with part of the interval beeing conditional of the input. However, these methods may not offer adequate coverage for specific subgroups within the data. Recent results have pushed the limits of Standard Conformal Prediction capabilities by addressing the issue of building schemes that can account for conditional dependency of the prediction interval on the covariates. To sum up, the PAC Bayes and the Conformal based approach both provide generalisation guarantees for the algorithms under study, but from different viewpoints. Let us add that exciting recent work has successfully combined these two tools to derive generalisation guarantees on the coverage properties of an algorithm using conformal prediction, showing that the approaches can be complementary in establishing strong generalisation results. During the proposed internship, we wish to investigate, in particular, recent contributions to Conformal Prediction that manage to enhance the reliability of prediction intervals in Machine Learning models. This approach allows to generate prediction intervals that maintain both marginal coverage and approximate conditional validity for clusters or subgroups naturally present in the data. Our main objectives in this internship will be to: (i) reinforce the results obtained in the recent literature through the lens of PAC-Bayes theory (which applies very well to combinations of models) and (ii) investigate exciting applications to fairness, where notions of subgroups naturally appear when it comes to study different populations. During his internship, the candidate will attempt to establish theoretical guarantees on the predictions made by a model by combining the theories of Conformal Prediction and PAC-Bayesian. The work can be conducted as follows: (i) understand the similarities and differences between Conformal Prediction and PAC-Bayesian theory, (ii) provide additional guarantees on Conformal Prediction using PAC-Bayesian theory, (iii) study the applicability of the obtained theoretical results to Fairness.
En savoir plus :https://eric.msh-lse.fr/
Stage_Conformal_Prediction ERIC Lyon 2.pdf
Contact :stephane.chretien@univ-lyon2.fr
Stage M2 - Intégration de jeux de données protéomiques et PTM-omiques
Publiée le 05/02/2025 10:40.
Stage, Paris 15ème arrondissement.
Entreprise/Organisme :Institut Pasteur
Niveau d'études :Master
Sujet :Contexte : Le protéome est l’ensemble des protéines présentes dans des échantillons biologiques (cellules, organismes, etc.). La plateforme protéomique de l’Institut Pasteur a pour vocation l’étude à grande échelle des protéomes de pathogènes (virus, bactéries, etc.) et des interactions de ces pathogènes avec leur hôte. Dans ce but, elle travaille en collaboration avec différents laboratoires de recherche de l’Institut Pasteur. L’expérience utilisée le plus couramment à la plateforme se base sur la spectrométrie de masse et consiste à réaliser des analyses « bottom-up » (les protéines sont préalablement digérées en peptides pour une meilleure détection). Ces expériences produisent des données volumineuses qui nécessitent plusieurs étapes d’analyses pour être interprétées. D’un point de vue statistique, les jeux de données produits possèdent certaines caractéristiques particulières. Ainsi, on mesure des dizaines de milliers de peptides dans seulement quelques échantillons (données de type « large p, small n »). Il en résulte des matrices d’intensités mesurées qui possèdent des dizaines de milliers de lignes (les peptides) et seulement quelques colonnes (les échantillons). Elles peuvent être entachées de valeurs manquantes (survenant lorsque la protéine n’a pas été détectée dans un échantillon par exemple). Un sujet d’étude particulier concerne les modifications post-traductionnelles (« Post-translational modifications », ou PTM) de protéines. Ces modifications, notamment la phosphorylation, jouent un rôle clé dans la communication cellulaire. Leurs variations d'abondance peuvent perturber les signaux cellulaires, entraînant des désordres et des maladies. Comparer l'évolution d'un protéome non modifié à celle d'un phospho-protéome (ou autre PTM-ome) sous différentes conditions biologiques permet de déterminer si l’abondance de la modification est liée à celle de la protéine d'origine au fil des conditions. En cas d'absence de différence, on peut conclure que les conditions biologiques n'affectent pas l’abondance des modifications, et donc les signaux cellulaires. Ce type d'analyse aide à la compréhension du fonctionnement de maladies infectieuses et, in fine, à identifier des processus cellulaires à cibler pour améliorer le traitement de patients infectés. Contenu du stage : Sous la supervision d'un ingénieur de recherche statisticien de l'Institut, vous contribuerez au développement d'un programme en R, ainsi que de son interface en Shiny, pour simplifier ce type d'analyses au sein de la plateforme protéomique. Une première version de l'application est déjà en cours d'élaboration, mais plusieurs défis restent à relever, notamment la mise en place de méthodes statistiques pour plus de deux conditions biologiques et pour la visualisation des résultats. Ces améliorations sont essentielles pour rendre l'application pleinement opérationnelle dans le cadre des activités quotidiennes de la plateforme. Une comparaison exhaustive de méthodes d’intégration de ce type de données est à mener pour déterminer quelle approche statistique est la plus optimale à utiliser. Nous recherchons un(e) candidat(e) motivé(e) par cette problématique biologique concrète, par le développement de méthodes statistiques en R et par la création d’interfaces intuitives en Shiny, permettant d’exporter des résultats sous forme de tableurs Excel, fichiers PowerPoint ou Word. Idéalement, le/la candidat(e) possède de solides connaissances en mathématiques/statistiques, notamment en modèles de régression, clustering et analyses multivariées, et des connaissances en R, qu’il/elle pourra approfondir durant le stage.
Date de début :printemps 2025 (1er avril au plus tôt)
Durée du contrat :6 mois
Description :Contexte : Le protéome est l’ensemble des protéines présentes dans des échantillons biologiques (cellules, organismes, etc.). La plateforme protéomique de l’Institut Pasteur a pour vocation l’étude à grande échelle des protéomes de pathogènes (virus, bactéries, etc.) et des interactions de ces pathogènes avec leur hôte. Dans ce but, elle travaille en collaboration avec différents laboratoires de recherche de l’Institut Pasteur. L’expérience utilisée le plus couramment à la plateforme se base sur la spectrométrie de masse et consiste à réaliser des analyses « bottom-up » (les protéines sont préalablement digérées en peptides pour une meilleure détection). Ces expériences produisent des données volumineuses qui nécessitent plusieurs étapes d’analyses pour être interprétées. D’un point de vue statistique, les jeux de données produits possèdent certaines caractéristiques particulières. Ainsi, on mesure des dizaines de milliers de peptides dans seulement quelques échantillons (données de type « large p, small n »). Il en résulte des matrices d’intensités mesurées qui possèdent des dizaines de milliers de lignes (les peptides) et seulement quelques colonnes (les échantillons). Elles peuvent être entachées de valeurs manquantes (survenant lorsque la protéine n’a pas été détectée dans un échantillon par exemple). Un sujet d’étude particulier concerne les modifications post-traductionnelles (« Post-translational modifications », ou PTM) de protéines. Ces modifications, notamment la phosphorylation, jouent un rôle clé dans la communication cellulaire. Leurs variations d'abondance peuvent perturber les signaux cellulaires, entraînant des désordres et des maladies. Comparer l'évolution d'un protéome non modifié à celle d'un phospho-protéome (ou autre PTM-ome) sous différentes conditions biologiques permet de déterminer si l’abondance de la modification est liée à celle de la protéine d'origine au fil des conditions. En cas d'absence de différence, on peut conclure que les conditions biologiques n'affectent pas l’abondance des modifications, et donc les signaux cellulaires. Ce type d'analyse aide à la compréhension du fonctionnement de maladies infectieuses et, in fine, à identifier des processus cellulaires à cibler pour améliorer le traitement de patients infectés. Contenu du stage : Sous la supervision d'un ingénieur de recherche statisticien de l'Institut, vous contribuerez au développement d'un programme en R, ainsi que de son interface en Shiny, pour simplifier ce type d'analyses au sein de la plateforme protéomique. Une première version de l'application est déjà en cours d'élaboration, mais plusieurs défis restent à relever, notamment la mise en place de méthodes statistiques pour plus de deux conditions biologiques et pour la visualisation des résultats. Ces améliorations sont essentielles pour rendre l'application pleinement opérationnelle dans le cadre des activités quotidiennes de la plateforme. Une comparaison exhaustive de méthodes d’intégration de ce type de données est à mener pour déterminer quelle approche statistique est la plus optimale à utiliser. Nous recherchons un(e) candidat(e) motivé(e) par cette problématique biologique concrète, par le développement de méthodes statistiques en R et par la création d’interfaces intuitives en Shiny, permettant d’exporter des résultats sous forme de tableurs Excel, fichiers PowerPoint ou Word. Idéalement, le/la candidat(e) possède de solides connaissances en mathématiques/statistiques, notamment en modèles de régression, clustering et analyses multivariées, et des connaissances en R, qu’il/elle pourra approfondir durant le stage.
En savoir plus :https://research.pasteur.fr/fr/team/proteomics/
stageIP.pdf
Contact :quentin.giaigianetto@pasteur.fr
Protocoles séquentiels et adaptatifs pour planifier les études de bioéquivalence (données éparses)
Publiée le 05/02/2025 10:39.
Stage, Lille.
Entreprise/Organisme :Université de Lille, ULR 2694 Metrics
Niveau d'études :Master
Sujet :Approches par modélisation pour la planification de protocoles séquentiels ou adaptatifs dans les études de bioéquivalence avec échantillonnage épars
Date de début :dès que possible
Durée du contrat :6 mois
Rémunération :Standard stage de M2
Secteur d'activité :Statistique
Description :L'approche non compartimentales (NCA), recommandée pour analyser et planifier les études de bioequivalence (BE) en pharmacocinétique (PK), nécessite de nombreuses concentrations pour chaque sujet. Cela rend difficile son application à certaines populations, telles que les patients atteints de cancer. C'est pourquoi une approche alternative, basée sur une modélisation par modèle non linéaire à effets mixtes, a été developpée (approche MBBE). Plus récemment, la planification en 2 étapes avec des protocoles séquentiels (TSS) et adaptatifs (TSA) des études de BE par NCA a été transposée à l'approche MBBE, et évaluée sur des études avec échantillons PK riches. L'objectif de ce stage est d'étendre et d'évaluer cette approche à des études de BE avec échantillons épars. Différentes approches non-asymptotiques seront développées afin de corriger l'erreur standard d'estimation de l'effet du traitement sur les paramètres sur lesquels est effectué le test de BE : 1) un terme de correction tenant compte du nombre de paramètres du modèle PK, 2) la distribution a posteriori de l'effet traitement obtenue par Monte Carlo Hamiltonien (HMC) implémenté dans le langage Stan, 3) la méthode Sampling Importance Resampling 4) un bootstrap non paramétrique (rééchantillonnage de cas). Ces solutions seront ensuite évaluées par des simulations d'essais cliniques utilisant une étude de cas d’un médicament anticancéreux à haute variabilité indiqué pour le traitement de la leucémie myéloïde chronique. Les critères d'évaluation comprendront la taille finale de l'échantillon nécessaire, le taux d'erreur de type I (la proportion de jeux de données pour lesquels l'hypothèse nulle de non BE (H0) est rejetée en simulant sous H0), et la puissance (la proportion de jeux de données pour lesquels H0 est rejetée en simulant sous l'hypothèse alternative de BE).
En savoir plus :No link
Stage M2 Statistique Bioequivalence 2025.pdf
Contact :florence.loingeville@univ-lille.fr
Post-Doc in Machine Learning (Multiple Fairness in Recommending Systems)
Publiée le 05/02/2025 10:39.
Référence : Postdoc in Télécom Paris.
CDD, Télécom Paris, 19 Place Marguerite Perey, 91120 Palaiseau.
Entreprise/Organisme :Télécom Paris
Niveau d'études :Doctorat
Date de début :Printemps 2025
Durée du contrat :18 ou 36 mois
Secteur d'activité :Intelligence Artificielle
Description :Post-Doc in Machine Learning (Multiple Fairness in Recommending Systems) The group dedicated to Research in Machine Learning, Statistics & Signal Processing (the research group S2A) in Télécom Paris is recruiting a postdoc in Machine Learning (18 months contact, extendable to 36 months). The post-doc recruited will take part in an interdisciplinary collaborative research project involving the SES (Economics and Social Sciences) department of Télécom Paris and the Caisse des Dépôts et Consignations, a leading French public financial institution. Research assignment Research activities will focus on fairness issues for recommendation engines designed by means of machine-learning methods. With the explosion of digitized content available online, recommender systems have become an essential technology and a key element in the development of new services. In a commercial context, the algorithmic principles at work (e.g. collaborative filtering, user/content-based methods, hybrid approaches) in their operation are most often aimed exclusively at maximizing user satisfaction and increasing the platform's level of use. In the context of a public service, many other criteria and objectives must be integrated to ensure a fair service from the point of view of both users and suppliers (multi-sided fairness). It is precisely the subject of this collaborative project to propose and analyze (theoretically and empirically) methods for achieving acceptable trade-offs between the relevance of recommendations and bias mitigation. In addition to producing methodological research, the post-doc's mission will also include applied work on the current version of a deployed recommendation system, aimed at quantifying the presence of different types of bias resulting from its operation. Keywords: public service recommender system, fair and explainable AI, bias mitigation, multi-sided fairness Supervision: the recruit will work under the supervision of Sephan Clémençon (https://perso.telecom-paristech.fr/clemenco/) Winston Maxwell (https://www.telecom-paris.fr/winston-maxwell). Charlotte Laclau (https://laclauc.github.io/) Skills Education : PhD in Computer Science or in Applied Maths A short international postdoctoral experience is welcome but not mandatory English: fluent Expertise in Python programming, familiarity with database queries Capacity to work in a team and develop good relationships with colleagues in other disciplines Excellent writing and pedagogical skills Knowledge and experience required Research publications in Machine Learning (e.g. in Neurips, ICML, AISTATS, …) Knowledge of how recommending systems work Taste for AI applications and interest in its societal aspects Additional information The position does not involve teaching. However, on a voluntary basis, the postdoc recruited may take part in machine-learning courses (undergraduate/master level) coordinated by the supervisory team. The position 18 months position (extendable to 36 months) Télécom Paris, 9 place Marguerite Perey - 91120 Palaiseau - France Application Applicants should submit a single PDF file that includes: motivation letter curriculum vitae one or two major publications contact information for one or two references Important dates First-Quarter 2025: interviews with candidates (by visio-conference eventually) Spring 2025: beginning Contact for information/application Stephan Clémençon stephan.clemencon@telecom-paris.fr Charlotte Laclau charlotte.laclau@telecom-paris.fr Winston Maxwell winston.maxwell@telecom-paris.fr Related Websites https://s2a.telecom-paris.fr/ www.telecom-paris.fr/ai-ethics
En savoir plus :https://s2a.telecom-paris.fr/
Post-Doc in Machine Learning (Multiple Fairness in Recommending Systems).pdf
Contact :stephan.clemencon@telecom-paris.fr

<1>  2  3  4  5  6  Page suivante

 
 
©2025 SFdS
Société Française de Statistique
Institut Henri Poincaré
11 rue Pierre et Marie Curie
75231 Paris cedex 5
Tél. : +33 (0)1 44 27 66 60
Notre site a été supporté par :