Consulter les offres d’emploi

Ingénieur.e en biostatistique
Publiée le 22/10/2024 13:59.
CDD, Lille.
Entreprise/Organisme :Plateforme Bilille - UAR 2014 - US 41 Plateformes Lilloises en Biologie et Santé
Niveau d'études :Master
Date de début :A partir de Janvier 2025.
Durée du contrat :CDD de 12 mois renouvelable
Rémunération :Suivant l’expérience et les grilles de l'université de Lille.
Secteur d'activité :Plateforme de Bioinformatique et Biostatistique
Description :La plateforme de bioinformatique et biostatistique Bilille est l’une des 8 plateformes scientifiques et technologiques de l’unité PLBS (Plateformes Lilloises en Biologie et Santé) au service d’unités de recherche académiques en sciences de la vie et de la santé. Bilille est aussi plateforme membre de l’Institut Français de Bioinformatique (IFB). La plateforme Bilille compte actuellement 7 ingénieur.e.s temps plein aux profils complémentaires (bioinformaticiens, biostatisticiens, bioanalystes) et est présente sur 3 campus : Cité Scientifique, Campus Santé et Pasteur Lille. Les domaines d’activité de Bilille portent notamment sur l'analyse de données -omiques, la biologie intégrative, la phylogénie, la biologie des systèmes, l’imagerie, et la bioinformatique structurale. Afin de renforcer son pôle biostatistique, Bilille recrute un.e ingénieur.e d’étude (IE) ou de recherche (IR) en biostatistique, en CDD pour une durée initiale de 12 mois.
En savoir plus :https://bilille.univ-lille.fr/news/detailed-news/join-bilille-team
202410_IE_IR_biostat_offre_poste.pdf
Contact :jimmy.vandel@univ-lille.fr
Développement d’une stratégie de segmentation d’un réseau pour définir des zones de maintenance
Publiée le 22/10/2024 13:59.
Référence : Stage stratégie de segmentation d'un réseau routier - Centre R&D COLAS.
Stage, Magny-les-hameaux (78 Yvelines).
Entreprise/Organisme :COLAS/Core Center
Niveau d'études :Master
Date de début :A partir de février 2025
Durée du contrat :6 mois
Rémunération :1800 € /mois + prime de fin de stage
Secteur d'activité :Bâtiment Travaux Publics
Description :La maintenance des chaussées est l’une des principales activités du groupe COLAS. Le besoin de maintenance peut être établie par une stratégie d’auscultation. Elle peut être visuelle mais le recours à des appareils de mesure normés est fortement encouragé. Par exemple, un APL (Analyseur de Profil en Long) mesure l’uni des chaussées tandis que le lidar LCMS (Laser Crack Measurement System) détecte et mesure les fissures longitudinales. Une stratégie d’auscultation maintenue sur plusieurs années permet de construire une importante base de données (de retour d’expérience). L’intérêt premier d’une telle base est de modéliser l’évolution d’une fissure (par exemple) en fonction de paramètre d’exploitation de la chaussée (âge du revêtement ou trafic) afin d’anticiper au bon moment le point de fissuration inacceptable par une action de maintenance ciblée et préventive. Les travaux de Maxime Redondin est un exemple concret de cette approche pour le cas particulier des marquage routiers [1]. Long Term Pavement Performance (LTPP) est la plus grande et la plus ancienne base de données de retour d’expérience, complète et ouverte connue à ce jour. Depuis les années 80, elle permet de consulter l’évolution des différentes pathologies d’une chaussée (fissure longitudinale, nid-de-poule, ressuage…) sur plus de 2500 sections de 150m (de long) réparties aux Etats-Unis et au Canada. L’ensemble des dégradations étudié par la base est fixé depuis les années 2000 [2]. Une première investigation a donné lieu à l’établissement de plusieurs modèles d’évolution de dégradations. Les modèles obtenus affichent des performances insatisfaisante à l’égard d’un gestionnaire. L’une des principales limites de cette approche concerne la vaste étendue géographique de cette étude (Etats-Unis + Canada). La proposition de ces fins de travaux est de poursuivre en intégrant en amont de la modélisation une segmentation du réseau routier. L’identification de zones stratégiques à entretenir a deux intérêts. La première consiste à segmenter un réseau routier en zones où la section de chaussée suit un mode de dégradation similaire. Le second objectif est d’estimer un historique de maintenance par zone basée sur l’augmentation médiane entre deux inspections. Dans le contexte du développement d’une stratégie de performance par une approche de segmentation du réseau routier, le stage se déroulera en plusieurs étapes : 1. Etablir un état de l’art des méthodes de classification : CAH, DBSCAN, k-means, KNN, gestion des données mixtes … [3], [4] 2. Evaluer la routine de classification des travaux de Maxime Redondin 3. Comparer les techniques de classification 4. Rédiger un mode opératoire complet décrivant la démarche pour déployer les différentes techniques sur des bases de données publiques ou privées. 5. Interfacer cet ensemble de méthodes dans un environnement Azure ou type Streamlit 6. Rendre compte régulièrement à l’occasion des réunions d’équipe.
En savoir plus :https://www.colas.com/fr/innovation/lespace-public-lieu-de-partage/?anchor=section-30
Développement d’une stratégie de segmentation d'un réseau routier en vue de définir des zones de maintenance stratégique.pdf
Contact :sebastien.quigniot@colas.com
Stage Machine Learning
Publiée le 21/10/2024 17:47.
Stage, Bron (69).
Entreprise/Organisme :Université Lyon 2 (ERIC lab.) et IFPEN
Niveau d'études :Master
Sujet :Physics-Informed Machine Learning for catalytic hydrocracking process modeling
Date de début :mars 2025
Durée du contrat :6 mois
Rémunération :tarif réglementé (environ 30€/j)
Secteur d'activité :Recherche
Description :cf fichier joint.
En savoir plus :https://eric.msh-lse.fr
Stage-2025-Lyon-ERIC-IFPEN.pdf
Contact :julien.jacques@univ-lyon2.fr
Développement d'algorithmes pour l'analyse de la perte d'autonomie des personnes âgées
Publiée le 21/10/2024 17:47.
Référence : Offre d'emploi pour jeune docteur en R&D chez SIPAD.
CDI, 38 rue Blomet, 75015 Paris.
Entreprise/Organisme :SIPAD
Niveau d'études :Doctorat
Date de début :Dès que possible
Durée du contrat :CDI
Rémunération :Entre 50 000 à 60 000 euros par an
Secteur d'activité :Accompagnement des personnes en perte d'autonomie à domicile
Description :Au sein du l’entreprise Sipad, dans le cadre de votre premier contrat CDI depuis votre soutenance (statut de Jeune Docteur), en lien permanent avec les équipes des différentes entités opérationnelles, votre rôle de « Jeune docteur » sera d'identifier et utiliser les travaux de Recherche les plus récents sur les différents domaines cités, d'accompagner le directeur technique et ses équipes sur la mise en œuvre de projets pour ses clients, d'apporter votre expertise en conduite de projets de recherche et de participer à la consolidation d’une première phase de recherche déjà menée par l’entreprise dans le domaine de l’analyse automatique de la perte d’autonomie des personnes âgées. Vos missions principales consisteront donc en : - Investiguer et évaluer les dernières avancées en recherche et technologiques (veille scientifique, veille technique) - Implémenter des algorithmes et entraîner des modèles d’intelligence artificielle - Identifier des sources de réflexions sur des évolutions possibles des technologies ou des méthodes de management - Travailler en étroite coopération avec les équipes opérationnelles pour passer de la phase recherche à la phase de mise en production (intégration et recherche finalisée) - Présenter régulièrement le fruit de vos découvertes et de vos réflexions - Rédiger des dossiers de recherche avec les équipes projets - Suivant les avancées de recherche, publier des articles scientifiques ou participer à des conférences Ce poste évoluera vers un rôle de soutien et d’accompagnement d’étudiants en M2 et éventuellement dans leur parcours de thèse Cifre. Nos avantages : - Locaux dans le cœur du 15ème arrondissement de Paris - Télétravail jusqu'à 2 jours par semaine - Proximité et convivialité cultivées à tous les niveaux de l'entreprise Le profil recherché Jeune docteur spécialisé en Data Science, Informatique, Math Appliquées, Intelligence Artificielle Vous maîtrisez également la programmation informatique permettant de concevoir et d'implémenter les solutions de Machine Learning ou Deep Learning (Python, R, …) ainsi que des outils collaboratifs de versioning comme Git. Vous avez une bonne connaissance de méthodes de conduite de projet et de l'organisation des entreprises. La maîtrise du français et de l'anglais à l'écrit et à l'oral est nécessaire.
En savoir plus :https://sipad.com/notre-solution
SIPAD_Offre Emploi_Jeune Docteur.pdf
Contact :c.faure@sipad.com
offre de stage niveau M2
Publiée le 21/10/2024 17:47.
Stage, Palaiseau (campus agroparistech).
Entreprise/Organisme :AgroParisTech / CEA
Niveau d'études :Master
Sujet :Calibration bayésienne de modèles physiques de thermohydraulique
Date de début :mars/avril 2025
Durée du contrat :6 mois
Rémunération :indemnités de stage, environ 600€ par mois
Description :voir le fichier joint.
En savoir plus :NA
Sujet_stage_2025_GIS_LARTISSTE.pdf
Contact :pierre.barbillon@agroparistech.fr
Explorer les changements Structuraux d’Hydrogels par outils de chimiométrie en imagerie Raman
Publiée le 21/10/2024 17:47.
Référence : Offre de stage Master 2 au LIEC - 2025.
Stage, Nancy, France.
Entreprise/Organisme :UMR 7360 CNRS Laboratoire Iinterdisciplinaire des Ecosystèmes Continentaux (LIEC)
Niveau d'études :Master
Sujet :Contexte - Les matrices polymériques extracellulaires sont les composants essentiels de nombreux systèmes environnementaux et constituent une interface fonctionnelle et protectrice entre systèmes biologiques (bactéries, algues par exemple) et milieu aqueux. Du fait de leur capacité à absorber l'eau et différents types de polluants, les hydrogels en sont des analogues et jouent également un rôle important dans la surveillance et le suivi de la mobilité des polluants dans l’environnement. Les propriétés électrostatiques, structurales et hydrodynamiques de ces architectures vont gouverner l’établissement des flux diffusifs et la répartition spatiale de contaminants chimiques ou de nanoparticules (organiques ou minérales) aux interfaces gel/solution. C’est dans ce contexte que nous souhaitons examiner les modifications de propriétés physicochimiques de gels d’alginate mis en contact ou initialement « dopés » avec des nanoparticules de type humiques/fulviques (NPH ou NPF). Sur ces échantillons, nous utiliserons l’imagerie hyperspectrale Raman afin de quantifier des changements structuraux liés à la présence de matière organique nanoparticulaire (profil de densité polymérique, hétérogénéités structurales par exemple). L’objectif du stage est donc d’appliquer et de développer des méthodes de séparation à l’aveugle de signaux sources , communément appelées en chimiométrie Méthodes de Résolution de Courbes Multivariées (en anglais, Multivariate Curve Resolution, MCR) qui permettent d’extraire, sans aucune connaissance au préalable sur l’échantillon, les spectres des espèces « pures », ainsi que leurs cartographies Raman respectives. Le stage se déroulera en 2 parties : (1) Participation (partielle) à l’acquisition des données expérimentales qui consisteront à analyser par la technique d’imagerie hyperspectrale Raman les gels « dopés » avec les nanoparticules naturelles lors de leur gélification et ceux dans lesquels les NPH ou NPF ont diffusé afin de déterminer les impacts structuraux des nanoparticules et les profils de concentrations (en macromolécules et en NPH ou NPF). (2) Analyse des données hyperspectralse obtenues par les méthodes de séparation de signaux sources par des approches MCR pour en extraire des profils de densité en NPH ou NPH et/ou en densité de chaînes macromoléculaires.
Date de début :1er semestre 2025
Durée du contrat :6 mois
Rémunération :Environ 580 euros / mois
Secteur d'activité :Chimiométrie, Chimie Analytique, spectroscopies, data fusion
Description :L’étude sera réalisée au Laboratoire Interdisciplinaire des Environnements Continentaux (UMR CNRS 7360 – Université de Lorraine), dans l’équipe PhySI (Physico-chimie et Réactivité des Surfaces et Interfaces). La candidate ou le candidat devra avoir des compétences solides en physico-chimie (particulièrement sur les techniques de spectroscopie vibrationnelle), et en mathématique (notamment statistiques, calcul matriciel). Elle ou il devra également avoir un goût particulier et une certaine autonomie en programmation (MATLAB, VBA, PYTHON, R ou tout autre langage). Des capacités d’organisation ainsi qu’un attrait pour la recherche et le travail en laboratoire sont attendus pour ce stage. Stage M2 de 6 mois au cours du 1er semestre 2025 (début à définir selon le ou la candidat(e) retenu(e)) Le dossier de candidature doit impérativement comporter les éléments suivants : • le CV du candidat et une lettre de motivation, • les notes obtenues en master 1 • les enseignements suivis en master 2
En savoir plus :https://liec.univ-lorraine.fr/
OffreMaster2-LIEC_2025_SHYMAIR_vf.pdf
Contact :marc.offroy@univ-lorraine.fr
Postdoc de 18 mois sur l'intégration de l'effet cocktail dans l'empreinte environnementale
Publiée le 21/10/2024 17:47.
Postdoc, Narbonne.
Entreprise/Organisme :INRAE
Niveau d'études :Doctorat
Sujet :Voir document joint.
Date de début :Début 2025
Durée du contrat :18 mois
Rémunération :Entre 2816€ et 3190€ bruts.
Description :Voir document joint.
En savoir plus :https://www.linkedin.com/posts/r%C3%A9mi-servien-550a1716a_offre-postdoc-activity-725260128674161049
postdoc2024.pdf
Contact :remi.servien@inrae.fr
Méthodes de sélection en grande dimension pour les études épidémiologiques cas-témoins
Publiée le 21/10/2024 17:47.
Référence : Stage de M2 Biostatistiques / Epidémiologie.
Stage, Service de Biostatistiques et d’Epidémiologie de Gustave Roussy.
Entreprise/Organisme :Gustave Roussy (Paris) et Laboratoire de Mathématiques Bretagne Atlantique (LMBA, Vannes)
Niveau d'études :Master
Sujet :Tandis qu’une littérature abondante a été consacrée aux développements de méthodes de sélection de biomarqueurs à partir de données de grande dimension depuis la méthode Lasso proposée par Tibshirani [1] en 1996 avec des applications aussi bien sur des données d’essais cliniques ou de cohortes, les développements méthodologiques et les applications dans le cadre d’études épidémiologiques de types cas-témoins semblent, après une brève revue de la littérature, beaucoup plus rares. Ces études cas-témoins sont mises en place pour étudier l’association entre un facteur d’exposition et la survenue d’un événement rare. La particularité de l’analyse des données d’une étude cas-témoins est l’appariement d’un cas (i.e. patient avec événement d’intérêt) avec 1 ou plusieurs témoins (i.e. patients sans évènement d’intérêt) et la méthode statistique classique pour analyser ce type de données est la régression logistique conditionnelle [2]. Bien souvent, les méthodes de sélection en grande dimension pour une étude cas-témoins se limitent à des analyses univariées ou aux méthodes de sélection automatiques (backward, forward ou encore stepwise). L’approche Lasso adaptée à la régression logistique conditionnelle a été développée par Reid et al. en 2014 [3]. Récemment, des approches non paramétriques basées sur l’utilisation d’arbres de décision ont également été proposées [4, 5, 6]. De par leur nature non-paramétrique, ces dernières approches ne posent aucune hypothèse sur la forme de la relation entre les facteurs d’exposition et l’événement d’intérêt. De plus, ces méthodes non paramétriques reposent sur leur capacité à modéliser des relations complexes comme des interactions. Ainsi, l’utilisation de telles méthodes dans le cadre de l’analyse de données cas-témoins en grande dimension semble pertinente. L’objectif de ce stage est d’approfondir cette revue de la littérature et de comparer les performances des différentes méthodes existantes à travers une large étude de simulation. Les méthodes seront ensuite appliquées à une étude cas-témoin nichée dans la cohorte French Childhood Survivor Study (FCCSS) dont l’objectif était d’identifier des biomarqueurs de l’expression génétique associés aux pathologies cardiaques après traitement d’un cancer dans l’enfance. L’identification de biomarqueurs prédictifs de l’effet des traitements (recherche d’interaction) sur le développement des pathologies cardiaques sera aussi évaluée. Références : [1] R Tibshirani, Regression shrinkage and selection via the lasso, Journal of the Royal Statistical Society. Series B, vol. 58, no1,‎1996, p.267-288. [2] NE Breslow, NE Day, KT Halvorsen, RL Prentice, C Sabai. Estimation of multiple relative risk functions in matched case-control studies. Am J Epidemiol. 1978 Oct;108(4):299-307 [3] Reid S, Tibshirani R: Regularization Paths for Conditional Logistic Regression: The clogitL1 295 Package. J Stat Softw 58:12, 2014 [4] NS Zadeh, S Lin, GC Runger. Matched Forest: Supervised Learning for High-Dimensional Matched Case–Control Studies. 2020. Bioinformatics 36(5):1570 76 [5] Schauberger G, Tanaka LF, Berger M. A tree-based modeling approach for matched case-control studies. Stat in Med, 2023, 42 :676-692 [6] Shi, Haolun, et Guosheng Yin. 2018. « Boosting conditional logit model ». Journal of Choice Modelling 26:48 63.
Date de début :Entre février et avril 2025
Durée du contrat :6 mois
Secteur d'activité :Statistiques, analyse de données, biostatistique-épidémiologie
Description :Profil recherché Ce stage s’adresse à un(e) étudiant(e) de Master 2 dans l’un de ces domaines : science des données, statistique appliquée, biostatistique / épidémiologie. Une maîtrise de la programmation en R est requise. Une connaissance des données de santé et des méthodes avancées en apprentissage statistique sera un plus. Environnement de travail Le travail sera réalisé dans le service de Biostatistiques et d’Epidémiologie de Gustave Roussy (Villejuif, Paris) sous la supervision de Gwénaël Le Teuff (Gustave Roussy), Audrey Poterie (Laboratoire de Mathématiques Bretagne Atlantique, Université Bretagne Sud, Vannes) et Nadia Haddy (ANSM). La durée du stage envisagée est de 6 mois, avec une date de début comprise entre février et avril 2025 suivant la disponibilité de l’étudiant(e). Contact Les candidat(e)s intéressé(e)s doivent postuler en envoyant un CV et une lettre de motivation à : Gwenael.leteuff@gustaveroussy.fr et Audrey.Poterie@univ-ubs.fr
En savoir plus :NA
sujet_stage_ccstudies_2024.pdf
Contact :audrey.poterie@univ-ubs.fr
Histoire évolutive d’une tumeur
Publiée le 21/10/2024 17:47.
Référence : Stage M2 - ANR IdenTHiC.
Stage, Montpellier ou Paris.
Entreprise/Organisme :CNRS, Université de Montpellier
Niveau d'études :Master
Sujet :Analyse phylogénétique de données de séquençage pour l'étude de l'évolution d'une tumeur.
Date de début :février ou mars 2025
Durée du contrat :4 à 6 mois
Rémunération :Indemnité de stage
Secteur d'activité :Recherche
Description :Analyse phylogénétique de données de séquençage pour l'étude de l'évolution d'une tumeur.
En savoir plus :https://imag.umontpellier.fr/
ANR_Phase2-4.pdf
Contact :paul.bastide@u-paris.fr
Sensibilité des élevages bovins laitiers à des variations extrêmes d'aléas environnementaux
Publiée le 10/10/2024 17:58.
Stage, Rennes.
Entreprise/Organisme :INRAE
Niveau d'études :Master
Secteur d'activité :Agriculture
Description :Contexte. L’UMR Sol, Agro et hydrosystème, Spatialisation (SAS) étudie les interactions entre l'agriculture et l’environnement dans les territoires ruraux pour contribuer à l’élaboration de systèmes de production agricole durables. Dans un contexte de changement climatique dû notamment à l’émission de gaz à effet de serre (GES), l’agriculture, responsable de 18% des émissions de GES d’origine anthropique en France (Rapport du Haut conseil pour le climat, 2024) , et plus particulièrement l’élevage (59% des émissions du secteur agricole dont 83% attribués aux élevages bovins), sont amenés à réduire leurs impacts sur l’environnement. Dans cet objectif, il est nécessaire de prendre en compte les interactions entre les pratiques de gestion et les fluctuations de l’environnement (contexte régional, climatique ou économique), en particulier dans les cas où ceux-ci varient simultanément de manière extrême. Par exemple, la conjonction de pratiques qui consistent à développer des élevages fortement basés sur l’herbe et de niveaux de précipitation très élevés affecte la qualité et la quantité d’herbes disponibles pour les animaux, avec des conséquences sur leur productivité et la gestion des stocks fourragers. Objectifs. L’objectif général de ce stage est de mieux comprendre les relations entre variables (pratiques de gestion, quantité d’intrants, produits animaux et végétaux, émissions de gaz à effets de serre…) au sein des élevages bovins laitiers et avec leur environnement extérieur (régional, climatique, économique), afin d’élaborer différentes stratégies d’atténuation des émissions de GES. La diversité des pratiques de gestion des élevages conduit au développement de systèmes variés qui vont d’élevages intensifs en bâtiment, avec des animaux nourris principalement avec des aliments achetés à l’extérieur, à des élevages extensifs à l’herbe, avec des animaux ayant une alimentation basée sur l’herbe pâturée. Les fluctuations des aléas environnementaux peuvent conduire à l’occurrence de conditions environnementales qui dévient fortement des conditions habituelles au sein d’élevages dont les pratiques dévient aussi de celles des systèmes dominants (par exemple, haut niveau de précipitation au sein d’un système herbager). Il s’en suit que les aléas de l’environnement extérieur peuvent avoir des conséquences d’une ampleur très variable, en termes d’impacts environnementaux (émissions de GES, consommation d’énergie, pertes de nitrate…) et de productivité des élevages, en fonction de la variété des pratiques de gestion mises en œuvre, en particulier les pratiques atypiques (Senga Kiessé et al. 2022) . Dans ce contexte, ce stage visera à identifier et analyser les co-variations extrêmes de paires de facteurs ciblés (par exemple, pratiques de gestion, émissions de GES, productions animales et végétales) en explorant des approches statistiques telles que la théorie bivariée des valeurs extrêmes ou les modèles de copules extrêmes. Dans l’objectif de développer des systèmes plus durables, l’identification d’associations extrêmes entre une paire de facteurs (par exemple, maximum/maximum, minimum/minimum) au sein des élevages contribuera à mieux caractériser la diversité de leurs pratiques et les vulnérabilités auxquelles les élevages peuvent être exposés. Profil souhaité. MASTER 2 en agro-environnement ou statistiques appliquées ayant des compétences en analyses environnementales et méthodes statistiques d’analyse des valeurs extrêmes. Aisance avec la manipulation de données, autonomie, rigueur, aptitudes à la lecture d’articles en anglais et à la rédaction, esprit de synthèse. Aptitude au travail en autonomie, curiosité. Maîtrise du logiciel statistique R et des outils bureautiques Word, Excel et PowerPoint. Conditions : environ 640 € net par mois (30,45 euros par jour, 35 heures par semaine), selon le barème en vigueur (+ restauration entreprise et participation employeur aux frais de restauration et de transport) Période de stage : 6 mois à partir de janvier 2025
En savoir plus :https://umrsas.rennes.intranet.inrae.fr/
Stage_2024-2025-UMR-SAS.pdf
Contact :tristan.senga-kiesse@inrae.fr
Stage M2 pour l'analyse de communautés bactériennes (métagénomique)
Publiée le 10/10/2024 11:08.
Référence : Stage-2024-022.
Stage, Ploufragan (Saint Brieuc, 22).
Entreprise/Organisme :Anses
Niveau d'études :Master
Sujet :Ce stage se déroulera au Laboratoire de l’Anses de Ploufragan-Plouzané-Niort. Vous travaillerez au sein de l’unité Hygiène et Qualité des Produits Avicoles et Porcins (HQPAP) en étroite collaboration avec une statisticienne de l’unité EPISABE. L’Unité HQPAP assure 4 mandats de Laboratoire National de Référence (LNR Salmonella et salmonelloses aviaires, Campylobacter, botulisme aviaire) et des missions d’expertise aux niveaux national et international. Les activités de recherche de l’unité ont pour thématique la « Maîtrise des agents bactériens zoonotiques transmis par la chaîne alimentaire par une approche pluridisciplinaire dans les filières avicole et porcine ». Les travaux de l’unité répondent au concept « one health », concept visant à renforcer les liens entre santé humaine, santé animale et l’environnement. Vous participerez à un projet de recherche visant à caractériser le risque lié à la contamination des abattoirs de bovins, porcs et volailles par les pathogènes émergents Clostridium perfringens et Clostridium difficile. En particulier vous réaliserez des analyses des communautés bactériennes présentes dans l’environnement des abattoirs (obtenues par métagénomique ciblée) pour déterminer s’il existe des liens statistiques entre la présence de ces pathogènes et celle d’autres bactéries retrouvées dans l’environnement de l’abattoir.
Date de début :Enter janvier et mars
Durée du contrat :6 mois
Rémunération :~ 600 euros / mois
Secteur d'activité :Sécurité alimentaire
Description :Vous serez amené(e) à : - Récupérer et mettre en forme des scripts sous R issus du pipeline FROGS (https://frogs.toulouse.inra.fr/) basés sur le package Phyloseq, - Comparer les résultats avec les scripts créés avec ceux obtenus par le pipeline sur un jeu de données d’exemple - Adapter les sorties (tableaux et graphes aux besoins des utilisateurs) - A partir de la bibliographie, intégrer des tests statistiques plus performants dans le script - Analyser les données de microbiote par metagénomique ciblée relatives au projet Clostabat, et interpréter les résultats avec les biologistes de l’équipe
En savoir plus :NA
Stage-2024-022 M2 Statistique.pdf
Contact :muriel.guyard@anses.fr
Learning with heavy-tailed inputs: Out-of-domain Generalization on Extremes
Publiée le 10/10/2024 11:08.
Référence : Internship offer: (+Thesis opportunity): Generalization on Extremes.
Stage, Laboratoire MAP5, Université Paris Cité, 45 rue des saint-pères, Paris..
Entreprise/Organisme :Laboratoire MAP5, Université Paris Cité
Niveau d'études :Master
Sujet :**Context**: Extreme Value Theory (EVT) is a field of probability and statistics concerned with tails of distributions, that is, regions of the sample space located far away from the bulk, associated with rare and extreme events. Poviding probabilistic descriptions and statistical inference methods for the tails requires sound theoretical assumptions pertaining to the theory of regular variation and maximum domains of attraction, ensuring that a limit distribution of extremes exists. This setting encompasses a wide range of applications in various disciplines where extremes have tremendous impact, such as climate science, insurance, environmental risks and industrial monitoring systems [1]. In a supervised learning framework, the goal is to learn a good prediction function to predict new, unobserved labels. In many contexts (covariate-shifts, climate change), extrapolation (or out-of-sample) properties of the predictors thus constructed are crucial, and obtaining good generalization properties on unobserved regions of the covariate space is key. Recently, there has been significant interest in the ML literature regarding out-of-domain generalization (see e.g. [2]). Recent works [3,4,5] focus on the problem of learning a tail predictor based on a small of the most, with non-asymptotic guarantees regarding the risk on extreme regions . For simplicity, the theoretical study in both works is limited to Empirical Risk Minimization (ERM) algorithms without a penalty term. In addition, the regression problem analysed in [5] covers least squares regression only. Also, with heavy-tailed targets, non-linear transformations of the target are required in order to satisfy boundedness assumptions. **Research Objectives**: The general purpose of this internship and subsequent thesis is to extend the scope of applications of the supervised learning methods described above to a wider class of learning algorithms. One main limitation of least squares regression is that the optimal predictor (i.e. the conditional expectation given the covariate) is not invariant under non-linear transformations of the target. As a starting point, the least-squares framework will be extended to the quantile regression framework which, in contrast to least squares, is compatible with non-linear transformations. From a statistical learning perspective, we shall extend the ERM framework considered thus far to encompass penalized risk minimizations procedures amenable to high dimensional covariates or non-linear regression functions. SVM quantile regression [6] is a natural candidate for this purpose. The goal will be to obtain finite sample guarantees on the generalization error of quantile regression functions learnt with the a subsample made of the largest observations and hopefully recover learning rates of comparable order as the ones obtained in the classical framework, with the full sample size n replaced with the reduced sample size. The bottleneck is that these largest observations may not be considered as an independent sample because they are order statistics of a full sample. However it is anticipated that proof techniques from recent works [7,8,9] based on conditioning arguments and concentration inequalities incorporating (small) variance terms can be leveraged for this purpose. **References** [1] Beirlant, J., Goegebeur, Y., Segers, J., and Teugels, J. L. (2004). Statistics of Extremes: Theory and Applications, volume 558. John Wiley & Sons. [2] Zhou, K., Liu, Z., Qiao, Y., Xiang, T., and Loy, C. C. (2022). Domain generalization: A survey. IEEE Transactions on Pattern Analysis and Machine Intelligence, 45(4):4396–4415. [3] Jalalzai, H., Clémençon, S., and Sabourin, A. (2018). On binary classification in extreme regions. In NeurIPS Proceedings, volume 31. [4] Clémençon, S., Jalalzai, H., Lhaut, S., Sabourin, A., and Segers, J. (2023). Concentration bounds for the empirical angular measure with statistical learning applications. Bernoulli, 29(4):2797–2827. [5] Huet, N., Clémençon, S., and Sabourin, A. (2023). On Regression in Extreme Regions. arXiv preprint arXiv:2303.03084. [6] Takeuchi, I., Le, Q. V., Sears, T. D., Smola, A. J., and Williams, C. (2006). Nonparametric quantile estimation. Journal of machine learning research, 7(7). **Supervisory Team/contact** : Anne Sabourin (MAP5, Université Paris-Cité), Clément Dombry (LMB, Université de Franche-Comté)
Date de début :Before May 2025
Durée du contrat :4 to 6 months (+ 36 months upon pursuing a PhD)
Secteur d'activité :Academic research
Description :context: The internship is intended to lead to a PhD thesis if everything goes as planned. The PhD will be funded by the ANR project EXSTA led by A. Sabourin. The Phd Candidate will benefit from interactions with other researchers in the field e.g. through workshops organised within the project’s framework, in addition to usual participation in conferences. A collaboration is envisioned with Johan Segers (Department of Mathematics, KU Leuwen) on the research questions of the PhD thesis.
En savoir plus :https://helios2.mi.parisdescartes.fr/~asabouri/index.html#generalInfo
offreStage2024.pdf
Contact :anne.sabourin@u-paris.fr
Full-time academic in High Dimensional Spatio-Temporal Data
Publiée le 10/10/2024 11:08.
Référence : 36622 / SC 049 / 2025.
CDI, Louvain-la-Neuve, Belgium.
Entreprise/Organisme :ISBA, UCLouvain, Belgium
Niveau d'études :Doctorat
Date de début :September 2025
Description :See the attached files and the links therein.
En savoir plus :https://jobs.uclouvain.be/PersonnelAcademique/job/An-Academic-in-High-Dimensional-Spatio-Temporal-Da
Anouncement.pdf
Contact :catherine.legrand@uclouvain.be
Full-time academic in Statistical and Bayesian Learning
Publiée le 10/10/2024 11:08.
Référence : 36621 / SC 020 / 2025.
CDI, Louvain-la-Neuve, Belgium.
Entreprise/Organisme :ISBA, UCLouvain, Belgium
Niveau d'études :Doctorat
Date de début :September 2025
Description :See the attached file and links therein.
En savoir plus :https://jobs.uclouvain.be/PersonnelAcademique/job/An-Academic-in-Statistical-and-Bayesian-learning/1
Announcement.pdf
Contact :catherine.legrand@uclouvain.be
STAGE - IA pour la simulation électromagnétique H/F
Publiée le 08/10/2024 16:12.
Référence : Offre_stage_Thales_IASimu_2025.
Stage, Vélizy-Villacoublay (78).
Entreprise/Organisme :Thales AVS France
Niveau d'études :Master
Sujet :Etudes et améliorations de méta-modèles PINNs permettant de simuler un champ magnétique dans un milieu multi-matériaux (en lieu et place d’un logiciel classique par éléments finis)
Date de début :entre février et avril 2025
Durée du contrat :6 mois
Rémunération :Environ 1000€
Secteur d'activité :Intelligence Artificielle - Electronique
Description :Stage au sein d'une équipe d'ingénieurs-chercheurs, développeurs de logiciels et études diverses par simulation numérique pour étudier et concevoir des amplificateurs de puissance (domaine électronique)
En savoir plus :https://careers.thalesgroup.com/fr/fr/job/R0264800/STAGE-IA-pour-la-simulation-%C3%A9lectromagn%C3%A
Offre_stage_IASimu_2025_vf.pdf
Contact :flore.molenda@thalesgroup.com

<1>  2  3  Page suivante

 
 
©2024 SFdS
Société Française de Statistique
Institut Henri Poincaré
11 rue Pierre et Marie Curie
75231 Paris cedex 5
Tél. : +33 (0)1 44 27 66 60
Notre site a été supporté par :