Statistical Applications of Industrial Big Data (SAFI-M6)

PERSONNEL CONCERNÉ

Cette formation s’adresse aux ingénieurs professionnels, aux chefs de projet, aux analystes de données et aux informaticiens ayant des responsabilités dans la conception, la planification et le développement de nouveaux produits, ou dans la gestion de la qualité des produits actuels, et qui souhaitent développer des connaissances et des compétences avancées dans l’application de méthodes statistiques à l’appui d’une prise de décision solide fondée sur des données.

PRÉREQUIS

Cette formation étant dispensée en anglais, un niveau d’anglais technique correspondant à une utilisation professionnelle régulière est requis.
La participation au module ‘Statistics for engineering’ (SAFI-M1) est recommandée (ou connaissance équivalente des concepts de base de statistiques avec utilisation pratique et niveau d’éducation équivalent).
Une expérience de l’analyse des données / des problématiques big data en entreprise est souhaitée.
Utilisation de Python : une expérience initiale de codage de base est requise (variables, contrôles, listes…).

OBJECTIFS DE LA FORMATION

A l’issue de ce module, le participant sera capable de :
Prendre des initiatives dans l’examen des solutions d’analyse et de traitement statistique des big data.
Analyser les données disponibles et produire des résultats, ou guider vers les applications appropriées en matière d’analyse statistique des Big Data.
Identifier les corrélations et construire des modèles statistiques à partir des ressources Big Data de l’ingénierie.
Interpréter les résultats et les expliquer à des non-spécialistes.
Utiliser des outils logiciels concrets, en mettant l’accent sur la conception et l’expérimentation du processus de travail.

Professeur Daniel NEAGU

Daniel Neagu a été nommé professeur d’informatique à l’université de Bradford en 2011. Il a rejoint le département d’informatique en tant que maître de conférences en 2002, et a été promu maître de conférences en 2005. Auparavant, il a été professeur associé au département d’informatique et d’ingénierie de l’université de Galati, en Roumanie (1993-2001). Après avoir soutenu avec succès sa thèse de doctorat intitulée Using Artificial Neural Networks in Fuzzy Reasoning, Daniel a été nommé chercheur au Dipartimento di Elettronica e Informazione, Politecnico di Milano, Italie (2001-2002), où il a rejoint le réseau de recherche européen IMAGETOX (Intelligent Modelling Algorithms for General Evaluation of TOXicities) du 5e PC, en collaboration avec le professeur Giuseppina Gini.
Ses recherches portent sur les techniques d’intelligence artificielle appliquées à l’ingénierie (automobile), la sécurité des produits, la toxicologie, les soins de santé et les réseaux sociaux en ligne.
Daniel dirige le groupe de recherche sur l’intelligence artificielle (AIRe) de l’université de Bradford.
Daniel enseigne les systèmes de Big Data et l’analytique, l’exploration de données, la conception et le développement de logiciels.

Dr Amr Rashad Ahmed ABDULLATIF

Le Dr Amr Abdullatif est un chercheur expérimenté qui se consacre à la recherche et au développement de techniques d’apprentissage automatique et d’apprentissage profond, avec un parcours professionnel éprouvé dans différentes entreprises (GE Oil & Gas, Ansaldo, Bombardier, …), et universités (Bradford, PISA, Scuola Superiore Sant’Anna, Gênes, Le Caire, AASTMT, …). Ses intérêts de recherche portent sur les techniques d’intelligence artificielle appliquées à l’industrie automobile, la transformation numérique du pétrole et du gaz, la vision par ordinateur, le traitement du langage naturel, le diagnostic prédictif, les soins de santé et l’apprentissage en ligne à partir de flux de données non stationnaires.
Il travaille actuellement en tant que professeur adjoint à l’université de Bradford. Auparavant, il dirigeait des projets d’apprentissage automatique chez Baker Hughes, une société GE, en tant que chercheur associé.

Cette formation présente aux participants un développement pratique des connaissances spécialisées en analyse statistique des données nécessaires pour appliquer les principes de la sdata science et pour fournir des solutions d’ingénierie innovantes basées sur les données.

Notions fondamentales

  • Qualité des données et nettoyage des données ; Préparation des données (évaluation statistique de la qualité des données, nettoyage des données et transformation des données);
  • Exploration des concepts de cardinalité des données, dimensionnalité, déséquilibre, similarité, sélection de caractéristiques ;
  • Résolution de problèmes d’ingénierie à l’aide de la programmation Python.

Prétraitement des données

  • Visualisation exploratoire des données et introduction aux concepts statistiques pertinents pour l’exploration du Big Data ;
  • Ingénierie des caractéristiques (importance, sélection, réduction de la dimensionnalité, ACP).

Statistical Classification

  • Méthodes pour traiter les données de grande dimension, les grands échantillons, le fractionnement des échantillons ;
  • Algorithmes orientés données pour les modèles statistiques d’ingénierie du Big Data (classificateurs, arbres de décision, Naïve Bayes) ;
  • Méthodes bootstrap et bagging.

Sujets spéciaux

  • Introduction à la problématique du panier de la ménagère et aux règles d’association ;
  • Regroupement (k-means, clustering à haute dimension, sub-space clustering) ;
  • Exploration de texte.

Mini-Projet

  • Mise en pratique par le biais d’une application à un projet individuel d’ingénierie Big Data pertinent.

METHODES ET MOYENS PEDAGOGIQUES

La formation est conçue sous forme d’atelier avec une répartition approximative de 50/50 entre les sessions techniques et les exercices pratiques, destinés à expliquer les concepts en s’appuyant sur des études de cas industriels pertinents.
La formation est dispensée en ligne. Le dossier de formation sera envoyé une semaine à l’avance avec les instructions de participation et le matériel d’apprentissage comprenant des tutoriels de programmation Python de niveau introductif.


MOYENS TECHNIQUES

La formation est dispensée sous forme de classe virtuelle sous Teams.
Informations de connexion envoyées au plus tard 2 jours avant la formation.

SUIVI ET EVALUATION

Feuille d’émargement signée chaque demi-journée par le stagiaire et cosignée par la SIA.
Évaluation de l’apprentissage basée sur :
– une présentation individuelle ou en groupe avec argumentation sur un mini projet.
– un plan individuel d’application autour d’un projet spécifique sur le lieu de travail du stagiaire (plan basé sur les méthodes et outils du cours).
Évaluation de la formation par les participants.
Remise d’une attestation de formation.

DELAI D’ACCES

Formation inter-entreprises : inscription au plus tard 2 jours avant la formation
Formation intra-entreprise : organisation sous 2 semaines minimum.

PROCHAINE(S) SESSION(S)

Nous consulter Dates à venir (2025)

CONTACT

Patrycja PERRIN 01 61 38 96 32

ENVOYER UN EMAIL

ACCESSIBILITÉ

Les personnes en situation de handicap sont invitées à contacter notre Référent Handicap afin d'étudier ensemble les possibilités de suivre la formation.

ENVOYER UN EMAIL
Sponsored By

Statistical Applications of Industrial Big Data (SAFI-M6)

CHOIX D'OPTIONS

TARIFS
Prochaine session

ENTREPRISE

RESPONSABLE DE FORMATION

Nom

STAGIAIRE

Nom

FACTURATION

Sans titre
** Dans le cas d’une facturation directe à un OPCO, le client fera les démarches auprès de l’OPCO afin de s’assurer de son accord. A défaut, le règlement de la facture incombera au Client. L’accord de prise en charge par l’OPCO devra nous parvenir avant le début de la formation.