====== Outils Formels pour la Science de Données ====== ===== Description ===== Le cours a pour objectif de présenter quelques méthodes mathématiques nécessaires à l’analyse des données. Après un rapide rappel de théorie des probabilités (définitions, combinatoires, variables aléatoires discrètes, …), il sera question de sujets probabilistes plus avancés (variables aléatoires continues, intégrales multiples, estimations, moments). Puis quelques méthodes statistiques seront abordées (estimateurs, intervalles de confiance, …). Finalement, des méthodes d’optimisation de fonctions à plusieurs variables seront discutées avec application à la méthode des moindres carrés (régression linéaire). ===== Syllabus ===== ==== Sujets centraux ==== Rappels de théorie des probabilités : axiomes, règles de calcul (complémentaire, union, formule de Poincaré), indépendance, conditionnement. Rappels sur les variables aléatoires discrètes : lois jointes et marginales, espérance, variance, covariance, séries génératrices. Exemples: Bernoulli, binomiale, géométrique, Poisson. Variables aléatoires réelles continues : distribution, densité. Rappel d'intégrales simples et multiples. Exemples: loi uniforme, exponentielle, gaussienne. Moments et Estimations. Inégalités de Cauchy-Schwarz, Jensen, Markov, Bienaymé-Tchebychev. Méthode du second moment. Loi faible des grands nombres, théorème central limite. Statistique par quelques exemples: Estimation du paramètre d'une Bernoulli par intervalles de confiance en utilisant Bienaymé-Tchebychev ou Markov exponentiel. Intervalle de confiance asymptotique en utilisant le théorème central limite. Construction d'un test sur le paramètre. ===== Pré-requis ===== * Mathématiques niveau L1, L2 (ensembles, symbole de sommation, suite, séries, dérivées) * Probabilités niveau L2-L3 (typiquement le cours PR4 donné en L2 MIASHS et L3 INFO)