====== Outils Formels pour la Science des Données ====== ==== PROGRAMME : probabilités et statistique, combinatoire, analyse ==== * Axiome des probabilités (sans détailler les tribus) * Règles de calcul (complémentaire, union, formule de Poincaré) Ex: jeu de pile ou face, boules et urnes. * Probabilité uniforme. * Combinatoire : permutations, Pascal, formule du binôme et du multinôme. * Variables aléatoires discrètes: distribution, espérance, variance, écart-type. (rappel sur les séries positives ou non) * Exemples: Bernoulli, binomiale, géométrique. * Poisson et approximation poissonienne de la binomiale. * Linéarité de l'espérance. * Ex : Collectionneur de coupons (durée moyenne) Séries génératrices. * Variables aléatoires réelles continues: distribution, densité. Médiane. * Rappel d'intégrale simple. Th. fondamental du calcul différentiel, intégration par parties, contrepartie discrète. * Comparaison séries/intégrales Exemples: loi uniforme, exponentielle, gaussienne Espérance, variance dans le cas à densité. * Fonction génératrice des moments (transformé de Laplace) * Indépendance et conditionnement: * Indépendance de variables aléatoires ou d'événements en nombre quelconque. * Loi du maximum de v.a.i.i.d. * Propriétés de stabilité de l'indépendance. * Loi jointe, marginale. Covariance. Densité multivariée (intégrale multiple comme itérées d’intégrale simples) * Espérance d'un produit de variables indépendantes. * Application à la variance d'une somme. * Moments et Estimations: * Inégalités: Cauchy-Schwarz, Jensen, croissance des normes p. Inégalités de Markov, Bienaymé-Tchebychev, Paley-Zygmund. Méthode du second moment. * Loi faible des grands nombres. * Collectionneur de coupon. * Enoncé du théorème central limit (avec des intervalles). * Statistique par quelques exemples : Estimation du paramètre d'une Bernoulli: * Intervalle de confiance en utilisant Bienaymé-Tchebychev, ou Markov exponentiel. * Intervalle de confiance asymptotique en utilisant le théorème central limit. Construction d'un test sur le paramètre. * Régression linéaire. Méthode des moindre carrés. * Rappels : Optimisation d'une fonction de plusieurs variables, dérivées partielles. ==== REFERENCES BIBLIOGRAPHIQUES ==== * Initiation aux Probabilités et aux chaînes de Markov, Pierre Brémaud Springer 2009, Ch. 1-4 et 6 === Peut-etre trop simple : === * Initiation aux Probabilités, Sheldon M. Ross Editeur : PPUR Presses polytechniques et universitaires romandes === Sans doute trop avancé : === * Probability and Computing , Michael Mitzenmacher et Eli Upfal Randomization and Probabilistic Techniques in Algorithms and Data Analysis 2nd Edition 2017, Cambridge U.P [[http://www.bioinfo.org.cn/~wangchao/maa/Probability_and_Computing.pdf|Ch. 1-6]] * Probability Models for Computer Science , Sheldon M. Ross Academic press 2001 Ch. 1 et 3 === Pour mémoire : === * Randomized Algorithms, Rajeev Motwani et Prabhakar Raghavan. Cambridge 1995