Nouveaux Apports Théoriques à l’Analyse Statistique Implicative et Applications. Données déséquilibrées, entropie décentrée et indice d’implication. p. 315-327.
English Title : Unbalanced data, out centered entropy and implication measure.
Auteurs : Ritschard Gilbert ; Zighed Djamel Abdelkader ; Marcellin Simon
Résumé
Cet article porte sur l’induction d’arbres de classification pour des données déséquilibrées, c’est-à-dire lorsque certaines catégories de la variable à prédire sont beaucoup plus rares que d’autres. Plus particulièrement les auteurs s’intéressent à deux aspects : d’une part, à définir des critères de construction de l’arbre qui exploitent efficacement la nature déséquilibrée des données, et d’autre part la pertinence de la conclusion à associer aux feuilles de l’arbre. Ils ont récemment abordé cette problématique sous deux angles indépendants : l’un était axé sur le recours à des entropies décentrées, l’autre s’appuyant sur des mesures d’intensités d’implication issues de l’ASI. Ils proposent ici de comparer et d’établir les similarités entre ces deux approches. Abstract This paper is concerned with the induction of classification trees for unbalanced data, i.e. for the case where some categories of the target variable are much less frequent than other ones. More specifically, we address two aspects. On the one hand, we look for growing criteria that efficiently take into account the specific unbalanced nature of the data. On the other hand, we deal with the relevance of the conclusion that should be assigned to the leaves of a grown tree. We have recently considered two independent ways for dealing with these issues. The first one consisted in defining and using out centered entropies, and the second one on relying on measures of implication strength derived from implicative statistics. The aim of this paper is to compare and establish the relationship between these two approaches.
Notes
Chapitre de l’ouvrage Nouveaux Apports Théoriques à l’Analyse Statistique Implicative et Applications.
Pistes d’utilisation en classe
Cette ressource peut être utilisée en formation initiale des enseignants.
Données de publication
Éditeur Université Jaume I Cstellon Castellon , 2007 Collection ASI Num. 04 Format 19 cm x 27 cm, p. 315-327 Index Bibliogr. p. 326-327
ISBN 84-690-8241-8 EAN 9788469082416
Public visé chercheur, enseignant
Type chapitre d’un ouvrage Langue français Support papier