Back

Session MA10 - Exploitation de données / Data-Mining

Day Monday, May 7, 2007
Room Demers Beaulne
Chair Gilles Caporossi

Presentations

10h30 AM-
10h55 AM
Arbre multivarié pour variables de réponses mixtes
  Abdessamad Dine, HEC Montréal
Denis Larocque, GERAD et HEC Montréal, Méthodes quantitatives de gestion
François Bellavance, GERAD et HEC Montréal, 3000, chemin de la Côte-Ste-Catherine, Montréal, Québec, Canada, H3T 2A7

Les méthodes de construction d’arbres de régression ou de classification multivariées existantes peuvent traiter un seul type de variable réponse à la fois, soit elles sont toutes continues (ordinales), soit toutes nominales. Nous présenterons une méthode de construction d’arbres multivariés adaptée à la situation où un mélange de variables réponses continues et nominales est présent. Le critère de séparation adopté est basé sur le modèle général de location (GLOM). Nous présenterons les résultats d’une analyse par simulation ainsi que des exemples avec des données réelles.


10h55 AM-
11h20 AM
Arbres de régression pour données longitudinales
  Saad-Ellah SE. Berhili, HEC Montréal, Méthodes quantitatives de gestion, 3000, chemin de la Côte-Sainte-Catherine, Montréal, Québec, Canada, H3T 2A7
François Bellavance, GERAD et HEC Montréal, 3000, chemin de la Côte-Ste-Catherine, Montréal, Québec, Canada, H3T 2A7

Une nouvelle méthode de classification des données longitudinales par arbre est présentée. Non seulement elle traite le cas où le vecteur des variables dépendantes est continu mais aussi le cas discret (binaire, compte). Cette méthode combine les avantages des modèles paramétriques (GEE) à ceux des arbres de régression (RECPAM). Une comparaison avec des techniques similaires antérieures (Segal, 1992) sera aussi présentée.


11h20 AM-
11h45 AM
Exact Methods for Minimum Sum-of-Squares Clustering: A Survey
  Daniel Aloise, GERAD et École Polytechnique de Montréal, Mathématiques et génie Industriel, C.P. 6079, Succ. Centre-Ville, Montréal, Québec, Canada, H3C 3A7
Pierre Hansen, GERAD et HEC Montréal, Méthodes quantitatives de gestion, 3000, chemin de la Côte-Sainte-Catherine, Montréal, Québec, Canada, H3T 2A7

Minimum sum-of-squares clustering consists in partitioning a given set of N entities into M clusters in order to minimize the sum of squared distances from the entities to the centroid of their cluster. We present a survey, with some new results, of the state-of-art and quite diverse exact methods for solving this problem.


11h45 AM-
12h10 PM
Forecasting Rail Transportation Demand Using Artificial Neural Networks
  Shadi Sharif Azadeh, École Polytechnique de Montréal, Applied mathematics and industrial engineering, Montréal, Québec, Canada
Richard Labib, École Polytechnique de Montréal, Applied mathematics and industrial engineering, Montreal, Quebec, Canada
Gilles Savard, GERAD et École Polytechnique de Montréal, Mathématiques et génie industriel, C.P. 6079, Succ. Centre-ville, Montréal, Québec, Canada, H3C 3A7

We consider in this talk the forecasting of the demand for a major rail operator. A supervised artificial neural network, namely a Multi-Layer Perceptron (MLP), is used along with the backpropagation learning algorithm. Significant data pre-processing is achieved in order to incorporate feed-forward inputs such as time of purchase, date of departure, prices, products and physical classes. Numerical results show good generalization since the predictions are within 8% of the targeted values.


Back