Résumés
Abstract
Local regression is a popular form of non-parametric regression, combining excellent theoretical properties with conceptual simplicity and flexibility to find structure in many datasets. Local regression smoothers fit low-order polynomials locally in the points surrounding a target point. The estimate, at each target point, is a weighted mean taken from the polynomial with observations close to the target point receiving the largest weights. Unfortunately this simplicity has flaws. At the boundary, the weight function is asymmetric and the estimate may have substantial bias. Bias can be a problem if the regression function has relatively high curvature in the boundary. It leads to a disturbing nuisance affecting applications as well as global measures of performance of the estimators like mean squared error or deviations between the true curve and estimated curve.
In this article, we consider the alleviation of this boundary problem for the context of univariate graduation of mortality by local likelihood models. We consider three specifc treatments to reduce the impact of these boundary effects including symmetric and asymmetric weight systems. We analyze local statistical properties of smoothers subject to an a priori fixed bandwidth restriction. The weighting systems of these estimators depend on smoothing parameters that traditionally are estimated by means of data dependent optimization criteria. However by imposing to all of them the condition of a fixed bandwidth, we can measure the performance of each smoother and study where the contribution to these criteria are coming from the design space. Apart from statistical considerations, the choice of the parameters could be refined by taking into account the nature of the risk considered. The results are compared to the Whittaker-Henderson model for which it is not necessary to give specific treatment at the boundary.
Keywords:
- Boundary effect,
- Local likelihood,
- Life insurance,
- Graduation
Résumé
La régression locale est une forme populaire de régression non-paramétrique, combinant d’excellentes propriétés théoriques avec une simplicité conceptuelle et une flexibilité capable de trouver la structure dans de nombreux ensemble de données. Les lisseurs issus des régressions locales ajustent localement des polynômes aux points aux alentours d’un point cible. L’estimation, à chaque point cible, est une moyenne pondérée du polynôme où les observations proches du point cible reçoivent les poids les plus élevés. Malheureusement, cette simplicité a des failles. Aux bordures, la fonction de poids est asymétrique et l’estimation peut engendrer un biais important. Ce biais peut être un problème si la fonction de régression a une courbure relativement élevée à la bordure. Cela entraîne une nuisance qui affecte les applications ainsi que les mesures globales de performance des estimateurs comme la moyenne des carrés des résidus ou les écarts entre la courbe réelle et la courbe estimée.
Dans cet article, nous considérons la réduction des effets de bordures pour le lissage des données d’expérience provenant de l’assurance vie. Nous considérons trois traitements spécifiques pour réduire l’impact des effets de bordures, incluant des systèmes de poids symétriques et asymétriques. Nous analysons les propriétés statistiques locales des lisseurs sujets à une restriction a priori de la fenêtre d’observations. Les systèmes de pondération de ces estimateurs dépendent des paramètres de lissage qui sont traditionnellement estimés au moyen de critères d’optimisation dépendants des données. Cependant, en imposant à chacun d’eux la condition d’une fenêtre d’observations fixe, on peut mesurer la performance de chaque lisseur et étudier la provenance des contributions à ces critères. Mis à part les considérations statistiques, le choix des paramètres pourrait être affiné en tenant compte de la nature du risque. Les résultats sont comparés au modèle de Whittaker-Henderson pour lequel il n’est pas nécessaire de donner un traitement spécifique aux bordures.
Mots-clés :
- Effet de bordures,
- modèle de vraissamblances,
- assurance-vie,
- lignage des données