Estimation de la durée totale
des absences « provisoires » citées dans un dénombrement
Dans un dénombrement l’indication qu’un individu est absent depuis 3 ans ne signifie pas que son absence ne durera que 3 ans.
Une simulation a été utilisée pour estimer les probabilités A qu'ont les absences « provisoires » d'avoir une durée totale donnée.
Les exemples donnés ci-dessous sont relatifs à 27 absences estimées « provisoires » dans la consigne des mâles de 1726.
Les durées sont exprimées en années : une durée d'absence égale à 0 correspond à un retour dans les 365 jours suivant le départ.
Les étapes du calcul de simulation sont les suivantes.
On définit d'abord :
- Une première approximation A1 de la loi de probabilité A, probabilité sans doute décroissante avec la durée d'absence et à définir dans l’intervalle de temps correspondant à la durée de l’absence la plus grande donnée dans le dénombrement (cette durée est probablement sous-estimée puisqu’on n’en connaît pas la fin exacte mais, correspondant à une seule personne, elle n’a que peu d’influence dans l’estimation des probabilités). Par exemple, constatant de nombreuses absences qui ont toutes chances d’être relativement courtes, la plus longue étant connue pour avoir au moins 20 ans, on peut retenir, arbitrairement et en première approximation, que 20 % des absences totales sont de moins de 1 an, 15 % de moins de 2 ans, 7 % de moins de 3 ans…. 2 % de plus de 20 ans. On pourrait très bien retenir des probabilités égales mais la suite des calculs serait sans doute plus longue.
- Un échantillon fictif arbitraire d'absents dont l'effectif, pour faciliter la présentation, est choisi voisin de celui des absents soumis à l'étude, par exemple 28 (pour une meilleure représentation statistique un échantillon plus volumineux peut être préféré). A chaque individu de l'échantillon on affecte une durée d'absence totale en tirant celle-ci dans la loi de probabilité A1.
Avec les probabilités A1 initialement retenues, l'echantillon de 28 personnes conduit à :
- 6 individus, notés 0, supposés revenir l'année de leur départ,
- 4, notés 1, revenir 1 an après,
- 2 ,notés 2, revenir 2 ans après,
- ...
- 1, noté 21, revenir plus de 20 ans plus tard.
On recherche ensuite :
- le nombre des personnes notées 0 parties en 1726 et rentrées la même année,
- le nombre des personnes notées 1 parties en 1725 et rentrées en 1726,
- le nombre des personnes notées 2 parties en 1724 et rentrées en 1726
- ...
- le nombre des personnes notées 21 parties avant 1704 et rentrées après 1726
Chacun de ces nombres est converti en proportion de l'échantillon en le divisant par 28 et l'on calcule successivement les proportions cumulées correspondantes. Ces proportions cumulées devraient correspondre aux proportions cumulées observées dans le dénombrement si la loi A1 était la bonne.
On modifie alors les probabilités de la loi A1 jusqu'à ce que les résultats des calculs coïncident avec la réalité observée dans le dénombrement. An est alors une estimation de A, répartition des durées réelles d'absence.
La loi de probabilité définitivement retenue qui s'ajuste bien aux observation de la consigne de 1726 montre ainsi que :
- 55 % des absents « provisoires » reviennent dans l’année de leur départ,
- 15 % le font avant la deuxième,
- 6 % avant la troisième,
- 21 % entre la troisième et la vingtième,
- 1 % après la vingtième (estimation ultime incertaine).
On doit noter que ces probabilités sont issues des informations du dénombrement qui mentionne une absence sans préciser si celle-ci est unique ou seulement la dernière observée : on peut partir faire les foins dans le Piémont tous les ans, le dénombrement ne mentionnera jamais que le dernier départ constaté lors du dénombrement et qui sera généralement de durée inférieure à 1 an.