3.1 Sources
Bien que la collecte et le traitement des données du recensement doivent répondre à des normes de qualité élevées, il est très difficile d’éliminer toutes les erreurs potentielles. Il existe deux types d’erreurs de couverture de la population. Le sous‑dénombrement de la population correspond à l’exclusion de personnes qui auraient dû être dénombrées, alors que le surdénombrement de la population désigne l’inclusion de personnes dénombrées plus d’une fois (en général deux fois). Le surdénombrement comprend aussi les personnes dénombrées qui n’auraient pas dû l’être. Toutefois, on ne mesure pas ce type d’erreur, car il est jugé négligeable.
Un sous-dénombrement peut se produire lors de la première étape du recensement si la liste des logements utilisée pour l’univers des logements est incomplète. Ce risque est plus élevé, par exemple, si un logement est en cours de construction. Inversement, un surdénombrement peut se produire si un logement est dénombré à deux reprises.
Il y a également des risques d’erreur de couverture à l’étape de la collecte des données sur le terrain. Les erreurs commises par les répondants sont à l’origine d’erreurs de couverture lorsque la personne qui remplit le questionnaire du recensement omet une personne dont le lieu habituel de résidence est le logement en question selon les règles du recensement; il s’agit alors d’un sous-dénombrement. La personne peut également inclure une personne dont le lieu habituel de résidence n’est pas le logement en question; il s’agit alors d’un surdénombrement si la personne a déjà été dénombrée à son lieu habituel de résidence ou à un autre endroit. Il est généralement facile de déterminer le lieu habituel de résidence d’une personne. Cependant, comme on le mentionne à la section précédente, le processus est parfois plus complexe, et des règles spéciales ont été élaborées pour déterminer le lieu habituel de résidence d’une personne. Ces règles sont énoncées dans le questionnaire du recensement, mais la liste est longue et elles peuvent être difficiles à comprendre. Des erreurs de couverture peuvent survenir lorsque les règles ne sont pas consultées ou lorsqu’elles sont appliquées de façon inappropriée. La notion de jour du recensement comme date de référence pour déterminer le lieu habituel de résidence peut également être mal comprise, ce qui peut entraîner une erreur de couverture.
Des erreurs de couverture peuvent également être commises à tout moment au cours de l’étape de traitement, lorsque les renseignements indiqués dans les dossiers des personnes ou des ménages sont entrés dans la base de données du recensement ou extraits de celle-ci. Les dossiers peuvent être supprimés par erreur. Les questionnaires peuvent être associés à un dossier erroné ou retournés trop tard pour être ajoutés.
Même si des efforts sont faits pour recenser la population des personnes en situation d’itinérance, le risque de sous-dénombrement est élevé. Certains autres modes de vie sont également susceptibles de donner lieu à des erreurs de couverture. Par exemple, les jeunes adultes qui viennent de quitter le domicile familial peuvent être soit sous-dénombrés, parce que ni leurs colocataires ni leurs parents ne les ont inscrits dans le questionnaire du recensement, soit surdénombrés, parce qu’ils ont été inscrits dans les deux questionnaires du recensement. Les personnes qui conservent une résidence secondaire en raison de leur emploi peuvent également être à l’origine d’une erreur de couverture.
Les utilisateurs doivent également savoir dans quelle mesure les réserves et les établissements ont participé au Recensement de 2021. Dans certains cas, le dénombrement n’a pas été autorisé par la communauté ou a été interrompu avant d’être terminé. Ces régions géographiques (63 en tout en 2021, en hausse par rapport aux 14 régions enregistrées en 2016) sont considérées comme des réserves et des établissements partiellement dénombrés. Il n’y a pas de données en 2021 pour les réserves et les établissements partiellement dénombrés, et ces régions ne sont pas prises en compte dans les totaux. Des problèmes semblables sont survenus au cours de recensements antérieurs. Par exemple, 22 réserves et établissements ont été partiellement dénombrés lors du Recensement de 2006, et 31 lors du Recensement de 2011.
Les estimations démographiques pour les 63 réserves et établissements partiellement dénombrés sont basées sur un modèle. Cependant, étant donné qu’il n’y a pas de source fiable permettant de vérifier les hypothèses du modèle, les estimations doivent être utilisées avec circonspection. Pour obtenir plus de renseignements, voir la section 12.2.
3.2 Contrôle
Les sources possibles d’erreurs de couverture ont été définies au cours de l’étape de planification du Recensement de 2021, et les mesures suivantes ont été prises pour réduire au minimum les risques connexes :
- Les limites des unités de collecte (UC) ont été soigneusement définies et configurées, de façon à ce qu’aucune des régions géographiques ne soit omise ou incluse deux fois.
- Les secteurs de listage/livraison : Le manuel de l’agent recenseur renfermait des instructions quant à la façon de dénombrer une UC tout en minimisant les risques d’oublier des logements. Le nombre total de logements selon le Recensement de 2016 a été communiqué aux chargés des opérations sur le terrain afin de les aider à déceler les modifications notables. Par ailleurs, lorsque les opérations de listage donnaient lieu à une différence marquée du nombre de logements par rapport à celui du Recensement de 2016, une vérification de la liste était effectuée. Enfin, des procédures précises de contrôle qualitatif ont été appliquées à l’UC afin d’évaluer puis de corriger les modifications apportées à la liste.
- Les secteurs d’envoi par la poste : L’envoi par la poste a été effectué en fonction d’une liste d’adresses provenant du Registre des adresses de Statistique Canada. Cette liste était mise à jour régulièrement et des activités de listage ont été effectuées (sur le terrain et à distance), principalement dans les zones où les erreurs de base de sondage étaient plus probables. Les activités de listage ont été effectuées en continu, mais de façon plus intensive dans les deux années précédant le recensement. Le travail des agents recenseurs était étroitement surveillé.
- En 2021, la méthode d’envoi par la poste et de livraison à la porte (EPLP) a été mise en place. Les secteurs d’EPLP sont ceux où tous les logements ont une adresse et où la majorité d’entre eux peuvent recevoir du courrier. Dans ces secteurs mixtes, les logements disposant d’une adresse postale valide ont reçu le matériel d’envoi régulier par la poste (comme dans les secteurs d’envoi par la poste), tandis que ceux qui n’avaient pas d’adresse postale valide (correspondant à l’adresse municipale) ont reçu une lettre d’invitation qui a été déposée à leur porte par un employé du recensement. Les secteurs d’EPLP ont été mis en place pour maximiser le nombre de logements admissibles à l’envoi par la poste pour le recensement. Comme pour les secteurs d’envoi par la poste, les secteurs d’EPLP étaient basés sur une liste d’adresses provenant du Registre des adresses de Statistique Canada, et la liste était mise à jour régulièrement.
- Des procédures spéciales ont été définies pour assurer le dénombrement de la population vivant dans les réserves.
- Des messages publicitaires informaient les Canadiens à propos du recensement et indiquaient ce qu’ils devaient faire s’ils n’avaient pas reçu de questionnaire.
- L’Assistance téléphonique du recensement (ATR) était offerte pour obtenir une réponse aux questions à propos du recensement, y compris celles à propos de la couverture.
- Lorsque le service d’ATR recevait des appels concernant un logement susceptible d’avoir été omis par le recensement, une procédure était mise en place pour examiner les environs à la recherche d’autres logements susceptibles d’avoir été omis.
- Le questionnaire comprenait une partie intitulée « Qui inscrire », ce qui permettait aux répondants de déterminer les personnes qui devaient être incluses. De plus, un peu plus de 84 % des réponses au Recensement de 2021 ont été obtenues par Internet, et le questionnaire électronique comprenait des questions de vérification supplémentaires lorsque les répondants déclaraient qu’un logement était inoccupé ou inexistant, ou s’ils avaient de la difficulté à déterminer si une personne devait être incluse ou non.
- Dans le questionnaire, on demandait aux répondants d’indiquer s’il y avait des personnes qui n’avaient pas été inscrites parce qu’ils n’étaient pas certains qu’il fallait les inclure. Le questionnaire électronique guidait les répondants pour qu’ils prennent la bonne décision. Dans les autres cas, un suivi téléphonique était effectué par la suite auprès des répondants pour déterminer si les personnes en question devaient être inscrites ou non dans le questionnaire.
- Le suivi téléphonique a été effectué après l’examen des questionnaires en cas d’incohérence quant à la couverture ou pour vérifier la situation des ménages, y compris les questionnaires ne concernant que des résidents étrangers ou des personnes présentes temporairement.
Ces procédures ainsi qu’une formation appropriée du personnel, des vérifications de supervision et des contrôles qualitatifs durant les étapes de collecte et de traitement ont permis de réduire le nombre d’erreurs de couverture.
3.3 Définitions
La présente section porte sur la définition algébrique des erreurs de couverture. La lettre
représente le total ou le nombre « réel » de personnes ciblées par le Recensement de la population. La lettre
représente le chiffre publié du recensement du nombre de personnes dans la population cible. L’erreur associée à l’utilisation de
plutôt que de
est la suivante :
Cette erreur, désignée au moyen de la lettre
,
représente l’erreur de couverture nette de la population.
La lettre
désigne le sous-dénombrement de la population, c’est-à-dire le nombre de personnes qui auraient dû être prises en compte dans
,
mais qui ne l’ont pas été.
Le nombre de personnes dans le recensement,
,
comporte deux éléments, soit :
où :
est le nombre de personnes dénombrées, c’est-à-dire le nombre de personnes inscrites dans un questionnaire du recensement.
est le nombre de personnes imputées. Il s’agit d’une estimation du nombre de personnes omises parce que leur logement a été classé comme étant occupé, mais non répondant ou classé par erreur comme étant inoccupé (donc pour lequel aucun suivi n’a été fait). Pour obtenir plus de renseignements sur l’imputation des ménages entiers (IME), voir la section 3.6 du Rapport technique sur l’échantillonnage et la pondération, Recensement de la population, 2021, no 98-306-X au catalogue de Statistique Canada.
Le sous-dénombrement par rapport au nombre de personnes publié dans le recensement
est donc ce qui reste des personnes qui auraient dû être inscrites dans un questionnaire du recensement et qui n’ont pas été prises en compte par l’IME. Autrement dit, le sous-dénombrement ne comprend pas l’estimation du nombre de personnes qui n’ont pas été dénombrées soit parce qu’un questionnaire du recensement rempli n’a pas été retourné pour le logement (logement non répondant), soit parce que le logement n’a pas reçu de questionnaire puisqu’il a été classé par erreur comme étant inoccupé (erreur de classification).
Le concept de sous-dénombrement avant l’IME existe aussi. C’est ce que l’on appelle le sous-dénombrement de la collecte du Recensement de la population. Pour obtenir plus de renseignements, voir la section 12.1.
La lettre
désigne le surdénombrement de la population, c’est-à-dire le nombre de dénombrements excédentaires compris dans
qui n’auraient pas dû l’être.
comporte deux éléments. Le premier est le dénombrement excédentaire de personnes, c’est-à-dire qu’elles ont été prises en compte plus d’une fois. Les études sur la couverture portent sur ces dénombrements excédentaires. Le deuxième concerne les personnes qui ont été dénombrées, mais qui ne faisaient pas partie de la population cible du recensement. Par exemple, les résidents étrangers en visite au Canada dont le nom figure dans un questionnaire du recensement en tant que résidents habituels d’un logement ne devraient pas faire partie de
.
Les personnes fictives sont un autre exemple. Selon des études antérieures, le nombre de personnes qui sont dénombrées, mais qui ne font pas partie de la population cible du recensement est en général très faible et peut être ignoré. Par conséquent, les études sur la couverture du recensement n’évaluent pas cet élément des erreurs de couverture.
Puisque
désigne les personnes non dénombrées qui devraient être comprises dans
et que
désigne les dénombrements qui ne devraient pas être compris dans
,
l’écart entre
et
correspond à
moins
,
c’est-à-dire :
Le nombre réel de personnes dans la population cible du recensement est alors :
En pratique, pour des raisons de coût et d’actualité des données produites, on établit une estimation de
,
dénotée
,
fondée sur des études par échantillon, où :
est une estimation du nombre de personnes non incluses dans
qui auraient dû l’être et
est une estimation du nombre de personnes incluses dans
qui n’auraient pas dû l’être. On peut supposer que le surdénombrement des personnes comprises dans
alors qu’elles ne font pas partie de la population visée par le recensement est égal à zéro, car il est négligeable.
se limite donc à une estimation du nombre de dénombrements en double. Les études sur la couverture du recensement visent à établir les valeurs de
et de
.
En bref, la population réelle
est formée du nombre de personnes publié dans le recensement
et du sous-dénombrement net
.
On parle de sous-dénombrement net, car
est généralement plus grand que
dans le contexte du recensement actuel au Canada. Toutefois, l’inverse est possible et
serait alors négatif. La variable
correspond à
plus le nombre de personnes ajoutées lors de l’IME, et cette imputation
vise les personnes habitant des logements non répondants ou des logements occupés classés par erreur comme étant des logements inoccupés.
Les erreurs de couverture de la population du recensement peuvent généralement être exprimées en fonction de taux relatifs à la population réelle. Le taux de sous-dénombrement
est
exprimé en un pourcentage de
.
Le taux de surdénombrement
est
exprimé en un pourcentage de
.
Le taux de sous-dénombrement net
correspond à l’écart entre
et
,
exprimé en un pourcentage de la population cible du recensement. Ces trois taux peuvent être estimés au moyen de
,
et
comme suit :
Un taux de sous-dénombrement net positif indique que le taux de sous-dénombrement est plus élevé que le taux de surdénombrement. Autrement dit, le nombre de personnes non comprises dans les chiffres publiés du recensement
est plus élevé que le nombre de personnes dénombrées en trop. C’est généralement le cas pour tous les recensements du Canada. Cependant, un taux de sous-dénombrement net négatif est parfois observé pour certains domaines d’intérêt.
3.4 Évaluation
Deux études postcensitaires ont été menées pour estimer les erreurs de couverture de la population du Recensement de 2021. L’Étude sur le sous-dénombrement du recensement (ESoR) a fourni des estimations du sous-dénombrement de la population, tandis que l’Étude sur le surdénombrement du recensement (ESuR) a permis d’estimer le surdénombrement de la population. Comme il est mentionné précédemment, l’Enquête sur la classification des logements (ECL) ne contribue pas à l’estimation des erreurs de couverture du recensement, puisque les chiffres du recensement sont déjà corrigés pour tenir compte des résultats de l’ECL.
L’ESoR et l’ESuR ont été réalisées après les opérations de collecte sur le terrain et de traitement du recensement. Les estimations provisoires des erreurs de couverture de la population du Recensement de 2021 ont été publiées le 28 avril 2023. Les estimations définitives ont été publiées le 27 septembre 2023, après un exercice de validation approfondi effectué en collaboration avec le Centre de démographie et les coordonnateurs statistiques provinciaux et territoriaux. Ces données ont été publiées en même temps que les nouvelles estimations démographiques officielles tenant compte de la mise à jour de la population de base du Recensement de 2021. Les chiffres de population du recensement corrigés pour tenir compte du sous‑dénombrement net de la population constituaient les estimations à jour de la population de base.
Une brève description de la méthodologie utilisée dans les deux études sur la couverture du recensement est présentée ci‑dessous :
Étude sur le sous-dénombrement du recensement
Dans l’ESoR, un échantillon aléatoire de personnes représentant la population cible du Recensement de 2021 a été sélectionné à partir de bases de sondage indépendantes du recensement. Ces bases de sondage sont décrites à la section 7.1. La base de données du Recensement de 2021 a ensuite été consultée pour déterminer si ces personnes avaient bien été dénombrées.
On a également effectué, au besoin, des interviews, dont la majorité a été des interviews téléphoniques assistées par ordinateur, à partir des bureaux régionaux (BR), afin de recueillir des renseignements pouvant servir à des recherches supplémentaires dans la base de données du Recensement de 2021. Une interview a été réalisée dans 60,2 % des 12 787 cas transmis aux BR. Le poids d’échantillonnage a été corrigé pour tenir compte de la non-réponse. Plus précisément, le poids d’échantillonnage total des non-répondants a été réparti entre des groupes de répondants ressemblant le plus possible aux non-répondants quant à leur probabilité de réponse.
L’estimation du sous-dénombrement de la population est basée sur le nombre de personnes dans l’échantillon de l’ESoR qui ont été classées comme des personnes « omises ». Ces personnes faisaient partie de la population cible du Recensement de 2021, mais aucune preuve de dénombrement n’a pu être trouvée dans la base de données des réponses du Recensement de 2021. À l’échelle nationale, 6 212 personnes faisant partie de l’échantillon de l’ESoR ont été classées comme des personnes omises dans les provinces, et 1 241, dans les territoires.
Étude sur le surdénombrement du recensement
Le surdénombrement a été mesuré en créant une liste d’enregistrements potentiellement en double dans la base de données du Recensement de 2021 à l’aide de méthodes de couplage probabiliste et déterministe pour effectuer un appariement de la base de données définitive du Recensement de 2021 avec elle-même, suivi d’un appariement entre la base de données définitive du Recensement de 2021 et une liste de personnes qui auraient dû être dénombrées d’après des sources de données administratives. Le couplage probabiliste permet d’estimer la probabilité que les paires liées soient de vraies concordances en se basant sur un modèle de concordance obtenu en comparant les variables de couplage entre les enregistrements. Le couplage déterministe permet de classer les paires d’enregistrements comme concordances lorsque les variables de couplage sont généralement en accord et comme non-concordances dans le cas contraire. Aucun poids n’est attribué à la force de la concordance.
Un échantillon aléatoire de doublons potentiels a été sélectionné à partir de la liste créée à l’aide des couplages, et les paires ont été vérifiées manuellement en comparant les caractéristiques démographiques ainsi que les noms afin de repérer les véritables cas de surdénombrement. Le surdénombrement de la population a été estimé à partir de cet échantillon.