Rapport technique sur la couverture, Recensement de la population, 2021
7. Étude sur le sous‑dénombrement du recensement

L’objectif premier de l’Étude sur le sous‑dénombrement du recensement (ESoR) est d’estimer le nombre de personnes faisant partie de la population cible du Recensement de 2021 qui n’ont pas été dénombrées lors de celui-ci aux échelons national, provincial et territorial. Un échantillon de personnes a été tiré de six bases de sondage indépendantes du Recensement de 2021. Les données des personnes choisies (PC) ont été appariées aux données fiscales et autres sources administratives afin d’obtenir des renseignements récents au sujet de leur résidence habituelle, de leurs adresses de contact, des membres de leur ménage et des groupes de personnes qui leur sont liés.

Un ensemble d’appariements automatisés complexes et de recherches manuelles ont été effectués pour trouver la PC dans la base de données des réponses (BDR) du Recensement de 2021. Les études sur la couverture du recensement (ECR), dont l’ESoR, ont été réalisées d’après une version de la BDR rendue disponible à la mi-octobre 2021 (c’est-à-dire avant la fin du traitement du recensement). On nomme cette version la BDR-ECR, qui est antérieure à la BDR finale de 2021. Quelques différences mineures existent entre la BDR-ECR et les versions ultérieures des bases de données du recensement. La BDR-ECR, une base de données de personnes, comprend tous les enregistrements des personnes dénombrées, à l’exception de trois groupes d’enregistrements. Le premier concerne les enregistrements du recensement imputés dans le cadre des IME. Le deuxième se rapporte à tous les enregistrements du recensement qui ont été ajoutés tardivement, soit après le début du traitement de l’ESoR, mais cette situation ne s’est pas présentée en 2021 contrairement aux cycles précédents. Le troisième groupe concerne les enregistrements du recensement communément appelés « dénombrements incomplets ». La section 7.4.6 fournit de plus amples détails sur les dénombrements incomplets.

Lorsque la recherche est infructueuse, une collecte multimodale est entreprise en vue de déterminer si la PC fait partie de la population cible, et pour obtenir des renseignements supplémentaires (notamment des adresses) qui aideraient à trouver la PC dans la BDR-ECR. À la fin de la recherche, chaque PC est classée hors champ (décédée, émigrée ou temporairement à l’extérieur du Canada), dénombrée ou omise. Un petit nombre de cas de non-réponse, composé en grande partie de personnes qui n’ont pas pu être dépistées au moyen de la collecte, doivent être traités et servent à rajuster les poids des répondants à l’aide d’un modèle de rajustement de la non-réponse.

7.1 Échantillonnage

La base de sondage visant à couvrir la population cible de l’ESoR, qui inclut toutes les personnes qui auraient dû être dénombrées lors du Recensement de 2021, est formée à partir de six bases indépendantes du Recensement de 2021. Les cinq premières sont utilisées pour la sélection d’un échantillon servant à l’estimation du sous‑dénombrement dans les dix provinces, tandis que les estimations pour les trois territoires sont calculées à l’aide des échantillons tirés de la dernière base de sondage seulement.

À l’échelon provincial, on commence par les personnes qui faisaient partie de la population cible du Recensement de 2016. Celles-ci comprennent toutes les personnes dénombrées au Recensement de 2016 et les personnes omises au Recensement de 2016, représentées par la portion de l’échantillon de PC de l’ESoR de 2016 qui ont été classées comme omises. Afin de tenir compte des personnes qui se sont ajoutées à la population cible depuis le recensement précédent, on ajoute les naissances et les immigrants intercensitaires (c.-à-d. entre les recensements de 2016 et de 2021) et les résidents non permanents en date du jour du Recensement de 2021. Les sources de données de ces bases de sondage sont les suivantes :

  • Base du recensement : Personnes dénombrées lors du Recensement de 2016 et apparaissant dans la BDR-ECR de 2016.
  • Base des personnes omises : Il n’existe pas de liste exhaustive des personnes omises. Toutefois, il existe un échantillon représentatif de ces personnes; il s’agit de l’échantillon de PC de l’ESoR de 2016 classées comme omises. Elles sont toutes incluses dans l’échantillon de 2016 avec leur poids de 2016.
  • Base des naissances : Données des statistiques de l’état civil sur les naissances intercensitaires. Comme le fichier final des statistiques de l’état civil sur les naissances n’est disponible que tardivement, l’échantillon des naissances de l’ESoR est tiré d’un mélange de fichiers préliminaires et finaux ainsi que de données brutes des statistiques de l’état civil.
  • Base des immigrants : Données administratives provenant d’Immigration, Réfugiés et Citoyenneté Canada (IRCC) au sujet des immigrants arrivés au Canada pendant la période intercensitaire.
  • Base des résidents non permanents : Données administratives provenant d’IRCC sur les personnes qui demandent le statut de réfugié en date du jour du recensement et sur celles qui ont obtenu un permis de travail ou d’études au Canada qui est valide le jour du recensement.

Pour chacun des territoires, les fichiers de l’assurance maladie comprenant les personnes admissibles aux soins de santé le jour du recensement forment la base de sondage principale. Bien que cette base ait une excellente couverture, cette dernière n’est pas complète et un ajustement doit par conséquent être effectué aux poids d’échantillonnage. Chaque base de sondage d’un territoire donné est indépendante des autres bases des territoires et ne sert qu’à faire l’estimation du sous‑dénombrement de ce territoire en particulier. De même, les bases de sondage des territoires ne servent pas à l’estimation du sous‑dénombrement dans les provinces. Dans le cadre de l’ESoR de 2021, les résidents non permanents dans les territoires qui avaient un permis de travail ou d’études et qui n’étaient pas déjà pris en compte dans les fichiers d’assurance maladie ont été ajoutés aux bases des territoires.

Aucune des cinq premières bases de sondage des provinces ne comprend les personnes émigrées ou à l’extérieur du Canada lors du Recensement de 2016 qui n’ont pas rempli de questionnaire du recensement en 2016 et qui sont revenues durant la période intercensitaire (« Canadiens de retour dans une province »). Selon le questionnaire détaillé du Recensement de 2021, on estime cette population à 252 089 personnes. De même, on estime à 13 426 le nombre de personnes de retour des territoires dans les provinces. À ce nombre s’ajoutent 120 personnes venant d’une réserve ou d’un établissement partiellement dénombré en 2016 et dénombré en 2021, puis 8 489 personnes venant des réserves ou des établissements de retour en 2016 et dénombrées en 2021, mais exclues de la base du Recensement de 2016. De plus, les personnes nées après le Recensement de 2016 à l’extérieur du pays ou dans les territoires qui ont la citoyenneté canadienne et qui sont revenues dans une des 10 provinces du Canada au jour du Recensement de 2021 ne sont pas prises en compte dans les cinq premières bases de sondage de l’ESoR. Selon le questionnaire détaillé du Recensement de 2021, on estime cette population à 16 925 personnes. Les estimations de l’erreur de couverture ne comprennent donc pas ces populations estimées à un total de 291 049 personnes.

Un problème qui se pose en raison de l’utilisation des bases de sondage multiples est la possibilité qu’une même personne soit incluse dans plus d’une base. Par exemple, une personne comprise dans la base des immigrants pouvait être titulaire d’un permis de travail et se trouver au Canada en mai 2016, et ainsi être dénombrable dans le cadre du Recensement de 2016. Elle serait donc à la fois dans la base des immigrants et dans celle du recensement si elle a été dénombrée, ou dans celle des personnes omises si elle a été omise. Ainsi, il est important de déterminer tous les cas de chevauchement des bases, sinon les estimations produites risquent d’être trop élevées puisque les personnes peuvent être comptées deux fois dans les bases de sondage. Autant que possible, ce chevauchement est décelé au moment de la création des bases de sondage, mais une partie est également cernée plus tard à partir des renseignements fournis par les répondants.

Le plan d’échantillonnage varie d’une base à l’autre selon la nature de la liste utilisée. Pour la base du Recensement de 2016, on a utilisé un plan stratifié à un seul degré. La méthodologie de stratification a été modifiée considérablement lors de l’ESoR de 2021. Avant d’effectuer la stratification, plusieurs couplages déterministes ont été effectués. D’abord, il y a eu un couplage de la base avec les données fiscales, et plus de 96 % des personnes ont été liées. Ensuite, il y a eu un couplage avec les fichiers de mortalité des statistiques de l’état civil. Il y a également eu un couplage avec les fichiers d’IRCC afin de trouver les résidents non permanents dans la base. Enfin, il y a eu un couplage avec la BDR de 2021 à l’aide du processus de méga-appariement qui est aussi utilisé pour le traitement de l’échantillon de l’ESoR. Ce processus fournit des suggestions de dénombrement potentiel, et un indicateur de la force de cette suggestion. Certaines suggestions sont assez fortes pour qu’on considère la personne dénombrée sans avoir besoin de vérifier la suggestion. On appelle ces cas des autodénombrements. À la suite de ces couplages, la stratification de la base a été effectuée. Deux strates à tirage complet ont été créées : la strate des personnes décédées et la strate des personnes autodénombrées. Ensuite, six strates à tirage partiel ont été créées en tenant compte de la probabilité de dénombrement des personnes (force de la suggestion dans la BDR de 2021), de la situation fiscale et de la probabilité d’être hors cible au recensement. Cependant, les personnes dénombrées dans les réserves et les établissements lors du Recensement de 2016 forment des strates séparées en utilisant les mêmes critères, mais en regroupant certaines strates étant donné que la population est plus petite et plus homogène.

Ensuite, les strates à tirage partiel ont été stratifiées par province. Pour les personnes demeurant dans les six plus petites provinces en 2016, la province de stratification correspondait à la province de résidence en 2016 (dans la BDR de 2016). Pour les personnes dans les quatre plus grandes provinces en 2016, la dérivation de la province de stratification variait selon la strate. Dans les strates à fortes probabilités de dénombrement dans la BDR en 2021, la province de dénombrement potentiel dans la BDR de 2021 a été utilisée. Sinon, dans le cas où la personne était liée aux données fiscales, c’est la province de résidence la plus récente selon ces données qui a été utilisée. En dernier recours, c’est la province figurant dans la BDR de 2016 qui a été utilisée.

La base des personnes omises est une base échantillonnale, car il n’existe pas de liste de toutes les personnes omises lors du Recensement de 2016. L’échantillon de cette base est constitué de tous les cas classés comme « omis » dans le cadre de l’ESoR de 2016. Quoique l’échantillon ne soit pas stratifié comme tel, une stratification implicite est inévitable puisque les cas omis en 2016 proviennent de bases et de strates différentes.

Pour créer la base de sondage des naissances, on a obtenu une copie des enregistrements de naissances intercensitaires des statistiques de l’état civil par l’intermédiaire du Système national d’acheminement, qui permet d’avoir accès à ces données plus rapidement. La base contient toutes les naissances entre le 10 mai 2016 et le 10 mai 2021 inclusivement. La base a ensuite été stratifiée selon la province de résidence de la mère, ou selon la province de naissance si cette donnée n’était pas disponible.

On a créé la base de sondage des immigrants à partir des dossiers d’IRCC. La base des immigrants contient toutes les personnes immigrées au pays entre le 10 mai 2016 et le 10 mai 2021 inclusivement. On a soustrait de la base des immigrants de 2016 ceux qui étaient résidents non permanents au jour du Recensement de 2016, ceux-ci étant déjà compris dans la base du Recensement de 2016 ou la base des personnes omises de 2016. La base des immigrants a été stratifiée par province. La province a été dérivée selon les renseignements disponibles dans un fichier d’adresses fourni par IRCC et dans le fichier d’immigration d’IRCC. La province de résidence la plus probable au jour du Recensement de 2021 a été retenue. Ensuite, les immigrants de toutes les provinces ont été séparés en deux strates selon leur date d’immigration. Les immigrants arrivés entre le 10 mai 2016 et le 30 avril 2020 ont formé la première strate, tandis que ceux arrivés entre le 1er mai 2020 et le 10 mai 2021 ont formé la seconde strate, ce qui s’explique par le fait que les immigrants arrivés depuis moins longtemps ont habituellement un taux d’omission plus élevé au recensement.

La base des résidents non permanents (titulaires d’un permis de travail ou d’études et demandeurs du statut de réfugié) a été créée à partir des dossiers d’IRCC. Les résidents non permanents au jour du Recensement de 2016 et les immigrants intercensitaires ont été enlevés de la base des résidents non permanents de 2021. La base a été stratifiée par province, selon la province de résidence la plus probable au jour du Recensement de 2021. Pour ce faire, un couplage déterministe de la base a été effectué aux données fiscales. Le fichier d’adresses d’IRCC et les différents fichiers de résidents non permanents d’IRCC ont aussi été utilisés. À la fin du processus, un certain nombre de résidents non permanents n’avaient aucune province de résidence qui leur était associée (résidents ayant un permis ouvert); ceux-ci ont donc été placés dans une strate nationale.

Dans les provinces, la taille totale de l’échantillon de 2021 a été déterminée de façon à atteindre deux objectifs principaux. Premièrement, le budget de collecte de l’ESoR de 2021 devait demeurer le même que celui de l’ESoR de 2016 (mais ajusté en fonction des augmentations de coût à l’unité entre 2016 et 2021). Ce n’est qu’une partie des personnes dans l’échantillon qui nécessite une collecte, et les proportions varient selon les bases et les strates. Deuxièmement, l’ESoR visait à obtenir des erreurs-types du taux de sous‑dénombrement semblables entre les provinces de taille comparable. On visait des erreurs-types plus petites pour les plus grandes provinces que pour les petites provinces, car cela permettait d’obtenir une petite erreur-type à l’échelon national. Autant que possible, les erreurs-types ne devaient pas être plus élevées que celles obtenues en 2016.

Ainsi, à partir de 2020, en mettant constamment à jour les paramètres entrant dans le calcul de l’erreur-type du sous‑dénombrement et le calcul du nombre de personnes nécessitant une collecte, on a fait des simulations de tailles d’échantillons par base de sondage et strate afin d’obtenir les erreurs-types voulues à tous les niveaux (national, provincial, âge et genre). Les bases et les résultats de l’ESoR de 2016 ont servi à faire ces simulations. Étant donné que certaines bases de sondage étaient prêtes avant d’autres, les tailles d’échantillons ont été déterminées pour ces bases avant d’établir les tailles pour les autres bases et strates. Entre autres, la taille d’échantillon de la strate de la base des personnes omises en 2016 était déjà fixée, toutes les personnes considérées comme des personnes omises dans le cadre de l’ESoR de 2016 ayant été choisies. Ensuite, la taille de la première strate de la base des immigrants a été déterminée à l’été 2020, et ainsi de suite pour les autres strates et bases (naissances et résidents non permanents). La répartition de l’échantillon a été achevée en novembre 2021 avec la stratification de la base du Recensement de 2016 comme décrite ci-dessus.

Dans plusieurs strates, une taille totale était déterminée pour l’ensemble des dix provinces, puis une répartition par la méthode de puissance a été utilisée afin de répartir l’échantillon total dans les provinces. Des tailles d’échantillons minimales étaient aussi fixées dans les plus petites provinces.

De plus, pour certaines strates de la base du recensement, une sous-stratification par sexe et groupe d’âge a été effectuée afin de s’assurer d’avoir un nombre suffisant de personnes omises à l’échelle de ces domaines. De même, la répartition de l’échantillon aux strates des réserves de la base du recensement a été effectuée de façon à obtenir une précision du sous‑dénombrement dans les réserves au moins aussi bonne qu’à l’ESoR de 2016. L’échantillon total final réparti était de 32 534 PC parmi les bases dans les provinces. Le tableau 7.1.1 présente la répartition finale de l’échantillon selon la strate pour toutes les provinces. Selon cette répartition de l’échantillon, à l’échelle provinciale, les erreurs-types visées pour le taux de sous‑dénombrement variaient entre 0,16 % et 0,42 %, et pour l’ensemble des provinces, de 0,09 %. Il convient de souligner que la répartition résultante ne garantit pas que ce niveau de précision sera nécessairement obtenu étant donné que des hypothèses ont été avancées à propos de plusieurs paramètres entrant dans le calcul de l’erreur-type du sous‑dénombrement (tailles des strates et bases, taux de personnes omises, taux de réponse à la collecte de l’ESoR, etc.). De plus, les effets de la pandémie de COVID-19 ont pu affecter la justesse de ces hypothèses, notamment en ce qui concerne le nombre d’immigrants et de résidents non permanents, la migration interprovinciale et les taux d’omission au Recensement de 2021.

Tableau 7.1.1
Répartition de l’échantillon, bases de sondage et strates pour toutes les provinces Sommaire du tableau
Le tableau montre les résultats de Répartition de l’échantillon, bases de sondage et strates pour toutes les provinces. Les données sont présentées selon Base de sondage (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
Base de sondage Strate pour chaque province Nombre de personnes
Note ...

n'ayant pas lieu de figurer

TP = tirage partiel
Source : Statistique Canada, Étude sur le sous-dénombrement du Recensement de 2021.
Total du tirage complet ... n'ayant pas lieu de figurer 26 944 027
Recensement de 2016 Décédé 1 239 662
Auto-dénombré dans une province 25 704 365
Total du tirage partiel ... n'ayant pas lieu de figurer 32 534
Recensement de 2016 Hors réserve TP_1 : fortes suggestions de dénombrement 5 559
Hors réserve TP_2 : fortes suggestions de dénombrement incomplet 369
Hors réserve TP_3 : probabilité élevée d’être hors champ 510
Hors réserve TP_4 : suggestions modérées de dénombrement 757
Hors réserve TP_5 : probabilité élevée d'être omise 5 041
Hors réserve TP_6 : autres 1 712
Dans une réserve TP_7 : suggestions fortes ou modérées de dénombrement 270
Dans une réserve TP_8 : probabilité élevée d'être omise 505
Dans une réserve TP_9 : autres 200
Dans une réserve TP_10 : Terre-Neuve-et-Labrador et Île-du-Prince-Édouard 60
Personnes omises de 2016 Aucune autre stratification 4 821
Naissances Aucune autre stratification 5 978
Immigrants Du 10 mai 2016 au 30 avril 2020 2 593
Du 1er mai 2020 au 10 mai 2021 588
Résidents non permanents Aucune autre stratification 3 571

La méthodologie d’échantillonnage pour les territoires était semblable à celle de la base du recensement pour les provinces. Les personnes comprises dans la base de sondage de chacun des territoires ont été appariées aux données fiscales et ensuite à la BDR de 2021, à l’aide du processus de méga-appariement qui est aussi utilisé pour le traitement de l’échantillon de l’ESoR (voir la section 7.2.1). À la suite de ces étapes, la stratification de la base a été effectuée en tenant compte de la force du couplage avec la BDR de 2021, de l’endroit du dénombrement et de l’activité fiscale récente. Une strate à tirage complet d’autodénombrements dans le territoire a été formée, et six strates à tirage partiel ont été formées (voir le tableau 7.1.2). Pour la première et la sixième strate, une sous-stratification par sexe et trois groupes d’âge (0 à 17 ans, 18 à 29 ans, 30 ans et plus) a été effectuée.

En ce qui concerne la répartition de l’échantillon pour les territoires, la première étape consistait à déterminer l’échantillon total à allouer à chaque territoire afin d’atteindre une précision semblable et adéquate du sous‑dénombrement. En 2021, l’erreur-type visée pour le taux de sous‑dénombrement était d’environ 0,40 % au Yukon et dans les Territoires du Nord-Ouest (une amélioration par rapport à 2016), et de 0,60 % au Nunavut (semblable à 2016). En utilisant les résultats de l’ESoR de 2016, des hypothèses de taux d’omission, de taux de dénombrement et autres ont été calculées pour chaque strate. Pour la première strate à tirage partiel, la taille d’échantillon a été fixée manuellement dans chaque territoire étant donné que cette strate avait très peu d’effet sur la précision du taux de sous‑dénombrement, mais plus d’incidence sur la précision du taux de dénombrement. Cela a une importance pour le calcul d’un facteur de calage au moment de la pondération. De plus, il fallait tenir compte du fardeau de travail des employés qui devaient vérifier l’échantillon de cette strate. De même, un échantillon a été fixé manuellement pour la quatrième strate, car elle représentait des personnes qui sont presque assurément hors cible, mais qui font l’objet d’un certain travail de recherche par les employés de l’ESoR. Ensuite, de façon itérative, on a effectué une répartition optimale de l’échantillon total entre les autres strates à tirage partiel, y compris les six sous-strates de la dernière strate. Une taille totale approximative a été fixée au départ, puis la précision de la répartition optimale était calculée, et cela a été répété en augmentant ou en diminuant la taille totale jusqu’à l’obtention de la précision voulue pour le taux de sous‑dénombrement dans chaque territoire. L’échantillon total final réparti était de 4 285 PC choisies parmi les bases dans les territoires.

Le tableau 7.1.2 présente la répartition selon la strate pour tous les territoires.

Tableau 7.1.2
Répartition de l’échantillon, strates selon le territoire Sommaire du tableau
Le tableau montre les résultats de Répartition de l’échantillon, strates selon le territoire. Les données sont présentées selon Strate (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
Strate Yukon Territoires du Nord-Ouest Nunavut Total
TP = tirage partiel
Source : Statistique Canada, Étude sur le sous-dénombrement du Recensement de 2021.
Tirage complet : auto-dénombré dans son territoire 27 881 26 696 16 981 71 558
Total du tirage partiel 1 156 1 331 1 798 4 285
TP_1 : fortes suggestions de dénombrement 530 440 468 1 438
TP_2 : suggestions modérées de dénombrement 57 196 356 609
TP_3 : fortes suggestions de dénombrement incomplet 30 30 44 104
TP_4 : fortes suggestions de dénombrement hors de son territoire 53 78 70 201
TP_5 : probabilité élevée d’être hors champ 97 83 96 276
TP_6 : probabilité élevée d'être omise (sous-stratification)
Femmes, 0 à 17 ans 30 59 158 247
Femmes, 18 à 29 ans 48 44 69 161
Femmes, 30 ans et plus 109 117 157 383
Hommes, 0 à 17 ans 33 61 132 226
Hommes, 18 à 29 ans 54 61 65 180
Hommes, 30 ans et plus 115 162 183 460

Le tableau 7.1.3 présente la répartition de l’échantillon pour le Canada, les provinces et les territoires.

Tableau 7.1.3
Taille de l’échantillon pour le Canada, les provinces et les territoires Sommaire du tableau
Le tableau montre les résultats de Taille de l’échantillon pour le Canada, les provinces et les territoires. Les données sont présentées selon Province ou territoire (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
Province ou territoire Strate à tirage complet (nombre de personnes) Strate à tirage partiel (nombre de personnes)
RNP-CA = résidents non permanents dont la province est inconnue
Source : Statistique Canada, Étude sur le sous-dénombrement du Recensement de 2021.
Canada 27 015 585 36 819
Toutes les provinces 26 944 027 32 534
Terre-Neuve-et-Labrador 393 554 1 551
Île-du-Prince-Édouard 106 063 1 437
Nouvelle-Écosse 696 275 1 943
Nouveau-Brunswick 579 964 1 680
Québec 6 668 208 4 298
Ontario 10 415 555 7 126
Manitoba 947 750 2 579
Saskatchewan 794 538 2 540
Alberta 2 940 437 4 215
Colombie-Britannique 3 401 683 5 015
RNP-CA 0 150
Tous les territoires 71 558 4 285
Yukon 27 881 1 156
Territoires du Nord-Ouest 26 696 1 331
Nunavut 16 981 1 798

Une méthode d’échantillonnage systématique à l’intérieur des strates a été utilisée pour sélectionner les échantillons. Voici la liste des variables de tri utilisées pour obtenir un échantillon efficace (stratification implicite), classées selon la base de sondage :

  • Base du Recensement de 2016 : sexe, âge, code MNote 1, géographie de 2016, situation fiscale, raison pour être potentiellement hors cible et province probable en 2021 (si stratifiée dans les six plus petites provinces);
  • Base des naissances : âge au jour du recensement, sexe, groupe d’âge de la mère et code postal;
  • Base des immigrants : groupe d’âge, sexe et pays de naissance;
  • Base des résidents non permanents : type de permis, groupe d’âge, sexe et pays de naissance;
  • Base des territoires : sexe, âge, code M, situation fiscale et municipalité de résidence.

Aucun échantillonnage n’était requis pour la base des personnes omises de 2016, car toutes les personnes omises de l’ESoR de 2016 ont été sélectionnées dans l’échantillon de l’ESoR de 2021.

Après la sélection des échantillons provinciaux et territoriaux, ceux-ci doivent être préparés en vérifiant la qualité des renseignements pour les différentes variables d’intérêt, soit les variables géographiques et démographiques. On procède, par exemple, à la vérification de la qualité des noms et à la validation des dates de naissance. Les adresses sont normalisées afin de faciliter les activités de traitement ultérieures. Afin de mettre à jour les renseignements géographiques, en particulier pour les échantillons du recensement et des personnes omises dont l’information date de 2016, ceux-ci sont appariés aux dossiers de l’Agence du revenu du Canada (ARC), dont ceux de l’impôt sur le revenu des particuliers de 2015 à 2021 et des prestations canadiennes pour enfants de 2016 à 2022. À l’aide des fichiers de l’ARC et des données des statistiques de l’état civil, on vérifie également si des personnes sélectionnées sont décédées. Cette étape de préparation est très importante, car elle aide à déterminer les personnes qui sont dénombrées dans les bases du recensement et à communiquer avec les personnes non trouvées en vue de les interviewer.

7.2 Traitement et classification

7.2.1 Traitement

L’objectif du traitement est de fournir des renseignements sur la classification des PC en vue de l’estimation et de l’ajustement pour la non-réponse. Ainsi, le traitement vise à :

  • déterminer si les PC sont dénombrées au sein de la BDR du recensement;
  • déterminer si les PC font partie de la population cible du recensement;
  • fournir davantage de renseignements sur l’ajustement pour la non-réponse.

Les résultats du traitement ont été enregistrés dans une classification attribuée à chaque PC aux fins d’estimation et de totalisation (voir la section 7.4 et la section 9).

La majeure partie du travail de traitement a fait intervenir une recherche informatisée automatisée dans la version des études sur la couverture du recensement de la BDR du Recensement de 2021 (BDR-ECR), afin de déterminer si la PC était dénombrée ou non.

Divers renseignements ont été utilisés pour cette recherche, notamment les noms et prénoms ainsi que les dates de naissance. Les numéros de téléphone et les adresses associés à la PC ou à des membres de son ménage ont également été utilisés. Des questionnaires où la personne aurait pu être dénombrée ont été relevés à partir de sources variées, notamment :

  • des appariements avec la BDR-ECR, en utilisant la date de naissance et le sexe de la PC et des membres de son ménage, ou le nom, le code postal ou le numéro de téléphone de la PC;
  • des adresses de sélection provenant de la base de sondage;
  • des mises à jour des adresses provenant de dossiers fiscaux;
  • des renseignements de l’interview téléphonique assistée par ordinateur (ITAO) [voir la section 7.3].

La première étape après la préparation de l’échantillon a été d’effectuer une recherche de chaque PC dans la BDR-ECR en traitant toutes les PC dont l’adresse figurait dans la base de sondage et les données fiscales. Deux résultats ont été obtenus. Lorsque les PC ont été trouvées, elles ont généralement été classées comme « dénombrées » et aucun autre traitement n’a été requis, à l’exception des PC identifiées ensuite, au moyen des données des statistiques de l’état civil, comme décédées avant le recensement. Les cas des PC non trouvées ont été envoyés pour faire l’objet d’une collecte. Pendant la collecte, la recherche dans la BDR-ECR s’est poursuivie. Lorsque les données de l’ITAO étaient disponibles, les chercheurs ont pu déterminer si chaque PC faisait ou non partie de la population cible du recensement. Dans l’affirmative, les données de l’ITAO permettaient parfois d’approfondir les recherches.

La recherche des PC a été menée à la fois automatiquement et manuellement par du personnel de codage dirigé par des spécialistes du domaine. Un manuel de procédures très détaillées indiquant les étapes précises de codage des résultats de recherche a été fourni au personnel de codage pour assurer l’uniformité du codage. Les recherches automatisées ont d’abord eu lieu. Un questionnaire du recensement existait pour les adresses obtenues grâce à une correspondance avec la BDR-ECR. On a calculé une mesure de similarité entre le questionnaire du recensement et les données disponibles pour l’enquête. Lorsque cette mesure dépassait un seuil préétabli, on concluait automatiquement que la PC avait été dénombrée à cette adresse. Dans ces cas, ni cette adresse ni les autres adresses de la PC n’avaient à être traitées par le personnel de codage. Des programmes informatiques ont également déterminé lorsqu’une adresse était un double d’une autre. Ces adresses en double n’avaient pas non plus à être traitées.

Pour d’autres cas, on a eu recours à un couplage manuel à l’aide de l’Application de vérification interactive de Doclink (AVID), application créée précisément pour cette opération. Le personnel de codage a utilisé, en outre, plusieurs outils dans le cadre de ce traitement, tels que des fichiers de référence géographique, des annuaires téléphoniques électroniques et le fichier des attributs des rues. Des questionnaires du recensement ou des unités de collecte du recensement suggérés correspondaient souvent à l’adresse utilisée à la première étape de la recherche. Le personnel pouvait également effectuer une recherche dans la BDR-ECR à l’aide de paramètres souples aux étapes ultérieures du traitement (recherche par nom, date de naissance, etc.). Les résultats de la recherche manuelle étaient alors modifiés manuellement par des corrections intégrées à l’AVID afin de limiter les erreurs. Un fichier comprenant les résultats de recherche a ensuite été produit. Les données de ce fichier ont été utilisées pour classer les PC.

7.2.2 Classification

Le traitement fournit les renseignements nécessaires en vue de déterminer si les PC sont :

  • incluses dans la « population cible du recensement » ou « hors champ » (non incluses);
  • « classifiées » ou « non classifiées »;
  • « listées » ou « non listées »;
  • « identifiables » ou « non identifiables »;
  • « dénombrées »;
  • « omises ».

Certaines PC figurent dans plus d’une catégorie. On en expliquera les raisons plus en détail dans cette section.

7.2.2.1 Classifications « population cible » ou « hors champ »

La « population cible du recensement » comprend le groupe de personnes mentionné à la section 2.2. Une PC est considérée « hors champ » si elle ne fait pas partie de la population cible du recensement. Chaque PC classée comme « hors champ » se voit attribuer l’un des états suivants pour cette classification : décédée, émigrée ou représentée par une autre base de sondage. Pour qu’une personne soit classée comme étant décédée, elle doit apparaître comme décédée dans au moins deux sources administratives (les fichiers de mortalité des statistiques de l’état civil, les fichiers d’impôts, les fichiers nécrologiques), ou sinon lors de l’interview de collecte de l’ESoR. Les émigrants permanents ou temporaires ont également été déterminés au moyen d’une interview de collecte en fonction de certains critères et des réponses fournies concernant leur lieu de résidence le jour du recensement, la période de temps passé à l’extérieur du Canada, leur intention de revenir vivre au pays et la raison pour laquelle ils étaient à l’extérieur du pays le jour du recensement. D’autres PC sont également classées comme « émigrées listées », qu’elles soient ou non des répondants lors de la collecte. Il s’agit des résidents non permanents (de la base des personnes omises et de la base du Recensement de 2016) qui n’avaient plus de permis de travail ou d’études en 2021 ni le statut d’immigrant depuis 2016.

Les PC classées comme « représentées par une autre base de sondage » comprennent notamment les cas sélectionnés dans une province, mais classés dans l’un des trois territoires. De même, les cas sélectionnés dans un territoire, mais classés dans une province ou un autre territoire, sont eux aussi classés comme « représentés par une autre base de sondage ».

Les PC classées dans la population cible du recensement sont soit « dénombrées », soit « omises », soit « non classifiées » (voir la section 7.2.2.2). Une PC est considérée comme « dénombrée » si elle figure dans la BDR-ECR. La classification « omises » est attribuée aux PC dans la population cible du recensement qui ne sont pas dénombrées ni « non classifiées ».

7.2.2.2 Classification pour la non-réponse et le rajustement de la non-réponse

L’attribution des classifications « listées » et « non classifiées » dépend de l’utilité des adresses fournies et des renseignements tirés de l’ITAO. Dans plusieurs cas, la collecte fournit des renseignements ainsi qu’une ou plusieurs adresses qui sont introuvables à partir d’autres sources. Dans d’autres cas, il est possible de trouver toutes les adresses et tous les renseignements obtenus au moyen de la collecte à partir d’autres sources.

Une PC est « listée » si elle a été classée sans le recours aux données provenant de l’ITAO; même si la collecte des données a été effectuée, les adresses et les renseignements obtenus au moyen de l’interview n’ont pas été requis.

Une personne est considérée comme « non classifiée » si l’on peut déterminer qu’elle fait partie de la population cible, mais qu’on ne peut déterminer si elle a été omise ou non. Cette situation survient lorsque le lieu de résidence le jour du recensement, tel que défini à la section 2.4, est connu, mais non déterminé dans la BDR-ECR. Les personnes dont le lieu de résidence le jour du recensement n’est pas assez précis (p. ex. si seul le nom d’une grande ville est fourni comme lieu de résidence le jour du recensement) et les personnes sans domicile fixe ont été incluses dans cette catégorie.

Les PC pour lesquelles il est impossible de déterminer une ou plusieurs des caractéristiques de la liste présentée plus haut sont considérées comme des non-répondants. Il existe trois types de non-répondants :

  • Une PC est « non identifiée » lorsqu’il est impossible de déterminer si elle est listée ou non. Autrement dit, comme les renseignements disponibles sur la PC sont incomplets, il est impossible de procéder ni à son appariement avec la BDR-ECR ni à la collecte de ses renseignements au moyen d’une interview.
  • Une PC est « non dépistée » lorsqu’il est impossible de déterminer si elle est incluse ou non dans la population cible du recensement.
  • Une PC « non classifiée » est considérée comme un cas de non-réponse partielle. En effet, on sait que la personne fait partie de la population cible, mais on ignore si elle est omise ou dénombrée.

7.2.2.3 Répartition de l’échantillon selon la classification

Le tableau 7.2 montre la répartition de l’échantillon selon la classification et la base de sondage. Ce tableau exclut les personnes dans les strates à tirage complet étant donné que ces personnes ont été classées (dénombrées ou décédées) avant la sélection de l’échantillon. La classification est déterminée à partir de combinaisons précises des caractéristiques de la liste présentée plus haut. Au départ, un échantillon total de 36 819 PC a été sélectionné dans les provinces et les territoires. De ce nombre, 22 083 PC ont été classées comme « dénombrées », 7 453, comme « omises » et 5 171, comme des non-répondants, dont 169 ayant été classées comme « non classifiées ». Les 2 112 autres PC ont été classées comme « hors champ », dont 583 personnes « décédées », 938 « émigrants » (permanents ou temporaires), 405 personnes hors de l’univers des territoires ou hors de l’univers des provinces, et 186 personnes, pour d’autres raisons. Un rajustement de la non-réponse a été effectué lors du processus d’estimation (voir la section 7.4). Il est important de noter qu’aux fins de la classification et, par conséquent, de l’estimation, la définition d’un non-répondant diffère de la définition habituelle d’un non-répondant, selon laquelle la collecte de données est tentée, mais non terminée. Il en est ainsi parce que pour procéder à la classification, on utilise des données provenant de plusieurs sources, dont la collecte. Afin d’éviter toute confusion, la section 7.3 portant sur la collecte fait référence à la « collecte terminée » plutôt qu’à la « réponse ».

7.2.2.4 Implications de la classification

Les PC « dépistées » sont les PC pour lesquelles il est possible de déterminer si elles sont incluses dans la population cible du recensement ou non. Aux fins d’estimation et de totalisation, les PC dépistées qui sont également classifiées sont les répondants. Puisque les noms, y compris ceux des membres du ménage, et les adresses sont disponibles dans la BDR-ECR, et que les outils pour consulter la base de données sont suffisamment puissants, il est possible de vérifier si une PC est dénombrée à une adresse, même si l’adresse fournie est vague.

L’utilité de savoir si une PC est dénombrée va de soi. Les PC qui font partie de la population cible du recensement et qui ne sont pas dénombrées, et donc classées comme « omises », sont la base de l’estimation du sous‑dénombrement. On voulait également classer les PC en se fondant sur les caractéristiques mentionnées précédemment afin de choisir les répondants les plus appropriés pour représenter les non-répondants.

Enfin, sauf pour les PC non classifiées, on a aussi déterminé l’adresse au jour du recensement (lieu habituel de résidence) de chaque PC dans la population cible du recensement. Cette adresse représente celle où, selon les directives relatives au recensement, la PC devrait avoir été dénombrée. Si la PC a été dénombrée, l’adresse du dénombrement sera considérée comme l’adresse au jour du recensement, en dépit d’autres renseignements fournis qui pourraient laisser croire que les directives relatives au recensement n’ont pas été bien comprises.

Pour obtenir de plus amples renseignements sur le traitement et la classification, veuillez consulter Parenteau (2023).

Tableau 7.2
Classification des personnes choisies, bases de sondage pour le Canada Sommaire du tableau
Le tableau montre les résultats de Classification des personnes choisies, bases de sondage pour le Canada. Les données sont présentées selon Classification (titres de rangée) et Recensement de 20161, Total, Naissances, Résidents non permanents, Bases de sondage territoriales1, Personnes omises de 2016, Immigrants, Strate provinciale et Strate territoriale, calculées selon % et nombre unités de mesure (figurant comme en-tête de colonne).
Classification Strate provinciale Strate territoriale Total
Recensement de 2016Tableau 7.2 Note 1 Personnes omises de 2016 Naissances Immigrants Résidents non permanents Bases de sondage territorialesTableau 7.2 Note 1
nombre % nombre % nombre % nombre % nombre % nombre % nombre %
Note 1

Excluant les strates à tirage complet.

Retour à la référence de note 1 referrer

Source : Statistique Canada, Étude sur le sous-dénombrement du Recensement de 2021.
Total 14 983 100,0 4 821 100,0 5 978 100,0 3 181 100,0 3 571 100,0 4 285 100,0 36 819 100,0
Dénombrées 7 354 49,1 3 122 64,8 5 210 87,2 2 610 82,0 2 015 56,4 1 772 41,4 22 083 60,0
Listées 7 201 48,1 3 112 64,6 5 206 87,1 2 604 81,9 1 997 55,9 1 760 41,1 21 880 59,4
Non listées 153 1,0 10 0,2 4 0,1 6 0,2 18 0,5 12 0,3 203 0,6
Omises 4 156 27,7 710 14,7 432 7,2 284 8,9 630 17,6 1 241 29,0 7 453 20,2
Listées 821 5,5 86 1,8 68 1,1 22 0,7 49 1,4 238 5,6 1 284 3,5
Non listées 3 335 22,3 624 12,9 364 6,1 262 8,2 581 16,3 1 003 23,4 6 169 16,8
Hors champ 882 5,9 433 9,0 102 1,7 100 3,1 188 5,3 407 9,5 2 112 5,7
Listées 505 3,4 327 6,8 79 1,3 10 0,3 104 2,9 293 6,8 1 318 3,6
Non listées 377 2,5 106 2,2 23 0,4 90 2,8 84 2,4 114 2,7 794 2,2
Non-réponse 2 591 17,3 556 11,5 234 3,9 187 5,9 738 20,7 865 20,2 5 171 14,0
Dépistées, non classifiées 87 0,6 17 0,4 17 0,3 2 0,1 10 0,3 36 0,8 169 0,5
Identifiées, non dépistées 2 492 16,6 539 11,2 217 3,6 185 5,8 728 20,4 829 19,3 4 990 13,6
Non identifiées 12 0,1 0 0,0 0 0,0 0 0,0 0 0,0 0 0,0 12 0,0

7.3 Collecte

7.3.1 Aperçu

Le personnel du bureau central d’Ottawa a travaillé étroitement avec le personnel des bureaux régionaux (BR) de Statistique Canada pour recueillir les données à l’étape de l’Étude sur le sous‑dénombrement du recensement (ESoR) de l’enquête. Les suggestions et recommandations formulées par les BR après l’ESoR de 2016 ont été prises en considération aux fins de la conception et du déroulement de l’enquête de 2021.

Le but principal de l’ESoR est de trouver (retracer) les personnes choisies (PC) pertinentes et d’en recueillir les données démographiques et les coordonnées, afin de pouvoir les classer comme dénombrées, omises ou hors du champ d’observation pour le recensement. Les résultats de cette classification sont utilisés pour estimer le nombre de personnes ayant été omises, ou sous-dénombrées, dans le recensement. Pour aider à trouver et classer les PC, l’adresse le jour du recensement et la composition du ménage ont été recueillies, ainsi que toute autre adresse à laquelle la PC peut avoir été dénombrée. D’autres renseignements, comme la langue maternelle de la PC, ont également été recueillis pour les tableaux de l’étude sur la couverture.

La taille de l’échantillon du tirage partiel de l’ESoR était de 36 819 (la section 7.1 décrit le plan de sondage). Au cours du traitement de précollecte, on a tenté de trouver ces cas dans la BDR-ECR, dans les statistiques de l’état civil et dans d’autres fichiers administratifs. Les cas correspondants ou trouvés dans ces fichiers, et pouvant donc être classés comme dénombrés ou décédés avant le jour du recensement, n’ont pas été envoyés à la collecte. Tous les autres cas non classés ont été envoyés à la collecte. Le nombre total de cas envoyés à la collecte (la taille de l’échantillon de la collecte) a été de 13 096. Au cours de la période de collecte, l’équipe de traitement a continué d’essayer de faire correspondre certains des cas; ceux pouvant être classés ont été retirés de la collecte (voir le tableau 7.3.2 pour connaître ces chiffres).

Par définition, la collecte avait lieu par répondant substitut pour les PC âgées de moins de 18 ans. On a aussi eu recours à des répondants substituts lorsque la PC n’était pas disponible pendant la période de collecte ou lorsqu’elle était difficile à joindre. Globalement, 34 % des cas traités l’ont été par répondant substitut et le pourcentage de cas par répondant substitut complétés par des intervieweurs a été supérieur à celui des cas effectués par autodéclaration.

Dans le cas des PC décédées, il était important d’établir si cette personne était décédée avant, après ou le jour du recensement, puisque différents cheminements de questionnaire étaient alors utilisés, selon la date du décès. Dans certains cas, il a été déterminé avant la collecte que la PC était décédée avant le jour du recensement (p. ex. en faisant correspondre des dossiers fiscaux et des statistiques de l’état civil). Ces cas n’ont alors pas été envoyés à la collecte. Cependant, en cas de doute, le cas était envoyé avec une note signalant que la PC était peut-être décédée.

Il était impératif que la PC pertinente (ou un répondant substitut pour cette personne) soit interrogée. En cas de collecte de données sur la mauvaise personne, la classification correspondante obtenue serait incorrecte. Le système d’interview téléphonique assistée par ordinateur (ITAO) a été conçu pour indiquer aux intervieweurs de vérifier que la personne interrogée était la PC pertinente au début de l’interview. En cas d’interview effectuée avec une autre personne que la PC (p. ex. personne au nom et à la date de naissance similaires), le cas était retourné à la collecte pour être effectué auprès de la personne pertinente.

L’ESoR est une enquête plurimodale obligatoire. Le mode principal de collecte de données est l’ITAO; le mode secondaire est l’autodénombrement. Pour 2021, l’ESoR a eu recours à des questionnaires électroniques en ligne pour les deux modes, puisqu’elle est passée au Système intégré de collecte et des opérations (SICO), qui est une application de collecte normalisée développée à Statistique Canada. Auparavant, le mode d’autodéclaration de l’ESoR avait recours à des questionnaires papier. La transition vers un questionnaire électronique a constitué une grande amélioration, puisqu’elle a réduit le fardeau du répondant ainsi que le temps d’opération et les coûts associés à l’envoi des questionnaires papier par la poste et la saisie manuelle des données retournées.

Le troisième mode de collecte a été des visites en personne par des intervieweurs sur le terrain. Le plan pour l’ESoR de 2021 était de continuer à avoir recours à des interviews sur le terrain pour une portée limitée, comme pour les cycles précédents (pour l’ESoR de 2016, seul 0,5 % des cas ont été effectués par des intervieweurs sur le terrain), mais plutôt que d’utiliser des questionnaires papier comme par le passé, les intervieweurs sur le terrain utilisaient un ordinateur portatif et la même application que les intervieweurs travaillant par téléphone. Toutefois, toutes les interviews en personne ont été annulées à l’étape de la planification de la collecte, du fait de la pandémie de COVID-19.

7.3.2 Opérations

La collecte des données pour l’ESoR a commencé le 28 mars 2022 dans tous les bureaux régionaux. Le dernier jour de collecte active a été le 4 novembre 2022. Le tableau 7.3.2 présente la répartition des cas chargés dans le système ITAO à partir du bureau central au fil du temps. La majorité des cas ont été envoyés au début de la collecte, le 28 mars, et comprenaient les cas relatifs à des adultes de toutes les bases de sondage à l’exception du Nunavut. Le total corrigé représente le nombre de cas envoyés à la collecte, à l’exception des cas supprimés de la collecte.

Tableau 7.3.2
Nombre total de cas en collecte Sommaire du tableau
Le tableau montre les résultats de Nombre total de cas en collecte. Les données sont présentées selon Description (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
Description Nombre
Source : Statistique Canada, Étude sur le sous-dénombrement du Recensement de 2021.
Cas commencés le 28 mars 2022 : adultes dans toutes les bases de sondage sauf le Nunavut 9 922
Cas commencés le 27 avril 2022 : mineurs dans toutes les bases de sondage (y compris la majorité de la base de sondage des naissances) sauf le Nunavut 1 822
Cas commencés le 6 juin 2022 : base de sondage du Nunavut et cas restants de la base de sondage des naissances 1 352
Nombre total de cas envoyés 13 096
Cas abandonnés par le bureau central : la collecte n’est plus requise (classés lors du traitement comme étant dénombrés ou hors champ) 309
Nombre total ajusté 12 787

Des lettres de présentation expliquant l’ESoR et avisant la PC (ou le répondant substitut) qu’elle avait été sélectionnée pour répondre à l’enquête ont été envoyées pour tous les cas dont la collecte commençait en mars et avril et pour lesquels une adresse postale valide existait. Un numéro de téléphone a été fourni pour toute question, dans les cas où le répondant souhaitait communiquer avec le BR pour répondre à l’enquête par téléphone. Un code d’accès sécurisé ainsi qu’un lien vers le questionnaire d’autodéclaration ont également été fournis aux cas sans numéro de téléphone à joindre (nécessitant un dépistage). Aucune lettre de présentation n’a été envoyée pour les cas dont la collecte a commencé en juin; ces cas ont reçu une lettre de rappel en juillet. Ces lettres de rappel ont été envoyées à tous les cas n’étant pas encore traités vers la moitié de la collecte. Une deuxième lettre de rappel a été envoyée un mois plus tard. Toutes les lettres de rappel comprenaient un code d’accès sécurisé et un lien vers le questionnaire d’autodéclaration. Une nouveauté pour l’ESoR de 2021 est qu’à l’approche de la fin de la collecte, des courriels de rappel ont été envoyés pour tous les cas incomplets pour lesquels on disposait d’une adresse de courriel valide.

Près de la fin de la collecte, dans le cadre d’un effort visant à accroître les taux de réponse, les BR de Toronto et de l’Ouest ont commencé un processus similaire aux visites d’interview sur le terrain effectuées par le passé. Si l’adresse d’une PC se trouvait proche du lieu d’une visite effectuée par un intervieweur pour une autre enquête, cet intervieweur se rendait alors à cette adresse pour essayer d’y rencontrer la PC. S’il trouvait la PC ou confirmait qu’il s’agissait bien du lieu de résidence de la PC, il demandait un numéro de téléphone pour que le BR rappelle afin de terminer l’interview. S’il parvenait à parler avec la PC, il pouvait également lui fournir un code d’accès sécurisé pour remplir le questionnaire en ligne. En cas d’absence de la PC, l’intervieweur essayait de recueillir des coordonnées pouvant permettre le dépistage de la PC.

Une analyse de la qualité des données a été effectuée pour vérifier l’exhaustivité et l’exactitude de chaque cas. Les cas où des champs clés étaient restés vides ou renfermaient des données ambiguës, ou encore lorsque les données recueillies correspondaient à une autre personne que la PC, étaient réactivés et retournés à la collecte aux fins de suivi. Au total, 41 cas ont été réactivés dans le cadre de l’ESoR de 2021. Les cas passant avec succès l’analyse de qualité des données ont été compilés en lots aux fins de traitement, de la façon décrite à la section 7.2.1.

La gestion de la qualité des opérations de collecte comprenait une séance de formation virtuelle bidirectionnelle pour les gestionnaires de la collecte des données régionaux, qui, à leur tour, formaient ensuite les intervieweurs. Des réunions hebdomadaires entre le bureau central et les BR ont eu lieu pendant la collecte pour discuter de la progression et répondre aux problèmes qui survenaient. Un outil de communication fondé sur un système de billets a été utilisé pour centraliser et faciliter les communications entre le bureau central et les BR. Il permettait d’effectuer le suivi de toutes les questions ainsi que des problèmes et de veiller à une résolution rapide. Les gestionnaires des BR ont attribué des ressources à l’enquête tout en respectant les besoins des autres enquêtes réalisées dans leur région. Les efforts soutenus afin d’interviewer les personnes ayant initialement refusé de participer à l’enquête ont permis d’améliorer les taux de réponse.

Le bureau central a créé des rapports de gestion détaillés chaque jour et chaque semaine pour documenter les progrès de la collecte. Ces rapports présentaient le nombre de cas recueillis et les taux de réponse par province sélectionnée et base de sondage.

7.3.3 Dépistage

Dans le cadre de la préparation de l’échantillon, les cas ont été couplés aux données fiscales et à d’autres données administratives pour fournir des coordonnées à jour des PC et des membres de leur ménage. Dans certains cas, les données initiales de l’ITAO étaient désuètes ou incomplètes, si bien qu’un dépistage était nécessaire. Le dépistage est le processus de recherche des coordonnées d’une PC ou d’un répondant substitut; il s’agit d’un élément majeur de l’ESoR.

Ces indices ont été chargés dans l’application d’ITAO comme coordonnées de remplacement avant la collecte; d’autres indices ont été envoyés aux BR lorsqu’on en trouvait lors du traitement au cours de la période de collecte. Un plus grand nombre de fichiers de sources de dépistage ont été envoyés à la collecte pour l’ESoR de 2021 (29 fichiers, par rapport à 13 en 2016); l’amélioration du traitement signifiait que seuls de nouveaux numéros de téléphone et de nouvelles adresses étaient envoyés aux BR, sans duplication de sources antérieures.

Dans le cadre de l’ESoR, des ententes ont été conclues avec 11 provinces et territoires (dont 9 ont eu recours à des personnes réputées être employées) qui ont envoyé des informations de dépistage. Le bureau central a envoyé des fichiers contenant les noms de PC, qui ont été comparés à des dossiers de soins de santé et renvoyés avec les coordonnées mises à jour. Le recours à des personnes réputées être employées signifiait que le nom et la date de naissance de la PC pouvaient être fournis; facilitant la mise en correspondance entre les fichiers.

Au début de la collecte des données, seuls 2,1 % des cas présentaient des coordonnées insuffisantes et devaient faire l’objet d’un dépistage. Du fait de la qualité et de la quantité des sources de dépistage mis à disposition par le bureau central, des numéros de téléphone fournis par le bureau central ont été utilisés pour 90,6 % des cas traités. Un pourcentage supplémentaire de 8,6 % des cas traités a pu être contacté grâce à un nouveau numéro de téléphone fourni grâce aux efforts de dépistage des BR; enfin un pourcentage final de 0,8 % supplémentaire des cas ont été traités lorsque les répondants ont contacté le BR.

7.3.4 Statistiques de collecte

De nombreuses statistiques ont fait l’objet d’une surveillance tout au long de la période de collecte de données et ont été analysées après la fin de la collecte.

Le tableau 7.3.4.1 présente les taux d’achèvement provinciaux et territoriaux selon le mode de collecte. Sur les 7 702 cas traités, 87,6 % l’ont été par ITAO et 12,4 % par autodéclaration en ligne.

Tableau 7.3.4.1
Nombre de cas terminés et taux d’achèvement selon la méthode de collecte, Canada, provinces et territoires de sélection Sommaire du tableau
Le tableau montre les résultats de Nombre de cas terminés et taux d’achèvement selon la méthode de collecte, Canada, provinces et territoires de sélection. Les données sont présentées selon Province ou territoire (titres de rangée) et Intervieweur, Autodéclaration, Nombre de cas envoyés et Total, calculées selon nombre de cas terminés et taux d’achèvement (%) unités de mesure (figurant comme en-tête de colonne).
Province ou territoire Nombre de cas envoyés Intervieweur Autodéclaration Total
Nombre de cas terminés Taux d’achèvement (%) Nombre de cas terminés Taux d’achèvement (%) Nombre de cas terminés Taux d’achèvement (%)
RNP-CA = résidents non permanents dont la province est inconnue
Source : Statistique Canada, Étude sur le sous-dénombrement du Recensement de 2021.
Canada 12 787 6 745 52,7 957 7,5 7 702 60,2
Terre-Neuve-et-Labrador 503 291 57,9 33 6,6 324 64,4
Île-du-Prince-Édouard 487 278 57,1 52 10,7 330 67,8
Nouvelle-Écosse 620 374 60,3 37 6,0 411 66,3
Nouveau-Brunswick 522 286 54,8 34 6,5 320 61,3
Québec 1 315 769 58,5 93 7,1 862 65,6
Ontario 2 406 1 214 50,5 235 9,8 1 449 60,2
Manitoba 852 451 52,9 47 5,5 498 58,5
Saskatchewan 832 425 51,1 51 6,1 476 57,2
Alberta 1 375 703 51,1 100 7,3 803 58,4
Colombie-Britannique 1 746 828 47,4 152 8,7 980 56,1
Yukon 460 239 52,0 29 6,3 268 58,3
Territoires du Nord-Ouest 632 345 54,6 33 5,2 378 59,8
Nunavut 950 529 55,7 56 5,9 585 61,6
RNP-CA 87 13 14,9 5 5,7 18 20,7

Le tableau 7.3.4.2 présente les taux d’achèvement par base de sondage et mode de collecte. Conformément aux tendances historiques, la base des résidents non permanents a enregistré le taux d’achèvement le plus bas (49,4 %), puisque les PC de cette base de sondage tendent à être plus mobiles et à fournir moins des coordonnées, rendant le dépistage difficile.

Tableau 7.3.4.2
Nombre de cas terminés et taux d’achèvement selon la base de sondage et la méthode de collecte pour le Canada Sommaire du tableau
Le tableau montre les résultats de Nombre de cas terminés et taux d’achèvement selon la base de sondage et la méthode de collecte pour le Canada. Les données sont présentées selon Base de sondage (titres de rangée) et Intervieweur, Autodéclaration, Nombre de cas envoyés et Total, calculées selon nombre de cas terminés et taux d’achèvement (%) unités de mesure (figurant comme en-tête de colonne).
Base de sondage Nombre de cas envoyés Intervieweur Autodéclaration Total
Nombre de cas terminés Taux d’achèvement (%) Nombre de cas terminés Taux d’achèvement (%) Nombre de cas terminés Taux d’achèvement (%)
Source : Statistique Canada, Étude sur le sous-dénombrement du Recensement de 2021.
Total 12 787 6 745 52,7 957 7,5 7 702 60,2
Recensement de 2016 6 773 3 720 54,9 482 7,1 4 202 62,0
Personnes omises de 2016 1 310 691 52,7 84 6,4 775 59,2
Naissances 671 377 56,2 40 6,0 417 62,1
Immigrants 553 280 50,6 87 15,7 367 66,4
Résidents non permanents 1 438 564 39,2 146 10,2 710 49,4
Yukon 460 239 52,0 29 6,3 268 58,3
Territoire du Nord-Ouest 632 345 54,6 33 5,2 378 59,8
Nunavut 950 529 55,7 56 5,9 585 61,6

Le tableau 7.3.4.3 présente les taux d’achèvement par sexe et groupe d’âge. Les taux d’achèvement les plus bas ont été pour les personnes des deux sexes âgées de 20 à 44 ans; le taux le plus élevé correspondant à celui des femmes âgées de 45 ans et plus.

Tableau 7.3.4.3
Nombre de cas terminés et taux d’achèvement selon la méthode de collecte, le sexe et le groupe d’âge pour le Canada Sommaire du tableau
Le tableau montre les résultats de Nombre de cas terminés et taux d’achèvement selon la méthode de collecte, le sexe et le groupe d’âge pour le Canada. Les données sont présentées selon Sexe et groupe d’âge (titres de rangée) et Intervieweur, Autodéclaration, Nombre de cas envoyés et Total, calculées selon nombre de cas terminés et taux d’achèvement (%) unités de mesure (figurant comme en-tête de colonne).
Sexe et groupe d’âge Nombre de cas envoyés Intervieweur Autodéclaration Total
Nombre de cas terminés Taux d’achèvement (%) Nombre de cas terminés Taux d’achèvement (%) Nombre de cas terminés Taux d’achèvement (%)
Note : Ce tableau exclut quatre cas pour lesquels le sexe était inconnu.
Source : Statistique Canada, Étude sur le sous-dénombrement du Recensement de 2021.
Les deux sexes 12 783 6 745 52,8 957 7,5 7 702 60,3
0 à 19 ans 1 930 1 062 55,0 140 7,3 1 202 62,3
20 à 29 ans 2 420 1 198 49,5 169 7,0 1 367 56,5
30 à 44 ans 4 697 2 303 49,0 389 8,3 2 692 57,3
45 ans et plus 3 736 2 182 58,4 259 6,9 2 441 65,3
Hommes 6 952 3 609 51,9 496 7,1 4 105 59,0
0 à 19 ans 963 530 55,0 74 7,7 604 62,7
20 à 29 ans 1 273 623 48,9 99 7,8 722 56,7
30 à 44 ans 2 678 1 305 48,7 199 7,4 1 504 56,2
45 ans et plus 2 038 1 151 56,5 124 6,1 1 275 62,6
Femmes 5 831 3 136 53,8 461 7,9 3 597 61,7
0 à 19 ans 967 532 55,0 66 6,8 598 61,8
20 à 29 ans 1 147 575 50,1 70 6,1 645 56,2
30 à 44 ans 2 019 998 49,4 190 9,4 1 188 58,8
45 ans et plus 1 698 1 031 60,7 135 8,0 1 166 68,7

7.4 Estimation

L’estimation de l’ESoR s’est divisée en deux parties. D’abord, on a effectué la pondération des PC, puis on a calculé le sous‑dénombrement du recensement. La pondération est le processus comprenant la détermination des poids d’échantillonnage initiaux des PC ainsi que tous les ajustements subséquents effectués à ces poids initiaux menant à la création des poids finaux des PC. La pondération comprend plusieurs étapes, qui sont décrites aux sections 7.4.1 à 7.4.4. La méthodologie du calcul du sous‑dénombrement du recensement est décrite à la section 7.4.6.

7.4.1 Calcul du poids initial

Pour les PC de toutes les bases de sondage sauf la base des personnes omises de 2016, les poids initiaux ont été attribués en fonction de l’inverse des probabilités de sélection dans l’échantillon. Cependant, le poids initial d’une PC de la base des personnes omises de 2016 correspond au poids final qui lui a été attribué lors de l’ESoR de 2016 au moment où la PC a été classée comme « omise ».

7.4.2 Ajustements aux poids initiaux

Les poids des PC de la base du Recensement de 2016 qui ont été dénombrées plus d’une fois en 2016 ont pour leur part été rajustés à la baisse pour tenir compte du fait que ces personnes avaient plus d’une chance d’être sélectionnées.

Ensuite, un ajustement aux poids initiaux influents dans la base des personnes omises de 2016 a été effectué. L’objectif était de réduire l’effet des poids élevés et influents sur les estimations et les erreurs-types à l’aide d’un élagage de leurs poids initiaux. Quelques personnes parmi les 4 821 personnes de la base des personnes omises de 2016 avaient un poids initial très élevé. La méthode utilisée consistait à tronquer des poids à un multiplicateur de la médiane des poids dans chaque groupe d’élagage formé. Les groupes d’élagage ont été formés selon la province de sélection et cinq groupes d’âge. Une personne ayant un poids supérieur au seuil voyait son poids être réduit à cette valeur. Les poids tronqués ont été redistribués uniformément aux autres personnes dans le groupe d’élagage.

7.4.3 Rajustement de la non-réponse

Pour réduire les biais statistiques, les poids initiaux des répondants devaient être rajustés pour tenir compte de la non-réponse. Le poids des personnes pour lesquelles une classification n’a pu être établie (les non-répondants) a été redistribué parmi les personnes pour lesquelles une classification a été établie (les répondants). Il existe trois types de non-réponse. Il y a d’abord les personnes non identifiées (seulement 12 PC). Les poids initiaux de ces personnes ont été transférés aux personnes identifiées dans chaque strate d’échantillonnage.

Le deuxième type de non-réponse concerne les personnes non dépistées (4 990 PC). L’ajustement consistait à former des groupes homogènes de réponse (GHR) parmi les personnes non listées (les personnes listées étant les personnes classifiées sans l’aide de la collecte de l’ESoR) et à transférer les poids des personnes non dépistées aux personnes dépistées non listées à l’intérieur des GHR.

La première étape de la création des GHR consistait à rassembler les personnes non listées (12 337 PC) en groupes principaux d’après leur propension estimée à être dans la population cible. Les groupes ont été formés en fonction de l’analyse de la corrélation entre plusieurs indicateurs fiscaux, notamment ceux pour 2020 et 2021, et la classification finale des personnes dépistées non listées. Jusqu’à sept groupes principaux ont été créés selon la base de sondage. Ces groupes principaux étaient aussi fortement corrélés à la propension à répondre. La deuxième étape de la création des GHR consistait à grouper les personnes non listées selon leur propension à répondre dans chacun des domaines, où un domaine est défini par le croisement d’une base de sondage avec un groupe principal. Dans chaque domaine, l’analyse de la propension à répondre a été faite au moyen d’un modèle de régression logistique à l’échelle nationale (ainsi qu’à l’échelle régionale, si les données le permettaient) et de l’analyse de tableaux de fréquences croisées à plusieurs niveaux. Dans le cas des modèles, plusieurs variables auxiliaires disponibles tant pour les personnes dépistées que non dépistées ont été utilisées, à savoir les variables disponibles dans les bases de sondage (p. ex. âge, sexe, relation avec les autres membres du ménage, pays d’origine, identité autochtone et type de résident non permanent), les variables disponibles dans les données fiscales pour les personnes liées (p. ex. présence ou non dans certains fichiers, fréquence des changements d’adresses depuis 2016 et type d’adresse), les variables reliées aux renseignements relatifs aux coordonnées (p. ex. nombre et sources de numéros de téléphone, disponibilité d’une adresse et lien de la dernière adresse connue avec le Recensement de 2021) et quelques autres variables. Ainsi, les variables auxiliaires significativement corrélées avec la propension à répondre ont été déterminées et utilisées pour former les GHR. Dans la plupart des domaines, les GHR ont été formés à l’intérieur de la province ou du territoire de sélection. L’ajustement consistait donc à transférer le poids des personnes non dépistées aux personnes dépistées non listées à l’intérieur de chaque GHR.

Le troisième ajustement pour la non-réponse est celui des personnes non classifiées (169 PC). Une personne non classifiée est une personne qui avait sa résidence principale dans une province ou un territoire donné le jour du recensement (qui faisait donc partie de la population cible du recensement), mais dont on ne sait pas avec certitude si elle avait été omise ou dénombrée. Suivant le même principe que pour les personnes non dépistées, des groupes homogènes de personnes classifiées ont été formés à l’intérieur de chaque base de sondage et province de classification. L’ajustement consistait à transférer le poids des personnes non classifiées aux personnes classifiées non listées à l’intérieur de chaque groupe homogène.

7.4.4 Ajustements finaux aux poids des personnes classées

7.4.4.1 Ajustement pour les poids influents

À cette étape, certaines PC ont un poids qui est élevé et considéré comme influent dans leur province de classification. Afin de réduire l’effet des poids élevés et influents sur les estimations provinciales et leurs erreurs-types, un ajustement aux poids influents a été effectué dans les cinq bases des provinces. La méthode utilisée est l’élagage des poids à un multiplicateur de la médiane des poids dans chaque groupe d’élagage formé. Il y a deux types de poids influents à cette étape.

D’abord, il y a les PC dont la province de classification est différente de la province de sélection. Donc, le poids est très élevé par rapport aux autres PC dans cette province de classification. Prenons, par exemple, une PC sélectionnée en Ontario ayant un grand poids, qui est classée à l’Île-du-Prince-Édouard. Dans cette situation, le poids est tronqué selon le seuil établi par groupe d’élagage. Un facteur entre quatre et six fois la médiane pour chacun des groupes a été utilisé comme seuil d’élagage. Les groupes d’élagage ont été formés selon la province de classification et cinq groupes d’âge. Les poids tronqués d’une PC ont été redistribués uniformément aux autres PC dans la même province de sélection, la même base de sondage, la même classification (personne dénombrée, omise ou hors cible), le même état (listée ou non listée) et par groupe d’âge. Ainsi, le poids influent d’une PC omise dans une province de classification donnée était réparti à d’autres personnes omises, mais dans la province de sélection de la PC. Pour ce premier type de poids influents, il y a eu 49 PC dont le poids a été tronqué, soit 33 personnes dénombrées et 16 personnes omises.

Le deuxième type de poids influents concerne les PC de la base des personnes omises de 2016 seulement, qui avaient encore un poids élevé et influent à l’intérieur de leur province de classification même si celle-ci était identique à la province de sélection (qui est, en fait, la province de classification en 2016). Pour ce type de poids influents, le seuil a été fixé à quatre fois la médiane des poids dans le groupe d’élagage. Les poids tronqués des PC ont été redistribués uniformément aux autres PC dans la même province de classification et la même classification, ce qui n’a donc pas d’effet sur l’estimation du sous‑dénombrement provincial. Pour ce deuxième type de poids influents, il y a eu 95 PC dont le poids a été tronqué, soit 10 personnes dénombrées, 55 personnes omises et 30 personnes hors cible.

7.4.4.2 Calage des poids pour la base des naissances

Pour l’échantillon de la base des naissances, un calage aux personnes dénombrées a été effectué afin de tenir compte des cas où un échantillon provincial contiendrait trop ou trop peu de personnes dénombrées. Un couplage automatisé déterministe appliqué à la BDR-ECR de 2021 a permis de déterminer les totaux de contrôle par province pour le groupe de calage des personnes dénombrées. Puis, pour les autres personnes figurant dans la base, un couplage aux données fiscales a permis de déterminer leur province de résidence au jour du recensement (sinon, la province de sélection a été utilisée) afin de déterminer les totaux de contrôle par province pour le groupe de calage des personnes non dénombrées. En outre, des totaux de contrôle par année d’âge (0 à 4 ans) ont été calculés. Le calage a été effectué à l’aide d’une méthode de ratissage aux marges en utilisant les 20 totaux de contrôle décrits ci-dessus pour la première marge, de même que 5 groupes de calage selon l’âge comme deuxième marge. Pour ce faire, le Système généralisé d’estimation (G-Est) de Statistique Canada a été utilisé.

7.4.4.3 Calage des poids pour la base des immigrants

Pour l’échantillon de la base des immigrants, un calage au nombre de personnes dans certains groupes de calage a été effectué afin de tenir compte des cas où un échantillon provincial contiendrait trop ou trop peu de personnes dénombrées ou de personnes faisant partie des autres groupes. Un couplage automatisé déterministe appliqué à la BDR-ECR de 2021 a permis de déterminer les totaux de contrôle par province pour le groupe de calage des personnes dénombrées. Puis, pour les autres personnes figurant dans la base, un couplage aux données fiscales a permis de déterminer leur situation fiscale (active ou non) et leur province de résidence au jour du recensement (sinon, la province de sélection a été utilisée) afin de déterminer les totaux de contrôle par province pour les autres groupes de calage des personnes non dénombrées. Dans les quatre plus grandes provinces, trois totaux de contrôle ont été déterminés : pour les personnes dénombrées, pour les personnes ayant des activités fiscales récentes, et pour les autres personnes. Cependant, dans les six autres provinces, seulement deux totaux de contrôle ont été déterminés : pour les personnes dénombrées, et les autres personnes. Ainsi, 24 totaux de contrôle ont été formés. Une simple méthode de poststratification a alors été effectuée pour faire le calage de la base des immigrants.

7.4.4.4 Rajustement par poststratification pour les territoires

Après avoir rajusté les poids initiaux, on a observé que l’estimation de personnes dénombrées dans les territoires était habituellement inférieure au chiffre comparable du recensement. Cette situation est attribuable à un sous‑dénombrement de la population cible du recensement dans les fichiers d’assurance maladie. Pour pallier ce sous‑dénombrement, les poids des PC dans les territoires ont été rajustés afin que l’estimation du nombre de personnes dénombrées égale le chiffre comparable du recensement pour ce territoire. Les ajustements ont été effectués pour six groupes de calage (selon l’âge et le genre) dans chaque territoire.

7.4.4.5 Ajustement pour le chevauchement de bases ou de strates

Pour un petit nombre de PC dans les cinq bases des provinces, le poids n’est pas le poids final, car un autre ajustement doit être effectué pour tenir compte du chevauchement entre les bases de sondage ou, dans certains cas, du chevauchement entre les strates de la base du recensement (donc surdénombrement en 2016), mais qui a été relevé seulement à la suite de la collecte de l’ESoR de 2021. Pour ce qui est des quelques PC en chevauchement de bases, ce sont en majorité des PC de la base des immigrants ou de la base des résidents non permanents qui étaient finalement prises en compte dans la base du Recensement de 2016 (donc dénombrées en 2016). Cette information n’était pas connue au moment de la préparation de ces bases de sondage. Ainsi, un facteur d’ajustement a été calculé en tenant compte de la probabilité de sélection dans les deux bases de sondage.

7.4.5 Distribution pondérée selon la classification

Le tableau 7.4.5 présente la distribution pondérée des PC selon la classification et la base de sondage. Pour un rappel des définitions, veuillez consulter la section 7.2. Seules les PC trouvées dans la BDR-ECR ont été classées comme « dénombrées ». Les personnes de la population cible qui ne sont pas dans la BDR-ECR ont été classées comme « omises ». Les PC restantes ont été classées comme « hors champ » (p. ex. décédées ou émigrées).

Tableau 7.4.5
Classification pondérée des personnes choisies, bases de sondage pour le Canada Sommaire du tableau
Le tableau montre les résultats de Classification pondérée des personnes choisies, bases de sondage pour le Canada. Les données sont présentées selon Classification (titres de rangée) et Résidents non permanents , Strate territoriale, Bases de sondage territoriales, Total, Naissances, Personnes omises de 2016, Immigrants, Strate provinciale et Recensement de 2016, calculées selon nombre et % unités de mesure (figurant comme en-tête de colonne).
Classification Strate provinciale Strate territoriale Total
Recensement de 2016 Personnes omises de 2016 Naissances Immigrants Résidents non permanents Bases de sondage territoriales
nombre % nombre % nombre % nombre % nombre % nombre % nombre %
Source : Statistique Canada, Étude sur le sous-dénombrement du Recensement de 2021.
Total 32 933 387 100,0 2 830 944 100,0 1 855 111 100,0 1 072 833 100,0 1 140 539 100,0 137 867 100,0 39 970 681 100,0
Dénombrées 29 127 257 88,4 1 784 797 63,0 1 646 438 88,8 874 651 81,5 639 236 56,0 94 583 68,6 34 166 962 85,5
Listées 29 023 031 88,1 1 773 009 62,6 1 643 876 88,6 871 537 81,2 626 405 54,9 94 272 68,4 34 032 130 85,1
Non listées 104 226 0,3 11 788 0,4 2 562 0,1 3 114 0,3 12 831 1,1 311 0,2 134 832 0,3
Omises 2 083 885 6,3 662 494 23,4 164 767 8,9 130 942 12,2 387 586 34,0 32 760 23,8 3 462 434 8,7
Listées 243 914 0,7 41 300 1,5 16 954 0,9 7 987 0,7 14 693 1,3 5 567 4,0 330 415 0,8
Non listées 1 839 971 5,6 621 194 21,9 147 813 8,0 122 955 11,5 372 893 32,7 27 193 19,7 3 132 019 7,8
Hors champ 1 722 245 5,2 383 653 13,6 43 906 2,4 67 240 6,3 113 717 10,0 10 524 7,6 2 341 285 5,9
Listées 1 402 710 4,3 206 632 7,3 25 675 1,4 3 964 0,4 32 613 2,9 7 768 5,6 1 679 362 4,2
Non listées 319 535 1,0 177 021 6,3 18 231 1,0 63 276 5,9 81 104 7,1 2 756 2,0 661 923 1,7

7.4.6 Calcul du sous‑dénombrement du recensement

On définit maintenant que :

C MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaam4qaaaa@36BF@
=
chiffre publié du recensement du nombre de personnes dans la population cible
S ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGabm4uayaaja aaaa@36DF@
=
estimation du sous‑dénombrement
=
estimation du nombre de personnes non incluses en C MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaam4qaaaa@36BF@ , mais qui auraient dû l’être
M ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGabmytayaaja aaaa@36D9@
=
estimation du nombre de personnes de la population visée par l’ESoR qui n’ont pas été dénombrées
=
somme du poids final des personnes considérées comme omises
X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamiwaaaa@36D4@
=
nombre de personnes incluses en C MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaam4qaaaa@36BF@ qui ne peuvent pas, dans le cadre de l’ESoR, être déterminées avec certitude comme des personnes dénombrées.

On estime le sous‑dénombrement de la population du recensement par le nombre (pondéré) de personnes omises moins le nombre de personnes comptées par le recensement (le terme C) mais exclues de la BDR-ECR :

S ^ = M ^ X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGabm4uayaaja Gaeyypa0JabmytayaajaGaeyOeI0Iaamiwaaaa@3A91@

X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamiwaaaa@36D4@ a trois composantes : les imputations, les dénombrements incomplets et les dénombrements tardifs.

L’adresse de la PC le jour du recensement désigne un logement pour lequel un dénombrement a été imputé. C’est le cas, notamment, des logements non répondants pour lesquels les données d’un autre logement ont été utilisées dans le cadre de l’IME.

Certains dénombrements figurant dans la base de données du recensement ont été jugés trop incomplets pour être utilisés aux fins de l’ESoR afin de déterminer si une PC était une personne dénombrée. Le dénombrement est généralement incomplet en pareil cas en raison de données manquantes ou non valides en ce qui a trait à la date de naissance ou au nom (p. ex. « ? », « M. », « Inconnu » ou « Personne 1 »). Lorsque la PC a fait l’objet d’un tel dénombrement, elle est considérée comme une personne « omise ». C’est ce qu’on appelle un « dénombrement incomplet de l’ESoR ». Cette catégorie de dénombrement inclut aussi certains types de logements collectifs pour lesquels seul le nombre de résidents habituels a été recueilli au recensement (pas de noms ni de dates de naissance). Il y a eu imputation dans la BDR des données des personnes vivant dans ces logements collectifs.

À l’échelle nationale, X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamiwaaaa@36D4@ représente un peu moins de la moitié de M ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGabmytayaaja aaaa@36D9@ . La valeur de X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamiwaaaa@36D4@ a augmenté par rapport à 2016 en raison d’une augmentation du nombre de personnes imputées dans le cadre de l’IME et de l’augmentation des imputations dans certains types de logements collectifs (dénombrements incomplets).

Le tableau 7.4.6 présente les chiffres nationaux des différentes composantes de l’estimation du sous‑dénombrement de la population, notamment les chiffres pour les trois composantes du terme X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamiwaaaa@36D4@ .

Tableau 7.4.6
Composantes de l’estimation du sous-dénombrement de la population pour le Canada Sommaire du tableau
Le tableau montre les résultats de Composantes de l’estimation du sous-dénombrement de la population pour le Canada. Les données sont présentées selon Composante (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
Composante Nombre de personnes
ESoR = Étude sur le sous-dénombrement du recensement
M = nombre de personnes de la population visée par l’Étude sur le sous-dénombrement du recensement (ESoR) qui n’ont pas été dénombrées
X = nombre de personnes comprises dans le chiffre publié du recensement, mais qui n’ont pas pu être déterminées avec certitude comme étant dénombrées dans le cadre de l’ESoR
S = sous-dénombrement
Source : Statistique Canada, Étude sur le sous-dénombrement du Recensement de 2021.
Estimation de M 3 462 434
X total 1 564 558
X de personnes imputées 931 346
X de dénombrements tardifs 0
X de dénombrements incomplets selon l’ESoR 633 212
Estimation de S 1 897 876

Enfin, le calcul de la variance des estimations du sous‑dénombrement est le suivant :

v( S ^ )=v( M ^ X)=v( M ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamODaiaacI caceWGtbGbaKaacaGGPaGaeyypa0JaamODaiaacIcaceWGnbGbaKaa cqGHsislcaWGybGaaiykaiabg2da9iaadAhacaGGOaGabmytayaaja Gaaiykaaaa@4375@

v( M ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamODaiaacI caceWGnbGbaKaacaGGPaaaaa@392D@ = estimation de la variance de M ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGabmytayaaja aaaa@36D9@ selon le plan de l’ESoR.

Le calcul de la variance a été fait à l’aide de la méthode classique du rééchantillonnage bootstrap. Pour ce faire, des poids de 500 répliques bootstrap ont été produits.


Date de modification :