classDiagram class Menage{ unité : ménages-logements identifiant : ident pondération : wprm } class Indivi{ unité : individus rattachés aux ménages identifiant : ident x noi pondération : wprm } class Foyer{ unité : foyers fiscaux des individus identifiant : idfoyer pondération : aucune } class Indfip{ unité : individus fiscaux hors ménages identifiant : idfoyer x coldec pondération : aucune } Menage .. Indivi : ident Indivi .. Foyer : (idfoyer x coldec | idfoyer2 x coldec2) & revenus individualisables Menage .. Foyer : ident & revenus non individualisables Menage .. Indfip : ident Indfip .. Foyer : idfoyer
2 Les données
2.1 L’ Enquête Revenus Fiscaux et Sociaux (ERFS)
2.1.1 Présentation
Le modèle Ines est construit sur la base de l’Enquête Revenus Fiscaux et Sociaux (ERFS).
L’ERFS est une source produite annuellement par l’Insee (Division Revenus des Ménages) constituée par le rapprochement entre le quatrième trimestre d’interrogation de l’Enquête Emploi en Continu (EEC), et d’un ensemble de sources administratives :
fichiers fiscaux de la DGFIP (bases issues des déclarations de revenu)
fichiers des allocataires de prestations versées par la CNAF, la MSA et la CNAV.
Ces sources administratives permettent de disposer d’une mesure du niveau de vie des ménages de France métropolitaine, ainsi que de l’ensemble des revenus, prestations et impôts qui le composent combinés à la richesse des caractéristiques socio-démographiques recueillies par l’EEC.
Par ailleurs, l’ERFS est la source nationale de référence sur les inégalités et la pauvreté monétaire.
2.1.2 Champ
Concernant les données d’entrées, le champ de l’ERFS correspond aux ménages vivant en logement dits “ordinaires” et résidant en France métropolitaine. Ainsi, sont exclues du champ les personnes vivant en collectivité, en habitations mobiles ou sans-domiciles fixe.
Sont également exclus du champ de diffusion de l’ERFS les ménages dont le revenu fiscal de référence est strictement négatif, et ceux qui ont pour personne de référence un étudiant.
2.1.3 Documentation
La documentation à disposition sur l’ERFS est composée :
d’une fiche descriptive, sur le site de l’Insee ;
de guides sur la méthodologie et les différents concepts de revenus mesurés, sur le site de l’Insee également ;
d’un bilan de production de l’ERFS propre à chaque millésime et mis à disposition lors de la transmission annuelle de l’ERFS ;
d’un dictionnaire des variables annuel, mis à disposition à partir du millésime 2022.
2.2 Refonte de l’EEC et de l’ERFS en 2021
2.2.1 Présentation
L’EEC a connu en 2021 une refonte d’ampleur nécessitant une refonte de la chaîne de production de l’ERFS. Cette refonte nécessaire a également été l’occasion de procéder à certains changements spécifiques à l’ERFS : adaptation de méthodes, de champ, de format de diffusion notamment.
Parmi les principaux changements intervenus au cours de la refonte de l’EEC, on peut notamment signaler :
la rénovation du questionnaire, qui occasionne de nombreux changements sur les variables recueillies et les concepts mesurés ;
des changements de protocole d’interrogation (en particulier la possibilité de répondre par internet en ré-interrogation) ;
la modification des règles de rattachement des individus au logement en cohérence avec la révision des cibles de population utilisées pour le calage sur marges ;
une amélioration de la méthode de pondération ;
une diminution de la taille de l’échantillon enquêté.
Cette refonte de l’EEC a nécessité des travaux d’adaptation de la chaîne de production de l’ERFS. Elle a également été l’occasion d’une réécriture globale de la chaîne (en R
) et de l’introduction d’une nouvelle méthode de traitement du défaut d’appariement totale aux sources administratives. Les bases de diffusion ont également été revues et rationalisées.
Les refontes combinées de l’EEC et de l’ERFS ont eu un impact significatif sur la mesure des principaux indicateurs de niveau de vie et d’inégalité diffusés à partir de l’ERFS, la rupture de série a été estimée dans ce document.
2.2.2 Impact sur le modèle Ines
L’ensemble de ces refontes sur les sources auxquelles est adossé le modèle Ines (EEC et ERFS), ont eu un fort impact global qui a nécessité un travail d’adaptation conséquent des codes du modèle pour garantir sa possibilité d’exécution à partir de l’ERFS 2021 (premier millésime post-refonte).
Cette adaptation a été l’occasion d’une réécriture en R des traitements ainsi que d’une restructuration d’ensemble des outils et du fonctionnement du modèle. Ce travail a été conduit entre 2023 et 2024 et aboutit à une première mise à disposition pour le modèle Ines 2023 basé sur l’ERFS 2021 (voir Mode d’emploi du modèle).
2.3 Les variables de l’ERFS
Un dictionnaire des variables est disponible pour l’ERFS depuis le millésime 2021, il n’existait auparavant pas de dictionnaire des codes et des variables spécifiques pour les ERFS de 1996-2020. La majorité des variables de l’ERFS sont des variables issues de l’EEC pour lesquelles un dictionnaire est accessible, les variables spécifiquement produites par l’ERFS (principalement des agrégats de revenus, impôts et prestations) font l’objet d’une documentation dans le dictionnaire des variables à compter du millésime 2021.
Le bilan de production annuelle documente par ailleurs une partie d’entre elles. Pour les variables de la déclaration fiscale (base foyer), on peut se reporter à la brochure pratique de déclaration des revenus de la DGFIP pour connaître le sens de l’ensemble des cases fiscales.
2.4 Les bases de diffusion de l’ERFS
Le modèle Ines mobilise les tables de diffusion de l’ERFS comme tables d’entrées des traitements. Ces tables sont décrites en détail dans le bilan de production de l’ERFS.
Les tables principales sont :
- menage : base des ménages-logement ERFS ;
- indivi : base des individus ERFS :
- mcomprf : bases des ménages (interrogés au t4 EEC) pour les trimestres suivants / précédents auxquels ces ménages ont été interrogés ;
- icomprf : bases des individus (interrogés au t4 EEC) pour les trimestres suivants / précédents auxquels ces individus ont été interrogés ;
- foyer : base des foyers fiscaux auxquels les individus de l’ERFS ont pu être rattachés (appariement fiscal) ;
- indfip : base des individus non présents parmi les occupants du logement (c-à-d absents du ménage) mais présents sur la (ou les) déclaration(s) fiscale(s) retrouvée(s) pour le ménage.
Les identifiants de ces différentes tables sont : * menage : ident
; * indivi : ident x noi
: * foyer : idfoyer
; * indfip : idfoyer x coldec
.
Voir la section familles, foyers et ménages pour plus de détails sur les identifiants et leurs spécificités.
Schéma des liens entre les principales tables de diffusion de l’ERFS
2.5 Liens entre les tables Menage
, Foyer
, Individi
et Indfip
2.5.1 Présentation
Ces quatre tables sont au cœur du fonctionnement du modèle. Leurs interactions sont cependant complexes et nécessitent d’être bien comprise pour avoir une vue d’ensemble du modèle.
Ménage <–> Individus : chaque individu n’appartient qu’à un seul ménage, et chaque ménage regroupe tous les individus qui le composent. Le lien est réalisé par la variable
ident
. Il y a une cohérence totale.Foyer <–> Individus + Indfip : chaque individu n’est associé qu’à un seul foyer fiscal dans la très grande majorité des cas, à l’exception des foyers dans lesquels un décès est survenu au cours de l’année (cf. explication ci-dessous). Il existe cependant plusieurs difficultés pour lier les tables
foyer
etindividus
.- certains individus n’ont pas pu être retrouvés sur une déclaration fiscale de l’année. Ces individus ne sont pas associés à un foyer fiscal dans l’ERFS et leur revenus ont été imputés statistiquement. Dans le modèle Ines, le choix est fait de créer des foyers fiscaux “fictifs” pour ces individus afin d’assurer une cohérence fictive entre les tables
foyer
etindividus
(facilite fortement les traitements), - à l’inverse, certains individus sont présents sur la déclaration fiscale (donc dans le foyer fiscal) mais ne sont pas associés à des individus de l’ERFS, il s’agit des individus FIP ou POTE qui constituent la table
indfip
. Ces individus FIP ou POTE ne sont pas rattachés au ménage-logement de l’EEC/ERFS pour diverses raisons (souvent car ils ne résident pas principalement dans le logement) et ne disposent donc pas d’une représentativité et d’un poids statistique. Ils font l’objet de quelques traitements particuliers dans le modèle afin de simuler au mieux les prestations et les prélèvements du ménage. - dans le cas particulier où un décès est survenu parmi les déclarants du foyer fiscal durant l’année, le conjoint survivant peut changer de foyer fiscal et être associé à deux foyers fiscaux avant et après le décès, il dispose alors deux identifiants de foyer fiscal : idfoyer et idfoyer2.
- certains individus n’ont pas pu être retrouvés sur une déclaration fiscale de l’année. Ces individus ne sont pas associés à un foyer fiscal dans l’ERFS et leur revenus ont été imputés statistiquement. Dans le modèle Ines, le choix est fait de créer des foyers fiscaux “fictifs” pour ces individus afin d’assurer une cohérence fictive entre les tables
Voir concepts de familles, foyers et ménages pour plus de détails sur les contours d’individus.
2.5.2 Variables de liens entre individus et foyer fiscal
2.5.2.1 quelfic
Renseigne sur le statut d’enrichissement des individus de l’ERFS vis-à-vis des sources administratives.
EE_POTE : individus appariés à une déclaration fiscale (fichiers DGFIP, FIP et POTE)
EE_CAF : individus non appariés à une déclaration fiscale mais appariés au fichier des allocataires CNAF
EE : individus non appariés DGFIP et/ou CNAF d’un ménage dont au moins un des membres a été apparié par ailleurs (hors étudiants)
EE_TOT : individus non appariés DGFIP et/ou CNAF d’un ménage dont aucun des membres n’a été apparié par ailleurs (hors étudiants)
EE_NRT : individus non appariés d’un ménage dont la personne de référence est étudiante
POTE : individus présents sur la/les déclaration(s) fiscale(s) du ménage mais absent du logement enquêté par l’EEC
2.5.2.2 idfoyer
Renseigne l’identifiant du foyer fiscal auquel un individu de l’ERFS a été rattaché (appariement fiscal).
Dans la très grande majorité des cas, un même individu ne peut appartenir qu’à un seul foyer fiscal (idfoyer unique), mais dans le cas particulier où un décès est survenu parmi les déclarants du foyer fiscal durant l’année, le conjoint survivant peut changer de foyer fiscal et être associé à deux foyers fiscaux, avant et après le décès (idfoyer et idfoyer2).
A l’inverse, un même foyer fiscal peut fréquemment être associé à plusieurs individus de l’ERFS (par exemple dans le cas d’une déclaration commune de deux personnes mariées ou pacsées).
2.5.2.3 coldec
Renseigne la position de l’individu sur la déclaration fiscale sur laquelle il a été retrouvé (déclarant 1, déclarant 2, personnes à charge…)
- 1 : déclarant 1
- 2 : déclarant 2
- 3 : 1ère personne à charge
- 4 : 2ème personne à charge
- 5 : 3ème personne à charge
- 6 : 4ème personne à charge
- 7 : 1ère personne rattachée à la déclaration fiscale
- 8 : 2ème personne rattachée à la déclaration fiscale