Méthodologie de traitement des DPE dans la BDNB

Les Diagnostics de Performance Énergétique (DPE) jouent un rôle essentiel dans la caractérisation des performances énergétiques des bâtiments de logements dans la Base de Données Nationale sur le Bâtiment (BDNB). Cet article présente les méthodes de traitement des DPE dans la BDNB et leur mise à disposition.

Les DPE attribuent une classe de performance allant de A à G aux logements, en se basant sur les caractéristiques et données techniques relevées par un diagnostiqueur DPE certifié.

Alt text

Le DPE a subi une réforme majeure en mars 2021 (appliquée en juillet 2021), entraînant d’importantes différences entre les DPE antérieurs à cette réforme et ceux qui lui ont succédé. Dans la BDNB, nous distinguons ces deux types de DPE en fonction du cadre légal d’application.

La réforme a entrainé des changements profonds dans la méthode de calcul des classes DPE entre les deux arrêtés. La conséquence de cela est qu’un DPE réalisé avant 2021 donne une classe qui n’est pas comparable avec les nouvelles classe DPE du nouvel arrêté, il faut donc manipuler les données des DPE arrêté 2012 avec une grande précaution.

Les principales modifications apportées par la nouvelle réforme sont :

  • Harmonisation de la méthode de calcul pour tous les DPE logements (suppression de la méthode dite “facture” pour les logements avant 1948)
  • Étiquette estimée sur un double seuil énergie/carbone
  • Le DPE est désormais opposable .

La disparition des DPE dits “facture” constitue le changement le plus significatif avec l’entrée en vigueur du nouvel arrêté DPE 2021. Auparavant, les classes énergétiques des bâtiments avant 1948 étaient évaluées à partir des factures réelles, mais aujourd’hui, tous les DPE des bâtiments existants sont réalisés avec la même méthode de calcul réglementaire (méthode 3CL).

Jeu de données source mise à disposition par l’ADEME

logo ademe

Les DPE ont été mis en Open Data par l’ADEME depuis juin 2020, et sont séparés en deux jeux de données distincts, chacun correspondant aux deux arrêtés.

Ces deux jeux de données se distinguent non seulement par le contexte réglementaire d’application des DPE, mais également par une refonte complète de la structure de données et une vérification de la saisie des données techniques associées.

Le CSTB a activement participé à la conception du nouveau modèle de données du DPE arrêté 2021 en collaboration avec l’ADEME et le ministère, afin d’améliorer la qualité des données archivées dans la base de l’ADEME. (en savoir plus sur le modèle de donnée du nouveau DPE)

Méthodologie de traitement uniformisé dans la BDNB

Les DPE de l’ADEME ne se réduisent pas à de simples classe énergétiques allant de A à G. Ces jeux de données contiennent des informations détaillées sur les différents éléments constitutifs de la performance énergétique d’un logement :

  • les caractéristiques thermiques du bâtiment (performance d’isolation, matériaux, etc.)
  • les caractéristiques des systèmes énergétiques de chauffage, d’eau chaude sanitaire, de ventilation et de climatisation
  • les performances réglementaires (théoriques) des bâtiments (classe DPE, consommations théoriques)

Les caractéristiques thermiques et des systèmes énergétiques des logements sont des informations indispensables pour la transition énergétiques des logements. Le CSTB a donc travaillé à pouvoir produire ces informations techniques de première utilité sur l’ensemble des logements ayant déjà bénéficié d’un DPE qu’il soit issu de l’ancien arrêté 2012 ou du nouvel arrêté de 2021.

L’objectif de ce traitement est de pouvoir produire les caractéristiques suivantes :

  • Matérialité, niveau d’isolation et performance de l’ensemble des éléments d’enveloppe (murs, planchers haut, planchers bas, fenêtres)

Exemple de données techniques pour les murs extérieurs d’un logement extraites du DPE :

propriété valeur
type_isolation_mur_exterieur ITI
epaisseur_isolation_mur_exterieur_estim 5.0
materiaux_structure_mur_exterieur murs en briques creuses
epaisseur_structure_mur_exterieur 20.0
u_mur_exterieur 0.36
  • Type d’installation, état et type du système énergétique

Exemple de données fournies pour un DPE logement sur les systèmes

proprité valeur
type_installation_chauffage individuel
type_energie_chauffage gaz
type_generateur_chauffage chaudiere gaz condensation
type_generateur_chauffage_anciennete neuf
type_installation_ecs individuel
type_energie_ecs gaz
type_generateur_ecs chaudiere gaz condensation
type_generateur_ecs_anciennete neuf
type_ventilation Ventilation mécanique auto réglable « après 1982 »

Ces données produites sont accessibles dans la table [dpe_logement/schema/latest/tables/dpe_logement.html), qui contient une ligne par DPE, et 100 attributs techniques par DPE.

Les 100 attributs ne sont pas tous renseignés pour l’ensemble des DPE et certains de ces attributs ne sont disponibles que pour le nouveau DPE (arrêté 2021). Toutefois, les champs les plus importants, comme le système de chauffage, sont remplis dans plus de 95% des cas.

Méthode de traitement-redressement des DPE arrêtés 2012

Le traitement des anciens DPE (arrêté 2012) a nécessité des travaux de retraitement approfondis de la base de données, car les caractéristiques recherchées n’étaient pas explicitement renseignées dans le modèle de données. Le CSTB a utilisé des techniques de rétro-ingénierie pour reconstituer les informations techniques à partir des données de calcul et des tables de valeurs disponibles dans la base de données ADEME. De plus, pour les DPE factures, les caractéristiques techniques du bâtiment ont été extraites des descriptions textuelles non structurées des logements à partir des fiches techniques descriptives du DPE.

Techniques de rétro-ingéniérie

Dans le cas des DPE arrêté 2012 utilisant la méthode de calcul 3CL, les données de calcul étaient stockées dans la base de données ADEME, accompagnées d’abaques de calcul représentant des tables de valeurs. Pour obtenir les données pertinentes, un processus de recoupement a été mis en place en utilisant ces tables de valeurs.

Par exemple, pour déterminer le générateur de chauffage dans la table des générateurs de chauffage, une combinaison des champs tv036_puissance_veilleuse_id (table des puissances de veilleuses), tv035_temperature_fonctionnement_chaudiere_30_id (table des températures de chaudières) et le type d’énergie ont été utilisée pour déduire que le générateur de chauffage était une chaudière gaz condensation

Techniques de traitement de texte

Cette reconstitution des données de calcul n’était pas suffisante pour reconstituer l’ensemble des informations d’intérêt dans la base DPE. Une grande partie des DPE de l’arrêté 2012 étant des DPE factures, il n’y avait pour ces DPE aucune donnée structurée de calcul pour pouvoir retrouver les caractéristiques du bâtiment et de ses systèmes énergétiques.

Pour ces DPE factures, les caractéristiques techniques du bâtiment ont été extraites des données textuelles non structurées de description des logements. Un travail important a été fait pour associer des expressions et descriptions à des caractéristiques techniques proprement labellisées des différents éléments (systèmes, murs, etc.) Ce traitement de texte a permis aussi de consolider les données récupérées issues de la rétro-ingénierie pour les DPE 3CL lorsque les données de calcul étaient insuffisamment précise pour retrouver les propriétés recherchées.

Ce traitement de texte a également été utile pour consolider les données récupérées grâce à de la rétro-ingénierie des DPE 3CL lorsque les informations de calcul n’étaient pas suffisamment précises pour retrouver toutes les propriétés recherchées.

Même avec l’application de ces deux traitements, il est important de noter qu’un nombre considérable de DPE dans la base de données ADEME arrêté 2012 est très peu ou mal documentés. En conséquence, certaines caractéristiques essentielles manquent pour ces DPE insuffisamment renseignés, en particulier pour les DPE factures.

Méthode de traitement des DPE arrêtés 2021

Le CSTB a conçu avec le ministère et l’ADEME le nouveau modèle de données DPE pour que l’ensemble des informations techniques soient proprement documentées et explicites fort de son expérience de traitement et d’analyse approfondi de l’ancienne base DPE (arrêté 2012).

Cette expérience a permis un traitement de cette nouvelle base DPE plus simple et plus fiable pour extraire les données techniques essentielles vers la BDNB.

Simplification des données techniques pour fournir une table de synthèse

Les données DPE sont mises à disposition dans la BDNB dans la table [dpe_logement/schema/latest/tables/dpe_logement.html). Cette table résume les caractéristiques des différents composants de la performance énergétique des logements.

Un logement peut avoir un nombre conséquent de murs, fenêtres, systèmes de chauffage. Mettre à disposition de manière brute cette complexité d’information nécessite des traitements conséquents pour les utilisateurs qui veulent récupérer des informations basiques comme “est-ce que les murs de ce bâtiment sont isolés ?", “le système de chauffage est-il performant ?".
Afin de se rapprocher des besoins des utilisateurs, des simplifications ont été réalisées pour extraire l’information essentielle issue de l’ensemble des éléments documentés dans le DPE.

Simplification des éléments d’enveloppe

Les données mises à disposition dans la BDNB pour les éléments d’enveloppe (mur, plancher bas, plancher haut, fenêtres) sont toujours des informations synthétiques résumées à l’échelle du logement ou de l’immeuble. ainsi par exemple, on aura une seule information synthèse de type d’isolation des murs ou de matériau des murs même s’il peut y avoir dans des cas complexes des hétérogénéités de composition des murs.

La méthode utilisée pour fournir les données de synthèse pour les murs du bâtiment est de regrouper les murs qui ont des caractéristiques communes (même niveau d’isolation, même matérialité) et de compter leur surface donnant sur l’extérieur cumulée, on garde alors le groupe de mur ayant le maximum de surface et les données de synthèse simplifiée affichée pour le DPE sont donc les caractéristiques du groupe de mur associé.

ex. on a trois murs isolés par l’extérieur avec U = 0.25 en bloc de béton pleins qui totalisent 50m² de surface contre un mur non isolé en brique de 35 m² de surface, alors la donnée affichée synthétique de la BDNB sera

  • type_isolation_mur_exterieur : ITE
  • materiaux_structure_mur_exterieur : murs en blocs de béton pleins
  • u_mur_exterieur : 0.25

Cette simplification rend le résultat plus lisible et exploitable par les utilisateurs de la BDNB, le pendant négatif est de masquer la complexité lorsqu’elle existe sur une éventuelle hétérogénéité de performance des murs.

Pour les autres éléments d’enveloppe des méthodes analogues sont utilisées pour fournir les données simplifiées issues des éléments majoritaires de chaque composant.

Simplification des éléments de système (chauffage, ECS)

Pour les systèmes de chauffage et d’ECS, la BDNB se limite à la description de deux générateurs différents, le générateur dit principal et le générateur dit d’appoint.
Dans les faits cette simplification est suffisante pour décrire de manière exhaustive la grande majorité des installations de chauffage et d’ECS pour du logement. Les installations avec plus de deux générateurs sont très rares.

Le système de chauffage ou d’ECS principal est identifié comme étant le système qui couvre la plus grande part de besoin du logement. On ne raisonne surtout pas en consommation ! Une pompe à chaleur peut consommer moins que la chaudière gaz d’appoint, mais couvrir plus de besoin du fait de son efficacité bien supérieure.

En l’absence d’une présence fiable de l’estimation des besoins/consommations par générateur dans l’ancienne base DPE (arrêté 2012) la détermination du générateur de chauffage principal est basé sur une méthologie forfaitaire de priorisation des systèmes basés sur de l’expertise métier. Exemple : les PAC air/eau, géothermique sont toujours générateurs principaux d’une installation. Une chaudière gaz a priorité sur une chaudière fioul. Les convecteurs électriques en concurrence avec une PAC ou une chaudière sont toujours placés en appoint (etc.)

Méthode de sélection des DPE représentatifs des bâtiments

Pour afficher des informations synthétiques à l’échelle d’un bâtiment de logement, nous publions une table qui affiche un DPE représentatif du bâtiment de logement.

Il s’agit de la table batiment_groupe_dpe_representatif_logement

L’intérêt de cette table est de pouvoir fournir les caractéristiques du bâti (niveau d’isolation, materiaux) du bâtiment et des systèmes énergétiques utilisés.

Le DPE représentatif du bâtiment peut être un DPE logement (maison ou appartement), ou lorsqu’il est disponible, le DPE décrivant l’immeuble dans son ensemble.

⚠️ Dans les immeubles hétérogènes en termes de systèmes énergétiques et/ou de vitrages entre les logements, le DPE représentatif peut donc potentiellement donner une information qui n’est pas en adéquation avec tous les logements du bâtiment.

Pour sélectionner le DPE représentatif d’un bâtiment de logement, on utilise les règles suivantes.

S’il existe au moins un DPE arrêté 2021, c’est celui-ci qui sera sélectionné. puis on applique les règles suivantes:

  1. On sélectionne tous les DPE avec un géocodage à l’adresse suffisamment de qualité.
  2. Les DPE sont d’abord triés en fonction de la version du DPE. en effet, avant la version 2.1 des DPE arrêté 2021, les DPE étaient dans une phase de transition avec un modèle incomplet non contrôlé. à partir de la 2.1 les contrôles et la qualité de modèle de données sont à un niveau satisfaisant. Ainsi, nous privilégions systématiquement un DPE en version 2.1 ou supérieur par rapport à un DPE avec une version antérieure. Si aucun DPE n’est disponible en 2.1 ou plus, on prend les DPE avec une version < 2.1
  3. Ensuite, on filtre les DPE immeubles par rapport aux DPE logements s’il y en a, car ils sont plus complets et sont à l’échelle “bâtiment”, et donc plus pertinents à afficher à notre échelle bâtiment. Si aucun DPE immeuble n’existe, on retiendra un DPE logement.
  4. Ensuite, on filtre les DPE de l’année la plus récente. (ceci pour privilégier les DPE les plus à jour en termes de rénovation énergétique)
  5. Ensuite, on choisit le DPE qui a une étiquette qui se rapproche le plus de la moyenne des étiquettes. Ainsi si un bâtiment a 3 DPE D et 2 DPE E alors un DPE D sera selectionné. Ceci pour éviter de privilégier par exemple un DPE d’un logement sous toiture ne donne une image plus défavorable du DPE bâtiment qu’il ne l’est.
  6. Enfin, on prendra parmi les DPE sélectionnés par étiquette le DPE le plus récent.

Cette méthode de selection est une succession d’arbitrage qui présentent à chaque fois des risques de ne pas choisir le “meilleur” DPE représentatif. Le mieux étant l’ennemi du bien, nous tentons avec cette méthode de proposer un bon DPE représentatif dans la plupart des cas. Dans le cas de maison individuelle le DPE représentatif sera presque systématiquement le seul DPE sur cette maison individuelle. La complexité de choix n’est un problème que dans le cas d’immeubles collectifs ou groupes de maisons individuelles.

S’il n’existe que des DPE arrêté 2012 on applique les règles suivantes:

  1. Nous sélectionnons tous les DPE avec un géocodage à l’adresse suffisamment de qualité.
  2. Ensuite, on filtre les DPE immeubles par rapport aux DPE logements s’il y en a, car ils sont plus complets et sont à l’échelle “bâtiment” donc plus pertinents à afficher à notre echelle bâtiment. Si aucun DPE immeuble n’existe, on prendra un DPE logement.
  3. Ensuite, on filtre les DPE de l’année la plus récente. (ceci pour privilégier les DPE les plus à jour en termes de rénovation énergétique)
  4. Ensuite, on choisit le DPE qui a une étiquette qui se rapproche le plus de la moyenne des étiquettes. Ainsi si un bâtiment a 3 DPE D et 2 DPE E alors un DPE D sera sélectionné. Ceci pour éviter de privilégier par exemple un DPE d’un logement sous toiture ne donne une image plus défavorable du DPE bâtiment qu’il ne l’est.
  5. Enfin, on prendra parmi les DPE sélectionnés par étiquette le DPE le plus récent.