Moins de 15 % des bâtiments résidentiels disposent d’un diagnostic de performance énergétique (DPE) dans au moins un de ses logements.
C’est normal au vu de la jeunesse du dispositif, mais cela ne permet que des extrapolations statistiques en grandes masses. Pour autant, pouvoir travailler avec une vision du parc complète reste essentiel pour une bonne compréhension de nos politiques de rénovation énergétique. C’est pourquoi les équipes du CSTB ont travaillé sur une méthode de prédictions d’étiquettes DPE sur l’ensemble des bâtiments résidentiel en France métropolitaine. La BDNB offre les informations, les moyens de calcul et le support de diffusion de ce type de données expertes.
Cet article explique pourquoi ces prédictions sont nécessaires, et comment nous avons relevé ce défi.
Le DPE : l’outil national de pilotage des performances du bâtiment
La performance énergétique des bâtiments est un enjeu majeur dans la lutte contre le changement climatique. Le secteur résidentiel représente en 2021 28%1 du total de la consommation d’énergie final consommée en France. En 2021, il représente 11% du total national d’émissions de GES en France (hors émissions indirectes liées à l’électricité et aux réseaux de chaleur urbain)2. Il est donc crucial de comprendre et d’améliorer l’efficacité énergétique du parc immobilier.
Pour inciter et suivre les améliorations du parc bâti existant en France métropolitaine, l’outil réglementaire principal est le diagnostic de performance énergétique (DPE).
Initié en 2012, il a été reformé récemment avec l’entrée en vigueur de l’arrêté du 31 mars 2021. Désormais, le DPE sert à identifier les passoires énergétiques, dont les conditions de location et de vente se durcissent progressivement.
Dans sa forme actuelle (DPE méthode 3CL 2021), un DPE repose sur la collecte de données de performances du bâti par un diagnostiqueur. En conjonction avec un ensemble d’hypothèses conventionnelles (météo, usages,…), ces données sont utilisées pour calculer les consommations des principaux usages réglementaires (chauffage, ECS, refroidissement, ventilation et éclairage) et leurs émissions de gaz à effet de serre (GES). Ce sont ces consommations et ces émissions qui sont utilisés pour classer un logement.
La méthode de calcul 2021 diffère fortement des anciennes méthodes de calcul :
- mise à jour des hypothèses météorologiques utilisées dans le calcul.
- réévaluation des performances des systèmes énergétiques.
- modification des seuils des étiquettes énergie et carbone.
- fusion des étiquettes énergie et carbone en une seule étiquette, en retenant la plus mauvaise des deux performances.
Il devient impossible de comparer des DPE entre les deux méthodes (2012 et 2021) purement sur la base de leurs classes. Heureusement, les données collectées lors de l’audit restent suffisamment similaires pour être comparables.
Les données du dispositif (données de l’audit et classes) sont capitalisées par l’ADEME dans son observatoire des DPE et mis en open data régulièrement depuis de 2020.
Lorsque nous récupérons ces données et que nous les alignons sur les bâtiments de la BDNB, seul 15% du parc de bâti dispose d’au moins un DPE, et seule une minorité dispose d’un DPE récent (méthode selon l’arrêté 2021).
Avec une grande partie du parc bâti sans DPE récent, le défi est clair. Comment avoir une vision complète et à jour de la performance énergétique des bâtiments en France ? C’est ce que nous aborderons dans les sections suivantes.
Extrapoler les performances du parc
Le Centre Scientifique et Technique du Bâtiment (CSTB) travaille depuis près de 10 ans sur des méthodes permettant d’extrapoler les performances des bâtiments restants.
Historiquement, la littérature recense deux grandes approches pour réaliser cette extrapolation. Les plus anciennes reposent sur la segmentation du parc en “bâtiments types”, censés représenter des segments homogènes dont le poids dans le parc réel est supposé connu. Une fois cette segmentation réalisée, il suffit de travailler sur chaque bâtiment type pour extrapoler les résultats à l’échelle nationale. Bien que ces approches aient longtemps été les seules opérationnelles, faute de meilleures données, il reste extrêmement difficile d’en évaluer empiriquement les performances3.
Les secondes classes d’approches ont émergées avec l’apparition des premiers jeux de données en open data et ont tiré profit de l’essor des techniques d’apprentissage machine et statistique. L’extrapolation d’une classe DPE est alors devenue un simple exercice de classification supervisée, en utilisant les données disponibles sur un bâtiment en entrée et sa classe DPE en valeur à prédire. Ces approches ont l’avantage d’être plus facile à évaluer en termes de fiabilité, et elles ne nécessitent pas une expertise approfondie en énergétique du bâtiment pour être déployées. Cependant, comme toute prédiction statistique, elles sont limitées dans leur capacité à prendre en compte les modifications des méthodes de calcul, telles que celles introduites par l’arrêté de 2021.
De la prédiction statistique aux modèles physiques
Afin de fournir les prédictions les plus fiables et les plus utiles possibles, nos équipes data ont travaillé sur une approche hybride visant à capitaliser le flux de données réelles et sur la connaissance des modèles physiques énergétiques. Au lieu de prédire directement des étiquettes, notre approche repose sur la prédiction statistique des données d’entrée de la méthode 3CL: performances thermiques des murs, des vitrages …
Cela présente plusieurs avantages :
- Nous sommes en mesure de capitaliser l’ensemble des données DPE historiques, dont les entrées sont restées relativement similaires depuis 2012.
- Nous pouvons utiliser ces données d’entrée avec le modèle de notre choix, en l’occurrence le modèle 3CL de l’arrêté 2021.
Cette approche a été déployée sur l’ensemble des 22 millions de bâtiments à usage résidentiel de la BDNB. Elle a abouti à des prédictions probabilistes des étiquettes dans la norme de l’arrêté 2021 pour chaque bâtiment et donne une incertitude qui prend en compte le niveau de complétude des données de chaque bâtiment.
Ces résultats permettent de donner une estimation à l’échelle du bâtiment :
Ou par segment de parc :
La fiabilité des prédictions au cœur du débat
Au vu de la nature des enjeux, il est capital d’être en mesure d’estimer l’incertitude des prédictions réalisées. C’est pourquoi chaque prédiction des données d’entrée est probabilisée. Au lieu de réaliser une seule prédiction, nous générons 100 jeux de données d’entrée compatibles avec les données observées. Pour chacun des 20 millions de bâtiments, nous réalisons alors 100 calculs DPE. La distribution des résultats de calcul nous permet d’évaluer un intervalle de confiance, prenant en compte le niveau de complétude des données sur chaque cas. Les résultats que nous présentons sur l’application Gorénove sont directement basés sur cette approche4.
Identifier le gisement
L’avantage d’une approche hybride est qu’elle garde la flexibilité et l’interprétabilité d’une méthode de calcul classique. Qui plus est, il nous est possible de simuler des scénarios de rénovation bâtiment par bâtiment et d’en évaluer l’impact à l’échelle nationale.
Par exemple, dans un scénario hypothétique de rénovation globale de l’ensemble des bâtiments résidentiels, nous pourrions réduire d’un facteur 3 les émissions carbone des bâtiments (en phase d’exploitation, hors prise en compte des émissions liées au cycle de vie de produits et équipement mis en place lors de la rénovation). Plus intéressant, il nous est possible d’analyser finement comment se répartit ce gisement, comme sur la figure suivante :
Rénover 20% des logements les plus émetteurs permettrait d’exploiter 50% de ce gisement, soit réduire les émissions des bâtiments de ~30% (en phase exploitation). Il est aussi intéressant de noter que le gisement le plus facilement accessible se situe parmi les bâtiments construits pendant les 30 glorieuses, majoritairement dans les maisons individuelles.
Comme nous disposons de ces résultats à l’échelle la plus fine, il est possible d’analyser de ce gisement sur l’ensemble des paramètres disponibles dans la BDNB.
Utilisez nos prédictions
L’ensemble de ces prédictions sont mises à jour à chaque millésime de la BDNB. Elles alimentent les applications gorenove.fr et sont disponibles via notre API expert. Vous pouvez également avoir accès à des téléchargements en masse ou à des études dédiées. Pour plus d’informations
Réferences
Chiffres clés du logement – Édition 2022, Le service des données et études statistiques (SDES, CGDD, MTE) ↩︎
M Pellan, M Louërat, J El Beze and G Habert. ”A holistic perspective on the French building and construction GHG footprint”. IOP Conference Series: Earth and Environmental Science, Volume 1078, sbe22 Berlin D-A-CH conference: Built Environment within Planetary Boundaries (SBE Berlin) 20/09/2022 - 23/09/2022 Berlin ↩︎
Adelaide Mailhac, 2019 ”Contribution au développement d'une méthodologie d'évaluation environnementale aux échelles urbaines” ↩︎
Schetelat, P., L. Lefort, and N. Delgado. ”Urban data imputation using multioutput multi-class classification.” In Proceedings of uSim Conference 2020: 2nd uSim Conference of IBPSA-Scotland, 2:126–133. uSim Conference. Edinburgh, Scotland: IBPSA-Scotland, November 2020 ↩︎