Conseil & accompagnement IA

Combien coûte vraiment un prompt d'IA ? Électricité, eau, CO2, à l'échelle

Un prompt texte consomme de l'ordre d'une recherche Google : minuscule à l'unité, mais significatif multiplié par des milliards de requêtes. Ce Repère donne les chiffres vérifiés, un cadre pour raisonner juste, et ce que ça change pour une entreprise.

9 min de lecturePublié le

Ce que coûte un prompt, à l'unité

Commençons par le chiffre que tout le monde cherche. Pour un prompt texte moyen, la consommation se mesure en fractions d'unité, pas en unités.

En août 2025, Google a publié pour la première fois des mesures détaillées sur son modèle Gemini. Le résultat est un point de repère solide, parce qu'il vient de l'opérateur lui-même et qu'il compte toute la chaîne : puce, machine hôte, capacité en veille, surcoût du centre de données.

Énergie d'un prompt texte médian sur Gemini, soit environ neuf secondes de télévision. À cela s'ajoutent 0,26 mL d'eau de refroidissement et 0,03 g de CO2. D'autres estimations situent la moyenne entre 0,24 et 0,4 Wh.

Source : Google, arXiv 2508.15734, 2025

Trois ordres de grandeur à garder en tête pour un prompt texte : autour de 0,3 Wh d'électricité, 0,3 mL d'eau, 0,2 g de CO2. Concrètement, un prompt texte pèse à peu près autant qu'une recherche Google, et bien moins qu'un e-mail avec pièce jointe.

Un mot d'honnêteté sur ce chiffre Google, car il est discuté. Il ne compte que l'eau de refroidissement directe, pas l'eau des centrales qui produisent l'électricité, et il retient une comptabilité carbone favorable. La vraie valeur est donc plutôt une fourchette qu'un point : c'est pour cela qu'on parle d'ordres de grandeur, jamais de décimale exacte.

Le piège du débat : l'unité n'est pas l'échelle

Voici l'erreur de raisonnement la plus fréquente, dans les deux camps. On prend le chiffre unitaire, minuscule, pour conclure que l'IA ne consomme rien. Ou on prend le total mondial, énorme, pour conclure qu'un prompt est un désastre. Les deux sont faux, et pour la même raison : ils confondent l'unité et l'échelle.

Les deux affirmations sont vraies en même temps. Un prompt est négligeable. Des milliards de prompts par jour ne le sont pas.

Le même prompt, deux échelles
1 PROMPT TEXTE≈ 0,3 Whcomme une recherche GoogleCHATGPT, UNE JOURNÉE≈ 2,5 milliards de promptsle carré bleu, c'est le prompt de gauche

À gauche, un prompt texte : environ 0,3 Wh, l'énergie d'une recherche Google. À droite, l'usage réel de ChatGPT sur une journée, autour de 2,5 milliards de prompts. Le carré unique ne change pas de taille : c'est leur nombre qui fait la consommation.

C'est exactement ce que la mise à l'échelle mondiale confirme. Les centres de données, dont l'IA est le premier moteur de croissance, ont représenté environ 1,5 % de l'électricité mondiale en 2024.

Électricité consommée par les centres de données dans le monde en 2024, soit environ 1,5 % du total. L'IEA prévoit plus du double d'ici 2030. La consommation croît d'environ 12 % par an depuis 2017, quatre fois plus vite que la demande électrique générale.

Source : Agence internationale de l'énergie, Energy and AI, 2025

Tous les usages ne se valent pas : texte, image, raisonnement, vidéo

Voici l'angle mort du débat public, qui parle toujours du prompt texte comme si tout l'IA était là. En réalité, le coût dépend énormément de ce que vous demandez. Un prompt texte est le plancher ; la vidéo générée est le plafond, très loin au-dessus.

  • Texte : de l'ordre de 0,3 Wh, le cas le plus courant et le moins coûteux.
  • Image générée : de l'ordre de quelques Wh, soit des dizaines de fois un prompt texte.
  • Raisonnement : les modèles qui réfléchissent longuement consomment nettement plus, de l'ordre de 15 à 40 Wh.
  • Vidéo générée : le sommet, de l'ordre de plusieurs centaines de Wh pour quelques secondes.
Le coût selon l'usage, échelle indicative
Texte≈ 0,3 WhImage≈ 9 WhRaisonnement15 à 40 WhVidéo (5 s)≈ 940 Wh

Échelle logarithmique indicative : chaque carré vaut environ dix fois le précédent. Les valeurs réelles sont à droite. La génération de vidéo peut coûter des milliers de fois un prompt texte.

Le paradoxe de l'efficacité

On entend souvent que le problème va se régler tout seul, parce que les modèles deviennent plus efficaces. C'est vrai, et insuffisant. Google annonce avoir divisé par 33 l'énergie par requête en un an. Pourtant, sur la même période, la demande électrique des centres de données grimpe et doit plus que doubler d'ici 2030.

C'est un vieux mécanisme, connu depuis le charbon au XIXe siècle : quand une ressource devient moins chère à l'usage, on en consomme davantage, et le total augmente malgré les gains unitaires. L'efficacité par prompt baisse, le nombre de prompts explose.

Conséquence pratique : l'efficacité technique est nécessaire, mais elle ne dispense pas de choisir ses usages. Compter sur le progrès seul pour régler la question, c'est ignorer la moitié de l'équation.

Deux lectures honnêtes du même tableau

Sur l'impact de l'IA, deux camps coexistent, et chacun a des arguments solides. Les présenter côte à côte vaut mieux que trancher à la hache.

  • La lecture rassurante : l'impact unitaire est faible, comparable à une recherche Google ; l'efficacité progresse vite ; les bénéfices sont concrets, de la productivité à la recherche médicale ; comparée au streaming, à la voiture ou à l'avion, l'IA reste modeste par personne.
  • La lecture vigilante : l'effet d'échelle est réel et croît vite ; la vidéo et le raisonnement pèsent lourd ; l'eau pose un problème local autour de certains centres de données ; et l'empreinte ne se limite pas à l'énergie, elle touche aussi l'emploi et la concentration du pouvoir.

La position raisonnable n'est ni technophile béate, ni technophobe. Rester conscient des usages et des coûts est la meilleure façon de tirer parti de l'IA, sans naïveté ni peur.

Voir pour comprendre : le projet howmanyprompts

Les ordres de grandeur restent abstraits tant qu'on ne les manipule pas. C'est pourquoi j'ai conçu et développé howmanyprompts.com, un site de vulgarisation qui rend ces chiffres tangibles, sans parti pris.

Il propose deux façons de jouer avec les échelles :

  • Dépenser : partez d'un budget correspondant à un an d'IA et voyez en combien de gestes du quotidien vous l'épuisez. Un four pendant une heure vaut déjà des milliers de prompts.
  • Convertir : dites ce que vous avez fait avec l'IA aujourd'hui, et lisez l'équivalent concret en électricité, en eau et en CO2.

La méthode est volontairement transparente : on divise la consommation mesurée d'un geste par celle d'un prompt, chaque valeur est datée et reliée à sa source, on retient une médiane et on affiche la fourchette. Le site ne chiffre que l'usage courant, l'inférence, tout en reconnaissant que l'entraînement des modèles fait partie de l'empreinte globale. Par cohérence, même le coût de fabrication du site est affiché.

Ce que ça change pour une entreprise

Un dirigeant n'a pas à choisir entre culpabilité et déni. La bonne posture est l'usage lucide, et elle se traduit en décisions simples.

  1. Choisissez l'outil à la hauteur de la tâche. La vidéo générée et le raisonnement long coûtent cher : gardez-les pour les cas qui le justifient, pas par défaut.
  2. Mesurez plutôt que devinez. Avant de vous inquiéter ou de vous rassurer, regardez vos usages réels : quels outils, pour quels volumes, avec quel gain.
  3. Ne confondez pas coût énergétique et coût financier. Les deux existent, ils ne se recouvrent pas : un abonnement inutile pèse sur votre trésorerie bien avant de peser sur la planète.
  4. Formez vos équipes à un usage juste. Un collaborateur qui sait quand l'IA aide vraiment consomme mieux, dépense moins et produit plus.

C'est précisément le fil de notre travail : aider les TPE et PME à adopter l'IA en connaissance de cause, du premier audit IA à la formation des équipes. Comprendre les coûts, c'est déjà mieux décider.

Questions fréquentes

À l'unité, très peu : de l'ordre d'une recherche Google, quelques gouttes d'eau, une fraction de gramme de CO2. C'est le nombre de requêtes, des milliards par jour, qui rend la consommation significative à l'échelle mondiale. Les deux choses sont vraies en même temps.

Par ordre croissant : le texte est le moins coûteux, puis la génération d'images, puis les modèles de raisonnement, et de loin la génération de vidéo, qui peut coûter des milliers de fois plus qu'un prompt texte. Le type d'usage compte bien plus que le nombre de prompts.

Ce n'est pas la bonne question. Un usage lucide vaut mieux qu'un renoncement ou qu'un déni : choisir le bon outil pour la bonne tâche, éviter la vidéo générée quand une image suffit, et mesurer plutôt que deviner. C'est ce que nous aidons les entreprises à faire.

Entraîner un grand modèle coûte beaucoup, de l'ordre du gigawattheure. Mais c'est un coût unique, réparti sur les centaines de milliards de requêtes qui suivent : ramené à un prompt, il redevient faible. L'usage quotidien, l'inférence, est ce sur quoi chacun a réellement prise.

Sources

  1. Measuring the environmental impact of AI inference : Google Cloud, 2025
  2. Measuring the environmental impact of delivering AI at Google Scale : arXiv 2508.15734, 2025
  3. How much energy does ChatGPT use ? : Epoch AI, 2025
  4. Energy and AI : Agence internationale de l'énergie, 2025
  5. How Hungry is AI ? Benchmarking energy, water and carbon : arXiv 2505.09598, 2025
  6. AI Energy Score : énergie des images et vidéos : Hugging Face (S. Luccioni), 2025
  7. ChatGPT users send 2.5 billion prompts a day : TechCrunch, 2025
  8. Impact CO2 et Base Empreinte : ADEME

Repères liés

Pour aller plus loin

Un projet en tête ?

On échange, on écoute, on construit. Pas de template, pas de devis générique.