Les chiffres qui surprennent

Google Search

0,30 Wh

Consommation par requête standard. Le référentiel de base depuis 20 ans.

Gemini · Standard

0,24 Wh

En 12 mois, Google a divisé le coût d'une requête Gemini par 33. Déjà sous le seuil Google Search.

Raisonnement complexe (o3)

~33 Wh

L'équivalent de 110 recherches Google — pour une seule question à un modèle de raisonnement.

Le point de bascule

Le seuil de la sobriété

Pour une question simple, Google gagne. Dès que vous devez ouvrir plusieurs onglets, lire et synthétiser — l'IA devient énergétiquement plus sobre. L'inférence coûte une transaction unique. La navigation, c'est une accumulation continue.

Au-delà de 2 à 3 pages consultées, le bilan énergétique penche en faveur de l'IA.

"Chaque mot généré est une promesse faite à l'environnement. La question n'est plus ce que l'IA peut faire, mais ce qu'elle doit faire."

5,4×

Moins d'énergie sur mobile quand l'IA remplace une recherche complexe multi-pages

Consommation par modèle

Tous les modèles ne se valent pas

L'écart entre un Llama 8B et un modèle de raisonnement dépasse un facteur 1 000. La sobriété numérique commence par choisir le bon outil.

Llama 3.1 8B · local 0,031 Wh

Gemini · texte standard 0,24 Wh

Google Search 0,30 Wh

ChatGPT · moyenne 2025 0,34 Wh

Claude Sonnet · Anthropic 0,50 – 1,00 Wh

OpenAI o3 / DeepSeek-R1 7 – 33 Wh

GPT-5 · estimation 18 – 40 Wh

0 Wh20 Wh40 Wh

Les barres sont proportionnelles à 40 Wh (max estimé GPT-5). L'échelle logarithmique masquerait les faibles valeurs — ici représentées linéairement pour l'honnêteté visuelle.

L'empreinte invisible — l'eau

Liquid Footprint

L'impact invisible
de l'eau

0,26 ml / prompt

Ce qui semble virtuel a une soif bien réelle. Un quart de millilitre par interaction. Multiplié par des milliards, l'impact devient océanique — entre 4,2 et 6,6 milliards de m³ d'ici 2027.

water_drop water_drop water_drop water_drop water_drop ≈ 5 gouttes par requête

6 600 km³

Demande mondiale projetée en 2027. Dépasse la consommation annuelle totale du Danemark.

120%

Engagement de Meta : reconstituer plus d'eau qu'ils n'en consomment d'ici 2030.

1,09

PUE moyen de Google. Seulement 9% de l'énergie totale part dans le refroidissement et l'éclairage.

5 leviers concrets

On sait comment faire mieux.

bolt

80%

Conception sobre

L'UCPH a analysé 400 000 architectures. Choisir les bonnes structures dès le départ économise 70 à 80% d'énergie sans perte de précision.

schema

100×

Mixture of Experts

Le modèle n'active que 5 à 10% de ses neurones par token. Jusqu'à 100 fois moins d'énergie que les modèles denses classiques.

compress

75%

Quantification INT4

Réduire la précision numérique divise la mémoire par 4 et la consommation de 60 à 80%. Suffisant pour 90% des usages.

memory

30×

Puces spécialisées

Le TPU v7 "Ironwood" de Google est 30 fois plus efficace que le premier TPU. Calcul tensoriel en hardware — pas en logiciel.

ac_unit

40%

Refroidissement liquide

Remplacer l'air par le liquide réduit l'infrastructure de 40% et permet des densités de rack 10 fois supérieures.

L'IA pour décarboner l'IA

99% d'énergie économisée sur la phase de recherche d'architecture

Les chercheurs de Copenhague ont utilisé une IA pour prédire quels modèles seraient efficaces — sans les entraîner tous. L'outil de sa propre décarbonation.

99%

Pression sur les réseaux électriques

415 TWh

Consommation 2024

1,5% de l'électricité mondiale. Attendu à 945 TWh d'ici 2030.

21%

Part de l'Irlande

Un cinquième de l'électricité nationale. Prévu à 32% dès 2026.

80%

Avantage Norvège

98% renouvelables + refroidissement naturel. TCO jusqu'à 80% inférieur à l'Europe centrale.

90%

Part de l'inférence

L'entraînement est ponctuel. L'utilisation quotidienne représente 70 à 90% de l'énergie totale.

"The intelligence we create
should not come at the cost
of the world we inhabit."

Editorial Intelligence — Bioluminescent Archive · 2026