Modus
Originalfassung 2026.0 Import-Version 2026.1-import Online-Referenz 2026.2-live-reference erste Online-Prüfung

Teil Messung, Daten und Methodik

Kapitel 32 - Benchmarks, Skalen und Scorecards

Originalfassung Volltextposition Quellen Glossar

Stand dieser Onlinefassung

Diese Seite ist Teil der lebenden Online-Referenz. Der Text basiert auf der zitierfähigen Originalfassung und wurde für die Webfassung strukturiert, verlinkt und gegen den aktuellen Begriffsstand eingeordnet.

Original2026.0bleibt zitierfähig
Onlinefassung2026.2-live-referencelesbar, verlinkt, versioniert
Prüfstandfachlich geprüftweitere Delta-Reviews laufen
Technische Versionsdaten anzeigen
Dokument-ID
woek-main-2026
Import-Version
2026.1-import
Live-Reference-Version
2026.2-live-reference
Terminologiebasis
WOeK_Begriffsleitfaden_fuehrend_v1.0.md
Terminologiebasis-Stand
2026-05-21
Source-Hash
f5779e4c35cd6b81080074b4bbbe33e0a2ea0c63fac39cff544630286a0f3ec4

Live-Reference-Hinweis 2026.2

Diese Seite gehört zur lebenden Online-Referenzfassung 2026.2-live-reference. Die Source-Original-Fassung bleibt über Originaldatei und Importversion zitierfähig; begriffliche Präzisierungen, Reviewstatus und Aktualisierungen werden im Live-Reference-Changelog dokumentiert.

Kapitel 32 - Benchmarks, Skalen und Scorecards

Kapitel 31 hat die WÖk-ID als Ordnungseinheit eingeführt. Sie macht Wirkungsindikatoren adressierbar, prüfbar und versionierbar. Damit ist jedoch noch keine Bewertung entstanden. Ein Messwert allein sagt nicht, ob eine Wirkung gut, schwach, riskant, durchschnittlich, schädlich oder transformativ ist. Ein Wasserverbrauch, eine Emissionsmenge, eine Unfallquote, ein Living-Wage-Anteil, ein Recyclingwert oder eine Transparenzkennzahl erhalten ihre Bedeutung erst durch Vergleich, Kontext und Schwellenwert.

Dieses Kapitel erklärt, wie aus Daten vergleichbare Bewertungen entstehen. Es führt Benchmarks, Wirkungsskalen und Scorecards als methodische Brücke zwischen Rohdaten und Wirkungseinschätzung ein. Scorecards sind keine moralischen Etiketten. Sie sind strukturierte Übersetzungen von Wirkungsdaten in nachvollziehbare Bewertung [I-K32-1][I-K32-2].

Die verbindliche Grenze bleibt klar: Dieses Kapitel erklärt noch nicht die Reverse Merit Order im Detail, keine Produktsteuer, keine konkrete Steuermechanik und keine rechtliche Anwendung. Es geht um die Bewertungslogik zwischen Daten, Schwellenwerten, Kontext und Wirkungsklassen.

32.1 Wirkungsskala von negativ bis transformativ

Eine Wirkungsskala übersetzt Messwerte in Bedeutung. Sie sagt nicht nur, dass ein Wert hoch oder niedrig ist. Sie ordnet ein, ob dieser Wert eine negative, neutrale, positive oder transformative Wirkung anzeigt. Ohne Skala bleiben Daten schwer verständlich. Mit einer schlechten Skala entsteht Scheingenauigkeit. Mit einer guten Skala wird sichtbar, in welchem Wirkungsbereich ein Zustand liegt.

Die Wirkungsökonomie arbeitet mit einer Skala von -3 bis +3. Der genaue Zuschnitt kann je nach Wirkungsfeld, Indikatorfamilie und Kontext variieren. Der Zweck bleibt gleich: Daten sollen nicht nur gesammelt, sondern in eine verständliche Wirkungsordnung überführt werden [I-K32-1][I-K32-4].

Tabelle 32-1: Wirkungsskala von -3 bis +3

ScoreWirkungsqualitätBeschreibungSteuerungsfolge
+3TransformativVerändert nicht nur einen Einzelzustand, sondern verschiebt Systembedingungen in Richtung Mensch, Planet und Demokratie.Maximale Entlastung, Bonus, bevorzugter Kapitalzugang oder Beschaffungsvorteil.
+2Sehr gutDeutlich positive Zustandsveränderung in relevanten Feldern, keine kritische Negativwirkung.Starke Entlastung oder positive Markt- und Kapitalrückkopplung.
+1GutPositive Wirkung bei solider Datenlage und ohne rote Linie.Entlastung oder positiver Schwellenstatus.
0NeutralKeine nachgewiesene relevante Negativwirkung, aber kein starker Positivbeitrag.Standardsignal, Übergangsstatus oder Beobachtung.
-1Schwach negativRelevante negative Wirkung oder unzureichende Leistung in einem wichtigen Feld.Malus, Verbesserungsauflage oder reduzierte Vorteile.
-2SchädlichStarke negative Wirkung oder kritischer Engpass.Hoher Malus, eingeschränkte Förderung, harte Korrekturanforderung.
-3Hoch schädlichRote Linie, schwere Schädigung oder nicht akzeptable Wirkung.Höchstsatz, Ausschluss, Sperrlogik oder rechtliche Begrenzung.

Eine solche Skala ist kein bloßer Übersetzungsmechanismus. Sie macht sichtbar, dass Wirkung nicht nur „vorhanden“ oder „nicht vorhanden“ ist. Zwischen Schaden und Transformation liegen Zwischenstufen. Ein Wert kann noch problematisch sein, aber besser als ein destruktiver Ausgangszustand. Ein anderer Wert kann neutral sein, also keine relevante Verbesserung erzeugen. Wieder ein anderer kann positiv sein, aber noch nicht systemisch transformativ. Transformativ ist eine Wirkung erst dann, wenn sie nicht nur einen Einzelwert verbessert, sondern einen Zukunftspfad verändert, Regeneration ermöglicht, Risiken senkt oder positive Rückkopplungen erzeugt.

Die Skala schützt vor zwei Fehlern. Der erste Fehler wäre Schwarz-Weiß-Bewertung. Dann wird alles entweder gut oder schlecht. Diese Logik verfehlt Übergänge, Lernprozesse und Transformation. Der zweite Fehler wäre Beliebigkeit. Dann wird jeder kleine Fortschritt schon als nachhaltig oder positiv bezeichnet. Diese Logik entwertet echte Transformation.

Eine Wirkungsskala braucht daher klare Schwellen. Sie muss zeigen, wann ein Wert noch schädlich ist, wann er neutral wird, wann er positive Wirkung anzeigt und wann er transformativ wirkt. Diese Schwellen dürfen nicht aus Kommunikation oder Wunschdenken entstehen. Sie müssen aus Daten, wissenschaftlichen Referenzen, regulatorischen Standards, Branchenbenchmarks, Wirkungspfaden und normativen Mindestanforderungen abgeleitet werden [I-K32-2][E-K32-1][E-K32-2].

Wichtig ist: Die Skala bewertet nicht den Menschen, der handelt. Sie bewertet eine Wirkung in einem definierten Wirkungsraum. Diese Trennung ist methodisch notwendig. Wer Wirkung misst, darf nicht moralisch etikettieren. Eine Score-Stufe sagt nicht: Eine Person ist gut oder schlecht. Sie sagt: Ein bestimmter Indikatorwert liegt in einem bestimmten Wirkungsbereich.

32.2 Benchmarks nach Branche und Kontext

Benchmarks sind Vergleichsmaßstäbe. Sie beantworten die Frage: Womit wird ein Messwert verglichen? Ohne Benchmark bleibt ein Wert leer. Zehn Tonnen Emissionen können je nach Produkt, Branche, Menge, Standort und Lebenszyklus sehr hoch, moderat oder niedrig sein. Ein Wasserverbrauch kann in einer wasserreichen Region anders zu bewerten sein als in einer Stressregion. Ein Lohnwert kann je nach Lebenshaltungskosten, Arbeitszeit, Tarifbindung und Lieferkettenstufe unterschiedliche Bedeutung haben.

Die Wirkungsökonomie braucht deshalb Branchen- und Kontextbenchmarks. Ein Wert wird nicht abstrakt bewertet, sondern im Verhältnis zu Aktivität, Branche, Region, Systemgrenze und Wirkungsfeld. Die technischen Leitlinien der WÖk nennen sektorspezifische Referenzwerte, Archetypen und Benchmarks als methodische Grundlage, damit Messwerte nicht frei interpretiert werden, sondern in nachvollziehbare Bewertungsrahmen eingehen [I-K32-1].

Branchenbenchmarks verhindern falsche Vergleichbarkeit. Eine Schule, ein Stahlwerk, ein Pflegeheim, ein Medienhaus, ein Textilprodukt, ein Wohngebäude, eine Bank und eine digitale Plattform erzeugen unterschiedliche Wirkungen. Sie dürfen nicht mit derselben Indikatorenmischung bewertet werden. Gleichwohl können sie über gemeinsame Wirkungsdimensionen verbunden werden: Mensch, Planet und Demokratie. Vergleichbarkeit entsteht also nicht durch Gleichsetzung, sondern durch geordnete Übersetzung.

Kontextbenchmarks verhindern ebenfalls Verzerrung. Ein niedriger Wasserverbrauch kann noch problematisch sein, wenn er in einem extrem wasserarmen Gebiet entsteht. Ein hoher Energiebedarf kann anders zu bewerten sein, wenn er unvermeidbare Grundversorgung sichert oder aus vermeidbarer Verschwendung stammt. Ein Beschäftigungswert kann positiv erscheinen, aber durch schlechte Arbeitsbedingungen, Gesundheitsrisiken oder fehlende Mitbestimmung relativiert werden. Ein emissionsarmer Prozess kann gesellschaftlich schädlich sein, wenn er auf Zwangsarbeit, Biodiversitätsverlust oder demokratisch problematischer Abhängigkeit beruht.

Benchmarks müssen daher mehrere Ebenen verbinden. Sie brauchen wissenschaftliche Referenzen, regulatorische Vorgaben, Branchenwerte, regionale Bedingungen, Lebenszyklusbezug, Mindeststandards und Transformationspfade. Ein guter Benchmark ist nicht nur Durchschnitt. Durchschnitt kann eine schlechte Realität stabilisieren. Wenn eine ganze Branche schädlich arbeitet, kann der Branchendurchschnitt nicht automatisch als neutral gelten. Der Benchmark muss sich an Wirkung orientieren, nicht nur an vorhandener Praxis.

Damit wird ein wichtiger Unterschied sichtbar: Ein statistischer Durchschnitt beschreibt, was üblich ist. Ein Wirkungsbenchmark beschreibt, was gemessen an Mensch, Planet und Demokratie tragfähig oder transformativ ist. Beide Informationen können nützlich sein. Sie dürfen aber nicht verwechselt werden.

32.3 Scorecard-Aufbau

Abbildung 40 aus Die neue Ordnung des Wohlstands: Kapitel 32 - Benchmarks, Skalen und Scorecards
Abbildung 40 aus Die neue Ordnung des Wohlstands. Quelle: Hauptwerk, Kapitel 32 - Benchmarks, Skalen und Scorecards.

Eine Scorecard bündelt mehrere Indikatoren zu einer strukturierten Wirkungsbewertung. Sie besteht nicht aus zufällig ausgewählten Kennzahlen. Sie ordnet relevante WÖk-IDs, Datenquellen, Benchmarks, Schwellenwerte, Skalenlogik und Kontextinformationen zu einem Wirkungsfeld.

Der Aufbau einer Scorecard beginnt mit der Frage, was bewertet wird. Ein Produkt, eine Dienstleistung, eine Organisation, ein Kapitalfluss, eine Tätigkeit, ein Gebäude, eine Lieferkette oder eine öffentliche Maßnahme haben unterschiedliche Wirkungsprofile. Danach folgt die Auswahl der relevanten Indikatorfamilien. Je nach Wirkungsfeld können Klima, Wasser, Ressourcen, Arbeit, Gesundheit, Sicherheit, Bildung, Teilhabe, Transparenz, Medienqualität, Demokratie, Resilienz oder digitale Verantwortung relevant sein [I-K32-3][I-K32-4].

Im nächsten Schritt werden Messwerte erfasst. Diese Messwerte stammen aus Datenquellen, die im vorherigen Kapitel eingeführt wurden: Berichte, Audits, Lebenszyklusanalysen, amtliche Daten, Lieferkettendaten, Branchenwerte, wissenschaftliche Quellen, Sensorik oder qualifizierte Schätzungen. Danach werden die Werte gegen Benchmarks gelesen. Erst dieser Vergleich erlaubt die Übersetzung in eine Wirkungsskala.

Eine Scorecard enthält damit mindestens fünf Ebenen. Die erste Ebene ist der Indikator. Die zweite Ebene ist der Messwert. Die dritte Ebene ist der Benchmark. Die vierte Ebene ist die Übersetzung in eine Wirkungsskala. Die fünfte Ebene ist die systemische Einordnung: Welche Wirkung entsteht im Zusammenhang? Eine Scorecard ist deshalb mehr als ein Punkteschema. Sie ist ein geordnetes Bewertungsinstrument, das Daten, Kontext und normativen Maßstab verbindet [I-K32-1][E-K32-1].

Tabelle 32-2: Aufbau einer Scorecard

ElementFunktion
BewertungsgegenstandProdukt, Dienstleistung, Tätigkeit, Investition, Immobilie, Unternehmen, Medium, Gesetz oder Programm.
KlassifikationNACE-Code, Produktgruppe, Funktionsklassifikation oder Wirkungsraum.
SDG-/SDG+-BezugNormativer Zielbezug und Anschluss an Mensch, Planet und Demokratie.
WÖk-IDsKonkrete Indikatoren mit Einheit, Datenquelle, Schwelle und Bewertungslogik.
MesswerteGeprüfte, plausibilisierte, geschätzte oder als Standardwert gesetzte Daten.
ArchetypBewertungsfunktion, etwa lower_is_better, higher_is_better oder near_zero_better.
BenchmarkSektoraler, regionaler oder technischer Vergleichswert.
EinzelscoreScore je Wirkungsfeld von -3 bis +3.
DatenqualitätGeprüft, plausibilisiert, geschätzt, Standardwert oder Datenlücke.
AusschlussindikatorenRote Linien, die Kompensation verhindern.
FinalScoreSteuerungsfähige Gesamtbewertung nach Reverse Merit Order.
Version und PrüfstatusMethodenstand, Assurance, Audit, Stichprobe oder Revisionsstatus.

Scorecards müssen lesbar und prüfbar sein. Lesbarkeit bedeutet, dass Akteure verstehen, warum ein Wert zu einer bestimmten Bewertung führt. Prüfbarkeit bedeutet, dass Datenquelle, Einheit, Systemgrenze, Zeitraum, Benchmark, Bewertungslogik und Unsicherheit nachvollziehbar sind. Ohne Lesbarkeit entsteht Misstrauen. Ohne Prüfbarkeit entsteht Willkür.

Gleichzeitig darf eine Scorecard nicht vorgaukeln, jede Wirkung sei vollständig abgeschlossen bewertbar. Komplexe Wirkungen bleiben teilweise unsicher. Deshalb braucht jede Scorecard Platz für Datenqualität, Unsicherheitsgrad, methodische Annahmen, offene Punkte und Aktualisierungsstatus. Ein Score ohne Hinweis auf Datenqualität ist riskant. Er kann Präzision vortäuschen, wo nur grobe Annäherung vorliegt [I-K32-2].

Scorecards übersetzen Wirkung in Bewertung, aber sie ersetzen kein Urteil. Sie sind Teil einer lernenden Architektur. Wenn neue Daten, bessere Benchmarks oder veränderte Systemzustände sichtbar werden, muss eine Scorecard angepasst werden können. Starrheit wäre hier ebenso falsch wie Beliebigkeit.

32.4 Der Netto-Wirkungs-Index als operative Wirkungskennzahl

Der Netto-Wirkungs-Index, kurz NWI, ist die operative Kennzahl der Wirkungsökonomie für die Bewertung von Netto-Wirkung [I-K32-6].

Er misst nicht einzelne Wirkung. Er misst auch nicht Transformation. Der NWI bündelt die bewertete Gesamtwirkung eines Produkts, einer Dienstleistung, einer Tätigkeit, eines Unternehmens, einer Investition, eines Gesetzes, eines Haushaltsprogramms oder einer öffentlichen Maßnahme in einem definierten Wirkungsraum [I-K32-6].

Damit schließt der NWI die Lücke zwischen Einzeldaten und Steuerung. Einzelne Indikatoren zeigen Messwerte. Scorecards ordnen diese Messwerte Wirkungsfeldern zu. Benchmarks übersetzen sie in Bewertung. Der NWI führt diese Bewertung zu einer operativen Netto-Wirkungskennzahl zusammen [I-K32-1][I-K32-6].

Der NWI berücksichtigt positive und negative Wirkungen, Mindestbedingungen, Ausschlussindikatoren, Datenqualität, Unsicherheit, Zeitwirkung und Systemkontext. Er ist deshalb keine einfache Addition guter und schlechter Werte. Schwere negative Wirkungen in kritischen Feldern dürfen nicht durch gute Werte in anderen Feldern neutralisiert werden. Die Reverse Merit Order bleibt deshalb ein methodischer Kern des NWI [I-K32-4][I-K32-6].

Ein hoher NWI bedeutet: Der Bewertungsgegenstand erzeugt im definierten Wirkungsraum eine positive Netto-Wirkung. Ein niedriger oder negativer NWI bedeutet: Die Gesamtwirkung ist kritisch, schädlich oder nicht ausreichend tragfähig. Ein mittlerer NWI kann anzeigen, dass positive und negative Wirkungen nebeneinander bestehen, dass Datenqualität fehlt, dass Unsicherheit hoch ist oder dass Mindestbedingungen nicht stabil erfüllt sind [I-K32-2][I-K32-6].

Der NWI ist damit die Kennzahl für operative Vergleichbarkeit. Er kann in Produktbewertungen, Lieferketten, Investitionsentscheidungen, öffentlicher Beschaffung, Wirkungssteuern, Wirkungshaushalten, Unternehmenscontrolling und öffentlichen Programmen verwendet werden. Er beantwortet die Frage: Wie ist die Netto-Wirkung dieses Bewertungsgegenstands im Vergleich zu einem definierten Maßstab zu beurteilen? [I-K32-6]

Methodisch ist der NWI eine zusammengesetzte Kennzahl. Deshalb muss er besonders transparent konstruiert werden. Es muss sichtbar bleiben, welche Indikatoren einbezogen wurden, welche Gewichtung oder Engpasslogik gilt, welche Datenqualität vorliegt, welche Felder kritisch sind und welche Unsicherheiten bestehen. Eine zusammengesetzte Kennzahl darf Orientierung geben, aber sie darf die zugrunde liegenden Wirkungsprofile nicht verdecken [E-K32-1].

Der NWI ersetzt deshalb keine Scorecard. Er verdichtet sie. Die Scorecard bleibt die prüfbare Struktur aus Bewertungsgegenstand, Klassifikation, SDG-/SDG+-Bezug, WÖk-IDs, Messwerten, Benchmarks, Archetypen, Einzelscores, Datenqualität, Ausschlussindikatoren, Prüfstatus und Version. Der NWI ist die daraus abgeleitete operative Netto-Wirkungskennzahl [I-K32-1][I-K32-6].

Ebenso ersetzt der NWI keine Lebenszyklusanalyse, keine ESRS-Berichterstattung, keine GRI-Offenlegung und kein Impact-Metriksystem. Solche Standards und Methoden liefern Daten, Systemgrenzen, Metriken, Berichtsinformationen oder Vergleichslogiken. Der NWI nutzt solche Informationen, ordnet sie aber in die Wirkungslogik von Mensch, Planet und Demokratie ein [E-K32-2][E-K32-3][E-K32-4][E-K32-5].

Vom T-SROI unterscheidet sich der NWI klar. Der NWI bewertet Netto-Wirkung. Der T-SROI bewertet Transformationswirkung. Ein Produkt kann einen hohen NWI haben, ohne ein System zu verändern. Eine Investition kann einen moderaten NWI haben und dennoch hohe Transformationswirkung entfalten, wenn sie neue Infrastruktur, neue Standards, neue Märkte oder neue Verhaltenspfade ermöglicht [I-K32-6][I-K32-7].

Diese Trennung verhindert eine methodische Überladung des T-SROI. Nicht jede positive Wirkung ist Transformation. Nicht jede Transformation zeigt sich sofort in hohen operativen Wirkungswerten. Deshalb braucht die Wirkungsökonomie beide Kennzahlen: den NWI für die operative Netto-Wirkung und den T-SROI für die systemische Transformationsleistung [I-K32-6][I-K32-7].

Der NWI bleibt dabei lernfähig. Wenn neue Daten, bessere Benchmarks, veränderte Systemzustände, neue Risiken oder neue wissenschaftliche Erkenntnisse vorliegen, muss die Berechnung angepasst werden können. Ein NWI ist keine endgültige Wahrheit. Er ist eine geprüfte, versionierte und nachvollziehbare Bewertung auf dem jeweiligen Methodenstand [I-K32-1][I-K32-2].

Damit wird aus der Scorecard ein steuerungsfähiges Instrument. Die Scorecard zeigt das Wirkungsprofil. Der NWI verdichtet dieses Profil zur operativen Netto-Wirkungskennzahl. Der T-SROI fragt anschließend, ob aus dieser Wirkung eine systemische Transformation entsteht.

32.5 Vergleichbarkeit ohne Gleichmacherei

Eine Wirkungsökonomie braucht Vergleichbarkeit. Ohne Vergleichbarkeit entstehen keine Orientierung, keine Steuerung, keine Rückkopplung und keine lernfähigen Märkte. Gleichzeitig darf Vergleichbarkeit nicht mit Gleichmacherei verwechselt werden [I-K32-8].

Produkte, Unternehmen, Infrastrukturen, Plattformen, Gebäude, Schulen, Krankenhäuser, Fonds, Lieferketten oder politische Maßnahmen erzeugen unterschiedliche Wirkungen in unterschiedlichen Wirkungsräumen. Sie können deshalb nicht mit identischen Indikatoren, identischen Gewichtungen oder identischen Datenlogiken bewertet werden. Eine Schule wirkt anders als ein Stahlwerk. Ein Pflegeheim wirkt anders als eine Social-Media-Plattform. Eine Wasserleitung wirkt anders als ein Fondsprodukt. Trotzdem müssen alle in eine gemeinsame Wirkungsarchitektur eingeordnet werden können [I-K32-8].

Die Wirkungsökonomie löst dieses Problem nicht durch vollständige Vereinheitlichung, sondern durch geordnete Übersetzung. Vergleichbarkeit entsteht nicht dadurch, dass alle dasselbe messen. Vergleichbarkeit entsteht dadurch, dass unterschiedliche Wirkungen auf gemeinsame Wirkungsdimensionen bezogen werden: Mensch, Planet und Demokratie [I-K32-8].

Dadurch können unterschiedliche Bewertungslogiken nebeneinander bestehen, ohne beliebig zu werden. Ein Textilprodukt braucht andere Indikatoren als ein Kreditportfolio. Ein Wohngebäude braucht andere Benchmarks als ein Medienunternehmen. Ein Krankenhaus braucht andere Schwellenwerte als ein Rechenzentrum. Dennoch können alle hinsichtlich ihrer Netto-Wirkung vergleichbar gemacht werden, weil sie innerhalb derselben Wirkungsarchitektur bewertet werden [I-K32-1][I-K32-8].

Diese Architektur verbindet:

gemeinsame Grundlogiken,

aber unterschiedliche Kontextmodelle.

Gemeinsam bleiben:

die Wirkungsdimensionen,

die Skalenlogik,

die Datenqualitätsanforderungen,

die Nichtkompensation kritischer Schäden,

die Reverse Merit Order,

die Trennung zwischen Netto-Wirkung und Transformationswirkung,

die Transparenz der Bewertungslogik [I-K32-4][I-K32-6][I-K32-7][I-K32-8].

Unterschiedlich bleiben:

Indikatorfamilien,

Benchmarks,

Systemgrenzen,

Wirkungsräume,

Materialität,

Transformationspfade,

Datenquellen,

technische Bewertungslogiken [I-K32-2][I-K32-3][I-K32-8].

Gerade dadurch wird Vergleichbarkeit erst sinnvoll. Ein Durchschnittswert ohne Kontext erzeugt Scheingenauigkeit. Eine vollständig standardisierte Bewertung ignoriert reale Unterschiede. Eine vollständig individuelle Bewertung verhindert dagegen jede Orientierung. Die Wirkungsökonomie versucht deshalb, zwischen Beliebigkeit und Vereinheitlichung eine lernfähige Mitte zu schaffen [I-K32-8][E-K32-1].

Das gilt auch für den Netto-Wirkungs-Index. Der NWI ist keine universelle „Supernote“, die alle Unterschiede verschwinden lässt. Er verdichtet unterschiedliche Wirkungsprofile zu einer operativen Netto-Wirkungskennzahl, ohne deren Herkunft unsichtbar zu machen. Deshalb bleibt die zugrunde liegende Scorecard immer mit dem NWI verbunden [I-K32-6][I-K32-8].

Noch deutlicher wird dies beim T-SROI. Transformationswirkung ist besonders kontextabhängig. Dieselbe Investition kann in unterschiedlichen Systemzuständen völlig unterschiedliche Transformationswirkung entfalten. Eine Solarinvestition in einem fossil geprägten Energiesystem hat andere Hebelwirkung als dieselbe Investition in einem bereits weitgehend regenerativen System. Eine Bildungsinvestition wirkt anders in einer stabilen Demokratie als in einer polarisierten Öffentlichkeit. Transformation lässt sich deshalb nicht mechanisch standardisieren [I-K32-7][I-K32-8].

Vergleichbarkeit ohne Gleichmacherei bedeutet daher:

gemeinsame Wirkungslogik,

aber kontextsensible Anwendung,

gemeinsame Bewertungsprinzipien,

aber unterschiedliche Wirkungsräume,

gemeinsame Transparenzstandards,

aber unterschiedliche Transformationspfade.

Die Wirkungsökonomie sucht deshalb keine perfekte Einheitsskala für alle Wirklichkeit. Sie sucht eine nachvollziehbare, prüfbare und lernfähige Architektur, in der unterschiedliche Wirklichkeiten vergleichbar werden, ohne ihre Unterschiede zu verlieren [I-K32-8][E-K32-1].

32.6 Zwischenfazit

Kapitel 31 hat die WÖk-ID als Adresse der Wirkung eingeführt. Kapitel 32 hat gezeigt, wie aus adressierten Daten Bewertung entsteht. Eine Wirkungsskala übersetzt Messwerte in Wirkungsbereiche von negativ bis transformativ. Benchmarks geben Messwerten Bedeutung, müssen aber branchenspezifisch, kontextsensibel und an Wirkung ausgerichtet sein. Scorecards verbinden Indikatoren, Messwerte, Benchmarks, Datenqualität und Wirkungsklassen zu einer nachvollziehbaren Bewertung [I-K32-1][I-K32-2].

Mit dem Netto-Wirkungs-Index kommt nun eine operative Verdichtung hinzu. Der NWI macht die Netto-Wirkung eines Bewertungsgegenstands steuerungsfähig, ohne das zugrunde liegende Wirkungsprofil zu verdecken. Er ist keine einfache Durchschnittsnote, kein Ersatz für die Scorecard und keine Transformationskennzahl. Er ist die operative Kennzahl für Netto-Wirkung [I-K32-6].

Damit wird ein zentraler methodischer Schritt erreicht. Wirkung bleibt nicht als Datenpunkt liegen. Sie wird bewertbar. Scorecards machen die Bewertung prüfbar. Der NWI macht sie operativ vergleichbar. Zugleich bleibt die Bewertung begrenzt, transparent und lernfähig. Scorecards und NWI sind keine moralischen Etiketten. Sie sind strukturierte Übersetzungen von Wirkungsdaten in nachvollziehbare Bewertung [I-K32-1][I-K32-2][E-K32-1].

Die nächste Frage lautet: Was geschieht, wenn eine Scorecard in mehreren Feldern gute Werte zeigt, aber ein kritisches Feld schwer schädlich ist? Darf ein positiver Wert einen schweren Schaden ausgleichen? Oder muss das schwächste kritische Feld die Gesamtbewertung begrenzen?

Diese Frage führt zu Kapitel 33: Reverse Merit Order.

Endnoten und Quellen zu Kapitel 32

Interne WÖk-Quellen

[I-K32-1] Weber, Natalie: Technische Leitlinien zum Wirkungssteuergesetz (WUStG) - Vollversion Extended, August 2025. Grundlage für Wirkungsindikatoren, WÖk-IDs, Archetypen-Logik, sektorale Benchmarks, Vorlagen für Scorecards, Datenquellen, Assurance und Governance. In diesem Kapitel werden nur die methodischen Elemente Datenquellen, Archetypen, Benchmarks, Skalen und Scorecards genutzt, nicht die Steuermechanik.

[I-K32-2] Weber, Natalie: WÖk Master Items final v1.2, 2025. Grundlage für Indikatorfamilien, SDG- und SDG+-Bezüge sowie die Strukturierung von Wirkungsfeldern wie Arbeit, Wasser, Gesundheit, Bildung, Gleichstellung, Gebäude, Stadtgrün, Abfall, Datenschutz, Medien, Demokratie, Resilienz und Technologieverantwortung.

[I-K32-3] Weber, Natalie: Produktbesteuerung durch Wirkung, 2025. Grundlage für die methodische Darstellung von Produktdaten, Scorecards, Benchmark-Archetypen, Datenfluss, digitalen Produktpässen und der Skala von -3 bis +3 in Produkt- und Wirkungsfeldern. In diesem Kapitel wird daraus nur die Bewertungslogik übernommen, nicht die Produktsteuerung.

[I-K32-4] Weber, Natalie: Wirkungsökonomie in der Lieferkette, 2025. Grundlage für die Verbindung internationaler Standards wie SDGs, ESRS, GRI und ILO mit Indikatoren, Benchmarks, Datenqualität und Scorecards. In diesem Kapitel nur als methodischer Beleg für die Scorecard-Architektur verwendet.

[I-K32-5] Weber, Natalie: Die neue Ordnung des Wohlstands, Manuskriptfassung 2026. Grundlage für die Abgrenzung von Messwert, Schätzung, Plausibilität, Unsicherheit, Ambivalenz und Offenheit sowie für die Einordnung von Bewertung als Verbindung aus empirischer, systemischer und normativer Ebene.

[I-K32-6] Weber, Natalie: Die neue Ordnung des Wohlstands. Begründung und Grundlagen der Wirkungsökonomie, Manuskriptfassung 2026, insbesondere Kapitel 16 „Das Begriffssystem der Wirkungsökonomie“. Grundlage für die Definition des Netto-Wirkungs-Index als operative Kennzahl zur Bewertung von Netto-Wirkung sowie für die Abgrenzung von Wirkung, Netto-Wirkung und Transformationswirkung.

[I-K32-7] Weber, Natalie: Whitepaper T-SROI - Der neue Standard für Impact-Controlling in der Wirkungsökonomie, September 2025. Grundlage für die Abgrenzung des T-SROI als Kennzahl systemischer Transformationswirkung, für den Transformationsmultiplikator, systemische Breitenwirkung, Resilienz und die Unterscheidung zwischen operativer Netto-Wirkung und Transformationsleistung.

[I-K32-8] Weber, Natalie: Die neue Ordnung des Wohlstands. Begründung und Grundlagen der Wirkungsökonomie, Manuskriptfassung 2026. Grundlage für die methodische Unterscheidung zwischen Vergleichbarkeit und Gleichmacherei, für die geordnete Übersetzung unterschiedlicher Wirkungsräume in gemeinsame Wirkungsdimensionen sowie für die Trennung von gemeinsamer Wirkungslogik und kontextspezifischer Bewertung.

Externe Quellen

[E-K32-1] OECD; Joint Research Centre of the European Commission: Handbook on Constructing Composite Indicators. Methodology and User Guide, OECD Publishing, Paris, 2008. Bezugspunkt für Normalisierung, Gewichtung, Aggregation, Sensitivitätsanalyse, Transparenz und Risiken zusammengesetzter Indikatoren. OECD/JRC - Handbook on Constructing Composite Indicators: https://www.oecd.org/en/publications/handbook-on-constructing-composite-indicators-methodology-and-user-guide_9789264043466-en.html.

[E-K32-2] International Organization for Standardization: ISO 14040: Environmental management - Life cycle assessment - Principles and framework, 2006; ISO 14044: Environmental management - Life cycle assessment - Requirements and guidelines, 2006. Bezugspunkt für Systemgrenzen, funktionelle Einheiten, Datenqualität, Allokation, Vergleichbarkeit und Transparenz in Lebenszyklusbewertungen. ISO 14044: https://www.iso.org/standard/38498.html.

[E-K32-3] Europäische Kommission: Delegierte Verordnung (EU) 2023/2772 zu den European Sustainability Reporting Standards (ESRS). Bezugspunkt für strukturierte Nachhaltigkeitsdaten, Wesentlichkeit, Angaben zu Auswirkungen, Risiken und Chancen sowie anschlussfähige Metriken und Berichtslogiken. EUR-Lex: https://eur-lex.europa.eu/eli/reg_del/2023/2772/oj/eng.

[E-K32-4] Global Reporting Initiative: GRI Standards. Bezugspunkt für globale Nachhaltigkeitsberichterstattung, Themenstandards, Wirkungsbezug und vergleichbare Offenlegung von Auswirkungen auf Wirtschaft, Umwelt und Menschen. GRI Standards: https://www.globalreporting.org/standards/.

[E-K32-5] Global Impact Investing Network: IRIS+ System / Impact Toolkit. Bezugspunkt für die Standardisierung von Impact-Kennzahlen, Wirkungskategorien, Datenklarheit, Vergleichbarkeit und Impact-Metriken im Impact-Investing-Kontext. IRIS+ / GIIN Impact Toolkit: https://impacttoolkit.thegiin.org/irisplus/; GIIN: https://thegiin.org/

[E-K32-6] Europäische Kommission: EU Taxonomy for sustainable activities; Delegierte Verordnungen mit technischen Bewertungskriterien. Bezugspunkt für technische Screening-Kriterien, Umweltziele und sektorale Nachhaltigkeitsanforderungen. European Commission - EU Taxonomy: https://finance.ec.europa.eu/sustainable-finance/tools-and-standards/eu-taxonomy-sustainable-activities_en.

[E-K32-7] Intergovernmental Panel on Climate Change: Climate Change 2023 - AR6 Synthesis Report. Bezugspunkt für wissenschaftliche Klimarisiken, Emissionspfade, Minderungsanforderungen und Transformationsbezug von Klimabenchmarks. IPCC AR6 Synthesis Report: https://www.ipcc.ch/report/ar6/syr/.

[E-K32-8] World Health Organization: WHO global air quality guidelines, 2021. Bezugspunkt für gesundheitsbezogene Grenzwerte und Leitlinien zu PM2.5, PM10, Ozon, NO2, SO2 und CO. WHO: https://www.who.int/publications/i/item/9789240034228. (Weltgesundheitsorganisation)

[E-K32-9] International Labour Organization: Decent Work Indicators; Living Wages. Bezugspunkt für menschenwürdige Arbeit, Arbeitsindikatoren, Lohnbezug und soziale Mindestanforderungen. ILO Decent Work Indicators: https://www.ilo.org/sites/default/files/wcmsp5/groups/public/%40dgreports/%40integration/documents/publication/wcms_229374.pdf; ILO Living Wages: https://www.ilo.org/topics-and-sectors/wages/living-wages.

[E-K32-10] Europäische Kommission: Commission Recommendation (EU) 2021/2279 on the use of the Environmental Footprint methods to measure and communicate the life cycle environmental performance of products and organisations. Bezugspunkt für Product Environmental Footprint (PEF), Organisation Environmental Footprint (OEF) und lebenszyklusbezogene Produktbewertung. EUR-Lex: https://eur-lex.europa.eu/eli/reco/2021/2279/oj/eng. (EUR-Lex)

[E-K32-11] Science Based Targets initiative: Corporate Net-Zero Standard. Bezugspunkt für wissenschaftsbasierte Netto-Null-Ziele, 1,5-Grad-kompatible Zielsetzung und unternehmerische Emissionspfade. SBTi: https://sciencebasedtargets.org/net-zero.

[E-K32-12] World Resources Institute: Aqueduct Water Risk Atlas. Bezugspunkt für Wasserstress, Wasserknappheit, Wasserverbrauch im Standortkontext und risikobasierte Wasserindikatoren. WRI Aqueduct: https://www.wri.org/applications/aqueduct/water-risk-atlas/.

[E-K32-13] Eurostat: NACE Rev. 2.1 - Statistical classification of economic activities in the European Union - 2025 edition. Bezugspunkt für die Klassifikation wirtschaftlicher Aktivitäten und die Zuordnung von Wirkungsindikatoren zu Branchen, Produktgruppen und statistischen Vergleichsräumen. Eurostat: https://ec.europa.eu/eurostat/web/products-manuals-and-guidelines/w/ks-gq-24-007.

Zentrale Begriffe dieses Kapitels

Scorecard

Eine Scorecard strukturiert Wirkungsfelder, Indikatoren, Datenqualität und Bewertung.

FinalScore

Der FinalScore ist ein methodisch verdichtetes Ergebnis einer Wirkungsbewertung.

NWI

Der Netto-Wirkungs-Index bewertet operative Netto-Wirkung.

Benchmark

Ein Benchmark ist ein Vergleichs- oder Schwellenwert, an dem Wirkung, Datenqualität oder Risiken eingeordnet werden.

Netto-Wirkung

Netto-Wirkung beschreibt die bewertete Gesamtwirkung unter Berücksichtigung positiver, negativer und neutraler Wirkungen.