| Die hier vorgestellten "baudaten" basieren mehrheitlich auf statistischen Grundlagen.
Diskret verteilte Erhebungszahlen zur Darstellung der "Klimadaten" und der "Produktedaten" werden bestmöglich an eine mathematisch definierte, sogenannt logistische Summenfunktion angelehnt und in kontinuierlicher Verteilungsdichte abgebildet.
Bei symmetrischer Annäherung kommt eine logistische S-Kurve zur Anwendung, welche mit jener zur gaussschen Normalverteilung fast deckungsgleich ist. Für asymmetrische Verteilungen stehen analoge S-Kurven - mit Wendepunkt bei e-1 resp.(1- e-1), statt bei 0.5 aus symmetrischer Verteilung - zur Verfügung.
Die Summenfunktionen sind wie folgt definiert:
mit Wendepunkt 0.5: (%) = e(A+B. xi) . (e(A+B. xi) + 1)-1 . 100
mit Wendepunkt e-1: (%) = e -A. (e ^ (B. xi)) . 100
mit Wendepunkt 1-e-1: (%) = [1 - e -A . (e ^ (-B.xi))] . 100
Die spezifische Verteilungsdichte i folgt einer "Glockenkurve" aus 1. Ableitung der Summenfunktion
Die Abweichungen zwischen der symmetrisch - logistischen S-Kurve und der gaussschen Normalverteilung sind unten tabelliert; sie sind für die Praxis bedeutungslos.
| Abweichung ± z von der 50% - Symmetrieachse |
(Teil -) Summen -differenz in Promillen |
| 0.00 |
± 0.0 |
| 0.05 |
+ 0.9 |
| 0.10 |
+ 1.8 |
| 0.15 |
+ 2.6 |
| 0.25 |
+ 4.1 |
| 0.50 |
+ 5.8 |
| 0.60 |
+ 5.6 |
| 0.70 |
+ 4.8 |
| 0.80 |
+ 3.6 |
|
| Abweichung ± z von der 50% - Symmetrieachse |
(Teil -) Summen -differenz in Promillen |
| 0.90 |
+ 2.0 |
| 1.00 |
± 0.0 |
| 1.25 |
- 4.8 |
| 1.50 |
- 8.8 |
| 1.75 |
-11.1 |
| 2.00 |
-11.5 |
| 2.50 |
- 9.0 |
| 2.90 |
- 6.0 |
| 2.99 |
- 5.3 |
|
Differenzen zwischen den Teilsummen nach symmetrisch - logistischer S - Funktion und gaussscher Normalverteilung (Annäherung nach Hastings); in (±) - Promilleangaben.
- negativ: Teilsumme nach S-Kurve = kleiner
- positiv : Teilsumme nach S-Kurve = grösser
Wie erwähnt, ist der "Fehler" der hier verwendeten S-Kurve praktisch bedeutungslos und wird durch verschiedene Vorbehalte gegenüber den Ergebnissen aus gaussscher Normalverteilung weiter relativiert:
- Mangels grafischer Darstellungsmöglichkeit der GaussVerteilung fehlt bei dieser - im Sinne einer Regressionsanalyse mit Korrelationskoeffizient - ein visualisierter Bezug der Stichprobenserie zur angenommenen Verteilungsfunktion.
- Eine Stichprobenanalyse nach gaussscher Normalverteilung führt nur dann zu einer exakten Prognose über die Verteilung der Gesamtpopulation, wenn sich die exakte Normalverteilung durch vollständiges Auszählen - gewissermassen im Sinne der Nachkalkulation - tatsächlich bestätigen sollte. Andernfalls sind selbst die auf sogenannten k-Werten (Koeffizienten für Toleranzintervalle) basierenden Vertrauensbereiche von Erwartungswerten ihrerseits wiederum mit Toleranzen behaftet.
- Die genormte Normalverteilung geht von einem symmetrischen Streubereich im gesamten Zahlenspektrum von + unendlich bis - unendlich aus. Bei arithmetischem Mittelwert aus relativ grosser Streuung im Nahbereich des Wertes Null können sich - wenn der Wert Null in Wirklichkeit aus praktischen oder physikalischen Gründen nicht unterschritten werden kann - erhebliche Abweichungen in der berechneten Häufigkeitsverteilung der Gesamtpopulation zur Realität ergeben.
- Mangels alternativer Verteilungsfunktionen trifft die "statistische Lehre nach Gauss" eine Vorselektion unter den gezogenen Stichprobewerten hinsichtlich ihrer Verwendbarkeit innerhalb einer Gaussverteilung. Stehen einzelne Stichproben diesbezüglich in ungünstiger Relation zum (zufälligen) arithmetischen Mittelwert der Stichprobenserie, werden sie aus der Erhebungsliste gestrichen! Mit anderen Worten: Bei ungenügender Verträglichkeit einer Stichprobenserie wird das Zufallsergebnis der Stichprobe auf Verwendbarkeit "nach Gauss" hin angepasst. Damit aber wird die auf dem Zufallsprinzip basierende Prognose über die Verteilung einer Gesamtpopulation schon vor der eigentlichen Auswertung verfälscht.
Diesen Vorbehalten gegenüber gelebter (und gelehrter) Praxis steht mit der hier verwendeten, "gauss- ähnlichen" S-Funktion die Möglichkeit offen, mittels Regressionsanalyse die tatsächliche Verteilung und Korrelation der Messwerte bildlich darzustellen und zu beziffern. Davon ausgehend kann in der Folge ebenfalls das Vertrauensniveau für einen bestimmten Fraktilwert in Abhängigkeit des gewünschten Toleranzintervalls - hier ausgehend vom wahrscheinlichsten Erwartungswert der Gesamtpopulation aufgrund der Stichproben (Wendepunkt xs), und unter Berücksichtigung des zugehörigen Korrelationskoeffizienten r - angegeben werden.
In den Grafiken für die "Produktedaten" ist neben dem 95% - Vertrauensbereich für den wahrscheinlichsten Erwartungswert xs auch das massgebende 90% - Vertrauensniveau für den 90% - Fraktilwert einer Produkteeigenschaft angegeben. Die hierfür verwendeten einseitigen Toleranzintervalle (k - Koeffizienten nach ISO 3207) sind allgemein als Tabellenwerte verfügbar und folgen im Bereich 3 < n <1000 mit hinreichender Genauigkeit (< 2.5% Abweichung) der unten abgebildeten Funktion.

Im Rahmen der europäischen Produktenormierung ist vorgesehen, den sogenannten Nennwert einer Produkteeigenschaft als 90% - Fraktilwert mit 90% - igem Vertrauensniveau aus der statistischen Stichprobenerhebung abzuleiten. Ausgehend vom (zufälligen) arithmetischen Mittelwert xrm einer auf n - Proben begrenzten Prüfserie und der daraus geschätzten Standardabweichung s wird der
Nennwert xes nach der Formel: xes = xrm ± k . s berechnet.
Demgegenüber ist nach vorstehenden Überlegungen der entsprechende Grenzwert [x(90%)G.../90 ] in den Grafiken aus der Abweichung (k . s) zum wahrscheinlichsten Erwartungswert der Gesamtheit xs aufgrund der Stichprobe (Wendepunkt der S-Kurve, nicht zufälliger arithmetischer Mittelwert xap resp. xrm) ermittelt. Unterschiede in den Vergleichswerten sind somit auf das Zufallsergebnis xrm resp. xap zurückzuführen.
Um vom Grenzwert nach Grafiken zum mutmasslichen Nennwert nach EU - Normierung zu gelangen, kann folgende Beziehung benutzt werden:
EUNennwert = xes ~ xap ± [x(90%)G.../90 - xs]absolut . r r = Korrelationskoeffizient gemäss Grafik.
Die entsprechende Umrechnungsformel ist in allen Grafiken zu den "Produktedaten" aufgeführt.
Oftmals zeigt es sich, dass die begrenzte Stichprobenserie bei vielen nach dem Zufallsprinzip erhobenen Eigenschaften oder Vorgängen nicht einer symmetrischen, sondern (zunächst ?) signifikant asymmetrischen Verteilung nahekommt. Beispiel: Lebensdauer einer Population, Niederschlagsverteilung innerhalb eines Zeitraums, etc. Der "Deckungsgrad" von Einzelwerten zur vermuteten Häufigkeitsverteilung ( - Funktion) wird dabei auch hier durch den Korrelations-koeffizienten "r" symbolisiert. Die Angleichung einer begrenzten Stichprobenserie an eine asymmetrische Verteilungsdichte (mit höherem Korrelationskoeffizienten als für die symmetrische Funktion), hat dabei oft eine markante Abweichung des "momentan" wahrscheinlichsten Wertes xs zum arithmetischen Mittelwert der Stichprobe xap zur Folge.
Eine solche "voräufige" Asymmetrie der Stichprobe steht damit aber noch keineswegs zwingend im Widerspruch zu einer (erwarteten) Normalverteilung der Gesamtheit, denn der (ebenfalls asymmetrische) Vertrauensbereich aus einer derartigen Stichprobe ist einseitig entsprechend weiter gefasst. Es ist also sehr wohl möglich, dass die momentan naheliegendste Verteilung aufgrund einer begrenzten Stichprobe durch Erweiterung um zusätzliche Messresultate sich doch noch der Symmetrie zuneigt. Dabei wird die neue Prognose über den Vertrauensbereich des (nunmehr symmetrischen ) Scheitelwertes der (erweiterten) Stichprobe in der Regel weiterhin innerhalb der ursprünglichen Absteckung liegen.
Vereinzelte asymmetrische Verteilungen von "Produktedaten" aufgrund begrenzter Stichprobenzahlen sind stets in diesem Zusammenhang zu sehen.
Die vermittelten "Kostendaten" schliesslich gründen auf einer nach definierten Prinzipien erzeugten Wahrscheinlichkeitsverteilung von Prognosewerten über Gebrauchsdauer, Planungshorizont, Zinsentwicklung, Unterhaltsaufwand, Bau - und Energiepreisteuerung, Entsorgungsaufwand, etc. Die Wahrscheinlichkeitsfunktion für symmetrische oder asymmetrische (Gebrauchsdauer) Verteilungsdichten der Einflussparameter ist dabei mit jenen zur statistischen Auswertung der
"Klimadaten" und der "Produktedaten" identisch. Das dazu vorstehend Gesagte gilt somit für die Grafiken zu den "Kostendaten" sinngemäss. |