DoE-Happen #29 – “Centerpoints und qualitative Faktoren geht das?
Hallo, liebe DoE-Enthusiasten!
In unserem letzten Blogbeitrag haben wir die Centerpoints und ihre zielgerichtete Anwendung detailliert diskutiert.
Nun möchte ich gerne auf Besonderheiten im Zusammenhang mit attributiven Faktoren und Multilevel-Faktoren eingehen. Doch bevor wir uns diesen Aspekten im Detail annehmen, möchte ich noch einmal die wesentlichen Aspekte aus dem Blog-Beitrag „DoE-Happen #28 – „Replicates” und „Center-points” ansprechen, um auch die neuen Leser für diesen Beitrag abzuholen.
Wenn Sie noch voll im Bilde sind springen Sie doch einfach zu den Überschriften:
👉 Faktor- und Variablenarten
👉 Oder zu: „Wenn es schwieriger wird, ist weglassen der Centerpoints keine Option!“
Die Bedeutung von Centerpoints in der DoE:
💡 Startpunkt und Variationsbasis: Die Centerpoints bilden den Ausgangspunkt für unsere Experimente. Um diese zentralen Punkte herum werden die verschiedenen Faktoren mittels Designs im Arbeitsplan variiert. Die Wiederholgenauigkeit an diesen Center-Points liefert entscheidende Hinweise auf die Qualität des ableitbaren Prognosemodells (Ursache-Wirkungs-Modell). Die Streuung der Centerpoints ist repräsentativ und kann vereinfacht für jeden Versuch innerhalb der Versuchsplanung angenommen werden.
💡 Erkennung von Nichtlinearitäten: Lineare Designs variieren die Faktoren normalerweise nur auf zwei Ebenen. Durch das Hinzufügen von Centerpoints können Experimentierende jedoch feststellen, ob die Beziehung generell zwischen den Faktoren und den Zielgrößen linear oder nichtlinear ist. Centerpoints bieten eine exzellente Möglichkeit, die Grundannahmen der Untersuchung zu überprüfen, insbesondere hinsichtlich der Homogenität der Varianz und der Güte der Modelle z.B. basierend auf der linearen Einschätzung.
💡 Schätzung der Prozessvariabilität: Centerpoints ermöglichen eine präzise Schätzung der Variabilität des Prozesses innerhalb des zentralen Bereichs. Diese zentrale Variabilität kann der gesamten beobachteten Variation gegenübergestellt werden, um ein besseres Verständnis für die Präzision und Lage der Beobachtungen als auch der Prognosen zu erhalten. Shainin hat hierzu definiert, dass die Wiederholgenauigkeit maximal ein 1/6 bis ein 1/5 groß sein sollte, um die Effekte der Faktoren fundiert zu bestimmen.
🔎 Faktor- und Variablenarten
In den meisten Versuchsplanungen werden quantitative Faktoren verwendet. Das bedeutet, dass diese Faktoren messbare, skalierte und einstellbare Werte sind. Bei anderen Faktoren gibt es Einschränkungen aufgrund ihrer spezifischen Eigenschaften, die ihre Variabilität und die Platzierung der Centerpoints beeinflussen können.
Ein Verständnis der Datenarten der Faktoren ist entscheidend. Die folgenden Erklärungen verdeutlichen, warum manche Faktoren nicht beliebig innerhalb des Versuchsdesigns variiert werden können und wie dies zu Einschränkungen bei der Platzierung der Centerpoints führen kann.
Anbei erhalten Sie eine Übersicht der wichtigsten Datenarten im Design of Experiments (DoE), die die Einstellung der Faktoren im Versuchsplan beeinflussen.
Bevor wir nun mit konkreten Beispielen fortfahren, finden Sie hier eine Übersicht der wichtigsten Datenarten, die die Einstellung der Faktoren im Versuchsplan beeinflussen:
- Quantitative Daten: Messbare und numerische Daten, unterteilt in:
- Kontinuierlich: Werte können jeden beliebigen Punkt innerhalb eines Intervalls annehmen (z.B. Temperatur).
- Diskret: Werte sind zählbar und nehmen spezifische Werte an (z.B. Anzahl von Objekten).
- Multilevel: Mehr als zwei diskrete Stufen oder Ausprägungen (z.B. verschiedene Dosierungen).
- Binär: Haben nur zwei mögliche Ausprägungen, wie „ein/aus“, „ja/nein“ oder „1/0“.
- Kompositionell: Daten, bei denen die Komponenten sich zu einem festen Gesamtwert aufsummieren (z.B. A, B und C, die sich zu 100% addieren).
- Füller (Restfaktor): Ein zusätzlicher Faktor, der die Summe der kompositionellen Faktoren auf 100 Teile bringt.
- Qualitative Daten: Beschreiben Eigenschaften und Kategorien, unterteilt in:
- Kategorial:
- Nominal: Kategorien ohne natürliche Reihenfolge (z.B. Farben, Marken).
- Ordinal: Kategorien mit natürlicher Reihenfolge (z.B. Bewertungsskalen).
- Attributiv: Beschreiben spezifische Merkmale qualitativ (z.B. Materialart).
Nachdem Sie nun die verschiedenen Datenarten kennengelernt haben, folgt eine Mindmap, die Ihnen konkrete Beispiele für jede dieser Datenarten veranschaulicht:
Warum das Weglassen der Centerpoints keine Option ist
Die vorherige Übersicht zeigt, warum die Platzierung der Centerpoints in manchen Untersuchungen schwierig sein kann. Das Weglassen der Centerpoints ist jedoch keine Option, da wir sonst auf wichtige Erkenntnisse verzichten müssten. Ohne diese Informationen riskieren wir, falsche Schlussfolgerungen zu ziehen.
Um die Anordnung der Centerpoints verständlicher zu machen, habe ich einige beispielhafte Visualisierungen erstellt. Diese sollen Ihnen helfen, die Konzepte besser zu verstehen und anzuwenden. Sollten Sie bei Ihren eigenen Projekten Unterstützung benötigen, stehe ich Ihnen gerne zur Verfügung.
Beispiel mit Quantitativen Faktoren
Quantitative und frei einstellbare Faktoren sind am einfachsten zu handhaben. Sie können problemlos auf eine mittlere Position eingestellt werden. Der linke Plot dient lediglich zur Veranschaulichung. Da das DoE erst ab zwei unabhängigen Faktoren sinnvoll ist, zeigt der linke Plot ergänzend eine einfache lineare Regression.
Das voranstehende Beispiel zeigt die reduzierten Versuche von 5 Faktoren, die auf 2-Level in einem fraktionellen faktoriellen Design angeordnet sind. Natürlich ist dies auch mit mehr als 5 Faktoren möglich, wird jedoch zunehmend unübersichtlicher. Die vorangehenden Visualisierungen mit wenigen Faktoren dienen vor allem dem Verständnis und als Hilfestellung, um zu verdeutlichen, dass mathematisch mehr möglich ist, als wir uns mit den üblichen 3 Dimensionen vorstellen können.
Bei Faktoren mit unterschiedlichen Datenarten muss ein angepasstes Aufteilungsschema bzw. Design verwendet werden. Die Centerpoints müssen so verteilt werden, dass ihre Platzierung den entsprechenden Levels gerecht wird. Im vorhergehenden Beispiel bin ich davon ausgegangen, dass X1 ein attributiver Faktor ist, wie z.B. Maschine [1; 2] oder Katalysator-Typ [A; B]. Daher wurden die Centerpoints in zwei Sets mit jeweils 2+ Versuchen auf die verschiedenen Levels aufgeteilt.
Für die Variation von Faktoren auf zwei Levels ist dies keine große Herausforderung, da die Faktoren in einem linearen Design ohnehin mit -1/1 gleichgesetzt werden. Für die mittlere Position, also den Centerpoint, muss jedoch eine Alternative gefunden werden. Diese Alternative besteht darin, die Centerpoints in Gruppen aufzuteilen, die den jeweiligen Stufen der attributiven Faktoren zugeordnet werden.
Gerade am Anfang einer Untersuchung, wenn noch wenig Wissen erarbeitet wurde und Sie unsicher sind, welchen Weg Sie einschlagen sollten, sind reduzierte Designs besonders hilfreich. Diese Designs ermöglichen es Ihnen, viele unnötige Versuche zu vermeiden, die möglicherweise mit den falschen oder weniger zielführenden Faktoren oder in einem nicht zielführenden Bereich durchgeführt würden. So sparen Sie Zeit und Aufwand und können sich auf die wesentlichen Aspekte Ihrer Untersuchung konzentrieren. Mit einem geschickten Design könnten Sie beispielsweise in Ihrem Versuchsplan bei drei Faktoren auch einen binären Faktor berücksichtigen.
Auch die Kombination von drei quantitativen Faktoren mit einem binären Faktor ist möglich und kann Ihnen helfen, mit minimalem Aufwand die richtige Richtung zu finden. Dadurch können Sie mit einer geringen Anzahl von Versuchen schnell herausfinden, welche Faktoren zielführend sind, und sich anschließend auf diese fokussieren, um weiterführende Experimente effizienter zu gestalten.
Software
Im Idealfall nutzen Sie in Ihrer Versuchsplanung bereits Software, die Ihnen helfen kann, die Centerpoints entsprechend aufzuteilen. Dies geschieht mitunter bei der Auswahl des zielführenden Designs. Durch die voranstehenden Beispiele sollten Sie jedoch nun in der Lage sein, die Lage der Centerpoints einzuschätzen und gegebenenfalls für ein optimales Design an Ihre Anforderungen anzupassen.
Möglicherweise möchten Sie Ihre Versuchsplanung zukünftig auch durch die Verwendung von Software optimieren. Ich habe viele Softwarepakete intensiv getestet und mich für Modde V13.1 entschieden. Diese Software konzentriert sich voll und ganz auf die Versuchsplanung, während bei einigen anderen Paketen die Versuchsplanung nur ein zusätzliches Feature ist.
In den meisten Fällen wollen meine Kunden keine Statistiker werden, sondern die Software soll sie in einem spezifischen Bereich wie ein Werkzeug unterstützen. Meiner Meinung nach tut Modde dies am besten und intuitivsten, weshalb ich es in meinen Lehrveranstaltungen an der TH-Rosenheim verwende. Falls Sie Fragen dazu haben können Sie mich gerne anschreiben.
🎯 Eventuell ist mein Blog in mancher Hinsicht etwas eskaliert oder zu umfangreich geworden, sodass ich plane, ihn zukünftig noch einmal aufzugreifen und in kleinere Abschnitte aufzuteilen. Ich hoffe dennoch, dass ich mit diesem Beispiel ein wenig mehr Motivation erzeugen konnte, die wertvollen Centerpoints in Zukunft zu berücksichtigen. Dies wird Ihnen helfen, Ihre Versuchsplanung gegen Fehlinterpretationen abzusichern und bessere Entscheidungen zu treffen.
Bis zum nächsten Mal, bleiben Sie neugierig und experimentierfreudig!
Teilen Sie gerne Ihre Gedanken und Erfahrungen mit mir – gemeinsam können wir den Weg zur Optimierung meistern. Wenn Ihnen dieser Artikel gefallen hat, teilen und liken Sie ihn bitte!
Falls Sie ein Thema haben, über das Sie mehr erfahren möchten, schreiben Sie mir!
Ihr DFSS- und DoE-Experte,
Stefan Moser
👉 Außerdem lade ich Sie herzlich ein, meine Webseite unter www.stefan-moser.com zu besuchen, dort finden Sie weitere Hinweise und Informationen zu Consultings, Zertifikats -Einsteiger, -Fortgeschrittenen und -Masterkursen in vielen Formaten als offene, Inhouse- oder auch Online-Kurse.
👉 Falls Sie Interesse an einem kompakten Online DoE Intro Kurs mit Zertifikat haben. So empfehle ich meinen folgenden Kurs.