Projektablauf

All generalizations are false, including this one.

Mark Twain

Immer neuen, anspruchsvollen Fragen auf den Grund gehen:  Das ist es, was meine Arbeit interessant macht. Keine Ausgangssituation gleicht der anderen, jeder Kunde kommt mit ganz eigenen Fragen und Anliegen auf mich zu. Entsprechend unterschiedlich gestaltet sich die Zusammenarbeit.

Einige Grundelemente bleiben dennoch ähnlich:  Jedes Projekt beginnt mit der Durchsprache der Aufgabenstellung, und jedes Projekt folgt einer klaren Systematik, die sich am Beispiel eines umfang­reicheren Projektes — Gegenstand: statistische Modellierung — grob umreißen lässt.

1. Aufbereitung des Datenbestands

Eine saubere Datenbasis ist essenziell für ein erfolgreiches Analyseprojekt. „So groß wie nötig — so klein wie möglich“ lautet dabei die Maxime:  Die Datenbasis sollte genügend Daten enthalten, um die benötigten Informationen zu liefern, dabei aber effiziente Analysen ermöglichen.

Ich sichte und strukturiere Ihre Daten, entwerfe einen groben Analyseplan und bestimme, welche weiteren Daten zur Beantwortung Ihrer Fragestellung erforderlich sind. Sofern diese aus offiziellen Quellen bezogen werden können, übernehme ich das selbst.

2. Plausibilitätsanalyse

Den komplettierten Daten­bestand prüfe ich zunächst auf Qualität und Plausibilität. Unstimmigkeiten werden geklärt, fehlende Informationen eingeholt und Korrekturen vorgenommen. So entsteht Zug um Zug eine konsistente, in sich geschlossene Analysebasis.

3. Deskriptive und explorative Datenanalyse

Die Daten der Analysebasis untersuche ich im Hinblick auf die eingangs umrissene Fragestellung. Zur Anwendung kommen deskriptive Verfahren (Verdichtung der enthaltenen Informationen) wie auch explorative Verfahren (zusätzliche Verarbeitung der Daten zum Aufzeigen von Strukturen). Resultat sind Erkenntnisse zur Verteilung der Daten, zur Häufigkeit von „Ausreißerwerten“ und zu aufschlussreichen Korrelationen zwischen den Daten.

4. Formulierung eines Modells

Die Erkenntnisse aus der Datenanalyse überführe ich nun in ein statistisches Modell. Dabei gilt es, Zusammenhänge zwischen den Variablen aufzudecken und ihr Ausmaß zu schätzen. Hier bringe ich mein Fachwissen über statistische Methoden und deren Anwendungs­bedingungen ein. Zur Schätzung von Modellparametern und Durchführung statistischer Tests und Prognosen arbeite ich mit speziellen Statistikprogramme (wie Stata ®, SPSS ® und dem offenen Statistikpaket R).

5. Verfeinerung des Analyseansatzes und Entwicklung erster Hypothesen

Dieser Schritt verläuft parallel zu den vorhergehenden Schritten: Bei der Aufbereitung und Analyse von Daten ergeben sich immer wieder neue Erkenntnisse, anhand derer ich die Vorgehensweise iterativ — und in enger Abstimmung mit Ihnen — anpasse und verfeinere. Dabei kristallisieren sich bereits erste Hypothesen zum Ergebnis heraus

6. Befüllen des Modells

Das formulierte statistische Modell wird nun ebenfalls schrittweise verfeinert:  Mithilfe spezieller Prüfprozeduren („Diagnostic Checks“) prüfe ich die Gültigkeit der Modellannahmen, passe gegebenenfalls die Modellformulierung an und schätze das Modell erneut — so lange, bis das endgültige, aussagekräftige Modell steht. Die anfänglichen Hypothesen werden in diesem Prozess erhärtet und konkretisiert.

7. Ableitung von Aussagen und Bericht

Im letzten Schritt leite ich aus dem statistischen Modell konkrete, umsetzungsorientierte Aussagen zu Ihren Fragen ab, die in einem Bericht zusammengefasst werden.

Im Prinzip kann ich an jedem beliebigen Punkt in ein Analyseprojekt einsteigen. Allerdings ist die Datenqualität und ‑struktur ausschlaggebend für die Dauer des Gesamtprojektes — daher empfehle ich meinen Kunden in der Regel, die Zusammenarbeit mit der Überprüfung der Daten zu beginnen