Zeitreihenvorhersagen sind von zentraler Bedeutung für die Zukunftsplanung von Unternehmen. Daher ist es nicht weiter verwunderlich, dass Machine Learning immer populärer in unternehmerischen Planungsprozessen wird.
Um Zeitreihenprobleme mit Machine-Learning-Algorithmen zu lösen, muss ein Data Scientist einige Schritte abarbeiten: Zu Beginn eines jeden Projekts steht das Aufbereiten und das „Engineering" der Daten. Dies beinhaltet sowohl das Identifizieren und Bearbeiten von fehlenden Werten und Ausreißern, als auch das Erstellen von Zeitreihen spezifischen Merkmalen (Features). Typische sogenannte „Feature Transformationen" bei Zeitreihen sind z.B. das Erstellen von Lags, also Verzögerungen, Trends oder Glättungsfunktionen, wie Mittelwerte. Dadurch entstehen nicht selten Transformationen, welche für die Lösung des Vorhersage-Problems keinen Mehrwert bieten. Um solche Merkmale identifizieren zu können, muss der Data Scientist verschiedene Techniken anwenden, um die irrelevanten von den relevanten Features zu trennen. Sind diese einmal identifiziert, so beginnt das Training und Tuning von verschiedenen Algorithmen.
All diese Schritte wiederholen sich bei jedem neuen Zeitreihenvorhersage-Problem. Daher haben wir das gewonnene Wissen aus unseren vorherigen Machine-Learning-Lösungen für gebündelt und ein AutoML Tool geschrieben, das diese Schritte für uns automatisiert.