Laut einer Umfrage unter 1000 Organisationen auf der ganzen Welt führen 78 % der Unternehmen maschinelles Lernen (ML) ein, um die betriebliche Effizienz zu steigern, 75 % um die Kundenbindung zu erhöhen und 79 % um Daten zu analysieren und neue Ideen aufzudecken. Aber wie schafft ML all das?
Der Schlüssel sind die Daten
Selbstlernende Algorithmen verarbeiten große Datenmengen, erinnern sich an erfolgreiche und erfolglose Entscheidungen und nutzen diese Informationen dann für zukünftige Prognosen. Die Algorithmen werden auf Verlaufsdaten trainiert: Transaktionen, die Historie der Interaktionen mit Kunden, Internetquellen, Umsatzinformationen und so weiter. Der Datensatz, die Qualität und die Dauer des Zeitraums, in dem sie gesammelt werden, bestimmen wie genau das Modell letztendlich sein wird. Der Algorithmus arbeitet, indem er Muster in der Datenmenge findet, überwacht wie und warum verschiedene Faktoren den Prozess der Interessensänderungen beeinflussen und nicht offensichtliche Muster schneller erkennt, als es ein Team von Analysten je könnte.
Hierzu ein Beispiel: Ein Geschäft sammelt über mehrere Jahre hinweg Einkaufsdaten. Das System analysiert diese Daten und findet verschiedene Muster: wie die Verbrauchernachfrage von der Jahreszeit abhängt, welche Kunden neue Waren kaufen und wie sich Rabatte und andere Faktoren auswirken. Auf dieser Grundlage erstellt der Algorithmus eine Vorhersage: die Menge an Waren, die der Einzelhändler in der nächsten Woche, im nächsten Monat oder im nächsten Jahr einkaufen muss.
6 Fragen zum Definieren Ihrer ML-Bedürfnisse
Jeder ML-Algorithmus beginnt mit dem Sammeln von Daten. Dann simuliert ihn ein ML-Programmierer, stellt möglicherweise fest, dass nicht genügend Daten vorhanden sind, und geht zum Sammeln zurück. Der Simulations-/Sammelzyklus wird so lange wiederholt, bis genügend Daten gesammelt sind, und dann findet der Programmierer ein gutes Modell und wendet es an. Wenn es nicht funktioniert, erstellt der Programmierer ein anderes Modell, wendet es an und testet es; und so weiter, bis ein richtig funktionierendes Modell gefunden wird, das zu den Daten passt. Das Erstellen eines ML-Algorithmus ist ein fortlaufender Zyklus und es ist wichtig, die folgenden Fragen zu beantworten, bevor man beginnt:
- Zieldefinition. Welches Geschäftsproblem versuchen Sie zu lösen? Wie lässt sich dies als Problem des maschinellen Lernens formulieren?
- Daten. Welche Daten haben Sie? Wie passen diese zur Definition der Aufgabe? Sind die Daten strukturiert oder nicht? Sind die Daten statisch oder dynamisch?
- Bewertung. Was bestimmt den Erfolg? Ist das maschinelle Lernmodell mit 95 % Genauigkeit gut genug?
- Merkmale. Welche Aspekte der Daten werden für das Modell verwendet? Wie kann das, was bereits bekannt ist, dies beeinflussen?
- Modellierung. Welches Modell sollten Sie wählen? Wie können Sie das Modell verbessern? Wie können Sie es mit anderen Modellen vergleichen?
- Experimente. Was können Sie noch ausprobieren? Funktioniert das erweiterte Modell wie erwartet Wie verändern sich andere Schritte, in Abhängigkeit davon was Sie vorfinden?
Die Schritte eines ML-Workflows
Schritt 1: Datenerfassung
Aus Sicht des Unternehmens ist die schwierigste Phase das Sammeln und Aufbereiten der Daten. Damit ML funktionieren kann, werden viele Verkaufsdaten benötigt.
Diese Daten können aus verschiedenen Quellen stammen (z. B. ERP, CRM-Systeme, externe Quellen u. a.). Es ist auch möglich, Informationen über verkaufsbeeinflussende Faktoren zu erhalten, z. B. geografische Region, laufende Marketingkampagnen, Wechselkurse, Saison und so weiter. Diese zusätzlichen Faktoren können die Genauigkeit der Prognose beeinflussen.
In den meisten Fällen wird ein Teil der Daten verwendet, um das Modell zu trainieren und der Rest wird verwendet, um das Ergebnis zu verifizieren, indem die vorhergesagten Verkaufsmengen mit den vorhandenen Daten verglichen werden.
Schritt 2: Datenvorbereitung
Nach dem Sammeln von Trainingsdaten ist der nächste Schritt die Vorbereitung: das Herunterladen der Daten an einen geeigneten Ort und das Sortieren, Bereinigen und Modifizieren der Daten für das Training.
Zuerst müssen alle Daten gesammelt werden, und dann wird ihre Reihenfolge zufällig geändert, damit die Reihenfolge den Lernprozess nicht beeinträchtigt. Außerdem müssen sie, wie zuvor erwähnt, in zwei Teile aufgeteilt werden. Das optimale Verhältnis für Trainings-/Verifizierungsdaten ist 80/20 oder 70/30. Es ist wichtig, dass sich die Daten in beiden Teilen nicht wiederholen.
Schritt 3: Auswählen des richtigen Modells
Bei der Auswahl eines Modells müssen die folgenden Parameter berücksichtigt werden:
Genauigkeit. Das Ergebnis mit maximaler Genauigkeit ist nicht immer optimal. In manchen Fällen ist es sinnvoller, Näherungswerte zu verwenden, die die Verarbeitungszeit deutlich reduzieren.
Lernzeit. Die zum Trainieren des Modells erforderliche Zeit hängt vom gewählten Algorithmus ab. Im Allgemeinen gilt: Je geringer die Genauigkeit, desto geringer die Trainingszeit. Einige Algorithmen sind stärker von der Datenmenge abhängig als andere und dies kann die Wahl des Algorithmus für das Modell deutlich beeinflussen, besonders wenn nur wenig Zeit zur Verfügung steht.
Linearität. Die meisten ML-Algorithmen sind linear, d. h. die Datenkategorien können durch eine gerade Linie getrennt werden. Bei einigen Problemen funktionieren lineare Algorithmen gut, aber bei anderen reduzieren sie die Genauigkeit erheblich.
Anzahl der Parameter. Die Anzahl der Parameter, z. B. die Anzahl der erforderlichen Iterationen oder dessen Fehlerempfindlichkeit, wirkt sich direkt auf das Verhalten des Algorithmus aus. In der Regel gilt: Je größer die Anzahl der Parameter, desto größer ist die Anzahl der Versuche und Fehler auf dem Weg zur besten Kombination.
Schritt 4: Modelltraining
Um ein ML-Modell zu trainieren, muss Folgendes angegeben werden:
Datenquelle für Training
Name des Datenattributs, das das zu prognostizierende Ziel enthält
Erforderliche Datentransformationsanweisungen
Trainingsparameter zur Steuerung des Lernalgorithmus
Schritt 5: Verifizierung des Ergebnisses
Nachdem ein Modell spezifiziert wurde, kann eine Bewertung vorgenommen werden und es sollten Anpassungen durchgeführt werden, um die für das Unternehmen passende Genauigkeit zu erreichen. Sobald diese Genauigkeitsstufe erreicht ist, kann das Vorhersagemodell in Form eines zugänglichen Webdienstes veröffentlicht werden. Seine Rolle ist einfach: Es empfängt Daten als Eingabe (z. B. Datum, Filiale, prognostizierte Wechselkurse, Produkttyp usw.) und gibt prognostizierte Verkaufsmengen aus.
Typischerweise werden verschiedene Regressionsalgorithmen verwendet, um eine Umsatzprognose zu erstellen, aber es können auch andere Methoden verwendet werden, abhängig von den genauen Zielen und davon, welches Modell die höchste Genauigkeit liefert. Algorithmen können auch kombiniert werden.
Nach der Auswertung der Leistung des Modells ist es einfach zu sehen, ob es durch Anpassung der Parameter verbessert werden kann. Darüber hinaus ist es in der Regel notwendig, ein Modell mehrmals durch die Trainingsdaten laufen zu lassen, um die Genauigkeit zu verbessern.
Fallstudien zur Umsatzvorhersage
Fallstudie 1: Umsatzprognose
Der Algorithmus findet und misst alle Beziehungen zwischen Produkten, analysiert vergangene Verkaufsdaten und modelliert dann die Auswirkungen verschiedener Faktoren auf den Verkauf.
Dieses Modell kann zum Beispiel vorhersagen, wie ein Rabatt auf Produkt X die Verkäufe ähnlicher Produkte verändern wird, oder wie sich kühles Wetter auf die Verkäufe auswirkt.
Fallstudie 2: Preisoptimierung
Der Algorithmus sagt die besten Preise für den Einzelhändler voraus und berücksichtigt dabei die Kundennachfrage, die Preise der Wettbewerber, Lagerprobleme, das Lieferdatum der nächsten Charge, die Verkaufsgeschwindigkeit und andere Faktoren.
Der Algorithmus kann z. B. berechnen, dass eine Uhr des Modells X zwischen $80 und $150 kostet. In Kenntnis dieser Grenzen bestimmt der Einzelhändler die optimalen Kosten für die Ware unter Berücksichtigung seiner Geschäftsziele.
Fallstudie 3: Kundensegmentierung
Im Einzelhandel werden die Kunden nach Alter, Einkommensniveau, Sozialstatus und Interessen kategorisiert. ML ermöglicht es, Kunden anhand von impliziten Mustern in Gruppen zusammenzufassen, z. B. Menschen, die zu impulsiven Käufen von vorgeschlagenen Zusatzprodukten neigen, die ein hohes Gehalt haben oder die zwei Kinder haben. Diese Kategorisierung kann Einzelhändlern helfen, ein sehr genaues Profil für ihre Kunden zu erstellen, um Rabatte zu optimieren.
Fallstudie 4: Marketing-Optimierung
Algorithmen helfen, unnötige Angebote zu entfernen und die Arbeit an denen zu verstärken, die Ergebnisse bringen. Sie können frühere Angebote analysieren und Kombinationen wie Ort/Produkt/Rabatt wählen, um das gewünschte Ziel zu erfüllen: den Markt erweitern, den Gewinn steigern oder neue Kunden anziehen.
So können Marketingspezialisten beispielsweise Nutzer, die sich für sie interessieren, genauer ansprechen.
Fallstudie 5: Merchandising
Die Analyse von Informationen aus Videoüberwachungssystemen hilft zu verstehen, wie sich Menschen in einem Geschäft bewegen, wie sich der Standort auf den Kauf von Waren auswirkt, welche Theken und Vitrinen von größtem Interesse sind und so weiter. Einzelhändler können "Customer Journey Maps" für vorrangige Verkaufsbereiche erstellen.
Zum Beispiel kann das System durch den Vergleich der Daten von Regalen und Vitrinen, Werbeaktionen und anderen Faktoren bestimmen, wo verschiedene Warengruppen platziert werden sollten.
Kontaktieren Sie uns, damit wir Ihre spezifischen Ziele besprechen und die perfekte Machine-Learning-Lösung für Ihr Unternehmen finden können.

