Im November 2021 zeigte ein Bericht von McKinsey, dass 71% der Nutzer ein personalisiertes Erlebnis erwarten, wenn sie im Internet surfen.1. Sie erwarten insbesondere, dass ihnen die richtigen Inhalte zur richtigen Zeit zur Verfügung stehen. Dieses Ziel zu erreichen, ist die Grundlage für kontextsensitiven Handel und Marketing, die darauf abzielen, die Konversionsrate zu erhöhen. Dazu bedarf es einer umfangreichen Datensammlung, um zum richtigen Zeitpunkt personalisierte Inhalte oder Produkte vorzuschlagen. Dies ist die Schlüsselrolle von Empfehlungsmaschinen, die auf künstlicher Intelligenz und maschinellem Lernen basieren.
Was ist eine Empfehlungsmaschine?
Eine Empfehlungsmaschine ist ein Tool, das sich auf künstliche Intelligenz und Machine Learning stützt, um Internetnutzern automatisch Inhalte oder Produkte vorzuschlagen. Die Empfehlungen sind nicht nur automatisch, sondern auch dynamisch und personalisiert, da sie täglich oder sogar in Echtzeit mit einer großen Menge an Nutzerdaten gefüttert werden. Die Leistung von Empfehlungsmaschinen hängt daher von ihrer Fähigkeit ab, diese Daten zu verarbeiten.
Lesen Sie unser White Paper über Contextual Commerce
Wie funktioniert eine Empfehlungsmaschine?
Der Prozess der Empfehlung von Online-Inhalten beruht auf der Verkettung mehrerer Schritte.
Das Sammeln von Daten
Eine Empfehlungsmaschine sammelt 2 Arten von relevanten Daten, um ein Nutzerprofil zu definieren:
- implizite Daten: Dies sind Daten, die der Nutzer nicht absichtlich angibt und die bei seinen Aktivitäten im Internet gesammelt werden. Dazu gehören z. B. die Seiten, die er besucht hat, Klicks, Wörter, die er bei einer Suche verwendet hat, oder seine Kaufhistorie.
- Explizite Daten: Dies sind Informationen, die der Nutzer selbst übermittelt. Das können "Gefällt mir"-Angaben in sozialen Netzwerken sein, seine Bewertungen, die er nach seinen Einkäufen veröffentlicht, Inhalte, die er selbst im Internet veröffentlicht, oder auch sein Austausch mit anderen Nutzern.
Die Speicherung von Daten
Die Leistung einer Empfehlungsmaschine hängt zum Teil von ihrer Fähigkeit ab, die von ihr gesammelten Daten zu speichern. Empfehlungsmaschinen stützen sich auf extrem leistungsfähige technologische Bausteine, die als einzige in der Lage sind, die drei Dimensionen von Big Data zu bewältigen.2 :
- Volumen: Empfehlungsmaschinen speichern gigantische Mengen an digitalen Daten.
- Velocity: Sie bewältigen die enorme Geschwindigkeit, mit der Daten generiert werden.
- Vielfalt: Sie speichern eine wachsende Vielfalt an Daten.
Volumen, Geschwindigkeit und Vielfalt sind die drei wesentlichen Aspekte von Big Data
Die Analyse der Daten
Empfehlungsmaschinen analysieren dann die gesammelten und gespeicherten Daten. Sie folgen einer Methodik, d. h. einem zuvor festgelegten Regelwerk, das an die Strategie angepasst ist, die von dem Unternehmen gewählt wurde, von dem die Website abhängt. Die Ansätze unterscheiden sich in Abhängigkeit von sehr vielen Parametern: den Zielen der Empfehlung, der Art der Website, der Art der gesammelten und analysierten Informationen etc.
Es gibt 3 gängige Ansätze, die auch als "Filter" bezeichnet werden, nämlich :
- kollaborativer Filter
- inhaltsbasierter Filter
- Hybridfilter
Kollaborativer Filter: Eine Methode, bei der Ähnlichkeiten zwischen den vergangenen Daten eines Nutzerpanels und des aktuellen Nutzers gefunden werden. Dieser Ansatz beruht auf der Annahme, dass, wenn es Ähnlichkeiten in der Präferenz für bestimmte Elemente zwischen dem Nutzerpanel und dem Zielnutzer gibt, die Wahrscheinlichkeit hoch ist, dass der Zielnutzer auch andere Elemente, die sie ausgewählt haben, mag. Diese Empfehlungen basieren auf automatisch erhobenen Daten ohne Analyse ihrer Merkmale.
Inhaltsbasierter Filter: Ein Ansatz, bei dem zum einen die Eigenschaften der Daten analysiert werden. Diese Daten können z. B. Attribute der Katalogprodukte bei einer E-Commerce-Website oder die Themen der Inhalte sein, wenn es sich um ein Informationsmedium handelt. Andererseits wird das Profil des Zielnutzers ausgedrückt, indem seine Präferenzen für die Datenmerkmale der Website aufgelistet werden. Hier basieren die Empfehlungen auf den identifizierten Übereinstimmungen zwischen den Attributen der referenzierten Daten und den Vorlieben des Nutzers. Diese Methode beruht auf der Annahme, dass es eine große Wahrscheinlichkeit gibt, dass der anvisierte Nutzer Merkmale mag, die denen ähnlich sind, die er in der Vergangenheit gemocht hat. Diese Empfehlungen basieren auf dem vergangenen Verhalten des Nutzers, ohne sich darum zu kümmern, ob Daten über andere Besucher vorliegen.
Hybridfilter: Strategien, die die beiden vorherigen Filterarten kombinieren. Sie kreuzen also die Präferenzen des Zielbesuchers mit den Community-Daten, mit den Attributen der Katalogelemente, aber auch mit anderen Empfehlungsmodellen.
Filterblasen und Serendipität
Eine Filterblase ist ein Phänomen, das auftritt, wenn ein Algorithmus nur Elemente vorlegt, die dem Geschmack des Nutzers ähnlich sind. Dies birgt die Gefahr, dass der Nutzer in einer bestimmten Umgebung gefangen ist, ohne andere Bereiche zu erkunden. Daher die Notwendigkeit, zufällige Inhalte einzuführen oder anders gesagt, ein gewisses Maß an Serendipität in die Algorithmen der Empfehlungsmaschinen einzubringen.
Serendipity ist "die Tatsache, dass man zufällig eine unerwartete Entdeckung macht, die sich später als fruchtbar erweist, insbesondere in der Wissenschaft.3 ".
Auch können Algorithmen dem Zufall Raum geben, indem sie wissentlich zufällige Inhalte vorschlagen, die außerhalb des Bereichs der nahen oder bekannten Interessen des Nutzers liegen.
Die Kombination der beiden Praktiken ermöglicht eine optimale und ethisch korrekte Funktionsweise von Empfehlungsmaschinen.
Die Algorithmen von Empfehlungsmaschinen führen regelmäßig zufällige Inhalte ein, um Filterblasen für die Nutzer zu vermeiden.
Auf welche Daten stützt sich eine Empfehlungsmaschine?
Soziodemografische Daten
Die Erhebung soziodemografischer Daten über Verbraucher ist ein entscheidender Schritt für Empfehlungsmaschinen. Denn Alter, Geschlecht, Herkunft, Sprache sowie Familien- und Arbeitssituation beeinflussen nicht nur das Surfverhalten im Internet, sondern auch das Kaufverhalten. Im E-Commerce tätigen beispielsweise 30 % der Männer mindestens einen Kauf pro Woche, während es bei den Frauen nur 24 % sind. Ebenso machen die Millennials fast 35% des Online-Handels aus, während die Generation X 30% und die Baby Boomer nur 15% ausmachen.4. Diese soziodemografischen Daten beeinflussen auch die Interessensgebiete und die Kategorien der gekauften Artikel. Eine Eurostat-Studie ergab unter anderem, dass die 16- bis 24-Jährigen die Altersgruppe sind, die am meisten Kleidung online kauft, dicht gefolgt von den 25- bis 54-Jährigen. Dagegen zählen Personen über 55 Jahre zu den häufigsten Käufern von Möbeln und Wohnaccessoires.5.
Persönliche Daten
Neben soziodemografischen Daten sind auch persönliche Daten - implizite und explizite - für die Erstellung von Verbraucherprofilen unerlässlich. Das Sammeln und Verknüpfen dieser beiden Datentypen reduziert und präzisiert den Umfang der Inhalte, die vorgeschlagen werden sollen, sowie die Zeit und den Ort, an dem sie verbreitet werden sollen. Auf diese Weise funktioniert zum Beispiel die Produktempfehlung von Amazon. Die Algorithmen analysieren die Wunschlisten der Nutzer, die Produkte, nach denen sie suchen, die Zeit, die sie auf jeder Produktseite verbringen, sowie ihre bisherigen Einkäufe. Die Produktempfehlungen der Plattform sind daher oft relevant.
Aber es sind die sozialen Netzwerke, in denen Empfehlungsmaschinen Zugang zu einer außergewöhnlichen Menge, Vielfalt und Genauigkeit von Nutzerdaten haben.6. Die Daten speisen sich aus den Inhalten, die von den Nutzern angesehen und geteilt werden, aber auch aus den Interaktionen und dem Austausch mit anderen Nutzern. Die Algorithmen der sozialen Netzwerke definieren genau die Interessen und demografischen Profile jedes Besuchers. So erweisen sich die Empfehlungen des Social Commerce als äußerst präzise und haben ein hohes Leistungsniveau.
Datenbanken und Transaktionen
Datenbanken und Transaktionsverläufe werden analysiert und kategorisiert, um die Inhaltsvorschläge zu optimieren. Die in CRM-, PIM- oder DMP-Datenbanken eingegebenen Produktmerkmale werden von E-Commerce-Websites oder Marktplätzen ausgewertet. Diese Produktattribute ermöglichen es den Algorithmen, während des Empfehlungsprozesses relevante Assoziationen herzustellen. Beispielsweise wird eine E-Commerce-Website für Küchenartikel einem Nutzer, der die Produktseite einer Kaffeemaschine aufruft, einen Milchaufschäumer vorschlagen. Darüber hinaus werden diese Produktmerkmale durch die Transaktionshistorie ergänzt, wie z. B. die Beliebtheit des Produkts bei den Nutzern, die aktuellen "Bestseller", die zusätzlichen Verkaufswege anderer Nutzer oder auch Kundenbewertungen. In ähnlicher Weise analysiert eine Content-Plattform die Interaktionen ihrer Leser mit ihren Inhalten: die Abruf- und Interaktionsrate der Internetnutzer, die abgegebenen Bewertungen, die Lesezeit...