Getrieben von Daten? Vom Sinn und Unsinn datengetriebenen Publizierens

29. Juni 2018 – Data Driven Publishing. Ist das schon wieder eins dieser rasch vergänglichen Buzzwords, die es nicht mal in den Gartners Hype Cycle geschafft haben oder doch eine ernstzunehmende Strategie, um das Verlagsgeschäft planbarer, umsatzstärker und rentabler zu machen?

Dieser Artikel ist der erste einer kleinen Serie, die zeigt, wie wir bei readbox mit diesem Thema umgehen, warum wir davon überzeugt sind, dass es das Arbeiten in der Verlagsbranche nachhaltig verändern wird und welche Tools wir dafür in den nächsten Monaten auf den Markt bringen werden.

Daten? Was für Daten?
Wovon wir eigentlich reden.

Produkte erzeugen Daten (und bestehen daraus), Prozesse erzeugen Daten, Leser und Kunden erzeugen Daten. Was davon ist denn jetzt relevant? Und ab wann sind Daten so weit aufbereitet, dass man damit effizient und zuverlässig sein Geschäft steuern kann, wann werden Zahlen wirklich zu Key Performance Indicators (KPIs)?

Die üblichen Daten

Damit gehen wir täglich um, das kennen wir. Aber nutzen wir das Potenzial all dieser Informationen auch wirklich aus oder starren wir zu häufig nur auf Zahlenkolonnen, die uns nicht wirklich weiterbringen? Also, was haben wir normalerweise so im Haus?

Sales-Daten wie Absatz- und Umsatzzahlen, Vormerker und Retouren.
medienform-, ausgaben- und auflagenübergreifend inkl. E-Book, Hörbuch,
HC, TB, Readerausgaben, Ramscherlösen, Auslandslizenzen. Aufgeschlüsselt nach Shops, Ländern, Imprints, Genres, Reihen, Herausgebern Autoren und allen möglichen anderen Faktoren. Tagesaktuell, monatlich, quartalsweise, jährlich. Retourenbereinigt oder auch nicht.

Kosten aus allen Bereichen: Lektorat, Marketing, Vertrieb, Herstellung, Auslieferung, Lagerhaltung, Makulatur, Honorare, Gemeinkosten, Umlagen, Steuern, Personal, Abschreibungen, Mitgliedsbeiträge des Börsenvereins, Anwaltskosten für die DSGVO-Umsetzung, you name it. Ach ja, aus Erlösen und Kosten ergeben sich Ertrag und Deckungsbeitrag.

Metadaten zu Produkten waren früher noch stärker unterschätzt als heute, sind aber noch immer fast überall qualitativ und quantitativ ausbaufähig. In einer Welt, in der die Kunden mehr und mehr online einkaufen, wird relevante Sicht- und Findbarkeit erst durch richtig gute Metadaten erzeugt. Da können Inhalt und Ausstattung Ihres Buches so gut sein, wie sie wollen, ohne passende Metadaten wird kein Mensch Ihren Titel finden, geschweige denn kaufen.
Dazu gehören unter vielen anderen Angaben vor allem Titel, Untertitel, Keywords, Sachgruppen (THEMA, WGS, BISAC) und Beschreibungstexte.

Der Content selbst. Jeder weiß es, aber nur ganz kurz zusammengefasst zur Erinnerung: Im gesamten Entstehungsprozess eines Printbuches ist nur der allerletzte Schritt analog, der Rest ist rein digital und besteht aus Datenflüssen: Der Autor schreibt in einer Textverarbeitung, schickt das Manuskript per Mail, das Lektorat redigiert per Software, der Setzer arbeitet mit einem DTP-Programm und die Satzfahne geht als PDF-Datei via FTP-Server an den Drucker. Dazu kommen die rein digitalen Produktformen wie E-Book, Hörbuch und Apps.
Und es klingt fast verrückt, aber das Potenzial des Inhalts eines Buches schöpfen wir heute noch kaum aus, denn wir machen „nur“ ein Buch daraus. Die Analyse der Inhalte ermöglicht noch viel mehr: Quantitative Methoden, also das automatisierte Auswerten der Worte, der Sätze, der Absatz- und Kapitellängen erlauben z. B. einerseits Aussagen über Zielgruppeneignung, Genre und helfen andererseits bei der Optimierung von Metadaten wie Keywords und Sachgruppen-Einstufung. Qualitative Analysen ermöglichen komplexere Erkenntnisse, wie z. B. über Handlungsstränge, die einzelnen Protagonisten, über Epochen, Orte und Schauplätze, ja sogar über die zu erwartenden Emotionen des Lesers beim Lesen selbst. Allesamt höchst wertvolle Daten für Marketingaktionen, Programmgestaltung und Empfehlungsmanagement.

Daten aus Marketingaktionen, hier hängt viel davon ab, was gemessen und nach welchen Kriterien Erfolge definiert werden. Also z. B. Öffnungs- und Konversionsraten von Newslettern, Umsatz- und Reichweiteneffekte von E-Book-Preisaktionen, AdWords- und Social-Media-Anzeigen-Kampagnen, Leadgenerierung auf Messen, Impact von Social-Media-Reichweiten-Kampagnen, Erfolg von Pressearbeit und Bloggerrelations, Aktionen im Buchhandel, Lesereisen und vieles mehr.
Und, Hand aufs Herz, hier bleiben gar nicht mal so selten offensichtliche Potenziale auf der Strecke: Die Nachpflege und Qualifikation von Adressen im (hoffentlich vorhandenen) CRM, die Rezensionskontrolle und damit verbundene laufende Optimierung des Presseverteilers und die kombinierte Betrachtung und Bewertung von Aktionen, wie z. B. die Auswirkungen einer E-Book-Preisaktion auf die Printausgabe.

Die teuren Daten

Spätestens beim PoS hört es dann mit den Daten meistens erstmal auf. Es sei denn, man nimmt Geld in die Hand und kauft selbige ein. Kundenverhalten, Verkaufstrends, und Benchmarks liefern die altbekannten Panels und Charts von media control (METIS) und GfK.

Amazon bietet ebenfalls einen kostenpflichtigen einen Blick in seinen Online-Laden an, das Ganze heißt Amazon Retail Analytics Premium (ARA) und ist in zweierlei Hinsicht anstrengend: Erstens ist der Service vorsichtig formuliert nicht gerade geschenkt und zweitens gibt es statt schick aufbereiteter Charts und Tabellen sprödes Excel – das ohne weitere Aufbereitung eher schwere Datenkost darstellt. (Anmerkung des Autors: Eigentlich schon irgendwie ein cooles Geschäftsmodell, oder? Man erzeugt mit den Produkten der Handelspartner nicht nur Umsätze, sondern auch Daten, die man ihnen dann wieder verkauft. Fies, aber schlau.)

Und dann gibt es natürlich ein reichhaltig-vielfältiges Angebot an Studien und Statistiken diverser Institutionen zu ebenso diversen Preisen. Hier seien nur beispielhaft der Börsenverein des deutschen Buchhandels, das Statistische Bundesamt (Destatis), Statista und IfD Allensbach genannt.

Die Kunden- bzw. Leserdaten

Je buchhandels-orientierter der Verlag, desto schattenhafter ist im Branchenschnitt das Bewusstsein für die Bedeutung von Leserdaten. Das ist eigentlich auch für den Buchhandel schade, denn auch die dortigen Kollegen profitieren von der zielgruppengerechten Ansprache und Programmgestaltung der Verlage. Also stellen wir folgende Frage: Wo hinterlassen Kunden und Leser denn überhaupt Spuren, die man auswerten kann?

Relativ offensichtlich sind ihre Fußspuren auf den Webangeboten eines Verlags, also
z. B. Bewegungen auf Internetseiten – Landingpages von Autoren, Reihen und Marketingaktionen nicht vergessen – Online-Shops und den Social-Media-Angeboten. Datenschutzgerecht eingesetzt, liefern Tools wie Google Analytics und die plattformeigenen Analysewerkzeuge der Social-Media-Kanäle eine Fülle von Daten, aus denen man eine Menge u. a. über die Usability einer Website und vor allem eines Shops lernen kann.

In vielerlei Hinsicht hochspannend sind die Suchbegriffe, mit denen Website- und Shop-Besucher etwas zu finden hoffen – nicht nur bei den eigenen Webangeboten, sondern auch z. B. bei Google und Amazon. Passen diese Begriffe bei Produktsuchen zu den Metadaten? Sind die Treffer auch tatsächlich relevant, sprich die Konversion hoch? Suchen die (potenziellen) Kunden vielleicht nach ganz anderen Dingen und falls ja, was lässt sich daraus für das eigene Angebot und/oder die eigene Positionierung ableiten?

Hat der Verlag eigene Social-Media-Kanäle, bieten einerseits die jeweiligen Plattformen eigene Tools zur Auswertung an, aber Tools zum übergreifenden Social-Media-Monitoring gibt es reichlich. Diese Daten geben Aufschluss über die Zusammensetzung der Follower = Zielgruppe und deren Bereitschaft zur Interaktion – was wiederum Rückschlüsse auf die Qualität der eigenen Social-Media-Angebote erlaubt.

Mindestens ebenso spannend wie Suchbegriffe und (gute) Social-Media-Postings sind die Bewertungen, Rezensionen und Kommentare in Online-Shops. 1-Sterne-Bewertungen mit passend schlechter Rezension können sich fatal auf die Verkaufszahlen auswirken, an dieser Stelle ist es wichtig, solche Ereignisse möglichst rasch zu bemerken und passend darauf zu reagieren. Eine passive Überwachung reicht an dieser Stelle nicht aus, hier sind Alerts und Push-Services gefragt, um die Reaktionszeit möglich niedrig zu halten und Umsatzverluste zu minimieren.

Nutzen Sie das richtige Tool zur Anzeige von Leseproben, erhalten Sie zur Auswertung Daten über das Nutzungsverhalten der Leser. Also, wie lange und wie weit gelesen wurde, ob und wann auf einen Kaufbutton zu welchem Shop geklickt wurde, wann im Tages- und Wochenverlauf am meisten gelesen wurde und welche Geräte zum Lesen benutzt wurden. K(l)eine Überraschung aus unseren Analysen: Der Mobil-Anteil steigt deutlich!
Ach ja, über solche Daten verfügen die Shop-Dickschiffe wie Amazon und Google natürlich reichlich und richten die Darstellung Ihrer Online-Angebote nach den Ergebnissen aus. Nur werden sie den Teufel tun, dass auch an die Verlage zurückzuspielen. Diesen Vorteil der Shops wollen wir bei readbox aufheben und diese Informationen für die Verlage nutzbar machen. Auch A/B-Tests von Leseproben und Covern werden dadurch möglich.

Unter bestimmten Voraussetzungen ist auch das Nutzungsverhalten kompletter E-Books mess- und auswertbar. Hier wird sichtbar, wie weit Leser tatsächlich in einem Buch vorgedrungen sind, ob sie es zu Ende gelesen, aufgegeben oder einfach nach einer Pause weitergelesen haben. Die bekannteste Lösung hierfür bietet Jellybooks an.

Ebenfalls zu haben sind ähnliche Nutzungsdaten aus Streamingdiensten wie z. B. der E-Book-Flatrate skoobe. Das gehört dort zum normalen Reporting. Auch aus den track-genauen Abrechnungsinformationen von Hörbuch-Streams lässt sich ermitteln, wie weit ein Hörbuch genutzt wurde.

Daten sind einsam.
Von Silos, historisch gewachsenen Strukturen und der Notwendigkeit, diese aufzubrechen.

2018-06-28 Illustration rbx-Data-Framework
Die readbox-Systemarchitektur: Was im Frontend als meine.readbox erscheint, basiert im Backend auf der readbox-Basistechnologie, in die alle möglichen und verfügbaren Daten aus externen und internen Systemen einfließen, verarbeitet und verfügbar gemacht werden.

Zur Gewinnung und Verwaltung von Daten hat fast jeder Verlag seine Standardausstattung an Tools, deren Typen sich zumeist mit drei Buchstaben abkürzen, ERP, CMS, CRM, PIM und vielleicht noch MAM. Jedes System ist für etwas anderes zuständig, die Anschaffung hat sich im Laufe der Jahre irgendwann irgendwie ergeben und es wurde in der Vergangenheit dabei eigentlich nie vernetzt gedacht oder geplant. Bitte nicht falsch verstehen, das ist kein Vorwurf, sondern eine Feststellung. Jede Fachabteilung hat ihre eigenen Anforderungen und was dabei herauskommt, ist mein persönlicher Lieblings-Euphemismus: Eine „historisch gewachsene Systemlandschaft“. Super!

Das große Problem: Die Systeme sind nur selten darauf ausgelegt, miteinander zu reden, sprich, Daten miteinander auszutauschen und werden so zu mehr oder weniger isolierten Datensilos. Und irgendwann ist es IMMER soweit, dass man z. B. für Auswertungen von Marketingaktionen Daten aus mehreren Systemen braucht. Mir sind bislang zwei Möglichkeiten bekannt, damit umzugehen:

  1. Irgendein armer Mitarbeiter zieht sich aus den jeweiligen Systemen manuell die Daten und fummelt (entschuldigung, ist doch so) diese in wahlweise einer Exceldatei oder einer PowerPoint-Präsentation zusammen. Jeden. Monat. Wieder.
  2. Eine Schnittstelle zwischen den Systemen wird gebaut. Entweder von einem der Systemhersteller oder einem Dienstleister (unser täglich Brot bei readbox). Je nach Datenstruktur kann das so richtig teuer werden, weswegen so manche Verlage die Kosten scheuen.

Und jetzt? Letzten Endes ist es ein Rechenspiel: Wie viel kosten mich die Mitarbeiter, die regelmäßig ihre Arbeitszeit mit dem zeitfressenden und fehleranfälligen Zusammentragen von Daten aus verschiedenen Silos verbringen? Was kosten mich im Vergleich die nötigen Schnittstellen, um die Daten an einer Stelle automatisiert zusammenzubringen, auszuwerten und in Grafiken, Dashboards oder wie auch immer zu visualisieren?

Bei dieser Rechnung werden die beiden letzten Punkte erfahrungsgemäß gerne unterschätzt: Daten aus verschiedenen Systemen in einem zu vereinigen, ist nur die  halbe Miete, denn ohne die richtige Fragestellung zur Auswertung und der leicht verständlichen Darstellung der Daten bringt mir das Ganze ja nicht viel. Damit kommen wir zum letzten Punkt dieses Artikels: Was können Daten eigentlich leisten? Welche Fragen können sie mir denn überhaupt beantworten?

Enttäuschung kommt von Erwartung. Daten liefern Antworten, die so schlau sind wie die Fragen, die man an sie stellt.

Verstehen – Analytics

4V
Das „4V-Modell“ von readbox: Verstehen, Verbessern, Verschlanken, Vorhersagen

Vor dem Hintergrund der oben skizzierten Datenlage in voneinander getrennten Silos, der zunehmenden Menge an Medienformen sowie Marketing- und Sales-Kanälen, wird es immer schwieriger, einen Überblick aber alle relevanten Zahlen zu bekommen. In diesem Sinne bedeutet Data Driven Publishing, sein Geschäft besser zu verstehen, indem man alle wichtigen Daten aggregiert, möglichst automatisiert und smart auswertet und verständlich darstellt. Und das auf unterschiedlichen Ebenen und möglichst individualisiert, schließlich braucht ein Lektor oder ein Vertriebsmitarbeiter einen höheren Detailgrad an Informationen als ein Abteilungsleiter oder Geschäftsführer.

Dem Verstehen folgt das Steuern: Heute liefern viele Standard-Software-Systeme bereits ansehnliche Tabellen und Grafiken aus, aber die Darstellung allein reicht noch nicht aus, um zu verstehen, warum die Zahlen so sind wie sie sind. Wenn ich sehe, dass die Absatzzahlen eines Buches nach unten oder oben ausreißen, kann ich das passiv beobachten und hoffen, dass es wahlweise vorbei geht oder so bleibt – oder ich kann versuchen, herauszufinden, wo die Ursachen liegen und nach- bzw. gegensteuern. Das wird erheblich einfacher, wenn ich mir z. B. als Lektor die Marketingmaßnahmen einblenden kann, die zum Zeitpunkt eines solchen Ausreißers gerade stattgefunden haben. Oder wenn ich sehen kann, ob es besondere Bewertungen und Rezensionen in den wichtigsten Shops zu diesem Titel gab.

Auch die Performance von Produkten und Marketingmaßnahmen lässt sich mit der Kombination der richtigen Daten aus verschiedenen Blickwinkeln betrachten. Wie gut die verschiedenen Medienformen eines Titels im Vergleich oder aggregiert laufen, ist dabei noch das einfachste, aber wie reagiert z. B. ein Printtitel auf eine E-Book-Preisaktion? Welchen Effekt haben Optimierungsmaßnahmen von Metadaten auf die Verkäufe in On- und Offline-PoS? Passen meine Keywords für die Shops zu den Suchbegriffen auf meiner eigenen Website?

Nur mit dem Aufbrechen von Datensilos werden Antworten zu Fragestellungen wie diesen überhaupt möglich. Um die richtigen Fragen zu finden, brauchen wir die richtigen Parameter (KPIs), die wir messen müssen und deren Auswertungen uns erlauben, Absatz und Umsatz zu steigern. An genau dieser Stelle eine besondere Menge hochwertiges Hirnschmalz zu investieren, dürfte eine gute Idee sein, denn Zahlen sind so ein bisschen wie Treibsand oder facebook: Wer sich davon einfangen lässt, kommt nicht so leicht wieder raus. Und stellt zu allem Übel auch noch fest, dass er Äpfel mit Birnen verglichen hat und die Auswertung zwar schick, aber wenig aussagekräftig ist.

Welche Parameter das sind? Tja, dieses Spiel kann man beliebig komplex spielen, aber letzten Endes sollten es unserer Erfahrung nach möglichst einfach verständliche und klar messbare Faktoren sein, anhand derer man konkrete Maßnahmen ableiten kann, um sein Business zu steuern. In unseren Lösungen geben wir einige KPIs standardisiert aus, erstellen das finale KPI-Set aber stets erst zusammen mit unseren Kunden.

Auf die folgenden Punkte werden wir in weiteren Artikeln eingehen, hier seien exemplarisch nur ein paar Punkte aufgeführt.

Verbessern – Intervention

  • Ziel ist es, möglichst direkt aus den Auswertungen z. B. die passenden Marketingmaßnahmen zum richtigen Zeitpunkt zu ergreifen.
  • Das Messen, Bewerten und Nachsteuern der Maßnahmen gehört ebenfalls dazu.

Verschlanken – Automation

  • Arbeit haben wir alle genug und Ressourcen meist zu wenig. Automation schafft hier Entlastung. Dabei soll der Mensch nicht ersetzt,  sondern unterstützt werden.
  • Automation beschleunigt Prozesse, verbessert ihre Qualität und vereinfacht sie.
  • Automation sorgt für die effizientere Nutzung vorhandener Ressourcen nutzen und spart Kosten.

Vorhersagen – Prediction

  • Die hohe Kunst des datengetriebenen Publizierens. Das Ziel: Die Maschine wertet große Datenmengen aus und schlägt aktiv vor, Dinge zu tun. Oder sie zu lassen.
  • Stichwort „Predictive Analysis„: Bei der Berechnung von Forecasts und bei der Businessplanung können Algorithmen vorhandene Salesdaten um aktuelle Trenddaten anreichern und so Vorhersagen ermöglichen.
  • Und dann geht es um ideale Zeitpunkte. Um passende Preise und Preisänderungen. Um neue Produkte. Um die richtigen Marketingmaßnahmen im richtigen Kanal zum richtigen Zeitpunkt: Preditive Analysis führt zu  Predictive Marketing. Und zu Predictive Sales.

PS: Falls jemand überraschender Weise beim Buzzword-Bingo noch nicht fertig sein sollte: Big Data, Künstliche Intelligenz (KI), Machine Learning, Deep Learning, neuronale Netze & Co. sind hier nicht explizit aufgeführt. Warum? Weil sie auch nichts anderes sind als Tools, Methoden und Verfahren, die genau dann zum Einsatz kommen, wenn sie gebraucht werden. Genau wie ein Dreisatz oder das Malnehmen. Nur weil irgendwo „KI“ drauf steht, heißt das nicht automatisch, dass es besser ist. Höchstens teurer.

Peter Schmid-Meil

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s