Читать книгу Marktforschung - Heymo Böhler - Страница 44
2.2.3.6 Markt-, Labor- und Online-Experimente
ОглавлениеIn Hinblick auf das experimentelle Umfeld lassen sich Markt-, Labor- und Online-Experimente unterscheiden. Marktexperimente werden in einem »natürlichen« Umfeld durchgeführt (z. B. in Geschäften des Einzelhandels, in einer Stadt oder einem Nielsen-Gebiet), während das Laborexperiment eher in einem »künstlichen« Umfeld (z. B. einem gut erreichbaren Befragungsraum mit Einkaufsmöglichkeit in den Fußgängerzonen großer Städte) stattfindet, das genau die Bedingungen aufweist, die der Experimentator möchte. Inzwischen setzen sich allerdings immer mehr die Online-Experimente durch, bei denen die Datenerhebung vom Labor fast vollständig ins Internet verlagert wird. In der Marktforschungspraxis sind folgende Varianten von Marktexperimenten verbreitet:
• der regionale Testmarkt,
• der lokale Testmarkt bzw. Minimarkttest sowie
• der Store-Test (auch: »Ladentest« oder »Kontrollierter Markttest«).
Beim regionalen Testmarkt werden Marketing-Maßnahmen in einem größeren Marktgebiet (z. B. Bundesland oder Nielsen-Gebiet) erprobt. Ziel ist es zumeist, die Reaktionen von Handel, Endabnehmern, mitunter auch von Konkurrenten, auf die Neueinführung von Produkten und die damit einhergehenden Marketing-Maßnahmen zu ermitteln. Um eine zuverlässige Hochrechnung der Testmarktergebnisse zu ermöglichen, sollten die folgenden Bedingungen erfüllt sein (vgl. auch Berekoven et al. 2009, S. 405 ff.):
1. Repräsentativitätsbedingungen
• Die Bevölkerungsstruktur sollte im Hinblick auf Demographie, Einkommens-, Berufs- und Sozialstruktur sowie hinsichtlich des Konsumverhaltens nicht zu sehr vom Bundesdurchschnitt abweichen.
• Es sollte keine atypische Wirtschaftsstruktur vorliegen.
• Gleiche Konkurrenzsituation wie im Gesamtmarkt.
• Gleiche Handelsstruktur wie im Gesamtmarkt.
• Gleiche Mediensituation wie im Gesamtmarkt.
2. Abgrenzbarkeit des Testgebiets
• Testmarkt und Einzugsgebiet des Handels sollten weitgehend übereinstimmen.
• Verhinderung von Medienausstrahlungen von Nachbargebieten und in diese.
3. Das Testgebiet sollte bisher eine normale Entwicklung in dieser Produktklasse aufweisen (z. B. kein »Nachholbedarf«).
4. Das Testgebiet sollte nicht überstrapaziert worden sein (wie z. B. Berlin).
5. Es sollten geeignete Erhebungsinstrumente (z. B. Panel) im Testmarkt zur Verfügung stehen.
Natürlich lassen sich diese Forderungen im Einzelfall nicht alle erfüllen; sie sind daher eher als Orientierungspunkte zu verstehen, um bei Nichteinhaltung Anhaltspunkte für mögliche Verzerrungen zu haben. Regionale Testmärkte erlauben die Anwendung quasi-experimenteller Versuchsanordnungen, sei es nach dem Muster der Vorher-Nachher-Messung bei verschiedenen Stichproben aus demselben Testgebiet oder durch Anwendung des Zeitreihendesigns.
Beim lokalen Testmarkt dient eine kleinere Stadt oder einzelne Stadtgebiete als Testgebiet. Besonders bekannt zur Durchführung derartiger Minimarkttests ist in Deutschland vor allem das Testmarkt-System GfK BehaviorScan der GfK (Högl et al. 2016). Dieses ermöglicht es Herstellern von Gütern des täglichen Bedarfs vor einer bundesweiten Einführung Marketing-Maßnahmen (neue oder veränderte Produkte, Verpackung, Markierung, Preis, Verkaufsförderung, Fernseh-, Printwerbung) quasi-experimentell zu überprüfen. Als einziges in Deutschland angebotenes Testmarkt-System bietet es die Einbeziehung von Fernsehwerbung in den Test (Targetable TV) an. Abbildung 14 zeigt den Aufbau des GfK BehaviorScan sowie die überprüfbaren Marketing-Instrumente (GfK 2002, S. 5; Högl et al. 2016, S. 293).
Abb. 14: Aufbau des GfK BehaviorScan sowie überprüfbare Marketing-Instrumente
Basis des GfK BehaviorScan bildet ein nach Soziodemographie und Verbrauchsverhalten weitgehend repräsentatives Panel von 3.400 Haushalten in Haßloch (Rheinland-Pfalz), die über das Kabelfernsehen durch die GfK individuell selektiert und angesteuert werden können. Die Panelhaushalte können spezielle Testwerbung empfangen, die in das normale Werbefernsehen bei allen wichtigen Sendeanstalten eingespeist wird. Sie sind mit einer Identifikationskarte ausgestattet, die bei jedem Einkauf in den am Ort unter Vertrag genommenen Einzelhandelsgeschäften (sechs Märkte in Haßloch und einer in der näheren Umgebung) vorgelegt werden soll. Da die Geschäfte mit Scannerkassen ausgerüstet sind, können der individuelle Einkauf des Haushalts und die Abverkäufe der einzelnen Geschäfte per Scanning erfasst werden (sog. Single-Source-Ansatz, d. h. eine Kombination aus Haushalts- und Handelspanel).
GfK BehaviorScan stellt somit eine sehr weit gediehene Form eines Quasi-Experiments dar (vgl. für eine ausführliche Bewertung des GfK BehaviorScan Berekoven et al. 2009, S. 402 ff.): Das Marktgebiet ist relativ gut abgegrenzt, die Bevölkerungs- und Konsumstruktur ist relativ repräsentativ für Deutschland, die örtlichen Tageszeitungen, Supplements, Fernsehzeitschriften, Werbefernsehen und Handzettel sowie Verkaufsförderung im Geschäft können dem vorgesehenen nationalen Medienplan entsprechend eingesetzt werden. Aus der Grundgesamtheit aller Panelhaushalte werden bei jeder Durchführung eines lokalen Testmarkts per sog. Matching eine Experiment- und eine Kontrollgruppe mit gleichen soziodemographischen Merkmalen und gleichem Konsumverhalten gebildet, so dass als quasi-experimentelles Design das Zeitreihendesign möglich ist. Abbildung 15 (Ruppe 1989, S. 46) zeigt beispielhaft die Ergebnisse eines hohen bzw. eines niedrigen Werbeetats bzw. Werbedrucks bei der Einführung eines neuen Produkts in den Perioden Pl bis P6.
Abb. 15: Zeitreihendesign zur Ermittlung der Wirkung des Werbedrucks
Beim Store- Test lassen sich die Wirkungen einzelner Marketing-Maßnahmen (Preis, Regalplatzierung) sowie der Einführungserfolg neuer Produkte abschätzen. Zu diesem Zweck wird das Experiment in einer Stichprobe von Einzelhandelsgeschäften realisiert. Die Ergebnisse (Umsatz, Marktanteil, Kannibalisierung im Sortiment) werden durch Scannerkassen bzw. per Inventur durch Mitarbeiter des Instituts erfasst. Die GfK bietet etwa im Großraum Ludwigshafen mit dem GfK RetailScan/TV einen Store-Test an, bei dem zusätzlich Zielgruppenmerkmale der Käufer, Erst- und Wiederkaufrate, Einkaufsintensität und Einkaufshäufigkeit erhoben werden.
Zu den wichtigsten Laborexperimenten zählen Preis- und Werbemitteltests sowie die Ermittlung des Einführungserfolgs neuer Produkte.
Soll etwa die Wirkung einer Preisänderung auf den Absatz eines Fruchtsaftgetränks im Labor überprüft werden, werden die Versuchspersonen mit einem vorher ausgehändigten Geldbetrag in einen eigens dafür hergerichteten Verkaufsraum (Studio) geführt. In diesem befinden sich auf einem Regal die mit dem neuen Preis ausgezeichnete Marke sowie die Konkurrenzmarken. Jede Versuchsperson wird aufgefordert, die Marke zu kaufen, die ihr am besten gefällt. Das restliche Geld sowie die gewählte Marke dürfen sie behalten. Die Kontrollgruppe hat die gleiche Aufgabe, wobei hier die Marke zum alten Preis angeboten wird.
Zur Durchführung von Werbemittel-Pretests werden ebenfalls Labore in Fußgängerzonen genutzt. Ziel ist es den Werbeerfolg von Fernsehspots, Anzeigen, Rundfunkspots, Kinospots, Plakaten und Internetwerbung unter kontrollierten Bedingungen zu erfassen. So wird etwa zur Messung der Werbewirkung von Fernsehspots ca. 125 Testpersonen ein 90-minütiger Fernsehfilm vorgeführt, wobei das Experiment als Untersuchung zum Fernsehen deklariert wird. Um die Verzerrungen durch das Forced Exposure-Design zu reduzieren wird der Fernsehfilm durch mehrere Werbespots unterbrochen, nicht nur durch den zu prüfenden Testspot. Nach Darbietung des Fernsehfilms werden Erinnerung an den Testspot und an die Testspotinhalte sowie positive Ausstrahlungen des Testspots auf die beworbene Marke gemessen. Zur Messung der Werbewirkung von Kinospots hingegen muss in einem normalen Kino gemessen werden, wobei ein Kinofilm durch kinoübliche Werbeblöcke unterbrochen und anschließend die Erinnerungswirkung sowie die Stärken und Schwächen der Gestaltung der Kinospots erhoben werden.
Im Anzeigentest werden die Testanzeigen in drei Publikumszeitschriften integriert (sog. Foldertest). Eine Experimentgruppe blättert die Zeitschriften durch, wobei mittels einer Augenkamera der Blickverlauf festgehalten wird (als Testzweck wird »die Untersuchung des Leseverhaltens« genannt); eine zweite Experimentgruppe nimmt die Testhefte über das Wochenende mit nach Hause. Erfasst wird anschließend die Meinung zu den Testheften, Erinnerung an die Anzeige und deren Inhalte, die Markenpräferenz etc. Diese in der Unternehmenspraxis genutzten Anzeigentests werden auch in der Wissenschaft intensiv genutzt, etwa wenn es darum geht, den Einfluss des Kontext (Anzeige in passendem oder nicht passendem Umfeld) auf die Werbewirkung zu erfassen (Germelmann et al. 2020).
In ähnlicher Weise sind die Laborexperimente zur Prognose der Werbewirkungen von Rundfunkspots und Plakaten sowie von Internetwerbung aufgebaut, wobei stets darauf geachtet wird, dass die Kommunikationssituation möglichst realitätsnah gestaltet wird und der Untersuchungsgegenstand verschleiert ist.
Zur Prognose der Erfolgsträchtigkeit neuer Produkte (zumeist gemessen am zukünftigen Marktanteil oder Absatzvolumen) werden Testmarktsimulationssysteme angeboten. Anbieter sind u. a. die GfK mit dem Verfahren GfK Volumetric TESI (Erichson 2008, S. 989; Högl et al. 2016, S. 304), Nielsen mit dem Verfahren BASES Volumetric Forecasting (https://www.nielsen.com/us/en/solutions/capabilities/bases/) oder Launch eValuate und Concept Evaluate von Kantar (https://www.kantar.com/marketplace/solutions/innovation-and-product-development/concept-testing).
Abbildung 16 zeigt das Vorgehen bei GfK Volumetric TESI (Gaul et al. 1996; Erichson 2008; Högl et al. 2016): Zunächst werden ca. 300 Personen, die möglichst repräsentativ für die anvisierte Zielgruppe sein sollen, angeworben und in einem Hauptinterview über Soziodemographie, Konsumgewohnheiten, Markenpräferenzen, Einstellungen und Kaufabsichten befragt. Danach werden in Anzeigenfolders oder in Spots Werbemittel für das Testprodukt und für Konkurrenzprodukte präsentiert. In der anschließenden Kaufsimulation werden die Testpersonen gebeten, in einem als Supermarkt eingerichteten Labor in der betreffenden Warengruppe einzukaufen, wobei neben dem Testprodukt Konkurrenzmarken platziert sind. Kaufen sie das Testprodukt, so erhalten sie ein gleichwertiges Produkt als Zugabe, während Käufer von Konkurrenzprodukten eine Gratisprobe des Testprodukts erhalten.
Abb. 16: Aufbau und Vorgehen des GfK Volumetric TESI
Nun werden die Testpersonen gebeten, das Testprodukt zu Hause auszuprobieren (»Home-Use-Test«). Nach Beendigung des Home-Use-Tests werden die Testpersonen einem Nachinterview (persönlich oder per Telefon) unterzogen. Erhoben werden die Präferenzen und Einstellungen zum neuen Produkt sowie zu Konkurrenzmarken, Erfahrungen mit dem Testprodukt sowie Vorzüge und Nachteile des Produkts. Schließlich werden die Testpersonen erneut ins Studio eingeladen, um im Rahmen einer zweiten Kaufsimulation den Anteil der Wiederkäufer zu ermitteln.
Aus dem Anteil der Erstkäufer beim ersten Besuch im Labor und dem Anteil der Wiederkäufer unter den Erstkäufern beim zweiten Besuch im Labor lässt sich mit Hilfe des Modells von Parfitt und Collins (1968) mittels Hochrechnung der zu erwartende langfristige Marktanteil des Testprodukts oder sein zu erwartendes Absatzvolumen abschätzen (vgl. Silk und Urban 1978). Alternativ können Kaufwahrscheinlichkeiten der Testpersonen und über Hochrechnungen wieder Marktanteil und Absatzvolumen des Testprodukts aus abgefragten Produktpräferenzen vor und nach dem Home-Use-Test mittels Präferenzanteilsmodell prognostiziert werden (siehe Silk und Urban 1978; Erichson 2008, S. 993 ff.).
Der Vorteil der Testmarktsimulation liegt insbesondere in der Aufdeckung von Mängeln in der Kommunikation bzw. am Produkt. Allerdings ist der prognostizierte Marktanteil nur eine erste grobe Schätzung, da der Marktanteil im Gesamtmarkt wesentlich von der Distribution im Handel und der realisierten Werbekampagne abhängt. Hierüber sind nur grobe Schätzungen möglich. Liegt der im Simulationsmodell ermittelte Marktanteil sehr niedrig, so deutet jedoch alles auf einen Flop hin, und das Unternehmen kann die hohen Kosten eines unnötigen Testmarkts vermeiden. Liegt der Marktanteil überdurchschnittlich hoch, so kann an eine sofortige Markteinführung ohne vorherigen Testmarkt gedacht werden. Bei dazwischen liegenden Werten wird man je nach Philosophie des Unternehmens ein Marktexperiment durchführen.
Alle bisher gezeigten Experimentarten haben ihre Vor- und Nachteile. Im konkreten Fall muss der Forscher diese gegeneinander abwägen.
Regionale Testmärkte zeichnen sich durch eine große Realitätsnähe, umfangreiche Stichproben (Daten aus Haushalts- und Handelspanel) sowie der Möglichkeit aus, vor der nationalen Einführung »Kinderkrankheiten« in der Produktion und im Marketing-Mix aufzudecken und zu beseitigen. Nachteilig sind die mangelhafte Kontrolle von Störfaktoren, die erhebliche Durchführungsdauer, die fehlende Geheimhaltung sowie die hohen Kosten. Äußerst problematisch ist auch die mangelnde Kooperationsbereitschaft des Handels, so dass es oft nur zu relativ niedrigen Distributionsquoten kommt.
Bei Store-Tests und lokalen Testmärkten können Störeinflüsse durch Kooperation mit den beteiligten Handelsbetrieben minimiert werden. Außerdem haben sie gegenüber Laborexperimenten den Vorteil einer größeren Realitätsnähe. Ferner sind Store-Tests und lokale Testmärkte nahezu ebenso schnell, flexibel und kostengünstig durchzuführen wie Laborexperimente. Allerdings können im lokalen Testmarkt nur Güter des täglichen Bedarfs mit hoher Kauffrequenz getestet werden. Demgegenüber bieten sich Store-Tests auch für Produkte an, die nur in größeren Intervallen gekauft werden, weil hier eine höhere Fallzahl an Kaufakten vorliegt. Nachteile von Store-Tests und lokalen Testmärkten sind jedoch vor allem die mangelnde Überprüfbarkeit der Händlerreaktionen, die oftmals ausschlaggebend für den Einführungserfolg sind, sowie die atypische Mediensituation, sofern z. B. keine Fernsehspots getestet werden können.
Im Laborexperiment hingegen lassen sich mögliche Störeinflüsse (Konkurrenzaktivitäten, zusätzliche Aktivitäten des Handels, Darbietung im Regal, unterschiedliche Betriebsgrößen) besonders gut ausschalten. Des Weiteren kann das Laborexperiment geheim, relativ schnell, flexibel hinsichtlich des Instrumenteinsatzes und relativ kostengünstig (im Vergleich zu regionalen Marktexperimenten) abgewickelt werden. Nachteilig sind die zumeist kleinen Stichproben sowie auftretende Testeffekte, da sich die Versuchspersonen u.U. im Labor anders verhalten als in der Realität (z. B. größere Preissensibilität).
In vielen Veröffentlichungen zur Wahl zwischen Markt- und Laborexperiment (vgl. u. a. Hermanns 1979, S. 55 f.) wird vereinfachend behauptet, dass Marktexperimente zwar eine niedrigere interne Validität als Laborexperimente aufweisen, jedoch wegen ihrer höheren externen Validität vorzuziehen seien.
Der Begriff der externen Validität bezieht sich auf die Generalisierbarkeit (Repräsentativität) der Experimentergebnisse. Externe Validität liegt vor, wenn die im Experiment festgestellten Zusammenhänge auch in anderen Situationen erwartet werden können (vgl. Cook und Campbell 1979, S. 39). Interne Validität ist dagegen gegeben, wenn die rechnerisch festgestellte Differenz der abhängigen Merkmale einzig und allein auf den Experimentfaktor zurückzuführen ist (vgl. Campbell und Stanley 1966, S. 174 ff.).
Diese Argumentationsweise übersieht, dass zwischen interner und externer Validität eine »asymmetrische« Beziehung besteht (vgl. Zimmermann 1972, S. 79). Mit anderen Worten, wenn ein Experiment extern valide sein soll, so muss zuvor die Bedingung der internen Validität erfüllt sein, d. h. ohne interne keine externe Validität. Wenn z. B. in einem Store-Test die Verkäufer in den Experimentgeschäften durch Hinweise auf die Preiswürdigkeit des Artikels den Absatz forcieren, so wird das verzerrte Ergebnis nicht dadurch besser, dass es in einem natürlichen Umfeld gewonnen wurde. Marktexperimente weisen somit nur dann externe Validität auf, wenn durch Kontrolle der Störfaktoren ein ausreichendes Maß an interner Validität erreicht werden kann. Ist dies nicht oder nur unter hohen Kosten möglich, so ist das Laborexperiment vorzuziehen, zumal auch im Labor durchaus eine weitgehend »natürliche« Umweltsituation geschaffen werden kann (vgl. hierzu insbesondere Zimmermann 1972, S. 195 f. und Abb. 13).
In den letzten Jahren konnte zudem verstärkt beobachtet werden, dass die Datenerhebung bei fast allen vorgestellten Experimentarten immer häufiger internetbasiert stattfindet, d. h. dass sog. Online- Experimente auf dem Vormarsch sind. Diese Experimentierform bietet sich natürlich zunächst einmal dann an, wenn das zu untersuchende Kauf- und Nutzungsverhalten sich sowieso weitgehend im Internet abspielt. Man denke an das Nutzungsverhalten von Webseiten, an Kaufaktivitäten in Online-Shops oder die Wirkung alternativer Werbemittel bei der Banner-/Display- und Suchmaschinenwerbung. Die Vorteile sind in diesem Fall offensichtlich (vgl. z. B. Baier und Rese 2020b): Man kann über Online-Access-Panels oder über A/B-Tests auf der eigenen Webseite schnell und mit wenig Aufwand randomisiert große Experiment- und Kontrollgruppen mit gewünschten Quoten erreichen und interessierende Kenngrößen (z. B. Verweildauern oder Konversionsraten) bzw. die Wirkung verschiedener Alternativen leicht ermitteln. Kohavi und Longbotham (2016) weisen darauf hin, dass Tech-Konzerne wie Alphabet/Google, Amazon, Facebook, LinkedIn oder Microsoft jährlich mehrere Tausend Online-Experimente in Form randomisierter A/B-Tests durchführen, um neue Such- und Personalisierungsmöglichkeiten oder neue Interaktions- und Empfehlungsformate zu überprüfen.
Auch bei Untersuchungsgegenständen ohne direkten Internetbezug werden Online-Experimente immer beliebter. So bieten die weiter oben genannten Anbieter von Testmarktsimulationssystemen inzwischen alle auch kostengünstige Tests an, bei denen mit Hilfe von Online-Access-Panels Stichproben von Auskunftspersonen kontaktiert und befragt werden. Der Home-Use-Test der Neuprodukte erfolgt dabei mit Hilfe einer Zusendung und Erprobung des Neuprodukts zwischen zwei (Online-Befragungs-)Terminen. Auch Online-Access-Panels wie z. B. InnoFact (https://innofact-marktforschung.de/loesungen/home-use-test/) oder SIS International (https://www.sisinternational.com/solutions/qualitative-quantitative-research-solutions/in-home-use-tests-ihuts/) bieten derartige In-Home-Use-Tests als Online-Experiment an.
Arechar et al. (2018) weisen am Beispiel stärker grundlagenorientierter, spieltheoretischer Experimente nach, dass die bei Online-Experimenten deutlich höheren Verweigerungs- und Abbruchquoten ebenso wie die letztendlich unkontrollierte Erhebungssituation die Validität der Messung negativ beeinflussen kann. Auch bei Selka und Baier (2014) sowie Baier und Kurz (2021) zeigte sich bei der Auswertung von insgesamt 3.883 kommerziellen Conjoint-Experimenten aus den Jahren 2002 bis 2020, dass die interne und externe Validität der Studien parallel zum Übergang von anfangs fast ausschließlich Laborexperimenten zu heute fast ausschließlich Online-Experimenten unter Verwendung von Online-Access-Panels abgenommen hat.