A/B-Testing: Der vollständige Leitfaden für Split-Tests im Marketing (2026)

Q: Was ist A/B-Testing im E-Mail-Marketing?

A/B-Testing (Split-Testing) sendet zwei Versionen einer E-Mail an kleine Segmente Ihrer Liste, um herauszufinden, welche besser abschneidet. Die Gewinnerversion wird dann an die verbleibenden Abonnenten gesendet.

Q: Was sollte ich in E-Mails per A/B-Test testen?

Beginnen Sie mit Betreffzeilen (größter Einfluss), testen Sie dann Versandzeiten, CTAs, E-Mail-Design/Layout, Personalisierung und Inhaltslänge. Testen Sie jeweils nur eine Variable für eindeutige Ergebnisse.

Q: Wie lange sollte ich einen A/B-Test laufen lassen?

Für E-Mails testen Sie mit 10–20 % Ihrer Liste für 2–4 Stunden, bevor Sie die Gewinnerversion senden. Für Landingpages lassen Sie Tests mindestens 1–2 Wochen laufen oder bis Sie statistische Signifikanz (95 % Konfidenz) erreichen.

Erfahren Sie, wie Sie A/B-Tests durchführen, die Ihre Conversions tatsächlich verbessern. Behandelt E-Mail, Landingpages und Anzeigen mit echten Beispielen, Tools und statistischen Best Practices.

A/B-Testing

A/B-Testing?

A/B-Testing gehört zu den wirkungsvollsten Maßnahmen im Marketing. Anstatt darüber zu debattieren, ob ein roter Button besser konvertiert als ein grüner, lassen Sie Ihre Zielgruppe mit echten Daten entscheiden. Unternehmen, die systematisch testen, übertreffen diejenigen, die sich auf ihr Bauchgefühl verlassen – und der Abstand wird mit der Zeit immer größer.

Dieser Leitfaden behandelt alles, was Sie brauchen, um A/B-Tests durchzuführen, die zuverlässige, umsetzbare Ergebnisse über E-Mail-Kampagnen, Landingpages, Anzeigen und Produkterlebnisse hinweg liefern. Ob Sie neu im Split-Testing sind oder Ihre Methodik verfeinern möchten – hier finden Sie praktische Frameworks, echte Beispiele und Tool-Empfehlungen.

Was ist A/B-Testing?

A/B-Testing (auch Split-Testing genannt) ist ein kontrolliertes Experiment, bei dem Sie zwei Versionen eines Marketing-Elements vergleichen, um festzustellen, welches bei einer bestimmten Metrik besser abschneidet. Sie teilen Ihre Zielgruppe zufällig in zwei Gruppen, zeigen jeder Gruppe eine andere Version und messen den Unterschied in den Ergebnissen.

Das Konzept stammt aus randomisierten kontrollierten Studien in der Wissenschaft. Indem Sie nur eine Variable gleichzeitig ändern und alles andere konstant halten, können Sie den Effekt dieser einzelnen Änderung mit statistischer Sicherheit isolieren.

Wie A/B-Testing funktioniert

Jeder A/B-Test folgt demselben grundlegenden Ablauf:

Beobachten Sie eine Leistungsmetrik, die Sie verbessern möchten (z. B. E-Mail-Öffnungsrate liegt bei 18 %)
Stellen Sie eine Hypothese über eine Änderung auf, die sie verbessern könnte („Eine kürzere, neugierig machende Betreffzeile wird die Öffnungen steigern”)
Erstellen Sie zwei Versionen: die Kontrolle (A) und die Variante (B)
Teilen Sie Ihre Zielgruppe zufällig auf, sodass jede Gruppe statistisch gleichwertig ist
Führen Sie den Test für eine vorbestimmte Dauer durch oder bis Sie die erforderliche Stichprobengröße erreichen
Analysieren Sie die Ergebnisse anhand statistischer Signifikanz, um den Gewinner zu bestätigen
Implementieren Sie die Gewinnerversion und dokumentieren Sie die Erkenntnisse

A/B-Testing vs. Multivariate Tests

A/B-Testing vergleicht zwei Versionen mit einem geänderten Element. Multivariates Testing (MVT) ändert mehrere Elemente gleichzeitig und misst jede Kombination.

Merkmal	A/B-Testing	Multivariates Testing
Geänderte Variablen	Eine	Mehrere
Benötigte Versionen	2	Viele (2^n Kombinationen)
Erforderliche Stichprobengröße	Moderat	Sehr groß
Komplexität	Niedrig	Hoch
Am besten für	Gezielte Optimierung	Verständnis von Wechselwirkungen
Zeit bis zu Ergebnissen	Schneller	Langsamer

Für die meisten Marketing-Teams ist A/B-Testing der bessere Ausgangspunkt. Multivariates Testing wird nützlich, wenn Sie sehr hohen Traffic haben und verstehen möchten, wie Elemente miteinander interagieren.

Warum A/B-Testing wichtig ist

Daten ersetzen Meinungen

Marketing-Teams verschwenden enorm viel Zeit mit Diskussionen über subjektive Vorlieben. A/B-Testing ersetzt „Ich finde diese Überschrift besser” durch „Version B hat die Anmeldungen um 14 % mit 95 % Konfidenz gesteigert.” Diese Veränderung beeinflusst, wie Teams Entscheidungen treffen und Ressourcen zuweisen.

Kleine Verbesserungen summieren sich

Eine 5-prozentige Verbesserung der Conversion-Rate mag allein bescheiden wirken. Aber wenn Sie mehrere 5-%-Verbesserungen über Ihren Funnel hinweg stapeln, ist die Wirkung dramatisch:

E-Mail-Öffnungsrate: 18 % verbessert auf 18,9 % (+5 %)
Klickrate: 3,2 % verbessert auf 3,36 % (+5 %)
Landingpage-Conversion: 8 % verbessert auf 8,4 % (+5 %)
Kombinierter Effekt: 12,6 % mehr Conversions bei gleichem Traffic

Über ein Jahr konsequenten Testens können diese schrittweisen Verbesserungen Ihre Marketing-Leistung verdoppeln oder verdreifachen – ohne die Ausgaben zu erhöhen.

Risikominimierung

Einen kompletten Website-Relaunch oder ein neues E-Mail-Template ohne Testing zu starten, ist ein Glücksspiel. A/B-Testing ermöglicht es Ihnen, Änderungen mit einem kleinen Publikumssegment zu validieren, bevor Sie sie breit ausrollen. Wenn die neue Version schlechter abschneidet, haben Sie den Schaden auf einen Bruchteil Ihrer Nutzer begrenzt.

Aufbau von Unternehmenswissen

Jeder Test, ob er gewinnt oder verliert, erweitert das Verständnis Ihrer Organisation darüber, was das Kundenverhalten antreibt. Im Laufe der Zeit entsteht so ein sich verstärkender Wissensvorsprung, den Wettbewerber nicht leicht replizieren können.

Was Sie per A/B-Test testen sollten

Die wirkungsvollsten Tests zielen auf Elemente ab, die direkt wichtige Conversion-Metriken beeinflussen. Hier ist eine Aufschlüsselung nach Kanal.

E-Mail A/B-Testing

E-Mail ist einer der einfachsten und lohnendsten Kanäle zum Testen, da Sie die vollständige Kontrolle über die Variablen haben und Ergebnisse schnell messen können.

Betreffzeilen sind das einzelne Element mit dem größten Einfluss im E-Mail-Marketing. Sie bestimmen, ob Ihre Nachricht überhaupt geöffnet wird.

Testen Sie Variationen wie:

Länge: Kurz (3–5 Wörter) vs. beschreibend (8–12 Wörter)
Personalisierung: Name oder Unternehmen des Empfängers einbinden vs. generisch
Dringlichkeit: „Letzte Chance” oder Fristsprache vs. neutrale Formulierung
Neugier: Offene Schleifen („Die eine Metrik, die die meisten Marketer ignorieren”) vs. direkte Nutzenaussagen
Emoji: Mit vs. ohne
Zahlenspezifik: „5 Strategien” vs. „Strategien” ohne Zahl

E-Mail-Inhalte, die Sie testen können:

CTA-Platzierung: Über dem Fold vs. nach Aufbau der Argumentation
CTA-Text: „Jetzt starten” vs. „Kostenlos testen” vs. „So funktioniert es”
Layout: Einspaltig vs. mehrspaltig
Bildverwendung: Produktbilder vs. Lifestyle-Bilder vs. nur Text
Inhaltslänge: Kurz und prägnant vs. detailliert und umfassend
Social Proof: Testimonials einbinden vs. Statistiken vs. keins von beiden

Versandzeitoptimierung kann die Öffnungsraten erheblich beeinflussen. Testen Sie den Versand derselben E-Mail zu verschiedenen Tageszeiten oder an verschiedenen Wochentagen, um herauszufinden, wann Ihre spezifische Zielgruppe am empfänglichsten ist.

Landingpage A/B-Testing

Landingpages bieten die meisten Variablen zum Testen und erzeugen oft die größten Conversion-Steigerungen.

Überschriften: Ihre Überschrift ist das Erste, was Besucher lesen, und hat den größten Einfluss auf die Absprungrate.

Nutzenorientiert („Erweitern Sie Ihre E-Mail-Liste 3x schneller”) vs. funktionsorientiert („KI-gestützter E-Mail-Listen-Builder”)
Frageformat („Verlieren Sie immer noch Abonnenten?”) vs. Aussageformat
Kurz und mutig vs. lang und spezifisch

Call-to-Action-Buttons:

Buttonfarbe (testen Sie den Kontrast, nicht nur einzelne Farben)
Buttontext („Kostenlos anmelden” vs. „Jetzt durchstarten” vs. „Mein Konto erstellen”)
Buttongröße und -platzierung
Einzelner CTA vs. mehrere CTAs

Seitenlayout und Design:

Langform- vs. Kurzform-Seiten
Video über dem Fold vs. statisches Bild
Platzierung und Format von Testimonials
Formularlänge (weniger Felder vs. mehr Qualifikation)
Vertrauenssiegel und Sicherheitsabzeichen

Preisdarstellung:

Monatliche vs. jährliche Preise zuerst angezeigt
Einbindung eines „Beliebteste”-Tags
Drei-Stufen- vs. Zwei-Stufen-Preisgestaltung

Anzeigen A/B-Testing

Bezahlte Werbeplattformen wie Google Ads und Meta Ads verfügen über integrierte A/B-Testing-Funktionen, aber eine disziplinierte Methodik ist dennoch wichtig.

Anzeigentext: Verschiedene Wertversprechen, emotionale vs. rationale Ansprache
Überschriften: Verschiedene Blickwinkel auf dieselbe Keyword-Intention
Kreativ-Elemente: Verschiedene Bilder, Videos oder Grafikstile
Zielgruppensegmente: Dieselbe Anzeige über verschiedene Targeting-Kriterien testen
Landingpage-Ziele: Anzeigentraffic auf verschiedene Seiten leiten

CTA- und Conversion-Element-Testing

Über einzelne Kanäle hinaus sollten Sie die Conversion-Elemente testen, die in Ihrem gesamten Marketing auftauchen:

Formularlänge: Jedes zusätzliche Feld reduziert die Abschlüsse, erhöht aber die Lead-Qualität
Social-Proof-Format: Sternebewertungen vs. schriftliche Testimonials vs. Kundenlogos
Dringlichkeitselemente: Countdown-Timer, begrenzte Verfügbarkeitshinweise
Garantiebotschaften: Geld-zurück-Garantien, kostenlose Testbedingungen
Navigation: Navigation einbinden vs. auf Conversion-Seiten entfernen

Wie Sie einen A/B-Test durchführen: Schritt für Schritt

Schritt 1: Definieren Sie Ihr Ziel und Ihre Metrik

Beginnen Sie mit einer klaren Metrik. Der Versuch, gleichzeitig für mehrere Metriken zu optimieren, führt zu mehrdeutigen Ergebnissen.

Gute Beispiele:

„E-Mail-Öffnungsrate von 22 % auf 25 % steigern”
„Landingpage-Conversion-Rate von 3,5 % auf 4,5 % verbessern”
„Warenkorbabbruchrate von 68 % auf 62 % senken”

Schritt 2: Formulieren Sie eine Hypothese

Eine starke Hypothese hat drei Komponenten:

„Wenn wir [Änderung], dann wird [Metrik] sich [verbessern/verschlechtern], weil [Begründung].”

Beispiel: „Wenn wir unser Anmeldeformular von 6 auf 3 Felder verkürzen, wird die Formularabschlussrate um mindestens 15 % steigen, weil die Reduzierung von Reibung den wahrgenommenen Aufwand senkt.”

Die Begründung ist wichtig, weil sie Tests in Lernmöglichkeiten verwandelt, selbst wenn die Hypothese falsch ist.

Schritt 3: Berechnen Sie Ihre erforderliche Stichprobengröße

Einen Test ohne Kenntnis der erforderlichen Stichprobengröße durchzuführen, ist einer der häufigsten Fehler. Sie brauchen genügend Daten, damit das Ergebnis statistisch aussagekräftig ist.

Die erforderliche Stichprobengröße hängt von drei Faktoren ab:

Basis-Conversion-Rate: Ihre aktuelle Leistung
Minimaler erkennbarer Effekt (MDE): Die kleinste Verbesserung, die es wert ist, erkannt zu werden
Statistische Power: Die Wahrscheinlichkeit, einen echten Effekt zu erkennen (typischerweise 80 %)
Signifikanzniveau: Ihre Toleranz für falsch positive Ergebnisse (typischerweise 5 %, oder p < 0,05)

Beispielberechnung:

Angenommen, Ihre Landingpage konvertiert bei 5 % (Basis) und Sie möchten eine 20-prozentige relative Verbesserung (auf 6 %) erkennen. Mit 80 % Power und 95 % Signifikanz:

Erforderliche Stichprobengröße pro Variante: ungefähr 3.600 Besucher
Gesamte benötigte Stichprobe: 7.200 Besucher

Die Formel verwendet die folgende Näherung:

n = (Z_alpha/2 + Z_beta)^2 * [p1(1-p1) + p2(1-p2)] / (p2 - p1)^2

Dabei gilt:

Z_alpha/2 = 1,96 (für 95 % Konfidenz)
Z_beta = 0,84 (für 80 % Power)
p1 = 0,05 (Basisrate)
p2 = 0,06 (erwartete Rate mit Verbesserung)

Eingesetzt:

n = (1,96 + 0,84)^2 * [0,05(0,95) + 0,06(0,94)] / (0,06 - 0,05)^2
n = (2,80)^2 * [0,0475 + 0,0564] / (0,01)^2
n = 7,84 * 0,1039 / 0,0001
n ≈ 8.146 pro Variante

In der Praxis nutzen die meisten Marketer einen Online-Stichprobenrechner oder den in ihrem Testing-Tool integrierten Rechner. Die wichtigste Erkenntnis: Kleinere Effekte erfordern deutlich größere Stichproben, um sie zuverlässig zu erkennen.

Schritt 4: Erstellen Sie Ihre Varianten

Bleiben Sie diszipliniert:

Ändern Sie nur ein Element pro Test. Wenn Sie gleichzeitig die Überschrift und die Buttonfarbe ändern, können Sie das Ergebnis keiner der beiden Änderungen zuschreiben.
Machen Sie die Änderung bedeutsam. Das Testen von „Jetzt kaufen” vs. „jetzt kaufen” (Groß-/Kleinschreibung) wird wahrscheinlich keine messbaren Ergebnisse liefern. Testen Sie wirklich unterschiedliche Ansätze.
Dokumentieren Sie genau, was geändert wurde, damit die Ergebnisse reproduzierbar sind.

Schritt 5: Randomisieren und teilen Sie Ihre Zielgruppe

Eine ordnungsgemäße Randomisierung ist entscheidend. Jeder Besucher oder Empfänger sollte die gleiche Wahrscheinlichkeit haben, eine der beiden Versionen zu sehen. Die meisten Testing-Tools erledigen das automatisch, aber überprüfen Sie, dass:

Die Aufteilung wirklich zufällig ist (nicht basierend auf Geografie, Gerät oder Ankunftszeit)
Jeder Nutzer durchgehend dieselbe Version sieht (kein Flackern zwischen Versionen)
Ihre Stichprobengruppen groß genug sind, um statistisch repräsentativ zu sein

Schritt 6: Führen Sie den Test bis zum Ende durch

Hier ist Disziplin am wichtigsten. Schauen Sie nicht zwischendurch auf die Ergebnisse und beenden Sie den Test vorzeitig, wenn eine Version wie ein Gewinner aussieht. Frühe Ergebnisse sind verrauscht und unzuverlässig.

Gängige Regeln:

Führen Sie den Test durch, bis Sie Ihre vorberechnete Stichprobengröße erreichen
Lassen Sie ihn mindestens einen vollständigen Geschäftszyklus laufen (typischerweise 1–2 Wochen für Web, ein vollständiger Versand für E-Mail)
Ändern Sie während des Tests nichts

Schritt 7: Analysieren Sie die Ergebnisse und bestimmen Sie die statistische Signifikanz

Ein Ergebnis ist statistisch signifikant, wenn die Wahrscheinlichkeit, dass der beobachtete Unterschied zufällig aufgetreten ist, unter 5 % liegt (p-Wert < 0,05).

Beispiel: Ihr Test zeigt, dass Version B bei 6,2 % konvertiert vs. Version A bei 5,0 %, mit einem p-Wert von 0,03. Das bedeutet, dass es nur eine 3-prozentige Wahrscheinlichkeit gibt, dass dieser Unterschied von 1,2 Prozentpunkten auf zufällige Variation zurückzuführen ist. Sie können Version B zuversichtlich implementieren.

Wenn der p-Wert jedoch 0,15 beträgt, ist der beobachtete Unterschied nicht zuverlässig genug, um danach zu handeln, auch wenn Version B „gewonnen” hat. Sie bräuchten mehr Daten oder eine größere Effektstärke.

Schritt 8: Implementieren und iterieren

Wenden Sie die Gewinnerversion an. Dokumentieren Sie die Hypothese, was getestet wurde, das Ergebnis und das Konfidenzniveau. Dann gehen Sie zum nächsten Test über.

Die besten Testing-Programme pflegen einen Backlog von Testideen, geordnet nach potenziellem Impact und Umsetzbarkeit.

Statistische Signifikanz: Vertiefung

Konfidenzintervalle verstehen

Anstatt sich ausschließlich auf p-Werte zu verlassen, betrachten Sie Konfidenzintervalle. Ein 95-%-Konfidenzintervall gibt Ihnen den Bereich an, in dem die wahre Conversion-Rate wahrscheinlich liegt.

Wenn Version B eine Conversion-Rate von 6,2 % mit einem 95-%-KI von [5,4 %, 7,0 %] zeigt und Version A 5,0 % mit einem 95-%-KI von [4,3 %, 5,7 %], deuten die überlappenden Bereiche darauf hin, dass der Unterschied möglicherweise nicht so eindeutig ist, wie die Punktschätzungen vermuten lassen.

Häufige statistische Fehler

Zwischenblicke: Das mehrfache Prüfen von Ergebnissen erhöht Ihre Falsch-Positiv-Rate. Wenn Sie einen Test während seines Laufs 5-mal prüfen, kann Ihr effektives Signifikanzniveau bei 15–25 % statt bei 5 % liegen.
Vorzeitiges Beenden: Einen Test zu beenden, sobald eine Version Signifikanz erreicht, erfasst oft Rauschen statt Signal.
Ignorieren der Stichprobengrößenanforderungen: Einen Test mit 200 Besuchern durchzuführen und einen Gewinner zu erklären, ist unzuverlässig – unabhängig davon, was die Zahlen zeigen.
Zu viele Varianten testen: Ein A/B/C/D/E-Test teilt Ihre Stichprobe fünffach und reduziert die statistische Power dramatisch.
Survivorship Bias in Berichten: Nur gewonnene Tests zu teilen, erzeugt ein irreführendes Bild der Testing-Effektivität.

Bayesianischer vs. frequentistischer Ansatz

Traditionelles A/B-Testing verwendet frequentistische Statistik (p-Werte und Konfidenzintervalle). Einige moderne Tools nutzen bayesianische Methoden, die Ergebnisse als Wahrscheinlichkeiten ausdrücken („es gibt eine 94-prozentige Wahrscheinlichkeit, dass B besser ist als A”).

Bayesianische Methoden bieten einige praktische Vorteile:

Ergebnisse sind für Nicht-Statistiker leichter zu interpretieren
Sie können Ergebnisse kontinuierlich überwachen, ohne Fehlerraten zu erhöhen
Sie handhaben kleine Stichproben eleganter

Beide Ansätze sind valide. Das Wichtige ist, einen konsistent zu verwenden und seine Annahmen zu verstehen.

A/B-Testing Tools im Vergleich

Die Wahl des richtigen Tools hängt davon ab, was Sie testen und in welchem Umfang Sie arbeiten.

Brevo

Am besten für: E-Mail A/B-Testing und Multi-Channel-Kampagnenoptimierung

Brevo bietet robustes integriertes A/B-Testing für E-Mail-Kampagnen, das Split-Testing auch für kleinere Marketing-Teams zugänglich macht. Zu den wichtigsten Funktionen gehören:

Betreffzeilen-Testing: Testen Sie bis zu vier Betreffzeilen-Varianten und senden Sie automatisch die Gewinnerversion an die restliche Liste
Content-Testing: Vergleichen Sie vollständig unterschiedliche E-Mail-Layouts und Texte
Versandzeit-Optimierung: KI-gestützte Versandzeitvorhersage basierend auf individuellen Empfänger-Verhaltensmustern
Flexible Gewinnerkriterien: Wählen Sie Ihre Gewinner-Metrik (Öffnungen, Klicks oder Umsatz) und legen Sie die Testdauer fest
Automatische Gewinnerauslieferung: Einmal einrichten und vergessen. Brevo sendet die Gewinnerversion an den Rest Ihrer Liste, nachdem die Testphase endet

Brevos Vorteil ist, dass A/B-Testing nativ in dieselbe Plattform integriert ist, die Sie für E-Mail, SMS, WhatsApp und Marketing-Automatisierung nutzen. Es fallen keine zusätzlichen Kosten oder Drittanbieter-Integrationen an, und die Ergebnisse fließen direkt in Ihre Kampagnenanalysen ein.

Preise: A/B-Testing ist ab dem Business-Plan verfügbar.

Optimizely

Am besten für: Enterprise-Web- und Produktexperimente

Optimizely ist der Industriestandard für Website- und Produkt-A/B-Testing im großen Maßstab. Es unterstützt Feature Flags, serverseitiges Testing und anspruchsvolles Audience Targeting. Die Plattform bietet Full-Stack-Experimente, was bedeutet, dass Sie Tests über Web, Mobile und Backend-Systeme hinweg durchführen können.

Preise: Individuelle Enterprise-Preise, die typischerweise bei mehreren Tausend Euro pro Monat beginnen.

VWO (Visual Website Optimizer)

Am besten für: Mid-Market-Website- und Conversion-Optimierung

VWO bietet einen visuellen Editor zum Erstellen von Testvarianten ohne Code, zusammen mit Heatmaps, Sitzungsaufzeichnungen und Umfragen. Es findet eine gute Balance zwischen Benutzerfreundlichkeit und analytischer Tiefe.

Preise: Pläne beginnen bei etwa 199 $/Monat für Basic-Testing.

Google Analytics / Google Tag Manager

Am besten für: Grundlegendes Website-Testing mit kleinem Budget

Obwohl Google Optimize 2023 eingestellt wurde, können Sie weiterhin grundlegende A/B-Tests mit Google Analytics 4 in Kombination mit Google Tag Manager durchführen. Die Einrichtung erfordert mehr technischen Aufwand als dedizierte Tools, ist aber kostenlos und integriert sich natürlich in Ihre bestehenden Analysen.

Preise: Kostenlos.

Unbounce

Am besten für: Landingpage A/B-Testing

Unbounce kombiniert einen Landingpage-Builder mit integriertem A/B-Testing, was es unkompliziert macht, Landingpage-Varianten zu erstellen und zu testen. Die Smart-Traffic-Funktion nutzt KI, um Besucher automatisch zu der Variante zu leiten, die für ihr Profil am wahrscheinlichsten konvertiert.

Preise: Pläne beginnen bei 74 $/Monat, mit A/B-Testing auf höheren Stufen verfügbar.

Tool-Vergleichsübersicht

Tool	Bester Kanal	A/B-Testing-Einfachheit	KI-Funktionen	Einstiegspreis
Brevo	E-Mail, SMS, Multi-Channel	Sehr einfach	Versandzeit-KI, Auto-Gewinner	Im Business-Plan enthalten
Optimizely	Web, Produkt	Moderat	Prädiktive Analysen	Enterprise-Preise
VWO	Web, Landingpages	Einfach (visueller Editor)	KI-gestützte Einblicke	~199 $/Monat
GA4 + GTM	Web	Technisch	Grundlegende ML-Einblicke	Kostenlos
Unbounce	Landingpages	Einfach	Smart Traffic Routing	74 $/Monat

Echte A/B-Testing-Beispiele

Beispiel 1: E-Mail-Betreffzeilen-Test

Unternehmen: Ein E-Commerce-Shop für Outdoor-Ausrüstung

Test: Zwei Betreffzeilen-Ansätze für eine saisonale Verkaufs-E-Mail

Version A: „Frühlingssale: 30 % Rabatt auf alle Wanderausrüstung”
Version B: „Ihr nächstes Abenteuer beginnt hier (30 % Rabatt inbegriffen)”

Ergebnisse:

Version A: 24,3 % Öffnungsrate, 4,1 % Klickrate
Version B: 28,7 % Öffnungsrate, 3,8 % Klickrate
Gewinner: Version B bei Öffnungen, Version A bei Klicks

Erkenntnis: Neugier erzeugende Betreffzeilen steigerten die Öffnungen, zogen aber weniger kaufbereiten Traffic an. Das Team entschied sich, die Klickrate zu optimieren, da sie stärker mit dem Umsatz korrelierte.

Beispiel 2: Landingpage CTA-Button

Unternehmen: Ein SaaS-Produkt mit kostenloser Testversion

Test: CTA-Button-Text auf der Preisseite

Version A: „Kostenlos testen”
Version B: „Kostenlos testen – Keine Kreditkarte erforderlich”

Ergebnisse:

Version A: 3,8 % Conversion-Rate
Version B: 5,1 % Conversion-Rate (34 % Verbesserung, p = 0,008)

Erkenntnis: Das Entfernen von wahrgenommenem Risiko im CTA-Text steigerte die Anmeldungen erheblich. Der Einwand „Muss ich meine Kreditkarte eingeben?” war ein großer Reibungspunkt, obwohl die Seite dies bereits in kleinerem Text erwähnte.

Beispiel 3: Produktempfehlungs-E-Mails mit Tajo

Unternehmen: Ein Shopify-Store, der Tajo zur Synchronisierung von Kunden- und Bestelldaten mit Brevo nutzt

Test: Zwei Ansätze für automatisierte Produktempfehlungs-E-Mails, die nach einem Erstkauf ausgelöst werden

Version A: Generische „Das könnte Ihnen auch gefallen”-Empfehlungen basierend auf der Kategorie
Version B: Personalisierte Empfehlungen auf Basis von Tajos synchronisierter Kaufhistorie und Kundensegmentdaten, die an Brevo übermittelt werden

Ergebnisse:

Version A: 2,1 % Klickrate, 0,8 % Kaufrate
Version B: 4,7 % Klickrate, 2,3 % Kaufrate (187 % mehr Käufe)

Erkenntnis: Wenn Kundenintelligenz von Tajo reichhaltigere Verhaltensdaten in Brevos E-Mail-Engine einspeist, verbessert sich die Empfehlungsrelevanz dramatisch. Der Schlüssel war die Synchronisierung nicht nur von Bestelldaten, sondern auch von Browsing-Events und Produktaffinitäts-Scores über Tajos Echtzeit-Datenpipeline.

Beispiel 4: Anzeigen-Kreativ-Test

Unternehmen: Ein B2B-Softwareunternehmen mit LinkedIn-Anzeigen

Test: Zwei kreative Ansätze für dieselbe Zielgruppe

Version A: Produkt-Screenshot mit Feature-Hervorhebungen
Version B: Kunden-Testimonial-Zitat mit Porträtfoto

Ergebnisse:

Version A: 0,38 % CTR, 42 $ Kosten pro Lead
Version B: 0,61 % CTR, 28 $ Kosten pro Lead (33 % niedrigerer CPL)

Erkenntnis: Social Proof übertraf Produktfunktionen bei kalten Zielgruppen auf LinkedIn. Das Team testete anschließend verschiedene Testimonial-Formate und fand heraus, dass spezifische Metriken im Zitat („sparte 12 Stunden pro Woche”) allgemeines Lob übertrafen.

Häufige A/B-Testing-Fehler

1. Testen ohne Hypothese

Zufällige Tests ohne klare Hypothese erzeugen Daten, aber kein Wissen. Beginnen Sie immer mit einer begründeten Vorhersage darüber, warum eine Änderung funktionieren könnte. Selbst wenn Ihre Hypothese falsch ist, hilft Ihnen die Begründung zu lernen und bessere Tests zu entwerfen.

2. Tests zu früh beenden

Die Versuchung, nach wenigen hundert Datenpunkten einen Gewinner zu erklären, ist groß, besonders wenn frühe Ergebnisse dramatisch aussehen. Widerstehen Sie. Frühe Ergebnisse tendieren mit mehr Daten zum Mittelwert zurück. Verpflichten Sie sich vor Testbeginn auf Ihre Stichprobengrößenberechnung.

3. Triviale Änderungen testen

Die Änderung eines Buttons von #FF0000 auf #FF1100 wird keine messbaren Ergebnisse liefern. Konzentrieren Sie sich auf Änderungen, die echte Nutzeranliegen, Einwände oder Verhaltensmuster ansprechen. Die besten Tests ändern die Botschaft, das Angebot oder den Nutzerfluss – nicht geringfügige kosmetische Details.

4. Segmentunterschiede ignorieren

Ein insgesamt „kein Unterschied”-Ergebnis kann signifikante Unterschiede innerhalb von Segmenten verbergen. Version B könnte bei Mobile-Nutzern dramatisch besser funktionieren, während sie bei Desktop-Nutzern schlechter abschneidet. Analysieren Sie Ergebnisse immer nach Schlüsselsegmenten (Gerät, Quelle, neu vs. wiederkehrend), wenn die Stichprobengrößen es zulassen.

5. Externe Faktoren nicht berücksichtigen

Ein Test, der während einer Feiertagsverkaufsperiode läuft, wird andere Ergebnisse liefern als einer in einer normalen Woche. Achten Sie auf saisonale Effekte, Aktionskalender, Nachrichtenereignisse und andere externe Faktoren, die die Ergebnisse verzerren könnten.

6. Zu viele Dinge gleichzeitig testen

Wenn Sie Überschrift, Heldenbild, CTA-Text und Seitenlayout gleichzeitig ändern, sagt Ihnen ein positives Ergebnis, dass etwas funktioniert hat – aber nicht was. Priorisieren Sie Ihre Testideen nach potenziellem Impact und testen Sie die wirkungsvollsten Elemente zuerst.

7. Keine Testing-Kultur aufbauen

A/B-Testing scheitert, wenn es als einmaliges Projekt statt als kontinuierliche Praxis behandelt wird. Die erfolgreichsten Unternehmen führen Tests kontinuierlich durch, pflegen ein gemeinsames Repository von Ergebnissen und machen Testing zum Standard bei jedem Kampagnenstart.

Ein A/B-Testing-Programm aufbauen

Einen Test-Backlog erstellen

Pflegen Sie eine priorisierte Liste von Testideen mit dem ICE-Framework:

Impact: Wie stark könnte dieser Test die Zielmetrik verbessern? (1–10)
Confidence: Wie zuversichtlich sind Sie, dass dieser Test ein aussagekräftiges Ergebnis liefert? (1–10)
Ease: Wie einfach ist es, diesen Test umzusetzen? (1–10)

Multiplizieren Sie die drei Werte, um Tests zu priorisieren. Ein Test mit hohem Impact, hoher Zuversicht und einfacher Umsetzung (wie ein Betreffzeilen-Test in Brevo) sollte gegenüber einem potenziell wirkungsvollen, aber komplexen Test (wie einem kompletten Checkout-Redesign) bevorzugt werden.

Einen Testing-Rhythmus etablieren

Streben Sie einen konsistenten Rhythmus an:

E-Mail-Tests: Bei jedem wichtigen Kampagnenversand durchführen. Brevo macht dies besonders einfach, da die A/B-Funktionalität in den Kampagnerstellungs-Workflow integriert ist.
Landingpage-Tests: Kontinuierlich durchführen, mit 2–4 Tests pro Monat, je nach Trafficvolumen.
Anzeigen-Tests: 1–2 Kreativtests pro Anzeigengruppe pro Monat durchführen.

Ergebnisse dokumentieren und teilen

Erstellen Sie ein einfaches Testprotokoll mit:

Testname und Datum
Hypothese
Was geändert wurde
Ergebnisse (einschließlich Konfidenzniveau)
Wichtigste Erkenntnis
Nächste Maßnahme

Diese Dokumentation wird im Laufe der Zeit zu einem Ihrer wertvollsten Marketing-Assets.

Häufig gestellte Fragen

Wie lange sollte ein A/B-Test laufen?

Bis Sie Ihre erforderliche Stichprobengröße erreichen oder mindestens einen vollständigen Geschäftszyklus (typischerweise 7–14 Tage für Web-Tests). Für E-Mail-A/B-Tests in Tools wie Brevo übernimmt die Plattform das Timing automatisch. Sie legen die Testdauer fest (üblicherweise 1–4 Stunden für Betreffzeilen-Tests), und die Gewinnerversion geht an die verbleibenden Empfänger.

Was ist eine gute Stichprobengröße für A/B-Testing?

Das hängt von Ihrer Basis-Conversion-Rate und dem minimalen Effekt ab, den Sie erkennen möchten. Als grobe Orientierung: Um eine 10-prozentige relative Verbesserung bei einer 5-%-Basis mit 95 % Konfidenz und 80 % Power zu erkennen, benötigen Sie ungefähr 15.000 Besucher pro Variante. Für E-Mail-Tests liefern Listen von 1.000+ Abonnenten pro Variante in der Regel zuverlässige Ergebnisse für Öffnungsraten-Tests.

Kann ich mehrere A/B-Tests gleichzeitig durchführen?

Ja, solange die Tests nicht miteinander interagieren. Einen E-Mail-Betreffzeilen-Test und einen Landingpage-Überschriften-Test gleichzeitig durchzuführen, ist in Ordnung, da sie verschiedene Teile des Funnels betreffen. Zwei Tests auf derselben Landingpage gleichzeitig durchzuführen, kann Wechselwirkungen erzeugen, die die Ergebnisse verwirren.

Was ist ein statistisch signifikantes Ergebnis?

Ein Ergebnis, bei dem die Wahrscheinlichkeit, dass der beobachtete Unterschied zufällig aufgetreten ist, unter Ihrer Signifikanzschwelle liegt, typischerweise 5 % (p < 0,05). Das bedeutet, Sie können zu mindestens 95 % sicher sein, dass der Unterschied real ist und nicht auf zufällige Variation zurückzuführen ist.

Wie führe ich A/B-Tests mit kleiner Zielgruppe durch?

Bei kleineren Zielgruppen konzentrieren Sie sich auf das Testen von Elementen mit dem größten potenziellen Effekt. Betreffzeilen-Tests können bei kleineren Listen aussagekräftige Unterschiede zeigen, da Öffnungsratenunterschiede tendenziell größer sind. Sie können auch die Testdauer verlängern, um mehr Daten zu sammeln, oder bayesianische statistische Methoden verwenden, die mit kleinen Stichproben eleganter umgehen.

Sollte ich immer den statistisch signifikanten Gewinner wählen?

In der Regel ja, aber betrachten Sie das Gesamtbild. Wenn Version B bei Klicks gewinnt, aber Version A beim Umsatz, hängt der „Gewinner” von Ihrem Geschäftsziel ab. Berücksichtigen Sie auch die praktische Signifikanz: Eine statistisch signifikante 0,1-%-Verbesserung ist möglicherweise den Implementierungsaufwand nicht wert.

Was ist der Unterschied zwischen A/B-Testing und Personalisierung?

A/B-Testing identifiziert, welche Version für Ihre gesamte Zielgruppe (oder ein Segment) am besten funktioniert. Personalisierung liefert verschiedenen Nutzern basierend auf ihren Eigenschaften oder ihrem Verhalten unterschiedliche Inhalte. Beide arbeiten zusammen: Nutzen Sie A/B-Testing, um festzustellen, welche Personalisierungsstrategien am effektivsten sind.

Heute noch starten

Sie brauchen keine umfangreiche Testing-Infrastruktur, um zu beginnen. Starten Sie mit dem Kanal, über den Sie die meiste Kontrolle und die schnellste Feedback-Schleife haben – für die meisten Unternehmen ist das E-Mail.

Wenn Sie Brevo nutzen, können Sie Ihren ersten A/B-Test in weniger als fünf Minuten innerhalb des Kampagnerstellungs-Workflows einrichten. Testen Sie eine Betreffzeile, lassen Sie die Plattform automatisch den Gewinner auswählen und überprüfen Sie die Ergebnisse. Dieser einzelne Test wird Ihnen mehr über Ihre Zielgruppe beibringen als wochenlange interne Debatten.

Für E-Commerce-Unternehmen ist die Verbindung Ihrer Shop-Daten über Tajo und das Durchführen von A/B-Tests bei Produktempfehlungs-E-Mails in Brevo eine der Strategien mit dem höchsten ROI. Wenn Ihre E-Mails auf echten Kundenkaufdaten basieren, haben Sie weitaus aussagekräftigere Elemente zum Testen als generische Inhalte.

Die Unternehmen, die gewinnen, sind nicht die mit den besten ersten Vermutungen. Es sind die, die am meisten testen, am schnellsten lernen und ihre Vorteile über die Zeit hinweg ausbauen. Starten Sie heute Ihren ersten Test.

Frequently Asked Questions

Was ist A/B-Testing im E-Mail-Marketing?

A/B-Testing (Split-Testing) sendet zwei Versionen einer E-Mail an kleine Segmente Ihrer Liste, um herauszufinden, welche besser abschneidet. Die Gewinnerversion wird dann an die verbleibenden Abonnenten gesendet.

Was sollte ich in E-Mails per A/B-Test testen?

Beginnen Sie mit Betreffzeilen (größter Einfluss), testen Sie dann Versandzeiten, CTAs, E-Mail-Design/Layout, Personalisierung und Inhaltslänge. Testen Sie jeweils nur eine Variable für eindeutige Ergebnisse.

Wie lange sollte ich einen A/B-Test laufen lassen?

Für E-Mails testen Sie mit 10–20 % Ihrer Liste für 2–4 Stunden, bevor Sie die Gewinnerversion senden. Für Landingpages lassen Sie Tests mindestens 1–2 Wochen laufen oder bis Sie statistische Signifikanz (95 % Konfidenz) erreichen.

Artikel teilen:

Zurück zu allen Beiträgen

A/B-Testing: Der vollständige Leitfaden für Split-Tests im Marketing (2026)

Was ist A/B-Testing?

Wie A/B-Testing funktioniert

A/B-Testing vs. Multivariate Tests

Warum A/B-Testing wichtig ist

Daten ersetzen Meinungen

Kleine Verbesserungen summieren sich

Risikominimierung

Aufbau von Unternehmenswissen

Was Sie per A/B-Test testen sollten

E-Mail A/B-Testing

Landingpage A/B-Testing

Anzeigen A/B-Testing

CTA- und Conversion-Element-Testing

Wie Sie einen A/B-Test durchführen: Schritt für Schritt

Schritt 1: Definieren Sie Ihr Ziel und Ihre Metrik

Schritt 2: Formulieren Sie eine Hypothese

Schritt 3: Berechnen Sie Ihre erforderliche Stichprobengröße

Schritt 4: Erstellen Sie Ihre Varianten

Schritt 5: Randomisieren und teilen Sie Ihre Zielgruppe

Schritt 6: Führen Sie den Test bis zum Ende durch

Schritt 7: Analysieren Sie die Ergebnisse und bestimmen Sie die statistische Signifikanz

Schritt 8: Implementieren und iterieren

Statistische Signifikanz: Vertiefung

Konfidenzintervalle verstehen

Häufige statistische Fehler

Bayesianischer vs. frequentistischer Ansatz

A/B-Testing Tools im Vergleich

Brevo

Optimizely

VWO (Visual Website Optimizer)

Google Analytics / Google Tag Manager

Unbounce

Tool-Vergleichsübersicht

Echte A/B-Testing-Beispiele

Beispiel 1: E-Mail-Betreffzeilen-Test

Beispiel 2: Landingpage CTA-Button

Beispiel 3: Produktempfehlungs-E-Mails mit Tajo

Beispiel 4: Anzeigen-Kreativ-Test

Häufige A/B-Testing-Fehler

1. Testen ohne Hypothese

2. Tests zu früh beenden

3. Triviale Änderungen testen

4. Segmentunterschiede ignorieren

5. Externe Faktoren nicht berücksichtigen

6. Zu viele Dinge gleichzeitig testen

7. Keine Testing-Kultur aufbauen

Ein A/B-Testing-Programm aufbauen

Einen Test-Backlog erstellen

Einen Testing-Rhythmus etablieren

Ergebnisse dokumentieren und teilen

Häufig gestellte Fragen

Wie lange sollte ein A/B-Test laufen?

Was ist eine gute Stichprobengröße für A/B-Testing?

Kann ich mehrere A/B-Tests gleichzeitig durchführen?

Was ist ein statistisch signifikantes Ergebnis?

Wie führe ich A/B-Tests mit kleiner Zielgruppe durch?

Sollte ich immer den statistisch signifikanten Gewinner wählen?

Was ist der Unterschied zwischen A/B-Testing und Personalisierung?

Heute noch starten

Verwandte Artikel

Frequently Asked Questions