Hörbuch erstellen ohne Tonstudio: Leitfaden für Selfpublisher
Lade dein gesamtes Manuskript in einem Schritt hoch – kein manuelles Aufteilen, kein kapitelweises Einfügen in ElevenLabs. DocsToAudio konvertiert dein Buch mit ElevenLabs-KI-Stimmen und gibt eine M4B-Datei mit Kapitelmarkierungen aus, die direkt bei Apple Books hochgeladen werden kann – zu einem Bruchteil der Studiokosten.
Nach der Fertigstellung eines Buches stehen viele Selfpublisher vor derselben Frage: Was ist mit der Hörbuchversion?
Der klassische Weg führt über einen professionellen Sprecher oder ein Tonstudio – die Kosten liegen typischerweise zwischen 2.000 und 5.000 US-Dollar, und professionelle Sprecher auf ACX (Amazons Hörbuchplattform) berechnen 200 bis 400 Dollar pro fertiggestellter Stunde. Für die meisten Selfpublisher lassen sich diese Kosten kaum wieder hereinspielen.
Die Alternative ist KI-Stimme – aber die meisten TTS-Tools haben Zeichenlimits, sodass man ein Buch in Dutzende Segmente aufteilen, diese separat verarbeiten und anschließend manuell zusammenfügen muss. Auch bei der direkten Nutzung von ElevenLabs muss man das Manuskript in Abschnitte zerteilen, Text Segment für Segment einfügen, jede Datei einzeln herunterladen und dann selbst zusammensetzen. Der Aufwand summiert sich schnell.
DocsToAudio wurde genau für diesen Anwendungsfall entwickelt: das gesamte Manuskript in einem Schritt hochladen, kein manuelles Aufteilen nötig. Der Dienst ruft automatisch ElevenLabs-KI-Stimmen auf, konvertiert und fügt alles zusammen und gibt dann eine M4B-Datei mit Kapitelmarkierungen aus. Kein Aufnahmegerät, kein manuelles Zusammenfügen.
Das M4B-Hörbuchformat: Kapitelnavigation und Selfpublishing-Standard
MP3 ist das universellste Audioformat, aber Hörbücher haben eine besondere Anforderung: Kapitelnavigation.
M4B (MPEG-4 Audiobook) ist Apples spezielles Hörbuchformat mit Unterstützung für Kapitelmarkierungen, Cover-Bild und Lesezeichen. Wenn du eine M4B-Datei in der Bücher-App auf dem iPhone oder in Apple Books abspielst, kannst du direkt zu jedem Kapitel springen – wie das Blättern in einem gedruckten Buch.
DocsToAudio generiert Kapitelmarkierungen automatisch aus der Überschriftenstruktur deines Dokuments. Lade ein DOCX mit 20 Kapiteln hoch, und die ausgegebene M4B-Datei hat automatisch 20 Kapitel-Navigationspunkte. Keine manuelle Konfiguration erforderlich.
Unterstützte Manuskriptformate: EPUB, DOCX, PDF, TXT
| Format | Hinweise |
|---|---|
| EPUB | Standard-E-Book-Format mit der vollständigsten Kapitelstruktur |
| DOCX | Word-Dokument, das gängigste Schreibformat |
| Geeignet für bereits gesetzte Manuskripte | |
| TXT | Reiner Text, ideal für einfach strukturierte Inhalte |
EPUB ist das empfehlenswerteste Format – EPUB-Dateien enthalten von Haus aus eine vollständige Kapitelstruktur, die DocsToAudio direkt lesen und mit höchster Genauigkeit auf die Kapitelmarkierungen im Ausgabe-Audio abbilden kann.
Das richtige ElevenLabs-KI-Stimmenmodell für dein Hörbuch wählen (weitere Modelle folgen)
Hörbücher erfordern eine höhere Stimmqualität als fast jeder andere Anwendungsfall: Die Zuhörer müssen stundenlang, manchmal zehnstundenlang konzentriert bleiben.
| Modell | Eigenschaften | Am besten geeignet für |
|---|---|---|
| ElevenLabs Flash v2.5 | Schnelle Konvertierung, geringere Kosten | Kürzere Inhalte, Effizienz im Vordergrund |
| ElevenLabs Turbo v2.5 | Ausgewogenes Verhältnis von Geschwindigkeit und Qualität | Die meisten Hörbuchprojekte |
| ElevenLabs Multilingual v2 | Beste mehrsprachige Qualität | Nicht-englische Bücher, zweisprachige Inhalte |
ElevenLabs bietet Hunderte von Stimmen, die vor der Konvertierung in der Vorschau angehört werden können, um die passende für den Ton deines Buches zu finden. ElevenLabs ist bereits integriert; weitere hochwertige KI-Stimmenmodelle werden hinzugefügt, um eine größere Auswahl zu bieten.
Vom Manuskript zum veröffentlichungsfertigen Hörbuch: 4-Schritte-KI-Stimmen-Workflow (ohne Studio)
Schritt 1: Manuskript hochladen
Öffne DocsToAudio und ziehe deine EPUB- oder DOCX-Datei auf die Seite.
Schritt 2: Inhalt in der Vorschau prüfen und organisieren
Das System extrahiert den Text und zeigt ihn nach Kapiteln gegliedert an. In diesem Schritt kannst du Copyright-Seiten, Inhaltsverzeichnisse oder andere Abschnitte entfernen, die nicht vorgelesen werden sollen.
Schritt 3: Eine ElevenLabs-Stimme auswählen
Wechsle in den Premium-Modus und wähle ein Modell sowie eine Stimme. Du kannst eine kurze Probe anhören, um den Stil zu bestätigen, bevor du die vollständige Konvertierung startest.
Schritt 4: M4B herunterladen und auf Vertriebsplattformen hochladen
Lade die M4B-Datei nach der Konvertierung herunter und lade sie auf diese Plattformen hoch:
- Apple Books: Upload über iTunes Connect, für Apple-Geräte-Nutzer
- Findaway Voices (Draft2Digital): Abdeckung von Spotify, Chirp, Kobo und vielen weiteren
- ACX: Amazons Hörbuchplattform, für Audible-Hörer
Kostenvergleich Hörbuchproduktion: Studio vs. Sprecher vs. KI
| Methode | Kosten | Zeit | Rechte |
|---|---|---|---|
| Professioneller Sprecher (ACX) | 200–400 $ / fertiggestellte Stunde | Wochen | Manche Plattformen verlangen Einnahmenteilung |
| Eigenaufnahme im Studio | Ausrüstung + Zeitaufwand | Wochen | Vollständig selbst |
| DocsToAudio + ElevenLabs | Abrechnung nach Zeichenanzahl; geschätzter Kreditverbrauch wird vor der Konvertierung angezeigt | Minuten bis Stunden | Vollständig selbst |
Häufig gestellte Fragen
1. Können Hörbücher mit KI-Stimme auf Audible veröffentlicht werden?
ACX (Audibles Creator-Plattform) hat ausdrückliche Offenlegungsanforderungen für KI-Stimmen: Du musst auf der Buchseite angeben, dass es „KI-generierte Stimme" ist. Manche Verlage und Plattformen haben zusätzliche Richtlinien für Inhalte mit KI-Stimmen – prüfe die aktuellen Vorgaben jeder Plattform vor dem Upload.
2. Wie viele Credits verbraucht ein Buch in der Regel?
DocsToAudio rechnet nach Zeichenanzahl ab, nicht nach Wortanzahl. Du musst im Voraus nichts manuell schätzen – melde dich an, lade dein Manuskript hoch, wähle ein ElevenLabs-Modell, und die Seite zeigt automatisch den geschätzten Kreditverbrauch für diese Konvertierung an. Prüfe die Schätzung, kaufe das benötigte Kreditpaket und starte dann die Konvertierung. Der tatsächliche Verbrauch wird zum Zeitpunkt der Konvertierung berechnet.
3. Werden Credits abgezogen, wenn ich die Konvertierung abbricht oder sie fehlschlägt?
DocsToAudio ruft die ElevenLabs API Segment für Segment auf – bereits verarbeitete Segmente verursachen tatsächliche Kosten. Auch wenn du während der Konvertierung auf Abbrechen klickst, werden bereits abgeschlossene Segmente deinem Kreditverbrauch angerechnet. Stelle sicher, dass dein Guthaben ausreichend ist, bevor du beginnst, und überprüfe den geschätzten Verbrauch auf der Vorschauseite vor dem Start.
Fang an, dein Hörbuch zu produzieren
Wenn dein Manuskript bereit ist, probiere es mit DocsToAudio aus und konvertiere ein Kapitel – lade ein EPUB oder DOCX hoch, wähle eine ElevenLabs-Stimme und höre das Ergebnis innerhalb von Minuten, um zu entscheiden, ob es das Richtige für dein Buch ist.
Bereit, deine Dokumente in Audio umzuwandeln?
DocsToAudio kostenlos testen →