Was ist eine EPUB-Datei?

EPUB (Electronic Publication) ist das am weitesten verbreitete offene Standardformat für digitale Bücher und Publikationen. Im Gegensatz zu PDF-Dateien, die feste Layouts beibehalten, sind EPUB-Dateien so konzipiert, dass sie reflowbar sind, d. h. der Text passt sich automatisch an verschiedene Bildschirmgrößen und Geräte an. Eine EPUB-Datei ist im Wesentlichen ein ZIP-Archiv, das XHTML- oder HTML-Inhalte, CSS-Stylesheets, Bilder und Metadatendateien enthält, die nach der EPUB-Spezifikation organisiert sind.

Das Format wurde vom International Digital Publishing Forum (IDPF) entwickelt und wird jetzt vom W3C verwaltet. EPUB-Dateien verwenden die Erweiterung .epub und werden von den meisten E-Readern, Tablets und Leseanwendungen unterstützt, darunter Apple Books, Google Play Books, Kobo und viele andere.

Werkzeugbeschreibung

Dieser Konverter extrahiert und transformiert EPUB-E-Book-Dateien in das Standard-HTML-Format. Er analysiert die EPUB-Paketstruktur, liest die Metadaten des Buches, verarbeitet alle Kapitel in ihrer korrekten Lesereihenfolge und generiert eine einzelne konsolidierte HTML-Datei, die in jedem Webbrowser angezeigt oder für andere Zwecke weiterverarbeitet werden kann.

Funktionsweise

Der Konverter verarbeitet EPUB-Dateien in mehreren Schritten:

  1. Entpacken: EPUB-Dateien sind ZIP-Archive, daher extrahiert das Tool zunächst den Inhalt
  2. OPF-Datei lokalisieren: Die Datei META-INF/container.xml verweist auf die OPF-Datei (Open Packaging Format), die das Manifest und die Lesereihenfolge des Buches enthält
  3. Metadaten analysieren: Extrahiert Titel, Autor, Verlag, Sprache, Veröffentlichungsdatum und Beschreibung aus Dublin-Core-Metadatenelementen
  4. Spine verarbeiten: Der OPF-Spine definiert die Lesereihenfolge der Kapitel und stellt sicher, dass der Inhalt in der richtigen Reihenfolge angezeigt wird
  5. Inhalt extrahieren: Jede XHTML-Kapiteldatei wird verarbeitet und der Body-Inhalt extrahiert
  6. Bilder einbetten: Bilder werden in Base64-Daten-URIs konvertiert, damit sie direkt in das HTML eingebettet werden
  7. Stile einbinden: CSS-Stylesheets aus dem EPUB werden optional in die Ausgabe zusammengeführt

Funktionen

  • Extrahiert vollständige Buchmetadaten einschließlich Titel, Autor, Verlag, Sprache und Beschreibung
  • Behält die Kapitellesereihenfolge bei, wie sie im EPUB-Spine definiert ist
  • Konvertiert eingebettete Bilder in Base64-Daten-URIs für eigenständige HTML-Ausgabe

Optionen erklärt

Option Beschreibung
Stile einbinden Wenn aktiviert, extrahiert CSS-Stylesheets aus dem EPUB und bettet sie in das Ausgabe-HTML ein. Dies behält die ursprüngliche Formatierung und Typografie bei. Deaktivieren Sie diese Option für ungestylten Inhalt.
Bilder einbinden Wenn aktiviert, konvertiert Bilder in Base64-Daten-URIs, die direkt in das HTML eingebettet werden. Die resultierende Datei ist eigenständig, aber größer. Deaktivieren Sie diese Option für reine Textausgabe.

Unterstützte Formate

Eingabe Ausgabe
EPUB 2.0 HTML5
EPUB 3.0 HTML5

Einschränkungen

  • DRM-geschützte EPUB-Dateien können nicht konvertiert werden. Das Tool funktioniert nur mit ungeschützten Dateien
  • Sehr große EPUB-Dateien mit vielen hochauflösenden Bildern können länger verarbeitet werden
  • Einige komplexe EPUB-3-Funktionen wie eingebettete Audio-/Videodateien, JavaScript-Interaktivität oder erweitertes CSS können möglicherweise nicht perfekt übertragen werden
  • Fixed-Layout-EPUBs (häufig in Comics und Kinderbüchern) werden möglicherweise nicht wie beabsichtigt angezeigt, da das Tool für reflowbare Inhalte optimiert ist

Tipps

  • Für die kleinste Ausgabedateigröße deaktivieren Sie beide Optionen „Stile einbinden" und „Bilder einbinden"
  • Wenn Sie nur bestimmte Kapitel benötigen, verwenden Sie die Schaltflächen zum Herunterladen einzelner Kapitel anstelle des Herunterladens des kompletten Buches
  • Das generierte HTML enthält semantisches Markup mit <section>-Elementen für jedes Kapitel, was es einfach macht, benutzerdefinierte Stile anzuwenden oder den Inhalt weiter zu verarbeiten
  • Kapiteldateinamen werden als data-source-Attribute beibehalten, was beim Identifizieren der Inhaltsquelle hilfreich ist

Häufig gestellte Fragen

F: Warum wird meine EPUB-Datei nicht konvertiert? A: Der häufigste Grund ist DRM-Schutz. EPUB-Dateien, die in einigen Geschäften gekauft werden, enthalten Kopierungsschutz, der die Konvertierung verhindert. Die Datei kann auch beschädigt sein oder nicht dem EPUB-Standard entsprechen.

F: Kann ich das HTML zurück in EPUB konvertieren? A: Dieses Tool konvertiert nur in eine Richtung (EPUB zu HTML). Um EPUB-Dateien aus HTML zu erstellen, benötigen Sie ein spezielles EPUB-Erstellungstool wie Calibre oder Sigil.

F: Warum fehlen einige Bilder in der Ausgabe? A: Bilder mit ungewöhnlichen Pfaden oder nicht standardisierten Formaten werden möglicherweise nicht korrekt verarbeitet. Stellen Sie sicher, dass die Option „Bilder einbinden" aktiviert ist. Einige EPUB-Dateien referenzieren externe Bilder über URLs, die nicht eingebettet werden können.