EPUB – EBook Format

  1. Startseite
  2. Software
  3. EPUB – EBook Format

EPUB (Akronym für electronic publication) ist ein offener Standard für E-Books vom International Digital Publishing Forum (IDPF), der den älteren Standard Open eBook (OEB, beziehungsweise Open eBook Publication Structure, OEBPS) ersetzt.

Er unterstützt DRM-Mechanismen, definiert aber keine Implementierung, sondern überlässt dies der jeweiligen Lesesoftware. Annotationen wie Notizen, Lesezeichen etc. sind nicht Teil des Standards.
Auf EPUB basierende E-Books erlauben eine dynamische Anpassung des Textes an die jeweilige Bildschirmgröße des Lesers und eignen sich damit insbesondere für die Ausgabe auf Handheld-Geräten. Im Gegensatz dazu wird beispielsweise der Text bei PDF wie im gedruckten Buch angezeigt. Bei kleinen Ausgabegeräten kann eine derartige Darstellung jedoch für den Leser unbefriedigend sein, falls er bei einer individuell angenehmen Anzeigegröße des Textes häufig hin- und herscrollen muss.

Format

Der EPUB-Standard basiert auf einer Anzahl freier Standards, darunter hauptsächlich XML, XHTML, CSS, NCX (aus DTBook), Dublin Core und Zip. Die Spezifikation von EPUB gliedert sich in drei Teile, die unterschiedliche Bereiche definieren:

Open Publication Structure
Die Formatierung der eigentlichen Inhalte wird durch die Open Publication Structure (OPS) geregelt, die aktuell in Version 3.0 vorliegt. Sie werden, mit jeweils einer Untermenge von XHTML 1.1 und CSS 2.1 formatiert, in einer oder mehreren UTF-8- oder UTF-16-codierten Dateien mit der Dateinamenserweiterung .xhtml gespeichert.

Open Packaging Format
Die Strukturierung wird durch das Open Packaging Format (OPF) geregelt, das aktuell in Version 2.0.1 vorliegt. Die Beschreibung der Struktur und die Aufnahme von Metadaten erfolgen in einer Stammdatei (Dateinamenserweiterung: .opf). Darin werden im Abschnitt „manifest“ alle weiteren im Archiv gespeicherten Dateien aufgelistet und die Metadaten nach dem Dublin-Core-Schema bereitgestellt. Der weitere Abschnitt „spine“ ist ein minimales Inhaltsverzeichnis, mit dem Attribut „toc“ wird auf ein ausführliches Inhaltsverzeichnis verwiesen.

Das ausführliche Inhaltsverzeichnis wird im Abschnitt „navMap“ in einer Datei mit der Dateinamenserweiterung .ncx in dem XML-Format NCX angegeben, das DTBook entstammt. Jedem Eintrag wird im Attribut „playOrder“ eine Position innerhalb der Reihenfolge der wiederzugebenden Texte zugeordnet.

OEBPS Container Format
Die Verpackung aller Teildateien in eine einzelne Datei und die Struktur des darin enthaltenen Dateisystems wird durch das OEBPS Container Format (OCF) geregelt, das aktuell in Version 1.0 vorliegt. Sämtliche Teildateien werden in einer Zip-Archivdatei mit der Dateinamenserweiterung .epub zusammengefasst. Darin müssen mindestens enthalten sein:

  • eine unkomprimierte Datei mit dem Namen mimetype und dem Inhalt application/epub+zip im Wurzelverzeichnis als erste Datei im Archiv,
  • ein Verzeichnis META-INF mit einer Datei namens container.xml, die auf die Stammdatei der Publikation verweist,
  • die Stammdatei,
  • ein Inhaltsverzeichnis zur Navigation durch die Publikation und
  • mindestens eine Inhaltsdatei.

Beispiele

Das Dateisystem in einer minimalen EPUB-Datei könnte so aussehen:

mimetype
META-INF/
  container.xml
inhalt.opf
inhalt.ncx
inhalt.xhtml

container.xml

  <?xml version="1.0" encoding="UTF-8"?>
  <container
    xmlns="urn:oasis:names:tc:opendocument:xmlns:container"
    version="1.0">
    <rootfiles>
      <rootfile
        full-path="inhalt.opf"
        media-type="application/oebps-package+xml"/>
    </rootfiles>
  </container>

Stammdatei inhalt.opf

 <?xml version="1.0" encoding="UTF-8"?>
  <package
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:opf="http://www.idpf.org/2007/opf"
    xmlns="http://www.idpf.org/2007/opf"
    version="2.0"
    unique-identifier="BookId">
    <metadata>
      <dc:language xsi:type="dcterms:RFC3066">de-DE</dc:language>
      <dc:title>Hello World</dc:title>
      <dc:identifier id="BookId">id_Hello_World</dc:identifier>
    </metadata>
    <manifest>
      <item id="ncx" href="inhalt.ncx" media-type="application/x-dtbncx+xml"/>
      <item id="Datei_1" href="inhalt.xhtml" media-type="application/xhtml+xml"/>
    </manifest>
    <spine toc="ncx">
      <itemref idref="Datei_1"/>
    </spine>
  </package>

detailliertes Inhaltsverzeichnis inhalt.ncx

<?xml version="1.0" encoding="UTF-8"?>
  <!DOCTYPE ncx 
    PUBLIC "-//NISO//DTD ncx 2005-1//EN" "http://www.daisy.org/z3986/2005/ncx-2005-1.dtd">
  <ncx
    xmlns="http://www.daisy.org/z3986/2005/ncx/"
    version="2005-1"
    xml:lang="de-DE">
    <head>
      <meta name="dc:Title" content="Hello World"/>
      <meta name="dtb:uid" content="id_Hello_World"/>
    </head>
    <docTitle>
      <text>Hello World</text>
    </docTitle>
    <navMap>
      <navPoint playOrder="1" id="id_Hello_World_01">
        <navLabel>
          <text>Hello World</text>
        </navLabel>
        <content src="inhalt.xhtml"/>
      </navPoint>
    </navMap>
  </ncx>

eigentlicher Inhalt inhalt.xhtml
Eine einfache XHTML-Datei:

<?xml version="1.0" encoding="UTF-8"?>
  <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" 
     "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
  <html xmlns="http://www.w3.org/1999/xhtml">
    <head>
      <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/>
      <link rel="schema.DC" href="http://purl.org/dc/elements/1.1/"/>
      <title>Hello World</title>
      <meta name="DC.identifier" content="id_Hello_World"/>
    </head>
    <body>
      <h1>Hello World</h1>
      <p>Ein Beispieltext.</p>
    </body>
  </html>

Überprüfung

Da alle Inhalte des EPUBs standardisiert und XML-basiert sind, kann ein EPUB, ähnlich wie ein HTML-Dokument, validiert werden. Dabei wird überprüft, ob alle Regeln des EPUB- und der XML-Standards eingehalten wurden.

Geschichte

Open eBook, der Vorläufer von EPUB, wurde von zwei Herstellern von E-Book-Systemen, nämlich SoftBook Press (hauptsächlich) und NuvoMedia Inc., für ihre mobilen Lesegeräte entwickelt und in den späten 1990er Jahren veröffentlicht. Unter anderem Microsoft setzte 1998 auf Open eBook, nachdem das eigene Lit-Format begraben worden war. Im September 1999 wurde Version 1.0 der Spezifikation veröffentlicht, die sogenannte Open eBook Publication Structure (OEBPS). Diese wurde im Juni 2001 (Version 1.0.1) und August 2002 (Version 1.2) mit neuen Formatempfehlungen aktualisiert. Im September 2007 wurde die Open Publication Structure (OPS) 2.0 unter dem heutigen Namen EPUB veröffentlicht, welches OEBPS ersetzt. Das Format wird seither im Rahmen des International Digital Publishing Forum (IDPF) entwickelt. Dateien dieser neuen Generation des Formats tragen nicht mehr die bisherige Dateiendung .opf (OEB Package Format), sondern nunmehr .epub.

Digitale Rechteverwaltung

Das EPUB-Format unterstützt Mechanismen der digitalen Rechteverwaltung (DRM), definiert allerdings keine konkrete Implementierung. Dies hat dazu geführt, dass momentan unterschiedliche, miteinander nicht kompatible Systeme existieren. Das von Adobe entwickelte ADEPT DRM System hat von diesen eine vergleichsweise hohe Verbreitung; fast alle Händler, die ihre EPUB-Bücher schützen, verwenden dieses System, und es wird von den meisten E-Book-Readern unterstützt.

Ein weiteres DRM-System ist von Apple entwickelt. Bisher kann lediglich die firmeneigene Software iBooks Bücher in diesem Format entschlüsseln. Damit ist dieses System auf Geräte beschränkt, für die iBooks als Lesesoftware verfügbar ist.

Entfernen des Kopierschutzes
Für die von Adobe entwickelte digitale Rechteverwaltung ADEPT DRM wurde im Februar 2009 eine Möglichkeit des Umgehens publiziert. Hierbei wurde nicht der Kopierschutz an sich geknackt, sondern lediglich der private Schlüssel extrahiert. Mit diesem lassen sich dann alle mit diesem Schlüssel geschützten EPUB-Dateien vollständig entschlüsseln und ohne digitales Rechtemanagement neu abspeichern. Diese neuen Dateien unterliegen somit nicht mehr den Restriktionen der digitalen Rechteverwaltung. Eventuell vorhandene persönliche Identifizierungsdaten bleiben vorhanden.


Quelle: Wikipedia (http://de.wikipedia.org/wiki/EPUB)

error: Content is protected !!