使用EbookLib创建EPUB电子书时嵌套目录结构的正确方法

2025-07-10 12:11:18作者：傅爽业Veleda

问题背景

在使用Python的EbookLib库创建EPUB电子书时，开发者经常会遇到需要组织复杂目录结构的情况，比如多卷本图书，每卷包含多个章节。一个常见的错误是在处理这种嵌套目录时，生成的导航文件(nav.xhtml)会出现格式问题，导致EPUB验证工具报错。

典型错误场景

当开发者尝试创建包含多卷(Volume)和多章节(Chapter)的EPUB文件时，可能会采用类似以下的代码结构：

volume_chapters = []
for chapter in chapters:
    chapter_item = epub.EpubHtml(...)
    volume_chapters.append((chapter_item, chapter_item.file_name))
    
toc_section = (epub.Section(volume_title), volume_chapters)
book.toc.append(toc_section)

这种写法会导致生成的nav.xhtml文件中出现空的<ol>标签，违反了EPUB规范，因为<ol>标签必须包含至少一个<li>子元素。

问题分析

问题的根源在于传递给目录结构的格式不正确。在EbookLib中，构建目录结构时：

每个章节条目应该直接传递EpubHtml对象，而不是包含文件名的元组
只有当章节有子章节时，才需要传递元组或列表
空的子章节列表会导致生成无效的HTML结构

正确实现方法

以下是创建多卷本EPUB电子书的推荐做法：

book = epub.EpubBook()
chapter_index = 0

for volume_title in volumes:
    volume_chapters = []
    
    # 创建当前卷的所有章节
    for i in range(chapter_index, chapter_index + 2):
        chapter = epub.EpubHtml(
            file_name=f'{volume_title}_{chapters[i]}.xhtml',
            title=chapters[i],
            content='<p>内容</p>'
        )
        book.add_item(chapter)
        volume_chapters.append(chapter)  # 直接添加章节对象
        chapter_index += 1
    
    # 添加到书脊和目录
    book.spine.extend(volume_chapters)
    toc_section = (epub.Section(volume_title), volume_chapters)
    book.toc.append(toc_section)

# 添加必要的导航文件
book.add_item(epub.EpubNcx())
book.add_item(epub.EpubNav())
epub.write_epub('output.epub', book)

关键点说明

章节对象传递：直接传递EpubHtml对象给目录结构，而不是包含文件名的元组
目录结构构建：使用(epub.Section(), chapters_list)的格式构建嵌套目录
验证问题：虽然一些EPUB阅读器能容忍空的<ol>标签，但为了规范性和兼容性，应该避免这种结构

扩展建议

对于更复杂的目录结构，比如多级嵌套(卷→章→节)，可以这样处理：

# 创建节
section = epub.EpubHtml(...)

# 创建章，包含节
chapter = [epub.EpubHtml(...), [section]]

# 创建卷，包含章
volume = (epub.Section('第一卷'), [chapter])

# 添加到目录
book.toc.append(volume)

这种层次化的结构能够清晰地反映书籍的组织方式，同时生成符合规范的导航文件。