如何使用Python将PDF文档转为MP3音频-AAA教育

如何使用Python将PDF文档转为MP3音频

时间：2020-12-23来源：www.aaa-cg.com.cn点击量：次作者：Sissi

时间：2020-12-23点击量：次作者：Sissi

一、转语音工具

　　微信读书里的电子书有配套的自动音频，而且声音优化的不错，比传统的机械朗读听起来舒服很多。

　　记得之前看到过Python有一个工具包，可以将文字转换为语音，支持英文和中文，而且能调节语速语调、导出mp3等。

　　去Github查了下，这个库叫：pyttsx3

如何使用Python将PDF文档转为MP3音频

　　简单来说，pyttsx3可以文字转语音，且是离线工作的，这一点就很实用。

　　安装比较容易，直接在命令行用pip安装：

如何使用Python将PDF文档转为MP3音频

　　我准备动手试试，将PDF书籍转成音频。

　　用什么书呢?最近在群里看到有人发张磊的新作《价值》电子书，这本今年刚出的畅销书盗版猖獗，我之前在微信读书里看过，对作者长期主义的观点深信不疑。

二、PDF转文本

　　既然是把PDF转化成语音，肯定是需要先读取PDF中的文字，再利用pyttsx3转语音。

　　Python中操作PDF的工具库主要是PyPDF2，但发现编码实在有点繁琐，我就换了另一个库pdfplumber，与PyPDF2语法类似，用起来还算流畅。

　　pdfplumber可以处理PDF包括文本、表格、格式在内的各种信息，小而强大。

如何使用Python将PDF文档转为MP3音频

　　输出：

如何使用Python将PDF文档转为MP3音频

　　上面的代码做了几件事情：「读取PDF文档、读取页数、读取第4页、输出第4页文本」

三、文本转语音

　　接下来开始将第4页的文本转化为音频。

如何使用Python将PDF文档转为MP3音频

　　上面代码使用pyttsx3将文本转化为音频，然后朗读出来。我是在jupyter notebook上做实验的，代码执行后，电脑会直接朗读。

　　也可以将生成的音频保存为mp3格式。

如何使用Python将PDF文档转为MP3音频

　　当然你还可以调整声音的类型、速度、大小。

如何使用Python将PDF文档转为MP3音频

填写下面表单即可预约申请免费试听！怕钱不够？可先就业挣钱后再付学费！怕学不会？助教全程陪读，随时解惑！担心就业？一地学习，可推荐就业！

如何使用Python将PDF文档转为MP3音频