旗下产业: A产业/ A实习/ A计划
全国统一咨询热线:010-5367 2995
首页 > 热门文章 > 大数据分析 > 如何使用Python将PDF文档转为MP3音频

如何使用Python将PDF文档转为MP3音频

时间:2020-12-23来源:www.aaa-cg.com.cn点击量:作者:Sissi
时间:2020-12-23点击量:作者:Sissi



一、转语音工具
 

  微信读书里的电子书有配套的自动音频,而且声音优化的不错,比传统的机械朗读听起来舒服很多。
 

  记得之前看到过Python有一个工具包,可以将文字转换为语音,支持英文和中文,而且能调节语速语调、导出mp3等。
 

  去Github查了下,这个库叫:pyttsx3
 

如何使用Python将PDF文档转为MP3音频
 

  简单来说,pyttsx3可以文字转语音,且是离线工作的,这一点就很实用。
 

  安装比较容易,直接在命令行用pip安装:
 

如何使用Python将PDF文档转为MP3音频
 

  我准备动手试试,将PDF书籍转成音频。
 

  用什么书呢?最近在群里看到有人发张磊的新作《价值》电子书,这本今年刚出的畅销书盗版猖獗,我之前在微信读书里看过,对作者长期主义的观点深信不疑。
 

二、PDF转文本
 

  既然是把PDF转化成语音,肯定是需要先读取PDF中的文字,再利用pyttsx3转语音。
 

  Python中操作PDF的工具库主要是PyPDF2,但发现编码实在有点繁琐,我就换了另一个库pdfplumber,与PyPDF2语法类似,用起来还算流畅。
 

  pdfplumber可以处理PDF包括文本、表格、格式在内的各种信息,小而强大。
 

如何使用Python将PDF文档转为MP3音频
 

  输出:
 

如何使用Python将PDF文档转为MP3音频
 

  上面的代码做了几件事情:「读取PDF文档、读取页数、读取第4页、输出第4页文本」
 

三、文本转语音
 

  接下来开始将第4页的文本转化为音频。

如何使用Python将PDF文档转为MP3音频
 

  上面代码使用pyttsx3将文本转化为音频,然后朗读出来。我是在jupyter notebook上做实验的,代码执行后,电脑会直接朗读。
 

  也可以将生成的音频保存为mp3格式。

如何使用Python将PDF文档转为MP3音频
 

  当然你还可以调整声音的类型、速度、大小。
 

如何使用Python将PDF文档转为MP3音频



 

预约申请免费试听课

填写下面表单即可预约申请免费试听!怕钱不够?可先就业挣钱后再付学费! 怕学不会?助教全程陪读,随时解惑!担心就业?一地学习,可推荐就业!

©2007-2021/北京漫动者教育科技有限公司版权所有
备案号:京ICP备12034770号

©2007-2022/ www.aaa-cg.com.cn 北京漫动者数字科技有限公司 备案号: 京ICP备12034770号 监督电话:010-53672995 邮箱:bjaaa@aaaedu.cc

京公网安备 11010802035704号

网站地图