Yunfi

Yunfi

tg_channel
github
email

爱阅书香配置微软tts听书 Docker自建版

前言#

对于不想折腾的朋友,通过 Vercel 部署可能更方便。详见 爱阅书香听书 微软 AI 语音 TTS Vercel 部署教程 | Yunfi's Blog

前置条件#

  • 有一台可以运行 Docker 的机器
  • 安装好 docker

参考这篇文章的安装 Docker 一节:#安装 Docker | Yunfi's Blog

安装服务器端#

安装#

# 创建文件夹,名字任意
mkdir ifreetime_tts&&cd ifreetime_tts

# 下载文件
wget https://gist.github.com/yy4382/d0c2a5e2c19323f4aa651f99317fd53e/raw/docker-compose.yml

# 启动容器
docker compose up -d
# 搞好了!按照下文的方法验证是否成功,然后在爱阅中配置听书

想要设置 token 的话,按照 yaml 文件里的注释操作

配置 ios 端爱阅书香#

参考 Vercel 部署教程 | 爱阅配置部分 ,唯一的区别在于地址,应该是 https://ip:3000/api/aiyue

有问题评论讲

#

这是我最初做的版本,挺复杂的,仅供参考

稍显麻烦,需要 docker 基础知识,但是可以让你知道这一切是如何运作的,放在文末了

ms-ra-forwarder#

填写示例

也可以用 vercel,但是每月只有 100G 免费流量,听的多的 / 还搭了其他服务的要小心些

  • 因为微软把 Azure 的试用关了,所以只能用 ra(edge 的大声朗读)接口了

ifreetime#

  • 项目地址:iranee/ifreetime: iOS 爱阅书香 TTS 自建服务 (github.com)

  • 如果你的服务器已经在运行一个支持 php 的网站了,直接把项目里的 ra.php 中的 http://127.0.0.1:3000/api/ra 的 ip 改成你自己在第一步里用的,然后丢到网站里就行

  • 如果没有,那么需要建一个 docker 容器以运行该 php 文件(警告:我没写过 php,dockerfile 的写法是 ChatGPT 给的,不保证最优,但应该能用,反正我成功了)

  1. 新建一个文件夹,假设叫做 ifreetime (其他的也行)

  2. 进入文件夹,再建一个叫做 src 的文件夹,把项目中的 ra.php 放进去(或者直接把整个项目 clone 进去也行)

  3. 修改 ra.php,把 http://127.0.0.1:3000/api/ra 中的 127.0.0.1:3000 换成第一步中生成的 ip+ 端口

    • 对于服务器,最方便的方法是直接用公网 ip+ 端口,对于群晖,最简单的是用局域网 ip+ 端口
    • 经测试可行的其他替代方案:
      1. 云服务器做好域名解析和反代之后,使用类似 https://tts.example.com/api/ra 的格式(使用 https://tts.example.com 可以访问 ms-ra-forwarder)
      2. 使用本地 docker 的 ip,一般是 172.17.0.1,所以应该形如 http://172.17.0.1:3000/api/ra
    • 不可行的方案:不可以使用 127.0.0.1,因为在容器里
    • 可能会出问题的方案:域名 + 端口的形式,比如 https://www.example.com:3000/api/ra 尤其对于 nas 来说,因为 80/443 没法用,所以不得不额外加端口。有人这样搞失败了,但不确定是不是因为这个问题。有人这样搞成功了的话,用邮件踢我一脚(邮箱在博客上有写)
  4. 回到 ifreetime 文件夹,新建一个叫 Dockerfile 的文件,内容为

    # 设置基础镜像
    FROM php:7.3
    
    # 将本地代码复制到容器中的 /var/www/html 目录
    COPY src/ /var/www/html/
    
    # 设置容器内的工作目录
    WORKDIR /var/www/html
    
    # 暴露容器的 8000 端口
    EXPOSE 8000
    
    #启动php服务器
    CMD ["php", "-S", "0.0.0.0:8000"]
    
  5. 构建并运行:在 ifreetime 目录中,依次输入如下指令

    docker build -t ifreetime .
    docker run -d -p 12222:8000 ifreetime
    
  6. 这种方法,需要将爱阅中的配置(还有测试的时候)把 3000 都换成 12222. 而且 /api/aiyue 都换成 /ra.php

  7. 打开手机 App,进入听书配置 -> 自定义语音库
    创建 -> 高级自定义语音合成

    名称:任意

    合成字数:建议 200

    请求方式:GET

    地址:ra.php 网络地址,如果安装上面的方法,是 http://你的ip:12222/ra.php

    参数 -> 添加 -> 请输入请求参数:voiceName,内容填自己想要的人声(参考 这里),例如 zh-CN-XiaoxiaoNeural

    参数 -> 添加 -> 请输入请求参数:text,内容填 %@

    解析字段 -> 添加 -> 请输入解析字段与规则:playData,内容填 ResponseData

    测试发音,如果正确就 ok 了。

image
加载中...
此文章数据所有权由区块链加密技术和智能合约保障仅归创作者所有。