我用大模型写了一个Edge TTS图形化工具

前言

因为要用到文字转语音的功能,又不想在终端里敲代码,所以,经过一番尝试,我使用大模型成功创建了一个基于Microsoft Edge TTS API的图形化工具——edge-tts_tk_gui

项目简介

这是一个完全免费的文字转语音工具,基于 Microsoft Edge TTS API 开发,使用 Python 和 Tkinter 构建图形化界面。最大的特点是:无需安装额外的语音引擎或音频处理工具,只要有网络连接即可使用。

主要功能

  • 🎨 图形化界面:操作简单直观,适合各种用户
  • 🗣️ 多种语音选择:支持多种语音和音色
  • 📝 批量处理:支持批量文本转语音处理
  • ⚙️ 自定义参数:可调整语速、音调等语音参数
  • 🎵 音频播放:支持自动播放和保存音频文件(MP3格式)

技术栈

  • 编程语言:Python 3.8+
  • GUI框架:Tkinter
  • TTS服务:Microsoft Edge TTS API(通过 edge-tts 库)
  • 平台支持:Linux / macOS / Windows

项目结构

edge-tts_tk_gui/
├── core/                 # 核心功能模块
│   ├── audio_manager.py  # 音频管理
│   ├── config.py         # 配置管理
│   ├── tts_service.py    # TTS 服务
│   └── validators.py     # 验证器
├── ui/                   # 界面模块
│   ├── main_window.py    # 主窗口
│   ├── controls.py       # 控制组件
│   ├── file_selector.py  # 文件选择器
│   └── voice_selector.py # 语音选择器
├── test/                 # 测试文件和示例
├── main.py               # 程序入口
├── requirements.txt      # 依赖列表
└── README.md            # 项目说明

代码结构清晰,采用模块化设计,便于维护和扩展。

使用方法

安装依赖

# 克隆项目
git clone https://github.com/bosichong/edge-tts_tk_gui.git
cd edge-tts_tk_gui

# 创建虚拟环境
python3 -m venv venv
source venv/bin/activate  # Linux/macOS
# 或
venv\Scripts\activate  # Windows

# 安装依赖
pip install -r requirements.txt

运行程序

python3 main.py

系统要求

  • Python 3.8 或更高版本
  • Linux / macOS / Windows
  • 网络连接(用于访问 Microsoft Edge TTS API)

关于AI编程

这个项目有个特别之处:本程序的构思和创意由我提供,而代码完全由 GLM-4.7 大模型编写

通过与AI模型的交互,我只需描述需求,大模型就能生成完整的代码。从项目结构设计到具体功能实现,整个开发过程非常流畅。这让我深刻体会到了AI辅助编程的强大能力。

项目特点

  1. 完全免费:利用 Microsoft Edge TTS API,无需付费
  2. 跨平台支持:在主流操作系统上都能运行
  3. 零配置:无需复杂的安装和配置过程
  4. 代码质量高:模块化设计,易于维护和扩展
  5. AI生成:展示了大模型在代码生成方面的能力

总结

这个小项目虽然简单,但完整地展示了一个图形化应用的开发流程。更重要的是,它让我验证了大模型在软件开发中的实际应用价值。未来我会继续探索AI辅助编程的可能性,创造更多有趣的项目。

如果你对这个项目感兴趣,欢迎访问 GitHub:https://github.com/bosichong/edge-tts_tk_gui

许可证

本项目采用 MIT 许可证,欢迎学习和使用。

相关文章