我用大模型写了一个Edge TTS图形化工具
前言
因为要用到文字转语音的功能,又不想在终端里敲代码,所以,经过一番尝试,我使用大模型成功创建了一个基于Microsoft Edge TTS API的图形化工具——edge-tts_tk_gui。
项目简介
这是一个完全免费的文字转语音工具,基于 Microsoft Edge TTS API 开发,使用 Python 和 Tkinter 构建图形化界面。最大的特点是:无需安装额外的语音引擎或音频处理工具,只要有网络连接即可使用。
主要功能
- 🎨 图形化界面:操作简单直观,适合各种用户
- 🗣️ 多种语音选择:支持多种语音和音色
- 📝 批量处理:支持批量文本转语音处理
- ⚙️ 自定义参数:可调整语速、音调等语音参数
- 🎵 音频播放:支持自动播放和保存音频文件(MP3格式)
技术栈
- 编程语言:Python 3.8+
- GUI框架:Tkinter
- TTS服务:Microsoft Edge TTS API(通过 edge-tts 库)
- 平台支持:Linux / macOS / Windows
项目结构
edge-tts_tk_gui/
├── core/ # 核心功能模块
│ ├── audio_manager.py # 音频管理
│ ├── config.py # 配置管理
│ ├── tts_service.py # TTS 服务
│ └── validators.py # 验证器
├── ui/ # 界面模块
│ ├── main_window.py # 主窗口
│ ├── controls.py # 控制组件
│ ├── file_selector.py # 文件选择器
│ └── voice_selector.py # 语音选择器
├── test/ # 测试文件和示例
├── main.py # 程序入口
├── requirements.txt # 依赖列表
└── README.md # 项目说明
代码结构清晰,采用模块化设计,便于维护和扩展。
使用方法
安装依赖
# 克隆项目
git clone https://github.com/bosichong/edge-tts_tk_gui.git
cd edge-tts_tk_gui
# 创建虚拟环境
python3 -m venv venv
source venv/bin/activate # Linux/macOS
# 或
venv\Scripts\activate # Windows
# 安装依赖
pip install -r requirements.txt
运行程序
python3 main.py
系统要求
- Python 3.8 或更高版本
- Linux / macOS / Windows
- 网络连接(用于访问 Microsoft Edge TTS API)
关于AI编程
这个项目有个特别之处:本程序的构思和创意由我提供,而代码完全由 GLM-4.7 大模型编写。
通过与AI模型的交互,我只需描述需求,大模型就能生成完整的代码。从项目结构设计到具体功能实现,整个开发过程非常流畅。这让我深刻体会到了AI辅助编程的强大能力。
项目特点
- 完全免费:利用 Microsoft Edge TTS API,无需付费
- 跨平台支持:在主流操作系统上都能运行
- 零配置:无需复杂的安装和配置过程
- 代码质量高:模块化设计,易于维护和扩展
- AI生成:展示了大模型在代码生成方面的能力
总结
这个小项目虽然简单,但完整地展示了一个图形化应用的开发流程。更重要的是,它让我验证了大模型在软件开发中的实际应用价值。未来我会继续探索AI辅助编程的可能性,创造更多有趣的项目。
如果你对这个项目感兴趣,欢迎访问 GitHub:https://github.com/bosichong/edge-tts_tk_gui
许可证
本项目采用 MIT 许可证,欢迎学习和使用。