我用大模型写了一个Edge TTS图形化工具

2026年2月26日 J.sky

协奏

3 分钟阅读

前言

因为要用到文字转语音的功能，又不想在终端里敲代码，所以，经过一番尝试，我使用大模型成功创建了一个基于Microsoft Edge TTS API的图形化工具——edge-tts_tk_gui。

项目简介

这是一个完全免费的文字转语音工具，基于 Microsoft Edge TTS API 开发，使用 Python 和 Tkinter 构建图形化界面。最大的特点是：无需安装额外的语音引擎或音频处理工具，只要有网络连接即可使用。

主要功能

🎨 图形化界面：操作简单直观，适合各种用户
🗣️ 多种语音选择：支持多种语音和音色
📝 批量处理：支持批量文本转语音处理
⚙️ 自定义参数：可调整语速、音调等语音参数
🎵 音频播放：支持自动播放和保存音频文件（MP3格式）

技术栈

编程语言：Python 3.8+
GUI框架：Tkinter
TTS服务：Microsoft Edge TTS API（通过 edge-tts 库）
平台支持：Linux / macOS / Windows

项目结构

edge-tts_tk_gui/
├── core/                 # 核心功能模块
│   ├── audio_manager.py  # 音频管理
│   ├── config.py         # 配置管理
│   ├── tts_service.py    # TTS 服务
│   └── validators.py     # 验证器
├── ui/                   # 界面模块
│   ├── main_window.py    # 主窗口
│   ├── controls.py       # 控制组件
│   ├── file_selector.py  # 文件选择器
│   └── voice_selector.py # 语音选择器
├── test/                 # 测试文件和示例
├── main.py               # 程序入口
├── requirements.txt      # 依赖列表
└── README.md            # 项目说明

代码结构清晰，采用模块化设计，便于维护和扩展。

使用方法

安装依赖

# 克隆项目
git clone https://github.com/bosichong/edge-tts_tk_gui.git
cd edge-tts_tk_gui

# 创建虚拟环境
python3 -m venv venv
source venv/bin/activate  # Linux/macOS
# 或
venv\Scripts\activate  # Windows

# 安装依赖
pip install -r requirements.txt

运行程序

python3 main.py

系统要求

Python 3.8 或更高版本
Linux / macOS / Windows
网络连接（用于访问 Microsoft Edge TTS API）

关于AI编程

这个项目有个特别之处：本程序的构思和创意由我提供，而代码完全由 GLM-4.7 大模型编写。

通过与AI模型的交互，我只需描述需求，大模型就能生成完整的代码。从项目结构设计到具体功能实现，整个开发过程非常流畅。这让我深刻体会到了AI辅助编程的强大能力。

项目特点

完全免费：利用 Microsoft Edge TTS API，无需付费
跨平台支持：在主流操作系统上都能运行
零配置：无需复杂的安装和配置过程
代码质量高：模块化设计，易于维护和扩展
AI生成：展示了大模型在代码生成方面的能力

总结

这个小项目虽然简单，但完整地展示了一个图形化应用的开发流程。更重要的是，它让我验证了大模型在软件开发中的实际应用价值。未来我会继续探索AI辅助编程的可能性，创造更多有趣的项目。

如果你对这个项目感兴趣，欢迎访问 GitHub：https://github.com/bosichong/edge-tts_tk_gui

许可证

本项目采用 MIT 许可证，欢迎学习和使用。