最近发现大家都在折腾博客聚合和 RSS 文章聚合相关的网站与页面。其实自己很早就弄了一个本地使用的RSS阅读器,可以很方便的再本地进行rss订阅的文章采集和阅读,感兴趣的可以看看这个项目:
Python Private RSS subscription
Python 结合 feedparser 模块编写的 RSS 订阅阅读器,支持终端和 GUI 两种界面。
不过我看大家都在博客中集成了这个功能,所以我也想搞一个,但是并不想做那种大而全的聚合平台,只是一个简单的聚合页面——有博客链接,也有每天最新的 RSS 文章列表,主要是给自己日常翻阅用的。借助 AI 辅助,现在写这样一个功能页面,应该轻轻松松。
我的博客是静态站,基于 Astro 构建,开发工具用的是 opencode + deepseek v4 flash free
演示效果 :https://www.suiyan.cc/links
功能设计
需求很明确:友链页面里每个博客卡片下方,展示该博客最近一个月内发布的 RSS 文章列表,标题可点击跳转原文,按最新发布时间排序。
RSS 地址从哪里来?需要手动收集。 采集脚本不会自动发现 RSS 源——它只读取配置好的地址。所以第一步是找到每个博客的 RSS 订阅链接,保存到 src/consts.ts 中:
{
site_name: '示例博客',
site_url: 'https://example.com',
site_description: '描述文字',
rss: 'https://example.com/feed.xml',
}
每个友链条目都有一个 rss 字段,填入该站的 RSS 或 Atom 订阅地址即可。脚本运行时会读取这些配置,并发采集。如无 RSS 地址则设为 '#',脚本将自动跳过。
数据流如下:
手动收集 RSS 地址
↓ 填入 consts.ts
consts.ts(友链配置)
↓ Python 采集脚本(只读不写)
rss_data.json(采集结果,提交到仓库)
↓ Astro 构建时读取
links.astro → 动态排序 + 展示
设计要点:consts.ts 保持只读,友链的增删改都在这个文件里,采集脚本不修改它。排序逻辑交给前端页面,构建时根据 rss_data.json 里的文章时间动态排列。
第一步:编写 AI 提示词
有了设计思路,接下来通过多轮对话让 AI 逐步完成功能。
第 1 轮:需求描述
把 src/consts.ts 中友链数据的结构告诉 AI——每个链接包含 site_name、site_url、site_description、rss(订阅地址)。要求写一个 Python 采集脚本,参考已有的 RSS 阅读器项目,用 feedparser + requests 并发采集,过滤最近一个月文章,输出到 JSON 文件。
AI 会先给出方案简报,确认后开始写代码。
第 2 轮:页面展示
脚本跑通后,修改链接页面 links.astro,在每张友链卡片下方增加 RSS 文章区域。要点:
- 展示标题和相对时间(如”3天前”、“1周前”)
- 点击标题新窗口打开原文
- 最多展示 5 条
- 无文章时不显示 RSS 区域
第 3 轮:排序策略
初始方案中脚本按文章数量排序,页面按最新文章时间排序。经过沟通后调整为统一方案:不修改 consts.ts 文件,排序全部交给 Astro 页面在构建时动态完成。脚本只负责采集和输出 JSON。
第 4 轮:代码审查
功能完成后,让 AI 做几轮 review,重点检查:
- TypeScript 语法是否正确
- 日期处理和边界情况
- 移动端响应式样式
- 死代码和未使用的变量
第二步:采集脚本实现
最终脚本用 Python 写成,核心逻辑如下:
# 从 consts.ts 解析友链列表
friends = parse_friends()
# 并发采集全部 RSS
with ThreadPoolExecutor(max_workers=8) as executor:
futures = {executor.submit(fetch_feed, b['rss'], b['name'], cutoff): b
for b in feed_tasks}
for future in as_completed(futures):
articles, error = future.result()
# 分类处理:成功 / 无文章 / 失败
脚本输出结构化日志,每条带标签前缀,方便后续自动化解析:
[ OK] 素生 | z.arlmy.me | 16 篇
[ WARN] 揆机 | pathos.page | 近 4 周无新文章
[ERROR] ScarSu | scarsu.com | 连接失败
[ SKIP] BORBER | blog.borber.top | 未配置 RSS
终端采集最终效果:
npm run rss
> ataraxia@0.0.1 rss
> python3 scripts/fetch_rss.py
[ INFO] RSS 采集开始
[ INFO] 共 24 个友链
[ SKIP] BORBER | https://blog.borber.top | 未配置 RSS
[ SKIP] 图灵技术域 | http://www.omegaxyz.com | 未配置 RSS
[ INFO] 待采集 22 个, 跳过 2 个
[ OK] 枫林灯语 | https://blog.mfwt.top | 7 篇
[ OK] 阮一峰的网络日志 | https://www.ruanyifeng.com/blog | 3 篇
[ OK] 莫比乌斯 | https://mobius.blog | 10 篇
[ OK] 二丫讲梵 | https://wiki.eryajf.net | 4 篇
[ OK] Obaby | https://zhongxiaojie.com | 9 篇
[ OK] 八咫乌 | https://www.vergilisme.com | 3 篇
[ OK] 老T博客 | https://lawtee.com | 4 篇
[ OK] 秋风于渭水 | https://www.tjsky.net | 4 篇
[ OK] 一派胡言 | https://yipai.me | 1 篇
[ OK] 优世界 | https://usj.cc | 11 篇
[ OK] 孤斗 | https://d-d.design | 10 篇
[ WARN] 揆机 | https://pathos.page | 近 4 周无新文章
[ OK] 愆伏 | https://www.tortorse.com | 4 篇
[ WARN] Yihui Xie | https://yihui.org/cn | 近 4 周无新文章
[ WARN] 映屿 | https://www.glowisle.me | 近 4 周无新文章
[ WARN] 白熊阿丸的小屋 | https://blog.bxaw.name | 近 4 周无新文章
[ OK] 理论派 | https://sliun.com | 1 篇
[ WARN] Owen的博客 | https://www.owenyoung.com | 近 4 周无新文章
[ WARN] ScarSu | https://www.scarsu.com | 近 4 周无新文章
[ WARN] 特立独行的异类 | https://www.demochen.com | 近 4 周无新文章
[ OK] 素生 | https://z.arlmy.me | 16 篇
[ OK] CC的数字花园 | https://cyrus19.cc | 3 篇
[ INFO] 采集耗时 46s
============================================================
RSS 采集报告
============================================================
时间: 2026-06-28 16:22:19
总站点: 24
有 RSS: 22
成功: 22
失败: 0
跳过: 2
总文章: 90 (近 4 周)
============================================================
文件更新:
• /suiyanblog/scripts/../src/data/rss_data.json
============================================================
📋 关注事项
--------------------------------------------------------
⚠ 揆机 | https://pathos.page | 近 4 周无新文章
⚠ Yihui Xie | https://yihui.org/cn | 近 4 周无新文章
⚠ 映屿 | https://www.glowisle.me | 近 4 周无新文章
⚠ 白熊阿丸的小屋 | https://blog.bxaw.name | 近 4 周无新文章
⚠ Owen的博客 | https://www.owenyoung.com | 近 4 周无新文章
⚠ ScarSu | https://www.scarsu.com | 近 4 周无新文章
⚠ 特立独行的异类 | https://www.demochen.com | 近 4 周无新文章
--------------------------------------------------------
[ DONE] 采集完成, 共 90 篇文章
每种标签的含义:
[OK]— 采集成功,正常展示[WARN]— RSS 可访问但近一个月无文章,可能已停更[ERROR]— 网络错误或解析失败,需要关注[SKIP]— 未配置 RSS 地址,跳过
第三步:页面展示
在 links.astro 的文件头中读取 JSON 数据,合并到友链对象,按最新文章时间排序:
const linksWithRss = FRIENDS_LINKS
.map((link, i) => ({
...link,
_index: i,
rssArticles: rssData[link.site_url.replace(/\/$/, '')] || [],
}))
.sort((a, b) => {
const aDate = a.rssArticles[0]?.published_parsed || '';
const bDate = b.rssArticles[0]?.published_parsed || '';
return bDate.localeCompare(aDate) || a._index - b._index;
});
排序逻辑:有文章的按最新发布时间降序排列,没有文章的保持原始顺序沉底。这样更新勤快的博客始终排在前面。
样式上使用 flex 布局实现标题省略号截断 + 时间戳右对齐,卡片添加 overflow: hidden 防止超长内容溢出。
npm run rss 命令添加到 package.json:
"rss": "python3 scripts/fetch_rss.py"
第四步:接入定时任务
采集脚本定稿后,接入 Hermes agent 创建定时任务。任务配置如下:
| 项目 | 内容 |
|---|---|
| 执行时间 | 每天 10:00 |
| 命令 | cd /path/to/project && npm run rss |
| 通知条件 | stdout 中出现 [ERROR] 或 [WARN] |
| 通知方式 | 邮件 |
这样每天自动采集一次,有异常发邮件报警,正常时静默结束。采集结果随 Git 提交推送到仓库,部署到 Vercel 后页面自动更新。
总结
整个过程从需求提出到最终落地约半个小时。AI 负责了绝大部分代码编写和调试,人工主要做需求描述、方案决策和最终 review。
几点经验:
- AI 写代码快,但需要人类把握方向。 排序策略(按数量还是按时间?修改配置文件还是动态排序?)这些决策需要自己判断。
- Review 不能省。 AI 可能会写出有隐患的代码,比如缺少逗号导致语法错误。代码审查是必要环节。
- 结构化日志便于自动化。 脚本输出带标签的日志,既方便人工阅读,也方便后续接入定时任务解析。
最终效果:博客链接页面不再是干巴巴的链接列表,每张卡片下方动态展示着最近文章,页面更有活力。
这套方法不限于 Astro——只要博客能生成静态文件,都可以用。核心只是一个 Python 采集脚本 + 一个 JSON 数据文件,任何静态博客(Hugo、Hexo、Jekyll、Zola 等)都可以在自己的模板里读取 rss_data.json 来渲染。接入定时任务后甚至能做到每日自动更新。