最近发现大家都在折腾博客聚合和 RSS 文章聚合相关的网站与页面。其实自己很早就弄了一个本地使用的RSS阅读器,可以很方便的再本地进行rss订阅的文章采集和阅读,感兴趣的可以看看这个项目:

Python Private RSS subscription

Python 结合 feedparser 模块编写的 RSS 订阅阅读器,支持终端和 GUI 两种界面。

不过我看大家都在博客中集成了这个功能,所以我也想搞一个,但是并不想做那种大而全的聚合平台,只是一个简单的聚合页面——有博客链接,也有每天最新的 RSS 文章列表,主要是给自己日常翻阅用的。借助 AI 辅助,现在写这样一个功能页面,应该轻轻松松。

我的博客是静态站,基于 Astro 构建,开发工具用的是 opencode + deepseek v4 flash free

演示效果 :https://www.suiyan.cc/links

功能设计

需求很明确:友链页面里每个博客卡片下方,展示该博客最近一个月内发布的 RSS 文章列表,标题可点击跳转原文,按最新发布时间排序。

RSS 地址从哪里来?需要手动收集。 采集脚本不会自动发现 RSS 源——它只读取配置好的地址。所以第一步是找到每个博客的 RSS 订阅链接,保存到 src/consts.ts 中:

{
    site_name: '示例博客',
    site_url: 'https://example.com',
    site_description: '描述文字',
    rss: 'https://example.com/feed.xml',
}

每个友链条目都有一个 rss 字段,填入该站的 RSS 或 Atom 订阅地址即可。脚本运行时会读取这些配置,并发采集。如无 RSS 地址则设为 '#',脚本将自动跳过。

数据流如下:

手动收集 RSS 地址
    ↓ 填入 consts.ts
consts.ts(友链配置)
    ↓ Python 采集脚本(只读不写)
rss_data.json(采集结果,提交到仓库)
    ↓ Astro 构建时读取
links.astro → 动态排序 + 展示

设计要点:consts.ts 保持只读,友链的增删改都在这个文件里,采集脚本不修改它。排序逻辑交给前端页面,构建时根据 rss_data.json 里的文章时间动态排列。

第一步:编写 AI 提示词

有了设计思路,接下来通过多轮对话让 AI 逐步完成功能。

第 1 轮:需求描述

src/consts.ts 中友链数据的结构告诉 AI——每个链接包含 site_namesite_urlsite_descriptionrss(订阅地址)。要求写一个 Python 采集脚本,参考已有的 RSS 阅读器项目,用 feedparser + requests 并发采集,过滤最近一个月文章,输出到 JSON 文件。

AI 会先给出方案简报,确认后开始写代码。

第 2 轮:页面展示

脚本跑通后,修改链接页面 links.astro,在每张友链卡片下方增加 RSS 文章区域。要点:

  • 展示标题和相对时间(如”3天前”、“1周前”)
  • 点击标题新窗口打开原文
  • 最多展示 5 条
  • 无文章时不显示 RSS 区域

第 3 轮:排序策略

初始方案中脚本按文章数量排序,页面按最新文章时间排序。经过沟通后调整为统一方案:不修改 consts.ts 文件,排序全部交给 Astro 页面在构建时动态完成。脚本只负责采集和输出 JSON。

第 4 轮:代码审查

功能完成后,让 AI 做几轮 review,重点检查:

  • TypeScript 语法是否正确
  • 日期处理和边界情况
  • 移动端响应式样式
  • 死代码和未使用的变量

第二步:采集脚本实现

最终脚本用 Python 写成,核心逻辑如下:

# 从 consts.ts 解析友链列表
friends = parse_friends()

# 并发采集全部 RSS
with ThreadPoolExecutor(max_workers=8) as executor:
    futures = {executor.submit(fetch_feed, b['rss'], b['name'], cutoff): b
               for b in feed_tasks}
    for future in as_completed(futures):
        articles, error = future.result()
        # 分类处理:成功 / 无文章 / 失败

脚本输出结构化日志,每条带标签前缀,方便后续自动化解析:

[  OK] 素生           | z.arlmy.me       | 16 篇
[ WARN] 揆机           | pathos.page      | 近 4 周无新文章
[ERROR] ScarSu        | scarsu.com       | 连接失败
[ SKIP] BORBER        | blog.borber.top  | 未配置 RSS

终端采集最终效果:

npm run rss

> ataraxia@0.0.1 rss
> python3 scripts/fetch_rss.py

[ INFO] RSS 采集开始
[ INFO] 共 24 个友链
[ SKIP] BORBER       | https://blog.borber.top | 未配置 RSS
[ SKIP] 图灵技术域        | http://www.omegaxyz.com | 未配置 RSS
[ INFO] 待采集 22 个, 跳过 2 个
[   OK] 枫林灯语         | https://blog.mfwt.top | 7 篇
[   OK] 阮一峰的网络日志     | https://www.ruanyifeng.com/blog | 3 篇
[   OK] 莫比乌斯         | https://mobius.blog  | 10 篇
[   OK] 二丫讲梵         | https://wiki.eryajf.net | 4 篇
[   OK] Obaby        | https://zhongxiaojie.com | 9 篇
[   OK] 八咫乌          | https://www.vergilisme.com | 3 篇
[   OK] 老T博客         | https://lawtee.com   | 4 篇
[   OK] 秋风于渭水        | https://www.tjsky.net | 4 篇
[   OK] 一派胡言         | https://yipai.me     | 1 篇
[   OK] 优世界          | https://usj.cc       | 11 篇
[   OK] 孤斗           | https://d-d.design   | 10 篇
[ WARN] 揆机           | https://pathos.page  | 近 4 周无新文章
[   OK] 愆伏           | https://www.tortorse.com | 4 篇
[ WARN] Yihui Xie    | https://yihui.org/cn | 近 4 周无新文章
[ WARN] 映屿           | https://www.glowisle.me | 近 4 周无新文章
[ WARN] 白熊阿丸的小屋      | https://blog.bxaw.name | 近 4 周无新文章
[   OK] 理论派          | https://sliun.com    | 1 篇
[ WARN] Owen的博客      | https://www.owenyoung.com | 近 4 周无新文章
[ WARN] ScarSu       | https://www.scarsu.com | 近 4 周无新文章
[ WARN] 特立独行的异类      | https://www.demochen.com | 近 4 周无新文章
[   OK] 素生           | https://z.arlmy.me   | 16 篇
[   OK] CC的数字花园      | https://cyrus19.cc   | 3 篇
[ INFO] 采集耗时 46s

============================================================
   RSS 采集报告
============================================================
   时间:     2026-06-28 16:22:19
   总站点:   24
   有 RSS:   22
   成功:     22
   失败:     0
   跳过:     2
   总文章:   90 (近 4 周)
============================================================
   文件更新:
     • /suiyanblog/scripts/../src/data/rss_data.json
============================================================

   📋 关注事项
   --------------------------------------------------------
   ⚠ 揆机           | https://pathos.page  | 近 4 周无新文章
   ⚠ Yihui Xie    | https://yihui.org/cn | 近 4 周无新文章
   ⚠ 映屿           | https://www.glowisle.me | 近 4 周无新文章
   ⚠ 白熊阿丸的小屋      | https://blog.bxaw.name | 近 4 周无新文章
   ⚠ Owen的博客      | https://www.owenyoung.com | 近 4 周无新文章
   ⚠ ScarSu       | https://www.scarsu.com | 近 4 周无新文章
   ⚠ 特立独行的异类      | https://www.demochen.com | 近 4 周无新文章
   --------------------------------------------------------

[ DONE] 采集完成, 共 90 篇文章

每种标签的含义:

  • [OK] — 采集成功,正常展示
  • [WARN] — RSS 可访问但近一个月无文章,可能已停更
  • [ERROR] — 网络错误或解析失败,需要关注
  • [SKIP] — 未配置 RSS 地址,跳过

第三步:页面展示

links.astro 的文件头中读取 JSON 数据,合并到友链对象,按最新文章时间排序:

const linksWithRss = FRIENDS_LINKS
    .map((link, i) => ({
        ...link,
        _index: i,
        rssArticles: rssData[link.site_url.replace(/\/$/, '')] || [],
    }))
    .sort((a, b) => {
        const aDate = a.rssArticles[0]?.published_parsed || '';
        const bDate = b.rssArticles[0]?.published_parsed || '';
        return bDate.localeCompare(aDate) || a._index - b._index;
    });

排序逻辑:有文章的按最新发布时间降序排列,没有文章的保持原始顺序沉底。这样更新勤快的博客始终排在前面。

样式上使用 flex 布局实现标题省略号截断 + 时间戳右对齐,卡片添加 overflow: hidden 防止超长内容溢出。

npm run rss 命令添加到 package.json

"rss": "python3 scripts/fetch_rss.py"

第四步:接入定时任务

采集脚本定稿后,接入 Hermes agent 创建定时任务。任务配置如下:

项目内容
执行时间每天 10:00
命令cd /path/to/project && npm run rss
通知条件stdout 中出现 [ERROR][WARN]
通知方式邮件

这样每天自动采集一次,有异常发邮件报警,正常时静默结束。采集结果随 Git 提交推送到仓库,部署到 Vercel 后页面自动更新。

总结

整个过程从需求提出到最终落地约半个小时。AI 负责了绝大部分代码编写和调试,人工主要做需求描述、方案决策和最终 review。

几点经验:

  1. AI 写代码快,但需要人类把握方向。 排序策略(按数量还是按时间?修改配置文件还是动态排序?)这些决策需要自己判断。
  2. Review 不能省。 AI 可能会写出有隐患的代码,比如缺少逗号导致语法错误。代码审查是必要环节。
  3. 结构化日志便于自动化。 脚本输出带标签的日志,既方便人工阅读,也方便后续接入定时任务解析。

最终效果:博客链接页面不再是干巴巴的链接列表,每张卡片下方动态展示着最近文章,页面更有活力。

这套方法不限于 Astro——只要博客能生成静态文件,都可以用。核心只是一个 Python 采集脚本 + 一个 JSON 数据文件,任何静态博客(Hugo、Hexo、Jekyll、Zola 等)都可以在自己的模板里读取 rss_data.json 来渲染。接入定时任务后甚至能做到每日自动更新。