静态博客如何添加rss文章聚合？

2026年6月28日 J.sky

协奏

7 分钟阅读

最近发现大家都在折腾博客聚合和 RSS 文章聚合相关的网站与页面。其实自己很早就弄了一个本地使用的RSS阅读器，可以很方便的再本地进行rss订阅的文章采集和阅读，感兴趣的可以看看这个项目：

Python 结合 feedparser 模块编写的 RSS 订阅阅读器，支持终端和 GUI 两种界面。

不过我看大家都在博客中集成了这个功能，所以我也想搞一个，但是并不想做那种大而全的聚合平台，只是一个简单的聚合页面——有博客链接，也有每天最新的 RSS 文章列表，主要是给自己日常翻阅用的。借助 AI 辅助，现在写这样一个功能页面，应该轻轻松松。

我的博客是静态站，基于 Astro 构建，开发工具用的是 opencode + deepseek v4 flash free

演示效果：https://www.suiyan.cc/links

功能设计

需求很明确：友链页面里每个博客卡片下方，展示该博客最近一个月内发布的 RSS 文章列表，标题可点击跳转原文，按最新发布时间排序。

RSS 地址从哪里来？需要手动收集。 采集脚本不会自动发现 RSS 源——它只读取配置好的地址。所以第一步是找到每个博客的 RSS 订阅链接，保存到 src/consts.ts 中：

{
    site_name: '示例博客',
    site_url: 'https://example.com',
    site_description: '描述文字',
    rss: 'https://example.com/feed.xml',
}

每个友链条目都有一个 rss 字段，填入该站的 RSS 或 Atom 订阅地址即可。脚本运行时会读取这些配置，并发采集。如无 RSS 地址则设为 '#'，脚本将自动跳过。

数据流如下：

手动收集 RSS 地址
    ↓ 填入 consts.ts
consts.ts（友链配置）
    ↓ Python 采集脚本（只读不写）
rss_data.json（采集结果，提交到仓库）
    ↓ Astro 构建时读取
links.astro → 动态排序 + 展示

设计要点：consts.ts 保持只读，友链的增删改都在这个文件里，采集脚本不修改它。排序逻辑交给前端页面，构建时根据 rss_data.json 里的文章时间动态排列。

第一步：编写 AI 提示词

有了设计思路，接下来通过多轮对话让 AI 逐步完成功能。

第 1 轮：需求描述

把 src/consts.ts 中友链数据的结构告诉 AI——每个链接包含 site_name、site_url、site_description、rss（订阅地址）。要求写一个 Python 采集脚本，参考已有的 RSS 阅读器项目，用 feedparser + requests 并发采集，过滤最近一个月文章，输出到 JSON 文件。

AI 会先给出方案简报，确认后开始写代码。

第 2 轮：页面展示

脚本跑通后，修改链接页面 links.astro，在每张友链卡片下方增加 RSS 文章区域。要点：

展示标题和相对时间（如”3天前”、“1周前”）
点击标题新窗口打开原文
最多展示 5 条
无文章时不显示 RSS 区域

第 3 轮：排序策略

初始方案中脚本按文章数量排序，页面按最新文章时间排序。经过沟通后调整为统一方案：不修改 consts.ts 文件，排序全部交给 Astro 页面在构建时动态完成。脚本只负责采集和输出 JSON。

第 4 轮：代码审查

功能完成后，让 AI 做几轮 review，重点检查：

TypeScript 语法是否正确
日期处理和边界情况
移动端响应式样式
死代码和未使用的变量

第二步：采集脚本实现

最终脚本用 Python 写成，核心逻辑如下：

# 从 consts.ts 解析友链列表
friends = parse_friends()

# 并发采集全部 RSS
with ThreadPoolExecutor(max_workers=8) as executor:
    futures = {executor.submit(fetch_feed, b['rss'], b['name'], cutoff): b
               for b in feed_tasks}
    for future in as_completed(futures):
        articles, error = future.result()
        # 分类处理：成功 / 无文章 / 失败

脚本输出结构化日志，每条带标签前缀，方便后续自动化解析：

[  OK] 素生           | z.arlmy.me       | 16 篇
[ WARN] 揆机           | pathos.page      | 近 4 周无新文章
[ERROR] ScarSu        | scarsu.com       | 连接失败
[ SKIP] BORBER        | blog.borber.top  | 未配置 RSS

终端采集最终效果：

npm run rss

> ataraxia@0.0.1 rss
> python3 scripts/fetch_rss.py

[ INFO] RSS 采集开始
[ INFO] 共 24 个友链
[ SKIP] BORBER       | https://blog.borber.top | 未配置 RSS
[ SKIP] 图灵技术域        | http://www.omegaxyz.com | 未配置 RSS
[ INFO] 待采集 22 个, 跳过 2 个
[   OK] 枫林灯语         | https://blog.mfwt.top | 7 篇
[   OK] 阮一峰的网络日志     | https://www.ruanyifeng.com/blog | 3 篇
[   OK] 莫比乌斯         | https://mobius.blog  | 10 篇
[   OK] 二丫讲梵         | https://wiki.eryajf.net | 4 篇
[   OK] Obaby        | https://zhongxiaojie.com | 9 篇
[   OK] 八咫乌          | https://www.vergilisme.com | 3 篇
[   OK] 老T博客         | https://lawtee.com   | 4 篇
[   OK] 秋风于渭水        | https://www.tjsky.net | 4 篇
[   OK] 一派胡言         | https://yipai.me     | 1 篇
[   OK] 优世界          | https://usj.cc       | 11 篇
[   OK] 孤斗           | https://d-d.design   | 10 篇
[ WARN] 揆机           | https://pathos.page  | 近 4 周无新文章
[   OK] 愆伏           | https://www.tortorse.com | 4 篇
[ WARN] Yihui Xie    | https://yihui.org/cn | 近 4 周无新文章
[ WARN] 映屿           | https://www.glowisle.me | 近 4 周无新文章
[ WARN] 白熊阿丸的小屋      | https://blog.bxaw.name | 近 4 周无新文章
[   OK] 理论派          | https://sliun.com    | 1 篇
[ WARN] Owen的博客      | https://www.owenyoung.com | 近 4 周无新文章
[ WARN] ScarSu       | https://www.scarsu.com | 近 4 周无新文章
[ WARN] 特立独行的异类      | https://www.demochen.com | 近 4 周无新文章
[   OK] 素生           | https://z.arlmy.me   | 16 篇
[   OK] CC的数字花园      | https://cyrus19.cc   | 3 篇
[ INFO] 采集耗时 46s

============================================================
   RSS 采集报告
============================================================
   时间:     2026-06-28 16:22:19
   总站点:   24
   有 RSS:   22
   成功:     22
   失败:     0
   跳过:     2
   总文章:   90 (近 4 周)
============================================================
   文件更新:
     • /suiyanblog/scripts/../src/data/rss_data.json
============================================================

   📋 关注事项
   --------------------------------------------------------
   ⚠ 揆机           | https://pathos.page  | 近 4 周无新文章
   ⚠ Yihui Xie    | https://yihui.org/cn | 近 4 周无新文章
   ⚠ 映屿           | https://www.glowisle.me | 近 4 周无新文章
   ⚠ 白熊阿丸的小屋      | https://blog.bxaw.name | 近 4 周无新文章
   ⚠ Owen的博客      | https://www.owenyoung.com | 近 4 周无新文章
   ⚠ ScarSu       | https://www.scarsu.com | 近 4 周无新文章
   ⚠ 特立独行的异类      | https://www.demochen.com | 近 4 周无新文章
   --------------------------------------------------------

[ DONE] 采集完成, 共 90 篇文章

每种标签的含义：

[OK] — 采集成功，正常展示
[WARN] — RSS 可访问但近一个月无文章，可能已停更
[ERROR] — 网络错误或解析失败，需要关注
[SKIP] — 未配置 RSS 地址，跳过

第三步：页面展示

在 links.astro 的文件头中读取 JSON 数据，合并到友链对象，按最新文章时间排序：

const linksWithRss = FRIENDS_LINKS
    .map((link, i) => ({
        ...link,
        _index: i,
        rssArticles: rssData[link.site_url.replace(/\/$/, '')] || [],
    }))
    .sort((a, b) => {
        const aDate = a.rssArticles[0]?.published_parsed || '';
        const bDate = b.rssArticles[0]?.published_parsed || '';
        return bDate.localeCompare(aDate) || a._index - b._index;
    });

排序逻辑：有文章的按最新发布时间降序排列，没有文章的保持原始顺序沉底。这样更新勤快的博客始终排在前面。

样式上使用 flex 布局实现标题省略号截断 + 时间戳右对齐，卡片添加 overflow: hidden 防止超长内容溢出。

npm run rss 命令添加到 package.json：

"rss": "python3 scripts/fetch_rss.py"

第四步：接入定时任务

采集脚本定稿后，接入 Hermes agent 创建定时任务。任务配置如下：

项目	内容
执行时间	每天 10:00
命令	`cd /path/to/project && npm run rss`
通知条件	stdout 中出现 `[ERROR]` 或 `[WARN]`
通知方式	邮件

这样每天自动采集一次，有异常发邮件报警，正常时静默结束。采集结果随 Git 提交推送到仓库，部署到 Vercel 后页面自动更新。

总结

整个过程从需求提出到最终落地约半个小时。AI 负责了绝大部分代码编写和调试，人工主要做需求描述、方案决策和最终 review。

几点经验：

AI 写代码快，但需要人类把握方向。 排序策略（按数量还是按时间？修改配置文件还是动态排序？）这些决策需要自己判断。
Review 不能省。 AI 可能会写出有隐患的代码，比如缺少逗号导致语法错误。代码审查是必要环节。
结构化日志便于自动化。 脚本输出带标签的日志，既方便人工阅读，也方便后续接入定时任务解析。

最终效果：博客链接页面不再是干巴巴的链接列表，每张卡片下方动态展示着最近文章，页面更有活力。

这套方法不限于 Astro——只要博客能生成静态文件，都可以用。核心只是一个 Python 采集脚本 + 一个 JSON 数据文件，任何静态博客（Hugo、Hexo、Jekyll、Zola 等）都可以在自己的模板里读取 rss_data.json 来渲染。接入定时任务后甚至能做到每日自动更新。