last30days-skill 项目总结

[!info]
本文基于 mvanhorn/last30days-skill 当前主分支源码整理。分析时对应提交为 1221584，最近提交信息为 chore(release): v3.3.2 (#485)，提交时间为 2026-06-06。

项目介绍/说明

last30days-skill 是一个面向 Agent Runtime 的开源研究型 Skill。它的目标不是做传统网页搜索，而是让 AI Agent 在最近 30 天内跨多个社区、社交平台、视频平台、预测市场和代码平台检索真实讨论，再把这些证据整理成一份可读 briefing。

项目的核心定位可以概括为：用 Agent 去搜索“最近真实人群在讨论什么”，并按互动信号、时效性、相关性和来源质量进行排序，而不是只依赖搜索引擎的 SEO 结果或模型训练数据。

它同时具备两层产品形态：

Agent Skill 层：skills/last30days/SKILL.md 定义运行契约、输出格式、预检流程、引用规则、比较模式和宿主模型应该如何生成 query plan。
Python Engine 层：skills/last30days/scripts/last30days.py 是 CLI 入口，实际负责配置读取、数据源探测、多源检索、归一化、重排、聚类、渲染和保存。

项目支持 Claude Code、Codex、Cursor、GitHub Copilot、Gemini CLI、OpenClaw 等多种宿主环境。官方推荐的通用安装方式是 Agent Skills CLI：

npx skills add mvanhorn/last30days-skill -g

Claude Code 也可以通过 marketplace 安装：

/plugin marketplace add mvanhorn/last30days-skill
/plugin install last30days

项目解决的痛点

1. 大模型知识滞后

普通 LLM 回答依赖训练数据或有限联网能力，面对 AI 工具、开源项目、热点人物、社区反馈、产品口碑这类快速变化的信息时，很容易落后。last30days-skill 把问题限定在最近一段时间，并主动抓取社区讨论、视频 transcript、GitHub 活动和预测市场数据，解决“模型知道的不是现在发生的事”的问题。

2. 传统搜索过度依赖网页和 SEO

Google 或普通 web search 更容易返回官网、博客、新闻稿、媒体文章。很多真实意见存在 Reddit 评论、X 帖子、Hacker News 讨论、YouTube 长视频、TikTok 内容、GitHub Issue/PR 里。这个项目把这些平台作为一等数据源，强调“社交相关性”而不是单纯的网页相关性。

3. 多平台信息孤岛

X、Reddit、YouTube、TikTok、GitHub、Polymarket 等平台的数据格式、认证方式、搜索能力、互动指标都不一致。手动跨平台查资料非常耗时，也难以统一排序。项目通过多个 source adapter 把不同平台统一成 SourceItem，再进入同一套归一化、打分、融合和聚类流程。

4. 手工研究成本高

典型使用场景包括会前调研、竞品分析、工具选型、产品需求洞察、热点事件复盘、提示词学习。原本需要人工打开多个平台逐条看帖子、评论、视频和 issue；现在可以由 Agent 并发检索，再输出一份结构化 briefing。

5. “热度”和“可信度”难以同时处理

项目并不把互动量等同于事实，但它把点赞、转发、评论、upvote、浏览量、预测市场概率、GitHub star/PR 活动等作为信号之一，再结合 relevance、freshness、source quality 做融合排序。这样能把“社区确实在关注什么”显式纳入研究结果。

项目剖析

总体架构

项目结构的核心文件如下：

文件	作用
`skills/last30days/SKILL.md`	Agent 运行契约，定义输出规则、预检、计划生成、比较模式和引用约束
`skills/last30days/scripts/last30days.py`	CLI 主入口，负责参数解析、诊断、运行 pipeline、保存和输出
`skills/last30days/scripts/lib/pipeline.py`	多源检索编排，负责并发拉取、归一化、融合、重排、聚类
`skills/last30days/scripts/lib/planner.py`	Query plan 生成与兜底规划
`skills/last30days/scripts/lib/schema.py`	核心数据模型：`QueryPlan`、`SourceItem`、`Candidate`、`Cluster`、`Report`
`skills/last30days/scripts/lib/env.py`	配置、环境变量、`.env`、macOS Keychain、API key 探测
`skills/last30days/scripts/lib/render.py`	compact/md/html/context/json 等输出渲染
`CONFIGURATION.md`	配置参考，说明 key、数据源、保存目录、watchlist、briefing
`docs/how-search-works.md`	Reddit 与 X 搜索实现说明

重点原理

1. Skill Contract 驱动 Agent 行为

这个项目的一个关键设计点是：它不是只有代码，而是把 SKILL.md 当作产品入口。SKILL.md 明确规定宿主模型必须做什么，例如：

对命名实体类 topic，宿主模型应先做 pre-research，尽量解析 X handle、GitHub 用户、相关 subreddit 等。
宿主模型需要生成 JSON query plan，并通过 --plan 传给 Python 引擎。
Python 引擎输出的 badge、证据块、footer、HTML briefing 等有固定格式。
用户可见的最终结果需要避免裸 URL、避免末尾堆来源列表，并用 inline markdown link 引用证据。

这相当于把“提示词工程”提升为一份可版本化、可测试、可分发的 Agent 协议。

2. Query Plan 先行

planner.py 会把用户 topic 转成一个结构化的 QueryPlan：

topic -> intent -> freshness_mode -> cluster_mode -> subqueries -> source_weights

每个 SubQuery 包含：

label：子查询标签。
search_query：适合平台检索的关键词查询。
ranking_query：适合语义重排的自然语言问题。
sources：要搜索的数据源。
weight：该子查询在融合排序中的权重。

如果宿主模型传入 --plan，引擎会优先使用外部计划；否则会尝试调用内部 reasoning provider；再不行则走 deterministic fallback。项目文档里多次强调，命名实体场景应该由宿主 Agent 先生成 plan，否则结果会变薄。

3. 多源并发检索

pipeline.py 会根据配置和可用依赖判断数据源是否启用。默认可用的数据源包括 Reddit、Hacker News、Polymarket；如果本地有 gh 或 token，可启用 GitHub；如果有 yt-dlp 可启用 YouTube；如果有 X cookie、xAI key 或 ScrapeCreators key，可启用 X/Twitter 等。

核心检索使用 ThreadPoolExecutor 并发执行。每个 source 会被包装为统一的 retrieval stream，返回原始 item 和可能的 artifact。项目还做了这些工程处理：

对部分 source 设置 fetch cap，避免重复请求。
发现 429 后共享 rate-limit 状态，减少无效调用。
对 5xx transient error 做一次重试。
GitHub 有 person-mode 和 project-mode，优先按用户或仓库做定向检索。
Reddit 支持 public JSON enrichment，拉取真实 upvote、评论数、top comments。

4. 统一数据模型

不同平台返回的数据会被归一化成 SourceItem。关键字段包括：

source：来源，如 reddit、x、youtube、github。
title、body、url、author、container。
published_at、date_confidence。
engagement：平台互动指标。
relevance_hint、why_relevant、snippet。
metadata：平台特有补充信息。

统一模型的好处是：后续 relevance、freshness、dedupe、snippet、fusion、cluster 都不用关心原始平台差异。

5. 归一化、去重、融合、重排

单个 source 的处理流程大致是：

raw items
  -> normalize_source_items
  -> signals.annotate_stream
  -> prune_low_relevance
  -> dedupe_items
  -> extract_best_snippet

跨 source 的排序则大致是：

items_by_source_and_query
  -> weighted_rrf
  -> rerank_candidates
  -> score_fun
  -> enrich GitHub stars
  -> cluster_candidates
  -> render

其中 weighted_rrf 是加权 reciprocal rank fusion，用来把多个子查询、多种来源的候选项合并成统一候选池；rerank_candidates 再调用 reasoning provider 或 fallback 进行语义重排；score_fun 会给“有传播性/有趣的观点”额外打分，服务于 Best Takes 这类输出。

6. 聚类而不是简单列表

项目不是直接输出 N 条结果，而是把同一故事、同一讨论点、同一产品反馈合并成 Cluster。例如同一事件可能同时出现在 Reddit、X 和 YouTube，聚类后会成为一个主题块，而不是重复出现三次。

这对研究 briefing 很重要：用户关心的是“发生了什么、为什么重要”，不是原始链接列表。

项目主要流程

flowchart TD
    A[用户输入 topic] --> B[宿主 Agent 解析意图]
    B --> C[预检与实体解析]
    C --> D[生成或读取 QueryPlan]
    D --> E[last30days.py 解析参数与配置]
    E --> F[pipeline 判断可用数据源]
    F --> G[并发检索 Reddit / X / YouTube / HN / GitHub / Polymarket 等]
    G --> H[归一化 SourceItem]
    H --> I[相关性 / 新鲜度 / 互动指标打分]
    I --> J[去重与 snippet 提取]
    J --> K[加权 RRF 融合]
    K --> L[LLM 或 fallback 重排]
    L --> M[跨来源聚类]
    M --> N[compact / md / json / html 渲染]
    N --> O[保存 raw 结果或 HTML briefing]
    O --> P[宿主 Agent 综合为最终回答]

数据源与能力

数据源	启用条件	主要价值
Reddit	默认可用，public JSON 可补充评论	社区真实意见、upvote、top comments
Hacker News	默认可用	技术社区讨论和开发者共识
Polymarket	默认可用	预测市场概率信号
GitHub	`gh` 或 `GITHUB_TOKEN`	PR、Issue、Repo、release、star 等工程活动
X/Twitter	cookie、xAI、ScrapeCreators 或相关后端	热点反应、专家观点、实时讨论
YouTube	`yt-dlp` 或 ScrapeCreators	长视频 transcript、评测、播客、深度观点
TikTok / Instagram / Threads / Pinterest	`SCRAPECREATORS_API_KEY` 和对应 include 配置	短视频、创作者和视觉文化信号
Bluesky / Truth Social	对应账号或 token	细分社交平台讨论
Web / Perplexity	Brave/Exa/Serper/Parallel/OpenRouter 等	传统网页、引用型补充、深度研究
Digg	本地存在 `digg-pp-cli`	AI 1000 相关故事聚合和 X 引用

项目使用

基础安装

Claude Code 推荐方式：

/plugin marketplace add mvanhorn/last30days-skill
/plugin install last30days

Codex、Cursor、Gemini CLI、Copilot 等 Agent Skills 宿主：

npx skills add mvanhorn/last30days-skill -g

更新：

npx skills update last30days -g

常见命令

普通研究：

/last30days OpenClaw

比较研究：

/last30days "OpenAI vs Anthropic vs xAI"

导出 HTML briefing：

/last30days OpenClaw --emit=html

命令行直接运行：

python3 skills/last30days/scripts/last30days.py "OpenClaw" --emit=compact

指定保存目录：

python3 skills/last30days/scripts/last30days.py "OpenClaw" --save-dir ~/Documents/Last30Days

启用 SQLite 存储，适合后续 watchlist 和 briefing：

python3 skills/last30days/scripts/last30days.py "AI coding agents" --store

诊断当前可用数据源：

python3 skills/last30days/scripts/last30days.py --diagnose

常用参数

参数	说明
`--quick`	低延迟模式，减少每个 stream 的候选数量
`--deep`	高召回模式，增加检索深度
`--search reddit,x,youtube`	限定数据源
`--emit compact/json/context/md/html`	指定输出格式
`--days` 或 `--lookback-days`	设置回看天数，默认 30 天
`--save-dir`	指定 raw 或 html 输出目录
`--save-suffix`	给保存文件增加后缀
`--x-handle`、`--x-related`	X 定向检索
`--github-user`、`--github-repo`	GitHub person-mode 或 project-mode
`--competitors`	自动发现竞品并做比较
`--competitors-list`	显式传入竞品列表
`--competitors-plan`	为比较模式传入每个实体的解析结果
`--plan`	外部 query plan，推荐宿主 Agent 对命名实体使用
`--store`	持久化结果到 SQLite
`--deep-research`	使用 Perplexity Deep Research，需要 OpenRouter key

配置文件

项目支持多层配置，优先级大致是：

进程环境变量。
当前项目的 .claude/last30days.env。
全局 ~/.config/last30days/.env。
macOS Keychain 中 last30days-<KEY> 命名的凭据。

常见配置示例：

LAST30DAYS_MEMORY_DIR=~/Documents/Last30Days
BRAVE_API_KEY=<your-brave-key>
SCRAPECREATORS_API_KEY=<your-scrapecreators-key>
INCLUDE_SOURCES=tiktok,instagram,threads
XAI_API_KEY=<your-xai-key>
BSKY_HANDLE=<your-handle>.bsky.social
BSKY_APP_PASSWORD=<your-app-password>

风险与限制

1. 数据源可用性不稳定

很多平台没有稳定、低成本、官方友好的搜索接口。X、TikTok、Instagram、YouTube 等都可能遇到登录、cookie、API 限流、反爬、费用和地区网络问题。因此同一个 topic 在不同机器、不同 key 配置下，结果质量可能明显不同。

2. 互动量不是事实

项目把 upvote、like、view、comment、prediction odds 等作为信号，但互动量只能说明“有人关注或参与”，不能直接证明内容真实。高 stakes 场景仍然需要回到原始来源核验。

3. Query Plan 质量决定上限

命名实体、竞品比较、人物研究如果没有解析出正确的 handle、repo、subreddit、hashtag，很容易搜偏。项目把这部分放在宿主 Agent 的 pre-research 和 --plan 里，设计上是合理的，但也意味着宿主模型的规划能力会直接影响最终结果。

4. Skill Contract 很长，维护成本高

SKILL.md 本身很长，里面有大量历史失败模式和强约束规则。优点是能把 Agent 行为收敛到稳定模板；缺点是维护成本高，且不同宿主模型可能仍然遗漏部分协议。因此项目用版本、测试、渲染器 badge、footer 等机制来加强契约。

5. 凭据与隐私需要谨慎

项目默认把研究结果保存到本地目录，也支持 .env 和 macOS Keychain。使用时要注意 .env 权限、API key 管理、cookie 来源，以及 raw 结果里是否包含不适合外发的内容。

可借鉴点

1. “Skill = 协议 + 引擎”

这个项目最值得借鉴的不是某个爬虫适配器，而是产品形态：把 Agent 的行为协议、运行入口、工程代码、配置文档、测试和输出契约打包成一个 Skill。这样比单纯写一个 CLI 更适合 Agent 生态分发。

2. 宿主模型负责 planning，代码负责 execution

项目把“理解 topic、解析实体、生成 query plan”交给宿主模型，把“并发检索、归一化、去重、排序、保存”交给 Python 引擎。这种分工很适合 Agent 工具：模型做模糊理解，代码做确定性执行。

3. 多源证据需要统一 schema

SourceItem -> Candidate -> Cluster -> Report 的数据模型让后续算法可以不关心平台差异。以后扩展新数据源，只要把原始结果转成统一 schema，就能接入相同 pipeline。

4. briefing 比链接列表更有价值

项目的输出目标不是“找到链接”，而是“帮用户理解最近发生了什么”。所以它强调聚类、跨源合并、Best Takes、HTML briefing、raw 保存、watchlist 和 weekly briefing。这种设计更贴近真实研究工作流。

项目总结

last30days-skill 是一个很典型的 Agent 时代工具：它不是替代搜索引擎，也不是单纯的爬虫，而是把多个封闭平台的近期讨论整合成 Agent 可消费的研究上下文。

它解决的问题可以总结为三句话：

让 AI Agent 获取比训练数据更新的社区信息。
把 Reddit、X、YouTube、GitHub、Polymarket 等孤岛数据统一到一个研究 pipeline。
把原始搜索结果转成带证据、带排序、可复用的 briefing。

从工程上看，它的价值在于把 prompt contract、CLI engine、source adapters、schema、pipeline、render、store、watchlist 组合成一个完整产品，而不是只做一个脚本。对我们做 Agent 控制台、企业研究工具、竞品情报、内容调研、产品反馈聚合时，都有较强参考意义。

推荐使用场景：

会前人物或公司调研。
AI 工具、开源项目、技术方案的最近 30 天口碑分析。
竞品比较和市场热度观察。
产品需求洞察，尤其是从 Reddit、HN、GitHub issue 中找用户痛点。
内容创作前的社区观点和素材收集。

不推荐把它当成唯一事实来源。它更适合作为“近期讨论雷达”和“研究上下文生成器”，最终结论仍应结合官方文档、原始帖子、代码仓库和权威来源核验。

分享

last30days-skill 项目总结

last30days-skill 项目总结

项目介绍/说明

项目解决的痛点

1. 大模型知识滞后

2. 传统搜索过度依赖网页和 SEO

3. 多平台信息孤岛

4. 手工研究成本高

5. “热度”和“可信度”难以同时处理

项目剖析

总体架构

重点原理

1. Skill Contract 驱动 Agent 行为

2. Query Plan 先行

3. 多源并发检索

4. 统一数据模型

5. 归一化、去重、融合、重排

6. 聚类而不是简单列表

项目主要流程

数据源与能力

项目使用

基础安装

常见命令

常用参数

配置文件

风险与限制

1. 数据源可用性不稳定

2. 互动量不是事实

3. Query Plan 质量决定上限

4. Skill Contract 很长，维护成本高

5. 凭据与隐私需要谨慎

可借鉴点

1. “Skill = 协议 + 引擎”

2. 宿主模型负责 planning，代码负责 execution

3. 多源证据需要统一 schema

4. briefing 比链接列表更有价值

项目总结

参考链接

评论