$catGITHUB||~12 min

深度解析ai-fomo-skills:构建抗信息过载的个人AI知识系统

advertisement

我是怎么被AI FOMO折磨,然后用ai-fomo-skills自救的

先说说我的痛

不瞒你们说,我之前每天的状态就是:早上打开电脑,ArXiv上刷出200篇新论文,Twitter上又有人发了个炸裂的demo,GitHub Trending前三全是新的LLM框架。我收藏夹里躺着上千篇"稍后再读"的文章,但说实话,一篇都没读过。

这就是所谓的AI FOMO——Fear Of Missing Out。你明明知道不可能全部看完,但就是控制不住自己,总怕错过什么关键的东西。

后来我在GitHub上翻到了一个叫 vincelele/ai-fomo-skills 的项目,说实话第一眼看名字我还以为是什么割韭菜的课程,结果点进去一看,作者提出了一个挺有意思的概念叫个人超级对齐

这个概念说白了就是:外面的信息洪水滔天,你得有一套机制,让这些信息跟你自己的学习目标和认知框架对齐。不是什么都要看,而是只看跟你相关的、真正有价值的东西。

我对这个项目的理解

ai-fomo-skills 不是一个简单的收藏夹或者RSS阅读器。它更像是一个信息处理管道,把原始的、乱七八糟的信息喂进去,出来的是三样东西:

  • 知识:沉淀下来的原理、教程、最佳实践
  • 信号:过滤掉噪音之后,真正值得关注的新趋势和突破
  • 摘要:长篇论文和文档的精华提炼

我第一次跑通这个流程的时候,那种感觉就像——以前你每天要在垃圾堆里翻宝贝,现在有人帮你把宝贝挑出来放你桌上了。

踩坑实录:我自己搭了一个信息处理技能

接下来我手把手带你们搞一个实际能用的东西。我设计了一个叫 daily_ai_signal 的技能,目标是每天自动从RSS源里筛选出跟大模型相关的重大新闻,生成一份简报。

第一步:环境搭建

bash
1
# 建项目目录
2
mkdir ai-fomo-skills-practice
3
cd ai-fomo-skills-practice
4
 
5
# 虚拟环境(这步千万别跳过,我之前偷懒直接装全局,结果依赖冲突搞得头大)
6
python -m venv venv
7
source venv/bin/activate
8
 
9
# 装依赖
10
pip install feedparser openai python-dotenv

第二步:配置API密钥

env
1
# .env 文件
2
OPENAI_API_KEY="sk-你的密钥写在这里"

千万把API Key硬编码到代码里然后推到GitHub上。我一个朋友就是这么干的,第二天醒来发现账单多了200刀。用 .env 文件,然后在 .gitignore 里加上它。

第三步:核心脚本

这是整个技能的核心代码,我加了不少注释方便你们理解:

python
1
# daily_signal_skill.py
2
import os
3
import feedparser
4
from openai import OpenAI
5
from dotenv import load_dotenv
6
import json
7
 
8
load_dotenv()
9
 
10
client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))
11
 
12
def fetch_rss_entries(rss_url):
13
    """从RSS源抓取最新条目"""
14
    print(f"正在从 {rss_url} 抓取信息...")
15
    feed = feedparser.parse(rss_url)
16
    return feed.entries
17
 
18
def analyze_and_filter_with_ai(entries):
19
    """用LLM做智能筛选和摘要"""
20
    if not entries:
21
        return "没有找到新的信息。"
22
 
23
    # 只处理前10条,控制token成本
24
    # 我一开始没加这个限制,一次喂了50条进去,API费用直接起飞
25
    titles_and_summaries = [
26
        f"标题: {entry.get('title', '无标题')}\n摘要: {entry.get('summary', '无摘要')}"
27
        for entry in entries[:10]
28
    ]
29
 
30
    input_text = "\n\n---\n\n".join(titles_and_summaries)
31
 
32
    prompt = f"""
33
    你是一位资深的AI行业分析师。请分析以下来自AI领域的最新资讯条目。
34
    你的任务是:
35
    1. 识别出与大语言模型(LLM)、基础模型或多模态模型相关的重大进展或重要发布。
36
    2. 过滤掉公关稿、非核心更新或微小版本迭代。
37
    3. 为筛选出的每一条重要资讯,生成一句话的精炼摘要。
38
    4. 如果没有发现重要信号,请直接回复"今日无重大AI信号"。
39
 
40
    请以 JSON 列表的格式输出,每个元素是一个字典,包含 'title' 和 'ai_summary' 两个键。
41
 
42
    原始资讯如下:
43
    {input_text}
44
    """
45
 
46
    response = client.chat.completions.create(
47
        model="gpt-3.5-turbo",  # gpt-4o-mini 性价比也不错,看你自己选
48
        response_format={"type": "json_object"},
49
        messages=[
50
            {"role": "system", "content": "你是一个专业的AI信息过滤和总结助手,擅长从文本中提取关键信息,并以严格的JSON格式输出。"},
51
            {"role": "user", "content": prompt}
52
        ],
53
        temperature=0.2  # 低温度,输出更稳定
54
    )
55
 
56
    try:
57
        result = json.loads(response.choices[0].message.content)
58
        if isinstance(result, dict):
59
            for v in result.values():
60
                if isinstance(v, list):
61
                    return v
62
        return result
63
    except json.JSONDecodeError:
64
        print("AI返回的JSON解析失败了,可能是prompt需要调整。")
65
        return []
66
 
67
def main():
68
    # Hugging Face Blog 的 RSS,质量很高
69
    rss_url = "https://huggingface.co/blog/feed.xml"
70
 
71
    entries = fetch_rss_entries(rss_url)
72
    print(f"拿到 {len(entries)} 条内容,开始智能过滤...")
73
 
74
    important_signals = analyze_and_filter_with_ai(entries)
75
 
76
    if isinstance(important_signals, list) and important_signals:
77
        print("\n=== 今日重大 AI 信号 ===")
78
        for signal in important_signals:
79
            print(f"- {signal.get('title', '未知标题')}")
80
            print(f"  摘要: {signal.get('ai_summary', '无')}")
81
    else:
82
        print("\n=== 今天风平浪静,没有重大信号 ===")
83
 
84
if __name__ == "__main__":
85
    main()

第四步:跑起来并自动化

bash
1
python daily_signal_skill.py

跑通之后,我建议你用 cron job 或者 GitHub Actions 让它每天自动执行,然后把结果推到你的笔记系统里。我个人是推到 Obsidian 的一个专门的 daily notes 文件夹,每天早上打开就能看。

我试过的几种方案对比

在搞这个之前,我还试过别的方式,给你们做个参考:

方案一:自建脚本(就是上面这个)

  • 优点:完全可控,想怎么改就怎么改,成本就是API调用费
  • 缺点:得自己维护,代码出bug了得自己修
  • 适合:喜欢折腾的开发者

方案二:现成平台(比如一些付费的AI摘要服务)

  • 优点:开箱即用,不用写代码
  • 缺点:功能固定,你的数据在别人服务器上,而且订阅费不便宜
  • 适合:不想写代码的研究者

方案三:基于ai-fomo-skills生态

  • 优点:有社区沉淀的现成技能可以复用,标准化程度高
  • 缺点:项目还在早期,文档和示例可能不够完善
  • 适合:想快速上手同时参与社区共建的人

我个人最终选了方案一+方案三结合的路线。用 ai-fomo-skills 的理念做架构,然后根据自己的需求写具体技能。

几个真诚的建议

  1. 从小处着手:别一上来就想搞个大而全的系统。先从一个你最头疼的信息源开始,写一个过滤脚本跑通流程。
  2. 注意数据安全:把内容发给云端LLM的时候,敏感信息记得脱敏。后面可以考虑接本地模型比如Llama 3,彻底解决隐私问题。
  3. 融入工作流:工具再好,如果不在你的日常工作流里,很快就会被遗忘。一定要把它嵌入到你每天的习惯中。

说实话,自从搞了这套东西之后,我的AI焦虑缓解了不少。不是因为我不再关注新动态了,而是我知道——重要的东西不会被漏掉,它会自动出现在我的笔记里。这种安全感,比刷100条Twitter有用多了。

advertisement

深度解析ai-fomo-skills:构建抗信息过载的个人AI知识系统 — AI Hub