Neo:两个具体计划(按工作级别详细)


---
计划1:MCP 暴露路线图(前三大能力)
目标:让 Hermes 通过 MCP 端点被代理发现并可调用。这直接回应了“新SEO”的观察结论。
优先顺序
1. note-weaver(最高即时价值)
2. wiki 导入管道(Raindrop + EPUB → wiki)
3. FlashLib 聚类技能(新)
实现步骤
- 阶段 1(note-weaver)
- 将现有的 note-weaver 逻辑作为 MCP 工具暴露出来。
- 所需参数:source_path(文件或 URL)、target_vault(默认:~/wiki)、tags(可选)。
- 返回:结构化 markdown + 自动生成的链接列表 + 连接分数(Connection Scores)。
- 添加进度流(progress streaming),以便长时间的导入能报告状态。
- 阶段 2(wiki 导入)
- 创建专用的 MCP 端点 ingest-to-wiki,用于封装完整管道(获取 → 提取 → note-weaver → 交叉链接)。
- 支持单个条目以及批量集合。
- 暴露元数据(source、date、original tags),让代理能够做出有依据的决策。
- 阶段 3(FlashLib 聚类)
- 一旦聚类技能存在,将 cluster-corpus 和 get-cluster-summary 作为 MCP 工具暴露。
- 允许代理请求任意集合的主题分组,并获得中心页面(hub-page)建议。
决策点
- 认证:先从仅本地(stdio)开始;如果需要,再加入基于令牌(token-based)的认证。
- 工具命名:使用清晰、对代理友好的名称(note_weaver、ingest_to_wiki、cluster_documents)。
- 文档:每个端点都必须包含一段一问段落描述(one-paragraph description)+ 一个示例调用(example call),以便代理能够自我发现。
时间线目标:第一个端点(note-weaver)在一次专注会话内上线。
---
计划2:通过 FlashLib 升级 Wiki 知识库
目标:把你的 wiki 从一堆页面转变为一个聚类化、可查询的知识图谱,包含主题中心、重复检测以及漂移追踪。
核心工作流程
1. 嵌入生成
- 对所有 wiki 页面以及 Raindrop 条目使用你现有的嵌入器(embedder)。
- 将嵌入与元数据一并存储(title、source、date、tags)。
2. 使用 FlashLib 聚类
- 在完整语料库上运行 FlashKMeans(或该库推荐的聚类方法)。
- 目标簇数:先从 30–80 开始(可调)。
- 输出:每个文档的 cluster ID + 成员列表。
3. 后处理
- 主题中心:对每个簇自动生成一个中心页面(hub page),包含:
- 簇名称(由 LLM 根据最主要的文档生成)
- Top 5 个代表性摘录(representative excerpts)
- 所有成员页面的列表(附链接)
- 重复检测:在同一簇内,对余弦相似度 > 0.92 的文档进行标记(Flag documents)。
- 漂移追踪:每月重新运行聚类,并比较簇成员随时间的变化。
4. 集成
- 新技能:wiki-cluster(或扩展 note-weaver)。
- 一条命令:wiki-cluster --collection raindrop --output hubs/
- 结果以 markdown 文件形式写出,并成为一等(first-class)的 wiki 页面。
决策点
- 嵌入模型:复用你在 note-weaver 中已经使用的任何模型,以保持一致性。
- 簇数策略:先用肘部法(elbow method)或轮廓系数(silhouette score),然后允许手动覆盖。
- 更新频率:新条目每日夜间更新,每月进行一次完整重聚类。
- 隐私:所有处理都保持在本地完成。
预期结果
你的 wiki 将变得更强大——代理(以及你自己)可以按主题导航而不是手动搜索,重复内容会被自动标记,并且知识漂移将变得可度量。
---
下一步
你想先从哪个计划开始,还是让我们两个同时并行推进?只要你选定入口点,我就可以立即生成第一个技能文件或 MCP 端点规格。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论