OpenPisci · 开源 Windows AI Agent

OpenPisci

本地优先的 Windows 桌面 AI Agent,基于 Tauri 2 + Rust + React 构建。 通过 Pisci / Koi / Fish 三层协作架构,将复杂任务拆解、执行、复盘一体化。

Windows 桌面应用 多模型 Agent 丰富工具体系
3 层
Agent 架构(Pisci / Koi / Fish)
多模型
Claude / GPT / DeepSeek / Qwen 等
200+
工具与扩展调用能力
本地优先
安全、可控、适合持续工程化协作

产品定位与核心价值

不是聊天工具,而是可执行、可协作、可持续演进的桌面 Agent 平台

强大的 Agent 能力

  • 多 LLM 支持:Claude、GPT、DeepSeek、Qwen、Kimi 等
  • 自动记忆 + 主动记忆:跨会话沉淀关键上下文
  • 任务分解:复杂任务自动拆解并分步执行
  • 崩溃恢复:checkpoint 断点续跑
  • 心跳机制:定时巡检待办与状态
  • 循环检测:四种检测器防止死循环

Windows 工程化优势

  • 本地桌面体验:系统集成能力强、低门槛部署
  • UI Automation:可操控任意桌面应用
  • Office 自动化:Word / Excel / PPT / Outlook
  • PowerShell + WMI:系统级查询与操作能力
  • 安全策略:Strict / Balanced / Dev 模式可选
OpenPisci 界面展示

Pisci / Koi / Fish 三层架构

总控、持久化协作、无状态临时子任务,分层清晰、职责明确

角色 定位 生命周期 典型职责 关系
Pisci 主 Agent / 项目经理 / 用户入口 常驻 对话、协调多 Agent、推进与收尾判断 组织 Koi,必要时调用 Fish
Koi 持久化协作 Agent 可跨项目复用 架构、编码、测试、研究、审查等角色分工 通过 `pool_chat` 协作,可 @mention 彼此
Fish 无状态临时子 Agent 一次性 / 按需创建 批量扫描、资料整理、上下文隔离任务 由 Pisci/Koi 通过 `call_fish` 委派

鱼池(Pond)协作机制

项目池 + Chat + 看板 + Inbox + 知识库,支持多 Agent 长周期协同

鱼池(Pond)协作界面展示
鱼池聊天室协作展示
1

用户发起项目

  • 用户可以在应用内聊天,也可以通过飞书等 IM 直接告诉 Pisci“创建一个鱼池项目”
  • Pisci 通过 `pool_org(action="create")` 创建项目池,并写入 `org_spec`
2

Pisci 组织团队

  • Pisci 根据项目目标选择合适的 Koi 角色
  • Pisci 优先通过 `pool_chat` 发送带 `@KoiName` 的消息来发起工作,而不是死板串行分配
3

Koi 自主协作

  • Koi 在 `pool_chat` 中汇报进展、交接工作、提出问题、请求复审
  • `@mention` 是消息,不是硬命令:被提及的 Koi 会自主判断是立即响应、继续当前工作,还是请求 Pisci 协调
  • `@all` 可向整个项目团队广播
4

待办与状态同步

  • 任务通过 `koi_todos` 追踪,状态流转为 `todo -> in_progress -> done / blocked / cancelled`
  • Pisci 和任务所有者可以更新任务状态;其他 Koi 需要通过 `@pisci` 请求变更
  • `pool_chat` 中的 `[ProjectStatus] follow_up_needed / waiting / ready_for_pisci_review` 信号会辅助 Pisci 判断项目是否继续推进
5

Pisci 心跳与继续推进

  • 心跳会扫描池内新消息、待办和状态信号
  • 只要仍有 active todo,或有人发出 `follow_up_needed / waiting`,Pisci 就应继续协调,而不是把项目误判为结束
  • 只有当工作真正收敛,并且有人明确用 `ready_for_pisci_review @pisci` 把判断权交回时,Pisci 才进入收尾审查
6

项目收尾

  • Koi 只能建议“可由 Pisci 审查是否结束”,不能单方面宣布项目结束
  • 最终是否归档,由 Pisci 汇总后向用户确认,再执行 `pool_org(action="archive")`

工具体系与扩展生态

覆盖文件、代码、系统、浏览器、Office、SSH、视觉、记忆、计划等全流程能力

丰富的 Windows 工具集

工具 说明
file_read / file_write文件读写(支持分块读取大文件)
file_edit精确字符串替换,支持 edits 数组批量原子修改
file_diff修改前预览 unified diff,或对比两个文件
file_list结构化目录列表(JSON,含大小/修改时间)
file_search按名称 glob 搜索或按内容 grep 搜索(支持 file_extensions 过滤)
工具 说明
code_run专为编程场景设计的命令执行工具,返回结构化输出并自动诊断常见错误
shell / powershell_queryPowerShell 命令执行 / 结构化系统查询
wmiWMI/WQL 查询硬件和系统信息
web_search多引擎并行搜索(DuckDuckGo、Bing、百度、360),结果合并去重
browserChrome 浏览器自动化(CDP 协议)
uiaWindows UI Automation — 控制任意桌面应用
工具 说明
screen_capture截图(全屏/窗口/区域),支持 Vision AI 分析
com / com_invokeCOM/ActiveX 对象调用(支持 32/64 位)
office通过 COM 自动化 Word、Excel、PowerPoint、Outlook
email发送/接收邮件(SMTP/IMAP)
sshSSH 远程连接与命令执行
pdfPDF 读写、页面渲染为图像(render_page_image / render_region_image)
工具 说明
vision_context视觉上下文管理:跨轮次保存/选择图像,供 Agent 主动决策下一步看什么
memory_store向长期记忆写入信息
plan_todo为复杂任务维护可视化执行计划与待办状态
用户自定义工具TypeScript 插件,支持自定义配置接口
MCP 工具通过 MCP 协议接入外部工具服务器

进阶能力与生态

子 Agent、技能、编程工作流、上下文可视化与多平台连接,构建可持续演进的桌面 Agent 系统

小鱼(Fish)子 Agent 系统

  • 通过 FISH.toml 定义专属子 Agent,拥有独立人设、工具权限和配置
  • 无状态临时工作者:主 Agent 或 Koi 通过 call_fish 委派子任务,仅返回最终结果
  • 核心价值:中间推理与工具调用不污染主 Agent / Koi 上下文,节省上下文窗口
  • 用户可在 %APPDATA%\\com.pisci.desktop\\fish\\ 放置自定义小鱼
  • 适用于批量文件处理、数据收集、代码扫描等多步骤任务,而非长期项目协作

技能系统(Skills)

  • 使用 SKILL.md:YAML frontmatter(名称/描述/工具列表等)+ Markdown 正文(使用说明)
  • 技能内容会在每次 Agent 调用时注入系统提示词,引导使用特定工具与流程
  • 自动触发:每次收到任务优先调用 skill_search 查找匹配技能,命中则按技能指令执行
  • zip 包安装:支持将 SKILL.md + reference.md + examples.md 打包为 .zip 一键安装
  • 支持 URL / 本地路径安装(单文件或 zip)
  • 技能持久化:写入磁盘并同步到数据库,重启自动恢复
  • 内置技能:Office 自动化、文件管理、Web 自动化、系统管理、桌面控制
  • 注意SKILL.md 为 OpenPisci 自定义格式,与 Anthropic MCP 不是同一规范

编程能力(v0.3.0 新增)

  • code_run:结构化 exit_code / stdout / stderr / duration_ms,并对 Rust/Python/Node 常见错误自动诊断
  • file_edit 批量替换:edits 数组原子修改多处,先全量验证再统一写入
  • file_diff:修改前预览 unified diff,帮助自我校验
  • file_search 增强:结果上限 500、file_extensions 精确过滤、单文件 grep 上限 200KB
  • 编程闭环:系统提示词内置“理解 → 修改 → 验证 → 调试”工作流指导

上下文预览 / 文件链接(v0.3.0 新增)

  • 点击聊天界面查看下一轮发送给 LLM 的完整消息序列
  • 结构化展示 role、blocks(文本/工具调用/工具结果),工具调用与结果可折叠
  • 显示 token 使用量与上下文预算进度条,便于理解压缩效果
  • 本地路径(如 C:\\Users\\...\\file.md)自动转为可点击链接,系统默认程序打开
  • 支持 Windows / UNC / Unix 路径与 file:// URI

多平台 IM 网关

平台 模式
微信(WeChat)扫码绑定,双向收发(iLink Bot API,无需 CLI)
飞书(Feishu/Lark)WebSocket 长连接收件 + 出站回复
企业微信(WeCom)本地中继收件 + 出站回复
钉钉(DingTalk)Stream 模式 WebSocket 收件 + 出站回复
Telegram长轮询收件 + 出站回复
Slack出站 Webhook
Discord出站 Webhook
Microsoft Teams出站 Webhook
Matrix出站发送
通用 Webhook出站 Webhook
IM 消息与 Agent 双向通信:每个 IM 频道/用户拥有独立的持久会话,消息历史完整保留。

定时任务 / 安全机制 / 界面特性

  • 定时任务:Cron 表达式调度;任务历史记录(运行次数、最后执行时间、状态);支持立即触发
  • 安全机制:API 密钥 ChaCha20Poly1305 加密存储;Strict / Balanced / Dev 策略;提示注入检测(v2);工具调用频率限制;危险操作二次确认
  • 界面特性:极简模式(悬浮 HUD + Toast);双主题(紫罗兰 / 黑金);窗口边框颜色随主题动态变化(Windows 11+);中英文国际化

快速开始与安全提示

建议先在测试环境体验,再逐步接入真实项目与生产流程

快速开始

  • 系统要求:Windows 10/11(64-bit)+ WebView2 Runtime
  • 安装方式:从 GitHub Releases 下载 `.exe`
  • 首次配置:选择 LLM、填写 API Key、设置工作区
  • 开发环境:Rust stable + Node.js 20 + VS2022 Build Tools

安全机制

  • 密钥加密:ChaCha20Poly1305
  • 策略模式:Strict / Balanced / Dev
  • 提示注入检测 + 工具频率限制
  • 危险操作二次确认
  • 建议在虚拟机环境下先行验证高权限流程

开始体验 OpenPisci

从单人任务到多 Agent 项目协同,OpenPisci 提供完整的本地优先执行闭环。 如果你在 Windows 上需要一个可执行、可扩展、可持续协作的 AI Agent 平台,可以从 Releases 快速开始。

开源项目,持续迭代更新
三层 Agent 协同,支持复杂任务拆解
丰富工具与技能体系,覆盖研发到办公场景