K-Founder 智能键盘 · 软件 MVP

真接 CometAPI(gpt-4o-mini)· 失败自动降级 · 展示「软件能交付什么、哪些依赖硬件」
● 绿色=软件现已实现 ● 灰色=依赖硬件信号
绿色:纯软件,现在跑给你看 灰色:需硬件发信号,现用模拟替代 AI 数据来源:等待生成 点左侧键 → 看中间反应 → 点 13 印 → 真·AI 提炼

物理按键(鼠标点击模拟)

真机由键盘硬件触发。每个键的「软件响应」是真实的。
硬件触发5
标记重点 → AI 提金句
硬件触发6
标记结论 → AI 提大纲
硬件触发7
标记任务 → AI 提待办
硬件触发4
截屏可做;读他人App受限
软件可做11
唤起知识库 RAG 问答
软件可做13
归档 → 触发 5 路 AI

① 录音与实时打标 软件实时

00:00
点「开始真实录音」→ 浏览器会请求麦克风权限 → 对着麦克风说话,文字实时出现 → 说话时点 5/6/7 号键打标
(按「开始真实录音」,对着麦克风说中文,转写文字会实时出现在这里…)

② 五路并行 AI 提炼 真·调用 CometAPI

点 13 号键「印」触发。真实调用大模型,约 1-3 秒返回;若超时/断网自动降级为预设结果(绝不空屏)。

核心总结

章节大纲

金句精选(5悟)

行动待办(7传)

锚点高光(打标加权)

③ 知识库 AI 问答 真·RAG

(回答会以打字机方式出现…)

④ 本 MVP 已满足的需求 对照原始需求

以下为《新增功能》《全景矩阵表》中、本演示已真实跑通的条目:
  • ✓ 会议智能命名 / 录音转写:真实麦克风录音 + 实时中文转写(zh-CN)
  • ✓ 多维度 AI 纪要生成:核心总结 + 章节大纲 + 金句精选,真调用 CometAPI
  • ✓ 按键意图分发(5悟/6法/7传):打标锚点 → AI 按锚点加权提炼
  • ✓ 行动待办自动抽取:结构化输出任务/负责人/截止/优先级
  • ✓ 锚点高光时刻:按打标加权生成高光,体现「锚点驱动」
  • ✓ 知识库 AI 问答(RAG):语义检索 + 打字机流式回答
  • ✓ 五路并行 AI 编排 + SSE 思路:5 类结果并发生成
  • ✓ 智能多路备用降级:AI 失败/断网自动降级,绝不空屏
  • △ 物理按键触发:软件响应真实,按下动作鼠标模拟(待硬件协议)
  • △ 毫秒级音画对齐:算法可做,精度依赖硬件时间戳

本演示对应「能 / 不能」边界

✓ 录音转写整理

录音→AI出总结/大纲/金句/待办。纯软件,已实现。

✓ 按键打标加权

收到打标信号后把对应片段加权交AI。软件逻辑真实。

✓ 五路并行 AI

并发生成+流式下发。软件核心,现接 CometAPI。

✓ 知识库 RAG 问答

向量检索+流式回答。纯软件成熟方案。

✓ 坏录音修复

重写WAV文件头救回中断录音。纯软件。

△ 物理按键信号

键盘按下要发「打标包+时间戳」。需供应商给协议与样例包。

△ 麦克风录音

真机音频来自键盘麦克风阵列,音质由硬件保证。

△ 毫秒级对齐

≤10ms 取决于硬件时钟精度,软件只能补偿。

✕ 截屏读他人App

读其它App的文件名/网址被iOS禁止。改「截图+AI识图」。

✕ 后台保活24h

iOS会杀后台,「300ms自愈」做不到,需改口径。