AI Product Manager & AI Builder

做 AI 产品，

和说不清的需求打交道

我这两年做 AI 产品，方向是车险经营和核保。日常是先去业务待几天，听清楚一线到底想问什么、想做什么，再回来把它拆成 Agent / Skill。

把模糊的现实难题，变成清晰的 AI 产品，这也是我想折腾的事情

做过的项目

Selected Evidence

做过的项目

Team Projects

公司项目

工作中的 AI、经营分析、核保风控与数据产品相关项目。

01 RAG / 经营归因 / 核保审核 / 可信评估

车险智能助手

面向总分车险经营及核保人员，搭建了经营调度、核保审核风控2个agent

有意思的地方在于，我主导探索了经营分析 Agent Harness 的落地实践，跟随前沿研究与行业讨论，在企业实际土壤中碰壁。最后分层架构定为：LLM 负责意图理解和顶层路由，确定性分析流程做 workflow 编排，非确定性归因用 ReAct 循环驱动维度下钻定位根因。计算与判断逻辑封装为函数调用，再加一层脚本化后置校验兜底。让对的模块做对的事，反而是最难也最关键的设计判断。

AI 替代率 22.4%

风控减损 3.4亿

释放工作量 249人

回答正确率 80.7%

展开细节收起细节

面向总分车险经营及核保人员，解决经营分析依赖人工拉数、指标口径不统一、归因链路不可追溯，以及核保资料审核人工成本高、风险识别前置不足等问题。
经营侧梳理 3 大类 7 个归因场景、280+ 经营指标、176 个组合维度和 2500+ 份知识，建设指标语义层、归因分析能力、RAG 知识库和引用溯源链路。
支持“自然语言提问 → 指标 / 知识召回 → 归因推理 → 结论输出 → 人工复核 / 任务跟进”的闭环，让经营问题从查询走向可追溯诊断。
核保侧将高频重复审核事项转化为“资料上传 - 审核引擎 - 审批结果”的产品链路，AI 处理资料质量、图片溯源、GPS 鉴真和一致性判断，由核保人兜底复杂判断。
建立测试集、验收标准、低置信度转人工、Bad Case 闭环和高风险核保人工复核机制，控制 AI 输出边界，支撑生产场景上线。
全国推广后，整体经营 / 核保岗位 AI 替代率 22.4%，等效释放 249 人工作量；经营问题覆盖率 82.1%、正确率 80.7%；替代核保岗位 60.4% 工时，累计拦截疑似欺诈 / 高风险单 32 万，按风控口径减损 3.4 亿。

02 Deep Agent / 经营分析 / 人机协同

机构车险部经理分身

面向机构车险部经理，设计机构侧 AI 经营分析执行 Agent。它更偏机构本地经营执行中枢，基于 Deep Agent 架构串起目标理解、任务拆解、分析判断、策略生成和执行跟踪。

工作替代 78%

部署机构 3家

展开细节收起细节

接入多源上下文，将机构经营专家判断沉淀为可复用规则与模板，已在 3 家机构部署，可替代初中级分析师 78% 工作。
将日报生成、取数清洗、邮件草稿等确定性任务封装为标准 Workflow，归因下钻、异常探索等开放性任务交由 ReAct 子流程。
设计任务路由、Workspace、工具网关与数据语义映射模块，支持对接机构前置库、外购数据与 Excel 等多源数据。
将分析结果转化为“策略生成 → 起草督导 → 收集反馈 → 汇总复盘”的执行链路，并把邮件、表单、系统取数、浏览器自动化等能力封装为分级管控工具。
将机构差异化诉求抽象为“总部标准方法论 + 机构本地专家包”的产品模式，打造明星车险部经理分身，支撑多机构快速复制与能力扩展。

03 经营监控 / 预警纠偏 / 复盘

经营管理闭环与高管驾驶舱

将经营总览、KPI、预警纠偏、待办追踪和复盘决策产品化，让管理动作从线下推动转为线上闭环。

纠偏发起 2166次

经营策略沉淀 157条

展开细节收起细节

围绕经营异常预警、纠偏发起、处理反馈、时光轴复盘和管理决策建立产品链路。
引入 AI 总结与时光轴展示，为后续策略建议和管理动作推荐沉淀过程数据。
系统累计发起纠偏 2166 次，沉淀经营策略 157 条，帮助总部 / 机构形成线上化复盘与追踪习惯。

04 AI 产品运营 / 智能体生态

AI 转型与推广

主导 AI 转型机制，从产品专区、智能体武器库到机构 AI 声音，把 AI 项目推广、反馈、案例和复用纳入统一运营闭环。

AI 项目 12个

声音解决率 87.6%

展开细节收起细节

牵头AI运营推广小组（跨团队5人），搭建本事业群的 AI 产品运营与复用机制——案例库、Agent 复用平台、培训宣贯与机构督办
横向拉通 12 个 AI 项目，统一呈现业务价值、机构排名、优秀 Agent 和学习案例。
组织 AI 相关培训及分享近 20 场，推动个群内部 AI 应用的学习和落地。
沉淀 230 条机构 AI 声音，声音解决率 87.6%，将一线反馈转为迭代策略。
沉淀 53 个优秀案例，案例学习量达 1w，推动机构间学习和复用。

05 DMP / CDP / 营销驾驶舱

客户数据与营销智能化平台

打通媒体投放、埋点、私域转化、人群标签和客户画像链路，把客户数据平台做成增长和经营分析底座。

获客成本降低 35%

费用节约 100万

展开细节收起细节

DMP 试点降低获客成本 35%，提升线索转化率 15%。
营销驾驶舱减少重复指标约 100 个、减少营销套表 5 套、节约费用约 100 万元。
参与 CDP 与腾讯共创，覆盖 OneID、标签画像、人群细分和数据治理。

Side Projects

个人项目

都是从生活里的某个真实痛点出发，用 Claude Code / Codex vibe coding 边聊边搭。

01 Chrome Extension / Prompt Regression / Eval Board

提示词测试插件 Prompt Eval

GitHub

把页面上下文读取、评测用例生成、平台结果导入、Judge 判定和历史看板串成浏览器侧边栏里的 Prompt 回归验证流程。

评测 run 100+

试用 Agent 20+

展开细节收起细节

面向内部 Agent 开发中 Prompt 调试记录散落、测试批次与平台结果难追溯、Prompt 改动后难以快速回看效果变化等问题，设计嵌入浏览器侧边栏的轻量评测工具。
串联“读取当前页面上下文 - 生成 E1/E2/E3 评测用例 - 导入平台结果 - 触发 Judge 判定 - 沉淀历史看板与证据”的端到端工作流，贴合 Agent 工程师日常开发节奏。
覆盖 Agent 上下文、Prompt、input schema 读取，并支持任务型 / 对话型 Agent 模板，让评测用例能跟随不同 Agent 形态快速生成。
支持 Excel / CSV / JSON / HTML 表格等结果格式、输出列识别、结果行匹配、平台失败 / 空输出隔离和 Judge 返回解析，降低导入和判定过程里的人工校验成本。
在内部 20+ 个 Agent 试用中累计沉淀 100+ 次评测 run，支撑 Prompt 调整前后通过率对比和失败归因；本地 verify 覆盖 349 个 Node 单测、核心 smoke、验收 smoke、扩展包检查、语法检查和 JSON 校验。

02 AI Coding Workflow / Remote Approval / Agent Watchdog

Codex Beeper / Codex 传呼机

GitHub

我用 Codex 时有一个很具体的离桌断点：官方 remote 不稳定且无成熟解决方案，而 GitHub 上类似项目又偏重，更像通用聊天中控或完整远程控制平台。但我需要的是轻量能力：任务跑起来后，人不可能一直守在电脑前，完成结果、权限审批和异常都会卡在本机。所以我依托微信 OpenClaw 的 channel 和官方 daemon 做了这个工具，只在完成、审批、异常时叫我，并支持引用通知续写同一个 thread。后续将演进成 Agent Watchdog，服务多 Agent 切换和审批场景。

展开细节收起细节

面向 Codex Desktop / CLI 用户，聚焦长耗时 AI 编程任务中的完成通知、权限审批、异常提醒和上下文续写，不做大而全的聊天中控。
基于 Codex Stop hook、app-server JSON-RPC 与微信 OpenClaw / iLink channel，实现完成通知、引用通知续写同一 thread、远程审批和本地 watchdog 自愈。
通过 SQLite 持久化通知、入站消息、hook 队列和 context token，配合 sender 串行队列、turn timeout / interrupt、stale token 诊断与未送达重试，降低远程协作中的丢消息和卡死风险。
默认 owner-only、本地运行、无公网 webhook；微信端只能选择配置过的项目别名，不能传任意本机路径，敏感操作保留审批和边界提示。
后续计划从“Codex 传呼机”演进为 Agent Watchdog，覆盖多 Agent 任务状态监控、切换、审批和异常接管。

03 Hybrid Retrieval / Reranker / RAG

BJJ Video Search

我是一名巴西柔术练习者，参加职业竞技曾获23年、24年AJP中国区冠军。这个领域存在大量的长视频、长播客，我每次想回看某个动作都得在一小时的视频里翻半天。因此做了个时间戳级别的视频检索项目，把教程、字幕、术语别名、技术标签和时间戳片段转化为可检索、可引用、可问答的知识库。

累计查询 1100+

Top-5 可用率 80%+

展开细节收起细节

搭建“字幕采集、VTT 解析、时间戳 chunk、标签抽取、混合召回、Reranker 精排、RAG 问答、Web / API 展示”的端到端链路。
针对长视频难定位、术语别名复杂和语义召回不稳定问题，设计术语归一化、Sparse + Dense 双路召回和 RRF 融合排序。
通过时间戳引用和原片段跳转机制，让用户能够回到视频具体片段验证答案来源，降低不可追溯回答带来的信任风险。
支持 FTS5 / 向量混合召回和离线全文检索降级，沉淀可迁移至企业培训视频、会议纪要、制度文档和内部知识库检索的方法论。
实现幂等入库、内容类型自动分类、手动修正和单元 / 接口烟测，提升系统可维护性。
在 11 名训练者小范围内测中，累计查询 1100+，Top-5 可用率 80%+，显著降低长视频和播客中的技术片段查找成本。

BJJ Video Search 项目页面截图 — BJJ Video Search 项目页截图

查看项目页

04 Agent Workflow / OCR / Rule Engine

AI 票夹

GitHub

发票散落在邮件里，有的是 PDF/XML 附件、有的藏在链接里、有的还得去某平台下载，每次整理都很麻烦。自己编排了个 Agent：规则做核心判断，LLM 抽取信息做处理，最后由我确认。原本只是做个人报销场景，最近全国在推发票抽奖，也派上了用场。

展开细节收起细节

搭建“专用邮箱收票、Gmail API 监听、附件 / 链接解析、OCR、规则引擎、本地归档、定时提醒”的端到端处理流程。
按发票形态设计分层解析策略：结构化 XML 优先，PDF 文本层其次，图片或扫描件调用 OCR，仅提供下载链接的邮件通过浏览器自动化获取发票文件。
针对抽奖，构建城市规则引擎，按活动城市、票面金额、开票时间、发票类型、购买方名称、销售方信息等维度判断参与条件。
将发票自动流转为待上传、疑似可参与、不可参与、待人工处理等状态，把 Agent 的不确定性转成用户可管理的任务队列。
采用“AI 辅助 + 确定性规则”的判断机制：LLM 用于异常解析、字段补全和解释，核心资格判断由规则引擎完成。
不替用户绕过官方渠道，提醒用户前往支付宝、云闪付、微信等官方渠道手动上传和抽奖，并采用本地归档和最小化字段存储降低隐私暴露。

查看项目页

05 Policy Intelligence / Source Governance

车险监管动态解析

行业里每天有大量监管、市场和同业动态，人盯不过来、全交给 AI 又怕错，所以做了一套评分体系和来源留痕 + 人工复核的流程，不错过重点影响资讯、每一条都可追溯。先在我自己的环境跑起来，小范围推送内部。

展开细节收起细节

设计“信息源监测、去重清洗、主题分类、AI 摘要、业务影响判断、人工复核、定向推送、知识库沉淀”的端到端链路。
沉淀车险政策关注主题和风险标签，覆盖费用监管、定价变化、新能源车险、理赔服务、消费者权益、同业动态和舆情风险等方向。
对外部来源进行风险分层，采用公开信息源白名单、发布时间 / 原文链接留痕、摘要化入库、人工复核和高风险来源降级处理。
支撑经营助手“问外部动态 / 问知识”场景，让外部动态能够进入总部与机构经营决策流程。

查看样例晨报

Experience

工作经历

2023.09 - 至今

某大型金融互联网公司｜智慧经营及风控审核 AI 产品

高级 AI 产品经理 2025 优秀员工

负责车险 AI 产品体系规划与落地，覆盖 Agent 产品建设、可信评估体系与 AI 运营推广机制。

2020.07 - 2023.09

某大型数字城市科技公司｜企业级数据产品与经营驾驶舱

产品主管（直管 5 人） 2020 优秀新航程 2021 最佳服务奖 2022 最佳服务奖

主导高管驾驶舱、营销驾驶舱、DMP / CDP、数据治理和数据智能顶层设计，覆盖管理层经营分析、用户增长和精准触达。

2018.09 - 2019.08

某大型跨国水处理集团｜数据平台产品

数据产品跨国业务经历

面向运营总览和业务汇报场景，完成数据需求、指标口径、报表和可视化方案设计，推动业务系统数据生产化。