Team Projects
公司项目
工作中的 AI、经营分析、核保风控与数据产品相关项目。
01
RAG / 经营归因 / 核保审核 / 可信评估
车险智能助手
面向总分车险经营及核保人员,搭建了经营调度、核保审核风控2个agent
有意思的地方在于,我主导探索了经营分析 Agent Harness 的落地实践, 跟随前沿研究与行业讨论,在企业实际土壤中碰壁。最后分层架构定为:LLM 负责意图理解和顶层路由,确定性分析流程做 workflow 编排,非确定性归因用 ReAct 循环驱动维度下钻定位根因。计算与判断逻辑封装为函数调用,再加一层脚本化后置校验兜底。让对的模块做对的事,反而是最难也最关键的设计判断。
AI 替代率
22.4%
风控减损
3.4亿
释放工作量
249人
回答正确率
80.7%
展开细节
收起细节
- 面向总分车险经营及核保人员,解决经营分析依赖人工拉数、指标口径不统一、归因链路不可追溯,以及核保资料审核人工成本高、风险识别前置不足等问题。
- 经营侧梳理 3 大类 7 个归因场景、280+ 经营指标、176 个组合维度和 2500+ 份知识,建设指标语义层、归因分析能力、RAG 知识库和引用溯源链路。
- 支持“自然语言提问 → 指标 / 知识召回 → 归因推理 → 结论输出 → 人工复核 / 任务跟进”的闭环,让经营问题从查询走向可追溯诊断。
- 核保侧将高频重复审核事项转化为“资料上传 - 审核引擎 - 审批结果”的产品链路,AI 处理资料质量、图片溯源、GPS 鉴真和一致性判断,由核保人兜底复杂判断。
- 建立测试集、验收标准、低置信度转人工、Bad Case 闭环和高风险核保人工复核机制,控制 AI 输出边界,支撑生产场景上线。
- 全国推广后,整体经营 / 核保岗位 AI 替代率 22.4%,等效释放 249 人工作量;经营问题覆盖率 82.1%、正确率 80.7%;替代核保岗位 60.4% 工时,累计拦截疑似欺诈 / 高风险单 32 万,按风控口径减损 3.4 亿。
02
Deep Agent / 经营分析 / 人机协同
机构车险部经理分身
面向机构车险部经理,设计机构侧 AI 经营分析执行 Agent。它更偏机构本地经营执行中枢,基于 Deep Agent 架构串起目标理解、任务拆解、分析判断、策略生成和执行跟踪。
展开细节
收起细节
- 接入多源上下文,将机构经营专家判断沉淀为可复用规则与模板,已在 3 家机构部署,可替代初中级分析师 78% 工作。
- 将日报生成、取数清洗、邮件草稿等确定性任务封装为标准 Workflow,归因下钻、异常探索等开放性任务交由 ReAct 子流程。
- 设计任务路由、Workspace、工具网关与数据语义映射模块,支持对接机构前置库、外购数据与 Excel 等多源数据。
- 将分析结果转化为“策略生成 → 起草督导 → 收集反馈 → 汇总复盘”的执行链路,并把邮件、表单、系统取数、浏览器自动化等能力封装为分级管控工具。
- 将机构差异化诉求抽象为“总部标准方法论 + 机构本地专家包”的产品模式,打造明星车险部经理分身,支撑多机构快速复制与能力扩展。
03
经营监控 / 预警纠偏 / 复盘
经营管理闭环与高管驾驶舱
将经营总览、KPI、预警纠偏、待办追踪和复盘决策产品化,让管理动作从线下推动转为线上闭环。
展开细节
收起细节
- 围绕经营异常预警、纠偏发起、处理反馈、时光轴复盘和管理决策建立产品链路。
- 引入 AI 总结与时光轴展示,为后续策略建议和管理动作推荐沉淀过程数据。
- 系统累计发起纠偏 2166 次,沉淀经营策略 157 条,帮助总部 / 机构形成线上化复盘与追踪习惯。
04
AI 产品运营 / 智能体生态
AI 转型与推广
主导 AI 转型机制,从产品专区、智能体武器库到机构 AI 声音,把 AI 项目推广、反馈、案例和复用纳入统一运营闭环。
展开细节
收起细节
- 牵头AI运营推广小组(跨团队5人),搭建本事业群的 AI 产品运营与复用机制——案例库、Agent 复用平台、培训宣贯与机构督办
- 横向拉通 12 个 AI 项目,统一呈现业务价值、机构排名、优秀 Agent 和学习案例。
- 组织 AI 相关培训及分享近 20 场,推动个群内部 AI 应用的学习和落地。
- 沉淀 230 条机构 AI 声音,声音解决率 87.6%,将一线反馈转为迭代策略。
- 沉淀 53 个优秀案例,案例学习量达 1w,推动机构间学习和复用。
05
DMP / CDP / 营销驾驶舱
客户数据与营销智能化平台
打通媒体投放、埋点、私域转化、人群标签和客户画像链路,把客户数据平台做成增长和经营分析底座。
展开细节
收起细节
- DMP 试点降低获客成本 35%,提升线索转化率 15%。
- 营销驾驶舱减少重复指标约 100 个、减少营销套表 5 套、节约费用约 100 万元。
- 参与 CDP 与腾讯共创,覆盖 OneID、标签画像、人群细分和数据治理。
Side Projects
个人项目
都是从生活里的某个真实痛点出发,用 Claude Code / Codex vibe coding 边聊边搭。
01
Chrome Extension / Prompt Regression / Eval Board
把页面上下文读取、评测用例生成、平台结果导入、Judge 判定和历史看板串成浏览器侧边栏里的 Prompt 回归验证流程。
展开细节
收起细节
- 面向内部 Agent 开发中 Prompt 调试记录散落、测试批次与平台结果难追溯、Prompt 改动后难以快速回看效果变化等问题,设计嵌入浏览器侧边栏的轻量评测工具。
- 串联“读取当前页面上下文 - 生成 E1/E2/E3 评测用例 - 导入平台结果 - 触发 Judge 判定 - 沉淀历史看板与证据”的端到端工作流,贴合 Agent 工程师日常开发节奏。
- 覆盖 Agent 上下文、Prompt、input schema 读取,并支持任务型 / 对话型 Agent 模板,让评测用例能跟随不同 Agent 形态快速生成。
- 支持 Excel / CSV / JSON / HTML 表格等结果格式、输出列识别、结果行匹配、平台失败 / 空输出隔离和 Judge 返回解析,降低导入和判定过程里的人工校验成本。
- 在内部 20+ 个 Agent 试用中累计沉淀 100+ 次评测 run,支撑 Prompt 调整前后通过率对比和失败归因;本地 verify 覆盖 349 个 Node 单测、核心 smoke、验收 smoke、扩展包检查、语法检查和 JSON 校验。
提示词测试插件 Prompt Eval 首页截图
02
AI Coding Workflow / Remote Approval / Agent Watchdog
Codex Beeper / Codex 传呼机
GitHub
我用 Codex 时有一个很具体的离桌断点:官方 remote 不稳定且无成熟解决方案,而 GitHub 上类似项目又偏重,更像通用聊天中控或完整远程控制平台。但我需要的是轻量能力:任务跑起来后,人不可能一直守在电脑前,完成结果、权限审批和异常都会卡在本机。所以我依托微信 OpenClaw 的 channel 和官方 daemon 做了这个工具,只在完成、审批、异常时叫我,并支持引用通知续写同一个 thread。后续将演进成 Agent Watchdog,服务多 Agent 切换和审批场景。
展开细节
收起细节
- 面向 Codex Desktop / CLI 用户,聚焦长耗时 AI 编程任务中的完成通知、权限审批、异常提醒和上下文续写,不做大而全的聊天中控。
- 基于 Codex Stop hook、app-server JSON-RPC 与微信 OpenClaw / iLink channel,实现完成通知、引用通知续写同一 thread、远程审批和本地 watchdog 自愈。
- 通过 SQLite 持久化通知、入站消息、hook 队列和 context token,配合 sender 串行队列、turn timeout / interrupt、stale token 诊断与未送达重试,降低远程协作中的丢消息和卡死风险。
- 默认 owner-only、本地运行、无公网 webhook;微信端只能选择配置过的项目别名,不能传任意本机路径,敏感操作保留审批和边界提示。
- 后续计划从“Codex 传呼机”演进为 Agent Watchdog,覆盖多 Agent 任务状态监控、切换、审批和异常接管。
03
Hybrid Retrieval / Reranker / RAG
BJJ Video Search
我是一名巴西柔术练习者,参加职业竞技曾获23年、24年AJP中国区冠军。这个领域存在大量的长视频、长播客,我每次想回看某个动作都得在一小时的视频里翻半天。因此做了个时间戳级别的视频检索项目,把教程、字幕、术语别名、技术标签和时间戳片段转化为可检索、可引用、可问答的知识库。
累计查询
1100+
Top-5 可用率
80%+
展开细节
收起细节
- 搭建“字幕采集、VTT 解析、时间戳 chunk、标签抽取、混合召回、Reranker 精排、RAG 问答、Web / API 展示”的端到端链路。
- 针对长视频难定位、术语别名复杂和语义召回不稳定问题,设计术语归一化、Sparse + Dense 双路召回和 RRF 融合排序。
- 通过时间戳引用和原片段跳转机制,让用户能够回到视频具体片段验证答案来源,降低不可追溯回答带来的信任风险。
- 支持 FTS5 / 向量混合召回和离线全文检索降级,沉淀可迁移至企业培训视频、会议纪要、制度文档和内部知识库检索的方法论。
- 实现幂等入库、内容类型自动分类、手动修正和单元 / 接口烟测,提升系统可维护性。
- 在 11 名训练者小范围内测中,累计查询 1100+,Top-5 可用率 80%+,显著降低长视频和播客中的技术片段查找成本。
BJJ Video Search 项目页截图
查看项目页
04
Agent Workflow / OCR / Rule Engine
发票散落在邮件里,有的是 PDF/XML 附件、有的藏在链接里、有的还得去某平台下载,每次整理都很麻烦。自己编排了个 Agent:规则做核心判断,LLM 抽取信息做处理,最后由我确认。原本只是做个人报销场景,最近全国在推发票抽奖,也派上了用场。
展开细节
收起细节
- 搭建“专用邮箱收票、Gmail API 监听、附件 / 链接解析、OCR、规则引擎、本地归档、定时提醒”的端到端处理流程。
- 按发票形态设计分层解析策略:结构化 XML 优先,PDF 文本层其次,图片或扫描件调用 OCR,仅提供下载链接的邮件通过浏览器自动化获取发票文件。
- 针对抽奖,构建城市规则引擎,按活动城市、票面金额、开票时间、发票类型、购买方名称、销售方信息等维度判断参与条件。
- 将发票自动流转为待上传、疑似可参与、不可参与、待人工处理等状态,把 Agent 的不确定性转成用户可管理的任务队列。
- 采用“AI 辅助 + 确定性规则”的判断机制:LLM 用于异常解析、字段补全和解释,核心资格判断由规则引擎完成。
- 不替用户绕过官方渠道,提醒用户前往支付宝、云闪付、微信等官方渠道手动上传和抽奖,并采用本地归档和最小化字段存储降低隐私暴露。
AI 票夹项目页截图
查看项目页
05
Policy Intelligence / Source Governance
车险监管动态解析
行业里每天有大量监管、市场和同业动态,人盯不过来、全交给 AI 又怕错,所以做了一套评分体系和来源留痕 + 人工复核的流程,不错过重点影响资讯、每一条都可追溯。先在我自己的环境跑起来,小范围推送内部。
展开细节
收起细节
- 设计“信息源监测、去重清洗、主题分类、AI 摘要、业务影响判断、人工复核、定向推送、知识库沉淀”的端到端链路。
- 沉淀车险政策关注主题和风险标签,覆盖费用监管、定价变化、新能源车险、理赔服务、消费者权益、同业动态和舆情风险等方向。
- 对外部来源进行风险分层,采用公开信息源白名单、发布时间 / 原文链接留痕、摘要化入库、人工复核和高风险来源降级处理。
- 支撑经营助手“问外部动态 / 问知识”场景,让外部动态能够进入总部与机构经营决策流程。
车险监管样例晨报截图
查看样例晨报