← 博客
繁體中文 English 简体中文
Levi · LinkedIn

构建生产级AI系统

LLM应用、RAG Pipeline及文件智能 — 香港及中国大陆

我合作过的大多数企业都不缺数据。缺的是一套能够将数据转化为可执行信息的系统——而不需要每天有人手动逐份阅读。这就是我构建的东西。

LLM应用 RAG Pipeline 文件智能 香港 中国大陆 生产系统

我实际构建的东西

我是一名驻香港及中国大陆的独立AI工程师,专注于生产级LLM应用、RAG(检索增强生成)pipeline及文件智能系统。背景涵盖7年以上数据与分析工作经验、2年以上生产AI系统构建及部署经验,以及比利时Vlerick商学院商业分析与AI硕士学位。

我构建的系统是端对端的:数据摄取、LLM处理、检索架构、交付层及基础设施。不是原型——是有真实用户和真实运营要求的生产系统。

RAG Pipeline及文件问答

处理大量文件的机构——保单、报告、合同、备案——通常面临同一个瓶颈:信息存在但无法查询。找一个具体细节意味着要手动打开文件。

生产级RAG pipeline解决这个问题。文件被摄取、分块、嵌入并储存到向量数据库。结果是一个系统:用自然语言提问,可以从完整文件库中得到精确答案——无论文件数量或年份。

已在香港保险市场生产部署:跨多个保险公司的PDF摄取、通过pgvector的语义检索,以及用于跨文件比较查询的对话界面。

定期数据Pipeline及自动摘要

同样的底层架构——定期摄取、LLM处理、结构化输出——适用于定期监控及摘要信息来源。可配置输入、相关性过滤、通过Telegram或电邮交付。Pipeline按计划运行,输出无需人工介入。

适用于任何目前有人手动阅读来源并写摘要的场景。

记忆型AI系统

我也构建上下文持久性重要的AI应用——记住用户历史、从互动中学习、在推理时检索相关先前上下文。

HKSoka(hksoka.com/cn)是一个由Claude驱动的对话平台,由我端对端设计及构建。其核心差异化在于多层RAG记忆架构:

种子记忆对话开始时注入的长期用户上下文
学习记忆通过AWS Lambda自动从对话中提取并嵌入的事实,经pgvector检索
自动关键记忆高重要性事实的后台晋升机制,确保始终注入
技术规格双语内容、150K context window token管理、Vercel serverless + Neon PostgreSQL + AWS Lambda

此架构适用于任何跨对话连续性重要的业务场景——客户关系管理、持续咨询工作流程或知识库助手。

基础设施及部署

生产系统需要的不只是好的模型调用。我构建的基础设施包括:

计算AWS Lambda异步嵌入pipeline,与serverless函数解耦以避免超时限制
编排EventBridge定期任务编排
数据库Neon PostgreSQL + pgvector语义检索
模型Claude及生产级LLM API
应用层Vercel serverless部署及API托管
通知Telegram实时告警及定时通知
合规审计日志及审核层(按需求)

我也构建并维护过一个生产级ML交易pipeline,包含自动信号生成、多种子验证及AWS实时部署——包括从数据摄取到模型部署的完整基础设施所有权。

合作模式

项目制合作。交付物在开始前清晰界定范围。交付可运行的系统,不是PPT。

欢迎希望自动化文件工作流程、构建内部知识库、或将LLM工具部署到现有业务的企业洽谈范围。

联系:smartai.hk+ai.consulting@proton.me
LinkedIn:linkedin.com/in/levi-innovation

Levi是驻香港的独立AI工程师,为金融服务及专业服务行业的企业构建生产级LLM应用、RAG pipeline及文件智能系统。

联系洽谈 →