← 博客
繁體中文 English 简体中文
Levi · LinkedIn

建構生產級AI系統

LLM應用、RAG Pipeline及文件智能 — 香港及中國大陸

我合作過嘅大多數企業都不缺數據。缺的是一套能夠將數據轉化為可執行資訊嘅系統——而不需要每天有人手動逐份閱讀。這就是我建構嘅東西。

LLM應用 RAG Pipeline 文件智能 香港 中國大陸 生產系統

我實際建構嘅嘢

我係一名駐香港及中國大陸嘅獨立AI工程師,專注生產級LLM應用、RAG(檢索增強生成)pipeline及文件智能系統。背景涵蓋7年以上數據與分析工作經驗、2年以上生產AI系統構建及部署經驗,以及比利時Vlerick商學院商業分析與AI碩士學位。

我構建嘅系統係端對端:數據攝取、LLM處理、檢索架構、交付層及基礎設施。唔係原型——係有真實用戶同真實運營要求嘅生產系統。

RAG Pipeline及文件問答

處理大量文件嘅機構——保單、報告、合約、備案——通常面臨同一個瓶頸:資訊存在但無法查詢。找一個具體細節意味著要手動打開文件。

生產級RAG pipeline解決呢個問題。文件被攝取、分塊、嵌入並儲存到向量數據庫。結果係一個系統:用自然語言提問,可以從完整文件庫中得到精確答案——無論文件數量或年份。

已在香港保險市場生產部署:跨多個保險公司嘅PDF攝取、通過pgvector嘅語義檢索,以及用於跨文件比較查詢嘅對話介面。

定期數據Pipeline及自動摘要

同樣嘅底層架構——定期攝取、LLM處理、結構化輸出——適用於定期監控及摘要資訊來源。可配置輸入、相關性過濾、通過Telegram或電郵交付。Pipeline按計劃運行,輸出無需人工介入。

適用於任何目前有人手動閱讀來源並寫摘要嘅場景。

記憶型AI系統

我亦構建上下文持久性重要嘅AI應用——記住用戶歷史、從互動中學習、在推理時檢索相關先前上下文。

HKSoka(hksoka.com)係一個由Claude驅動嘅對話平台,由我端對端設計及構建。其核心差異化在於多層RAG記憶架構:

種子記憶對話開始時注入嘅長期用戶上下文
學習記憶通過AWS Lambda自動從對話中提取並嵌入嘅事實,經pgvector檢索
自動關鍵記憶高重要性事實嘅後台晉升機制,確保始終注入
技術規格雙語內容、150K context window token管理、Vercel serverless + Neon PostgreSQL + AWS Lambda

此架構適用於任何跨對話連續性重要嘅業務場景——客戶關係管理、持續諮詢工作流程或知識庫助手。

基礎設施及部署

生產系統需要的不只係好的模型調用。我構建嘅基礎設施包括:

運算AWS Lambda異步嵌入pipeline,與serverless函數解耦以避免超時限制
編排EventBridge定期任務編排
數據庫Neon PostgreSQL + pgvector語義檢索
模型Claude及生產級LLM API
應用層Vercel serverless部署及API託管
通知Telegram實時告警及定期通知
合規審計日誌及審核層(按需求)

我亦構建並維護過一個生產級ML交易pipeline,包含自動信號生成、多種子驗證及AWS實時部署——包括從數據攝取到模型部署嘅完整基礎設施所有權。

合作模式

項目制合作。交付物在開始前清晰界定範疇。交付可運行嘅系統,唔係PPT。

歡迎希望自動化文件工作流程、構建內部知識庫、或將LLM工具部署到現有業務嘅企業洽談範疇。

聯絡:smartai.hk+ai.consulting@proton.me
LinkedIn:linkedin.com/in/levi-innovation

Levi係駐香港嘅獨立AI工程師,為金融服務及專業服務行業嘅企業構建生產級LLM應用、RAG pipeline及文件智能系統。

聯絡洽談 →