马丁 Martin
河北 · 保定
个人信息
  • Martin / 马丁 / 男 / 1988
  • 工作年限: 13
  • 教育情况: 本科 / 教育 / 初等教育/计算机教育
  • 海外远程经验(北美、澳洲)
  • 倾向前端/全栈 主攻:AI 应用落地(RAG/多模态/Agent)、在线协作、教育/医疗场景
城市
河北 · 保定
电话 / 微信
15201114387
邮箱
403028240@qq.com
技能清单
  • 开发语言: Javascript/node.jsTypescript PHP Python Ruby on rails Swift
  • 系统架构设计: 微服务架构 分布式系统 异步架构 高并发设计 分层架构 事件驱动 流式处理 性能优化
  • AI应用技术: 托管 RAG 平台架构 LangChain LangGraph LlamaIndex RAGFlow 语义意图识别 Query 扩写与增强检索 海量文档索引 PDF/视频 OCR 管线 Prompt Engineering AI Agent 多模态 AI (图/表/公式) 语音识别 (Whisper)
  • vector & embedding: pgvector ChromaDB Pinecone 混合检索 (向量+BM25/FTS) RRF融合 Cross-Encoder Rerank RAG Triad 评测
  • 前端: React next.js React Native Meteor Fabricjs Excalidraw React Flow Canvas/SVG Vue3jQueryApollo Clienttaro
  • ui: MuiTailwind Ant Design Element ui taro ui Vant
  • 后端框架: FastAPI Express NestJS Laravel ThinkPHP SQLAlchemy
  • 云服务 & 基础设施: AWS (S3, Lambda) 阿里云 (ECS, NLS) 腾讯云 (ECS, RDS) Supabase CloudFlare R2 Docker Docker Compose
  • 实时同步技术: YJS webSocket
  • 支付: Stripe 微信,支付宝相关接口
  • 数据库与缓存: PostgreSQL MySQL MongoDB Redis Memcache Kafka 连接池优化
  • 状态管理: zustand Redux context
  • 工具: gitcomposeryarn npm Postman
  • 项目管理: github (海外项目) coding (国内和自己的项目) jira
  • 测试工具: ones qunit jest
  • 开发IDE: cursor vscode
自研项目
  • Memorix — 工业级托管多模态 RAG 平台(重点自研) FastAPI Next.js PostgreSQL/pgvector BYOK 多模态 RAG

    定位:面向第三方应用与企业平台的云端 RAG 基础设施——上传即索引、API 即召回;存储/索引/检索由平台托管,LLM 生成全程 BYOK,模型费用与厂商选型完全由租户掌控。

    系统架构:索引与在线检索分离(异步 Worker 负责解析→增强→切分→向量化→可选图谱抽取;API 无状态)。多租户隔离(Project → Collection → Document),REST /v1 + 控制台 Playground 同源能力;Embedding / Chat / OCR / Rerank / VLM 五轨独立配置。

    文档理解(对标工业级 PDF RAG):版面级 Content List 解析(可选 MinerU 风格 JSON);扫描页 OCR + 图/表/公式分通道与 VLM 上下文感知增强;语义断点切分 + 10%–20% token 重叠(段落优先、固定 token 兜底);中文 PDF 跨页拼接与页眉页脚/广告/目录去噪;索引期 LLM 知识图谱实体关系抽取,检索期实体命中加分。

    检索链路优化(解决「本地 Demo 准确率高、线上用户仅 ~60%」):

    • Query 扩写 + 防幻觉:小模型生成多路同义问句并行召回;改写结果经 Embedding 余弦相似度校验(阈值 ≥0.8),低于阈值废弃,避免扩写幻觉带偏检索。
    • 混合检索:pgvector 语义召回 + Postgres 全文(BM25/FTS)+ RRF 融合,解决向量与关键词量纲不可直接相加的问题。
    • 策略路由 Rerank:简单问句走毫秒级启发式排序;复杂问句才触发租户 Cross-Encoder(~200ms/条),兼顾高并发 P99 与长难问准确率。
    • 评测闭环:Playground 与 API 返回 meta(扩写变体、图谱命中、Rerank 来源);RAG Triad 拆分 Context Recall(检索是否找对)与 Faithfulness(生成是否忠实上下文),启发式 + LLM 保守评分。

    技术栈:Python/FastAPI, SQLAlchemy, Alembic, Next.js/TypeScript, Supabase Auth/Storage, pgvector, Redis, Docker;融合 RAG-Anything 多模态管线思路并自研混合检索与租户级可观测。

    官网地址:https://memorix-frontend-production-5f55.up.railway.app/

  • HyperGPT: next.js express Langchain Openai GLM deepseek

    chatbot ai,自用且部分企业用户在使用

    git: https://github.com/m3360202/HyperGPT

    线上:http://hypergpt.aliensoft.com.cn/

  • MathLibrary: python express latex2mathml chromadb Langchain pypandoc

    数学公式,知识图谱,题目文档提取并转译到向量数据库的案例

    git: https://github.com/m3360202/mathLibrary

  • GptService: expressLangchain nodejs

    使用langchain/langgraph集成claude gork openai等接口

    git: https://github.com/m3360202/HyperGPT

  • CanvasX: Fabric js

    git: https://github.com/m3360202/HyperGPT

    npm: https://www.npmjs.com/package/martin-fabric

工作经历
AI智能白板协作系统 (AI + Excalidraw) 2025.12 - 至今 (兼职)
  • 项目概述:基于 Excalidraw + React Flow 的无限画布协作平台,以画布 Card 为知识载体,深度集成 LLM 与 RAG,支撑「拖入资料 → 对话检索 → 可视化产出」一体化工作流。
  • 画布 Card 与多源摄入:在画布上挂载 PDF、Markdown、链接等 Card 组件,统一触发云端解析与索引;用户可在 Card 上下文中直接提问,引用定位回具体文档与页码。
  • PDF / YouTube OCR 识别:对接 OCR 与字幕/文稿抽取管线,将扫描页 PDF、YouTube 视频内容结构化为可检索文本,解决「非纯文本素材无法问答」的痛点。
  • 海量文档增强检索:单画布支持批量导入上千份资料,结合 RAGFlow / 向量知识库做 Query 扩写、混合召回与重排,在超大文档集上稳定召回高相关片段。
  • 语义意图识别:对用户自然语言做意图分类与 Query 增强(绘图指令 vs 知识问答 vs 总结提炼),路由到不同 AI 能力,降低误触发与检索跑偏。
  • 画布渲染与智能交互:Canvas/SVG 海量元素性能优化;AI 自动排版、思维导图生成、流程图智能连线等,提升协作创作效率。
  • 技术栈:React/TypeScript, Excalidraw, React Flow, Fabric.js, RAGFlow, LLM API, OCR, 向量检索, WebSocket/YJS
AI智能模拟面试系统 2025.7 - 至今 (兼职)
  • 项目概述:开发面向日本用户的AI驱动模拟面试应用,集成大语言模型、语音识别和多维度智能评估系统
  • AI对话引擎:基于GPT-4o和Deepseek构建智能面试官,实现上下文感知的多轮对话生成。设计动态Prompt工程,支持基础/高级/企业定制三种模式,通过流式响应优化用户体验和API成本
  • 多模态AI集成:集成OpenAI Whisper和阿里云NLS实现日语语音识别,开发视频分析模块提取非语言特征(面部表情、肢体动作),结合语音和视觉数据进行综合评估
  • 智能评估系统:设计6-7维度AI评估框架,使用Anthropic和GPT-4o进行结构化评估,优化LLM调用策略将多轮评估合并为单次调用,降低延迟60%以上
  • 架构优化:基于FastAPI构建异步后端,通过Redis缓存和连接池优化提升响应速度,设计分段式流程平衡实时性与资源消耗
  • 技术栈:GPT-4o, Deepseek, Anthropic Claude, OpenAI Whisper, 阿里云NLS, Python/FastAPI, SQLAlchemy, Redis, PostgreSQL, React Native, TypeScript, Prompt Engineering
心镜 · 情感健康分析平台 2025.1 - 2026.4 (自研桌面端)
  • 项目概述:面向情感咨询场景的 SaaS,基于用户聊天记录做亲密关系洞察,衔接「AI 初诊 → 深度报告 → 真人咨询」商业闭环。
  • RAG 检索:按对话事件(冲突、情感转折等)切分,构建微观/中观/宏观三层向量索引,在有限上下文内为 LLM 供给高信噪比素材。
  • 数据与产品:逆向解析微信/TXT/CSV 等聊天导出格式;结合用户画像(性格、依恋类型)做多维分析;支持多风格 AI 分析师与定制化报告。
  • 技术栈:Python/FastAPI, LangChain, LlamaIndex, GPT-4/Qwen, React/TypeScript, Swift/iOS, ChromaDB, PostgreSQL, Redis, Docker
ThirdpartAi(AI短剧自动生成系统) 2025.3 - 2025.7
  • 负责AI短剧生成平台的前端架构与核心功能开发,基于MUI组件库与YAML配置驱动实现动态界面生成
  • 视频生成无限画布:开发基于 Fabric.js 和 Canvas 的可视化视频剧情编排器,支持拖拽式场景管理、角色关系配置与时间轴轨道编辑,自动生成剧本结构及分镜脚本
  • 集成Runway/fal.ai等多模态AI模型,通过Python后端服务实现角色生成、语音合成及场景构建功能
  • 构建端到端视频生成流水线,协调文本到语音(TTS)、图像生成到视频合成的完整AI工作流
  • 实现基于提示词工程的角色一致性保持技术,确保多镜头下人物特征与场景风格的统一性
Stey 智能酒店项目(线上短期) 2024.10 - 2025.2
  • 担任大前端工程师,负责智能酒店项目的前端开发,利用Next.js和Tailwind CSS构建高性能的响应式网页。
  • 实现复杂的页面动态效果和流畅的用户交互体验,提升用户满意度。
  • 设计并优化支付流程,确保交易安全性与便捷性,减少用户操作步骤。
  • 与后端团队紧密协作,通过RESTful API进行数据交互,保障前后端数据一致性。
  • 参与项目架构讨论,提出多项优化建议并被采纳,有效提升开发效率和系统稳定性。
BOARDX.US (在线无限画布协作平台) 2022.3 - 2024-12
  • 核心前端架构:利用 React 和 Fabric.js 深度定制开发了高性能的在线交互式无限画布设计平台,支持海量矢量图形与富文本编辑。
  • AI智能辅助:集成大语言模型,实现了基于自然语言的智能设计辅助与图形生成功能。
  • 复杂交互与性能优化:针对 Canvas 渲染和 SVG 导出进行了深度性能优化,确保在不同设备和复杂场景下的流畅体验。
  • 使用实时同步技术如 Socket.io 与 YJS,确保多用户能够低延迟实时协作。
  • 设计和实现了RESTful API,为前端提供稳定的数据接口。
  • 使用MySQL和Redis进行数据存储和缓存,提高系统响应速度。
  • 实现了用户权限管理和数据安全机制。
保定微工坊网络科技有限公司 2012.11 - 2022.3
  • 爱情Living社区商城
    • 负责社区电商平台的整体架构设计与研发管理,采用Vue3+Java技术栈
    • 引入Kafka消息队列应对节假日高峰流量,确保系统高可用性和订单处理稳定性
    • 实现用户社区互动、商品交易、订单管理一体化功能,提升用户粘性和转化率
  • 长城人内购商城
    • 开发长城汽车员工内购平台,基于Vue3前端架构和Java后端服务
    • 设计并实现员工身份认证、特权商品展示、内购订单管理等核心业务功能
    • 通过分布式架构和负载均衡技术,保障大并发访问下的系统性能
  • 长城Fans福利商城
    • 构建员工福利积分兑换平台,采用Vue3+Java技术体系
    • 实现积分管理、福利商品兑换、订单跟踪等核心功能模块
    • 优化用户积分消费流程,提升员工福利体验和参与度
  • 蓝梦谷校园商城
    • 负责Taro跨端开发框架的应用与优化,实现一套代码多端发布
    • 基于Laravel后端架构,提供稳定的API服务和业务逻辑处理
    • 针对校园场景特色,开发专属商品推荐和校园活动功能模块
  • TouchHealth健康项目
    • 自主研发智能健康设备配套应用,集成微信智能硬件接口
    • 设计直观的健康数据可视化界面,帮助用户理解身体状况
    • 与硬件团队深度协作,确保软件与硬件设备无缝对接和数据同步
  • 技术管理与优化
    • 推行敏捷开发流程,使用GitHub和Coding进行版本控制和团队协作
    • 通过代码重构和数据库优化,显著提升系统性能和响应速度
    • 建立完整的测试体系,包括接口测试和性能测试,保障交付质量
    • 引入容器化部署,提升系统稳定性和部署效率至99.9%
腾讯科技(北京) 2010.10 - 2012.10
  • 担任新媒体技术支持,参与腾讯视频多个大型直播项目,保障千万级用户流畅观看体验。
  • 优化内容分发网络(CDN),有效降低视频加载延迟,提升播放成功率。
  • 与产品团队紧密配合,快速迭代功能,满足市场需求。
  • 参与内部技术沙龙,分享前沿技术动态,促进团队技术氛围。
 
冀ICP备13008594号-1