BOQIN.AI · 个人 AI 技术博客

以博学铸智 凭勤奋致远

专注于大语言模型(LLM)微调、智能体协同(Multi-Agent System)及语义检索的边界探索,在这里记录前沿研究与项目实践。

成长支柱

“博学、勤奋、AI” 不仅是我们的座右铭,更是技术深耕的基石

博学 · Erudition

广泛阅读与知识沉淀。紧跟 LLM 前沿研究,追踪 Transformer 与新兴架构(如 Mamba/RWKV),构建深度垂直领域的智能体知识图谱。

技术研究库检索:
已归档 12 篇 RL-based Agent 规划论文,核心结论包含:1. 引导策略梯度设计;2. 自主反思反馈环路...

勤奋 · Diligence

动手编码与实操实验。全天候维护个人 GPU 算力实验集群,不断进行模型微调、强化学习对齐(RLHF)、性能基准测试与实用的 Agent 开发。

集群运行时间: 24h 00m 00s
历史模型微调轮数: 48,291

智能 · AI Projects

理论转化为实用工具。开源多款智能体工作流与语义检索原型,使用自适应多智能体协同(Multi-Agent System)与逻辑推理自愈机制。

输入
反思
自愈
智能体流: 状态收敛且可自愈

最新技术文章

记录我们在人工智能架构设计、大模型微调和 Agent 落地应用中的深度思考与实践

2026-06-20 5 分钟阅读

深入浅出:从零构建多智能体协同(Multi-Agent)网络

在复杂任务场景中,单一 Agent 往往面临上下文瓶颈与推理深度受限的痛点。本文将剖析如何基于通信总线、角色划分和反思反馈机制构建一个高内聚、低耦合的多智能体协作系统原型。

Multi-Agent 架构设计
查看演示项目 →
2026-06-10 8 分钟阅读

以勤补拙:大模型微调中的自适应学习率调优实践

预训练模型微调(Fine-Tuning)对优化器策略高度敏感。本文从 PyTorch 自定义优化器模块切入,介绍如何通过检测历史梯度的夹角余弦相似度,自适应调节各网络层学习率的工程经验。

LLM 微调 PyTorch
查看相关代码 →
2026-05-28 6 分钟阅读

知识图谱与 RAG 的融合:如何让大模型具备领域知识

传统矢量检索在处理长程实体关联时经常发生幻觉。我们探索了结合 Neo4j 图数据库,利用混合检索(Hybrid Search)提升 LLM 语义准确性的实现方案,并对比了评测指标差异。

RAG 检索 知识图谱
查看检索演示 →

开源项目演示实验室

体验我们日常开发并开源发布的 AI 算法原型

分配任务给自适应协同智能体:

全舆情数据提取 空闲算力自调度

智能体状态推演轨迹:

展示多智能体在任务规划(Planning)、外部工具链调用(Action)以及交互反馈(Reflection)中的工作细节。

选择代码自愈与合成需求:

TS WebSocket网关 PyTorch自适应优化器

自愈合成器输出:

这里将输出通过 AST 静态编译和类型检查的代码,并展示潜在编译错误的自愈修正逻辑。

技术交流与探讨

如果您对大模型工程落地、Agent 系统开发有任何见解或合作意向,欢迎随时通过邮件与我们联系交流。

✉️ 联系邮箱:
🌐 博客镜像:www.boqinai.com
📍 运行环境:Linux / Nginx