Agent篇(3):从System 1直觉到System 2逻辑——认知架构与工具协议的演进
Agent认知架构演进——从System 1快速直觉到System 2深度推理,解析工具协议从Function Calling到ReAct的思维模式升级。
Agent篇(2):Agent的“熔断降级”:在LLM频繁异常的时代,如何构建高可用的AI软件系统
AI系统高可用设计——面对LLM频繁超时、幻觉等异常,通过熔断降级、重试退避、Fallback策略构建健壮的Agent软件系统。
Agent篇(1):从单体到微服务:LLM应用的服务化架构演进之路
Agent架构演进之路——从单体LLM应用到微服务化架构,解析AI应用的服务拆分策略、API网关设计与模型服务编排的工程实践。
LLM篇(5):多模态的“融合之道”:从CLIP到LLaVA-NeXT,构建能“看”会“听”的下一代AI
多模态融合之道——从CLIP视觉-语言对齐到LLaVA-NeXT视觉指令微调,构建能看会听的下一代多模态AI系统。
LLM篇(4):解构模型推理的“速度与激情”——从vLLM到TensorRT-LLM的极限优化
模型推理极限优化——从vLLM的PagedAttention到TensorRT-LLM的算子融合,解构KV Cache、连续批处理等推理加速核心技术。
LLM篇(3):为模型注入“灵魂”:深度解析RLHF、RLAIF与DPO,构建更安全、更有用的AI
为模型注入灵魂——深度解析RLHF人类反馈强化学习、RLAIF AI反馈学习与DPO直接偏好优化三大对齐技术,构建更安全有用的AI。
LLM篇(2):不止是LoRA:企业级大模型微调的“炼金术”与“避坑指南”
企业级大模型微调炼金术——不止LoRA,深入对比Full Fine-tuning、Adapter、Prefix-tuning等方案,附数据准备、超参调优与常见避坑指南。
LLM篇(1):从混沌到智慧:解读大模型生命周期——预训练、微调、对齐与部署的系统性思考
LLM生命周期系统性解读——从预训练的数据与算力工程、SFT微调策略到RLHF对齐与模型部署,构建大模型从训练到上线的完整认知体系。
RAG篇(10):Agentic RAG的黎明:当RAG拥有“规划”能力,从“问答机”到“研究助理”的进化
Agentic RAG的黎明——当RAG拥有自主规划和多步推理能力,从被动问答机进化为主动研究助理。
RAG篇(9):RAG的“进化飞轮”:从自动化评估(RAGAs)到人工反馈闭环(Human-in-the-loop)
RAG的进化飞轮——基于RAGAs框架的自动化评估体系与Human-in-the-loop人工反馈闭环,驱动RAG系统持续优化。


