北黄的学习成长路

Agent认知架构演进——从System 1快速直觉到System 2深度推理，解析工具协议从Function Calling到ReAct的思维模式升级。

AI系统高可用设计——面对LLM频繁超时、幻觉等异常，通过熔断降级、重试退避、Fallback策略构建健壮的Agent软件系统。

Agent架构演进之路——从单体LLM应用到微服务化架构，解析AI应用的服务拆分策略、API网关设计与模型服务编排的工程实践。

发表于2025-02-02|LLM

多模态融合之道——从CLIP视觉-语言对齐到LLaVA-NeXT视觉指令微调，构建能看会听的下一代多模态AI系统。

发表于2025-01-29|LLM

模型推理极限优化——从vLLM的PagedAttention到TensorRT-LLM的算子融合，解构KV Cache、连续批处理等推理加速核心技术。

发表于2025-01-22|LLM

为模型注入灵魂——深度解析RLHF人类反馈强化学习、RLAIF AI反馈学习与DPO直接偏好优化三大对齐技术，构建更安全有用的AI。

发表于2025-01-17|LLM

企业级大模型微调炼金术——不止LoRA，深入对比Full Fine-tuning、Adapter、Prefix-tuning等方案，附数据准备、超参调优与常见避坑指南。

发表于2025-01-10|LLM

LLM生命周期系统性解读——从预训练的数据与算力工程、SFT微调策略到RLHF对齐与模型部署，构建大模型从训练到上线的完整认知体系。

发表于2025-01-06|大模型工程RAG

Agentic RAG的黎明——当RAG拥有自主规划和多步推理能力，从被动问答机进化为主动研究助理。

发表于2025-01-03|大模型工程RAG

RAG的进化飞轮——基于RAGAs框架的自动化评估体系与Human-in-the-loop人工反馈闭环，驱动RAG系统持续优化。