北黄的学习成长路

发表于2024-09-27

理清BPE与tiktoken的关系——BPE是将文本拆分为子词的分词算法，tiktoken是OpenAI基于BPE实现的高性能分词工具，二者共同服务于大模型的文本Token化流程。

发表于2024-09-22|LLM|softmax

解析PyTorch对softmax函数的数值稳定性优化——通过减去最大值防止指数溢出，对比朴素实现与稳定实现的差异，理解log-sum-exp技巧在深度学习中的重要性。

系统梳理RAG优化手段——涵盖查询转换、分块策略优化、混合检索、重排序、上下文压缩等全链路优化技术，提升检索增强生成系统的准确性与相关性。

大模型领域核心术语速查手册——涵盖向量、张量、Embedding、Transformer、注意力机制、Tokenizer、微调、RLHF、RAG等数百个关键概念的简明解释。

从生产者、Broker、消费者三端分析Kafka消息丢失与重复消费的根因，给出唯一ID、幂等、手动提交偏移量、ACK=all等完整解决方案。

发表于2024-09-05|Kafka|死信队列

解析Kafka中死信队列的实现思路——通过创建独立死信Topic接收处理失败的消息，实现故障隔离、错误分析和数据修复，提升微服务架构的系统韧性。

发表于2024-09-01|CAP|服务发现•CAP

从CAP理论角度分析服务发现组件的选型——对比Zookeeper(CP)和Nacos/Eureka(AP)在一致性与可用性上的权衡，解释为什么服务发现场景更适合AP模型。

解析BFF（Backend For Frontend）模式——为不同前端提供专属后端聚合层，解决多端适配、接口膨胀和前后端耦合问题，适用于多终端微服务架构场景。

全面解析事件驱动架构（EDA）在微服务中的优势（松耦合、高扩展性、异步处理）与挑战（事件顺序、幂等性、调试复杂度），展望其与Serverless、Event Mesh的融合趋势。

解析CQRS命令查询职责分离模式——将读写操作拆分为独立模型，解决复杂业务中读写性能矛盾，适用于高并发读写、事件溯源和领域驱动设计等场景。