沐风的博客

在无限的平面上，机器人最初位于 (0, 0) 处，面朝北方。注意: 机器人可以接受下列三条指令之一：机器人按顺序执行指令 instructions，并一直重复它们。只有在平面中存在环使得机器人永远无法离开时，返回 true。否则，返回 false。示例 1：输入：instructions = "GGLLGG" 输出：true 解释：机器人最初在(0,0)处，面向北方。 “G”:移动一步。位置:(0,1)方向:北。 “G”:移动一步。位置:(0,2).方向:北…

2026年8月1日 0条评论 9点热度 0人点赞 MuWinds 阅读全文

一面：面试问项目啥的直接跳过，说说问的技术问题：这个问题我当时答得磕磕绊绊的，只说了有个 local storage 然后还会保存一些 css 这种信息用来提高多次加载的速度以外没回答出什么。正常的回答如下：除了 Cookie，现代浏览器在本地存储的信息非常丰富，涵盖了网页应用数据、用户浏览偏好、网络缓存以及安全凭证等多个维度。按用途和技术架构，主要可以分为以下几大类： 1. Web 存储机制（Web Storage & Databases）这些是前端开发者用来在本地存储应用数据的技术，存取容量远…

2026年8月1日 0条评论 55点热度 0人点赞 MuWinds 阅读全文

最近开始使用 pi 的 coding agent，发现没法通过 shift+tab 来调整 effort level 到 xhigh 和 max，pi 的 settings 里也没有让 pi 自己解决，很快就好了直接把 thinkingLevelMap 放在模型对象下，并且在 max 键上也做映射（否则 max 级别不会出现）：然后 /reload 就好了

2026年7月28日 0条评论 36点热度 0人点赞 MuWinds 阅读全文

给定两个字符串 s 和 t ，它们只包含小写字母。字符串 t 由字符串 s 随机重排，然后在随机位置添加一个字母。请找出在 t 中被添加的字母。示例 1：输入：s = "abcd", t = "abcde" 输出："e" 解释：'e' 是那个被添加的字母。示例 2：输入：s = "", t = "y" 输出："y" 提示：最开始没看清楚 length 的条件，看到随机重排想当然就直接用 unordere…

2026年7月18日 0条评论 49点热度 0人点赞 MuWinds 阅读全文

之前面一个中小厂不太顺利，回过头来发现我 vibe coding 太多导致基本的数据结构已经还给院长了，自己手写一个费劲的很，打算从 easy 难度的恢复一下，重走长征路 1768. 交替合并字符串给你两个字符串 word1 和 word2 。请你从 word1 开始，通过交替添加字母来合并字符串。如果一个字符串比另一个字符串长，就将多出来的字母追加到合并后字符串的末尾。返回合并后的字符串。示例 1：输入：word1 = "…

2026年7月18日 0条评论 56点热度 0人点赞 MuWinds 阅读全文

我们在海光 Z100 DCU (gfx906) 上对 vLLM 推理框架的 CUDA Graph 功能进行了完整的测试验证。本文记录开启 CUDA Graph + torch.compile 的具体配置、性能数据和关键发现。测试环境项目详情服务器 scnet GPU 1x 海光 Z100 DCU (gfx906), 16 GiB Python 3.10.12 PyTorch 2.10.0+das.opt1.dtk2604 vLLM 0.18.1+das.3266200.dtk2604 Triton 3.4.…

2026年6月15日 0条评论 196点热度 0人点赞 MuWinds 阅读全文

本文记录了我们使用自研微基准测试工具对 4× 海光 Z100 DCU 进行的一系列测试结果。测试环境项目详情 GPU 4× 海光 Z100 DCU，每张 16GB，合计 64GB GPU 架构 gfx906 (Vega 20 / GCN 5.1) DTK 版本 DTK 26.04 (DCC2602-0317) PyTorch 2.10.0+das.opt1.dtk2604 测试工具 dcu_benchmark.py（基于 hy-smi 遥测采样）采样间隔 1 秒矩阵规模 4096 × 4096（Matmu…

2026年6月9日 0条评论 143点热度 0人点赞 MuWinds 阅读全文

环境信息项目详情 GPU 4× 海光 Z100 DCU，每张 16GB，合计 64GB GPU 架构 gfx906 (Vega 20 / GCN 5.1) DTK 版本 DTK 26.04 (DCC2602-0317) Python 3.10.12 PyTorch 2.10.0+das.opt1.dtk2604 vLLM 0.18.1+das.3266200.dtk2604 Triton 3.4.0（从源码编译，替换原 3.4.0+git1ef59765） transformers 5.5.0 flash_at…

2026年6月8日 0条评论 260点热度 0人点赞 MuWinds 阅读全文

最近社区都在说 Muon 用在 LLM 上的训练效果要比 AdamW 好很多，这里根据 Kimi 的论文（http://arxiv.org/abs/2502.16982）和仓库做了一些尝试。选用模型：minimind，Github 链接：https://github.com/jingyaogong/minimind 硬件：AutoDL自己租个 nv 的卡就行常见的 AdamW 优化器就是在 Adam 的基础上在梯度更新时加上梯度衰减，这样的话可以避免更新的时候产生更大的参数。而 Muon …

2026年5月31日 0条评论 162点热度 0人点赞 MuWinds 阅读全文

map 是有序键值对容器，它的元素的键是唯一的．搜索、移除和插入操作拥有对数复杂度．map 通常实现为红黑树（红黑树是一种自平衡的二叉搜索树．每个节点额外存储了一个 color 字段 ("RED" or "BLACK")，用于确保树在插入和删除时保持平衡）．设想如下场景：现在需要存储一些键值对，例如存储学生姓名对应的分数：Tom 0，Bob 100，Alan 100．但是由于数组下标只能为非负整数，所以无法用姓名作为下标来存储，这个时候最简单的办法就是使用 STL 中的 map． map 重…

2026年3月8日 0条评论 305点热度 0人点赞 MuWinds 阅读全文

12 3 4 5…11

leetcode 复健：1041

Inagora 爬虫实习面试记录

pi agent 不显示 xhigh 和 max 的解决方法

Leetcode 复健2: 389

Leetcode 复健1: 1768

Z100 DCU 上 vLLM CUDA Graph 推理优化实践

海光 Z100 DCU微基准测试：功耗、温度与计算特性分析

海光 Z100 DCU 适配 vLLM 运行 Qwen3.5-27B 完整总结

训练小参数LLM将优化器从AdamW换成Muon的尝试

记忆回溯：C++ map