三斗室

给“日志分析模型”注入后门？

27 May 2025 Posted in 安全

用 AI 模型来分析日志，发现未知异常，是目前非常流行的监控手段，之前我也介绍过这一类日志异常检测算法。不过你有没有想过一种可能性：你的日志 AI 模型会被黑客注入后门，AI 平常该怎么告警还怎么告警，关键时刻却“故意”漏报异常日志？继续阅读……

运维大模型：又一年过去了，运维离下岗还有多远？

24 May 2025 Posted in AIOps

一年前，笔者曾写过一篇《离大模型全面接管运维还有多远》，探讨了当时几篇运维领域大模型的进展。一年过去了，大模型技术本身可谓日新月异，各种开源闭源模型层出不穷，能力也肉眼可见地增强。那么，在运维这个“老大难”的领域，大模型应用是否也水涨船高了呢？我们是不是离那个“NoOps”又近了一步？继续阅读……

近期，可观测性 2.0 概念引发了国内外友商们的广泛关注与热议，greptimedb 公司《什么是可观测性 2.0 ？什么是可观测性 2.0 原生数据库？》引用了 honeycomb CTO Charity Majors 的文章，介绍了宽事件(wide event)的概念和自己针对这个概念的底层设计，flashcat 公司《可观测性2.0？还是只是日志的卷土重来？》则批判性地翻译了 Hydrolix CTO Todd Persen的文章——Todd Persen 在 Charity Majors 观点的基础上，进一步认为应该提供高性价比的原始日志存储方案，并提供超脱在运维以上的业务价值——而 flashcat 则认为这个观点不方便利旧，落地难度更高，还是选择上层串联的方式更实用。继续阅读……

如何评估日志总结的准不准？

23 Apr 2025 Posted in 智能运维

在八个月前的《日志易 SPL 实现基于大模型的海量日志总结》中，我曾经展示了一种综合 TFIDF 向量化、KMeans 聚类和 DPP 多样性采样算法，实现日志总结的方案。现在新一代的大模型，普遍可以支持 128k 的上下文窗口大小，激进一点的，比如 gemini、minimax，运用线性注意力机制，甚至实现了 1M 以上的窗口。很多人就有疑问了：我是不是直接把几千行日志一口气上传给大模型，要求 AI 总结就足够了？继续阅读……

日志易MCP Server落地实录

14 Apr 2025 Posted in 智能运维

一、背景：MCP 协议介绍

在 AI 蓬勃发展的当下，大型语言模型（LLM）虽展现出强大潜力，却受困于与外部资源连接的难题。数据分散、接口繁杂，致使 AI 模型难以灵活对接本地资源与远程服务，极大限制了其响应质量与工作效率。而就在这一关键时刻，MCP Server 强势登场，成为破局的关键力量。尤其随着 Manus 的火爆出圈，MCP Server 也备受瞩目，迎来了飞速发展，短短 1 个多月时间，数量已超 5000 个。继续阅读……

安全大模型落地的迷雾

26 Mar 2025 Posted in 智能运维

昨天看到安全村 SecUN 公众号上发表了一篇署名为奇安信副总裁张卓的文章：《通过DeepSeek现象思考大模型落地的正确路径》。文章很长，内容很多，看起来非常扎实。但其中一些技术细节和数据，值得商榷。继续阅读……

用大模型直接读监控指标，可行么？

17 Mar 2025 Posted in 智能运维

因为 deepseek 的母公司幻方做量化基金的缘故，相当多的一大批大模型新用户们，想当然的认为大模型可以用来炒股！一些半懂不懂的 IT 从业人员，也觉得大模型完全可以用来处理时序指标数据。一些运维的公众号软文里，已经开始写怎么用 deepseek 做监控——那么，大_语言_模型，直接读监控指标，真的可行么？继续阅读……

掌握大模型时代的流量规则

05 Mar 2025 Posted in 人工智能

当我们沉迷AI搜索，背后有一场“看不见的战争”

最近，上海寸屋拉面店在门口打出的广告爆红网络，广告内容很神奇，是该店被DeepSeek推荐为“上海最好吃的日本拉面TOP1”：继续阅读……

从 deepseek 泄露的日志能推算什么？

06 Feb 2025 Posted in 日志易分析

过年前后，deepseek 大火特火的时候，安全圈突然爆出 deepseek 的数据库泄露了！研究团队的原始内容参见：https://www.wiz.io/blog/wiz-research-uncovers-exposed-deepseek-database-leak。继续阅读……

聊一聊 trace 采样的新方法

28 Dec 2024 Posted in AIOps

上一篇《Splunk Conference 2024解读》里，我提到 grafana 和 splunk 都在探索怎么降低 trace 的存储空间。今天展开聊聊。继续阅读……

Splunk Conference 2024解读

27 Dec 2024 Posted in 日志分析

Splunk Conf24 最近公开了分享内容，这是 Splunk 被 Cisco 收购后的第一次年度技术大会。我看了一遍，大概总结有这么几个要素：继续阅读……

如何客观评价文档写的好不好

19 Aug 2024 Posted in 产品经理

toB 软件由于专业性较高，很难像 toC 软件那样上手就玩。于是软件使用文档写得好不好，相对来说显得比较重要。我们经常可以看到类似的抱怨：“这文档写的，完全看不懂”。继续阅读……

日志易 SPL 实现基于大模型的海量日志总结

02 Aug 2024 Posted in LLM

前段时间，阿里开源了qwen-agent，可以对长文档进行 RAG 增强的对话问题。但在对话之前，还缺了第一步——人们总是习惯先问一句“总结一下这篇文档说了什么”，然后再根据总结来具体提问。“长文总结”，其实是大模型应用要过的第一关。继续阅读……

解密 Datadog 的技术文档团队

29 Jul 2024 Posted in 产品经理

“完成优于完美”不仅仅是一句口号，更像是Datadog技术作者的座右铭。毕竟，谁不想在“完美”的文档上留下自己的痕迹呢？😉 继续阅读……

日志易 Text to SPL 探索

26 Jul 2024 Posted in LLM

日志易 Text to SPL，从广义概念上属于 Text to SQL 的一种变体。经过接近一年的尝试探索后，我们的第一个正式版即将推出。正好我在 AiDD 上海站听了好几家 Text to SQL 的分享，发现他们的各种路线我们都尝试过了。这下也更有信心，可以给大家分享一下我们的探索过程。继续阅读……

大模型时代的日志解析算法总结

25 Jul 2024 Posted in LLM

上一代 AIOps 的问题

关注 AIOps 日志算法的读者朋友们可能都知道，在日志解析方面，香港中文大学开源的 Drain 在几年前基本已经一统江湖。就连 elasticsearch 的 categorize_text aggregation 实现也使用了 Drain 算法。继续阅读……

给“日志分析模型”注入后门？

运维大模型：又一年过去了，运维离下岗还有多远？

可观测性2.0？一厢情愿的空中楼阁

如何评估日志总结的准不准？

日志易MCP Server落地实录

一、背景：MCP 协议介绍

安全大模型落地的迷雾

用大模型直接读监控指标，可行么？

掌握大模型时代的流量规则

当我们沉迷AI搜索，背后有一场“看不见的战争”

从 deepseek 泄露的日志能推算什么？

聊一聊 trace 采样的新方法

Splunk Conference 2024解读

如何客观评价文档写的好不好

日志易 SPL 实现基于大模型的海量日志总结

解密 Datadog 的技术文档团队

日志易 Text to SPL 探索

大模型时代的日志解析算法总结

上一代 AIOps 的问题

大模型取代运维还有多远？

价值3000元的大模型预训练经验，都在这里了

大模型在运维领域的应用展望

Schillace's Law：好好使用 ChatGPT 的原则

能不能用ChatGPT的判断原则

Edge Dev 用法：让 ChatGPT 读论文

ChatGPT 不是终点：BLIP2 多模态模型介绍

ChatGPT实践总结:神话之下依然是人

ChatGPT最差实践(3)：反战还是反华?