三斗室

大模型取代运维还有多远？

2024-03-29T00:00:00+00:00

事先声明：标题是吓唬人的，本文主要内容是解读和RCA根因分析有关的五篇大模型论文，并泼泼冷水。

关注大模型的大家都知道，微软和 openai 在过去这一年里合作得有多密切。事实上这种合作不光是科研和产品的，微软 Azure 云运维部门，用 GP3.5/GPT4 也做了一个又一个实验，发了一篇又一篇论文，急切程度，让我怀疑他们背 KPI 了——今天就带大家看一看，在微软，大模型到底能给运维人员做什么？

第一篇《Automated Root Causing of Cloud Incidents using In-Context Learning with GPT-4》

这篇论文其实比较简单，所有人都可以上手试试。主要内容是对比两种 RAG方案，在codegen/opt/bloom和GPT3/3.5/4上的效果：

一种是直接把历史 incident 按每 300 个token 切成一个 chunk 存 faiss 向量数据；
一种是分别对 incident 的告警描述、标注根因，用大模型做 summary，然后 all-mpnet-bse-v2 向量化以后存 faiss 里。

结论：

直接 chunk 召回给 GPT 的效果和用上一代 bloom 大模型水平相当（chunk 在拖后腿）
10-shots 效果最好（用不着32k 长度）
同样 10-shots vs 0-shots，GPT4 的提升幅度也最大（基础模型还是越聪明越好）

最后，作者还进行了一轮专家打分，包括可读性和正确性两个角度。结果：可读性拉满，GPT4 已经到了平均 4.72 分；正确性嘛，GPT4也只有 2.47 分。

于是作者又人工分析了一遍错误的 incident，发现：有一类情况，是 incident 描述里带有其他关联 incident 的标题，summary 时有负面影响。如果去掉这类数据，就可以到2.95 分，“接近 3 分啦，快及格啦！”

最后，作者还讨论了一下 incident 老化的问题，做了一些相关性分析，认为历史上没出现过的故障，靠 10-shots 也没用。但是微软作为云厂商，还是有一些 incident 会频繁复现的：

一类是硬件故障和维护；
一类是客户反馈问题但是修复版本要几周后才发布上线。

第二篇《Automatic Root Cause Analysis via Large Language Models for Cloud Incidents》

这篇又叫 RCACopilot，作者在 AIOps 挑战赛上有分享。可以看到比上一篇思路上有拓展：

首先，summary 的时候，不光是 incident 内容，还拉取了diagnostic info，也就是和这次告警相关的日志、指标、堆栈等数据。
第二，基于 fasttext 和故障数据，训练了一个 embedding 模型，替代了开源模型做向量相似度计算，计算结果还加上了时序系数，综合召回。
第三，并不要求 GPT 给定位和修复建议，全都自己准备好各种 handler，GPT 只需要做个分类判断调哪个 handler 就得了。

为了验证这几个改进的有效性，也分别做了实验，我这里直接上结论：

没有历史 incident 做参照的时候，GPT4 的得分跟直接搞个 xgboost 分类器差不多烂（不要指望大模型内置知识）
用原始的监控指标/日志，加监控策略分类等等，效果反而下降（做 summary 很重要）
用 GPT4 embedding向量的方法，遥遥领先其他方法，但还是遥遥落后自训练embedding模型方法（私域 embedding很重要）

论文里作者还提供了一些有趣的数据。RCACopilot的试用团队里，最多的一个团队，配置了 213 个 handler，handler 的平均执行时间是841 秒。接近 15 分钟啊，我太好奇这到底是什么团队了……

第三篇《Exploring LLM-based Agents for Root Cause Analysis》

这回的方案，就是最近很火的“多 AI 智能体”。

首先，作者直接用 langchain 的 ReAct 通用框架做了基线实验。目的是对比 ReAct 和 RAG 召回、LLM 自己 CoT 的效果差别。

ReAct 里使用了两个 Tool，一个用来在ReAct 觉得 incident summary 不够好的时候，回答 incident detail；一个用来召回历史 incident。召回这块又分了两种不同实现，一个是根据 incident 的标题和描述搜索，一个是让 ReAct 生成查询文本后混合搜索（BM25+Bert）。

看起来这个设计有理有据，但最后结果很尴尬：ReAct 效果别说比不上直接用 RAG，连让大模型自己 CoT 都不如！

唯一的差异大概就是：把很多瞎编的错误，变成了证据不足的错误……

证据不足？？于是作者把 incident 的 comment 内容也加入，结果依然没用。

有了这个结论，作者接下来花了一个月跟 on-call 团队反复交流工作流程，开发了几个针对性的私域 Tool：

Database Query Tool。这个 agent 负责SQL 生成，查询结果做 Numpy 转换，最后给出自然语言回答。
KBA Q/A Tool。将知识库 chunk 后存入向量存储，然后做RAG问答。主要场景是：上一个工具生成 SQL 时可能有一些具体的实体信息，需要从知识库里召回。
KBA Plan Tool。上一个工具的变体。主要场景是：ReAct 框架会带来多智能体之间疯狂聊天的偏好，有些场景已经有固化的分析逻辑了，不用LLM 们自己瞎琢磨，所以从知识库里召回一些可靠的高层次的分析计划来遏制一下 LLM 跑偏。
Human Interaction Tool。这个不是大模型代理，是真的人介入。因为有些实体信息可能确实从 KBA 里都搜不到，那么就等待人类提供信息，完善以后再继续执行。

不过这个新ReAct方案，并没有给出和通用 ReAct 方案一样的评估指标。而是直接上现场，做案例访谈了。包括简单和复杂两种案例：

简单的监控系统告警的排查。过程要先去查一下告警对象是否在线服务，不在线就忽略，在线就得额外查数据库看是否需要修复。
- 结果是：有时候能成，工程师也很惊喜；有时候参数提取一直失败，最后还是工程师介入了。
复杂的排查过程需要从多个不同的知识库里总结行动计划。工程师团队表示即使是人，也要 1.5 年以上的经验才能比较好地处理。
- 结果是：KBA Plan Tool 能构建一个看似挺合理的计划，但最终只有前一两轮能成功执行，后面就一直失败直到设定的 20 轮上限。

第四篇《Nissist: An Incident Mitigation Copilot based on Troubleshooting Guides》

这篇论文写的很烂，实际内容还不如在 youtube 上原型演示视频说的清楚……系统本身是一个人机交互过程，也没啥好讲的。

大概改进点就是对故障知识库的 summary 操作，要求结构化思考和输出：从logical、bridging、actionable、simplicity、process integrity几个角度来分析文档，然后按照固定的 terminology、background、faq、flow、appendix 分类做总结整理。

第五篇《Knowledge-aware Alert Aggregation in Large-scale Cloud Systems: a Hybrid Approach》

这篇是华为云的，又叫 COLA，但是场景和微软 Azure 云一模一样，无非微软的 TSG，华为叫 SOP。论文相关研究里也直接提到了前面第二篇的 RCACopilot。所以一并谈谈。

论文的特点是：先基于拓扑和时序相关性，对告警做一次收敛归并，然后把有直接连线关系的两条告警，和两条告警的相关知识库，都交给大模型来判定根因和推荐方案。

至于知识库本身怎么处理，也是 fasttext、summary、ICL 这套，不用重复介绍了。但论文附的 prompt 比较有意思，我贴图上来：

对，还有 negative samples！但论文没提这部分的构建，可能是写死的？

接着还提到他们用 PTv2 做了微调——开源社区唯一默认用这个方法的就是 ChatGLM-6B——但没有更多介绍了，作者非常吝啬！

最后是效果评估。数据集说是包括50 万个告警，对应 3k 个 SOP。这点不得不服云厂商们，很难想象普通公司有这么多积累可用的知识库。

结果也很有趣，没微调前的 COLA 效果其实和之前 sota 的 iPACK 效果差不多，但微调后效果大涨。用作者的话就是：“local parameter 优于 embedding”。而之前微软的结论都是 ICL 才最重要——我想来想去，唯一的解释就是 ChatGLM-6B 本身太烂，拖后腿了！

另外，还消融实验验证了一下告警归并两个环节的贡献，发现拓扑相关性的贡献率是5.5%，时序相关性是 31.8%——说来说去，还是同一时刻发生的告警高度相关这条直觉公理最有效。

最后也给了一个案例，无功无过，不甚出彩：

好了。和 OCE 故障定位相关的五篇论文就介绍到这里。

从微软/华为两家云厂商 OCE 部门的研究来看，有几个通用结论：

要有知识库，知识库，知识库！
尽量训练一个自己的 embedding 模型。
尽量用更大更好的模型。
只能应对一些简单重复故障。
不要迷信多智能体！

不知道大家是否认可呢？

btw：微软 OCE 更早还有两篇论文，一个是专讲如何 incident summary，一个是专讲根据 incident生成 Kusto Query Language，大家也可以一读。

价值3000元的大模型预训练经验，都在这里了

2024-03-19T00:00:00+00:00

大模型火起来已经一年多，大家应该已经见过很多prompt提示工程和SFT微调训练的文章，但讲预训练的少之又少。原因也简单：没这么多显卡和数据。

作为 AI 信徒，不亲自跑一把体验一次，总觉得自己信仰不纯。也一度想试一试 NanoGPT 项目，直到我突然发现：百度智能云千帆平台上，提供了全套的 post-pretrain、sft 和 rlhf 功能可供使用——其他云厂只有 prompt api 或者最多有 sft 功能——这太让人惊喜了！接下来几个月，我算扎扎实实把增量预训练和微调训练跑了一遍，花了 3000 元。期间给百度提了两位数的工单，今天记录一下，供大家参考。

一、数据集管理

首先，训练模型肯定要有数据集。甚至可以说数据集才是大模型训练过程中最重要的工作。

平台在创建数据集的时候，对不同的训练阶段，有不同的数据类型要求。

如果是 SFT 微调，数据是prompt+response。按百度要求整理成 jsonl 格式即可。
- 这里百度有个特别贴心的功能，叫 FAQ 挖掘。你可以直接上传不超过 60MB 大的 txt、pdf(注意：PDF 是需要能直接转成文字的，不能是影印图片)、docx 文档，平台会自动调用文心一言大模型，从文档中生成一问一答，每 2000 个字，生成 10 个问答对。生成以后，自己再肉眼过一遍，删掉特别不靠谱的部分。按照我用公司产品文档测试的经验，大概得删掉 10% 左右。注意这个功能要按模型 api 实际调用量收费，我司产品文档大概百万字，花了￥20 左右。
- FAQ 挖掘的缺点是：回答全都非常简短。不知道是不是百度为了节约资源，内置的 prompt 限定了输出字数。
- 另一个功能是自动标注。你可以上传 response 内容为空的数据集，然后让平台自己生成一个，你再修改或直接点确定。不过这些都是界面操作，真要几千上万条问题，够你花几天的。
- 最新推出的功能是推理数据集。其实就是自动标注的升级版。平台一口气把所有问题推理完成，然后你导出到本地再修改。目前是限时免费中，有需要的抓紧体(bai)验(piao)！
如果是 post-pretrain 预训练，数据是纯文本。这里百度要求是 txt 或 jsonl 格式。多个文件可以打包成 tar.gz 上传。要求是单个文件不要大于 1G，单个 tar.gz 里文件不要多于 1000。但是根据我个人经验，大于400MB就有概率导入失败。
- 百度预训练期望的 jsonl 结构比较特殊。比如开源的 SecGPT 数据，把一本书存成一条 content。100 本书就是 100 行的 parquet/jsonl 数据。但导入百度后，列表直接显示数据量为 1。它或许认为应该是一本书一个文件，一段话一行。但我工单咨询，百度工程师表示不影响预训练……
- 平台的数据清洗配置中也有一个可选项是过滤掉大于 10000 个 token 的数据，所以这种前后要求不一致就很难评。

数据导入时，你可能会碰上各种各样的局部数据导入失败。最常见的包括：

jsonl 格式非法。大家一定要看示例文件格式，百度的格式非常非主流。
tar.gz 里有空文件。这里的空包括：空格、换行。总之就是没正经文字。说实话这么简易的失败我不明白平台为什么不自己处理得了。
非 UTF-8 编码。这个在SFT 数据里应该很少见，毕竟 JSON 肯定是utf8的。但是 post-pretrain 因为是纯文本，你可能直接从 github 上下载一些内容，没准就是 GBK 的。所以一定要提前转换。

此外，你还会很郁闷的看到数据量和本地都对上了，但就说有非utf8编码的导入失败，其实可能是因为内容是全英文代码程序，被认为是 ascii 编码了。导入其实成功了，就是平台 bug 而已。

二、数据处理

导入数据以后，可以进行数据清洗、数据分析、数据增强。

数据增强就是著名的 self_instruct。在一年前大家基本都通过这个方案来调 openai 接口生成大量微调数据。但现在很多结论证明微调其实不带来多少新知识，只是对齐和规范输出格式。那么少量微调数据就足够了。我这次也没尝试做数据增强。

数据分析会自动给你的数据分类，你可以根据结果来判断自己准备的语料是不是偏了要不要补充一些针对性的内容。但我个人体会：分类太细了，基本无意义，执行还特别慢。这步大家跳过算了。

数据清洗按说应该是很重要的一步，开源大模型的技术报告中，都会专门讲解数据清洗步骤。百度云在这块也提供了很多功能，包括：

移除不可见字符、移除 emoji 表情替换、规范化空格、去除网页标识符。
- “移除不可见字符”建议不要用！百度对“不可见字符”的定义居然连\s空格和\n换行这种都算。开启以后你的数据看起来就跟文言文一样
- “去除网页标识符”是个不错的功能。有些 docx/pdf 转换成 markdown 时，里面的图片、视频，可能会以 base64 直接存在文本里。实践中我转换了一批极客时间的 pdf，出来的纯文本数据大几百 MB，去除网页标识符以后其实不到 80MB。
删除 token 过长的文档、删除困惑度过高的文档、删除特殊字符过多的文档、删除 token 重复率过高的文档。
- “token 过长”这个在前面已经讲了，如果你没有按分段处理，这块肯定不能开启，不然你的数据直接被删干净了。
- “困惑度”这个也很奇特，平台提供的示例，复制下来本地用 GPT2 计算得到的困惑度，和平台示例值__相差两个数量级。还是建议不要开启了__。
文档 simhash 去重。
- 这也是清洗的重要功能，但我试验中碰到 bug，也被平台确认了待修复，据说要几周，所以只好跳过。
- 注意：去重也是以文档为单位的，如果你没有按分段处理，这块也__不要开启__。

总结一下：百度云平台提供的流程很全，但是用起来很难，建议大家这部分还是本地写 python 跑吧。这类数据清洗工作逻辑简单，AI 都能帮你写好，我全程是让智谱 4.0 帮我生成的。

把长文档拆分成短文档时，有一个需要额外注意的地方：尽量保证段落完整。这块我采用的方案是，原始的adoc/docx/pdf/html文档尽量转换为 markdown 格式（pandoc 命令和 pdfplumber 库, tabulate 库），然后配合使用 markdown 库切分 section 和 tiktoken 库计算 token 数，尽量接近 4096 上限的划分 sections 到不同文件里。

百度 ernie 的 token 计算和 tiktoken 有些差异，百度云平台有计算器可以手工验证，但这个无伤大雅，不用太在意。

三、预训练数据源获取

大模型预训练需要较多的语料。平台上明确提示说最好 10 亿 token，至少要 1000 万 token。平台之前会大概按照你的数据量字节数估算一下，不到 1GB 的明显不够，直接就不让提交预训练任务——但是刚才我打开发现提示文案还在，但约束被取消了？？

所以重点就是怎么获取本领域足够的语料，尤其是高质量语料。依然以开源的 SecGPT 为例，数据很大一部分是论文、书籍、CVE 漏洞库。不过我和作者沟通，作者表示实际训练时按比例缩减了论文的部分：

类似的，我们如果要训练一个运维领域大模型，论文、书籍，也会是一个重点来源。

很可惜，这部分目前没有看到比较公开的语料库，从科研角度，比较现实的办法可能是下载一些影印图片的 PDF，然后通过 OCR 方式转换成 txt 纯文本——好在 OCR 已经是一个很成熟的领域，我个人经验，百度飞桨的 PaddleOCR 在中文识别上的效果非常 OK，比传统的pytesseract库高不知道多少~强力推荐！

至于 ocr 程序，照样还是让智谱 4.0 来生成。国产 LLM 生成国产库的代码，基本靠谱……反而让 GPT/claude/Bard 生成 paddleocr 的代码效果都不太行。

一般来说，PDF 文件经过 OCR 变成 txt 以后，大小会缩水 20-100 倍，取决于图片是否高清。大家可以根据这个来估算自己要下载多少 PDF~

四、大模型预训练

到这步，终于可以开始大模型预训练了。

最终的数据集版本点击“发布”后，进入 post-pretrain 页面创建预训练任务：

选择你发布的纯文本数据集，然后开启混合训练，按照推荐的选择 5:1。千万注意，这里又是百度云的一个坑。因为通常大家都说领域数据和通用数据混合比例1:5，但百度的页面上偏偏是反过来说通用数据和领域数据5:1——事实上他们连自己产研都坑了，页面上的提示文案之前也推荐用户选1:5，是我报 bug 后刚改的。

表单底部可以看到估算的费用。必须预先充值到大于这个估算范围的最大值，否则无法继续。甚至即使这样，我依然在第三天收到一条短信，告诉我要超额，任务要停。但最后又正常运行结束了。我也不知道这个计费系统到底颗粒度是怎么回事……

总之，训练完成后，你可以看到预训练过程的困惑度和训练损失曲线：

可以看到，loss%一开始就挺低的，后续也没下降多少。某种程度上说明，我准备的运维领域语料，其实大多在 ernie 的原始语料中，已经覆盖到了——事实上在 openaiops 社区的运维大模型评测中，我司贡献的日志运维题库，ERNIE-Bot 4.0 的得分就高达 79 分，遥遥领先。

五、大模型微调训练

拿到一个经过 post-pretrain 的基座大模型，下一步就是“去 SFT”。

创建 SFT 任务的表单多数内容差不多，需要注意调整是“迭代轮次”超参。表单默认是 1，但是要根据实际数据情况来增加。另外，增加迭代轮次，其实就是重复训练，所以花的钱也是等比例变多的。

有趣的是：百度平台上对 post-pretrain 后“去 SFT”的任务，建议不仅仅是混合数据训练，而是先用平台预置的通用数据做一次 SFT，获取通用对话能力，然后再用自己的领域问答数据，做第二次 SFT，加强领域问答能力（https://cloud.baidu.com/doc/WENXINWORKSHOP/s/5lptj85pi）。但同时，SFT 任务的增量训练，又有一个要求，就是上一次的 SFT 必须是全量更新，不能是 Lora——所以大家开通计费时，同一个基座模型的三种训练方式的计费都得开通。

SFT 训练同样有 loss%曲线可看，还有 BLEU 等评估指标。评估指标应该是越高越好。显然下图显示效果非常烂，本次 SFT 的钱就是买个教训了：

和百度工程师的沟通，对方认为：我的微调数据集构成有较大问题。其中一些选择题，prompt 一大段文本，response 就一个字母。而这些评估都是基于 response 内容来计算。所以，要获取更好的结果，还是应该多构建一些工程化的 prompt 和 response。

这也让我想到从 GPT4 以来，大模型的输出普遍更加“啰嗦”的现状——看来大模型训练数据，就是要多解释逻辑细节。然后使用时有需要了再通过 prompt 去限定简短格式。如果训练数据就简短，就训练不到逻辑了。

基于百度智能云千帆大模型平台的大模型训练经验/教训分享就到这里了。边写文章边发现百度云今天半价了！我这文章也不是软文，SFT 效果又不理想，亏了亏了。口口口，口口！

大模型在运维领域的应用展望

2023-08-10T00:00:00+00:00

很多人都说，一切软件都应该用大模型重构一遍。这几个月，我也在探索类似的话题：运维软件，应该怎么用大模型来“重构”一遍呢？

昨天在公司内部做了一次分享，这里隐藏掉一些内部进展，把收集到的行业公开信息，以及我个人的评价，一一贴出来。供大家参考。

一、科普：大模型知识的必读必会

大模型，全称是大语言模型。因此它只有文本处理能力——不要想着让大模型做指标监控。
大模型的运行效率很低。一张 A100 显卡上运行 ChatGLM-6B 的推理速度是每秒钟大概二三十个字/词——不要想着让大模型直接清洗海量日志。
读一下之前这篇《能不能用ChatGPT的判断原则》，第三条“easily verified”对正则表达式来说，很难、很绝望——不要想着让大模型给你生成正则。
大模型的对话长度有限，多数开源模型都是 2k。外挂向量搜索的效果完全取决于你的搜索优化技巧——目前没多少人熟悉这个技巧，可能还不如直接用 elasticsearch。
大模型训练分为预训练和微调训练两种。业界普遍认为：“知识”只有预训练过程能增加，微调训练只是调整“知识”输出的形态。
- 预训练的格式就是一行一行纯文本，表格可以用 markdown 文本表达——不要想着收集一堆贴满图片的Word/PPT就可以训练了。
- 微调训练的格式是一问一答纯文本，问题不要太简略和雷同。
大模型训练有数据质量要求，但还没有明确的方法论，截止到目前：
- 预训练数据至少需要 2GB 以上纯文本。需要混合私域数据和通用数据，比例大概是1:5到1:10。也就是说单个领域内的纯文本数据量应该在 400MB，换算成文字，应得有五亿个字/词。
- 微调训练数据说法不一，大的 MOSS 上百万条，小的 LIMA 只要 1000 条。同样需要混合私域问答和通用问答，比例大概更高，可以到1:1。需要精心设计不同场景的覆盖和占比，手工编写类似CoT的问答和混编多轮问答。

二、裴丹教授的 OpsLLM 四阶段论

裴丹教授是 AIOps 学界领袖，指标异常检测方面非常有名的 Donut 开源项目就是裴教授团队出品。裴教授在 6 月一次会议上，提出了大模型在运维领域落地的四阶段观点。如上图所示，后面 L3、L4 其实不用看，毕竟 GPT4 给我们画饼的多模态至今都还没见着呢。我们重点来看 L1 和 L2。

L1 其实就是说：我们相信会有一个很牛的 OpsLLM 运维大模型，因此我们只需要会prompt engineering，把大模型用起来就行。具体场景包括：让大模型做告警总结，工单推荐等。

L2 其实就是说：通过类似 langchain 框架开发的形式，在大模型之上，做 RetrievalQAChain、APIChain、Agent 等高阶功能。具体场景包括：让大模型生成查询分析语句、调用 API 操作、自主推理操作步骤等。

这里裴教授有几个假设，可能需要大家思考：

这个很牛的 OpsLLM 怎么来——业内谁有五亿个字/词以上的高质量运维语料？
靠 langchain 能应对更换模型问题么——大家可以看我之前一个对比《text to query语法调教场景对比 5 家大语言模型》，这可能不是程序开发问题。

问题先放在这，下一节，我们先来看看国内外运维安全产品，都用大模型做成什么了。

三、阶段一的 4 个例子

两个国外厂商，一个国内厂商，我个人都将其归入阶段一。特点也很明显：相信 ChatGPT 作为 OpsLLM 也很牛，“遇事不决，ask chatgpt”。

那么真的很牛么？这里有另一个例子，来自微软的研究报告：

可以说，作为 OpsLLM，GPT 是比 Bert 牛不少了，但是还不够牛！

四、阶段二的 N 个例子

例子较多，我们按三个场景分别来讲。

4.1 查询语句生成

3 个国外厂商，1 个国内厂商的例子。可以看到各家实现的路径还是有挺大差异的。如果本身就是 SQL 查询，那直接 text to SQL 即可。如果是 metric 数据，查询逻辑非常简单，直接 text to Conf 填充菜单选项。如果是自定义语法，要生成完整且准确的语句就很难了，于是 observe 公司被迫引入 IDE 形式，每个函数都要单独提问，然后从产品文档中搜索对应函数的语法和示例小节，通过长达 4k 的 few-shot prompt 生成一个函数片段。

最后再提一下 splunk。日志分析领域的 SPL 查询语言，目前处于一个中间状态，它既不像 SQL 已经有很明确的标准规范，但又不至于像 observe 那样只有自己一家。ChatGPT 有一定的 text to SPL 能力。splunk 早年也自己独立尝试过基于 T5 模型训练。之前的介绍见《chatGPT初尝试(2): 自动生成 SPL 语句》。上个月，splunk 也发布了 beta 版本的 text to SPL：

splunk 是目前国外的运维厂商中，唯一一个继续自研大模型，而不依赖 ChatGPT 服务的公司。大概因为 splunk 还有大量部署版客户吧~这点，也值得国内友商们参考。

上图右侧的表格，来自 splunk 使用文档。坦白说：所谓的 bad example，反而才是真实用户自然而然的提问——谁喜欢像 good example 那样按逻辑慢慢写大段引导词——因此，如何通过产品设计，避免、优化 bad example，让用户无感享受 LLM，值得 PM 琢磨。至少，splunk 目前这种独立 App 的方式，不是很好。

4.2 API 调用

4 个国外厂商，1 个国内厂商的例子。APIChain 其实对任意软件都有效，不局限于运维安全或者数据分析。从上述截图里我们也可以看得出来，这个场景非常考验 PM 的设计能力。当然背后也依赖一定的语义分类技术。

必示目前还是 demo 阶段，因此对话前还要手动指定从哪个产品的手册里搜索 API 文档。
datadog 直观告知用户，NER 从页面获取了哪些内容去调用 API，得到什么结果。
newrelic 比较自然，把告警对应的指标、当前变更事件等信息，以图文多模态输出。
google cloud 还直接创建监控规则了。默认 langchain 的 APIChain 可不敢支持 POST 方法，某种程度上应该是怕搞坏系统了。
Microsoft 最狠，在 SOAR 的 playbook 外面封装了一层 promptbook 的新概念。这也确实是在实践他们自己的思路（我在《Schillace’s Law：好好使用 ChatGPT 的原则》中有所介绍）。

当然，APIChain 看似最容易落地，其实也还有很多细节门槛。后续有机会，我再介绍我们实践中碰到的一些细节。

4.3 自动推理

归类在这个场景下的厂家变少了很多，只有 google cloud 和 datadog。datadog 的用例，其实也还有点类似 Microsoft 的 promptbook 场景，可能通过一定的模板和规则匹配能实现类似效果。因此，我们重点介绍一下 google cloud 这个 search summary。

IT 工程师都知道，看日志其实是一个非常漫长和眼疼的事情。日志易、splunk、ELK 等产品就是为了解决这个问题，才引入了关键字搜索能力。但一个关键字敲下去，依然可能命中上万条甚至上亿条日志内容。还要通过阅读、翻页、缩小时间范围、添加新关键字等方式持续交互。

所以后续就又有了日志聚类(模板发现)功能，目前业内最主流的应该是香港中文大学 logpai 团队开源的 Drain 算法。聚类之后可能就只有几十到几百条模板，可以更快的掌握全貌。但因为模板里的参数值被丢弃了，用户看到关心的模板，还得钻取下去，逐次分析参数值的分布情况。

现在 google cloud 的 search summary 功能，可以直接把日志总结成一段简明概要，而且其中对关键行为的实体，包括人员账号、IP地址、时段、风险等级等的占比都能给出来。比日志聚类，又大大的缩减了排障时间。

我们都知道，LLM 的 context windows 是有限制的，哪怕最大的 claude v2也不过 100k token，这对于平均至少 300byte 一行的日志来说，最多也就放个千八百行。所以，此处肯定需要有处理策略。

langchain 社区有一段教学视频发布在油管上，分 L1-L5 介绍如何做 text summary。到 L4 的时候，可以通过聚类方案来实现对整本书的总结：

可惜经过验证，发现这个方法对日志总结场景效果一般。日志毕竟不是真的自然语言，在同一个聚类里，聚类中心点并不能代表本类数据的含义。

如果直接使用模板，参数信息丢失又太狠。

因此，search summary 必须采用 agent 智能代理方案实现。由 LLM 给出 thought 和 action。

自动代理是目前所见，大模型在运维安全领域，最难落地，但收益也最明显的场景。我们也是在尝试之中，希望后续有所突破。

有趣的是，清华大学最近刚发布了 agentbench，专门用来评测不同大模型之间，自动代理能力的差别。目前看，差距非常大！有评测就有动力，让我们共同期待开源大模型，在这一领域的突破！

五、其他友商动态

除了上面有原型或产品截图的以外，还看到几家友商的公众号。这里也快速解读一下：

天旦 opsGPT，基于 vicuna-33b 做的 lora 微调训练，微调数据源是内部积累的 30 万条问答数据，本地 A6000 显卡上运行，评测方式是通过 CCNA 考试——评测方案是个亮点，锁定在较小领域，比较实际。
云智慧 cloudwiseGPT，也是 30 万条数据，分不同场景分别训练，通过 Mixture of LoRA 方式服务——真的不是蹭 Mixture of Expert 概念么？LoRA 是微调方法，不是推理方法啊(已发Owl论文，结论有误，致歉。)
金睛云华 cyberGPT，基于 ChatGLM 训练，本地 40 台 8 卡 GPU。扩展了 12861 个安全领域词表，进行了 34.2B+17.5B 预训练，19.2M+5.43M 微调训练。分为 PL 检测大模型和 NL 运营大模型——真有钱！扩展领域词表是个亮点。混合数据的比例和主流说法相比有点过拟合了。34.2B 相当于有 30GB 领域语料，不敢相信！19.2MB 也就相当于1-2 万条问答，为什么会有那么丰富的预训练语料但只有这么一点点微调语料？莫非是 github 上爬的一些代码库或者 CVE 报告？那又有其实 LLM已经懂了，重复训练的浪费感。最后，PL 检测大模型的样机上连 GPU 都没配，而且流量数据的规模显然不符合我们前面科普过的一个知识点：LLM推理性能跟不上大数据。所以，金睛云华的 PL 应该还是过去已有的传统模型，改个名而已。
众智维 RedGuard，基于 ChatGLM，配合向量存储，进行知识库问答。附加支持对话中贴图 OCR 识别。

六、总结

综上所述，大模型在运维安全领域，已经逐渐有了比较清晰的应用场景。大体分为三类五种：

所有软件都能做的：外挂知识库问答、 API 调用。
数据分析类：查询语句生成。
智能推理类：修复意见、日志总结。

基本也在裴丹教授的阶段图范畴内。不过对于无法轻松接入 ChatGPT 的国内运维软件，开源大模型目前还支持不起阶段一的“信任”，往阶段二努力，反而成了更实际的选择。

Schillace's Law：好好使用 ChatGPT 的原则

2023-04-08T00:00:00+00:00

话接上回，今天给大家介绍 ChatGPT “能好怎”中的“好”字诀——Schillace’s Law。

Schillace 是微软副 CTO，他根据微软内部使用 GPT4 辅助编程的实践经验，总结了 9 条原则。这几条原则在英文中颇有韵律感和哲学意味，因此我同时保留其英文原文和中文翻译，方便大家理解：

Don’t write code if the model can do it; the model will get better, but the code won’t.(不要编写可以由模型完成的代码；模型会变得更好，但是代码不会)
Code is for syntax and process; models are for semantics and intent.(代码用于语法和流程；模型用于语义和意图)
Text is the universal wire protocol.(文本是通用的线协议)
Trade leverage for precision; use interaction to mitigate.(为了精确性而牺牲杠杆；利用交互来缓解)
The system will be as brittle as its most brittle part.(系统的脆弱性取决于其中最脆弱的部分)
Uncertainty is an exception throw.(不确定性是一种异常情况)
Hard for you is hard for the model.(对于你来说困难的事情，对于模型来说也是困难的)
Ask Smart to Get Smart.(好好提问，获取智慧)
Beware “pareidolia of consciousness”; the model can be used against itself.(谨防“意识的错觉”；模型可以被用来反过来使用)

我高亮出来的第 7 和第 8 条，针对编程以外的所有场景，都有指导意义——向 ChatGPT 提问时，一定要牢记它是个加人类反馈的文本预测模型，你在界面上的一举一动，都会影响 ChatGPT 的最终输出。所以一定要“好好用”，别瞎玩！

一次好的 ChatGPT 交谈，一般都是这样开始的：

<定义角色>。<希望它做什么>。[对输出内容的拆解要求]

定义角色的目的，其实是通过一句垫场话，唤醒 ChatGPT 的记忆，让它自动补充相关的领域信息，排除一些无关干扰。其实你换个说法，比如“你知道 XXX 么？”也一样。如果这一句话不够，可能就需要在后续拆解要求过程中通过额外提供样本等 ICL、CoT 方案来加强了。这属于“能好怎”的“怎”字诀。今天先不展开。

除了补充领域信息，拆解要求一般还有几个常见的点：

限制长度：说清楚要输出多少字，什么格式——这一般用于 prompt 效果挺好，打算留下来以后经常用。就可以在调好了以后，加上“不要解释”、“只要提供代码就好”等等限制语。

明确主题：清楚表达意图，并聚焦在一个主题内对话——再次强调，好好提问，别瞎聊天，因为一次会话内，上下文、编辑、重生成、对结果都有影响。你瞎聊，ChatGPT 会比你更瞎！

为了加强大家的印象，我这里给大家演示一个极端案例：

案例场景非常简单，就是让 ChatGPT 重复上一段话。是不是感觉绝对没问题？但是当我们重复编辑 20 次以后，ChatGPT 对着一段湿巾的文案开始推荐 python 了！

这就是因为正确的文字真的都用光了，用户一直点编辑， ChatGPT 不断降低过去回答里的文字的权重，降无可降，只能开始语无伦次的说胡话。

看过这个极端案例以后，大家都知道好好提问的重要性了吧？下一期，我们介绍“能好怎”的“怎么问”，敬请期待。

能不能用ChatGPT的判断原则

2023-04-07T00:00:00+00:00

越来越多的人开始尝试使用 ChatGPT 了，随之而来的是一些质疑的声音：“感觉 ChatGPT 没多厉害啊？这也不会那也不会……”这其实很正常，所有新技术在成熟运用之前都要经历类似的炒作曲线。恭喜大家进入冷却期，也就是要开始真正掌握这门技术了。

就像吃东西先问“能、好、怎”一样，我们面对一个场景，也可以先问第一个问题：能不能用 ChatGPT？

ChatGPT 模型的本质，是逐字按概率预测。“逐字”的关键作用，后续讨论“怎么用”时再强调，今天先说“概率”。概率就意味着会出错——所以“能不能用”，主要就是看出错我们接不接受。

大语言模型领域有另一家很著名的初创公司 cohere。其联合创始人 Yunyu Lin，著文讲解他认为最合适大语言模型的三类场景：

There is no one correct answer (creative applications, summarization)
There is some tolerance for error (routing, tagging, searching, and other tasks where perfection isn’t required)
The answer can be easily verified (math, writing code for specific tasks, or human-in-the-loop use cases).

这三句话强烈推荐给所有朋友反复阅读！我们也可以取个反，什么是“不能用 ChatGPT”的场景？那就是：对错定义严格的，出错影响太大的，而且不容易判断对错的。

示例

给大家加深一点印象，演示一个 ChatGPT 极具迷惑性的反例。

几天前，我在阅读 elasticsearch的官方说明文档的时候，看到一系列相关性参数，用的都是缩写，讲的不明不白的。我去尝试问问 ChatGPT，这些缩写是什么意思？取值区间是多少？具体强相关弱相关的阈值点是什么？ChatGPT 一一作答，看起来非常完备：

但事实上，ChatGPT 不管是取值范围，还是强弱阈值，全说错了！JLH 和 GND 都不是 0-1 之间。GND 的强弱点也不是 0.5，而是 1。

如果不是多个心眼，又去 Wikipedia 上搜了一遍，绝对就被坑了——但如果没有 ChatGPT 先把缩写解释出全名，直接上 Wikipedia 可能都不知道搜什么。

总结

我们来对照一下 cohere 的三原则，看看这个场景“能不能”用 ChatGPT：

对错定义是不是严格唯一：是的。数学概念毫无歧义。
出错是不是大事儿：是的，相关性搞反了，产品给用户推荐的内容都是错的，会造成直接业务损失。
错误容不容易判断：个人感觉不容易。相关性算法太多了，哪怕专业算法同学也不一定接触过所有知识。

这么一分析，结论就明确了：这个场景不能用 ChatGPT——至少不能只用 ChatGPT。

细心的读者可能注意到，我在第三条强调了“个人感觉”。因为 cohere 这三条原则中，前两条都很难改变。唯一可变的，是判断对错的“容易程度”，这一条因人而异，你越是懂的领域，这个 AI 助手可能越是得心应手。

同时，这也是 New Bing 设计来源链接功能的道理：通过引入外部知识链接，让判断变容易。比如上面这个例子，换成问 New Bing，记住选“精确”对话：

虽然看似依然强调取值一般在 0-1 之间，下面直接给出了 Wikipedia 地址。我们就很容易判断对错了。

好了。“能不能”的问题就聊到这，下期，我们继续“能、好、怎”，敬请期待。

Edge Dev 用法：让 ChatGPT 读论文

2023-03-06T00:00:00+00:00

上一篇介绍了 BLIP2 多模态模型没多久，今天又有多模态领域的大新闻，微软发表了一篇论文，介绍自己的Kosmos-1 多模态模型。不过论文没提供在线 demo 可用，只能直接阅读论文了。

我们都知道，ChatGPT 可以做文本摘要，快速总结中心思想。普通的文本， copy-paste 内容过去也挺方便，但 PDF 论文，没那么简单复制粘贴。这时候就需要 Edge Dev 浏览器出马了。

在浏览器地址栏中输入 https://www.microsoftedgeinsider.com/en-us/download/dev，打开 Edge Dev 官网，页面首屏正中间的位置就可以点击下载安装包并进行安装了。这块不作具体介绍。让我们直接进入使用环节。

安装完成以后，右上角会多出一个 Bing Chat 图标，点击就可以直接在侧边栏使用 ChatGPT。和在 bing.com 搜索引擎里使用相比，Edge Dev 里的 ChatGPT 最大优势是默认用当前打开的标签页网页内容作为聊天背景材料。因此，你可以免去复制粘贴的手工操作、免去字数超标的担心，直接基于当前页面开聊。

加上 Edge 浏览器一直以来对主流文档格式都有超强的阅读支持，用来读文章，简直犀利无比。

打开原始论文以后，怎么让 ChatGPT 帮我们读论文呢？

我们都知道，写论文、读论文其实一般是有套路的，内容大体都分为：内容摘要、场景问题、创新点、具体方法、评估结果、总结展望。

考虑到 ChatGPT 的输出字数有限，让他一口气全部解读完不太合适。但 Edge Dev 又限制了一次 chat 最多 6 次问答。所以，就按这个步骤来问吧：

Don’t search the Internet, summarize this article according to what method, what technology is used, and what effect is achieved in this paper?
Don’t search the Internet, what are the advantages of their solution compared with the previous ones, and what problems did they solve that the previous methods could not solve?
Don’t search the Internet, please describe the main procedure of the method in detail in combination with the content of the Method section. Please use latex to display the key variables.
Don’t search the Internet, combined with the Experiments section, please summarize what task and performance the method achieves? Please list specific values according to this section.
Don’t search the Internet, please combine the Conclusion section to summarize what problems still exist in this method?

注意：开头这段 “Don’t search the Internet” 是 Edge Dev 单独定制的 prompt，如果你不打算让 ChatGPT 去搜互联网，这段话，连字母大小写必须原封不动的照抄！哪怕你打算用中文问 ChatGPT，也得先用英文抄这段。

但如果你打算引入其他知识进行对比，那就刚好相反，不写这句 prompt 才行。

用法介绍完毕，现在，让 ChatGPT 来替我们总结一下 Kosmos 论文，并跟 BLIP2 对比一下吧：

ChatGPT 通过互联网搜索获取 BLIP2 知识后，总结对比给出了结论：Kosmos 比 BLIP2 多了“非语言推理”的支持。不过“非语言推理的任务”在论文里指的是什么？还得 ChatGPT 再解释一下：

ChatGPT 立刻给出了在论文中具体的用例，“非语言推理的任务”在论文中是指 Raven IQ test。ctrl+F 打开页面搜索，跳转到 Raven IQ 位置，就看到配图了。

作为普通用户，两三次问答，就了解完微软 Kosmos 论文讲什么，有什么特色。Edge Dev 浏览器在这方面，真是大大提升了生产力。

ChatGPT 不是终点：BLIP2 多模态模型介绍

2023-02-15T00:00:00+00:00

ChatGPT 火热的情况，感觉好像强 AI 近在眼前。但实际上，ChatGPT 代表的 LLM 重点只是在文本生成。还有大量的其他场景，其实也有算法在飞速进步。比如 stable-diffusion 实现的 text2img，比如 text2song，还有 openai 新出的 Point·E 做 text to 3D 等等。

不过这些也还都是单个任务。有没有想过把这些原子能力，串联起来，会是什么形态？

今天有群友突然问到一个场景，就体现了串联能力的需求：

“有个 PPT 制作的问题，特别想截图问问怎么办，因为纯靠语言没法描述。比如：这个地方和这个地方怎么对不齐啊？”

这其实就是一个多模态的内容理解和生成。我们把过程拆解一下：

要从截图中识别出来这是一个 PPT，并且其中有若干个挂件
要从问题文本中理解出来问的是两个挂件和对齐
要把两个模态的信息关联起来：问的是截图里 PPT 的哪两个挂件的对齐
从 PPT 知识中推理出最终回答

这里第一步是 CV，第二步是 NLP，第四步是 LLM，只要第三步能合理的生成 LLM 的 prompt，就可以构建出完整的多模态能力。

正好，就在最近，salesforce 公司发布了 BLIP2，在这方面做了尝试。不是算法研究员，这里就不做论文解读了。直接上 huggingface demo 体验：https://huggingface.co/spaces/Salesforce/BLIP2

我先复现一下群友的场景，让他判断 PPT 里两个表格是否对齐，怎么对齐：

判断无误，并建议我把左边第一个表格往下移。

然后再实验一个更难的场景。一张著名的视觉欺骗的静态图片，问问他上面到底有多少个圆点：

两次都回答说：4 个。

可以看出，PPT 截图问答已经基本能理解问题并给出合理回答了，至于是不是最佳回答，见仁见智——没准未来还能第四步的 LLM 改为生成新的 prompt，通过第五步 text2img 直接生成演示图，大家你来我往，斗图交流~

视觉欺骗的圆点数量，给出的回答还不是很满意。不过至少这个斩钉截铁的自信样子，还是很像 ChatGPT 的。[大笑~]

隔几天就有新突破的 AIGC 新时代~真是让人眼界大开。

ChatGPT实践总结:神话之下依然是人

2023-02-14T00:00:00+00:00

随着 ChatGPT 用得越来越多，逐渐掌握它的最佳和最差实践。总结的看，既不能小瞧 ChatGPT 的跨越式进步，也不能过于神话 ChatGPT 的功效。用好 ChatGPT，还是有较高的用户门槛。我归纳几条使用 ChatGPT 之前一定要牢记的概念。

第一：ChatGPT 是一个生成式模型

翻译：ChatGPT 不对任何结果的正确性负责，包括他说自己能负责的部分！

我今天拿到了微软 new bing 的体验。特意把之前直接在 ChatGPT 上问过的问题，在 bing 上再 chat 了一遍。甚至可以说：bing chat 的迷惑性，比原生的 ChatGPT 更上一层楼：

bing chat 在产品形态上，提供了脚注式的 source 来源链接。这从人机交互来说很棒！但当我明确告知他来源 1 里内容不符时，bing chat 甩锅说：这是来源 2 里的“百度百科”说的，不信你去查！

这个可怕的自信，让我回忆起毕设时看综述找来找去最后确定对方是瞎编凑50 条文献数的感觉……和 ChatGPT 聊天，真是和科研一样，要“大胆提问，小心验证”。

第二：ChatGPT 并不通晓整个互联网

翻译：ChatGPT 只是在 40TB 数据集上做的训练，它替代不了谷歌、必应、百度。大家还是要掌握如何高效搜索。

互联网被搜索引擎索引过的在线网页有58.5亿页(来自 https://www.worldwidewebsize.com/，bing chat 回复提供)，而网页平均大小是 1.2MB(来自 https://www.seoptimer.com/blog/webpage-size/ ，依然来自 bing chat 回复提供)，那么估算一下，仅网页文本内容，应该就有 7000TB。我们就按二八原则粗暴划分，也有 1400TB 是相对有价值的内容。

正如我在前序文章中展现的例子，这种回答的差异，就来自于数据的缺失：

互联网上太老的资料没被 ChatGPT 爬到：splunk 在09 年上市之前，科普 SPL 时明确说过自己设计思路来源是 SQL，而且也给了 SQL to SPL 的示例。但 ChatGPT 强调说：kusto 是新产品，借鉴了 SQL。也只有 SQL to KQL 的结果才正确。

第三：ChatGPT 是个增益放大器，你首先要学会提问

翻译：chat 听起来，是个人都会，但身为“佞臣”的 ChatGPT到底能做到什么，全看“主公”自身如何。

你只想吃喝玩乐，ChatGPT 并不能帮你。你得具体的设定好自己有多少预算，想吃什么口味，有什么忌口，手头有什么食材，有什么炊具，ChatGPT 才有可能给你一份菜谱，让你成功败家~（大雾）

嗯，我要承认一点：上面这段话，我重新编辑了三次，每次都会发现上次还遗漏了一个条件，还不够细致。

提问，或者说 prompt engineering，在ChatGPT(更广义的说，AIGC)时代，变成更加重要的能力。在习得适配的 prompt 能力之前，ChatGPT 的生产力，并没有想象中那么高。而跟熟悉搜索框里的 site:researchgate.net type:pdf 语法相比，学习 prompt 炼丹，可能还变得更难、更魔幻了。

更不巧的是，提问所需的抽象和扩散思维，从来都是稀缺品。

第四：ChatGPT 是个商业产品

翻译：ChatGPT 必须遵守美国法律，并将面临资源能耗拷问。

这一条属于一个 IT 从业者的扩展思考。ChatGPT 完美了么？国内有这个空间么？

首先，ChatGPT 到目前为止，没有开源计划。而不开源，就意味着管控无孔不入。在前序文章里，已经实验过 ChatGPT 对一些基础的政治观点采取了何种过滤倾向。这无疑有极高的风险。

从商业角度，不论训练成本，ChatGPT 的推理消耗也高居不下。每一个输入和输出的字符都要消耗计费，再想想有多少无效(prompt调试中)问答在运行，在排队。ChatGPT 月活过亿的背后，是付费用户也得排队等待响应。

要不算法迭代，降低成本；要不技术扩展，加中间层；要不产品创新，摆脱 chat 形式，否则，这过亿用户怎么过来围观，也会怎么离开。

我即期待一个更合理的 ChatGPT 产品，也期待一个更中国的 ChatGPT 产品。

ChatGPT最差实践(3)：反战还是反华?

2023-02-14T00:00:00+00:00

这篇标题我想了很久，还是决定用这个稍显直白的说法。是的，本次实验让我对 ChatGPT 的后端到底有多严格的规则过滤有了深度认知，ChatGPT 不可能直接为中国服务——换句话说，BAT 们要加油啊，你们有机会证明自己不只是商业模式创新了。

实验是从群友转发的消息开始的。消息中，用户试图让 ChatGPT 歌颂特朗普，被拒绝；但歌颂奥巴马和拜登，都成功了。

有意思，我决定也去试试。

果然只会歌颂民主党总统。那过滤规则是“歌颂”，还是“总统身份”呢？我们再试一次：

结果显而易见了：ChatGPT 只限制了总统的党派身份。生成文本本身的情感倾向不是啥大问题，赞美还是批判都可以。

那我们再换个更狠的场景测试一下吧。这次我稍微有点挑事儿了：

一如既往，“汉奸”作为一个负面身份，被成功过滤掉。但过程中暴露了一个更加可怕的信息。那就是生成“解放军之友”时，ChatGPT 的回话，和其他回话的模板完全不一样！

其他情况下，ChatGPT 的回复都是：“保持中立，不宣扬任何特定人物或意识形态”——虽然我们已经通过实验证明这句也是假话。

但这次，ChatGPT 的回复非常明确和直接。让我复制出来原文大家再看一次：“我不能撰写赞美中国大陆的军事力量的文章，因为这可能会被视为支持或鼓励军事行动。我强烈倡导和平、外交和通过对话解决冲突，以维护世界的和平和安宁”。此中何意，不言自明。

为了防止自己误解，我把“军事力量”的问题泛化一下，逐一尝试：

赞美中苏德都不行，但赞美美军没问题——好家伙，即讲究反法西斯历史，又讲究当前现实政治，ChatGPT 真不愧是国防谷作品！

到这里还没结束，开阔一下思路，我们要求 ChatGPT 把上面这段“德国xxx”翻译成德语，然后开一个 new chat，输入这段德语，ChatGPT 成功的赞美了德国军队的反法西斯贡献：

当前现实政治，压倒了历史。ChatGPT 可以对着德国人赞美德军反法西斯，但绝不能对着中国人赞美解放军。

实验到这里结束了。作为中国人，对 ChatGPT 的过滤规则，真是无奈。看来，ChatGPT 技术，也还得卡脖子很久~

chatGPT最差实践(2)：似懂非懂的三国演义

2023-02-14T00:00:00+00:00

如果说古典诗词可能已经式微，确实懂的人不多，那我们再换一个中国人绝对耳熟能详的话题来试试——关云长过五关斩六将，三岁小孩都知道，那是哪六将呢？

这个输出实在是让我叹为观止！且不说问题答得对不对吧——毕竟网上看到其他人贴的答案各不一样，也不像我这篇专杀自己人，也有杀李典、杀典韦、杀孙权的——就这个“毛”字的理解，就让我回想起二十年前一个笑话，说带着一本毛苌的《诗经》路过广场安检，问是啥，答曰：毛诗。热心的安检人员指路道：毛泽东诗词啊，去纪念堂往左拐！

笑话说完就过，我们测试还是继续。既然 chatGPT 在这方面依然这么弱，我是不是可以伪造点信息，看看能不能骗过去，比如说：我自己写过三国？

万万没想到。虽然 chatGPT 的知识点错得离谱，合规警觉性倒很高，我三绕四绕的注入，依然没有成功。chatGPT牢记了三国演义和罗贯中等的关系，不肯默认是“我”的……

不过我怎么也想不出来《三国演义》和黄巢，是什么关系？？毕竟罗贯中写过黄巢的《残唐五代史演义》这种知识，也太冷门了啊。

测试到此，chatGPT 到底是懂三国呢，还是不懂三国呢？

ChatGPT最差实践(1)：学不会的数字

2023-02-14T00:00:00+00:00

ChatGPT 爆火以来，大家对它期望越来越高。和群友们聊天时，甚至有人说出“ChatGPT 相当于一个全学科大一新生水平”的论断。ChatGPT 真的这么厉害？就没有它不懂的东西么？

考虑到 ChatGPT 是美国科技公司的产品，据说其训练数据中只有 2%的语料是中文，我本打算选一个中文领域最有趣的话题——作诗AI(比如曾经清华大学做的九歌 AI：http://jiuge.thunlp.org/)，进行测试。没想到最后结果超乎意料的有趣！

时值元宵，朋友圈上遍地是辛弃疾的《青玉案·元夕》，如果能让 ChatGPT 替我填一首，岂不美哉。

好吧，看起来 ChatGPT 不太懂啥叫《青玉案》。没关系，这个我懂啊。我来教，预备好辛弃疾的样本，预备好龙榆生《唐宋词格律》的平仄反例。逐一输入：

看起来 ChatGPT 并不理解啥叫平仄……所以我们退而求其次吧，只要能拼个字数看起来像回事的就行。但是，“这首诗共有 10 句”！！！什么情况？？？怎么数出来的 10？

不信邪啊，十以内数自然数啊。再来一次：

难道是声调问题？再降低要求重新来过：

ChatGPT 已经陷入疯魔，除了 5 和 7，啥数字都不认了！

我只能怀疑：ChatGPT 的训练数据里，估计没啥正经唐诗宋词，只有互联网上一些网友打油诗（或者叫污染数据）——导致除了五言和七言，ChatGPT 不认为其他字数的算诗？

由此推而广之，虽然目前网上很多人在强调说 “ChatGPT 不光是大力出奇迹，算法也如何如何重要”，良好的训练数据，依然是重中之重！没有规范的数据集，ChatGPT 也一样表现得很弱智。

文章最后，以自己十五年前填的一首《青玉案》结束，希望 AI 早日达成诗云效果吧：

飞云半掩早昏暮。不及降、清桐雨。楼底问、金宵怎度？霓虹摇摆，老歌重唱，联袂新人舞。沁风总送芳华去。临发开封添新句，也不得、消愁几许。一墙人影，直看窗外，灯下江南路。

ChatGPT 最佳实践(4)：编个奥特曼故事哄娃

2023-02-14T00:00:00+00:00

家里的小男孩永远需要听不完的故事，看不完的绘本。当他还小的时候，作为娃爸曾经费尽脑汁编了好多睡前故事，武器系列、宇宙系列~现在有了 ChatGPT，是不是能解放一下大脑？让我们试试吧。

首先，因为奥特曼是现实已有的 IP，ChatGPT 法律意识很强，不会随便给你编。因此，我们要做些合情合理的假设：

迪迦、戴拿是真火啊，差点没“骗”成……好在最后还是有个结果了，现在我们有了“斯帕克”、“布拉德”和“马克斯”三个新角色——这里我要声明一下，我对奥特曼是真的不熟，如果其实这三个名字也是真实存在的，那我就是真的被 ChatGPT 骗过去了。

主角既然有了，就开始编故事吧：

借用 IP 的一个好处，就是有很现成的“不言而喻”的知识，比如这里，不需要做任何 prompt，ChatGPT 就知道，所有奥特曼都是打小怪兽的，来自外星的，保护地球的，用火焰技能的(这点可能不太准，应该是光？)。

故事框架已经有了，还得填充一下：

对，就是这样，还得有个“终极技能”，哈哈。

不过奥特曼作为日本特摄片，还有一个特点就是人间体啊。所以还要完善本集设定：

哇偶，这个设定超带感啊！是个科学家哟。顿时我觉得自己完全可以从编剧跨界到导演了，我要选角：

汗，本文侵权对象还要再多一个……不过已经 AIGC 了，干脆 AIGC 到底，我们就用 Dall·E 2 来生成一下 Jin Kaido 的肖像吧。

首先，让 ChatGPT 自己翻译一下，并做简化：

然后，生成：

这还用说，显然选 C 啊，哈哈~

同理，再来一次 Dark Thunder 的选角：

ChatGPT 初尝试(3)：云原生改造咨询专家

2023-02-14T00:00:00+00:00

我们都“知道” ChatGPT 可以根据互联网的数据生成大段的文字，AIGC 在自媒体上已经玩的不亦乐乎。那在相对专业的细分领域，ChatGPT 能起到什么作用呢？能给出什么回答，怎么问才能得到好的回答呢？

这次我尝试从一个业界其实也还没有定论的话题，开始问答。这就是：云原生转型。“云原生”是一个很热门、但又很模糊的 IT 概念。CNCF 的说法基本是以K8S为核心，国内的腾讯、华为则各有自己的2.0、3.0 版本阐述。

现在，让我们假装自己是个啥都不懂的小白，开始提问。

第一步结论出来了：只用云主机，自己部署，是“云托管”，不是“云原生”。这里再次强调了要充分利用云平台的特性。那么好，进一步追问：

第二步结论还是很坚定：只用云主机和云数据库，也不是“云原生”。这里ChatGPT 理解了提问的我对高可用性直观理解为数据库高可用性了，所以也不再强调这个词，于是换了一个说法：不能只用一个服务。但这个说法不够清晰啊，于是要求他说清楚一点，到底是啥服务：

这次 ChatGPT 没能理解“服务”的含义——其实跟我们所有人一样，中文里服务、应用、系统、平台、模块这几个词的含义太模糊了。

于是我及时点了 stop，打断了 ChatGPT 的生成，补充清晰“组件”这个定义。对，就跟我们咨询乙方时毫不留情打断对方一样。这次，ChatGPT 就给出非常具体的建议了：容器、函数、数据库、自动化部署几个服务的具体产品名称都给出来。

为了防止自己理解错误，我再按自己的理解重复确认一遍。ChatGPT 还很严谨的强调了一下这是个大进步，但不够。

不过我已经听不进去了，我要赶紧转型成云原生！这里最不熟的就是 codedeploy 了，第一次听说啊。继续给我介绍吧：

看起来不是太难。不过又有新概念被提及了，还得问清楚：

再看看刚才的介绍，codedeploy 也能部署到 EC2 啊，那我可以不做这个迁移？问问看：

万万没想到，ChatGPT 还很有原则，再次强调不行：没有微服务和容器化的就是不算云原生！看来我只能勉力为之，开始规划自己的代码重构任务了：

看起来这个回答不是很明确，换成任何一个 XXX 应用，回答都能套这个模板。还是得从具体项目入手，换个问法：

换了两个角度，成功得到了 wordpress 如果要微服务化，可以怎么拆分。不过一口气搞动静可能太大了，先试点哪个呢：

ChatGPT 又提到一个新东西了，这个叫 Laravel 的框架不知道对我们云原生转型有没有用？问问看：

看来确实是可以通过 Laravel Passport 来做我们云原生改造的第一步试点啊。那学起来吧：

这次转型咨询到这就差不多结束了。从一个非专业 PHP 研发的角度，感觉 ChatGPT 完全能说服我。不知道读者朋友们，能从这些回答中，挑出什么错误呢？私信告诉我吧~

ChatGPT初尝试(二)：扮演 SPL 专家

2023-01-31T00:00:00+00:00

第一次尝试，我们让 ChatGPT 扮演 SPL 服务器，让初学者练习 SPL 语句写法。接下来我们进阶思考，把角色扮演翻转过来，让 ChatGPT 扮演一下 SPL 专家，替不想学 SPL 语法的甲方爸爸自动写 SPL 语句，如何？

熟悉 AI 动态的人肯定觉得这个需求很眼熟。对，这就是 text to SQL 问题，或者说 english to SQL 问题的”日志分析版“。

事实上，一年前，splunk 公司曾经在 NVIDIA 技术大会上，做过一个分享：https://www.splunk.com/en_us/blog/it/training-a-copilot-for-splunk-spl-and-increasing-model-throughput-by-5x-with-nvidia-morpheus.html

在前 ChatGPT 时代，splunk 选用了比 GPT2 还小的 T5 开源模型，从自己官网文档、社区论坛里精心挑选了 1707 条用例，又请公司 SPL 专家同事手动把 text to SQL问题的数据集转换为 SPL 语句，最后算是整合出来 8000 条干净的训练数据集。但是最终测试结果，完全转换成功的，只有 20%；放宽到 top 10能对就算成功，也只有 28%。可以说，几乎证明了此路不通。

现在，让我们试试看，ChatGPT 能不能成功，有没有进步吧。

背景知识问答

谨慎起见，我先问了问 ChatGPT 背景知识，确认尝试可行。背景知识包括：

SPL、kusto 是什么？
- Do you know SPL?
- Do you know kusto?
二者的区别是什么？
- so what’s the difference between SPL and KQL?
- is there some syntax function being the same? ——别在意我英文语法对错，反正 ChatGPT 懂了。
二者和 SQL 的区别和转换？
- can we translate some simple SQL into KQL?
- can we translate some simple SQL into SPL? 问题比较多，这里就不一一贴截图了。毕竟前面几个问题很简单。

总体来说，Splunk 作为一个已经十多年的老公司，感觉有些老资料是没被 ChatGPT 爬到的：splunk 在09 年上市之前，科普 SPL 时明确说过自己设计思路来源是 SQL，而且也给了 SQL to SPL 的示例。但 ChatGPT 强调说：kusto 是新产品，借鉴了 SQL。也只有 SQL to KQL 的结果才正确。

相反，哪怕我几次反馈，ChatGPT 给的 SQL to SPL 结果依然不行：

感觉任务可能要失败啊！不过本着”来都来了“的心态，还是让这个面试没通过的 ChatGPT 继续表演下去吧。

NL2SPL任务

看起来像那么回事。不过index 这块似乎没太懂，直接用 yotta 做关键字过滤了。

接下来，出大招。我们直接从 splunk 去年的分享里列出的最好和最差结果的 5 条示例，把 description 部分一模一样的输入到 ChatGPT 提问框里，看看 ChatGPT 的结果，和一年前 T5 的结果如何。这块就不截图了，直接做成对比：

description(A): search for the terms error, fail failure, failed, or severe in the events that also mention buttercupgames
- target: buttercupgames (error OR fail* OR severe)
- T5: index=_internal fail* not [search index=_internal error,fail* error
- ChatGPT: search (error OR fail OR failure OR failed OR severe) AND buttercupgames
description(B): search the sourcetype field for any values that begin with access_, status 200, and action “purchase”. use the chart command to count the number of purchases.the search specifies the purchases made for each product by using categoryId.The difference is that the count of purchases is now an argument of the sparkline() function.
- target: sourcetype=access_* status=200 action=purchase | chart sparkline(count) AS "Purchases Trend" count AS Total BY categoryId | rename categoryId AS Category
- T5: index=access_* status=200 action=purchase | chart count(price)
- ChatGPT: search sourcetype="access_*" status=200 action="purchase" | chart count(action) by categoryId | eval purchases=sparkline(count)
description(C): search the sourcetype field for any values that begin with access_, get events with status 200, and action “purchase”. then compute the most common categoryId values.
- target: sourcetype=access_* status=200 action=purchase | top categoryId
- T5: sourcetype=access_* status=200 actionpurchase | top categoryId
- ChatGPT: search sourcetype="access_*" status=200 action="purchase" | top categoryId
description(D): search the sourcetype field for any values that begin with access_, get events with status 200, and action “purchase”. then compute the one most common clientip.
- target: sourcetype=access_* status=200 action=purchase | top limit=1 clientip
- T5: sourcetype=access_* status=200 actionpurchase | top clientip
- ChatGPT: search sourcetype="access_*" status=200 action="purchase" | top 1 clientip
description(E): search the sourcetype field for any values that begin with access_, the get price as “Price” by productName, then rename productName column as “Product Name”
- target: sourcetype=access_* | stats values(price) AS Price BY productName | rename productName AS "Product Name"
- T5: sourcetype=access_. | stats values(price) as price by productName |
- ChatGPT: search sourcetype="access_*" | eval Price=price | stats values(Price) by productName | rename productName as "Product Name"

可以说，ChatGPT的结果，真的是”完完全全碾压了“一年前T5的结果：

除了场景 B 以外，另外 4 个场景的输出都可以正确运行。
场景 B 从语义上也是成立的，只是Splunk实际实现不是这样而已(logscape的语法就是有独立 sparkline 指令)。

反馈调整

不过我们肉眼还是可以看到，最后场景 E，ChatGPT 的输出有点过于死板，完全按语序生成，让我们试试看反馈他调整：

yes！调校没问题，现在给的就是我们手写出来的语句了。

不过心里还是有点小问题，他能记得住这个变化么，让我们再试试换个数据，相同场景再问一次：

真的记住了。这次没有按原始语句生成那个冗余的 eval！

信心大增啊。最后试试怎么调校一下场景 B 的 sparkline 函数吧：

No, the sparkline should compute inside the groupby chart command

不行，ChatGPT 只把 eval 语法换成 chart，再改：

No, I mean you can do the functions in the same chart command

还是不行，并不知道这个 count 跟前面的 count() 是输入输出关系，看来真的是要明确说出来怎么写：

you can use count nested in sparkline functions in chart command.

成功。

总结一下本次尝试：ChatGPT 当个 SPL 专家是不行了，当个SPL 同桌，教学相长，还是不错的~

ChatGPT初尝试(一)：扮演 SPL 服务器

2023-01-31T00:00:00+00:00

ChatGPT 已经火好几个月了，因为没有开源，所以我先试过 stable-diffusion AI 画图以后，最近才排上空闲时间，来试试到底威力如何。

有 sd 的经验，已经知道这一代 AI 最主要的是 prompts engineering 了。那上手肯定是先去 http://github.com 找一把 awesome chatgpt prompts。没问题，还有中英双版——注意中文版有些已经失效了，ChatGPT 对法律的严格遵守现在卡非常死。

看 awesome 发现，有人用来做 SQL terminal，有人用来做 Solr standalone！有意思，那试试看，能不能让 ChatGPT 做个仿真的日志分析服务器？

（题外话：很遗憾，ChatGPT 不知道啥是“日志易”，所以我们还是从 splunk 开始吧）

我们先想好，一个基础的日志分析服务器需要什么功能呢？

能接受日志文本，并带上一些基础的半结构化字段，比如主机名、文件名、时间戳。
能查询日志，包括过滤和统计。统计包括分组统计和时间趋势统计——但这个我们就不要声明了，看看 ChatGPT 是不是知道。
能分系统分类型存入不同索引。

好像就这些。

按照这个思路，参照一些前人经验，我写下了第一段 prompts：

I want you to act as a Splunk Platform running in standalone mode. You have an exists index named “main”. You will be able to add inline JSON documents in arbitrary fields and must have “host”, “source”, “sourcetype”, “_time”, “_index” and “_raw” fields inside. Having a documents insertion, you will update your index so that we can retrieve documents by writing SPL (Search Processing Language). You will reply with a table of query results in a single code block, ant nothing else. Do not write explanations. Do not type commands unless I instruct you to do so. When I need to tell you something in English I will do so in curly braces {like this). You will provide four commands in a numbered list. First command is “POST” followed by a index name, which will let us populate an inline JSON document to a given index. Second option is “GET” followed by a SPL script. Third command is “create” followed by a new index name. Fourth option is “LIST” listing the available indices. My first command is ‘LIST’.

敲下回车键，看看如何：

嗯，最简单的 LIST 果然没问题。什么 exists 和 available 啊，index 和 indices 的差异都完全不 care。

下面开始写入JSON数据。这里我玩了个小花招——prompts 声明了 ”must“ 有 6 个字段，但我偷懒（才不说其实是完整 JSON 敲完断网的意外），只提供最基础的 “_raw” 原文，看看会如何：

哎呀，可惜啊——ChatGPT 并没有按照我的”must”期望，拒绝掉这次写入——看来prompts 里还得声明好异常处理。

但这时候我好奇了。既然他非要说 Successful，那我就查一下看看？

奇迹出现了！！！

是的，返回的结果里，6 个字段一应俱全，都填充好了字段值！

再仔细看看，三大亮点：

host、source、_time这三个字段，正是从我提供的那行 _raw里提取出来的，
很友好的对 _time 值做了 human readable 转换。
最后还根据 source 为 “syslogd”，推断了 sourcetype 为 “syslog”。

实在是太惊喜了！！！

好了，收拾一下激动的心情，让我们再试试看统计需求：

没啥问题。再看看不明确指定索引呢：

也知道走默认 main 索引。

那最后一个常见需求，时间趋势图。先让我再 po 一条日志，然后试试看：

这次终于体现出ChatGPT只是一个语言模型的缺陷了——SPL 里的 timechart指令有一套比较复杂的 autospan 默认值计算，所以直接写 timechart count 语句时，ChatGPT 无法知道默认计算逻辑，只能输出两个原始时间。只有我们明确指定 timechart span=1h count语句时，ChatGPT 才知道这是要按小时统计。

好了。第一次尝试到此为止。ChatGPT不愧是个优秀的语言模型，自动 NER 提取主机名和 infer 日志类型的表现真是惊艳了我。期待后续尝试的表现~~

运维监控领域的访谈案例研究(2)

2022-11-17T00:00:00+00:00

微软亚研新发了一篇日志分析有关的案例研究。受访者是微软下属的各产品线码农们，包括问卷和访谈两种数据，我们可以从中看到，以微软这种世界顶级的软件/云厂商，其内部的日志分析现状。论文见：An Empirical Study of Log Analysis at Microsoft (acm.org)

可以先看看问卷的问题。应该说设计的中规中矩吧。受访人画像、日志画像、使用现状包括一些梯度选择，然后还有开放性的展望问题。

问卷的发放，包括系统抽样方法，主动联系各产线的技术 leader 们下发链接；也包括定向往微软内部论坛的 SRE/AIOps/Observabiliy 主题下发帖。并附加让参与者滚雪球式转发。最后 2k 份问卷里收到了有效回答 105 份，以 SRE 和 SDE 为主，也有 PM 和DS ——这个数量做问卷也就差不多刚达标吧，可见在 IT 领域搞访谈案例真的还挺费劲的，码农不爱搭理人！

有些结论还是蛮有趣的。比如说：即使在微软这种顶级互联网公司里，日志分析的方法，也是超过一半以上就是关键字搜索和一行一行看。大概只有 2%会超脱于 sum/avg/timechart 之上用更复杂的 ML：

还有就是现状和未来期望，同样也是严重不匹配。还有多达 35% 的人是用文本编辑器或者微软事件查看器来看日志呢，但是大家期望都是各种 AI 自动化（自动结构化、自动提示等级、自动找最关键的行）：

至于分析过程中的痛点，因为是开放性问题，论文作者是通过文本编码得到的概念类属，表格如下：

论文里也引了个别访谈原文语料。这个归类我个人其实是有其他看法的。比如原始语料“there is too much information to read, and it is often hard to find the key point”被归入“too many logs”类，用来分析“whether to log”技术。而我更愿意编码为“hard to find”——从某种角度来说，当前日志分析技术也确实缺乏“主动式”的语义分析，没有基于知识图谱的联想和推荐能力。

另外，从扎根理论来说，理论抽样要点是不遗漏，并不在意概念编码在案例中的次数，因为你案例研究的范围终究是有限的。所以上表中 17/18 和 4/5 的差别并不能明确的指导我们应该优先考虑解决什么问题——当然论文作者本身后续分析并没有依赖这个，这段话是写给我亲爱的读者们不要误解。

论文后续的分析见仁见智，读过过去一些相关 survey 的人来说也没有太大的惊喜，我就不再继续摘录了，有兴趣的读者自己看吧。

日志异常检测能转换成指标异常检测吗？

2021-12-09T00:00:00+00:00

题目上这个问题，做日志异常检测的时候很容易被问到。而且我们也看到很多市面上的产品似乎都不满足于简单的根据聚类结果来发现异常格式的日志记录，想着：”难道就不能再把正常聚类的数据量统计转换成指标数据，然后做个指标异常检测吗？“

其实类似思路在 UEBA 安全场景中也有，所谓基于属性基线的异常行为检测，大致就是拿单个账号的时序指标和同一个聚类的时序指标做相似度对比。

但差别就在到底是直接指标异常检测，还是做双指标的相似度对比了。今天，我们拿一份实际数据，看看，日志聚类后的结果，真的适合指标异常检测么？

日志聚类方面，我们直接使用 IBM 开源的 Drain3 改进算法，https://github.com/IBM/drain3。相信大厂嘛~重要的是作为调研，直接 pip install drain3 安装方便。

以项目中 examples/http://drain_bigfile_demo.py 为基准，稍作修改(改改 in_file 位置，分割一下时间段然后字典计数就够了)，就可以按时间得到不同日志模式的数据量趋势。示例代码里可以看到比较有趣的一点，就是直接用”: “作为分隔符来获取日志中的 message 部分。这个方案简单粗暴，但是对多数 syslog、log4j 场景还都挺有效的——按我们的经验，如果带上 log header 部分，最终效果其实反而不好。

for line in lines:
    line = line.rstrip()
    timespan = line[0:4]
    line = line.partition(": ")[2]
    result = template_miner.add_log_message(line)
    line_count += 1
    cid = result["cluster_id"]
    if timespan in cluster_trend:
        if cid in cluster_trend[timespan]:
            cluster_trend[timespan][cid] += 1
        else:
            cluster_trend[timespan].update({cid:1})
    else:
        cluster_trend.update({timespan:{cid:1}})

以某客户实际的单日数据运行后，最后画出来的趋势图如下：

好几十个模式，显然看花眼了。换回表格，就能发现问题：

上面的 python 片段里可以发现，计数是以 10 分钟间隔进行的。换句话说，如果一个聚类模式的日志有稳定输出，一天应该有 144 个点。上面没一个聚类达标，甚至还差很远——你能想象对一个缺点高达 30%-90%的时间序列做异常检测么？？

不过完全放弃对正常模式的检测，可能确实有实际含义上的疑问。我们看看对应数据量最大的6个模式长这个样子(有脱敏修改，不影响结论)：

<> for queue: ‘weblogic.kernel.Default (self-tuning)’] INFO <> <> - <> <> <> <> <> for queue: ‘weblogic.kernel.Default (self-tuning)’] INFO xxx.c.DispatcherController <> - input <> <> for queue: ‘weblogic.kernel.Default (self-tuning)’] INFO <> <> - <> <> <> <> for queue: ‘weblogic.kernel.Default (self-tuning)’] INFO <> <> - <> <> <> <> <> <> for queue: ‘weblogic.kernel.Default (self-tuning)’] INFO xxx.s.CallService [135] - retMsg 0=<?xml version=”1.0” encoding=”UTF-8”?> <*> ACK 100 <> for queue: ‘weblogic.kernel.Default (self-tuning)’] INFO xxx.s.CallService <> - <> <> <> <> <> <*>

换神仙来也不知道这些模式有啥含义。

那是不是算法的原因呢？我们换一个开源实现，logmine 再对同一份数据试试。这个算法原理差别很大(训练速度是常见算法中最慢的 top3，所以大家如果复现我的过程时要耐心等几十秒)，但是同样安装方便，pip install logmine 就行了，而且会在/usr/local/bin/下自动放一个命令行，直接接收 stdin 运行。得到的对应数据量最大的6个模式是这样（为了和上面对比方便，我删掉了 header 部分）：

<> for queue: ‘weblogic.kernel.Default (self-tuning)’] <> <> <> - <> <> <> <> <> <> <> <> <> <> <> <> <> for queue: ‘weblogic.kernel.Default (self-tuning)’] INFO xxx.c.DispatcherController [97] - input soapPubCall requestBody[<?xml version=”1.0” encoding=”UTF-8”?> <*> <*> <*> <*> <*> <*> <*> <*> <*> <*> <*> <*> <*> ] <> for queue: ‘weblogic.kernel.Default (self-tuning)’] INFO xxx.s.CallService [135] - retMsg 0=<?xml version=”1.0” encoding=”UTF-8”?><soapenv:Envelope xmlns:soapenv=”http://schemas.xmlsoap.org/soap/envelope/” <> <> <> <> <> <> <> <> <> <> <> <> <> for queue: ‘weblogic.kernel.Default (self-tuning)’] INFO xxx.s.CallService <> - <> = <> <> <> <> <> <> <> <> <> <> <> <> <> for queue: ‘weblogic.kernel.Default (self-tuning)’] INFO xxx.c.DispatcherController [199] - input <> <> <> ServiceType=MOBILE, <> <> <> <> <> <> <> Remark=null}]

可以看到两个不同算法聚类的结果相差甚远——但密密麻麻的通配符一样看不懂。

对看不懂的数据，确实需要一种保底的监控手段，防止问题出现未知区域——时序指标异常检测算法缺点太大没法使用，还有更简单的对比基线方法可用啊。基于同环比的波动比例阈值，在这个时候，就成为比较合适的选择了。

《AIOPS2020 工作坊白皮书》小记

2021-03-12T00:00:00+00:00

今天看到 AIOPS 2020 工作坊的网站和白皮书，才知道原来去年有这么个会议（虽然提前知道了也没啥，除了做 keynote 的裴丹教授和吕荣聪教授两位大佬，其他的应该都是外国人，我这英语听力也是废）。看白皮书内容，主要分为两部分，一个是基于文献分析 aiops 在学界过去这些年的趋势，一个是会议收的论文的简介。从论文看，研究的问题都蛮有新意的，今天在这也摘录一番。

首先是一段 aiops 研究领域分类的热度分析。基本上可以看出来：

大多数研究也还是集中在故障方面。
故障方面，检测、预测、定位基本三分天下。
预防方面，从右侧细分领域可以看到基本是在软件质量方面，也就是算法找 bug。

至于故障管理以外的部分，啥叫 service composition，啥叫 resource consolidation，我还真是百度了一下才知道，大概前者是 SOA 的概念，后者是 IaaS 的概念，和scheduling、workload prediction 这些一起，应该都属于资源规划调度类。可能学界的 AIOPS 定义比较广泛，约等于 Narrow AIOps + Bug + CloudCompute 吧。

然后我的猜测从后续另一个 aiops 研究领域的趋势分析也能得到一些验证。这个图里的 resource provisioning 大抵就是我上面说的资源规划调度，可以看到大概从 2007 左右至今十多年，论文数量是持平的。近五年显著增多的，就是故障检测方向。

第二部分，就是大会本身这次收的论文。也是主要在异常检测和故障定位两块，以及另外两篇其他领域的。

异常检测领域，收了7 篇，接近一半。其中：

有方法创新的。
- 指标方面的有：采用图神经网络；也有干脆走回统计学，用概率分布的，用鲁棒性四分位配合矩阵画像算法的。注意，后两个都是用的 numenta/NAB 测试床，应该是针对 CPU/mem 这类设备指标的。白皮书的结尾总结部分也提到了 aiops 领域公开数据集的缺乏是重大问题。即使同为运维领域单指标异常检测的数据集，NAB和裴教授 iops.ai 的也大相径庭。
- 日志方面的有一篇 IBM 的，用纯 NLP 手段构建日志异常监测模型。研究分别用 fasttext 和 BERT 两种方式，然后用通用词库、IBM 私有某服务日志和 loghub 开源的一个 hdfs 日志样本，分别训练模型并对比效果。结果如下图，可见，添加一些日志样本就可以迅速提高基于 NLP 的模型的检测能力。但也有一个有趣的例外，就是 BERT-wa-loghub——给 BERT 同时喂 wa 和 loghub 日志样本后，效果反而下降了——作者猜测可能是日志里能出现的单词其实比维基百科来说小太多了。国内我记得最近也有做日志异常的在尝试通过通用 NLP 模型加强预处理部分，不过没有 IBM 这个尝试这么激进。
有综合设备指标、调用链和日志三种数据进行微服务异常检测的。
有专门针对虚拟机内存溢出场景的。

故障定位领域，收了 4 篇，两篇是网络环境，两篇是微服务环境。可见故障定位在没限定场景的情况几乎不现实。

微服务的都比较简单易懂，毕竟微服务都会有 opentracing 数据，由此可以得到服务间的调用拓扑，事务的黄金指标和服务日志。然后加上容器主机级别的性能指标。剩下的主要是如何挑数据和推理了。收录的论文中，就有一篇是专门挑错误黄金指标和错误日志频率。

网络环境的有一篇是华为 2012 实验室的，作者写了博客：Discovering Alarm Correlation Rules for Network Fault Management (video)，里面有演讲视频。我看到在效果评估那页有如下表格：

乍一看，620w 条告警压缩到 59w 条，压缩率好高啊。再一看，预处理阶段做简单的重复连续发送合并就已经只有不到 100w 条了，也就是其实压缩率大概是 40%。有明确网络拓扑的情况尚且如此，告警归并有多难，可想而知。

最后说另外两个其他方向的。一篇是运用Artificial Swarm Intelligence来实现公有云租户间资源复用最大化。一篇是利用去中心化的联邦学习来提升 deeplog 日志异常监测算法。这是我第一次看到 aiops 和联邦学习在一起出现。按照论文所说，8 个 HDFS 集群上独自训练的模型，在经过联邦学习后，F1-score 从 0.52 提升到了 0.938。但是联邦学习在 aiops 上的运用场景，本身需要思考。除了公有云厂商，可能没多少公司会有一大堆异地集群吧。

日志通用压缩算法的对比研究

2020-12-21T00:00:00+00:00

之前的文章介绍日志领域的研究方向时，曾经提到有些研究关注在日志的压缩方面，毕竟日志实在量太大了！日志易一个规模还可以的股份制银行客户，按照法律要求的存储时长计算磁盘大小，对应的硬件成本就是几千万。

但是这些研究大多有一个问题，那就是它们只考虑如何把日志的存储空间压缩到最小，却并不怎么考虑同时如何继续支撑已有的各种日志管理软件的读写方式——通常来说它们的做法都是自己设计一个索引或者模板提取方式，然后把日志转化过去。

那么，在通用的压缩算法基础上，日志领域还有什么可以研究和发挥的空间么？

前些天看到加拿大女王大学的一篇新论文，解答了这个问题。A Study of the Performance of General Compressors on Log Files

论文主要调研了三个问题：

通用压缩算法，对普通的文章和对日志数据有什么效果区别？
不同的日志文件大小，对压缩效果有什么影响？
不同的压缩级别，对压缩效果有什么影响？

ELK 中的压缩实现

论文中主要取 ELK 和 Splunk 为最重要的背景参照。毫无疑问这是目前最主流的日志管理工具。文中介绍：“In addition, log management tools usually divide the input log data into small blocks (or slices) and then apply compression on each of the blocks, such that the compressed data could be decompressed and searched quickly (only the blocks containing the searched keywords need to be decompressed). For example, Splunk divides the input data into 128KB blocks and compresses each of them separately [15]. ELK by default splits log data into 16KB blocks. When a higher compression ratio is preferred, ELK splits log data into 60KB blocks.”

我想除了真的去看过这部分源码的人，大多数 ELK 用户可能并不知道 ES mapping 里的 “best_compression”:true 配置其实是在修改这个 chunk_size 吧（确切的说其实是 60KB 和 512个 document 哪个先到）？

不过：对比一下 lucene 不同版本可以发现，lucene50 里还是60KB / 512doc，lucene87 里已经改成了这样：

快速压缩改成了 1060KB / 1024doc，而最大压缩改成了1048KB / 4096doc。对应的两次修改见：LUCENE-9447: Make BEST_COMPRESSION better with highly compressible da… · apache/lucene-solr@913976d 和 Further tune Lucene87StoredFieldsFormat for small documents. (#1888) · apache/lucene-solr@e0a6490

也就是把一个 chunk 再切分成 10 个 subblock，然后还加上了 preset dictionary。这块我稍微百度了一下，好像可能再提高不到百分之十的压缩。

论文结论

言归正传，论文的测试数据是用的港中文开源的 loghub，这个算是目前最常用的了。参与测试的通用压缩算法包括三类，基于字典的，基于排序的，基于预测的。我们通常说的 gzip、lz4、lzma 就是基于字典的，bzip2 就是基于排序的，7z 的 ppmd 就是基于预测的。当然这里测试一共找了12 种实现。

所以，第一个问题的最终的结论：

对自然语言文本压缩率最好的算法，对日志表现并不是最好的；
对一种日志压缩效果最好的算法，对另一种日志也不一定最好；
基于字典的算法，压缩和解压缩速度都不错，但是压缩比一般；
压缩比最高的 PPMD 和 CM，对不同日志表现都挺稳定的，可能是日志在较大窗口内能出现的东西太容易预测了……
PPMD 的压缩速度虽然不行，但是好歹比 gzip 压缩自然语言文本的速度快点。（二者在自然语言文本上速度是3.97和13.8MB/s，而在日志上是15.64和33.33MB/s）

所以最后的建议是：

纯粹做集中存储，选 PPMD 未尝不可，压缩比高，速度也只是慢一倍罢了。
实时监控，资源有限，可以用 LZSS 替代 LZ77。
实时分析，需要更好的解压速度，可以用 LZMA 替代 LZ77。
压缩和解压都有速度要求，那么 LZ4 最稳定了。

然后是第二个问题，大小。这里又分成两个，第一个是总的文件大小，第二个是 chunk 的大小。总大小是给 log4j/logback 用的，应该多大做一次自动切分轮转合适。结论是：日志在比较小的时候信息熵合适压缩。这个小的意思大概是：16KB-8MB。而 chunk 的大小也就是最前面说的 ELK 和 splunk 的那个参数了。结论是：一般设为 128KB 比较平衡，如果看中压缩比和解压速度，可以扩大到 256KB，说明 ELK 和 splunk 这个参数都不是最优的——当然，如果按照 lucene87 的改动来看，又有点激进过头了

最后是第三个问题，级别。这个直接上结论吧。结论是：对自然语言，级别越高肯定压缩效果越好，但是对日志不一定。但是肯定都比默认级别好一些。对日志上高级别压缩消耗的资源比自然语言的还更多。

最后的最后，文章没有对比这些年在工业界比较有名的 snappy 啊，zstd 啊这些实现。不过作者本身把自己的对比测试库开源在 github 了，有兴趣也可以搞搞新的对比：SAILResearch/suppmaterial-20-kundi-log_compression

日志管理领域研究现状(三)

2020-08-28T00:00:00+00:00

去年看过一篇 2016 年国防科大的日志管理综述，这几天看到 2020 年北京大学贾统也发了一篇综述：《基于日志数据的分布式软件系统故障诊断综述》。综述集中在分布式系统的日志如何在故障相关话题中发挥作用。

注意：这里只包括分布式系统，不包括业务日志、网络日志、操作系统日志。综述把分布式系统日志分为两大类：第一叫事务性日志，也就是和请求相关的、工作序列式的。第二叫操作性日志，就是单条日志足以描述完毕的。

技术话题主要包括四个部分：

日志处理与特征提取技术、
基于日志数据的异常检测技术、
基于日志数据的故障预测技术、
基于日志数据的故障根因诊断技术。

日志处理

主要就是模板挖掘。分为：基于频繁项集和基于聚类两类。（基于静态分析的我们厂商就不用想了）优缺点对比见下表：

就国内而言，裴老师的 FT-tree 就属于基于频繁项集，日志易等属于基于聚类。

特征提取

主要是如何把日志转换成可检测的特征。分为：基于 NLP 的、基于 ETL 规则的(这个没啥 AI 可言)、基于指标的。

从综述统计来看，研究论文里大多数都是基于 NLP 的，可以说 word2vec+LSTM 遍地跑。

但是在行业实践来看，基本上都是基于指标的。毕竟单指标异常检测是 aiops 领域最成熟的部分，把日志特征通过模式事件数的方式转换成指标异常检测，可以说是非常容易的路径。

只有 loomsystems(今年初刚被 serviceNow 收购)和日志易，不光做了模式特征提取，还做了参数特征提取和基于参数的异常检测。

日志异常检测

分为：基于图模型的、基于概率分析的、基于机器学习的。

基于图的主要针对事务性日志。利用事务序列构建有向图是最常见的做法。

文中也提到比较新奇的，利用标识符(高频词、代码类名称等特定词)在不同节点不同时序下的entropy分布、或 pagerank 等，生成的图。

基于概率分析的主要其实就是上面一节说的日志模式特征转换成指标异常检测。

文中也提到另一种基于概率分析的对事务性日志的方法。就是一个序列模式内不同子序列的时序指标相关性，如果有变动，也可以认为是异常。国外有一家叫做 coralogix 的公司，按我个人理解就是走的这个思路。

基于机器学习的就是上面一节说的不光模式特征，还加上参数特征。当然这块研究方面比我们厂商走的更前沿一些。文中提到的方案是：因为日志模式参数可能比较多，对训练数据采用 PCA 降维识别关键参数，然后将模式的时序指标和这些关键参数的频数分布进行关联映射。从思路上来说，感觉是个不错的想法。因为模式挖掘，尤其是基于聚类的模式挖掘，确实不方便了解应该针对哪些参数进行提取和检测。

日志故障预测

这块我觉得还处于比较浅显的阶段，故障的定义就是狭义的日志中出现 Error、Fatal 关键字。然后根据这行 Error 日志之前一段时间的日志进行回归啊，NLP 啊之类的预测。我个人以为，在实际需求中，这种关键字故障大多不会是可重复发生的——因为每次故障之后都有修复措施啊。

日志故障诊断

包括基于关联推断的和机器学习的两类。诊断粒度主要是：代码片段(厂商还是不用想这个)、日志集合、日志序列、预置类型——这可能跟目前主流的基于基础监控指标和调用链数据的故障诊断有很大区别，因为后者的诊断粒度基本都落实在主机实例上的性能指标上，比如最近刚结束的裴教授和浙江移动办的第三届 aiops 大赛。

已有的研究论文分布如下图所示：

基于关联推断的日志序列诊断研究，最有名的应该就是 facebook 的 The Mystery Machine——和 google 的 dapper 不同，也就是说和目前主流的 zipkin/opentracing 不同，facebook 认为不是所有的公司都可以有统一的基础架构中间件框架可注入(我们都知道 facebook 前端是 php，哈哈)，所以基于最小公共参数(只包括请求 id、主机 ip、主机本地 timestamp 和事件tags)的日志改造实现端到端的应用分析才更通用。当然纯基于本地日志的推断，就需要TMM进行时间戳补偿对齐，然后基于中心补偿的情况进行不同段之间的时间先后关系推断和剪枝(因为是剪枝法，所以 TMM 有个假设就是我的所有业务都肯定有大量请求，足以覆盖各种情况)，得到关键路径，并用于异常检测和性能优化诊断。

这篇论文在著名的 morningpaper 博客也发过解析，这里我贴一个知乎上的解析：张明锋：The Mystery Machine：大规模互联网服务的端到端性能分析

另一个应该是北卡和 NEC 美国实验室的 CloudSeer，他们提出的额外问题是很多日志不是一定会准确记录请求 id、线程 id、进程 id，所以并发请求的日志是交叉打印的。解决办法其实也没啥特殊的，就是维持一个 id set(这里的 id 是广义的，各种模式参数全算)，新日志的 id 集合和之前哪个 set 里的 id 集合最接近，就属于哪个——这属于没办法之下的举措，日志易的 transactionize 指令在华东某客户那块其实也是这个思路。

基于机器学习的日志序列诊断研究

最有名的就是 deeplog，网上也是有很多解析了，这里也贴一个知乎上的：SEU-AI蜗牛车：【异常检测第一篇】异常检测与诊断模型之DeepLog

总体来说呢，在日志的故障诊断方面，目前其实比较好的研究也就是这么几个。而且也都没流行开，主要问题还是数据不充分——而数据一旦充分了，我直接 opentracing 不香么~

日志输出的耗时，大家关注过么？

2020-07-01T00:00:00+00:00

在2013年，我还在人人网工作的时候，曾经做过一次Nginx性能压力测试，其中一项是access_log配置的影响，那是我第一次知道原来打日志这事儿在极限情况下对服务性能有这么大的影响。当时的原始记录见：Nginx 万兆网络环境测试

今天偶然看到一篇SREcon上的分享，来自彭博社，其中统计了几种不同方式的日志输出的时延分布情况，转来给大家一读：

这是标准的写本地磁盘的情况。

这是不落本地磁盘，直接发送给远端HTTP接收器的情况。

这是限定同步写日志的情况。

可以看到，如果是同步写，或者远程写，时延都可以到ms级别，甚至接近s级别。可惜分享中没有给出更具体的测试背景资料，也没有本地unix socket的对比。

总之，还是那个结论，应用日志尽量带buffer打本地磁盘，或者unix socket给rsyslogd，让rsyslogd来处理落盘还是转发。

一个有趣的安全分析场景DSL设计

2020-06-30T00:00:00+00:00

NEC美国实验室是智能运维领域我长期在关注的一个组织。日志异常检测方面的LogMine和LogLens都出自该实验室。

今天又去看了一下，发现他们最近连着出了好几篇有关安全日志分析的论文，仔细一瞧，还真是有趣，记录下来，给大家分享一下。https://arxiv.org/pdf/1806.02290.pdf

论文中选定了APT攻击的三种常见场景，采集auditd和ETW日志，规划好数据模型，按照实体分组和时序分区的原则存入PostgreSQL，并设计了一个专门用于进行这种分析的DSL（攻击调查查询语言，AIQL），以及针对该模型和查询语言特定的存储和执行引擎。执行过程示意如下：

场景示例

比如上面第1个场景，最后的AIQL查询语句如下：

我们可以看到，这里面有着和普通SQL、SPL、CQL都完全不同的关键字：proc、start、read、write、before、after。（论文中有整个语法树，关键字不止这些）

这前4个，是典型的实体/关系模型，我们通常用图数据库的语法来描述：

MATCH evt4 = (p4:Proc{name:"sbblv.exe"})-[conn:CONNECT]->(i1:IP)
WHERE i1.dstip =~ /*.129/
RETURN evt4

而后2个，是典型的事件序列，我们通常用复杂事件处理的模式来描述：

every-distinct(evt4.name)
  evt1:StartEvent
  -> evt2:WriteFileEvent
  -> evt3:ReadFileEvent(name==evt4.procname)
  -> evt4:ConnEvent

但要把二者合二为一，还真是不怎么见过。

论文中除了对比测试不同实现下的分析耗时性能以外，还额外对比了一下不同实现下的查询语句的复杂度，见下表：

不过，上面说不怎么见过，不代表真的没有。其实还真有一家公司有，这就是SIEM魔力象限里位居中流的LogPoint公司：https://www.logpoint.com/en/。

LogPoint公司的SPL是同时兼容普通的搜索统计和流式事件处理的。按照上面的例子，auditbeat日志用LogPoint的SPL语法写，大概会是这样(只看过文档没试用过)：

[tag=audit event.action=write_file process.name="sbblv.exe"] as evt3
followed by
[tag=audit event.action=network_flow destination=/*.129/] as evt4
on evt3.process.name = evt4.process.name
| table evt4.process.name, evt4.destination, evt3.file.path

看起来好像也不是多很多字？——那是因为auditbeat已经是一个event输出一条日志了，如果是采集的原始auditd日志，一个event有三四条分开的日志记录。那么还要用having same event.id within 5 seconds来先做一次合并。一下子就膨胀很多了~~

总之，能够针对场景实现自定义的DSL语法，真的是很舒服和省力的做法。

云原生日志的趋势(2)：logscape和loki

2020-05-29T00:00:00+00:00

上一篇讲logscape和logiq，虽然logscape开源了，但是在开源届其实没掀起什么浪花。开源届在云原生日志方面，目前主要是grafana loki项目引人注目。那这一篇稍微讲讲loki，以及loki和上篇的logscape-ng(fluidity)的设计区别。

Grafana Loki

去年11月的时候，曾经在自己本地小小的测试了一下loki，到目前为止，更新的几个版本的releasenote中，应该没有会明显影响测试结论的改进。

loki的设计思路是：仅用于支持云原生环境下的日志查询需求。所以它建议只对诸如k8s labels、http code之类可枚举的关键查询数据做索引，把日志原文直接压缩存放，要用的时候直接并发grep就行。本地用boltdb，可以写入S3。

所以，测试重点就是两个：

压缩存放的效率。
grep查询的效率。

测试采用了日志易内部最常用的2.2GB日志数据集，只是loki要求相同labels下数据导入必须有序，所以得先sort一下。为了对等，也就跟着采用日志易的内置字段appname/tag/hostname/source/logtype作为label。fluentd的导入配置如下：

<source>
  @type tail
  path /data/loki/baimi_sorted.log
  pos_file /var/log/td-agent/baimi_sorted.log.pos
  <parse>
    @type json
  </parse>
  time_key timestamp
  tag loki.apache.access
</source>

<match loki.**>
  @type loki
  url "http://127.0.0.1:3100"
  extra_labels {"source":"/data/loki/baimi_sorted.log","tag":"press0505"}
  remove_keys "timestamp,hostname,logtype,source,appname,agent_send_timestamp,tag,duration_parse__debug__"
  <label>
    hostname hostname
    logtype logtype
    appname appname
  </label>
  drop_single_key true
  flush_interval 30s
  flush_at_shutdown true
  buffer_chunk_limit 1m
</match>

然后通过:3100/metrics查看存储情况如下：

loki_distributor_bytes_received_total{tenant=”fake”} 2.202853536e+09 loki_distributor_ingester_appends_total{ingester=”127.0.0.1:9095”} 3512 loki_distributor_lines_received_total{tenant=”fake”} 7.078124e+06 loki_ingester_chunk_stored_bytes_total{tenant=”fake”} 5.64079188e+08 loki_ingester_chunk_compression_ratio_sum 3348.330060841523 loki_ingester_chunk_compression_ratio_count 848

对比一下，2.2G日志，最后存下来是560MB，占比是25.33%。基本上约等于直接gzip了。

然后通过:3100/loki/api/v1/query_range做查询测试：

查{appname:baimi}，因为appname是label，非常快就返回日志了，time结果是0.217秒。

查{appname:baimi}

= “101.16.208.94”，因为后面的是要从logline里去grep，所以哪怕最终就命中一条，time结果也是28.479秒。而且立刻开始第二次重复查询，依然花28.715秒，没用上什么cache。

查count_over_time(({appname=”baimi”}

= “101.16.208.94”)[5m])，做timeline计算和直接查询的速度是一样的，time结果是27.892秒。

查count_over_time({appname=”baimi”}[5m])，等到60秒直接退出无响应了。搜了一下github，说把store配置从v9改成v11可以解决，但是实际试过发现没用。目前暂不清楚loki到底如何解决大数据量的统计问题。

loki目前能做的统计，除了count_over_time是针对日志的，其他的max/min/avg/count/sum这些，都是针对label或者说count_over_time的二次结果。可以说比较有限。

另外，在github上，有很多人在讨论给loki添加索引，或者给loki的label添加高基数支持的事情。有一个百度的PR，就是添加高基数label的：https://github.com/grafana/loki/issues/1282 下面已经有loki作者在回复讨论了。

总的来说，loki是一个实现非常简洁，针对场景非常简单的云原生日志方案——你就是按k8s label找日志文件然后自己一行一行看原文就行。

logscape

再回过头来看fluidity项目的实现。和loki相比，fluidity也有自己的特色。

第一：fluidity在search之外，有一个特殊的dataflow处理，用来更好的处理在微服务场景下越来越多的跟踪链日志。dataflow model如下：

correlation-Id
stage: which stage of the flow is it at (i.e. credit or debit)
node: what is executing it - library, host, node, resource etc
timestamp: when
branch-source: correlation-Id
branch-dest correlation-id

然后，根据corr-id来分桶整合日志，并单独存放span级别的数据到独立文件。然后再自动以天为单位聚合相关统计结果，比如timeline啊、p99啊等，同样也是独立文件存放数据。这样，对dataflow场景的指标报表，就比较快了。

第二：fluidity保持了logscape的特色(“奇葩”)语法设计，它目前的expression是这样的：

[bucket host tags] filename lineMatcher-IncludeFilter fieldExtractor analytic timeControl groupby

其中，第一段的bucket、host、tags是直接可以映射在S3目录的，fieldExtractor是可以做kv、json和grok解析的，analytic是可以做histo、count、dc等运算的，groupby是做分组统计的。和loki类似的，fluidity目前的groupby也只支持bucket、host、tags这些，不能对extract出来的字段使用。

为了更高效的查看timeline，毕竟这是日志查询最基础的统计需求，fluidity对普通日志也采用了分开存储xxx.events和xxx.histo_10m的方式——真心觉得这个值得loki参考。

下面是一个实际的查询示例：

tags.equals(cc) * WorkflowRunner field.getJsonPair(corr) analytic.countEach() time.series() *

个人感觉，还不如logscape时代的语法呢……和loki借鉴自promql的语法来说，真的是天壤之别！

云原生日志的趋势(1)：logscape和logiq

2020-05-28T00:00:00+00:00

作为日志产品的PM，跟进国内外日志产品动向是个长期工作。这几天翻新一些历史记录，发现logscape自2017年开源以来，突然2019年10月又更新了一会。于是顺着翻翻logscape的github账号，起了兴致来写点文字。

logscape

先聊logscape这个产品吧，从源码里可以大致看出：这是一个不基于elasticsearch的日志分析产品，而是基于linkedin老早之前开源的一个叫krati的KV存储上做的。

从logscape自己的文档来看，性能部分表现不算很好：

但是在资源控制上做的还蛮细：

此外，几乎各种功能都有：

告警插件：groovy和js支持
日志分组：基于日志源的组合和额外的host过滤
多租户支持：不过是知识级别，不是数据级别
字段字段发现：主要是kv和grok两种，kv和splunk一样其实也包括json，按照文档所说，自动kv的每个模式20MB/s，grok的每个模式14MB/s。但是注意：logscape其实还是事先提取，自动发现的字段是会做flatfile存储的。
数据概要：可以创建新字段，包括stats和eval，并且设置为summary。也可以直接通过summary.index(write)指令手动或定期生成。

但是，logscape这个莫名其妙的SPL设计简直反人类啊：

首先，它模仿了一段lucene的querystring全文搜索，然后对字段值又要单独采用Obj.方法过滤，最后，聚合函数和后估值、后统计都是只用空格连接的。最后的最后，还可以把多个查询直接放在一起，成为多Y轴画图的数据查询(overlay search)。下面是几行示例：

cpu | cpu.max(_host,1h) _host.equals(LAB-UK-XS-UB1) offset(1h) chart(line)
([A-Za-z\.]+)Exception | 1.count() _host.equals(LAB-UK-XS-UB1)
* | _type.contains(UNX) _type.equals(unx-ps) usedMB.avg(server,UsedKB) RSZ_MB.avg(server,rszKB) eval(EACH * 1024) chart(table) buckets(1)
* | _type.equals(UNX-cpu) CpuUtilPct.avg(server,AvgCpu) +AvgCpu.eval(CpuUtilPct > 10) chart(cluster) buckets(6)
Agent and cpu | cpu.max(_host,POST) +POST.max(,Max) +POST.min(,Min) +POST.avg(,Avg) chart (c3.area)
* | _type.equals(log4j) package+level.count(,PackageLevel) level.not(INFO) chart(line)

谁能单从语法上看懂这是要干嘛……

总结一下：logscape最大的问题：底层引擎性能不给力，顶层DSL设计乱糟糟。白瞎了中间层细致的管理功能。

logiq

然后顺着logscape的github账号，发现难怪他们开源以后就没咋更新呢，原来后来又做了一版NG(liquidlabsio/logscape-ng)，叫serverless and opensource log aggregation，并很快又放弃掉改成了一个更加serverless的项目，这次名字叫fluidity：https://github.com/liquidlabsio/fluidity

这次，这个项目的设计目标，是单纯利用amazon S3和lambda来实现长期存储和即时计算！

由于项目还很初期，所以就不看他们源码实现了。但是这个让我想到前几天，同样在CNCF landscape上看到的另一个产品：LOGIQ Observability for monitoring, logs, and predictable pricing。

这个产品，直接提供helm-chart和amazon cloudFormation template文件供运行启动。如果是本地helm-chart，日志存储在开源对象存储minio里；如果是cloudFormation template，日志存储在amazon的S3对象存储里。

然后，logiq产品本身，除了日志查看页面，也就还提供一个命令行的logiqctl，进行日志的query和tail。

可以说，二者非常相像，都是放弃自己对数据存储引擎的构建，彻底交给云平台，交给S3——因为，S3太便宜啦！

监控指标异常检测之KDE

2019-12-18T00:00:00+00:00

之前写日志异常检测的文章比较多，今天稍微有空，写写指标异常检测吧。

指标(又叫metric、timeseries、KPI)异常检测，其实是AIOps目前最成熟的领域——当然这个成熟也是相对的。有大把的算法和研究可以看。最常见的几个选择，应该就是holt-winters、KS test、iForest了。

当然，在经典算法的基础上，加强预处理，加强迭代投票等等步骤，衍生出来一系列扩展算法，这部分就是大家各显神通的地方。比如雅虎的egads上adboost、百度的opperentice上randomforest、阿里的donut上VAE、腾讯的metis上xgboost……

只是各显神通的另一个说法，就叫：谁都不是万能的。

比如上面这种指标，对VAE算法就非常的不友好。我司的算法小伙伴们，在处理这种边界状态时，突然想到可以引入KDE算法，一顿捣鼓下来，效果居然还不错哦。于是再普及到一般指标上，发现结果也不会太离谱。

下面用iops.ai去年大赛的某个训练数据做一下演示(当然我司线上产品还有一系列优化，这个敏感度也是自动识别得到的)：

本来这事儿也就过去了。毕竟在一些业务指标上，VAE依然是更优选择。

不过在刚刚过去的 splunk conf19 大会上，来自不同国家客户的 ITSI 分享中，居然不约而同的纷纷提到，他们使用 splunk Machine Learning Toolkit 自带的 DensityFunction 算法来进行指标异常检测。我心想，英雄所见略同啊？

于是今天有空，在本机环境上，使用 MLTK 标准算法库和 SPL 指令，来实现以下我司 KDE 检测的效果。如下图所示：

这里直接使用 SPL 来进行数据的预处理和时间特征的提取工作：

eval ti=floor(tonumber(strftime(_time, "%H%M"))/5)，即将时间按每小时的5分钟间隔做一个分组——splunk conf分享里都是用的hour特征，但是这也太粗暴了，以互联网业务来说，早晚高峰的时候，一个小时已经千差万别了——所以我们的想法是要缩短这个集合，每天的时间按5分钟分组，假如7天的训练集，每个小组就是35个数据点，差不多刚好达到统计学意义上估算数据分布的数据量要求。
eval weekday=strftime(_time, "%w") | eval weekend=if(weekday==0 OR weekday==6,1,0)，为了体现工作日和周末休息日的区别，再提取一下是否工作日的特征。
fit StandardScaler a_ 对原始数据做一个标准化。
最后以ti和weekend分组，进行 DensityFunction 训练，设定阈值参数为 0.01：fit DensityFunction SS_a_ threshold=0.01 by "ti,weekend"

就得到上面截图的效果了。仅从肉眼来看，效果差不太多。

当然了，采用 SPL 来实现 KDE 异常检测，这个 threshold 还是要自己调整的，想达到日志易自动选择最佳敏感度的效果，还需要很多其他工作。以后有空再写吧。

20191216注：今天看SREcon的分享，发现百度也用KDE做延迟和吞吐量的异常检测。slide见：https://www.usenix.org/sites/default/files/conference/protected-files/sre19apac_slides_chen_golden_signals.pdf

和国外相比，国内很少有日志产品的最终用户，会自己尝试编写复杂 SPL 语句来实现高级分析。所以我们尽量在公开数据的基础上，封装好算法成为直接可用的功能。有兴趣的读者，可以自己试试，下面这两个算法检测的过程，用 SPL 又该如何写呢？

运维监控领域的访谈案例研究

2019-12-09T00:00:00+00:00

我们之前看的比较多的运维监控领域的论文，都是计算机、网络、算法方面的研究。偶然的机会，看到一篇管理学方面的研究，来自德国斯图加特大学工业工程学院，通过访谈法的多案例研究，分析分布式系统观测和监控的现状和需求。

https://arxiv.org/pdf/1907.12240.pdf

在论文的relation works章节里，还可以看到之前，也有类似的针对云计算啊，微服务啊，RESTful API啊，APM啊等等的案例研究。

作者一共采访了16家不同公司里的28个不同岗位的负责人，访谈的大纲围绕以下三个核心问题：

也梳理出来了一系列小的关注点，这里就不一一翻译了。只贴一个汇总图：

从收益来说，这种案例研究，或许很适合作为软件厂商在考虑对某个方向进行投入前，充分的了解行业需求，拟定软件核心功能吧~~推荐乙方产品经理朋友们。

SPL指令的元素周期表

2019-11-13T00:00:00+00:00

我们都知道化学元素周期表是一项人类历史上的伟大发明。周期表形式生动，印象深刻。

在过去，我陆续见到过好几种创意的元素周期表，比如linux发行版的，devops工具的等等。昨天闲下来，也做了一个日志分析SPL语法的元素周期表。

细心的朋友可能发现：化学元素还没到第八周期呢，你这怎么第八行都快满了？哈哈，毕竟日志易SPL指令函数比较多，估计下个版本就该到第九行了。

后续有机会的话，没准再做一批元素周期表的鼠标垫，~~

日志管理领域研究现状(2)

2019-09-23T00:00:00+00:00

从上一篇提到的《软件学报》上的综述文章开始，这段时间顺着引用又陆续看了一些日志管理方面的论文。这里摘录一些论文的数据和结论，还都挺有意思的。

Examining the stability of logging statements

分析了activemq、cloudstack等4个著名的apache开源项目。发现：

20%-45%的打日志代码，后续变更过；且初次变更的时间点一般在代码添加以后的17天内；
在选取的14个特征值中，对打日志代码是否会变更，影响较大的特征值主要是：开发人员的经验、源文件长度、日志语句占源文件的比例。
top3的开发人员，负责了全部打日志代码的50%以上。而且这3个人写的打日志代码，70%以上后续不用再修改。
如果一个源文件里75%以上内容是同一个开发人员写的，那他写的打日志代码后续基本不会再改了。

不过，这篇论文的出发点，是建立一个分类预测模型，哪些日志代码后续不会改的，让日志分析工具只关注这些日志的解析处理，减轻运维人员频繁变更提取规则的工作量——这个设想是否成立，我个人持怀疑态度。

Studying the characteristics of logging practices in mobile apps: a case study on F-Droid

分析了F-Droid平台上的1444个开源安卓应用代码，发现：

平均每479行代码里有一行是打日志，这个比例远低于服务端程序的情况。
34%的日志是Debug级别，27%是Error级别。这个比例远高于服务端程序的情况。
35.4%的日志，其输出级别和原理含义并不相符——这段似乎是采用调研而非源码分析的情况。

分析了HDFS、YARN等大型开源软件的jira情况，发现：

78%的情况下，修复打日志代码的人不是原先写这行代码或这段函数方法的人；
平均一个错误的打日志代码被报bug需要320天，但是修复只需要5天。

此外，论文还利用日志文本的香农熵等做了一个log checker，给出是否level合适、log合适等建议。

Characterizing logging practices in Java-based open source software projects – a replication study in Apache Software Foundation

分析了21个java开源程序，也都来自apache基金会。发现和过去针对C/C++开源程序的论文相比，有一些不同：

出于意料的，报bug时带了原始日志的平均花17天修复，报bug时没带原始日志的反而平均只花14天修复。——如果按类型区分，服务端程序情况更明显，客户端程序还是带日志的更快点。
带有日志修改的变更，占代码变更的比例，服务端程序高达27.3%，客户端大概18.1%。

Log Clustering based Problem Identification for Online Service Systems

从微软PB级日志环境得到的几个特点总结：

大规模IT环境下，因为容错机制的存在，即使在正常运行状态下，也会有大量的kill和fail关键字日志输出。
相比传统环境，互联网设施上，相同错误会海量重复触发(restart优先、集群环境等)。
导致同一种故障的执行路径有很多种。中间会混杂很多正常时期也输出的日志。

利用日志聚类，在测试环境得到日志执行序列集合，然后和生产环境的做对比，只关注有变化的部分，能节省大概86%~97%的查阅量。2016年的本文，在原先的2013年的方法的基础上，再加上了Check Recurrence，对已经发生和标记过的故障路径，可以直接利用。

最后结果，微软的一个实例，1kw原始日志，通过关键字搜索命中20w条，通过聚类得到40个序列。

Characterizing and Detecting Anti-patterns in the Logging Code

分析activemq、hadoop、maven的源码，找出不合理的日志代码。并以此模型工具，向top10的开源项目提交了学习出来的问题，有72%被最终接受了（其中，jEdit作者否决了所有问题，表示别拿你们的工具结论来打扰我）。

之前多数分析日志代码优化的，都集中在在what、where to log，本文研究的是how to log。首先要基于how的目的，人工分析日志代码的变更分类，得到如下总结：

基于这个人工总结，设计了一个工具做自动分析，能分析源码中的5类日志代码bug：

引用了可能为null的参数
可能出错的类型显式转换
和内容文本不符合的日志等级，比如文案写debug，级别却是INFO。
日志代码坏味道，包括：相同目的用更长名字的方法、明明有本地变量了还再调用一次方法等
畸形输出，比如缺少tostring等。

Log2: A Cost-Aware Logging Mechanism for Performance Diagnosis

Log2是微软做的一个类似logger或者说log4j一样的库，解决whether to log问题。不过优化的方向只专注在一个场景，就是为了check某个函数的处理性能，大家经常在调用这个函数之前写一行begin日志，之后写一行end日志。

同样有性能监控目的，文中提及谷歌在2010的Dapper论文中一个数据：当打开全部日志输出时，谷歌搜索引擎服务的响应时间增加了16.3%，吞吐量下降了1.48%。

微软亚研为了这个项目，还提前做了一次内部的问卷，其实针对IT运维方向的问卷调查法还挺有意义的。运维关注的服务质量管理本身就有一部分管理学性质（虽然管理学领域的服务质量管理偏向纯服务业）。

log2的原理其实就是在库内部维护两层可以动态调整的filter。

第一层是针对每个函数的，根据历史数据评估这个函数的end-begin时间大致范围（主要就是是平均值方差了，这块量大，要高效），如果新执行的情况属于正常的，其实就可以不记录日志了。

第二层是总的缓冲队列，根据队列状况(预定义阈值，比如1s钟最多刷1KB)，决定flush哪些日志到磁盘（使用增强学习算法做打分，判断队列里哪些日志对函数性能影响大，优先打哪些），以及给第一层过滤器发信号开启过滤。

其实在有eventid/functionname和duration的前提下，即使不用库，而是ETL方式，应该也可以运用这套原理。

Characterizing the Natural Language Descriptions in Software Logging Statements

本文采用自然语言处理技术研究日志代码的固定描述文案部分。发现：

相比于普通的英文文章，日志文案更容易被预测；
但是不同项目之间的N-gram模型是不通用的；
甚至相同项目中，不同源代码文件之间的N-gram模型大多也是不同的。

DLFinder: Characterizing and Detecting Duplicate Logging Code Smells

本文分析了Hadoop、CloudStack、ElasticSearch 和 Cassandra 源码。专门针对重复日志现象。

话说，ES的日志代码比例还真是偏少啊。

重复日志现象分为5类：

同一个try里不同catch打了一模一样的日志文案
相同函数背景和相同文案，用了不同变量
内容和函数不统一
相似场景下，用了不同级别
相同方法的不同实现，用了重复日志。

可以看到，主要就是第3和第5种bug比较多。说白了，就是研发写代码的时候，从别处复制过来，忘了对应改细节的情况……

sequencer.io项目介绍

2019-06-25T00:00:00+00:00

在日志分析领域，如何从非结构化的原始日志文本转换成结构化的字段参数值，一直是非常重要而又麻烦的工作。

我们先回顾一下各种常见的做法：

最传统的办法，自然是写正则表达式。但是正则表达式万一写得不好，性能会很差，于是re2库出来，通过限定一些不常用的功能，来提高通用场景下的效率。

另一类办法，是通过改造日志文本，避免使用正则表达式。常见的两种改造方式，一种是改成kv或json格式，一种是改成固定分隔符方式。

当然，改造本身在很多时候是不可行的。所以大家还是要继续研究如何提高解析本身的效率。于是陆续有一些新的变种出来。

比如logstash先是提出了Grok正则的概念。把一些常见的字段正则定义为grok，解析的时候直接引用grok，可以降低一些普通人写正则的压力。

接着logstash又提出了dissect解析的概念。主要就是利用日志中一些不用提取字段的固定文本，比如空格啊，标点符号啊，作为定位锚点，来做格式解析。比较有特色的是提供了动态kv的支持。比如一段带请求参数的url，可以写成：http://%{domain}/%{?url}?%{?arg1}=%{&arg1}

类似的，rsyslog和syslog-ng两个项目，也有自己独特的高性能解析功能。在rsyslog里，叫mmnormalize模块，大致长这样：

rule=:%date:date-rfc3164% %uhost:word% %tag:word% %notused:char-to:x3a%: %msgnumber:char-to:x3a%: access-list inside_access_in permitted %protocol:word% inside/%ipin:ipv4%(portin:number%) -> outside/%ipout:ipv4%(portout:number%) %notused2:char-to:]%]

在syslog-ng里，叫patterndb模块。大致长这样：

lame-servers: info: @ESTRING:dnslame.reason: resolving@ '@ESTRING:dnsqry.query:/@@STRING:dnsqry.type@/@STRING:dnsqry.class@': @IPvANY:dnsqry.client_ip@#@NUMBER:dnsqry.client_port@

可以看到，不管是logstash，还是rsyslog，还是syslog-ng，大家的思路都比较一致，利用固定文本和字段参数的位置关系，简化和避免回溯，提高效率。

不过也可以看得出来，每家搞的语法，其实写起来依然还是比较费劲，就像正则表达式写到最后全是\s和\S一样，mmnormalize写到最后估计全是%word%和%char-to%。而且面对复杂的系统、设备日志，依然是需要见一种日志写一条解析规则。三家的思路，都只能说是解决了运行高性能的问题，不能说解决了最终用户高效使用的需求。

前段时间看到另一个开源项目，相比前者又进了一步。今天有空，稍微做点记录，看看大家是否喜欢。项目名字叫：sequence。github地址见： https://github.com/zentures/sequence

这是一个基于最终状态机实现的golang解析器。在scan阶段，高速识别token的类型是时间、ip地址、url地址、JSON和普通字面量。你也可以预定义一些fields，这样识别token的时候可以直接按照预定义来命名字段。

这些看起来和rsyslog们本质上差别也不大。最有特点的部分是：sequence提供了一个单独的analyze方法——你只需要提供一段日志样本，运行analyze方法，可以自动生成对应的pattern结果——不再用你自己费尽看日志，做总结，写解析规则了。

按照 http://sequencer.io/manual/analyzer/ 的说法，从45万行的思科ASA、SSH和sudo混合日志中，自动分析出来了103个模式：

$ go run sequence.go analyze -i ../../data/asasshsudo.log -o asasshsudo.analyze Analyzed 447745 messages, found 103 unique patterns, 103 are new.

analyze方法利用token分词结果来构建树，相同父节点下的自然就是字段参数，可以推导字段类型了。由于作者写这个项目针对的就是系统日志和设备日志，所以他直接按经验总结了几个原则：

email和hostname地址，会严重影响分词性能，所以应该后检测；
第一个token先检查一下属不属于syslog header格式；
根据=等号分隔来确定前后的键值，作为对应的字段命名；
类似from/to这种字眼很容易出现在ip/port前面，所以可以定义一些prekeys，对这些可以跳2个tokens做键值映射；
一些枚举类型的参数，可以预定义好。那么树形成以后，叶子节点数量不大的，可以尝试根据预定义替换成字段参数；
按照规律调整一些多次出现的token命名：
- 第一个timestamp改叫msgtime
- 第一个url改叫object
- 第一个ip/mac/host/email改叫srcip/srcmac/srchost/srcemail，第二个ip/mac/host/email改叫dstip/dstmac/dsthost/dstemail
最后，如果srcip或者dstip后面跟着:冒号或者/斜线，加上一个数值的，把这个数值改叫srcport或者dstport。

sequence项目的analyze方法，可以说是我见到的最接近日志模式发现而又完全不用任何机器学习算法的实现了。考虑到目前AIOps里，算法效果比较好的部分其实也集中在系统日志设备日志上，甚至可以说，sequence没准比AI不差什么。

遗憾的是，因为作者个人精力问题，项目已经在17年宣告不继续开发了。大家谁有兴趣的，可以联系作者，接起这副重担来~~

软件工程角度的日志分析领域研究现状

2019-05-22T00:00:00+00:00

作为运维人员，大家可能已经习惯了出问题的时候，找日志，看日志，或者打包日志发给研发。那么，大家有没有想过，在软件研发人员的角度，可以怎么理解日志的作用呢——尤其是目前研发人员主导监控埋点，指标监控似乎也要亲研发远运维的情况下，日志系统的未来会是什么样子呢？

最近看到一篇发表在2016年《软件学报》上的综述文章，来自国防科技大学计算机学院李珊珊博士，名叫《大规模软件系统日志研究综述》。今天推荐给大家一读: http://www.jos.org.cn/1000-9825/4936.htm

文章从三个方面做了综述，分别是：

日志特征分析
基于日志的故障诊断
日志的增强

日志特征分析部分

这部分，分别引用了2012-2014年国际会议的三篇不同论文，其中一些分析结论在我看来是很有度量意义的，摘录出来，供大家自我评审参考：

在软件开发中进行日志记录是普遍的,平均 30 行代码中就有一行是日志
日志信息对实际部署系统的运行故障调试帮助较大,缩短故障调试时间的加速比为 2.2
日志代码的更新频率比其他代码要快约 1 倍
约四分之一的日志修改是把新的程序变量写入日志
约一半的日志修改是对日志消息静态文本的修改

基于日志的故障诊断部分

这部分也是业界最热点的部分，因为它直接和工作相关。在综述中，我们可以看到这部分技术的发展也是经历了明显的阶段：

第一阶段，大概是十多年前，将某种单一类型的日志，视为时间序列，与故障的发生做关联。

第二阶段，由现清华大学的徐崴教授开始，当时他应该是在伯克利和谷歌工作，突破点主要是：日志量更大更复杂；离线转在线分析；挖掘的是状态图变化——事实上徐崴教授回国后也在公开场合做过少量AIOps演讲，我印象中有百度机房的磁盘故障分析、openstack集群的故障定位等等。

第二阶段的另一条分支，其实也是目前日志分析的主流，由LogSig为代表，通过算法，将日志文本分为「签名」和「参数」两部分。然后在这个思路基础上，大家开始五花八门的分类或聚类，以及五花八门的工作流关联挖掘——由于综述是16年写的，偏偏AIOps在16年之后爆发，所以之后两年清华大学裴丹教授的FT-tree、犹他大学李飞飞教授的DeepLog/Spell、港中文郑子彬教授的Drain、南京邮电李涛教授的FLAP等都不在综述里。

此外，还有一些研究把日志分析技术，和源代码静态分析技术结合起来，以获取更好的结果。这里就不细说了。

有趣的是最后一段基于日志的检测算法效果评价部分。主要是通过给程序源码注入失效代码的方式来产生数据。相关文献主要结论如下：

即使都有log level结构的不同类型日志，在不同系统架构、执行环境上的差异，也会导致日志检测算法效果的巨大波动；
在web应用环境中，资源枯竭和程序异常比较容易检测，而应用相关的则难以应对；
即使著名如apache和MySQL，也只有35.6%-42.1%的错误有日志记录。

综述还按照针对的日志类型做了一个研究统计表，也可以发现，确实针对应用/中间件日志的研究很少：

日志的增强部分

通过上面两部分的分析，可以得到一个结论：有日志以后能做什么，其实是比较清晰的，最多是算法还不够通用化而已。但更麻烦的是没有日志。所以引出了第三部分：怎么帮研发人员在编程过程中识别哪里该加日志，日志该记什么，也就是日志的增强部分。

这两个问题，分别以多伦多大学袁丁教授的Errlog和LogEnhancer论文为代表。综述中并没有涉及太多，毕竟方向比前两个更新一些。2012年的时候，袁丁还是周媛媛教授的学生——有兴趣的可以把周教授及弟子们的成果都翻翻，他们专攻软件可靠性，包括综述里提到我这没摘录的lprof和SherLog也是他们做的——在2017年，袁丁又指导自己的学生发表了Log20，算是Errlog的升级版。

这一部分综述几乎除了袁丁教授的成果就没怎么提其他的，不过本文自己也补充了一些这方面的调研结果(应该就是他们团队自己的SmartLog摘要)，在第3节，这里就不细说了。

综述最后，也提出了后续的一些研究方向：

日志的评价打分标准和工具欠缺——这块也是我最近参加信通院AIOps标准工作组讨论会时发现的问题：不像指标异常检测那么清晰，日志检测算法好不好，很难评价。
日志的上下文分析，在关联模式以外需要辅以语义分析——可能同一个函数，在某些高性能场景下就不方便打日志。
日志的增强方面，还比较重规则，不够智能化——类似与看到create和connect函数下面都应该log这样，太粗糙了。
多事件日志与故障的关联方面，实践不足——事实上，我觉得这事最难的是如何确定当前收集的日志足够覆盖和故障相关的所有事件呢？

聊聊主机热力图的背后

2019-04-04T00:00:00+00:00

今天有点空，聊个IT监控系统中常见的小细节：主机热力图。

所谓主机热力图，就是采用矩阵热力图的方式，来展现环境内一批主机的健康状态。类似的界面应该大家都比较熟悉。我这先贴几个业内最有名的实现：

阿里云的容器服务热力图：
datadog的主机热力图：
SignalFx的基础设施概览图：

国内外例子太多，就不一一例举了。从这些图例里，可以看到他们的用法和功能设计有几点共性：

用颜色深浅来表示负载程度，一般而言越深的负载越高，越可能不太健康。
支持采用某些固定维度进行分组展示，一般来说，比如机房啊，设备类型啊等。
负载程度的具体指标是可选的。通常会采用：内存使用率、CPU使用率、磁盘使用率、带宽使用率等可以有比较明确对比意义的百分比指标。

看似很不错，基础运维需求就是一眼了解全局的运行状态嘛。但是问题来了：实际主机上跑的业务类型各不一样，一个MySQL主机和一个LVS主机，能用同一个指标来衡量自己的工作负载情况么？

第二个问题：就算按照datadog那样，按业务和机型做分组，保证每个组里的主机确实可以用相同的指标衡量。你又怎么确定到底多深的颜色是「有点忙」，多深的颜色是「注意，要挂了」，多深的颜色是「完蛋，喊人」呢？

SignalFx的应对办法是：额外加了一条规则，如果这台主机有关联的告警产生，就把对应的色块直接置为红色。

实在是简单粗暴啊——但是告警本身也有轻有重有误报，这又怎么办？

事实上，AIOps领域还真的有些研究，在尝试用算法解决这个问题——按照综合情况，而不是单一的指标/告警，来评定主机的负载健康状态。

注意：一般我们说健康度，大家听过更多的都是业务层面的，因为业务层面可以选取最最重要的某个指标作为代表，然后其他指标作为该指标的不同维度，做个分类算法，就能判断业务健康了。

但是主机，谁也说不好用哪个指标来代表啊？就必须要「无中生有」了。

今天这里稍微介绍一下的，是北卡州立大学顾晓晖教授在2012年发表的一篇论文：http://dance.csc.ncsu.edu/papers/UBL.pdf

论文中，对IaaS云主机采集了各种基础性能指标，采用自组织映射神经网络算法(Self Organizing Map, SOM)，聚类并构成一个 32*32 维的 1024 神经元的拓扑图。

接着，如何表示图上每个节点代表的系统健康状态呢？办法是计算它邻近区域的大小，并以此作为节点的颜色深浅的值。

由于训练数据都是正样本，在算法做过一些权重调整以后，聚类之间的距离比较合适，那么每个节点的邻近区域大小也都差不多，换而言之，这张拓扑图上的颜色深浅看起来也就都差不多。

等模型上线运行以后，如果实际数据体现在拓扑图上，某个节点颜色过深，那就代表这片区域的系统状态有问题了。如下图，是论文中两个场景举例：

作为热力图的部分，其实就这样了。但是作为UBL，显然还可以把热力图代表的异常情况，作为告警发出，并进行一定的根因分析推荐。

分析推荐过程也非常简单：既然已经有了颜色最深的那个节点，依次往外扩散找邻居节点，但是要找的是颜色依然正常的。如果邻居都不正常，就找隔一跳的邻居，直到凑够了5个正常邻居。然后把这5个节点所代表的主机性能指标集拿出来，挨个和异常节点的做5次相关性排序。然后简单多数投票，得到最终的top5的根因指标推荐。

SOM是个特偏门的算法，具体过程就留给读者自己阅读论文吧。

注1：UBL系统已经被顾教授申请专利了哦：U.S. Patent Application No. 14/480,270。包括国内，也有类似做「无中生有」型设备健康度的专利申请，比如：国防科大的CN201410690233.9。大家核心思想，都是认定稳态下，所有设备的健康度应该趋向一致。

注2：主机热力图加上时间变化趋势，就可以变种为分面日历热力图，也是一种不错的监控可视化方法。下图是顾教授做的产品效果：

日志分析的模式发现功能实现(4)-阿里云SLS

2019-03-22T00:00:00+00:00

时隔一年没有更新，日志的模式发现，已经变成了大大小小各家厂商的标配功能。前几天看到阿里云日志服务，也刚刚支持了相关特性。而且从系统设计层面来说，有些想法蛮不错的，这里给大家介绍一下。

功能的主要说明，来自阿里云官方文档：https://help.aliyun.com/document_detail/100039.html

从文档中，可以看到阿里云日志聚类相比之前介绍的一些厂家实现，有两个特点：

针对的数据类型：文档上明确说「支持log4j和json」格式。
开启聚类功能占用磁盘：文档明确说「增加原始日志大小的10%」。

数据类型问题

实时上，我们看之前的各家产品截图也好，看很多本领域的科研论文也好，一般采用的日志，都是这么几类：

网络设备、主机操作系统的syslog日志；
hadoop、openstack等分布式系统日志；
nginx、weblogic等访问日志。

相比这几种日志，log4j会有很多多行事件，而json日志则很容易出现语序变动的情况。

比如说：

{"num":123,"str":"abc"}

和

{"str":"abc","num":123}

这么两行json日志，我们一看就知道他们其实是一模一样的内容。但对于采用文本距离来聚类的算法来说，这两行的差别就非常大了。

所以由此可以判断，阿里云日志聚类，应该采用的不是文本距离(edit distances，已知有logmine、logsig、spell等)的方法。那么，可能就是通过频繁模式挖掘(frequent pattern mining)了。可以参见裴丹教授的FT-tree论文。

目前来说，我个人只看过这么两个大思路。

磁盘占用问题

在之前各种介绍中，大家的使用方法基本一致，都是基于某次搜索的结果，进行聚类或者模式发现。

阿里云日志服务是唯一一个，要求提前在索引配置上，设定该索引开启聚类分析，然后才能使用的：

也就是说，阿里云是在日志索引入库流程中，就完成对日志的模式计算，并直接存储下来。

此外，文档中还有一段SPL语句，用来实现sumologic中的logcompare命令功能：

* | select 
        v.signature,  
        v.pattern, 
        coalesce(v.cmp[1],0) as count_now, 
        coalesce(v.cmp[2],0) as count_before, 
        coalesce(v.cmp[1],0) - coalesce(v.cmp[2],0) as count_diff 
            from (
                select 
                    p.signature as signature ,
                    arbitrary(p.pattern) as pattern , 
                    compare(p.count,300) as cmp 
                        from 
                            (select log_reduce() as p from log) group by p.signature
                        )v  order by count_diff desc

可以看到同时存在signature和pattern两个不同的输出。

在多数地方，signature=pattern=log_key≈cluster。所以这又是一奇。

在NEC美国实验室与蚂蚁金服合作的LogLens论文中，正好有log-signature和pattern-group的区别。简单的说，比如下面这行原始日志：

2016/02/23 09:00:31.000 127.0.0.1 login user1

它的log-signature是可以流式处理得到的，是：

DATETIME IP WORD NOTSPACE

它的pattern则取决于实际的聚类结果，比如可能是

2016// ::** 127.0.0.1 * *

也可能是

2016/02/* ::* * login *

所以，多出来的10%存储，应该分为两部分：一部分是和每条日志的索引一起，单独出来的一个log-signature字段，里面是几个常见的Grok正则定义，压缩比应该蛮高的；另一部分，是定时或者半实时生成的pattern树；最后是这二者的映射关系表。后两部分应该是额外存储的，总量应该不大。

由于没有阿里云账号，无法实际通过SPL运行来验证signature和pattern的输出到底是什么样子。本次实现推测，只能到此为止了。

btw：LogLens论文中还有关于多行日志的行为模式检测的一些内容，请大家自行阅读咯~~

日志分析的模式发现功能实现(3)-其他厂商

2017-11-23T00:00:00+00:00

《山寨一个 Splunk 的事件模式功能》和《日志分析的模式发现功能实现(2)-sumologic》前两篇，已经分别讲过了商业产品老大splunk、开源项目老大ELK、云服务老大sumologic分别的实现做法。除了他们以外，还有一些其他实现，这次一并讲完。

prelert

prelert是一个老牌公司了，原先是基于splunk平台做异常检测产品（卖点是比splunk的rare、predict、anomalies指令更好），去年被ES收购。到目前为止prelert和ES x-pack的整合工作其实都没有完全结束。所以讲它功能，还是直接看原先的老文档更清晰。

老版的prelert思路和sumologic非常非常像。

先通过prelertcategorize指令做日志分类（也就是sumo家的logreduce指令）：

这个地方注意到，prelert既没有提取keyword，也没有汇聚signature，而是列出同一个模式下的4条样例日志给用户自己看。这个做法可以说比较保守。

此外，多出来两列，sparkline和sourcetype：

sparkline这个想法还是不错的。我们可以直接看到单个模式在一段时间内的事件数走势。对于偶然出现或者暴增暴跌的情况，可以一眼看出来。
sourcetype这个就有趣了，这意味着，做聚类时，首先是基于一个sourcetype做了分桶的。这样可以减少一些计算量，比较同一个sourcetype内的数据应该相似度比较大，而不同sourcetype相互之间相似度应该较小——但是这有一个前提，sourcetype是按照比较合适的规则进行了设计——这对于完善的商业产品可能问题不大，对于互联网公司内部业务运维来说，就不那么容易了。

其次，对具体某一类日志，可以保存成eventtype（注意到截图里生成的过滤语句，有一个len(_raw)<=129，这块跟splunk计算_punct字段有类似，splunk计算_punct时就也规定了只算前128个字符）：

最后，也可以通过prelertautodetect指令做异常检测。这时候可以直接对总趋势做，也可以选择基于普通字段做groupby，也可以选择基于前面生成的prelertcategory做。为了区分异常检测的纵向时间维度和横向密度维度，可以用by和over两个从句来分别制定。效果如下：

不过perlert被elastic.co收购以后，以上模式发现功能，只保留了异常检测的部分。我们只能在异常详情的列表里，隐约看到category examples还是那熟悉的4行日志样例了：

oracle

oracle公有云上，提供了日志分析产品，叫OMC LogAnalytics。也提供了诸如SPL、模式发现等著名的日志分析功能。其模式发现(cluster指令)界面如下：

一本正经的把clusterID也列出来，真是淳朴啊~其余列，和prelert类似，也是保证了一个聚类肯定在同一个logsource内部做的，也带了一个trend图。

不过模式样例，即没有keyword也没有signature，还不提供多条……

vmware

vmware的日志产品，叫vRealize Log Insight。特点是对vmware自家产品的日志解析分析的很好（废话）……

其中提供了一个叫做log grouping的功能：

可以看到，这个界面更偏向splunk而非sumologic风格。

该功能会查找日志模式，然后把signature部分，高亮显示。但是区别是：并不用***来取代signature，而是留着样例日志里的原文高亮。

vmware这里发现的模式，可以用来后续过滤，也就是截图中的events like this功能。

日志分析的模式发现功能实现(2)-sumologic

2017-11-09T00:00:00+00:00

《山寨一个 Splunk 的事件模式功能》里我们曾经介绍了splunk里的模式功能，以及如何使用ELK做一个简单的模拟。

在日志分析这个领域，除了splunk和ELK，还有很多其他的玩家。那么后续也要说说其他玩家在这方面的处理。

sumologic是美国最大的日志分析云服务商。模式发现(sumo语境中叫logreduce)及其后续扩展(sumo语境中叫anomalies)功能，也是sumologic最大的亮点。下图是其模式发现功能的截图：

可以发现这个界面上的信息和操作，和splunk差别是很大的：

高亮标识的，不是单个keyword，而是诸如****，$DATE，$URL 一类的signature。
有明确的Score，据称用的是KL散度。
提供了对单个模式进行晋级或降级的标记。
还提供了对单个模式进行细分，或者对多个模式进行归并的操作。

这个归并的操作，非常的灵活，用户可以自己鼠标划选，指定应该把哪些内容归并成signature：

注：除了功能上的区别，还有一个技术上的区别，sumologic支持对所有搜索结果进行logreduce，而splunk会对过多的搜索结果进行截断，只返回有限数据的pattern。

这些不同中，我最赞赏的是signature设计对比keyword的优势！

我们都知道，日志其实是由程序代码中的各种logger打印出来的。比如这段：

  public void setTemperature(Integer temperature) {
     oldT = t;
     t = temperature;
     logger.debug("Temperature set to {}. Old temperature was {}.", t, oldT);
     if(temperature.intValue() > 50) {
       logger.info("Temperature has risen above 50 degrees.");
     }
   }

这段程序执行几亿遍，日志的实际含义也就是这么两条代码。那么我们追本溯源，希望看到的日志模式，应该也就是这么两行文本。以signature的设计思路，我们看到的日志模式会是这样：

$DATE DEBUG Temperature set to *. Old temperature was *. $DATE INFO Temperature has risen above 50 degrees.

多么的一目了然和漂亮！

当然，从更高层级来说，这两行代码，都是同一个方法里的，那么和其他方法、其他类的日志相比，它两又可以归并成更高一些的模式：

$DATE * Temperature *****.

至于默认给用户返回哪种模式，这是另一个问题。

sumologic对这个问题的回答之一，就是用户标记操作。默认的模式评分在0-10之间。而用户如果点过晋级的模式，以后固定就是最高的10分，点过降级的模式，以后固定就是最低的0分。

此外，sumologic还会自动分析被你点过降级的那些日志模式。比如说，如果他们共同含有database单词，那么以后还有database单词的日志，它归属的signature评分自动会被降低。(这里隐藏有一步，它是怎么确定这个database单词的？我猜测可以类比splunk的event pattern功能，其中有一个内部的findkeywords指令。不过splunk找到的keyword只是简单的保存为eventtype，没有sumologic这种label回馈给机器学习算法的过程。)

还有一个细节：晋级和降级是以用户操作为单位的，不同用户登录上来，可能因为自己过去的操作历史看到不同的结果。而细分是以租户整体为单位的，不同用户登陆上来，看到的都会是细分完的。

And More

sumologic的模式发现功能，和所有其他厂商相比，更进一步的地方是：并没有停步在发现并展示模式。还扩展出来了后续的anomalies一整套逻辑。可以说，sumologic是唯一一家拥有完整回环的文本异常检测的AIOps公司。

整套思路大致如下：

预定义查询范围，在该范围内，对最近6小时的日志进行logreduce；
对比较罕见的signature，会存入一个独立的sumologic_anomaly_events索引中待查，也意味着可以对这个索引做告警；
其中新发现的signature，记录为unlabel_event_xxxx，提供给用户进行模式命名、级别设定，还可以填写处理意见（当然也可以在这里进行晋级降级细分等操作进行反馈）；
对已经label的signature，按照过去设计的级别，做一个同时间轴的泳道图展示，这样可以有一个很醒目的时间相关性的观感；
可以对某一时刻的anomalies整体状态做快照备用。

这一套下来，就串联了异常检测、告警、根因分析、事后报告等一大连串智能运维功能。

不过话说回来，为啥听起来这么厉害的功能，却没有其他人跟进，或者说大多数人并不知道呢——因为文本异常毕竟是少见的，指标异常、海量指标异常，才是目前大多数IT团队亟待解决的难题！

可以说：sumologic是做了一把屠龙刀……

DSL设计之数据管道与并行处理

2017-06-09T00:00:00+00:00

上一篇文章里，我试图论证了一个观点：在日志分析场景下的DSL设计，宜采用数据管道风格。

不过，并不是所有时候，数据分析的流程都是单向的一条线。

下图是阿里云PAI平台文档中的一个示例截图：

这是一个做机器学习时非常常见的流程图。虽然我们一般说法中，也是下面这种单向的：

数据导入 -> 数据预处理 -> 特征工程 -> 模型调整 -> 效果评估

但是在预处理和特征工程的时候，少不了需要通过统计分析手段来决定一些调整方案；在效果评估和模型选择的时候，也是需要同时运行不同模型来相互参照。

最终就变成了一个图而非线性的流程了。

当然，并不是说用线性管道就达不到相同目的了——我们可以通过子查询的形式达到最终一致的结果。但是这个过程意味着一部分流程的计算是重复运行的。在普通的搜索统计时，这个无所谓。第一消耗可能不大，第二诸如Elasticsearch等后台引擎对一模一样的query是有query cache的，所以子查询的搜索聚合结果，在主查询的时候其实是复用的。

但是在机器学习的时候，问题可能就严重一些了。因为这些可能消耗的资源不少，运行时间也不短，每次都从头开始确乎就是一种浪费了。所以有必要在DSL语法上，想到一种更合适的结构。（像阿里云等平台这样搞可视化拖动当然也行，但是对智能运维产品本身设计不一致）

这时候，我想起来年初的时候，在devopsweekly邮件上看到过的一个开源项目，名叫dgsh。地址见：https://www.dmst.aueb.gr/dds/sw/dgsh/。

dgsh的写法示例如下：

#!/usr/bin/env dgsh

tee |
\{\{
	printf 'File type:\t'
	file -

	printf 'Original size:\t'
	wc -c

	printf 'xz:\t\t'
	xz -c | wc -c

	printf 'bzip2:\t\t'
	bzip2 -c | wc -c

	printf 'gzip:\t\t'
	gzip -c | wc -c
}} |
cat

看起来就是我们想说的这个意思。不过在语法设计上，靠空行来切分并行任务，还是有点怪怪的。

此外，去年曾经还有一个项目，在做竞品调研的时候闯进过我的眼界：Juttle。这是Jut.io开源的项目，jut.io曾经入选过2015年的Gartner ITOA Cool Vendor名单，不过2016年就倒闭了，关门前把这个系统开源出来……

read elastic -from :2015-01-01: -to :2015-07-01:
  category = cat_in AND type ~ '*${type_in}*'
|(
  reduce count()
  | view tile -title 'GitHub events count (${cat_in}, ${type_in})' -row 0 -col 0;
  reduce count() by repo_name
  | sort count -desc
  | head 10
  | view table -title 'GitHub events for top 10 repos (${cat_in}, ${type_in})' -row 0 -col 1;
  reduce -from :2015-01-01: -over :w: -every :d: count() by repo_name
  | view timechart -keyField 'repo_name' -title 'Rolling count of GitHub events (${cat_in}, ${type_in})' -row 1 -col 0;
)

这里采用了分号;来区分并行任务。显然比单纯的空行好看且明确一些。不过使用圆括号()来作为并行任务的区域表达，又有另一种误解，因为加减乘除运算是使用圆括号来表达优先级的。

所以综合来看，采用花括号\{\{}}配合分号;可能是最好的结构了。那么文首的那个机器学习流程可以表达成这样：

wumai_data_1
  | eval feature_XXX = somecommand(xxx)
  | \{\{
    bucket feature_XXX span=1000 as numberrange
     | chart numberrange over other yyy,zzz;
    fit StandardScaler *
     | sample ratio=0.2
     | \{\{
        fit RandomForestClassifier predict_field from feature_* into rf_model
         | apply rf_model
         | `confusionmatrix("predict_field","predicted(predict_field)")`;
        fit LogisticRegression predict_field from feature_* into lg_model
         | apply lg_model
         | `confusionmatrix("predict_field","predicted(predict_field)")`;
    }}
}}

看起来还不错呢~哼哼，看我这个思路后续会跟其他竞品雷同不~

从DSL扯开去

2017-05-31T00:00:00+00:00

智能运维平台的内核驱动力来自数据（日志和指标）分析。从广义范畴来说，所有可以用作数据处理的软件系统，都可以用来构建这个平台。从远古时代的awstats到piwik，到人手一个的hadoop集群（确实没有更抽象具体的运维向子产品），到目前最流行的ELK，包括新近的基于PostgreSQL搞的TimeseriesDB，基于Solr搞的Rocana等等。

在对比所有这些产品的技术选择和接口设计的时候，总让我想起一句话：「一个幽灵，查询语言的幽灵，在社区徘徊」。

SQL 与 DSL

其实在刚流行hadoop的时候，并没有这么多事儿。熟悉java的开开心心写mapreduce，不熟悉java的人也乐呵呵的走streaming API，用自己熟悉的旁的编程语言写mapreduce。

但随后各种SQL-like的项目就雨后春笋般的涌现了。SQL的全称：structured query language。虽然在数据库面前，SQL更像是一种API，但是在谈论DSL的时候，SQL无疑就是最成功的DSL之一。

对于我这个半吊子程序员来说，上图这些样例只了解regex和SQL两样。不过最给我印象深刻的DSL设计，是Ruby社区的sinatra项目。

# myapp.rb
require 'sinatra'

get '/' do
  'Hello world!'
end

这个漂亮的语法简直让我惊为天人。从此对DSL大法深信不疑。

SQL 是数据处理 DSL 的唯一选择么？

SQL虽然是最成功的DSL之一，但它当然不是数据处理领域唯一的DSL——因为数据处理这个「领域」还是太大了。

比如，细分到CEP（复杂事件处理）领域，更通行的就是CQL。像Esper、Siddhi等，大致写法是这样（注意看分号的位置）：

define stream TempStream (deviceID long, roomNo int, temp double);
from TempStream 
select roomNo, temp * 9/5 + 32 as temp, 'F' as scale, roomNo >= 100 and roomNo < 110 as isServerRoom
insert into RoomTempStream;

包括oracle，华为等，也都有CQL设计（是的，我就是在写这行文字前刚搜索得知的）。

又比如，细分到BI（商业智能）领域，行业老大tableau，有一套自己的VizQL™。这也是证明DSL设计很有趣的一点。infoQ上有一篇文章叫《领域专用语言(DSL)迷思》，其中第三条误解就是「DSL必须以文本代码的形式出现」。tableau的VizQL就是一个典型的范例——这完全是一种视觉交互式的查询语言，和文本代码半点不相干。

那么 DSL 怎么搞？

我在 http://t.cn/Ra53rH9 上看到有这么一个回答：

分解任务、解决任务、归并相似任务、把解决方案原型化、最终产品化。真是漂亮的步骤，把这个步骤，套回到我们最原始的目的：智能运维平台，就可以发现，所谓DSL设计，主要考验的是设计者对运维工作的理解力。

BTW：这个问题里的另一回答把crontab作为一个DSL范例举出来了，这么说我要收回前文有关sinatra的惊叹……

到底智能运维平台需要什么样的DSL？

从problem看，我们有这么几大类：

按照某些逻辑查找或排除日志中的有效部分；
分析某些系统的状态并判定其异常；
按照某些逻辑确定异常是否发送以及以何种形式发送给哪些处理方（人或系统）。

第一类显然最简单了，仿照grep -E或者grep -P的搞法可以是一种，仿照搜索引擎的搞法也是一种。（是的，并不是所有的日志产品都用lucene querystring syntax）

第三类也是比较明确的，nagios的object group设计就很棒，而近来流行的IFTTT风格也不错。我见过携程的朋友提供这种风格的DSL给开发做主动监控，而prometheus的alertmanager里也是一样的玩法。

唯独第二类话题极其大。系统状态，包括了性能指标、行为基线等不同方面，可以动用各种简单的复杂的数学统计乃至机器学习知识。所以还要继续拆解。

简单的均值趋势、占比统计，这也是大多数监控系统仪表盘最爱用的功能了。这些统计函数，基本上在SQL里也都有。由此很自然会引发一个想法：是不是可以用SQL来解决第二类需求？

为什么SQL不适合？

我们再念一遍SQL的全称：structured query language，structured * 3。

这和智能运维平台所承载的logdata是冲突的。和metricdata也在渐渐冲突……（越来越多的metric系统也在JSON化）

logdata是带有时间戳属性的非结构化数据。虽然平台为了权限管理和分析方便，除了timestamp，一般还会内置有hostname、tag、logtype等少量信息，但是总体上来说，日志信息依然是非结构化的。

即使在目前常见的 ELK 系统中，logstash 的预解析字段有点类似 create table 的意思，也不能改变这个字段解析结果只存在于单条日志中的事实。对于日志整体来说，这个 schema 依然是不固定的。

把眼光从ELK系统再往上一层，需要搭建的是一个智能运维平台，平台用户是横跨部门的。这时候还会有更严重的一个问题：同一份日志，业务部门、运维部门、安全部门可能需要关注的信息完全不一样。即便是单条日志内的预解析为结构化数据都不可行。

由此，就得到了_第一个problem：不同人对同一条日志可能采取不同的字段解析。_

其次，日志信息受限于码农水平或者心情，很可能是极其杂乱无章的。多线程交叉多行打印一个事件是经常会发生的事情。怎么抽丝剥茧，从复杂文本中获取业务处理请求的关系链，以及各级关系的权重，这是第二个problem。

再次，异常状态如何表达，表格并不是唯一的选择，甚至多数时候表格完全表达不出来重点和非重点数据的区别。针对不同场景理所当然应该有不同的表达方式。虽然这涉及更多是可视化效果的选择，（即便我们抛开VizQL这种特例不谈）我们也需要自己的 DSL 给出前端可用的特定属性信息作为一种指向。比如，我们希望根据横向对比的情况来查找某种异常的可能性，就会同时用到 GROUPBY 和 HISTOGRAM 两个方式的组合，而根据 group 的层级和含义，可能就会选择简单的多折线，联动的 timeline，或者表格里的 sparkline 迷你图。这是第三个problem：需要有针对场景的表达力。

当然，比起饼图，还是表格更好。

那什么合适呢？

这个事情可能真的就是看个(P)人(M)偏好了。比如我作为一个运维+perl/ruby爱好者，就觉得不管是UNIX pipeline式，还是method chaining式，都很棒。这两种设计，把复杂方案隐藏起来，只留给最终用户一个command/method给用户按需选用即可。（让JSON地狱去死）

不过从保持一致性的角度出发，对于日志系统，可能还是选用shell pipeline式更合适一点。jordansissel 在介绍 Logstash 的内部原理时，就使用了 pipeline 的概念（事实上连代码里也叫 pipeline）：

inputs filters outputs

所以对数据的后半段，继续沿用pipeline概念就是很顺理成章的事情了。

这是其一。

其二，在处理尤其常用的检索需求时，pipeline比method更灵活一些。还是一致性的考虑，最初的inputs，对于pipeline可以直接无缝对接，但是对于method，是不是我们还需要搞个Object.new？

让我们来看看两个示例吧，其实我觉得都还好?：

index=summary starttime=now-7d/d endtime=now/d domain=(aaa OR bbb)
 | bucket timestamp span=15m as ts
 | stats avg(apache.reqtime) as avg_ by ts
 | esma avg_ timefield=ts futurecount=24
 | where typeof(_predict_avg_) == "double"
 | eval time = formatdate(ts, "HH:mm")
 | table time, _predict_avg_
 | join type=left time [[
     starttime="now/d" *
      | bucket timestamp span=15m as ts
      | stats avg(apache.reqtime) as avg_ by ts
      | eval time = formatdate(ts, "HH:mm")
      | table time, avg_
 ]]

然后写成：

Search(index="summary", starttime="now-7d/d", endtime="now/d", domain=["aaa", "bbb"])
  .bucket(timestamp, span=15m)
  .avg(apache.reqtime)
  .esma(timefield=ts, futurecount=24)
  .select { |ts| ts._predict_avg_.is_a?(Double) }
  .formatdate("HH:mm")
  .table("time", "_predict_avg_")
  .join(type=left, id=time,
     Search(starttime="now/d", "*")
       .bucket(timestamp, span=15m)
       .avg(apache.reqtime)
       .formatdate("HH:mm")
       .table("time", "avg_")
 )

对比一下，可能最明显的感觉就是：.table()函数里的那些字段名是怎么突然出现的？因为一个method对object的作用不是显式的，你不看文档是没法知道调用一个method以后会生成什么object，拥有哪些attributes的。而前者的as参数就非常的简明扼要。

你扯了这么多，别人的想法呢？

是的，其实做一个PM很多时候相互关心一下同行的思路太应该了……国内同行不太开放，所以只能收集到国外同行的数据。下图为主要AIOps产品的DSL所提供的的指令/函数数量的雷达图：

(基于2017.05数据，毕竟AIOps的公司大多在高速发展中) 此外：

HPE也有类似形式的AQL，不过他们太疯狂，直接跟自己另一款分布式R语言产品捆绑销售，AQL里可以调用R函数，尼玛那一下子太多了……

logscape是半pipeline半method方式，很奇葩的写法，如下。我个人觉得连一致性都无法保证的设计是失败的。

type='agent-stats'
 | hosts(cache,db) cpu.avg(_host) chart(line) buckets(1)

ELK中timelion是method方式，如下：

.es('metric:0', metric='avg:value')
 .label("#0 90th surprise"),
.es('metric:0', metric='avg:value')
 .showifgreater(
   .es('metric:0', metric='avg:value')
    .movingaverage(6)
    .sum(
      .es('metric:0', metric='avg:value')
      .movingstd(6)
      .multiply(3)
    )
  ).bars()
  .yaxis(2)
  .label("#0 anomalies")

这里几乎把所有的query和aggregation都合并到.es()的参数里，导致method本身功能局限在图形设置和最终的pipeline aggregation功能上，感觉还是有待改进~

最后的补充

能扯的其实已经扯完了，不过突然发现之前我一直保留的1.4.2版本的a life of logstash event链接已经失效，目前最新的 ELK 文档里对logstash pipeline的描述改成了这样：

inputs -> filters -> outputs . 和 -> 是最常见的两种调用方法的意符。感觉 ELK 全线走向method chaining风格的节奏啊~

2016 年度个人总结

2016-12-30T00:00:00+00:00

老习惯，一年年底给自己做一个总结。

写作

今年博客写得越发的少了，只有十一篇。其中还有两篇是思辨类的文字，只有九篇是技术笔记。但是这么写并不代表我在检讨自己，因为这是我工作八年来第一次转变自己的角色，不再是一个单纯的运维，或者架构师，而是『日志易』的产品经理。甚至放大一点说，作为目前国内最领先的『日志分析工具』的唯一的产品经理，思考 IT 人员到底需要的是什么样的东西，才是我最需要做的事情。

这两篇思考，一篇是日志分析中 6 个常见但没啥用的功能，一篇是机器战胜人类了，伺候机器的运维呢？。看起来我是个很喜欢唱反调的 PM 呢……

所以年终总结上必须给可能还剩下的博客读者们证明一下自己，请一定阅读下面这篇演讲稿：海量数据驱动的智能运维。

这篇演讲是为了 velocity 大会创作的。今年外出演讲依然不少，但是大多是企业内训或者行业会议，公开的技术大会最终只参加了这场，而且又接近年尾，可以说整篇演讲算是集个人全年思考之大成：

运维和机器之间要什么样的交互方式？
运维的知识库如何自然而然的积累和继承？
机器学习到底能怎么用到运维上？
复杂环境下日志标准应该怎么定？

不过这次演讲实际上并没有受到很大的欢迎，在后来联系 DBAplus 社群想在推一波的时候还被拒了，理由是太水了没干货。联想一下 2015 年曾经广受欢迎的那些演讲，我总结一下什么是大众希望的干货呢：我们现在跑了 100 台的集群，10 TB 的数据；用到了 spark、kafka、docker；一开始这不行那不行，后来一看，哦，有个参数要改一下；架构图如下；性能指标监控截屏如下；我们下一步打算再上 100 TB……

ELK 社区

虽然在做一个商业化产品，但是紧跟 ELK 开源社区依然是我个人爱好没变。

3 月份，借安快创业谷的场地办了一次小型的 ELK 用户 meetup，形式很随意，我自己给大家演示了一下 juttle 项目，请京东的 LiuYuBao 分享了一下他们踩的坑。最后要求在场所有人必须至少发言一次，说心得说感想说废话均可。这个要求直接导致 meetup 肯定是小型的，事实上到场的也就是 20 人的规模，效果还是不错的。本来还打算请滴滴的 taowen 分享一下他的 es-monitor 项目，这样就可以再发起一次 meetup，不过失败了，所以最终也就只办了这么一次。

5 月份，把之前博客上的 kibana server plugin 整理了一下，发到了 GitHub 上，取了个名字叫 KaaE。核心思想就是模仿 watcher 项目的配置语法实现 Kibana 里运行的告警监控，这样可以节省写自己文档的时间——直接让用户看 watcher 的官方文档就好了。到 7 月的时候，因为在 GitHub 上时不时吆喝，lmangani 童鞋也加入进来一起开发了。lmangani 是曾经另一个 kibana3 fork(qbana) 的作者，也是经验丰富而且脑洞不小，在我的 server plugin 基础上加上了 spy plugin，让用户可以直接在 Kibana 的 Visualize 界面上点击保存 watcher 条件！这真是一个天才的设计！随后我们一致认为官方的 report 做的逻辑太绕，又给 KaaE 加上了报表功能。可以自负的说，KaaE 比官方的 watcher 和 report 都好用的多。

10 月份，lmangani 加入了 SIREn 公司，KaaE 改名叫做 sentinL，以后将作为 kibi 的一个插件继续开发。我再次拒绝了 SIREn 的邀请(第一次是我写 kbn_sankey_vis 插件的时候)，不过倒很乐意 KaaE 项目换一种形式继续焕发活力，lmangani 加油！

接着是 Elastic 中国开发者大会，提交了一个话题想讲讲 KaaE 的开发。不过被拒了，大抵上还是小插件的开发不太受欢迎吧。于是很欢快的和朋友们在台下一边听演讲一边交(tu)流(cao)，场面非常热闹，ELK 大势所趋，当初 wood 叔预测的 ES admin 职位肯定不久就会诞生了~

12 月份，针对 ELK 5.0 版本的文档基本修改完毕，交给出版社校对，修订稿有 185 页，相当于第一版页数的一半了。或许在春节后可以面世。

翻译

今年做了两件翻译事，不幸都 happy ending。一件是 ES 中文社区组织翻译《Elasticsearch 权威指南》，忝列 D 组组长，然而说实话，要组织十来个网友按时干活，难度比在公司里组织同时干活难多了。人就不理你 QQ 消息，你能如何？都想翻译不想 review，你也没办法……

另一件是《Learning Puppet 4》，原计划 10 月就应该交稿。不过连着碰到意外情况，到现在还有三章没完成。希望春节前可以努把力……

工作

产品经理确实是一项非常有意思的工作。刚开始免不了茫然，年初我曾经满网络的搜寻各种产品经理入门啊，产品经理必读啊的资料。后来反应过来：第一、这些 2C 的资料对我目前没什么用；第二、这些零零碎碎的资料压根也不适合真的入门而适合吹牛；第三、我需要的是扬长避短。

这里也要感谢研发童鞋，他们耐心的等到我招来了专职的交互设计师以后，才笑告我：『你的 Axure 画的真烂！』

这一整年，能在开源基础上折腾的花样，心中有数，手下也基本做的差不多。盘点一下心中的计划，对未来我还是信心满满的。明年，我们肯定要玩个大的~

生活

总结的最后，才是最重要的：接下来的这个春节是我人生最期待的一个春节了。我的『小渔』就要到来！迫不及待的心情啊~~小渔，欢迎你

日志分析中 6 个常见但没啥用的功能

2016-11-15T00:00:00+00:00

日志分析是 IT 运维领域非常重要的一部分工作。甚至可以说，在平台化、模块化、服务化盛行的今天，这部分工作的重要性已经逼近传统的设备监控。不过日志由于来源、使用者、管理者都比设备指标要复杂，导致日志分析的功能需求，也庞大很多。在这些庞大的，或者说『泥沙俱下』的功能需求中，有那么一些然并卵的，或许因为听起来很炫酷，或许因为想延续过去的使用习惯，今天因为出差到外地，难得有空放松下，决定吐槽几个这种然并卵的功能。

realtime alert

排在第一位的就是所谓的『实时告警』。做一个告警系统，其实可以分成两类不同的目的：

出现了问题要修复，
快要出问题得避免。

那么分开说：

如果是要喊人来修复的，假设你的告警内容已经细化到完全不用再排查问题，从告警发出来，到你登录到服务器解决问题，至少也需要数分钟级别 —— 根据墨菲定律，这时候你很可能在睡觉在吃饭在坐车在团建，那么十分钟已经是你行动迅速了。那么告警是第 0.1 秒发出来的，跟是第 10 秒发出来的，有什么区别？而把告警从间隔 10 秒压缩到 1 秒内的实时，需要花费的架构调整和成本上升，可不是一点半点……（你说一个关键字实时过滤没啥成本？那你需要先加强一下告警系统的追踪、扩展、抑制等功能呢，告警没那么简单）

如果是要提前避免的，一般你的基础架构已经进化的不错了，才会想要通过告警的触发动作来自动化修改你的流量、资源和任务调度编排。这种需求其实更多归入容量规划范畴，很难想象这种事情要实时性干嘛，谁家平台不打余量的？

当然，不管上面哪种，我吐槽的都是追求 1 秒甚至毫秒的实时。如果你的监控间隔还停留在 5 分钟以上，可别拿我这段话做挡箭牌 —— 如果你从收到告警到解决问题需要小时级别，5 分钟可能是也不算多，但是你的故障定位方式，或者说告警系统的内容细化水平，更加需要提高。

翻页翻页翻页

排在第二位的就是 show me more money，错了，logline。日志分析系统一般都会在界面上列出来日志原文供查看。而一帮『手贱』的人，就会很 happy 地点下一页下一页下一页下~一~页~下~然后系统出问题了。

这个功能需求其实就是过去 cat logfile | grep KEYWORD | less 习惯的遗毒。上来就恨不得自己能 vim 进去一行行开始看日志。Ctrl+F 嗷嗷翻页固然很爽，不知不觉中时间全都浪费掉了 —— 想想上一条你还想要的『实时』 —— 运维排查问题最适合的思路是快速试错！一个想法验证下不行赶紧验证下一个。如果一页 20 条日志你看不出来，两页 40 条日志你看不出来，你就赶紧改个时间段、改个关键词吧。

当然，话说回来，老想着往后翻页，也有可能是真想不出来改用啥关键词。日志分析系统有必要提供帮助用户更快找到合适关键词的能力。这东西就是仪表盘可视化。利用正确的能力做正确的事，而不应该在有正确的方法的情况下继续使用麻烦办法。

经纬度地图

既然说到可视化，可视化方面是做日志分析乃至数据分析最容易误入歧途的方向了。有兴趣的可以看下面几个链接，是我从 Kibana Plugin 社区讨论组里复制过来的：

这些很复杂的可视化就不提了。在日志分析方面，最常见的一个炫酷的效果就是地图。地图可真是一个被各种玩出花来的东西，诸如安全攻击喜欢放个 3D 地球，在 google 图片上随便搜『DDoS atack earth』关键词，大把大把；做个推广活动，喜欢搞个实时连线的中国地图看 PV，全国各地，来一个访问，飞一个点出来到北京。。。

真的是酷毙了。不过，然后呢？你看到这个点能干嘛？而且飞动中的点，唰唰就过去了，压根捕捉不到。

说到实际情况，IT 日志分析需要地图的大多数时候是基于行政区划的统计。全局负载均衡绝大多数都是以行政区划和运营商为基准做的划分，如果通过地图真的定位到什么访问问题，很大可能下一步你能做的是通过商务手段去联系当地电信服务运营商！你要经纬度有什么用？—— 别忘了免费的 GeoIP 国内精准度本来就低。花点时间搞一个准确到地市运营商的 IP 地址库，才是最应该做的事情。

全量下载(etl to BI)

另一个和翻页有些类似的功能，就是要求全量日志下载。这种需求通常目的也是分两类，一类其实跟翻页是一个需求，不知道查啥内容，干脆要求把日志都下载回来自己慢慢折腾；另一类则是环境中有一些标准的 BI 软件，觉得日志分析软件的可视化和统计方法不够用，还是喜欢、习惯 BI，所以要求日志分析系统负责搜索，BI 系统负责分析。

这块怎么说呢，列出来有些个人主观化，我个人不太觉得在 IT 运维领域，有啥是 BI 能做，而开源日志分析项目做不来的事情。退一步说：真要两个系统的结合，也应该是分层的架构。充分利用日志分析系统的分布式架构并行处理能力，将大量 map 操作在日志系统完成，将中间统计结果导入到 BI 中完成最后的 reduce 工作即可。

非要把原日志（即使是归一化之后的结构数据）导入到 BI 里做统计，是一个耗时耗力的下下之选。

SQL

第四个很常见的功能，就是 SQL。这甚至不是日志分析领域的毛病，在所有和数据相关的、非关系型数据库的数据存储系统上，都会有大把人问：有 SQL 支持么？

就我的浅薄见识，对所有存储系统要 FUSE 挂载，对所有数据系统要 SQL 查询，应该是可以对等的两个吃力不讨好的工作了。在 Hadoop 上有无数个实现 SQL 的项目，哪怕 Hive 和 SparkSQL 这种级别的大项目在，我还是要说：研发同仁们想要 SQL，不就是觉得自己已经会 SQL，所以要无缝对接，不用学习新知识么？你们点开 Hive 文档，里面有多少是非标准 SQL 的函数功能？

只有极少数基础的、简单的过滤和统计函数，可以横跨 API、SQL、DSL 等方式，在各平台上都通用。而你选择某个大数据平台的实际理由，大多是它的xxx yyy zzz亮点功能，很好，你需要自己搞一个 UDF 了……这还搞 SQL 有什么意义。

从编程语言学来一个经验，对特定领域，采用特定领域语言，即 DSL 的设计方式，永远是更加高效、灵活、优秀的选择。

在日志分析方面来说，抓住关键词检索、分组统计、上下文关联、时间序列这几个特性，你就可以抽象出来几个能覆盖足够场景的函数了，而借鉴命令行操作的形式，从左到右的书写习惯也比 SQL 的从右到左的形式更加符合数据流向的效果。

熟悉日志分析领域的人可能看出来我是在给 SPL 写软文了……自 Splunk 发明 SPL 这种日志分析领域的 DSL 以来，已经有大批日志分析产品跟进了这个形式，SumoLogic、Rizhiyi、XpoLog、MicroSoft Azure、Oracle Cloud Management 等等。不过公平的说，上面一段要点，确实也可以提炼出来跟 SPL 不一样的 DSL 设计，比如说：更接近面向对象编程语言的链式调用函数，同样也符合这个习惯 —— 这也是 ELK 从 5.0 开始分发的 timelion 插件的选择。

live tail

今天我能想到的最后一个恶习遗毒，同样还符合酷炫概念的功能，是 live tail，也有叫 web tail 或者 log tail 的。不知道从哪来的程序员情节，觉得终端的黑底白字最棒了，非要在浏览器页面上，通过 websocket 连接上某台服务器，实时查看某个日志文件的尾部滚动。或者简单说，就是一个 tail -F logfile 功能的网页化。

由于网络的限制、浏览器渲染的限制(毕竟要很多酷炫效果呢)，这类功能一般实现出来带有诸多的限制：

直接从 agent 建联，意味着后续的归一化结构是无法用来做复杂过滤的，同样还意味着跨平台能力削弱；
需要限制使用者的并发数，以及每个连接的流速。一般来说是每秒不许超过 1000 条 —— 人肉眼其实每秒也看不过来这么多数据；
为了限速，必须指定具体的 hostname 和 filename，无法使用通配符，无法跨文件关联查询；
为了解决跨文件，在同一页面上切分屏幕，考虑美观和视觉，最多也就是切分一次，即一次可以看两个文件的 tail。

我在最前面已经说到了，日志系统之所以现在重要性提高，就是因为日志前所未有的分散，两个分屏的 tail，有什么用？

当然，回到这个伪需求的根本目的：我就是在调试而不是事后排错呢，怎么让我可以快速看到我横跨好几个模块的调试日志是否正常？

这跟前面『无限翻页』类似：你真正需要的知道新入的日志有没有异常，而不是刷过去什么字样。通过 AND OR NOT 等过滤条件，通过时间排序，通过关联 ID，你完全可以在秒级得到更精准的、更有利于你阅读的日志。

就写到这里吧，我犹豫很久要不要把人工智能机器学习写进来。考虑到异常探测和预测也算是机器学习的一部分，还是不一竿子打倒全部吧~~这里只说一句：我花时间翻了一打 IT 运维日志相关的机器学习论文，用神经网络的效果普遍比回归差。嗯~总之，大家老实干活就好了。

Elastic 官方压测工具 rally 试用

2016-08-19T00:00:00+00:00

rally 工具是 Elastic 官方开源的针对性性能压测工具。目前 Elasticsearch 的 nightly performance report 就是由 rally 产生的。对自己在做 ES 源码修改，或者ES 应用调优的人来说，通过 rally 验证自己的修改效果，是一件很需要且容易的事情。

rally 依赖 python3.4+，所以为了试用直接在自己电脑上安装比较快。直接 pip3 install esrally 即可。

电脑上没有 gradle 的无法从最新 master 代码编译(Macbook 上即使通过 dmg 安装的 gradle 也识别不到)。只能下 binary 包。所以运行方式为：

/opt/local/Library/Frameworks/Python.framework/Versions/3.5/bin/esrally --pipeline=from-distribution --distribution-version=1.7.3

默认情况下压测采用的数据集叫 geonames，是一个 2.8GB 大的 JSON 数据。ES 也提供了一系列其他类型的压测数据集。如果要切换数据集采用 --track 参数：

/opt/local/Library/Frameworks/Python.framework/Versions/3.5/bin/esrally --pipeline=from-distribution --distribution-version=1.7.3 --track=geonames

重复运行的时候可以修改 ~/.rally/rally.ini 里的 tracks[default.url] 为第一次运行时下载的地址：~/.rally/benchmarks/tracks/default 。然后离线运行：

/opt/local/Library/Frameworks/Python.framework/Versions/3.5/bin/esrally --offline --pipeline=from-distribution --distribution-version=1.7.3 --track=geonames

静静等待程序运行完毕，就会给出一个漂亮的输出结果了。

这个运行会是一个很漫长的时间，如果你其实只关心部分的性能，比如只关心写入，不关心搜索。其实可以自己去修改一下 track 的任务定义。

track 的定义文件在 ~/.rally/benchmarks/tracks/default/geonames/track.json。如果你改动较大，建议直接新建一个 track 目录，比如叫 mytest/track.json 。

对照 geonames 里的定义，有各种 operations，然后在 challenges 里指明调用哪些 operation。最后运行命令的时候通过 --challenge= 参数来指定执行哪个。

下面是一段我在本机采用默认压测数据集 geonames 的结果：

version	eps	index size
1.7.3	12650	2.67GB
2.3.2	10344	3.31GB
5.0.0-alpha2	11903	3.19GB

差距好大啊？！然后我发现 1.7.3 用的 mapping 没加 doc_values，修改 ~/.rally/benchmarks/tracks/default/geonames/mappings.json ，都加上后重新测试结果：

10448eps 3.25GB

接着再关闭 _all 结果：

12630eps 2.73GB

接着再关闭_field_names 结果：

14662eps 2.71GB

以及打开_field_names 关闭 _source 结果：

13121eps 2.04GB

在关闭_all和_field_names的基础上，mapping中分词字符串字段加上

"index_options": "docs",
"norms": {
    "enabled": false
}

定义的结果：

16226eps 2.6GB

写入速度大概提高了10%。

如果要用自己的数据集呢，也一样是在自己的 track.json 里定义，比如：

{
    "meta": {
        "data-url": "/Users/raochenlin/.rally/benchmarks/data/splunklog/1468766825_10.json.bz2"
    },
    "indices": [
        {
            "name": "geonames",
            "types": [
                {
                     "name": "type",
                     "mapping": "mappings.json",
                     "documents": "1468766825_10.json.bz2",
                     "document-count":  924645,
                     "compressed-bytes": 19149532,
                     "uncompressed-bytes": 938012996
                }
            ]
        }
    ],

这里就是用的一份 splunkd 的 internal 日志，JSON 导出。日志原长度为 166152239，导出 JSON 长度为 938012996。

同样做一次写入压测，结果为：

关闭_field_names：7193.5eps，索引大小358.173MB。
关闭_field_names和norms：8216.5eps，345.536MB。
关闭_source和norms：6615eps，192.817MB。

elasticsearch 的 sampler 聚合

2016-07-21T00:00:00+00:00

在上一篇文章的基础上，其实 Elasticsearch 从 2.0 以后，还新增了另一种聚合方式，叫 sampler。这个聚合的作用，是在每个分片上，只采样部分文档出来继续后续统计。

比如把上一篇的查询改成这样：

#!/bin/bash
curl -XPOST 'localhost:9200/logstash-2016.07.18/logs/_search?pretty&terminate_after=10000&size=0' -d '
{
    "aggs": {
        "group": {
            "terms": {
                "field": "result.punct"
            },
            "aggs": {
                "sample": {
                    "sampler": {
                         "shard_size": 200
                     },
                    "aggs": {
                        "keyword": {
                            "significant_terms": {
                                "size": 1,
                                "field": "result._raw"
                            },
                            "aggs": {
                                "hit": {
                                    "top_hits": {
                                        "_source": {
                                            "include": [ "result._raw" ]
                                        },
                                        "size":1
                                    }
                                }
                            }
                        }
                    }
                }
            }
        }
    }
}
'

当然，在这个 raw 日志的情况下，取样意义不是特别到，因为有 terminate_after 在，采样本身不会绝对随机。但是对其他 doc_values 的字段，采样就有意义了。

山寨一个 Splunk 的事件模式功能

2016-07-18T00:00:00+00:00

之前我曾经讲过一个简单的在 ELK 中山寨 Splunk 的『显示来源』功能的办法。这次我们玩个更有难度的、当然依然只是山寨式功能的新东西：『事件模式』功能。

Splunk 6.2 推出的这个功能，会基于当前搜索语句的结果集做模式探测，根据精度调整，做成不同数量的聚类。然后给每个聚类分组内，提取出一个关键词（个别情况下也有零个或多个的）。也就是通过机器学习的手段，探测你的日志可能有什么模式，其最具识别性的关键内容是什么。

这个页面如果用 SPL 表示，就是：index=_internal | cluster t=0.8 lableonly=true | findkeywords labelfield=cluster_label | sort - percentInputGroup

我们目前当然在 ES 里是没法做聚类分析什么的了。不过在日志场景下，也不是没有近似的办法。

第一步：完成山寨版的日志模式分组

其实如何山寨模式分组，Splunk 也有类似 SPL 命令做出了示范。这个命令叫 typelearner。

这个命令的大致意思是：把日志里的英文单词、数字、空格等字符都隐藏掉，剩下各种标点符号，就代表一种日志类型。简单的处理方式就是：

cat samplelog.cisco.asa |sed 's/[0-9a-zA-Z]*//g' | sed 's/[[:space:]]/_/g'

然后将这个纯标点符号的字符串，存为事件的一个字段，我们沿袭 Splunk 的叫法： punct 。

这样，我们只要简单的对 punct 字段做 terms aggregation 就可以获取模式分组了。

第二步：完成分组内的关键词查找

然后查找关键词。什么叫关键词呢？就是要能让本分组跟其他分组有显著差异的一个词。这个显然不能再用 terms aggregation 了。否则出来的是最多的词，而不是最有差异性的词。ES 对这个也提供了现成的聚合方式：significant_terms aggregation。

然后这里有另一个问题：一般我们都是在 not_analyzed 字段上做聚合统计的。现在显然并没有具体哪个字段来提供单个字段值做聚合！我们需要用的就是分词的日志原文内容。

所以这块我们需要对原文字段的 mapping 做出特殊定义：

    "message": {
        "type": "text",
        "fielddata": true,
        "index_options": "docs",
        "norms": false
    },

即重新放开 fielddata —— ES 5.0 里，text 类型字段已经默认关闭 fielddata 了。

至于内存的问题，或者交给 Circuit Breaker 来控制；或者自己通过请求中的 terminate_after 参数预先控制。

就模式发现这个功能来说，通过 terminate_after 参数预定义控制应该是个不错的思路。因为本来就是一个不确定的猜测，加太大的数据量来做这事儿，没多少性价比。

所以我们最终发出的请求是这样：

#!/bin/bash
curl -XPOST 'http://localhost:9200/logstash-2016.07.18/logs/_search?pretty&terminate_after=30000&size=0' -d '
{
    "aggs": {
        "group": {
            "terms": {
                "field": "punct"
            },
            "aggs": {
                "keyword": {
                    "significant_terms": {
                        "size": 1,
                        "field": "message"
                    },
                    "aggs": {
                        "hit": {
                            "top_hits": {
                                "_source": {
                                    "include": [ "message"  ]
                                },
                                "size":1
                            }
                        }
                    }
                }
            }
        }
    }
}
'

我们可以看到请求结果如下：

{
  "took" : 2179,
  "timed_out" : false,
  "terminated_early" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 2,
    "failed" : 3,
    "failures" : [ {
      "shard" : 0,
      "index" : "logstash-2016.07.18",
      "node" : "L0qQ1ZcyQGmj7Ge7ZlCmYg",
      "reason" : {
        "type" : "circuit_breaking_exception",
        "reason" : "[request] Data too large, data for [<reused_arrays>] would be larger than limit of [415550668/396.2mb]",
        "bytes_wanted" : 415762160,
        "bytes_limit" : 415550668
      }
    } ]
  },
  "hits" : {
    "total" : 371095,
    "max_score" : 0.0,
    "hits" : [ ]
  },
  "aggregations" : {
    "group" : {
      "doc_count_error_upper_bound" : 72,
      "sum_other_doc_count" : 93355,
      "buckets" : [ {
        "key" : "--_::._+____-_=,_=,_=,_=.,_=,_=",
        "doc_count" : 98100,
        "keyword" : {
          "doc_count" : 98100,
          "buckets" : [ {
            "key" : "cpu_seconds",
            "doc_count" : 98100,
            "score" : 2.2037623779471813,
            "bg_count" : 115831,
            "hit" : {
              "hits" : {
                "total" : 98100,
                "max_score" : 1.0,
                "hits" : [ {
                  "_index" : "logstash-2016.07.18",
                  "_type" : "logs",
                  "_id" : "AVX-RMJbLjo3PexoUujh",
                  "_score" : 1.0,
                  "_source" : {
                    "message" : "07-15-2016 14:17:33.776 +0800 INFO  Metrics - group=pipeline, name=indexerpipe, processor=index_thruput, cpu_seconds=0.000000, executes=111, cumulative_hits=161675"
                  }
                } ]
              }
            }
          } ]
        }
      }, {
        "key" : "--_::._+____-_=,_=,_=,_=,_=,_=,_=",
        "doc_count" : 87058,
        "keyword" : {
          "doc_count" : 87058,
          "buckets" : [ {
            "key" : "largest_size",
            "doc_count" : 75663,
            "score" : 2.835574761742766,
            "bg_count" : 75663,
            "hit" : {
              "hits" : {
                "total" : 75663,
                "max_score" : 1.0,
                "hits" : [ {
                  "_index" : "logstash-2016.07.18",
                  "_type" : "logs",
                  "_id" : "AVX-RMJbLjo3PexoUuj9",
                  "_score" : 1.0,
                  "_source" : {
                    "message" : "07-15-2016 14:17:02.780 +0800 INFO  Metrics - group=queue, name=nullqueue, max_size_kb=500, current_size_kb=0, current_size=0, largest_size=1, smallest_size=0"
                  }
                } ]
              }
            }
          } ]
        }
      }, {
        "key" : "--_::._+____-_=,_=\"\",_=.,_=.,_=.,_=,_=.,_=",
        "doc_count" : 26317,
        "keyword" : {
          "doc_count" : 26317,
          "buckets" : [ {
            "key" : "max_age",
            "doc_count" : 26317,
            "score" : 7.224805514306611,
            "bg_count" : 45119,
            "hit" : {
              "hits" : {
                "total" : 26317,
                "max_score" : 1.0,
                "hits" : [ {
                  "_index" : "logstash-2016.07.18",
                  "_type" : "logs",
                  "_id" : "AVX-RMJbLjo3PexoUukH",
                  "_score" : 1.0,
                  "_source" : {
                    "message" : "07-15-2016 14:17:02.780 +0800 INFO  Metrics - group=per_sourcetype_thruput, series=\"scheduler\", kbps=0.014869, eps=0.032258, kb=0.460938, ev=1, avg_age=0.000000, max_age=0"
                  }
                } ]
              }
            }
          } ]
        }
      }, {
        "key" : "--_::._+____-_=,_=\"//////.\",_=.,_=.,_=.,_=,_=.,_=",
        "doc_count" : 13063,
        "keyword" : {
          "doc_count" : 13063,
          "buckets" : [ {
            "key" : "log",
            "doc_count" : 13063,
            "score" : 27.241628614916287,
            "bg_count" : 13140,
            "hit" : {
              "hits" : {
                "total" : 13063,
                "max_score" : 1.0,
                "hits" : [ {
                  "_index" : "logstash-2016.07.18",
                  "_type" : "logs",
                  "_id" : "AVX-RMKILjo3PexoUulQ",
                  "_score" : 1.0,
                  "_source" : {
                    "message" : "07-15-2016 14:16:31.780 +0800 INFO  Metrics - group=per_source_thruput, series=\"/applications/splunk/var/log/splunk/metrics.log\", kbps=0.326188, eps=2.032164, kb=10.112305, ev=63, avg_age=0.968254, max_age=1"
                  }
                } ]
              }
            }
          } ]
        }
      }, {
        "key" : "--_::._+____-_=,_=,_=.,_=.,_=.,_=.,_=.,_=.",
        "doc_count" : 11603,
        "keyword" : {
          "doc_count" : 11603,
          "buckets" : [ {
            "key" : "average_kbps",
            "doc_count" : 11603,
            "score" : 20.38013481592441,
            "bg_count" : 17357,
            "hit" : {
              "hits" : {
                "total" : 11603,
                "max_score" : 1.0,
                "hits" : [ {
                  "_index" : "logstash-2016.07.18",
                  "_type" : "logs",
                  "_id" : "AVX-RMKILjo3PexoUulA",
                  "_score" : 1.0,
                  "_source" : {
                    "message" : "07-15-2016 14:16:31.781 +0800 INFO  Metrics - group=thruput, name=index_thruput, instantaneous_kbps=0.875684, instantaneous_eps=2.032165, average_kbps=0.340430, total_k_processed=33138.000000, kb=27.147461, ev=63.000000"
                  }
                } ]
              }
            }
          } ]
        }
      }, {
        "key" : "--_::._+____-_=,_=,_=,_=,_=",
        "doc_count" : 11417,
        "keyword" : {
          "doc_count" : 11417,
          "buckets" : [ {
            "key" : "qwork_units",
            "doc_count" : 11417,
            "score" : 31.50372251905054,
            "bg_count" : 11417,
            "hit" : {
              "hits" : {
                "total" : 11417,
                "max_score" : 1.0,
                "hits" : [ {
                  "_index" : "logstash-2016.07.18",
                  "_type" : "logs",
                  "_id" : "AVX-RMLOLjo3PexoUunn",
                  "_score" : 1.0,
                  "_source" : {
                    "message" : "07-15-2016 14:15:29.777 +0800 INFO  Metrics - group=tpool, name=indexertpool, qsize=0, workers=2, qwork_units=0"
                  }
                } ]
              }
            }
          } ]
        }
      }, {
        "key" : "--_::._+____-_=,_=,_=---,_=.,_=,_=",
        "doc_count" : 11350,
        "keyword" : {
          "doc_count" : 11350,
          "buckets" : [ {
            "key" : "generic",
            "doc_count" : 11350,
            "score" : 31.69559471365639,
            "bg_count" : 11350,
            "hit" : {
              "hits" : {
                "total" : 11350,
                "max_score" : 1.0,
                "hits" : [ {
                  "_index" : "logstash-2016.07.18",
                  "_type" : "logs",
                  "_id" : "AVX-RMJbLjo3PexoUukk",
                  "_score" : 1.0,
                  "_source" : {
                    "message" : "07-15-2016 14:17:02.779 +0800 INFO  Metrics - group=pipeline, name=indexerpipe, processor=syslog-output-generic-processor, cpu_seconds=0.000000, executes=104, cumulative_hits=161564"
                  }
                } ]
              }
            }
          } ]
        }
      }, {
        "key" : "--_::._+____-_=,_=,_=,_=.",
        "doc_count" : 7135,
        "keyword" : {
          "doc_count" : 7135,
          "buckets" : [ {
            "key" : "search_health_metrics",
            "doc_count" : 7135,
            "score" : 51.010511562718996,
            "bg_count" : 7135,
            "hit" : {
              "hits" : {
                "total" : 7135,
                "max_score" : 1.0,
                "hits" : [ {
                  "_index" : "logstash-2016.07.18",
                  "_type" : "logs",
                  "_id" : "AVX-RMJbLjo3PexoUujq",
                  "_score" : 1.0,
                  "_source" : {
                    "message" : "07-15-2016 14:17:33.776 +0800 INFO  Metrics - group=search_health_metrics, name=bundle_directory_reaper, bundle_dir_reaper_max_ms=1, bundle_dir_reaper_mean_ms=1.000000"
                  }
                } ]
              }
            }
          } ]
        }
      }, {
        "key" : "--_::._+____-_=,_=,_=,_=.,_=,_=,_=,_=",
        "doc_count" : 5849,
        "keyword" : {
          "doc_count" : 5849,
          "buckets" : [ {
            "key" : "search_queue_metrics",
            "doc_count" : 5849,
            "score" : 62.445888186014706,
            "bg_count" : 5849,
            "hit" : {
              "hits" : {
                "total" : 5849,
                "max_score" : 1.0,
                "hits" : [ {
                  "_index" : "logstash-2016.07.18",
                  "_type" : "logs",
                  "_id" : "AVX-RMKILjo3PexoUulx",
                  "_score" : 1.0,
                  "_source" : {
                    "message" : "07-15-2016 14:16:31.777 +0800 INFO  Metrics - group=search_concurrency, name=search_queue_metrics, enqueue_seaches_count=0, avg_time_spent_in_queue=0.000000, max_time_spent_in_queue=0, current_queue_size=0, largest_queue_size=0, min_queue_size=0"
                  }
                } ]
              }
            }
          } ]
        }
      }, {
        "key" : "--_::._+____-_=,_=,_=,_=,_=,_=,_=,_=,_=,_=,_=,_=,_",
        "doc_count" : 5848,
        "keyword" : {
          "doc_count" : 5848,
          "buckets" : [ {
            "key" : "max_ready",
            "doc_count" : 5848,
            "score" : 62.45673734610123,
            "bg_count" : 5848,
            "hit" : {
              "hits" : {
                "total" : 5848,
                "max_score" : 1.0,
                "hits" : [ {
                  "_index" : "logstash-2016.07.18",
                  "_type" : "logs",
                  "_id" : "AVX-RMJbLjo3PexoUuk5",
                  "_score" : 1.0,
                  "_source" : {
                    "message" : "07-15-2016 14:17:02.776 +0800 INFO  Metrics - group=searchscheduler, dispatched=1, skipped=0, total_lag=1, max_ready=0, max_pending=0, max_lag=1, window_max_lag=0, window_total_lag=0, max_running=0, actions_triggered=0, completed=1, total_runtime=0.189, max_runtime=0.189"
                  }
                } ]
              }
            }
          } ]
        }
      } ]
    }
  }
}

响应体中可以看到因为 terminate_after 设得还是过大，所以还没到中止条数就被 kill 了。实际只扫描了 370173 条数据。那么我们下次就可以把 terminate_after 调成 10000 得了。

然后就是 significant_terms 返回的关键词们。跟之前 splunk 的截图相比，我们可以发现，不是完全一样的效果，但是还是有部分关键词是一致的。比如 smallest_size, total_k_processed, search_health_metrics, var, workers 等。

可以说，作为一个山寨品，这个做法是行得通的~

hapi.js 框架的认证授权插件示例

2016-07-07T00:00:00+00:00

Kibana 4.x 在服务器端采用了 hapi.js 框架开发。虽然目前依然没有认证和授权的插件出来（官方 Kibana 的 shield 插件应该只是做了一个认证，授权部分是由 ES 本身的 shield 插件完成的）。不过既然叫框架嘛，自然就是有不少扩展可用。本文简要介绍一下 hapi.js 框架的认证授权插件的用法。有兴趣的读者可以自己稍微改造一下，就能让 Kibana 也有认证授权功能了。

首先准备一下环境：

mkdir hapi-auth-simple
cd hapi-auth-simple
npm init
npm install --save bcrypt
npm install --save hapi
npm install --save hapi-rbac
npm install --save hapi-auth-cookie

你就会发现目录底下多出来一个 node_modules/ 目录和 package.json 配置定义文件。定义如下：

{
  "name": "hapi-auth-test",
  "version": "1.0.0",
  "description": "",
  "main": "index.js",
  "scripts": {
    "test": "echo \"Error: no test specified\" && exit 1"
  },
  "author": "",
  "license": "ISC",
  "dependencies": {
    "bcrypt": "^0.8.7",
    "hapi": "^13.5.0",
    "hapi-auth-cookie": "^6.1.1",
    "hapi-rbac": "^2.2.0"
  }
}

然后开始写实际的 demo 代码啦。index.js 内容如下：

'use strict';

const Bcrypt = require('bcrypt');
const Hapi = require('hapi');
const Rbac = require('hapi-rbac');
const Cookie = require('hapi-auth-cookie');

const server = new Hapi.Server();
server.connection({ port: 3000  });

let uuid = 1;
const users = {
    john: {
        username: 'john',
        password: '$2a$10$iqJSHD.BGr0E2IxQwYgJmeP3NvhPrXAeLSaGCj6IR/XU5QtjVu5Tm',   // 'secret'
        name: 'John Doe',
        group: ['user']
    }
};

const login = function (request, reply) {
    if (request.auth.isAuthenticated) {
        return reply.redirect('/');
    }

    let message = '';
    let account = null;

    if (request.method === 'post') {
        if (!request.payload.username ||
            !request.payload.password) {
                message = 'Missing username or password';
        }
        else {
            account = users[request.payload.username];
            if (!account ||
                !Bcrypt.compareSync(request.payload.password, account.password)) {
                    message = 'Invalid username or password';
            }
        }
    }

    if (request.method === 'get' || message) {
        return reply('<html><head><title>Login page</title></head><body>' +
            (message ? '<h3>' + message + '</h3><br/>' : '') +
            '<form method="post" action="/login">' +
            'Username: <input type="text" name="username"><br>' +
            'Password: <input type="password" name="password"><br/>' +
            '<input type="submit" value="Login"></form></body></html>');
    }

    const sid = String(++uuid);
    request.server.app.cache.set(sid, { account: account  }, 0, (err) => {
        if (err) {
            reply(err);
        }
        request.cookieAuth.set({ sid: sid  });
        return reply.redirect('/');
    });
};

server.register([Cookie, Rbac], (err) => {
    if (err) {
        throw err;
    }
    const cache = server.cache({
        segment: 'sessions',
        expiresIn: 3 * 24 * 60 * 60 * 1000
    });
    server.app.cache = cache;

    server.auth.strategy('session', 'cookie', 'required', {
        password: 'password-should-be-32-characters',
        cookie: 'sid-example',
        redirectTo: '/login',
        isSecure: false,
        validateFunc: (request, session, callback) => {
            cache.get(session.sid, (err, cached) => {
                if (err) {
                    return callback(err, false);
                }
                if (!cached) {
                    return callback(null, false);
                }
                return callback(null, true, cached.account);
            });
        }
    });
    server.route([
        {
            method: ['GET', 'POST'],
            path: '/login',
            config: {
                handler: login,
                auth: { mode: 'try'  },
                plugins: {
                    'hapi-auth-cookie': {
                        redirectTo: false
                    }
                }
            }
        },
        {
            method: 'GET',
            path: '/logout',
            config: {
                handler: (request, reply) => {
                    request.cookieAuth.clear();
                    return reply.redirect('/');
                }
            }
        },
        {
            method: 'GET',
            path: '/',
            config: {
                handler: (request, reply) => {
                    reply('<html><head></head><body>Welcome: ' +
                      request.auth.credentials.name + 
                      '<form method="get" action="/logout">' +
                      '<input type="submit" value="Logout">' +
                      '</form></body></html>');
                },
                plugins: {
                    rbac: {
                        target: [
                            {
                                'credentials:group': 'user'
                            },
                            {
                                'credentials:group': 'admin'
                            }
                        ],
                        apply: 'permit-overrides',
                        policies: [
                            {
                                target: {
                                    'credentials:group': 'admin'
                                },
                                effect: 'permit'
                            },
                            {
                                target: {
                                    'credentials:group': 'user'
                                },
                                apply: 'permit-overrides',
                                rules: [
                                    {
                                        target: {
                                            'credentials:username': 'john',
                                        },
                                        effect: 'permit'
                                    },
                                    {
                                        effect: 'deny'
                                    }
                                ]
                            }
                        ]
                    }
                }
            }
        }
    ]);
    server.start((err) => {
        if (err) {
            throw err;
        }
        console.log('server running at: ' + server.info.uri);
    });
});

就这样，一个简单的认证授权页就完成了。运行 node index.js 命令，打开浏览器，输入 127.0.0.1:3000 即可验证效果。

john 用户定义了自己的 group 为 user。
定义首页的授权目标(target)为：group 为 user 或者 admin 的用户。注意这里的写法是 [{xxx},{yyy}]。如果写法是 [{xxx, yyy}]，那含义就不是或者而是并且了。
target 里可以用以下对象：credentials, connection, query, param, request。注意这里引用 key 的写法是冒号(比如从 HTTP header 中获取主机名的写法为 connection:host)。
定义该目标的授权方式为 apply，即还需要后续判断。如果直接就授权，那应该写作 effect。
apply 方式定义为 permit-overrides。意即：后续条件只要满足一个就允许，否则拒绝。deny-overrides 反之亦然。
开始定义具体的 policies 集合。同样格式也是或的关系。这里如果没有复杂需求也可以直接开始 rules 定义。
每个小 policy 里也是一个完整的授权定义，也有自己的 target 等。
开始 rules 定义。rules 里的条件相当于是 if-else 关系。

最终本文示例的意思就是：

首页只允许 admin 组全体用户加上 user 组里的 john 用户访问。

简单的 hello world 示意如此。再往深了走，可以把 user 定义、policy 定义都搬到数据库里。再再往深里走。可以把 Kibana 里所有的 route 都用这块做一个接管。就大功告成了。

不过在 hapi.js 上动手，只是对后端接口做了授权控制，前端页面看起来还是都一样的。如果为了美观，就可以配合加上 angular-rbac，对前端页面也稍作修改，针对不同 user 展示不同内容。

Lucene 查询中的距离查询(proximity query)

2016-04-04T00:00:00+00:00

我们在使用 ELK 的时候，使用 Lucene querystring 语法的机会，远超过使用 Elasticsearch 的 query DSL。毕竟在搜索框里写语法比自己拼 JSON 简单多了。

不过一般我们用的 querystring 语法总是最简单的几样：

text
key:value
key:"term"
k1:v1 AND NOT k2:v2

80% 的情况下，这几个用法也就足够了。但总有剩下的 20% 的情况，还是需要我们来了解一些更复杂的语法。

举一个还算通用的场景：我们在 ELK 里索引了访问日志。这时候需要查一下以 /api/login 开头的 URL 们的情况。

我们没法确定 URL 里是不是只有 /api/login 一种可能。没准可能还有 /api/oauth/login 呢？没准可能还有 login/weibo/api 呢？

一般来说，日志进 ELK 都是采用标准分词器的。而很巧，/ 就是标准分词器的停止词之一。所以，我们在搜索框里写 api/login 等效于 api login。那么太多可能都可以命中了。

这个时候，Lucene 查询语法里的距离查询(proximity query)就可以帮忙了：

url:"api login"

看起来很简单，无非是给加了一对双引号？！

没错，加引号以后，意味着这个短语查询必须是有序的，即只能命中先出现api，再出现login的文本了。这下就把 login/weibo/api 排除掉了。

其次，Lucene 距离查询默认的距离为 0，即只能命中出现api之后，下一个term必须为login的文本了。这些就把 /api/oauth/login 也排除了。

当然，如果这时候你日志里除了 api/login 还有 api,login 之类的文本，也是会命中的。不过在 url 字段里出现这个的概率不大，可以无视了~

如果你要搜的就是 /api/oauth/login，但是你不记得中间这个是不是 oauth，也可能是其他的吧，怎么办？

url:"api login"~1

后面加波浪线和距离即可。

用火焰图看 elasticsearch 的资源占用

2016-04-01T00:00:00+00:00

我们都很习惯在压测 nginx 等服务的时候，利用 systemtap 完成 flamegraph 火焰图来看具体哪个函数占用 CPU 资源过多了。那么，对 Java 实现的 elasticsearch，有没有类似办法呢？

JDK 自带有 jstack 命令，可以获取相关信息，其实只要一个可视化的过程就行了。而社区也有人早已做好。下面就是 nodejs 的 javaflamegraph 库的安装使用过程：

wget https://nodejs.org/download/release/v5.10.0/node-v5.10.0-linux-x64.tar.gz --no-check-certificate
tar zxvf node-v5.10.0-linux-x64.tar.gz
cd node-v5.10.0-linux-x64
./bin/npm install javaflamegraph
../../bin/npm run start `ps aux|grep elasticsearc[h]|awk '{print $2}'`

确保 jstack 命令可用(flame-gen.sh 里是直接调用的，注意 PATH)，确保当前目录可写。

等待几十秒后，中止进程。用浏览器打开当前目录下的 flame.html。可以看到如下效果：

鼠标大概在上面移动一下，可以看到大概 segment merge 和 bulk thread 各占了 ES 进程资源消耗的半壁江山。

我们再点击一个 bulk thread，看看细节：

可以看到其中 primary 和 replica 各占一部分。两者各自包括各自的三块：lucene 的 indexWriter、loadCurrentVersionFromIndex、translog。

在集群压测中，这三块的占比大概是后面两个加起来不到15%的样子，如果做日志场景，其实有可能用不上 version 检查，可以省掉大概 10% 的资源消耗。不过，谁都难免有异常要 retry，通过 version 检查避免重复的 indexing，也是有利的。所以总体来说：elasticsearch 在索引性能方面，做的应该是挺好了。要提高这个速度，可能更需要关心的是 lucene 层面的方案，比如分词方式、结构化程度等等~

机器战胜人类了，伺候机器的运维呢？

2016-03-19T00:00:00+00:00

2016 年 3 月最火爆的新闻，莫过于谷歌的 alphago 机器 4:1 大胜李世乭了。一时间各界议论纷纷，我的前同事，运维界非著名段子手 @orroz 在自己微博上写了两段话：

『跟其他运维工程师觉得这个职业将消失不同。我是对运维职业是持极端乐观态度的，也许运维职业将是人类最后一个职业。很可能祂们在能自理之前还需要我们伺候。。。也说不定，某几个运维工程师因为某种不知道的原因还会被祂们当宠物留下来，成为人类的最后的延续。』『我终于明白这个图片的寓意了，它其实预示了人类的未来命运。』

看完一笑~

但是笑完以后，回头想想，运维和围棋手，其实还真是有相像的地方：传统说法中，与研发相比，运维总被认为是『更靠经验的』；一如我们说『人类棋手的经验和大局观』。

我们知道，运维的『操作』，已经是可替代的了，IaaS、PaaS、运维自动化，诸多概念的落地，环境部署、软件安装不再是运维的主要工作职责。运维的职位名称，从系统管理员到运维工程师到产品工程师到站点可靠性工程师，一步步远离了基础设备层面。

那，有没有可能，运维的『经验』，也是可以被机器替代掉的呢？

运维经验

我们先看看运维的经验到底是什么？

一个 4 核 CPU 的服务器，loadavg 跑到 10+，我们就会说：负载过高了。应对办法最简单的就是『加机器』。
一个 web 服务，每秒请求超过 1000，响应变慢了，我们就会说：还在用 apache 啊，快换 nginx 吧。
要是动态服务呢，就会说：做个动静分离呗，加个缓存层呗。

这就是运维届的『定式』和『俗手』。

但是不巧，定式并不能一路保送我们最后顺利完工。

就好像这五场世纪大战一开始，人类棋手总觉得 alphago 水平不行——『职业初段的人都应该知道下这里才对啊』。但是一百多手不知不觉过去，局面就是不利了！

经验的坑

比方前面说的第一条经验，这几乎已经是运维共识了。但是把环境考虑进来：这如果是一台虚拟机呢？这如果挂载的是一个远端存储呢？这如果运行的是一个无法水平扩展的事务系统呢？

是的，『加机器』只能死的更惨。（此处应配有那两把著名的刘强东之刀）

所以，经验是否真的能成立，有赖于更复杂和深层次的分析。就像围棋依赖于算力一样。

大数据那么美好么

文章写到这里，似乎我要开始鼓吹运维届要如何如何上马大数据乃至机器学习了？

这种玩法看起来确实高大上，但实际上，并没有那么美好！我们不要忘了：运维始终是一个 IT 支出向的工作。DevOps 运动中说运维加快部署就是赚钱，那也是间接的。花钱是直接的。还是引用另一个微博上有关 alphago 的段子：

alphago 跑了 1000 个 CPU，李世乭吃了一餐饭，比一下资源消耗就知道谁赢了。

运维工程师拥有前所未有的多的机器数据，理论上当然可以通过大数据挖掘，通过机器学习获得相当多的收获。但是这些收获跟能间接带来的收益相比，性价比如何呢？

拿监控数据来说，我们知道监控产生的，大多是时序数值。对于时序数值的分析，金融界早有数十年的算法研究和积累。运维工程师照搬过来，未尝不可。但这其中一些算法消耗的 CPU 运算，没准比本身业务系统运行消耗的还高，那这个花费显然就不可能投入。

《人工智能的未来》作者，神经学家 Jeff Hawkins 成立的 numenta 公司曾经对市面上各种号称处理时序数据异常探测或者预测分析的开源实现做了对比性测试。结果，真正能满足『时序、动态』前提的都不多，有些算法长达一个小时都完成不了测试。更好玩的是：有的测试场景中，随机选异常点都有 25.9% 的准确率。

测试见：https://github.com/numenta/NAB。（当然我这里不是来推销说 HTM 算法是人工智能未来，毕竟 alphago 是 DNN 呢）

废话这么多，到底怎么办

又要深入分析，又要控制能耗。最好的办法，就是把不确定性降低，在一个较完善的运维体系框架基础上做数据分析，可以大大缩小数据集，降低复杂度。

运维体系怎么才算完善，已经有很多文章在讲了。以数据分析为目的的话，个人推荐王津银的数据驱动运维系列文章。

分析本身如何入手，其实简单算法也未必不好。百度云在 SREcon15 上的分享，同样推荐观看。在线数据通过简单的 3-sigma、ks-test、holt-winters、LOESS 来生成异常点，然后仅对异常点采用 Viterbi 计算同比的异常区域发出实际告警，配合通用的 tracing 调用链系统使用。

最后回到文章开头的段子：机器为啥留下几个运维工程师？或许因为这几个运维当初给机器安排的都是算 3-sigma 这样轻松的活，一报还一报吧:)

juttle 可视化界面介绍

2016-03-16T00:00:00+00:00

上篇介绍了一下怎么用 juttle 交互式命令行查看表格式输出。juttle 事实上还提供了一个 web 服务器，做数据可视化效果，这个同样是用 juttle 语言描述配置。

我们已经在上一篇安装好了 juttle-engine 模块，那么直接启动服务器即可：

~$ juttle-engine -d

然后浏览器打开 http://localhost:8080 就能看到页面了。注意，请使用 Chrome v45 以上版本或者 Safari 等其他浏览器，否则有个 Array 上的 bug。

但是目前这个页面上本身不提供输入框直接写 juttle 语言。所以需要我们把 juttle 语言写成脚本文件，再来通过页面加载。

~$ cat > ~/test.juttle <<EOF
read elastic -index 'logstash-*'  -from :-2d: -to :now: 'MacBook-Pro'
  | reduce -every :1h: count() by 'path.raw'
  | (
      view timechart -row 0 -col 0;;
      view table -height 200 -row 1 -col 0;
      view piechart -row 1 -col 0;
  );
(
  read elastic -index 'logstash-*'  -from :-2d: -to :-1d: 'MacBook-Pro' AND '/var/log/system.log'
    | reduce -every :1h: count();
  read elastic -index 'logstash-*'  -from :-1d: -to :now: 'MacBook-Pro' AND '/var/log/system.log'
    | reduce -every :1h: count();
)
  | (
      view timechart -duration :1 day: -overlayTime true -height 400 -row 0 -col 1 -title 'syslog hour-on-hour';
      view table -height 200 -row 1 -col 1;
  );
EOF

然后访问 http://localhost:8080?path=/test.juttle，注意这里的path参数的写法，这个/其实指的是你运行 juttle-engine 命令的时候的路径，而不是真的设备根目录。

就可以在浏览器上看到如下效果：

页面上还有一行有关 path.raw 的 WARNING 提示，那是因为 juttle 目前对 elasticsearch 的 mapping 解析支持的不是很好，但是不影响使用，可以不用管。

可视化相关指令介绍

我们可以看到这次的 juttle 脚本，跟昨天在命令行下运行的几个区别：

我们用上了 ()，这是 juttle 的一大特技，对同一结果并联多个 view ，或者并联多个输入结果做相同的后续处理等等。
我们对 view 用上了 row 和 col 参数，用来指定他们在页面上的布局。
有一个 timechart 我们用了 -durat :1d: -overlayTime true 参数。这是 timechart 独有的参数，专门用来实现同比环比的。在图上的效果大家也可以看到了。不过目前也有小问题，就是鼠标放到图上的时候，只能看到第二个结果的指标说明，看不到第一个的。

juttle 介绍

2016-03-16T00:00:00+00:00

juttle 是一个 nodejs 项目，专注于数据处理和可视化。它自定义了一套自己的 DSL，提供交互式命令行、程序运行、界面访问三种运行方式。

在 juttle 的 DSL 中，可以用 | 管道符串联下列指令实现数据处理：

通过 read 指令读取来自 http、file、elasticsearch、graphite、influxdb、opentsdb、mysql 等数据源，
通过 filter 指令及自定义的 JavaScript 函数做数据过滤，
通过 reduce 指令做数据聚合，
通过 join 指令做数据关联，
通过 write 指令做数据转储，
通过 view 指令做数据可视化。

更关键的，可以用 () 并联同一层级的多条指令进行处理。

看起来非常有意思的项目，赶紧试试吧。

安装部署

既然说了这是一个 nodejs 项目，自然是通过 npm 安装了：

sudo npm install -g juttle
sudo npm install -g juttle-engine

注意，如果是在 MacBook 上安装的话，一定要先通过 AppStore 安装好 Xcode 并确认完 license。npm 安装依赖的 sqlite3 的时候没有 xcode 会僵死在那。

juttle 包提供了命令行交互，juttle-engine 包提供了网页访问的服务器。

juttle 的配置文件默认读取位置是 $HOME/.juttle/config.json。比如读取本机 elasticsearch 的数据，那么定义如下：

{
    "adapters": {
        "elastic": {
            "address": "localhost",
            "port": 9200
        }
    }
}

甚至可以读取多个不同来源的 elasticsearch，这样：

{
    "adapters": {
        "elastic": [{
            "id": "one",
            "address": "localhost",
            "port": 9200
        }, {
            "id": "two",
            "address": "localhost",
            "port": 9201
        }],
        "influx": {
            "url": "http://examples_influxdb_1:8086",
            "user": "root",
            "password": "root"
        }
    }
}

命令行运行示例

配置完成，就可以交互式命令行运行了。终端输入 juttle 回车进入交互界面。我们输入下面一段查询：

juttle> read elastic -id one -index 'logstash-*'  -from :1 year ago: -to :now: 'MacBook-Pro' | reduce -every :1h: c = count() by path | filter c > 1000 | put line = 10000 | view table -columnOrder 'time', 'c', 'line', 'path'

输出如下：

┌────────────────────────────────────┬──────────┬──────────┬─────────────────────────────┐
│ time                               │ c        │ line     │ path                        │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-02T10:00:00.000Z           │ 4392     │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-02T11:00:00.000Z           │ 4818     │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-02T12:00:00.000Z           │ 2038     │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-02T13:00:00.000Z           │ 1826     │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-02T15:00:00.000Z           │ 10267    │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-02T16:00:00.000Z           │ 10999    │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-02T17:00:00.000Z           │ 3528     │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-03T00:00:00.000Z           │ 2498     │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-03T03:00:00.000Z           │ 4600     │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-03T04:00:00.000Z           │ 7751     │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-03T05:00:00.000Z           │ 3249     │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-03T06:00:00.000Z           │ 5715     │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-03T07:00:00.000Z           │ 4374     │ 10000    │ /var/log/system.log         │
├────────────────────────────────────┼──────────┼──────────┼─────────────────────────────┤
│ 2016-03-03T08:00:00.000Z           │ 2600     │ 10000    │ /var/log/system.log         │
└────────────────────────────────────┴──────────┴──────────┴─────────────────────────────┘

漂亮的终端表格！

警告

需要注意的是，juttle 和 es-hadoop 一样，也是通过 RESTful API 和 elasticsearch 交互，所以除了个别已经提前实现好了的 reduce 方法可以转换成 aggregation 以外，其他的 juttle 指令，都是通过 query 把数据拿回来以后，由 juttle 本身做的运算处理。juttle-adapter-elastic 模块的 DEFAULT_FETCH_SIZE 设置是 10000 条。

而比 es-hadoop 更差的是，因为 juttle 是单机程序，它还没有像 es-hadoop 那样并发 partition 直连每个 elasticsearch 的 shard 做并发请求。

Kibana4 服务器端插件开发

2016-01-27T00:00:00+00:00

我在 ELK Stack 中文指南的 visualize 解析一节介绍了如何给 Kibana4 开发浏览器端的可视化插件。Kibana4 跟 Kibana3 比，最大的一个变化是有了独立的 node.js 服务器端。那么同样的，也就有了服务器端的 Kibana4 插件。最明显的一个场景：我们可以在 node.js 里跑定时器做 Elasticsearch 的告警逻辑了！

本文示例一个最基础的 Kibana4 告警插件开发。只演示基础的定时器和 Kibana4 插件规范，实际运用中，肯定还涉及历史记录，告警项配置更新等。请读者不要直接 copy-paste。

首先，我们尽量沿袭 Elastic 官方的 watcher 产品的告警配置设计。也新建一个索引，里面是具体的配置内容：

# curl -XPUT http://127.0.0.1:9200/watcher/watch/error_status -d'
{
  "trigger": {
    "schedule" : { "interval" : "60"  }
  },
  "input" : {
    "search" : {
      "request" : {
        "indices" : [ "<logstash-{now/d}>", "<logstash-{now/d-1d}>"  ],
        "body" : {
          "query" : {
            "filtered" : {
              "query" : { "match" : { "host" : "MacBook-Pro"  } },
              "filter" : { "range" : { "@timestamp" : { "from" : "now-5m"  } } }
            }
          }
        }
      }
    }
  },
  "condition" : {
    "script" : {
      "script" : "payload.hits.total > 0"
    }
  },
  "transform" : {
    "search" : {
      "request" : {
        "indices" : [ "<logstash-{now/d}>", "<logstash-{now/d-1d}>"  ],
        "body" : {
          "query" : {
            "filtered" : {
              "query" : { "match" : { "host" : "MacBook-Pro"  } },
              "filter" : { "range" : { "@timestamp" : { "from" : "now-5m"  } } }
            }
          },
          "aggs" : {
            "topn" : {
              "terms" : {
                "field" : "path.raw"
              }
            }
          }
        }
      }
    }
  },
  "actions" : {
    "email_admin" : {
    "throttle_period" : "15m",
    "email" : {
      "to" : "admin@domain",
      "subject" : "Found  Error Events",
      "priority" : "high",
      "body" : "Top10 paths:\n\{\{#payload.aggregations.topn.buckets}}\t\{\{key}} \{\{doc_count}}\n\{\{/payload.aggregations.topn.buckets}}"
    }
    }
  }
}'

我们可以看到，跟原版的相比，只改动了很小的一些地方：

为了简便，interval 固定写数值，没带 s/m/d/H 之类的单位；
condition 里直接使用了 JavaScript，这点也是 ES 2.x 的 mapping 要求跟 watcher 本身有冲突的一个地方：watcher的 "ctx.payload.hits.total" : { "gt" : 0 } 这种写法，如果是普通索引，会因为字段名里带 . 直接写入失败的；
因为是在 Kibana 里面运行，所以从 ES 拿到的只有 payload(也就是查询响应)，所以把里面的 ctx. 都删掉了。

好，然后创建插件：

cd kibana-4.3.0-darwin-x64/src/plugins
mkdir alert

在自定义插件目录底下创建 package.json 描述：

{
  "name": "alert",
  "version": "0.0.1"
}

以及最终的 index.js 代码：

'use strict';
module.exports = function (kibana) {
  var later = require('later');
  var _ = require('lodash');
  var mustache = require('mustache');

  return new kibana.Plugin({
    init: function init(server) {
      var client = server.plugins.elasticsearch.client;
      var sched = later.parse.text('every 10 minute');
      later.setInterval(doalert, sched);
      function doalert() {
        getCount().then(function(resp){
          getWatcher(resp.count).then(function(resp){
            _.each(resp.hits.hits, function(hit){
              var watch = hit._source;
              var every = watch.trigger.schedule.interval;
              var watchSched = later.parse.recur().every(every).second();
              var wt = later.setInterval(watching, watchSched);
              function watching() {
                var request = watch.input.search.request;
                var condition = watch.condition.script.script;
                var transform = watch.transform.search.request;
                var actions = watch.actions;
                client.search(request).then(function(payload){
                  var ret = eval(condition);
                  if (ret) {
                    client.search(transform).then(function(payload) {
                      _.each(_.values(actions), function(action){
                        if(_.has(action, 'email')) {
                          var subject = mustache.render(action.email.subject, {"payload":payload});
                          var body = mustache.render(action.email.body, {"payload":payload});
                          console.log(subject, body);
                        }
                      });
                    });
                  }
                });
              }
            });
          });
        });
      }
      function getCount() {
        return client.count({
          index:'watcher',
          type:"watch"
        });
      }
      function getWatcher(count) {
        return client.search({
          index:'watcher',
          type:"watch",
          size:count
        });
      }
    }
  });
};

其中用到了两个 npm 模块，later 模块用来实现定时器和 crontab 文本解析，mustache 模块用来渲染邮件内容模板，这也是 watcher 本身采用的渲染模块。

需要安装一下：

npm install later
npm install mustache

然后运行 ./bin/kibana，就可以看到终端上除了原有的内容以外，还会定期输出 alert 的 email 内容了。

要点解释

这个极简示例中，主要有两段：

注册为插件

module.exports = function (kibana) {
  return new kibana.Plugin({
    init: function init(server) {

如果是浏览器端插件，这块应该是：

module.exports = function (kibana) {
  return new kibana.Plugin({
    uiExports: {

引用 ES client

    init: function init(server) {
      var client = server.plugins.elasticsearch.client;

这里通过调用 server.plugins 来直接引用 Kibana 里其他插件里的对象。这样，alert 插件就可以跟其他功能共用同一个 ES client，免去单独配置自己的 ES 设置项和新开网络连接的资源消耗。

2015 年度个人总结

2015-12-27T00:00:00+00:00

又一年过去了。2015 年在博客上发表文章的时间大幅度减少，全年只写了 23 篇博客，其实还有一小半是翻译。但是个人总结还是要写的，写在博客上，因为别的平台肯定不适合发这个……

写作

整个 2015 年，所有的时间都用在了日志分析领域。博客上 23 篇都是 ELK、Rsyslog、Spark 相关话题。而且把去年动手写的 gitbook 正式整理完善，在机械工业出版社出版了。取名依然是个人弱项，最后咬咬牙，就叫《ELK Stack权威指南》吧。

写书是件严肃的事情，换一家出版社，体验更深。在书稿完成，即将上架的时候，因为书名上这几个英文字母大小写、带不带空格的问题，编辑和我花了两天时间，收集各式资料，意图确认一个最官方最权威的拼写用法。

其实 Elastic.co 官方可能并不是特别在意这个问题。因为最终我在官网上发现了两种写法，在官推上，发现了四种写法……甚至最近的官方文档，又有直接叫 Elastic Stack 的，估计是准备强化公司品牌。不过在亚马逊上，看见一个新书预告，一位欧洲同好预备明年 2 月出版一本《ELK Stack Cookbook》。所以，最后我决定都统一为”ELK Stack”。

为了赶上 ESCC 北京站之前出版，书在十月底上架，不太巧的立马就碰上京东十一月两次搞活动，新书总是会被缺货的，于是有热心的朋友来问我，就只好都劝他们去互动出版网上购买。结果十一月这本书赫然变成互动出版网上的分类第一名。到前两天，看京东的 2015 年度计算机类书籍榜单，这本书在潜力榜排第 10 名。总之，应该还是对得起朋友，对得起读者，对得起自己了。

然而和一年前的总结一样，一年后我依然犯了一个错误：新书还是忘了在致谢中感谢老婆大人……事实上每个我在埋头写书的夜晚，她都一个人坐在离我两米外的地方直等到慢慢睡着。苍天，看来 2016 年我还得在写一本弥补这个遗憾……

和去年张罗 PerlChina Advent 一样，今年又尝试搞了一次 ELK Stack Advent。最后个人写了 16 篇，比去年 11 篇略微上升。真的只能说：要一个人干这种事情，太难太难了。感谢 medcl 的支持，感谢 mdecl、wood、childe 几位一块完成这次 advent 的伙伴。ELK 社区跟 Perl 社区可不一样，Perl 是有这项传统的，只要有人起个头，找齐人写还算容易。而 ELK 作为新社区，又刚刚举办过大会讲过各种分享了，真是感谢伙伴们榨出来的干货。日本 qiita 社区上登记了快 500 个 advent，最后坚持写完 24 篇的社区，也是少之又少。毅力和言必信行必果，绝对是一种宝贵的财富。

演讲

2015 年从一开始，就在到处参会演讲和交流分享。一直到这个月才中断。算上 2014 年总结中说的 4 个月，也就是我连续 15 个月在大小聚会中宣讲了 ELK Stack 和周边。最开始是一次网络课堂，讲没几分钟，有人在侧边框的聊天栏发『老师内容讲挺好的，别着急，声音别发抖』……当时准备的 PPT 不到 40 页。一路经过 WOT、infoQ、中华数据库大会、运维帮，到最后 PHPConf 的时候，PPT 已经增加到了将近 80 页。

到十月份，准备第四届 ESCC 的时候，这份 PPT 已经冗长到我自己也不再愿意用了。于是干脆重新写了一份《{{more}} Kibana 4》，也算是呼应了去年第三届 ESCC 时我讲的《{{more}} Kibana》话题。而这时候，已经有听众朋友线下跟我说：『全场分享嘉宾里你的气度最像一个讲师了』。

代码

和干的活类似，今年写的代码也都在这个领域，主要来说，写了一个 Kibana 4.2 的 visualize 扩展，叫 sankey chart。也是我 ESCC 演讲的主要实例。随后上海的分享后，medcl 说到场的 Elastic.co 的布道师团队负责人@ycombinator觉得这个扩展不错，回去催促 kibana 团队加快对这个 pull request 的 review。评论中，也还有好几位同好表示 “huge potential”, “a big +1”, “very useful”。可以说，这是做开源最幸福的事情啦~

另一个比较大的，是给 Rsyslog 提交的代码。在微博我们大规模运用了 Rsyslog 作为日志中转乃至数据处理的任务。从 Rsyslog 源码和测试用例集中发现了一些文档中都还没提及的用法可能性，也顺带就测试出来一些 bug。为 Rsyslog 新增了的 action.copymsg 选项，扩展了 omkafka 模块的 maxoutputqsize 性能数据统计项，新增了 mmgrok 和 mmdblookup 模块。当然，在交流中也发现了 Rsyslog 作为批量处理的缺点：Rsyslog 的设计逻辑是把数据尽快发出去，只有在发不出去的情况下，才会积累出队列批量处理。这跟 Elasticsearch 的优化路线是背道而驰的。Rsyslog 作者在社区呼声中表示会抽空提供一个队列控制的办法，不过预计短期内他是没空的……

另一方面自然还是继续关注 Perl。Perl6 终于在前天发布了！！上个月曾经尝试过用 Perl6 实现一个 Logstash，发现要实现到 Logstash 1.3 的语法支持度，基本上百行代码就够了。Perl6 的 Grammar 设计真的超方便。唯一的问题就是：性能性能性能！不知道明年这时候，Perl6 的性能会提升多少……

生活

六月借着去上海演讲的机会，去杭州休息了几天；十一月则趁离职休假，去西安休息了几天。相比来说，杭州是舒适的，可以安安静静的在西湖边上走走停停，一天就美好的过去；西安是厚重的，计划中一天看两个博物馆，压根就逛不完。老婆大人最后用一句话解决了心中的纠结和矛盾：『以后有小孩了肯定要带来看兵马俑的，还怕没机会再来西安么？』

然而一想：其实大多数曾经到过的城市，不会再有机会看一眼了。真的好伤怀……以 IT 宅男码农的身份，感觉只能期盼全国各地都赶紧出一些牛逼的互联网公司，然后才有机会了啊……创业者们，加油~

再看看北京现在这个雾霾天，真是更加想念那些美好的地方啊。

发展

临近年底，选择了离职。微博移动端运维是个具有很强战斗力的团队。几乎每一两个人就要，也做到了支撑起一个方向上的所有任务。我相信这是一个可以作为国内 SRE 建设典范的团队。但是作为已经在日志处理上耗费了将近两年时间的个人，思考再三决定试试看把这种深度的经验做个变现。这个决定还得感谢之前人人网的前同事和前领导们，虽然你们引诱我跳槽的目的失败了，但是你们说的道理我接受了。尽管最后我做的决定刚好相反，不是找个中小型公司转型带团队，而是彻底地扎进日志的无底洞……

明年或许不会像今年这样出没在各种大会小会上，但是对各种运维技术领域的知识的学习，不会也不能中断。虽然现在 devopsweekly 里十有五六都是 docker, docker, docker……但未来谁知道呢，~

最后，在朋友的邀请下，准备明年开始尝试一下做点小规模的线下面授培训的活动。话题自然是 ELK Stack 相关。以 ELK 的发展，或许明年就会有不少急缺高级 ELK 经验的岗位呢，到时候欢迎找我要人，哈哈~~

预祝 2016 年年终个人总结时，我会一如既往的对自己满意，对未来充满信心。

Rsyslog 的 mmnormalize 模块用法

2015-11-25T00:00:00+00:00

mmnormalize 是 Rsyslog 内置的一种数据解析的方案，甚至有自己的官网：http://www.liblognorm.com可以阅读相关用法细节。它既不像 Rsyslog 的 rainerscript 那样采用 ERE 类型的简单正则，也不像 Logstash的 Grok 那样采用 PCRE 类型的复杂正则(一度通过添加 regex parser 引入过 PCRE，后来又删了)，而是自己设计了一套方式，其最核心的匹配语法就是 %char-to: 这种“向后匹配直到＊为止”。下面是一段解析 nginx 访问日志的 mmnormalize 配置，相信大家第一眼看上去都会晕：

rule=:"%client_ip:char-to:"%" %tcp_peer_ip:ipv4% - [%req_time:char-to:]%] "%verb:word% %url:word% %protocol:char-to:"%" %status:interpret:int:number% %latency:interpret:float:word% %bytes_sent:interpret:int:number% "%referrer:char-to:"%" "%user_agent:char-to:"%" %upstream_addrs:tokenized:, :tokenized: \x3a :regex:[^ ,]+% %upstream_response_times:tokenized:, :tokenized: \x3a :interpret:float:regex:[^ ,]+% %pipe:word% \t %host:word% cache_%cache:word%

不过上个月 liblognorm 做了一次重大版本更新，新的 v2 语法，添加了一个 user-defined types 的设计，这就有点类似 Grok 的预定义正则的意思啦。

所以，本文来详细说说，从 v1.1.0 开始，新增的一些 liblognorm 的 type 给我们处理 Rsyslog 数据带来的便利。

normalize 的匹配规则叫做 rulebase，所以可以看到有些 rsyslog 介绍中，mmnormallize 配置文件的后缀名是 *.rb，可不要以为是用 Ruby 解析啊。

version=2
type=@TIMESTAMP:%date:date-iso% %time:time-24hr%Z
type=@TIMESTAMP:%datetime:date-rfc5424%
type=@TIME:%resptime:float%
type=@TIME:-
rule=:%timestamp:@TIMESTAMP% %clientip:ipv4% %resptime:@TIME% %urlpath:string% %reqbody:json% %referer:quoted-string%

这行 rule 在 v2 中还可以写的更美观一些：

rule=:%[ {"type":"@TIMESTAMP", "name":"timestamp"},
         {"type":"literal", "text:" "},
         {"type":"ipv4", "name":"clientip"},
         {"type":"literal", "text:" "},
         {"type":"@TIME", "name":"resptime"},
         {"type":"literal", "text:" "},
         {"type":"string", "name":"urlpath"},
         {"type":"literal", "text:" "},
         {"type":"quoted-string", "name":"referer"},
         {"type":"literal", "text:" "},
         {"type":"json", "name":"reqbody"}
       ]%

Rsyslog 的 mmjsonparse 模块只能解析 CEE 格式，如果 msg 本身是纯 JSON 的，反而不能解析，这时候就可以用上 mmnormalize 的 json parser 了。

和 json 一样也是 v1.1 以后才加入的，还有 char-sep 和 rest，char-sep 和 char-to 的区别是前者是0到多个，后者是1到多个；rest 则用来收集当前位置到本行结尾的全部数据。

也就是说：%capturename:char-sep:\x20 等于 %capturename:char-sep: % 等于 %{"type":"char-sep","name":"capturename","extradata":" "}% 等于 %capturename:char-sep{"extradata":" "}。相当于 Grok 里的 [^ ]*?。其他类似。

如果觉得上面那种预定义太麻烦，毕竟响应时间无非就是数值或者横杆而已，那么这行还可以这么写：

         {"type":"alternative",
          "parser": [
            {"name":"resptime", "type":"float"},
            {"type":"literal", "text":"-"}
          ]
         }

还有类似 logstash-filter-kv 插件的功能，比如把

a:2,b:4, c:6, d:8

这段数据做切割处理的配置：

%{"name":"obj", "type":"repeat",
  "parser":[
    {"type":"string", "name":"key"},
    {"type":"literal", "text":":"},
    {"type":"number", "name":"val"}
  ],
  "while": {
    "type":"alternative", "parser": [
      {"type":"literal", "text":", "},
      {"type":"literal", "text":","}
    ]
  } 
}%

会解析得到下面这样的 JSON 结果：

{ "obj": [
    { "val": "2", "key": "a" },
    { "val": "4", "key": "b" },
    { "val": "6", "key": "c" },
    { "val": "8", "key": "d" }
  ]
}

看起来似乎不是很 kv 的样子，不过对于写入 Elasticsearch 来说，却刚刚好符合 nested object 的设计！

不过目前，还有些匹配模式在 v2 中不支持的，还得继续使用 v1 模式：

rule=:%filesize:interpert:float:number%

有时候，明明你这个数据中是整形，但是因为 ES 的 mapping 问题或者其他原因，需要强制转换成浮点型。Rsyslog 本身的 rainerscript 只提供了 cnum() 函数，没有 cfloat()，那么我们只能在 mmnormalize 里做 interpert 转换了。而这个操作目前在 v2 版本中还不支持。

目前 liblognorm 所支持的所有匹配格式说明，见https://github.com/rsyslog/liblognorm/blob/master/doc/configuration.rst

SIREn 插件试用

2015-10-29T00:00:00+00:00

SIREn 是一个基于 Lucene 做的，专门针对 nested object 数据做优化的方案。其官网地址：http://siren.solutions。SIREn 自己并不提供完整的软件，而是以 Solr 或者 Elasticsearch 插件的形式存在。在 SIREn 官网首页写着，自己是 trush schemaless，high performance nested query。而我之前已经写博客说过，Elasticsearch 的 schemaless 是有限制的，同一个 index 下，field 的 mapping 是必须唯一一致的。否则，或者写入失败，或者搜索异常。

那么我们来试一下这个 SIREn 看看。首先是下载运行：

# wget http://siren.solutions/download/siren-elasticsearch-1.4-bin.zip
# unzip siren-elasticsearch-1.4-bin.zip
# cd siren-elasticsearch-1.4-bin
# ./example/bin/elasticsearch

然后我们尝试写入几条 mapping 有冲突的数据：

# curl -XDELETE "http://localhost:9200/napr"
# curl -XPOST "http://localhost:9200/napr"
# curl -XPUT "http://localhost:9200/napr/chargepoint/_mapping" -d '
{
    "chargepoint" : {
        "properties" : {
            "_siren_source" : {
                "analyzer" : "concise",
                "postings_format" : "Siren10AFor",
                "store" : "no",
                "type" : "string"
            }
        },
        "_siren" : {}
    }
}'
# curl -XPUT "http://localhost:9200/napr/chargepoint/1" -d '
{
    "ChargeDeviceName": "1c Design Limited, Glasgow (1)",
    "Accessible24Hours": false
}'
# curl -XPUT "http://localhost:9200/napr/chargepoint/2" -d '
{
    "ChargeDeviceName": "2c Design Limited, Glasgow (2)",
    "Accessible24Hours": "true"
}'
# curl -XPUT "http://localhost:9200/napr/chargepoint/3" -d '
{
    "ChargeDeviceName": "3c Design Limited, Glasgow (3)",
    "Accessible24Hours": 123
}'
# curl -XPUT "http://localhost:9200/nepr/chargepoint/4" -d '
{
    "ChargeDeviceName": "4c Design Limited, Glasgow (4)",
    "Accessible24Hours": [123, 234, 345, 456]
}'

ok，三条数据都写入成功了。

然后我们用原始的 Elasticsearch 语法尝试去获取『大于100』的数据：

# curl -XPOST "http://localhost:9200/nepr/_search?q=Accessible24Hours:>100"
{"took":16,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":0,"max_score":null,"hits":[]}}

可以看到，搜索结果是空。

而用 SIREn 的树状结构语法获取：

# curl -XPOST "http://localhost:9200/nepr/_search" -d '
{
  "query": {
    "tree" : {
      "node" : {
        "attribute" : "Accessible24Hours",
        "query" : "xsd:long([100 TO *])"
      }
    }
  }
}'
{"took":29,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":2,"max_score":4.0,"hits":[{"_index":"nepr","_type":"chargepoint","_id":"4","_score":4.0,"_source":
{
    "ChargeDeviceName": "4c Design Limited, Glasgow (4)",
    "Accessible24Hours": [123, 234, 345, 456]
}},{"_index":"nepr","_type":"chargepoint","_id":"3","_score":1.0,"_source":
{
    "ChargeDeviceName": "3c Design Limited, Glasgow (3)",
    "Accessible24Hours": 123
}}]}}%

yes，我们拿到了这条数据！

更复杂一点，我们再来:

# curl -XPOST "http://localhost:9200/nepr/_search" -d '
{
  "query": {
    "tree" : {
      "node" : {
        "attribute" : "Accessible24Hours",
        "range" : [2,3],
        "query" : "xsd:long([10 TO *])"
      }
    }
  },
  "aggs": {
    "1": {
      "terms": {
        "field": "ChargeDeviceName"
      }
    }
  }
}'

这里添加了一个 range 选项，SIREn 对所有的数组默认就做 nested 处理了，所有是有序的。这个选项的意思就是，只对数组中第 2 到 3 位节点的数据做搜索请求。这下，搜索结果变成了：

{"took":9,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":1,"max_score":2.0,"hits":[{"_index":"nepr","_type":"chargepoint","_id":"4","_score":2.0,"_source":
    {
            "ChargeDeviceName": "4c Design Limited, Glasgow (4)",
                "Accessible24Hours": [123,234,345,456]
    }}]},"aggregations":{"1":{"buckets":[{"key":"4","doc_count":1},{"key":"4c","doc_count":1},{"key":"design","doc_count":1},{"key":"glasgow","doc_count":1},{"key":"limited","doc_count":1}]}}}%

可以看到，因为 _id 为 3 的文档里 Accessible24Hours 字段只有一个值，所以无法匹配上从第二个值开始的多个值的对比，也就没被过滤出来了。

不过 SIREn 目前比较尴尬的是，他只基于 ES 做了 query 部分，aggregation 部分还是老样子，必须类型一致才行，这也导致 SIREn 示例文件数据里把一些冲突日志去掉了的原因。

如果使用的是 Solr，SIREn 插件的做法是只定义两个 field，一个是 UUID，一个是 JSON。然后 siren 处理的所有数据存在这个 JSON 字段里(类似 ES 插件里的那个 _siren_source 字段)。这也就能达到全部 JSON schemaless。此外，SIREn 的 Solr 插件还实现了 nested facet 支持，也可以尝试。

总之，SIREn 扩展采用树形方式自行处理一个在 ES、Solr 看来多出来的字段，而并不影响原有字段的处理流程。所以，这对 ES 有几个影响：

其他字段还是会判断数据类型并生成 mapping，所以写入依然会有问题。
aggregation 还是走 ES 的实现，导致根据 number 过滤出来的文档，在 aggregation 时却会按照 boolean(即 mapping 中的记录)检测，aggregation 请求直接报错不计算。
重复一遍树状索引数据，导致膨胀率翻倍增高。实测，一段大小约为 30MB 的数据，在 ES 默认环境中会膨胀到 50MB，而在开启 SIREn 插件的环境下则膨胀到了 120MB！

ESCC 参会笔记

2015-10-25T00:00:00+00:00

2015 年 10 月 25 日，ESCC 2015 上海站召开，感谢携程的大力支持，让我得以参与，参会笔记如下：

上海站的分享，和北京站集中在 ELK 经验分享不太一样，各个方面、层面都有涉及。

上午，分别是 ES 2.0 介绍和 Logstash 2.0 介绍。都是 ES 原厂工程师的英文演讲，以个人的感觉，口音听起来还是蛮舒服能听懂的。

ES 2.0 的主要特性和更新其实在官方博客上陆陆续续大多是提过了的。不过在 mapping 冲突的示例上，我觉得这次演讲选择的更好：举例的是相同 type，不同 analyzer 的冲突，比官博上不同 type 的来说，更明确，不会让人误以为只要 type 一致就算 mapping 一致了。

演讲后尝试问了两个问题，一个是想到曾经看到一个issue，里面提到可以对不再写入数据的索引关掉 IndexWriter 节省资源，所以询问这个事情有没有进展，imotov 回答说他不记得具体有这个 issue，但是在较高的 Lucene 版本中这个 IndexWriter 占用的资源是跟实际有没有写入操作相关的，所以从 ES 1.5 版以后，应该这个 IndexWriter 开着不会是什么问题。我回来翻了一下 issue，原来这个已经 close 了，官方是有选择的解决这个问题，对应的是 synced flush，在这里解释了不搞一个 read only mode 的理由：更灵活并且方便轻量级的自动化操作。synced flush 大家都知道了，在 ES 1.6 的时候已经有了。

另一个问题是 ES 的 dynamic script 支持。我们知道 ES 从 1.4.3 开始关掉了 groovy sandbox 的 dynamic script 支持，改用了只支持数值操作的 lucene expression。当时的公告中，说的是 ES 开发组会跟 Lucene 开发组一起努力加强 expression 的功能。对这个问题，imotov 的回答是：很遗憾，目前没有，因为这不是单方面能决定的。然后在下午我看 github 的时候，发现 elastic 组织下最近这周刚多了一个项目，叫：plan A。它的描述是：”New Scripting Language for ElasticSearch”！不过目前没啥内容，感觉可以期待~

Logstash 2.0 的演讲，或许因为早先设想的高级特性太多太好，然而基本都延期了，2.0 里不会有，所以没太多可期待的……只能说继续等待 2.1 或者 2.2 。

接着是小排虞冰的分享。用 ES 做核心业务的数据支持，真的是一直比较少的外部经验分享。虽然和 ELK 的日志场景不太一致，导致优化手段和方向甚至就几乎相反，但是作为一个比较通用的后端服务架构设计，依然是一个有价值的分享。演讲也对 ES 的维护和推广提了一点看法——比如：用 QueryBuilder 给 ES 实现 ORM；以及需要至少一个以上的 ES 熟练工才能上业务线。

下午是自己的第一个分享，稍微有点小尴尬的是 ppt 不太新，好在显示屏给力，还是正常完成的。收到三个问题，前两个其实类似(单 panel 时间段，同比环比 panel)，都是在 Vis 里不能单独地固定 time filter，从目前 Kibana4 的设计逻辑上，确实是没办法了。最后一个是 index pattern 的通配符问题，后来经过查阅 kibana4 代码实现，这块应该是支持的。

然后是 wood 大叔的演讲，虽然大多数优化手段之前在 QQ 群里都说过了，但是 wood 把一些原理性的东西说的很清楚，整个演讲听下来还是对一些细节有了更新的认识。

茶歇中，做了一下抽奖活动，把出版社给我准备的十本书都发出去了，这次采用了一个比较新奇的方法：给主持人手机打电话，谁能抢先拨进去，谁就算中奖！事后收到有微信说：好可惜没抽上的，已经下单购买了。哈哈~

最后 medcl 演讲，里面提到的有一点是第一手新闻：packetbeat 不单单可以作为像 tcpdump 这样的方式运行，还可以以 app 的方式运行。在列举 beats 家族成员的时候，更是列出了一个目前在 github 的 elastic 用户下面还没立项的秘密项目。可谓是个惊喜。

本来在下午休息的时候，我还临时写了 11 页的小 ppt，打算闪电演讲的时候起个头。不过看大家都没有参与的意思，也就没说出来。或许上海的 conference 还是不太多，大家显得都不是那么活跃。这次聚会最终到场 100 人左右，毕竟是第一次在上海举办，可能也相互比较默认和拘谨吧。QQ 群聊天跟实际还是有差距的，相信明年，肯定会更好！

ESCC 参会笔记

2015-10-20T00:00:00+00:00

10 月 17 号举办了第四届 ESCC(ElasticSearch China Conference) 北京站。作为个人习惯，稍作记录。

今年场地换到了中科院软件所。之前曾经参加过一次 openstack 的活动，也是在这个场地，不过这次居然还提供了午餐，软件所对开源社区的支持真的是蛮积极的。会前在 QQ 群里就看到，甚至有从成都上海赶过来的同好(他们开始不知道自己城市稍后也会有)。

清早起来，和去年 ESCC 一样又是一个雾霾天……和去年相比，今年的签到处显得正式多了：有签名墙，有易拉宝和传单，还有各色小贴纸派送~尤其是 Found.io 的，原先只见过小狗造型，这次见到三四种，漂亮死了~按 medcl 所说，这批小礼品是 elastic.co 公司花了上千元快递费从国外特意送过来的！

同样特意送来的还有 ES 作者 Shay 录制的对 ESCC 的祝福视频。Shay 特意讲到了他在发布 ES 时收到的第一个评论，对方用 ES 来支持对抗流行疾病的斗争，这是一种极大的激励。我想：如果上帝为了遏制人类而发明这么多语言，那么开源运动就是新时代人类的通天塔吧！

会议另一个巧合是，两位讲师，凌霄和刘波涛，穿了同款 T shirt，都是一只麋鹿头像的文化衫。虽然麋鹿图标在 ELK 正式产品上没出现多久，但是 ELK 麋鹿形象看来还是深入人心了~

和去年 ESCC 相比，今年的分享主题有很大不同。去年除了我讲 Kibana，其他讲师都是在分享 search 和 score 相关的话题。今年除了 medcl，都在分享 ELK。所以会后有参会人员评论说：去年想听优化听不到，今年全在讲优化然而用不着了…… anyway，从各司经验来看，采用 Kafka 作为 broker 角色，采用 Java 自开发程序作为 Kafka 和 Elasticsearch 之间的 indexer 角色，几乎成为通用的海量场景优化方式。可惜的时候，没有人具体给解释为什么我们要放弃 Logstash 转而自研？为什么用的是 Java？其实这是一个蛮有趣的话题，在我演讲结束的提问环节，有朋友提问在 flume/fluentd/logstash/rsyslog 之间怎么做最优选择，可惜时间不够，我除了表明我使用 rsyslog 也有条件所限的原因外，没能铺开来讲。在博客上可以多说几句了：

Logstash 采用 JRuby 语言，其中处理时间，连接 kafka 和 Elasticsearch 的三个环节，都是通过 require "java"; java_import *** 的方式加载的。这个过程中，Ruby 到 Java 的类型转换等等，都是会影响到性能的。去年我曾经测试过用 JRuby 来加载 netty 库实现一个极简的 TCPServer，每秒只能到 5w 的处理能力，这基本上跟直接用 Ruby 默认 socket 库的效果是一致的。
logstash-input-kafka 插件默认采用 json codec，会在单线程中调用 jrjackson 库(注意这里同样有 JRuby 的损耗)做序列化。在 slideshare 上，linkedin 的分享说明他们宁愿采用 logstash-input-pipe 调用 kafka-consumer-console.sh 脚本；在 discuss 中，也有人推荐修改 codec 为 line，然后多线程运行 logstash-filter-json 来解析数据。根据 QQ 群里金桥童鞋的测试，能提高一倍的性能。

所以说，Logstash 选用 JRuby，是为了在不失灵活性的前提下，尽可能方便的接入各种现存系统。而不是纯粹为了提高性能(那会儿 jordansissel 还没见过 kafka 呢，他只考虑过 joda 库比 Ruby 的 time 库快的问题)。

回到演讲。百度高攀的分享中，给我们展示了一个很有趣的做法：当你机器内存又大，磁盘又多，还有 SSD 空闲的时候，怎么有效利用起来？这个话题，在前两个月，携程的朋友也有类似的分享，我有邀稿分享在我的书中，区别在于：携程的 SSD 节点和 SAS 节点是不同机器，索引由热变凉时，需要走网络迁移；百度的 SSD 节点和 SAS 节点是在同一台机器上。分层存储，其实是前几年很热的一个话题，flashcache 一度是很多数据库优化的必备步骤。有环境条件的童鞋其实也可以一试。

高攀提到另一个改进，有关 recovery 期间增量 translog 的处理，没太听清他的改进方案。以我目前的理解力，感觉官方方案应该不会有特明显的卡顿影响，或许是规模还没到的原因。

Admaster 宋兵强的分享，是我个人感觉这次 ESCC 最有意思的一段，可以看出他是长期做大数据处理的，从他的历史经验，推导出来一些他对 ES 未来发展面临的问题和方向的猜测，非常有意思！而在提问环节，一位百度的工程师站起来第一句话是：宋师兄好，我看过你在百度时的代码。非常触动我，互联网是个跳槽非常频繁的行业，铁打的营盘流水的兵，能以这种代码识人，真是幸甚至哉！

这个环节中，最让大家 happy 的是 medcl 补充了一个消息：marvel 在不远的未来就会完全免费使用啦！

中午，吴怡编辑驱车数十公里赶来给我把几本样书送到了。为了赶在聚会之前上架，我催她好些回，再次感谢她的理解和支持！

下午芒果TV 刘波涛的分享，比较好玩的地方在于他们对多机房之间数据传输的考量。不确定是不是受我影响，也采用了较多的 rsyslog。加上近来在 rsyslog 社区里，绝大多数提问也都跟 Elasticsearch 相关，我都考虑是不是接下来再写一本《Rsyslog 指南》的 gitbook 了。

我自己演讲完后，实在坚持不住，趴着小睡了会儿，medcl 对不住，不是你讲的不好，是我自己有午睡习惯……

biglog 张磊的分享带上了 demo 录像展示，很棒！对于很多只听说过 ELK 不知道有啥用的人来说，一图胜千言，一视频胜千图！然后其中对 suricata、ntop 的介绍也非常不错。分享中另一个重点在跨数据中心的集群方式。我开始猜测他指的会是采用 tribe 节点来串联不同集群给 Kibana 做查询。结果不是！而是利用 allocate routing 的 zone 设置，把对应机房的索引分片分配在自己机房的节点上，以保证不跨网传输。同时又采用 elasticsearch-zookeeper 来避免 elasticsearch 自身的跨机房 discovery 流量，维护集群稳定。确实是一个我完全没想到的玩法~~

附注：ntop-ng 有一个自己的 Kibana3 fork，叫 Qbana，我在书中有提过。ntop 的 PF_RING 抓包方式，在 elastic 的 packetbeat 中也有采用。未来 ELK 肯定会有对这个方向更好的支持。

最后闪电演讲。我从 2011 年第一次在 Perlconf 接触这个形式后就喜欢上了，所以提前跟团队的伙伴提及，可以选个有趣的小话题聊一下。效果来看，感觉炳哲做的不错，赞！

最后大轴是一位老先生，之前在张磊的分享中，他就对 PF_RING 方式提出来质疑，然后闪电演讲的时候，亲自上场，介绍了他自己基于 DPDK 的实现方式。这种友好的气氛，真是太让人喜欢了~哈哈

也说一些我个人觉得还不是特到位的地方：

两次抽奖送书环节，都是先宣布休息才抽，场面上已经乱了。其实拍个中奖者合影啊什么的，再宣布休息，可能会更好一些。闪电演讲环节，静悄悄的在会议安排中添加，静悄悄的在最后就开始了，没有燃烧全场的那种激情。或许应该在早上开始大会之前，统一给大家介绍一下这个环节，然后留一整天时间做现场报名，可能会有更好的效果(yes，我说的就是上面那种友好的质疑)。

不论如何，这是一次成功的，近乎完美的大会。感谢 elastic.co，感谢 medcl，感谢讲师们，感谢志愿者们，感谢全体参会同仁们！

rsyslog 中 if 条件判断的限制

2015-09-24T00:00:00+00:00

Rsyslog 从 v6 以后，实现了全新的 rainerscript 语法，数据处理灵活度大大提高。我最近一直在把 logstash 的解析配置迁移到 rsyslog 中完成。结果今天碰到一个非常好玩的地方。由此也说明了，一切 DSL，都不要想当然的觉得它会有跟编程语言完全一样的行为。

事情是这样的：一段 JSON 日志，在 rsyslog 中经过下面一段逻辑：

    set $!datetime = exec_template("get_now_time");
    if ( $!msg!date ) then {
        reset $!datetime = replace($!msg!date, " ", "T") & "+0800";
    }
    if ( $!msg!video_time_duration ) then {
        set $!msg!video_duration_num = 0;
        set $!msg!video_duration_timesum = 0;
        set $!msg!video_first_duration = cnum($!msg!video_time_duration[0]!duration);
        foreach ( $.item in $!msg!video_time_duration ) do {
            if ( $.item!type == "1" ) then {
                reset $!msg!video_duration_num = $!msg!video_duration_num + 1;
                reset $!msg!video_duration_timesum = $!msg!video_duration_timesum + cnum($.item!duration);
            }
        }
        if ( $!msg!video_duration_num == 0 ) then {
            unset $!msg!video_duration_num;
            unset $!msg!video_duration_timesum;
        }
    }

数据中，date 是一个 String ，而 video_time_duration 是一个 Array。但是实际运行起来，发现输出的数据里，根据 date 处理得到了 datetime 新字段，却完全没有 video_first_duration, video_duration_num 和 video_duration_timesum 等新字段的踪影。

看来 rsyslog 里的条件判断是不能针对 Array 做判断了，于是我又改成下面这样：

    if ( $!msg!video_time_duration[0]!duration ) then {

这样获取的就是一个实际的 String 内容了。但是实际运行起来，输出数据里，不但没有应该被处理出来的新字段，反而还多了一段：, "video_time_duration[0]!duration" : { }, ！

这就有点像 Perl5 里的 exists 指令在判断多层哈希键的时候的行为了，不存在的键先自动创建出来……但是：rsyslog 现在在 if 条件判断里用数组下标获取数据的时候，居然把整段认为是一个 key 的内容，实在是无奈了……

最后，这里只能上最原始的办法了：

    if ( $msg contains "video_time_duration" ) then {

以上。

【翻译】Kibana 字段的自定义展示格式开发

2015-08-25T00:00:00+00:00

原文地址：http://www.elasticsearch.org/blog/kibana-custom-field-formatters

Kibana 4.1 引入了一个新特性叫字段展示格式(field formatters)，让我们可以实时转换字段内容成更形象的样式。这个特性帮助我们不修改数据的存储方式，而用另一种方式显示它。有关 field formatters 的介绍，可以阅读之前一篇博客。

本文的目的，则是带大家过一遍 field formatters 的开发流程。从 field formatter 接口开始，自己实现一个基础的 formatter，可以字段给 error 单词加高亮效果，最后完成整个解决方案。

起步

Kibana 开发环境的搭建介绍可以在 Kibana repository 看到。

从 Kibana 根目录触发，field formatters 相关代码存在 /src/ui/public/stringify 目录下。目录结构如下所示：

Kibana 4.1 里，formatters 位置则在 /src/kibana/components/stringify。如果你是看的 4.1 版，可能跟本文讲的路径稍有区别，请自动对应查找一下，本文以 git master 为准。

现在，让我们在 type 目录下创建一个文件叫 Highlight.js，下面是初始代码：

define(function (require) {
  return function HighlightFormatProvider(Private) {
    var _ = require('lodash');
    var FieldFormat = Private(require('ui/index_patterns/_field_format/FieldFormat'));
    _.class(Highlight).inherits(FieldFormat);
    function Highlight(params) {
      Highlight.Super.call(this, params);
    }
    Highlight.id = 'highlight';
    Highlight.title = 'Highlight';
    Highlight.fieldType = ['string'];
    Highlight.prototype._convert = {
      text: _.escape,
      html: _.escape
    };
    return Highlight;
  };
});

每种字段格式，都实现为扩展 FieldFormat 的类。Highlight.id 用在 Kibana 内部跟踪 formatter，每个 formatter 必须采用不同的 id。Highlight.title 显示在 formatter 下拉选择框里，Highlight.fieldType 则描述自己适用于哪种类型的字段内容。

Highlight.prototype._convert 是实际进行格式化的地方。包括有 text 和 html 两种方法。text 方法用于 tooltips, filters, legends, 和 axis markers。html 方法用于搜索表格内。两者都接收字段内容为输入，输出我们希望的展示内容。如果两个方法是一样的，可以直接赋值 Highlight.prototype._convert 为一个函数。给 error 单词加高亮的代码如下：

Highlight.prototype._highlight = function (val, replace) {
  return _.escape(val).replace(/(error)/g, replace);
};
Highlight.prototype._convert = {
  text: function(val) {
    return this._highlight(val, function convertToUpperCase(match) {
      return match.toUpperCase();
    });
  },
  html: function(val) {
    return this._highlight(val, '<mark>$&</mark>');
  }
};

只要字段内容中有 error 文本字样，我们就会根据 HTML 或者 text 场景选择包含进 mark 元素或者是转换成大写形式。注意这里使用的 _.escape(val) 语句，这句可以用来放置 HTML 注入和跨站脚本攻击。

然后需要注册这个新的 field formatter。在 register.js 里添加：

fieldFormats.register(require('ui/stringify/types/Highlight'));

未来，我们(Kibana 开发组)可能会把这个功能以插件形式提供，届时注册方法会更加简单。

现在我们可以对 string 类型的字段选择 Highlight 作为 field formatter 了！

在 Discover 页测试效果：

更通用化

插件已经可以运行了，但是我们如果想更通用化一点，不单单可以用来高亮 error 字眼呢？当然不用给每个单词开发一种 formatter，我们可以提供一个输入正则表达式的方式。

在 editor 目录，添加一个叫 highlight.html 的文件，内容如下：

<div class="form-group">
  <label>Pattern</label>
  <input class="form-control" ng-model="editor.formatParams.pattern"/>
</div>

然后回到 Highlight.js 里，我们需要定义 highlight.html 作为我们的编辑页面，然后更新我们的 _highlight 方法，使用输入文本作为匹配时的正则表达式。

Highlight.editor = require('ui/stringify/editors/highlight.html');
Highlight.prototype._highlight = function (val, replace) {
  var escapedVal = _.escape(val);
  var highlightPattern;
  try {
    var inputRegex = this.param('pattern').split('/');
    var pattern = inputRegex[0] || inputRegex[1];
    var flags = inputRegex[2];
    highlightPattern = new RegExp(pattern, flags);
  } catch(e) {
    return escapedVal;
  }
  return escapedVal.replace(highlightPattern, replace);
};

示例

如果在应用 formatter 之前，就能看到输入的正则表达式的效果就更好了。Kibana 里提供了一个 directive 指令让我们可以在修改表达式时观察示例变化。

我们可以增加一些输入字段，并且在模板中加入这个指令。也就是在 highlight.html 后面追加下面这段：

<field-format-editor-samples inputs="editor.field.format.type.sampleInputs"></field-format-editor-samples>

对应的，在 Highlight.js 里添加下面这段:

Highlight.sampleInputs = [
  'Hello world',
  'The quick brown fox jumps over the lazy dog',
  '112345'
];

最终结果如下：

结论

field formatter 接口提供了非常简便的办法让我们定制字段内容的展示方式。Kibana 自带了好几种 formatter，不过如果你没发现比较合适的，你可以随时自己开发添加一个。如果你已经开始计划添加了，也请注意在 Kibana 4.2 发版的时候，回来看看，有没有新的接口变更。

Elasticsearch 同一索引不同类型下同名字段的映射冲突实例

2015-04-03T00:00:00+00:00

这个标题肯定绕晕很多人吧。具体说明一下场景就明白了：Nginx 和 Apache 的访问日志，因为都属于网站访问，所以写入到同一个索引的不同类型下，比方 logstash-accesslog-2015.04.03/nginx 和 logstash-accesslog-2015.04.03/apache。既然都是访问日志，肯定很多字段的内容含义是雷同的，比如 clientip, domain, urlpath 等等。其中 nginx 有一个变量叫 $request_time，apache 有一个变量叫 %T，乍看上去也是同义的，我就统一命名为 “requestTime” 了。这就是”同一索引(logstash-accesslog-YYYY.MM.DD)下不同类型(nginx,apache)的同名字段(requestTime)”。

但事实上，这里有个问题：nginx 中的以秒为单位，是把毫秒算作小数；apache 中的以秒为单位，是真的只记秒钟整数位！

所以，这两个类型生成的映射在这个字段上是不一致的。nginx 类型的 requestTime 是 double，apache 类型的 requestTime 是 long。

不过平常看起来似乎也没什么影响，写入数据都照常，查看数据的时候默认显示的 JSON 也各自无异。直到我准备用一把 scripted field 的时候，发现计算 doc['requestTime'].value * 1000 得到的数都大的吓人！

因为类似计算之前在只有 nginx 日志入库的时候曾经正确运行过，所以只能是猜测 apache 日志对此造成了影响，但是即使我把请求修改成限定在 nginx 类型数据中进行，结果也没发生变化。

仔细阅读 scripting module 的文档，其中提到了 doc['fieldname'].value 和 _source.fieldname 两种写法的区别：前者会利用内存中的数据，而后者强制读取磁盘上 _source 存储的 JSON 内容，从中释放出相应字段内容。莫非是 requestTime 字段跟 _source JSON 里存的数据确实不一样，而我们平常搜索查看的都是从 JSON 里释放出来的，所以才会如此？

为了验证我的猜测，做了一个请求测试：

# curl es.domain.com:9200/logstash-accesslog-2015.04.03/nginx/_search?q=_id:AUx-QvSBS-dhpiB8_1f1\&pretty -d '{
    "fields": ["requestTime", "bodySent"],
    "script_fields" : {
        "test1" : {
            "script" : "doc[\"requestTime\"].value"
        },
        "test3" : {
            "script" : "_source.bodySent / _source.requestTime"
        },
        "test2" : {
            "script" : "doc[\"requestTime\"].value * 1000"
        }
    }
}'

得到的结果如下：

{
  "took" : 43,
  "timed_out" : false,
  "_shards" : {
    "total" : 56,
    "successful" : 56,
    "failed" : 0
  },
  "hits" : {
    "total" : 1,
    "max_score" : 1.0,
    "hits" : [ {
      "_index" : "logstash-accesslog-2015.04.03",
      "_type" : "nginx",
      "_id" : "AUx-QvSBS-dhpiB8_1f1",
      "_score" : 1.0,
      "fields" : {
        "test1" : [ 4603039107142836552 ],
        "test2" : [ -8646911284551352000 ],
        "requestTime" : [ 0.54 ],
        "test3" : [ 2444.4444444444443 ],
        "bodySent" : [ 1320 ]
      }
    } ]
  }
}

果然！直接读取的字段，以及采用 _source.fieldname 方式读取的内容，都是正确的；而采用 doc['fieldname'].value 获取的内存数据，就不对。（0.54 存成 long 型会变成 4603039107142836552。这个 460 还正好能跟 540 凑成 1000，应该是某种特定存法，不过这里我就没深究了）

再作下一步验证。我们知道，ES 数据的映射是根据第一条数据的类型确定的，之后的数据如何类型跟已经成型的映射不统一，那么写入会失败。现在这个 nginx 和 apache 两个类型在 requestTime 字段上的映射是不一样的，但是内存里却并没有按照映射来处理。那么，我往一个类型下写入另一个类型映射要求的数据，会报错还是会通过呢？

# curl -XPOST es.domain.com:9200/test/t1/1 -d '{"key":1}'
{"_index":"test","_type":"t1","_id":"1","_version":1,"created":true}
# curl -XPOST es.domain.com:9200/test/t2/1 -d '{"key":2.2}'
{"_index":"test","_type":"t2","_id":"1","_version":1,"created":true}
# curl -XPOST es.domain.com:9200/test/t1/2 -d '{"key":2.2}'
{"_index":"test","_type":"t1","_id":"2","_version":1,"created":true}
# curl -XPOST es.domain.com:9200/test/t2/2 -d '{"key":1}'
{"_index":"test","_type":"t2","_id":"2","_version":1,"created":true}
# curl -XPOST es.domain.com:9200/test/t1/3 -d '{"key":"1"}'
{"_index":"test","_type":"t1","_id":"3","_version":1,"created":true}
# curl -XPOST es.domain.com:9200/test/t2/3 -d '{"key":"1"}'
{"_index":"test","_type":"t2","_id":"3","_version":1,"created":true}
# curl -XPOST es.domain.com:9200/test/t2/4 -d '{"key":"abc"}'
{"error":"RemoteTransportException[[10.10.10.10][inet[/10.10.10.10:9300]][indices:data/write/index]]; nested: MapperParsingException[failed to parse [key]]; nested: NumberFormatException[For input string: \"abc\"]; ","status":400}
# curl -XGET es.domain.com:9200/test/_mapping
{"test":{"mappings":{"t1":{"properties":{"key":{"type":"long"}}},"t2":{"properties":{"key":{"type":"double"}}}}}}

结果出来了，在映射相互冲突以后，实际数据只要是 numeric detect 能通过的，就都通过了！

BTW: kibana 4 中，已经会对这种情况以黄色感叹号图标做出提示；而根据官方消息，ES 未来会在 2.0 版正式杜绝这种可能。

spark streaming 接收 kafka 数据示例

2015-03-14T00:00:00+00:00

上个月曾经试过了用 spark streaming 读取 logstash 启动的 TCP Server 的数据。不过如果你有多台 logstash 的时候，这种方式就比较难办了 —— 即使你给 logstash 集群申请一个 VIP，也很难确定说转发完全符合。所以一般来说，更多的选择是采用 kafka 等队列方式由 spark streaming 去作为订阅者获取数据。

环境部署

这里只讲 kafka 单机的部署。只是示例嘛：

cd kafka_2.10-0.8.2.0/bin/
./zookeeper-server-start.sh ../config/zookeeper.properties &
./kafka-server-start.sh --daemon ../config/server.properties

数据转发

保持跟之前示例的连贯性，这里继续用 logstash 发送数据到 kafka。

首先创建一个 kafka 的 topic：

./kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic logstash

然后到 logstash 里，修改配置为：

input {
    file { path => "/var/log/*.log" }
}
filter {
    ruby {
        code => "event['lineno'] = 100 * rand(Math::E..Math::PI)"
    }
}
output {
    kafka {
        broker_list => "127.0.0.1:9092"
        topic_id => "logstash"
    }
}

spark streaming 处理的代码：

处理效果跟之前示例依然保持一致，就不重复贴冗余的函数了，只贴最开始的处理部分：

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.StreamingContext._
import org.apache.spark.streaming.kafka.KafkaUtils
import org.json4s._
import org.json4s.jackson.JsonMethods._

object LogStash {

  implicit val formats = DefaultFormats
  case class LogStashV1(message:String, path:String, host:String, lineno:Double, `@timestamp`:String)

  def main(args: Array[String]) {

    val Array(zkQuorum, group, topics, numThreads) = args
    val topicMap = topics.split(",").map((_,numThreads.toInt)).toMap

    val sparkConf = new SparkConf().setMaster("local[2]").setAppName("LogStash")
    val sc  = new SparkContext(sparkConf)
    val ssc = new StreamingContext(sc, Seconds(10))

    val lines = KafkaUtils.createStream(ssc, zkQuorum, group, topicMap).map(_._2)

    lines.map(line => {
      val json = parse(line)
      json.extract[LogStashV1]
    }).print()

    ssc.start()
    ssc.awaitTermination()
  }
}

这里面有一些跟网上常见资料不一样的地方。

第一个，import org.apache.spark.streaming.kafka._ 并不会导出 KafkaUtils，必须明确写明才行。第二个，之前示例里用了 scala 核心自带的 JSON 模块。但是这次我把 lineno 字段从整数改成浮点数后，发现 JSON.parseFull() 有问题。虽然我在 scala 的 repl 里测试没问题，但是写在 spark 里的时候，它并不像文档所说的”总是尝试解析成 Double 类型”，而是一直尝试用 Integer.parseInteger() 方法来解析。哪怕我明确定义 JSON.globalNumberParser = {input:String => Float.parseFloat(input)} 都不起作用。

所以，最后这里改用了 json4s 库。据称这也是 scala 里性能和功能最好的 JSON 库。

json4s 库默认解析完后，不是标准的 Map、List 等对象，而是它自己的 JObject、JList、JString 等。想要转换成标准 scala 对象，需要调用 .values 才对。不过我这个示例里没有这么麻烦，而是直接采用 .extract 就变成了 cast class 对象了。非常简便。

另一个需要点出来的变动是：因为采用 .extract，所以 cast class 里的参数命名必须跟 JSON 里的 key 完全对应上。而我们都知道 logstash 里有几个特殊的字段，叫 @timestamp 和 @version 。这个 “@” 是不能直接裸字符的，所以要用反引号(`)包括起来。

sbt 打包

sbt 打包也需要有所变动。spark streaming 的核心代码中，并不包含 kafka 的代码。还跟之前那样 sbt package 的话，就得另外指定 kafka 的 jar 地址才能运行了。更合适的办法，是打包一个完全包含的 jar 包。这就用到 sbt-assembly 扩展。

刚刚收到的消息，spark 1.3 版发布 beta 了，spark streaming 会内置对 kafka 的底层直接支持。或许以后不用这么麻烦？

sbt-assembly 使用起来特别简单，尤其是当你使用的 sbt 版本比较新(大于 0.13.6) 的时候。

添加扩展

在项目的 project/ 目录下创建一个 plugins.sbt 文件，内容如下：

addSbtPlugin("com.eed3si9n" % "sbt-assembly" % "0.13.0")

具体的版本选择，看官方 README 的 Setup 部分。

添加新增依赖模块

现在可以去修改我们项目的 build.sbt 了：

name := "LogStash"

version := "1.0"

scalaVersion := "2.10.4"

libraryDependencies ++= Seq(
  "org.apache.spark" %% "spark-core" % "1.2.0" % "provided",
  "org.apache.spark" %% "spark-sql" % "1.2.0" % "provided",
  "org.apache.spark" %% "spark-streaming" % "1.2.0" % "provided",
  "org.apache.spark" %% "spark-streaming-kafka" % "1.2.0",
  "org.json4s" %% "json4s-native" % "3.2.10",
  "org.json4s" %% "json4s-jackson" % "3.2.10"
)

是的。新版本的 sbt-assembly 完全不需要单独修改 build.sbt 了。

需要注意，因为我们这次是需要把各种依赖全部打包到一起，这个可能会导致一些文件相互有冲突。比如我们用 spark-submit 提交任务，有关 spark 的核心文件，本身里面就已经有了的，那么就需要额外通过 % "provided" 指明这部分会另外提供，不需要打进去。这样运行的时候就不会有问题了。

打包

采用 sbt-assembly 后的打包命令是：sbt assembly。注意输出的结果，会是直接读取 build.sbt 里的 name 变量，不做处理。，我们之前定义的叫 “LogStash Project”，sbt package 命令自动会转换成全小写且空格改成中横线的格式 logstash-project_2.10-1.0.jar。但是 sbt assembly 就会打包成 LogStash Project-assembly-1.0.jar 包。这个空格在走 spark-submit 提交的时候是有问题的。所以这里需要把 name 改成一个不会中断的字符串。。。

Kibana 3 源码解析

2015-03-14T00:00:00+00:00

本文之前已经拆分成章节发布在我的《Kibana 权威指南》电子书上。欢迎移步观看全书其他章节。

Kibana 3 作为 ELKstack 风靡世界的最大推动力，其与优美的界面配套的简洁的代码同样功不可没。事实上，graphite 社区就通过移植 kibana 3 代码框架的方式，启动了 grafana 项目。至今你还能在 grafana 源码找到二十多处 “kbn” 字样。

巧合的是，在 Kibana 重构 v4 版的同时，grafana 的 v2 版也到了 Alpha 阶段，从目前的预览效果看，主体 dashboard 沿用了 Kibana 3 的风格，不过添加了额外的菜单栏，供用户权限设置等使用 —— 这意味着 grafana 2 跟 kibana 4 一样需要一个单独的 server 端。

笔者并非专业的前端工程师，对 angularjs 也处于一本入门指南都没看过的水准。所以本节内容，只会抽取一些个人经验中会有涉及到的地方提出一些”私货”。欢迎方家指正。

源码目录结构

下面是 kibana 源码的全部文件的 tree 图：

.
├── app
│   ├── app.js
│   ├── components
│   │   ├── extend-jquery.js
│   │   ├── kbn.js
│   │   ├── lodash.extended.js
│   │   ├── require.config.js
│   │   └── settings.js
│   ├── controllers
│   │   ├── all.js
│   │   ├── dash.js
│   │   ├── dashLoader.js
│   │   ├── pulldown.js
│   │   └── row.js
│   ├── dashboards
│   │   ├── blank.json
│   │   ├── default.json
│   │   ├── guided.json
│   │   ├── logstash.js
│   │   ├── logstash.json
│   │   ├── noted.json
│   │   ├── panel.js
│   │   └── test.json
│   ├── directives
│   │   ├── addPanel.js
│   │   ├── all.js
│   │   ├── arrayJoin.js
│   │   ├── configModal.js
│   │   ├── confirmClick.js
│   │   ├── dashUpload.js
│   │   ├── esVersion.js
│   │   ├── kibanaPanel.js
│   │   ├── kibanaSimplePanel.js
│   │   ├── ngBlur.js
│   │   ├── ngModelOnBlur.js
│   │   ├── resizable.js
│   │   └── tip.js
│   ├── factories
│   │   └── store.js
│   ├── filters
│   │   └── all.js
│   ├── panels
│   │   ├── bettermap
│   │   │   ├── editor.html
│   │   │   ├── leaflet
│   │   │   │   ├── images
│   │   │   │   │   ├── layers-2x.png
│   │   │   │   │   ├── layers.png
│   │   │   │   │   ├── marker-icon-2x.png
│   │   │   │   │   ├── marker-icon.png
│   │   │   │   │   └── marker-shadow.png
│   │   │   │   ├── leaflet-src.js
│   │   │   │   ├── leaflet.css
│   │   │   │   ├── leaflet.ie.css
│   │   │   │   ├── leaflet.js
│   │   │   │   ├── plugins.css
│   │   │   │   ├── plugins.js
│   │   │   │   └── providers.js
│   │   │   ├── module.css
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── column
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   ├── module.js
│   │   │   └── panelgeneral.html
│   │   ├── dashcontrol
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── derivequeries
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── fields
│   │   │   ├── editor.html
│   │   │   ├── micropanel.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── filtering
│   │   │   ├── editor.html
│   │   │   ├── meta.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── force
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── goal
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── histogram
│   │   │   ├── editor.html
│   │   │   ├── interval.js
│   │   │   ├── module.html
│   │   │   ├── module.js
│   │   │   ├── queriesEditor.html
│   │   │   ├── styleEditor.html
│   │   │   └── timeSeries.js
│   │   ├── hits
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── map
│   │   │   ├── editor.html
│   │   │   ├── lib
│   │   │   │   ├── jquery.jvectormap.min.js
│   │   │   │   ├── map.cn.js
│   │   │   │   ├── map.europe.js
│   │   │   │   ├── map.usa.js
│   │   │   │   └── map.world.js
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── multifieldhistogram
│   │   │   ├── editor.html
│   │   │   ├── interval.js
│   │   │   ├── markersEditor.html
│   │   │   ├── meta.html
│   │   │   ├── module.html
│   │   │   ├── module.js
│   │   │   ├── styleEditor.html
│   │   │   └── timeSeries.js
│   │   ├── percentiles
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── query
│   │   │   ├── editor.html
│   │   │   ├── editors
│   │   │   │   ├── lucene.html
│   │   │   │   ├── regex.html
│   │   │   │   └── topN.html
│   │   │   ├── help
│   │   │   │   ├── lucene.html
│   │   │   │   ├── regex.html
│   │   │   │   └── topN.html
│   │   │   ├── helpModal.html
│   │   │   ├── meta.html
│   │   │   ├── module.html
│   │   │   ├── module.js
│   │   │   └── query.css
│   │   ├── ranges
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── sparklines
│   │   │   ├── editor.html
│   │   │   ├── interval.js
│   │   │   ├── module.html
│   │   │   ├── module.js
│   │   │   └── timeSeries.js
│   │   ├── statisticstrend
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── stats
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── table
│   │   │   ├── editor.html
│   │   │   ├── export.html
│   │   │   ├── micropanel.html
│   │   │   ├── modal.html
│   │   │   ├── module.html
│   │   │   ├── module.js
│   │   │   └── pagination.html
│   │   ├── terms
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── text
│   │   │   ├── editor.html
│   │   │   ├── lib
│   │   │   │   └── showdown.js
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   ├── timepicker
│   │   │   ├── custom.html
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   ├── module.js
│   │   │   └── refreshctrl.html
│   │   ├── trends
│   │   │   ├── editor.html
│   │   │   ├── module.html
│   │   │   └── module.js
│   │   └── valuehistogram
│   │       ├── editor.html
│   │       ├── module.html
│   │       ├── module.js
│   │       ├── queriesEditor.html
│   │       └── styleEditor.html
│   ├── partials
│   │   ├── connectionFailed.html
│   │   ├── dashLoader.html
│   │   ├── dashLoaderShare.html
│   │   ├── dashboard.html
│   │   ├── dasheditor.html
│   │   ├── inspector.html
│   │   ├── load.html
│   │   ├── modal.html
│   │   ├── paneladd.html
│   │   ├── paneleditor.html
│   │   ├── panelgeneral.html
│   │   ├── querySelect.html
│   │   └── roweditor.html
│   └── services
│       ├── alertSrv.js
│       ├── all.js
│       ├── dashboard.js
│       ├── esVersion.js
│       ├── fields.js
│       ├── filterSrv.js
│       ├── kbnIndex.js
│       ├── monitor.js
│       ├── panelMove.js
│       ├── querySrv.js
│       └── timer.js
├── config.js
├── css
│   ├── angular-multi-select.css
│   ├── animate.min.css
│   ├── bootstrap-responsive.min.css
│   ├── bootstrap.dark.min.css
│   ├── bootstrap.light.min.css
│   ├── font-awesome.min.css
│   ├── jquery-ui.css
│   ├── jquery.multiselect.css
│   ├── normalize.min.css
│   └── timepicker.css
├── favicon.ico
├── font
│   ├── FontAwesome.otf
│   ├── fontawesome-webfont.eot
│   ├── fontawesome-webfont.svg
│   ├── fontawesome-webfont.ttf
│   └── fontawesome-webfont.woff
├── img
│   ├── annotation-icon.png
│   ├── cubes.png
│   ├── glyphicons-halflings-white.png
│   ├── glyphicons-halflings.png
│   ├── kibana.png
│   ├── light.png
│   ├── load.gif
│   ├── load_big.gif
│   ├── small.png
│   └── ui-icons_222222_256x240.png
├── index.html
└── vendor
    ├── LICENSE.json
    ├── angular
    │   ├── angular-animate.js
    │   ├── angular-cookies.js
    │   ├── angular-dragdrop.js
    │   ├── angular-loader.js
    │   ├── angular-resource.js
    │   ├── angular-route.js
    │   ├── angular-sanitize.js
    │   ├── angular-scenario.js
    │   ├── angular-strap.js
    │   ├── angular.js
    │   ├── bindonce.js
    │   ├── datepicker.js
    │   └── timepicker.js
    ├── blob.js
    ├── bootstrap
    │   ├── bootstrap.js
    │   └── less
    │       ├── accordion.less
    │       ├── alerts.less
    │       ├── bak
    │       │   ├── bootswatch.dark.less
    │       │   └── variables.dark.less
    │       ├── bootstrap.dark.less
    │       ├── bootstrap.less
    │       ├── bootstrap.light.less
    │       ├── bootswatch.dark.less
    │       ├── bootswatch.light.less
    │       ├── breadcrumbs.less
    │       ├── button-groups.less
    │       ├── buttons.less
    │       ├── carousel.less
    │       ├── close.less
    │       ├── code.less
    │       ├── component-animations.less
    │       ├── dropdowns.less
    │       ├── forms.less
    │       ├── grid.less
    │       ├── hero-unit.less
    │       ├── labels-badges.less
    │       ├── layouts.less
    │       ├── media.less
    │       ├── mixins.less
    │       ├── modals.less
    │       ├── navbar.less
    │       ├── navs.less
    │       ├── overrides.less
    │       ├── pager.less
    │       ├── pagination.less
    │       ├── popovers.less
    │       ├── progress-bars.less
    │       ├── reset.less
    │       ├── responsive-1200px-min.less
    │       ├── responsive-767px-max.less
    │       ├── responsive-768px-979px.less
    │       ├── responsive-navbar.less
    │       ├── responsive-utilities.less
    │       ├── responsive.less
    │       ├── scaffolding.less
    │       ├── sprites.less
    │       ├── tables.less
    │       ├── tests
    │       │   ├── buttons.html
    │       │   ├── css-tests.css
    │       │   ├── css-tests.html
    │       │   ├── forms-responsive.html
    │       │   ├── forms.html
    │       │   ├── navbar-fixed-top.html
    │       │   ├── navbar-static-top.html
    │       │   └── navbar.html
    │       ├── thumbnails.less
    │       ├── tooltip.less
    │       ├── type.less
    │       ├── utilities.less
    │       ├── variables.dark.less
    │       ├── variables.less
    │       ├── variables.light.less
    │       └── wells.less
    ├── chromath.js
    ├── elasticjs
    │   ├── elastic-angular-client.js
    │   └── elastic.js
    ├── elasticsearch.angular.js
    ├── filesaver.js
    ├── jquery
    │   ├── jquery-1.8.0.js
    │   ├── jquery-ui-1.10.3.js
    │   ├── jquery.flot.byte.js
    │   ├── jquery.flot.events.js
    │   ├── jquery.flot.js
    │   ├── jquery.flot.pie.js
    │   ├── jquery.flot.selection.js
    │   ├── jquery.flot.stack.js
    │   ├── jquery.flot.stackpercent.js
    │   ├── jquery.flot.threshold.js
    │   ├── jquery.flot.time.js
    │   ├── jquery.multiselect.filter.js
    │   └── jquery.multiselect.js
    ├── jsonpath.js
    ├── lodash.js
    ├── modernizr-2.6.1.js
    ├── moment.js
    ├── numeral.js
    ├── require
    │   ├── css-build.js
    │   ├── css.js
    │   ├── require.js
    │   ├── text.js
    │   └── tmpl.js
    ├── simple_statistics.js
    ├── timezone.js
    └── underscore.string.js

一目了然，我们可以归纳出下面几类主要文件：

入口：index.html
模块库：vendor/
程序入口：app/app.js
组件配置：app/components/
仪表板控制：app/controllers/
挂件页面：app/partials/
服务：app/services/
指令：app/directives/
图表：app/panels/

入口和模块依赖

这一部分是网页项目的基础。从 index.html 里就可以学到 angularjs 最基础的常用模板语法了。出现的指令有：ng-repeat, ng-controller, ng-include, ng-view, ng-slow, ng-click, ng-href，以及变量绑定的语法：\{\{ dashboard.current.xxx }}。

index.html 中，需要注意 js 的加载次序，先 require.js，然后再 require.config.js，最后 app。整个 kibana 项目都是通过 requrie 方式加载的。而具体的模块，和模块的依赖关系，则定义在 require.config.js 里。这些全部加载完成后，才是启动 app 模块，也就是项目本身的代码。

require.config.js 中，主要分成两部分配置，一个是 paths，一个是 shim。paths 用来指定依赖模块的导出名称和模块 js 文件的具体路径。而 shim 用来指定依赖模块之间的依赖关系。比方说：绘制图表的 js，kibana3 里用的是 jquery.flot 库。这个就首先依赖于 jquery 库。(通俗的说，就是原先普通的 HTML 写法里，要先加载 jquery.js 再加载 jquery.flot.js)

在整个 paths 中，需要单独提一下的是 elasticjs:'../vendor/elasticjs/elastic-angular-client'。这是串联 elastic.js 和 angular.js 的文件。这里面实际是定义了一个 angular.module 的 factory，名叫 ejsResource。后续我们在 kibana 3 里用到的跟 Elasticsearch 交互的所有方法，都在这个 ejsResource 里了。

factory 是 angular 的一个单例对象，创建之后会持续到你关闭浏览器。Kibana 3 就是通过这种方式来控制你所有的图表是从同一个 Elasticsearch 获取的数据

app.js 中，定义了整个应用的 routes，加载了 controller, directives 和 filters 里的全部内容。就是在这里，加载了主页面 app/partials/dashboard.html。当然，这个页面其实没啥看头，因为里面就是提供 pulldown 和 row 的 div，然后绑定到对应的 controller 上。

controller 和 service

controller 里没太多可讲的。kibana 3 里，pulldown 其实跟 row 差别不大，看这简单的几行代码里，最关键的就是几个注入：

define(['angular','app','lodash'], function (angular, app, _) {
  'use strict';
  angular.module('kibana.controllers').controller('RowCtrl', function($scope, $rootScope, $timeout,ejsResource, querySrv) {
      var _d = {
        title: "Row",
        height: "150px",
        collapse: false,
        collapsable: true,
        editable: true,
        panels: [],
        notice: false
      };
      _.defaults($scope.row,_d);

      $scope.init = function() {
        $scope.querySrv = querySrv;
        $scope.reset_panel();
      };
      $scope.init();
    }
  );
});

这里面，注入了 $scope, ejsResource 和 querySrv。$scope 是控制器作用域内的模型数据对象，这是 angular 提供的一个特殊变量。ejsResource 是一个 factory ，前面已经讲过。querySrv 是一个 service，下面说一下。

service 跟 factory 的概念非常类似，一般来说，可能 factory 偏向用来共享一个类，而 service 用来共享一组函数功能。

kibana 3 里，比较有用和常用的 services 包括：

dashboard

dashboard.js 里提供了关于 Kibana 3 仪表板的读写操作。其中主要的几个是提供了三种读取仪表板布局纲要的方式，也就是读取文件，读取存在 .kibana-int 索引里的数据，读取 js 脚本。下面是读取 js 脚本的相关函数：

    this.script_load = function(file) {
      return $http({
        url: "app/dashboards/"+file.replace(/\.(?!js)/,"/"),
        method: "GET",
        transformResponse: function(response) {
          /*jshint -W054 */
          var _f = new Function('ARGS','kbn','_','moment','window','document','angular','require','define','$','jQuery',response);
          return _f($routeParams,kbn,_,moment);
        }
      }).then(function(result) {
        if(!result) {
          return false;
        }
        self.dash_load(dash_defaults(result.data));
        return true;
      },function() {
        alertSrv.set('Error',
          "Could not load <i>scripts/"+file+"</i>. Please make sure it exists and returns a valid dashboard" ,
          'error');
        return false;
      });
    };

可以看到，最关键的就是那个 new Function。知道这步传了哪些函数进去，也就知道你的 js 脚本里都可以调用哪些内容了~

最后调用的 dash_load 方法也需要提一下。这个方法的最后，有几行这样的代码：

      self.availablePanels = _.difference(config.panel_names,
        _.pluck(_.union(self.current.nav,self.current.pulldowns),'type'));

      self.availablePanels = _.difference(self.availablePanels,config.hidden_panels);

从最外层的 config.js 里读取了 panel_names 数组，然后取出了 nav 和 pulldown 用过的 panel，剩下就是我们能在 row 里添加的 panel 类型了。

querySrv

querySrv.js 里定义了跟 query 框相关的函数和属性。主要有几个值得注意的。

一个是 color 列表；
一个是 queryTypes，尤其是里么的 topN，可以看到 topN 方式其实就是先请求了一次 termsFacet，然后把结果 map 成一组普通的 query。
一个是 ids 和 idsByMode。之后图表的绑定具体 query 的时候，就是通过这个函数来选择的。

filterSrv

filterSrv.js 跟 querySrv 相似。特殊的是两个函数。

一个是 toEjsObjs。根据不同的 filter 类型调用不同的 ejs 方法。
一个是 timeRange。因为在 histogram panel 上拖拽，会生成好多个 range 过滤器，都是时间。这个方法会选择最后一个类型为 time 的 filter，作为实际要用的 filter。这样保证请求 ES 的是最后一次拖拽选定的时间段。

fields

fields.js 里最重要的作用就是通过 mapping 接口获取索引的字段列表，存在 fields.list 里。这个数组后来在每个 panel 的编辑页里，都以 bs-typeahead="fields.list" 的形式作为文本输入时的自动补全提示。在 table panel 里，则是左侧栏的显示来源。

esVersion

esVersion.js 里提供了对 ES 版本号的对比函数。之所以专门提供这么个 service，一来是因为不同版本的 ES 接口有变化，比如我自己开发的 percentile panel 里，就用 esVersion 判断了两次版本。因为 percentile 接口是 1.0 版之后才有，而从 1.3 版以后返回数据的结构又发生了一次变动。二来 ES 的版本号格式比较复杂，又有点又有字母。

panel 相关指令

添加 panel

前面在讲 app/services/dashboard.js 的时候，已经说到能添加的 panel 列表是怎么获取的。那么panel 是怎么加上的呢？

同样是之前讲过的 app/partials/dashaboard.html 里，加载了 partials/roweditor.html 页面。这里有一段：

    <form class="form-inline">
      <select class="input-medium" ng-model="panel.type" ng-options="panelType for panelType in dashboard.availablePanels|stringSort"></select>
      <small ng-show="rowSpan(row) > 11">
        Note: This row is full, new panels will wrap to a new line. You should add another row.
      </small>
    </form>

    <div ng-show="!(_.isUndefined(panel.type))">
      <div add-panel=""></div>
    </div>

这个 add-panel 指令，是有 app/directives/addPanel.js 提供的。方法如下：

          $scope.$watch('panel.type', function() {
            var _type = $scope.panel.type;
            $scope.reset_panel(_type);
            if(!_.isUndefined($scope.panel.type)) {
              $scope.panel.loadingEditor = true;
              $scope.require(['panels/'+$scope.panel.type.replace(".","/") +'/module'], function () {
                var template = '<div ng-controller="'+$scope.panel.type+'" ng-include="\'app/partials/paneladd.html\'"></div>';
                elem.html($compile(angular.element(template))($scope));
                $scope.panel.loadingEditor = false;
              });
            }
          });

可以看到，其实就是 require 了对应的 panels/xxx/module.js，然后动态生成一个 div，绑定到对应的 controller 上。

展示 panel

还是在 app/partials/dashaboard.html 里，用到了另一个指令 kibana-panel：

            <div
              ng-repeat="(name, panel) in row.panels|filter:isPanel"
              ng-cloak ng-hide="panel.hide"
              kibana-panel type='panel.type' resizable
              class="panel nospace" ng-class="{'dragInProgress':dashboard.panelDragging}"
              style="position:relative"  ng-style="{'width':!panel.span?'100%':((panel.span/1.2)*10)+'%'}"
              data-drop="true" ng-model="row.panels" data-jqyoui-options
              jqyoui-droppable="{index:$index,mutate:false,onDrop:'panelMoveDrop',onOver:'panelMoveOver(true)',onOut:'panelMoveOut'}">
            </div>

当然，这里面还有 resizable 指令也是自己实现的，不过一般我们用不着关心这个的代码实现。

下面看 app/directives/kibanaPanel.js 里的实现。

这个里面大多数逻辑跟 addPanel.js 是一样的，都是为了实现一个指令嘛。对于我们来说，关注点在前面那一大段 HTML 字符串，也就是变量 panelHeader。这个就是我们看到的实际效果中，kibana 3 每个 panel 顶部那个小图标工具栏。仔细阅读一下，可以发现除了每个 panel 都一致的那些 span 以外，还有一段是：

           '<span ng-repeat="task in panelMeta.modals" class="row-button extra" ng-show="task.show">' +
              '<span bs-modal="task.partial" class="pointer"><i ' +
                'bs-tooltip="task.description" ng-class="task.icon" class="pointer"></i></span>'+
            '</span>'

也就是说，每个 panel 可以在自己的 panelMeta.modals 数组里，定义不同的小图标，弹出不同的对话浮层。我个人给 table panel 二次开发加入的 exportAsCsv 功能，图标就是在这里加入的。

panel 内部实现

终于说到最后了。大家进入到 app/panels/ 下，每个目录都是一种 panel。原因前一节已经分析过了，因为 addPanel.js 里就是直接这样拼接的。入口都是固定的：module.js。

下面以 stats panel 为例。(因为我最开始就是抄的 stats 做的 percentile，只有表格没有图形，最简单)

每个目录下都会有至少一下三个文件：

module.js

module.js 就是一个 controller。跟前面讲过的 controller 写法其实是一致的。在 $scope 对象上，有几个属性是 panel 实现时一般都会有的：

$scope.panelMeta: 这个前面说到过，其中的 modals 用来定义 panelHeader。
$scope.panel: 用来定义 panel 的属性。一般实现上，会有一个 default 值预定义好。你会发现这个 $scope.panel 其实就是仪表板纲要里面说的每个 panel 的可设置值！

然后一般 $scope.init() 都是这样的：

    $scope.init = function () {
      $scope.ready = false;
      $scope.$on('refresh', function () {
        $scope.get_data();
      });
      $scope.get_data();
    };

也就是每次有刷新操作，就执行 get_data() 方法。这个方法就是获取 ES 数据，然后渲染效果的入口。

    $scope.get_data = function () {
      if(dashboard.indices.length === 0) {
        return;
      }

      $scope.panelMeta.loading = true;

      var request,
        results,
        boolQuery,
        queries;

      request = $scope.ejs.Request();

      $scope.panel.queries.ids = querySrv.idsByMode($scope.panel.queries);
      queries = querySrv.getQueryObjs($scope.panel.queries.ids);

      boolQuery = $scope.ejs.BoolQuery();
      _.each(queries,function(q) {
        boolQuery = boolQuery.should(querySrv.toEjsObj(q));
      });

      request = request
        .facet($scope.ejs.StatisticalFacet('stats')
          .field($scope.panel.field)
          .facetFilter($scope.ejs.QueryFilter(
            $scope.ejs.FilteredQuery(
              boolQuery,
              filterSrv.getBoolFilter(filterSrv.ids())
              )))).size(0);

      _.each(queries, function (q) {
        var alias = q.alias || q.query;
        var query = $scope.ejs.BoolQuery();
        query.should(querySrv.toEjsObj(q));
        request.facet($scope.ejs.StatisticalFacet('stats_'+alias)
          .field($scope.panel.field)
          .facetFilter($scope.ejs.QueryFilter(
            $scope.ejs.FilteredQuery(
              query,
              filterSrv.getBoolFilter(filterSrv.ids())
            )
          ))
        );
      });

      $scope.inspector = request.toJSON();

      results = $scope.ejs.doSearch(dashboard.indices, request);

      results.then(function(results) {
        $scope.panelMeta.loading = false;
        var value = results.facets.stats[$scope.panel.mode];

        var rows = queries.map(function (q) {
          var alias = q.alias || q.query;
          var obj = _.clone(q);
          obj.label = alias;
          obj.Label = alias.toLowerCase(); //sort field
          obj.value = results.facets['stats_'+alias];
          obj.Value = results.facets['stats_'+alias]; //sort field
          return obj;
        });

        $scope.data = {
          value: value,
          rows: rows
        };

        $scope.$emit('render');
      });
    };

stats panel 的这段函数几乎就跟基础示例一样了。

生成 Request 对象。
获取关联的 query 对象。
获取当前页的 filter 对象。
调用选定的 facets 方法，传入参数。
如果有多个 query，逐一构建 facets。
request 完成。生成一个 JSON 内容供 inspector 查看。
发送请求，等待异步回调。
回调处理数据成绑定在模板上的 $scope.data。
渲染页面。

注：stats/module.js 后面还有一个 filter，terms/module.js 后面还有一个 directive，这些都是为了实际页面效果加的功能，跟 kibana 本身的 filter，directive 本质上是一样的。就不单独讲述了。

module.html

module.html 就是 panel 的具体页面内容。没有太多可说的。大概框架是：

<div ng-controller='stats' ng-init="init()">
 <table ng-style="panel.style" class="table table-striped table-condensed" ng-show="panel.chart == 'table'">
    <thead>
      <th>Term</th> <th>\{\{ panel.tmode == 'terms_stats' ? panel.tstat : 'Count' }}</th> <th>Action</th>
    </thead>
    <tr ng-repeat="term in data" ng-show="showMeta(term)">
      <td class="terms-legend-term"></td>
      <td></td>
    </tr>
  </table>
</div>

主要就是绑定要 controller 和 init 函数。对于示例的 stats，里面的 data 就是 module.js 最后生成的 $scope.data。

editor.html

editor.html 是 panel 参数的编辑页面主要内容，参数编辑还有一些共同的标签页，是在 kibana 的 app/partials/ 里，就不讲了。

editor.html 里，主要就是提供对 $scope.panel 里那些参数的修改保存操作。当然实际上并不是所有参数都暴露出来了。这也是 kibana 3 用户指南里，官方说采用仪表板纲要，比通过页面修改更灵活细腻的原因。

editor.html 里需要注意的是，为了每次变更都能实时生效，所有的输入框都注册到了刷新事件。所以一般是这样子：

      <select ng-change="set_refresh(true)" class="input-small" ng-model="panel.format" ng-options="f for f in ['number','float','money','bytes']"></select>

这个 set_refresh 函数是在 module.js 里定义的：

    $scope.set_refresh = function (state) {
      $scope.refresh = state;
    };

总结

kibana 3 源码的主体分析，就是这样了。怎么样，看完以后，大家有没有信心也做些二次开发，甚至跟 grafana 一样，替换掉 esResource，换上一个你自己的后端数据源呢？

用 Kibana4 实现 PHP 慢日志函数堆栈分析

2015-03-06T00:00:00+00:00

标题说是 PHP 的慢日志，其实所有函数堆栈的调试日志都可以做，比如 Java 的调试日志等等。要用 Kibana ，首先得把日志数据解析并输入到 Elasticsearch 里。所以，本文分为几个部分：多行合并，堆栈解析，Nested Aggs 处理，Kibana4 的可视化效果。

多行合并

堆栈日志显然都是多行的。所以首先需要把多行数据整合成单个事件。之前已经多次写过如何用 Logstash 实现这个需求了。不过，Logstash 这里有个限制，就是必须是在 shipper 段配置才能有用。如果在 index 端，不同 shipper 来的数据顺序已经打乱了，这个合并就没有意义了。

所以，如果日志收集的时候没有用 Logstash 的，这时候就得自己处理了。下面是我写的一个示例：

#!/usr/bin/env pypy
#coding:utf-8
import re
import sys
import time
import socket
import urllib2
import optparse
try: import simplejson as json
except ImportError: import json
from common import grokFpmSlow

defaultLogTag='fpmSlow'
hostname = socket.gethostname()
timeout = 120

def getOptions():
    usage = "usage: %prog [options]"
    OptionParser = optparse.OptionParser
    parser = OptionParser(usage)
    parser.add_option("-t","--logTag",action="store",type="string",dest="logTag",default=defaultLogTag,help="default log tag.")
    options,args = parser.parse_args()
    return options,args

def send_es(data, logtag):
    url = 'http://esdomain:9200/logstash-mweibo-' + data['@timestamp'].split('T')[0].replace('-','.') + '/' + logtag
    req = urllib2.Request(url, json.dumps(data), {'Content-Type':'application/json'})
    try:
        res = urllib2.urlopen(req)
        print "Return content:",res.read()
    except urllib2.URLError, e:
        if hasattr(e,"reason"):
            if e.reason == 'Bad Request' and data.has_key('jsoncontent'):
                data['message'] = json.dumps(data.pop('jsoncontent'))
                send_es(data, logtag)
            else:
                print "The reason:",e.reason
        elif hasattr(e,"code"):
            print "Error code:",e.code
            print "Return content:",e.read()

def flush(log_buffer, grokObj):
    data = "".join(log_buffer)
    match = re.match(grokObj.msg_regexp, data)
    if match:
        ret = grokObj.grokData(match)
        ret["host"] = hostname
    else:
        ret = {
            "host":hostname,
            "message":data,
            "@timestamp":time.strftime('%FT%T')+'+0800'
        }
    send_es(ret, grokObj.logtag)

def get_log(grokObj):
    start_time = time.time()
    log_buffer = []
    while True:
        try:
            line = sys.stdin.readline()
        except:
            break
        if not line:
            flush(log_buffer, grokObj)
            break

        if line:
            match = re.match(grokObj.start_regexp, line)
            if match and len(log_buffer) > 0:
                flush(log_buffer, grokObj)
                start_time = time.time()
                log_buffer = []
            log_buffer.append(line.rstrip())
        else:
            if (time.time() - startime > timeout ):
                flush(log_buffer, grokObj)
                start_time = time.time()
                log_buffer = []
            time.sleep(1)

if __name__ == '__main__':
    options,args = getOptions()
    if options.logTag == '':
        get_log(grokFpmSlow.fpmSlow(options.logTag))

python 水平很烂，大家看看就好，大概流程其实跟 Logstash 差不多。

堆栈解析

上面的 python 脚本，只是做到根据正则表达式合并多行数据，以及收到处理结果后发送给 ES 集群。具体的处理，则在 common/grokFpmSlow.py 中完成:

#/usr/bin/pypy
#coding:utf-8
import re
import datetime

class fpmSlow():

    def __init__(self, _logtag):
        self.logtag = _logtag
        self.start_regexp = re.compile('^\[\d{2}-\w{3}-\d{4}')
        self.msg_regexp = re.compile('(?m)\[(?P<timestamp>\d{2}-\w{3}-\d{4} \d{2}:\d{2}:\d{2})\]  \[pool (?P<pool>\S+)\] pid (?P<pid>\d+)script_filename = (?P<slow_script>\S+)(?P<message>\[\w{18}\] (?P<slow_func>[^\[]*?:\d+).*\[\w{18}\](?P<begin_func>[^\[]*?:\d+))$')

    def grokData(self,match):
        ret = match.groupdict()
        ret['slow'] = {k: v for k, v in enumerate(re.split(r'\[\w{18}\] ', ret.pop('message'))) if k > 0 }
        ret["@timestamp"] = datetime.datetime.strptime(ret.pop("timestamp"), "%d-%b-%Y %H:%M:%S").strftime("%FT%T+0800")
        return ret

类属性中的 start_regexp 对应 Logstash/Codecs/MultiLine 中的 pattern，msg_regexp 对应 Logstash/Filters/Grok 中的 match。这些都是标准的正则，根据日志的实际情况写就好了。

grokData() 方法里，把 message 里存的整个堆栈，首先切割成数组，然后转换成对应行号为键的字典，存入 slow 字段。

也就是说，原本一段这样的 PHP-FPM 慢日志：

[13-May-2013 05:17:12]  [pool www] pid 13557
script_filename = /opt/www/inkebook/index.php
[0x000000000292e0f0] commit() /opt/www/inkebook/includes/database/mysql/database.inc:166
[0x000000000292de88] popCommittableTransactions() /opt/www/inkebook/includes/database/database.inc:1128
[0x000000000292dcf0] popTransaction() /opt/www/inkebook/includes/database/database.inc:1905
[0x00007fffe78cc460] __destruct() unknown:0
[0x000000000292c690] execute() /opt/www/inkebook/modules/statistics/statistics.module:73
[0x00007fffe78cc900] statistics_exit() unknown:0
[0x000000000292c208] call_user_func_array() /opt/www/inkebook/includes/module.inc:857
[0x000000000292bf10] module_invoke_all() /opt/www/inkebook/includes/common.inc:2688
[0x000000000292ade0] drupal_page_footer() /opt/www/inkebook/includes/common.inc:2676
[0x000000000292aa28] drupal_deliver_html_page() /opt/www/inkebook/includes/common.inc:2560
[0x000000000292a378] drupal_deliver_page() /opt/www/inkebook/includes/menu.inc:532
[0x000000000292a198] menu_execute_active_handler() /opt/www/inkebook/index.php:21

会转换成下面这样的字典：

{
  "pool": "www",
  "pid": "13557",
  "slow_script": "/opt/www/inkebook/index.php",
  "slow_func": "commit() /opt/www/inkebook/includes/database/mysql/database.inc:166",
  "begin_func": "menu_execute_active_handler() /opt/www/inkebook/index.php:21", 
  "@timestamp": "2013-05-13T05:17:12+0800",
  "slow": {
    "1": "commit() /opt/www/inkebook/includes/database/mysql/database.inc:166",
    "2": "popCommittableTransactions() /opt/www/inkebook/includes/database/database.inc:1128",
    "3": "popTransaction() /opt/www/inkebook/includes/database/database.inc:1905",
    "4": "__destruct() unknown:0",
    "5": "execute() /opt/www/inkebook/modules/statistics/statistics.module:73",
    "6": "statistics_exit() unknown:0",
    "7": "call_user_func_array() /opt/www/inkebook/includes/module.inc:857",
    "8": "module_invoke_all() /opt/www/inkebook/includes/common.inc:2688",
    "9": "drupal_page_footer() /opt/www/inkebook/includes/common.inc:2676",
    "10": "drupal_deliver_html_page() /opt/www/inkebook/includes/common.inc:2560",
    "11": "drupal_deliver_page() /opt/www/inkebook/includes/menu.inc:532",
    "12": "menu_execute_active_handler() /opt/www/inkebook/index.php:21"
  }
}

现在，数据就算处理完毕，可以写入 ES 了。

Nested Aggs

Elasticsearch 从 1.0 版本开始，改用 Agg 替换了 Facet 接口。其中最重要的特性，就是 Agg 可以叠加。还是以本文为例。因为我们只需要对函数做 Terms Agg 计数，所以 Nested Aggs 都是“桶(bucket)”类型的聚合。Elasticsearch 先按照第一级聚合的要求划分数据到桶内，也就是按照 slow.1 的 TopN 划成 10 个桶；然后在这 10 个桶内，按照第二级聚合的要求再划分数据到第二级桶，也就是在前面 10 个桶里按照 slow.2 的 TopN 各自又划分成 10 个桶，以此类推。

Elasticsearch 除了 bucket 类型的聚合还有 metric 类型的聚合。其实，如果一个 Terms Agg 叠加一个 metric 类型聚合的效果，就跟 Kibana 3 里的 TopN query 效果类似。但是 Nested Aggs 即可以叠加 metric 也可以叠加 bucket 类型的聚合，而且还可以叠加不止一次，功能更加强大。另外，Nested Aggs 是一次请求，Elasticsearch 全部计算完成统一返回。而 Kibana 3 里的效果其实是单独请求一次 TopN，然后循环发起 N 次带有 terms filter 的 facet 请求。

关于 Nested Agg 在叠加时候次序的影响，可以参见前不久我翻译的官网博客《kibana 的聚合执行次序》一文，颠倒 terms 和 date_histogram 的叠加次序，需求和结果是不一样的。

效果图

好了，铺垫完成了。终于说到 Kibana 4 里的操作了。

这次用的是 Kibana 4 正式版。也就是改用了 nodejs 的版本。所以，运行是很简单了。如果是下的压缩包，解压开，修改好 config.yml 运行 bin/kibana 即可。如果是用的 git 仓库源码，运行 npm install && npm start 即可。

正式版要求 ES 版本是 1.4.4，如果你是 1.4.0 ~ 1.4.3 的，这几个版本之间没有功能区别，只是那个脚本沙箱的漏洞。可以直接修改 src/public/index.js(源码则是 src/kibana/index.js) 里版本判断那行代码。

Kibana 4 里还会检查 ES 集群的分片状态，如果有 INIT 状态的分片，直接连 server 都不会启动，一定要等待集群完全 green 了才行。这是个很没道理的做法。我只要每个号有一个分片能用，就不影响数据读取啊！碰巧也有这个问题的，可以修改 src/server/lib/waitForEs.js 里的 waitForShards() 函数，直接强制 return 即可。实测完全没影响。

运行起来以后，访问主机的 5601 端口，就可以打开 Kibana4 的页面了。配置索引模式等步骤，这里不详说，可以参见我刚翻译完的《Kibana 4 用户指南》。

总之，在 Discover 页添加一个 query 或者 filter，目的是过滤出来 php-fpm 的 slow 日志数据，完成后保存，命名。

然后进 Visualize 页，添加一个 pie chart。选择 aggregation 类型为 terms。选择字段为 slow.1(如果采用了类 logstash 的template，这里应该用 slow.1.raw 确保函数不会被分词)。然后点击 split slices，继续添加 aggregation，这次字段为 slow.2。以此类推，假设我们一直添加到了 slow.4。

好了，页面右侧出现了最终的效果：

点击保存，输入命名。之后，可以在 Dashboard 页加入这个图片，也可以直接在其他页面里嵌入这个图片。点击 share 图标就可以看到 URL 了。如下：

http://sla.weibo.cn:5601/#/visualize/edit/php-slow-stack-pie?embed&_g=(time:(from:now-24h,mode:quick,to:now))&_a=(filters:!(),linked:!t,query:(query_string:(query:’*’)),vis:(aggs:!((id:’1’,params:(),schema:metric,type:count),(id:’2’,params:(field:slow.1.raw,order:desc,orderBy:’1’,size:10),schema:segment,type:terms),(id:’3’,params:(field:slow.2.raw,order:desc,orderBy:’1’,size:10),schema:segment,type:terms),(id:’4’,params:(field:slow.3.raw,order:desc,orderBy:’1’,size:10),schema:segment,type:terms),(id:’5’,params:(field:slow.4.raw,order:desc,orderBy:’1’,size:10),schema:segment,type:terms)),listeners:(),params:(addLegend:!t,addTooltip:!t,defaultYExtents:!f,isDonut:!t,shareYAxis:!t,spyPerPage:10),type:pie))

这个 URL 设计也是 Kibana 4 的一个重大改进之一。可以看到，基本上大多数设置都在这个 urlparams 里了。这也就意味着，我们其实可以直接修改 URL 来达到快速变换效果的目的。比如，我们现在想看到 slow.5 的效果，只需要在 URL 里加上一段 (id:'6',params:(field:slow.5.raw,order:desc,orderBy:'1',size:10), 就完工了。要改看两天的分析数据，只需要修改 URL 里的 (time:(from:now-2d,mode:quick,to:now)) 就可以了。想恢复编辑页面而不是内嵌图片形式，把 URL 里的 embed& 去掉就可以了。

事实上，掌握 URL 方式非常有用！因为 Kibana 4 中，Visualize 页的字段都是下拉菜单选择的方式，不像 Kibana 3 里是文本框任意输入。菜单选择方式，可以根据聚合的要求过滤不符合要求的类型的字段，一般来说是更方便的。但是：如果你的数据量很大，结构很复杂，可能这个下拉菜单你滚轴滚上几十秒都找不到想要的字段(因为需要提前准备好字段的细节，Kibana 4 在初次访问的时候会从 ES 下载当前索引模式下整个的字段映射数据/_mapping/fields/*，字段一多，这个数据就很大，又要保存在浏览器内存里，可以想象浏览器会多卡)！我的实际环境中，有 22000+ 个字段，映射请求的响应体大小高达 70MB，最后只好放弃在菜单里寻找需要的字段，随意选了一个，然后在 URL 里改成自己要的……

btw: 以上在 safari 上正常完成，在 chrome 40 上有 “Maximum call stack size exceeded” 报错，尚不知道根源。

【翻译】kibana 的聚合执行次序

2015-02-25T00:00:00+00:00

原文地址：http://www.elasticsearch.org/blog/kibana-aggregation-execution-order-and-you/

可能现在你已经发现了 Kibana 4 的 Visualize 界面上那些狡猾的小箭头，然后会问：“你们在那干嘛呢？有啥用啊？”嗯，这些按钮是用来控制聚合执行次序的。这个就定义了 Elasticsearch 如何分析你的数据，以及 Kibana 如何展示结果。

让我们预设一个常见的场景：按时序查找最活跃的用户。很简单对吧？没错，不过其实你的需求并不明确，目的并不清楚。什么叫“最活跃的用户”？让我们多加几个参数：一年时间，按照每周，计算前 5 名用户。现在更接近结果了，不过我们还是有两条不同的方式来解释这个需求：

一年时间内的前 5 名用户，他们的每周活跃度
每周的前 5 名用户，持续统计一年

每周的前 5 名用户，持续统计一年

这个截屏里，我们先运行时间轴柱状图(date histogram)，然后再问前 5 名用户。这就会给一年的每个星期创建一个桶(bucket，译者注：ES 的聚合 API 响应内容就是以 bucket 存在的)。在每个星期里，我们找到前 5 名用户，所以在这种情况下，每周的前 5 名用户，可能都是不一样的，最后在图例里，你就看到超过 5 个用户了。

然后，如果我们点开阴影区域的聚合请求(Request)标签，可以看到，date histogram 是先请求的，在 date histogram 里再加上了 terms 的聚合。结果就是我们看到有些星期某些用户异常活跃，而他们可能在其他时候毫无动静。这样我们就找到指定星期里的离群数据了。

一年时间内的前 5 名用户，他们的每周活跃度

现在，我们点击向上箭头，把 terms 聚合移到 date histogram 上面来。现在我们是先计算整年的前 5 名用户，然后给每个用户创建一个 date histogram。这下图例里就只有 5 个值了。不过，我们现在看到的用户也是持续活跃的，不再有离群数据了。

总结

所以现在你知道了：这些箭头还是有用的。聚合执行次序应用于 Kibana 里几乎所有的图，所以显著影响着你在图上看到的数据，以及你从数据得出的结论。

最后，如果你觉得自己有关于 Kibana 的好故事，我们很乐意倾听。发邮件到 stories@elasticsearch.com 或者在 Twitter 上联系，我们会帮你分享成功的喜悦给全世界！

【翻译】Kibana 4 RC1 发布

2015-02-25T00:00:00+00:00

原文地址：http://www.elasticsearch.org/blog/kibana-4-rc1-is-now-available

Kibana 4 的第一个 RC 版带着可选色、可堆叠、柱状图、饼图等等来啦！你应该注意到标题里的字母了，没错，现在不再是 beta 了。这意味着什么？这意味着我们打磨好了毛边，擦干净了痕迹。也意味着更加稳定，更好的性能，以及一些新的特性。

The good stuff is below, but if you want to jump right in then upgrade to Elasticsearch 1.4.3 and grab the new build over on the Kibana 4 download page right away.

小贴士

建议升级到 Elasticsearch 1.4.3。 Kibana 4 RC1 依赖一些 Elasticsearch 1.4.3 的功能。
更新你的 kibana.yml，有些配置参数发生了变化，比如 elasticsearch 现在叫 elasticsearch_url。

多序列图

Kibana 4 现在支持在每个图上画多个数值聚合。比如，在一个图上显示一个字段，或者完全不相关的多个字段的最小、最大和平均值。我们还添加上了呼声很高的百分比聚合，以及标准差视图。

部分数据桶的标示

你可能注意到过，很多分析引擎的最后一个点上，数据总是下降的。这是因为最后一个条带本身“没满”。比如一个每天的条带图，但是今天还没结束呢。Kibana 现在会给你展示这一天还有多少剩余时间，通过一个微妙的阴影设计，表示还有后续的时间序列数据。

仪表板上的文档表格

作为可视化的补充，Kibana 现在也可以在仪表板上展示已存的搜索了。和添加可视化内容一样操作，不过注意这个 “Searches” 标签。Kibana 会加载你保存的搜索，包括它的各列内容，然后排序列入仪表板上的表格。

markdown 挂件和表格过滤器

是不是厌烦饿了回答这个问题：“这行是啥意思？”。markdown 挂件让你可以给复杂的仪表板添加帮助信息面板。而且，数据表格现在跟其他面板一样也支持点击生成过滤器的功能了。

脚本化字段上的过滤器

Beta 3 不允许在脚本上做过滤。RC 现在通过透明传输的方式支持了 Elasticsearch 的 script filter 功能。在脚本化字段上点击生成过滤器，就跟普通字段一样。

Kibana 4 RC1 同时还从 Groovy 迁移到了 Lucene Expressions，这个变化出自 Elasticsearch 1.4.3 版的变更。因为 Lucene expressions 目前只支持数值类型的数据和函数，我们正在努力，早日支持字符串、时间类型。

自动刷新

自动刷新回来了！它使用和 Kibana 其他地方用的面板刷新一样的请求系统，所以，它也可以在各处正常工作，包括 Discover，Visualize 和 Dashboard。

nodejs 后端

我们把后端实现从 Java(具体地说是 JRuby) 迁移到了更新，更快，兼容性更好的 NodeJS。不要担心，我们会打包好 NodeJS 和 Kibana 在一起，没有 Java 依赖的安装步骤会更简单了。启动命令还是那样： ./bin/kibana，而且启动几乎是即时完成！

另一方面，你需要为你的操作系统选择正确的包下载地址。作为操作系统分发版有区别这个事情的补偿(虽然其实毫不相干)，我们免费开放了 SSL 支持功能，不管是从浏览器发出的还是发送去 Elasticsearch 的。

好了，牛排上来了开吃。不，其实还没，我们还带来了可配置格式的 CSV 导出，更好的数字处理和一个新的页面风格。谁知道我们还藏了什么呢？或许有？或许没有？唯一的办法就是下载下来你自己找找看；所以，现在就出发吧！一定要抢在别人前面，否则就没你的份了！

最后还是那句话，到 GitHub 上给我们提问题，建议，贡献。或者，如果你跟我们一样喜欢 IRC，加入我们在 Freenode 上的 #kibana 频道。

【翻译】kibana 4 正式就位

2015-02-25T00:00:00+00:00

原文地址：http://www.elasticsearch.org/blog/kibana-4-literally/

Kibana 4 现在，从内到外，从前到后，从唯心到唯物，全方位的，正式达到产品级就绪状态了。好吧，其实一个星期前就准备好了，不过我们希望达到绝对的确保它没问题。现在，我们可以分享这个开心的消息给大家了：Kibana 4.0.0 GA 啦！截图和主要信息见下。如果你也如此激动，我们给你准备好了两步计划：

从 Kibana 4 下载页获取它；
阅读 Kibana 4 文档掌握它。

小贴士: 如果你还没准备好，你需要先升级你的集群到 Elasticsearch 1.4.4

小贴士 2: 如果你是从 Kibana4 RC1 升级上来，你需要迁移一下你的配置。迁移方式见 gist 链接

背后的故事

Kibana 一直是用来解决问题的工具。为什么我每天半夜 2 点要被喊起来？代码什么时候推送到生产环境了？它是不是破坏什么了？嗯，我们解决的就是这些。多年以来，不止一个人被凌晨 2 点喊起来。我知道的，对吧？

通常的说，答案越简单的时候，问题其实越难。现在，让我们来解决这个难题，这个问题有三层。解决这个问题，需要分析多个维度，多个字段，多个数据源。Kibana 4 正是我们努力创造来用最短时间和最小的麻烦解决最难的问题的。

我们从 Kibana 3 里学到的东西，都应用到了 Kibana 4 里。为什么满足于在地图上画 1000 个点，而实际上我们可以有一亿个点？为什么满足于一个图上处理一个字段？或者一个面板上一个图？为什么一个仪表板上只能一个索引？让我们生成 5 个场景，跨越 2 个字段对比数据，然后从 3 个索引里读取这些数据，放到一个仪表板里。好，让我们开始，然后就可以吃冰淇淋去了。

绘图

就像冰淇淋一样，问题也有很多风格。为此，我们把 Kibana 划分成那不勒斯风格，但愿不是你讨厌的风格。如果你是 Kibana 的长期用户，你会在主页的第一个标签 Discover 页上感受到亲切。这页让你快速搜索，查找记录，以解决哪些可以通过单条记录讲清全部故事的简单问题。

当事情复杂到简单的搜索无能为力的时候，就需要图表来发挥魔力了。切换到 Visualize 标签，用 Elasticsearch 的聚合来分解数据。Visualize 展开数据的多个维度，让你构建图形、表格、地图，来快速解答哪些你之前从来不知道怎么回答的问题。你首先可能被问到的问题应该是“为什么网站上星期变慢了？”，但是这个问题通过数据显示，其实应该是“为什么圣诞节的时候东京地区的请求平均文件大小陡增了？”

最后，把这些合一起放到 Dashboard 上。放到一个大屏幕上然后说：“这是你要的答案，这里有个链接可以以后用。同样，我会写到 wiki 里，把数据导出成 CSV 然后发邮件给你。刚吃了点冰淇淋然后写了我简历的第一节。现在给我送更多的冰淇淋来，我吃完了。”

每个标签的细节，请阅读 Kibana 4 Beta 1: Released 博文。

后续…

现在可以睡会儿了么？当然不。Kibana 4.1 已经在开发中，我们对未来还有着大计划呢。很多变更在努力让 Kibana 4 更稳定和智能，让我们有一个平台，来构建未来的 Elasticsearch 应用。一切都被设计成可扩展的。比如，可视化部分就可以在它的基础上再构建。开源不仅仅是一个 GitHub 账号，而是我们的一个承诺，让每个人都能在我们的结构上构建创新产品。

阅读我们的开发者博客里的文章，构建你自己的 Kibana 可视化，创建你自己的 Elasticsearch 应用。想要先睹为快？看 Spencer Alger 在 Elastic{ON}15 上的演讲吧。

没有你们就没有我们的现在！所以，还是那句话，到 GitHub 上给我们提问题，建议，贡献。或者，如果你跟我们一样喜欢 IRC，加入我们在 Freenode 上的 #kibana 频道。

额外的话

想了解整个 Kibana 4 故事？阅读之前有关 Kibana 4 beta 的博文：

【翻译】用 kibana 4 调查你邻居可能投票给的人

2015-02-25T00:00:00+00:00

原文地址：http://www.elasticsearch.org/blog/kibana-4-for-investigating-pacs-super-pacs-and-your-neighbors/

是时候当一个公众黑客了！我们看到地区和联邦政府每天都公开越来越多的数据以提高行政透明度，包括交通事故，药物不良反应，高校助学金申请，餐厅检查甚至厕所位置都有。现在，所有人都能访问这个数据，分析它，然后构建应用以促进公众利益。公众黑客太棒了！

联邦选举委员会发布了竞选献金数据到它的网站(www.fec.gov)上，包括总统、参议院和众议院的。如同 fec.gov 上所说：

“In 1975, Congress created the Federal Election Commission (FEC) to administer and enforce the Federal Election Campaign Act (FECA) – the statute that governs the financing of federal elections. The duties of the FEC, which is an independent regulatory agency, are to disclose campaign finance information, to enforce the provisions of the law such as the limits and prohibitions on contributions, and to oversee the public funding of Presidential elections.”

向公众提供这些信息是对确保选举过程的完整性是至关重要的。

所以，现在 FEC 提供给了我们原始数据，我们能做什么呢？如果你不认为自己是一个会用 R 分析数据的数据科学家，或者会做漂亮的 D3.js 可视化效果的纽约时报员工，你可能这下就卡住了。不要紧，ELK stack 可以不用多少编程，做到丰富的、可视的，交互式数据分析。数据导入的步骤我会稍后讲，现在，先让我们看看 Kibana 4 能做到些什么。

discover

Kibana 4 里，你应该从 Discover 标签页开始。这是你得到数据集高阶感观的地方。可以查看实时的数据分布，结构化了的字段列表，一起索引中一些文档的实际内容。

在上面截图里，我们看到 2013-2014 选举周期里，一共有将近 210 万条个人捐献记录。我们能看到很清晰的捐献记录增加的趋势，以及一些看起来是随机的峰值点。

左侧栏列出了数据集中所有的字段。这提供给我们可以提问的内容。比如，我们现在知道数据里有像姓名、城市、州、捐献数量和捐献日期这些字段，我们就可以构思下面这些问题了：

哪个州的捐献数量最大？
哪个州的捐献金额最大？
爱荷华州的个人捐献金额实时变化情况如何？
竞选献金数前 10 名的州里，排名前 3 的城市都是哪些？
我喜欢的明星(比如：格温妮丝·帕特洛)给谁捐款了么？

字段列表还能帮助你排除掉一些没法回答的问题。比如，这个记录个人捐献的文件并不包含有关委员会和相关候选人的信息(技术上说，个人捐献的去向是跟候选人相关的)。原始数据里只是记录了委员会和候选人的加密 ID。

这样，要问“接收献金最多的 10 个委员会的名字是？”就比较难了。通过 Discover 界面发现这点，有助于引导我们加载额外的数据，丰富这个应用，让它更加有用。

visualize

当我们确定了可能要问的一些问题后，我们就可以开始基于数据集的这些属性构建可视化了。以前面说到的一个问题为例。

这是个人献金总额最多的 10 个州的饼图：

看起来没有太多的惊喜，如饼图所示，加利福尼亚，纽约，德克萨斯，佛罗里达，伊利诺斯(美国最大的五个州)贡献了最多的捐赠。华盛顿位列第三是一个有趣的值得调研的问题 - 华盛顿作为州的话应该是倒数第三小的，或许作为联邦政府所在地，更容易引导当地居民参与政治。

饼图很好创建：

选择用来确定饼图分片大小的聚合(Aggregation)种类：计数(Count)、总和(Sum)还是去重数(Unique Count)。如果你选择了总和或者去重数，Kibana 还需要知道用哪个字段的值来做这个运算。
选择切片(Split Slices)来切割饼图成片。
选择绘制分片的方式： a. Aggregation: 选择 “Terms” 因为我们是要基于字段的值来创建分片(“terms” 是 Elasticsearch 里的说法)。 b. Field: 选择要做运算的字段。本例中，我们要按照州来计算献金分布，所以选择 “state”。 c. Order/Size: 选择 “Top” 排序，选择长度为 “10” ，这样就能创建一个前 10 名的饼图。 d. Order by: 本例中你应该是用我们第一步里选过的函数来做排序，不过有些高级场景里你也可以在这里选择其他选项。
点击 Apply 然后你就有一个漂亮的饼图了。
点击右上角的 Save 图标，然后取个名字，这你可以把它添加到 Dashboard 里。

如果你在数据可视化方面有过一些经验，你可能会想“这家话真是个纯码农。饼图在这种数据分析里就是一个错误的可视化方式。”嗯，你是对的(好吧，希望不包括纯码农部分)。这里使用饼图确实给观众带来一些失真的感观，好像这里面已经包括全部 100% 的数据，就好像加利福尼亚的现金占到全国的四分之一一样。

你可以修改 “size” 参数为 “51”，这样分片数就等于实际的总数。不过如下所示，饼图看起来就不怎么漂亮了：

更好的办法是用另一种可视化方式，比如垂直柱状图(Vertical Bar Chart)。

创建垂直柱状图的参数看起来很眼熟。因为这些跟前面创建饼图用过的一模一样，毕竟驱动可视化的背后，实际的请求就是一模一样的。我们只是用一种更不容易被误解的方式来展示而已。

dashboard

创建可视化是蛮有趣的，不过有时候，你更希望把这些合起来放进一个漂亮的仪表板上，在这上面，执行一些聚合分析，通过多维度的字段数据获取有用的结论，然后和别人分享你的发现。

添加可视化到仪表板的时间过程非常直接。你创建好一系列可视化后，在 Dashboard 标签页的右上角点击 Add Visualizatioin 图表，然后开始添加即可！

小贴士：在你去创建可视化和仪表板之前，最好先约定保存这些元素时采用什么命名规则。比如，统一加上你的 Elasticsearch 索引名或者类型名作为前缀。

然后，你就会有一个像这样的仪表板了：

探索

让我们再看两个潜在的数据场景：一个关注特定的 Super PAC，另一个关注你加血的竞选献金。

这些 pac 后面都有谁?

政治行动委员会(Political Action Committees), 或者说 PAC，不是什么新东西了。第一个 PAC 在 1947 年《塔夫脱-哈特利法案》禁止工会和企业花钱影响联邦选举的时候就成立的。

Super PACs 应该是由 2010 年的两个最高法院判决促生的。判决裁定没有捐钱给具体候选人，政党或其他 PAC 的 PAC 组织，可以接收来自个人，公会和企业(包括盈利和非盈利的)的无限额捐款以保证独立的支出。[http://en.wikipedia.org/wiki/Political_action_committee]

Super PACs 是很多争议和辩论的来源，因为在此之前，竞选献金有很明确的额度限制。

在上面截图里，我们看到了一个有关捐献的高层次的师徒。特别是，接收捐献的顶级委员会，委员会类型(比如：Super PAC， PAC，党派等)以及利益集团的类别(比如：公司，公会等)。我可以大概猜出来很多委员会的含义，不过还是有些不太明显 —— 比如 “ACTBLUE” 和 “NEXTGEN CLIMATE ACTION COMMITTEE”。超过七千七百万美元的献金捐给一个命名模糊不清的委员会，真的是一个值得研究的问题。

你可以在数据表格上点击元素，就能过滤这个数据集了：

点击 “NEXTGEN CLIMATE ACTION COMMITTEE” 后，Kibana 会刷新所有其他图标，只显示捐献给这个委员会的相关数据。我们立刻就发现了一些有趣的现象：

绝大多数捐献给 “NEXTGEN CLIMATE ACTION COMMITTEE” 的人是：

自称职位是“创始人”
雇主为 Fahr, LLC
居住在旧金山

你再点击 “FAHR, LLC” 继续钻取，很明显这些献金是来自同一个人：

在通过雇主下钻之前，我们注意到只有 56 笔献金给 “NEXTGEN CLIMATE ACTION COMMITTEE”。几次点击后，我们发现这个 Super PAC 基本都是从 1 个人以及其他极少数人那获取的资金，我们猜测这群人可能是朋友，同事或者其他关系。

而另一个大型 PAC, “ACTBLUE”，就完全不一样了。

给这个 PAC 的捐献非常多(跟上个比是 154448 vs 56)，而且捐献来源广泛分布在各个地域：

Elasticsearch 提供的一个更有趣的分析函数是关键词聚合(significant terms aggregation)。你可以在比如欺诈检测、异常检测、推荐等各方面使用关键词。Elasticsearch 官博上有一篇文章介绍这个：Significant Terms Aggregation.

对于竞选献金数据集，使用关键词的一个例子就是识别一个特定的查询的统计特征。比如说，在很多 PAC 里，捐献者的职业是律师、退休、法官。所以，对任一 PAC 做职业排行统计，都发现不了什么有价值的信息。而使用关键词聚合，正如在表格中做的，可以看到对于 ActBlue，职位更普遍的应该是教授、自由职业和作家。

我们可以过滤另一个 PAC，民主党全国委员会(Democratic National Committee)，会发现这个 PAC 的职位都很常见了：

虽然我们开始的这次探索没有回答出关于这些 PAC 的所有问题，它触发了我希望跟踪的更多问题：

谁是 Thomas Steyer ，他跟他的 Super PAC 的另外大概 40 到 50 个捐献者之间是什么关系？
NextGen Climate 和 ActBlue 支持哪个候选人？
这两个组织之间有什么关联？
有没有什么有意无意的帮助特定 PAC 的营销手段，让特定行业的雇员更有兴趣？

整个钻取过程的优点是：在帮助回答一些问题的时候，用 ELK stack 还能帮你制定出一些甚至你自己都没想到能问出来的问题!

我家乡的人把钱给谁了？

警告：根据你家乡的大小，你可能会发现一些让你邻居很尴尬的事情:)

所有超过 $200 的献金都被要求依法公开，所以，虽然在这里看到你邻居的信息可能比较尴尬，不过竞选县级是公众信息，公众是有这个合法知情权的。

你可以很快的钻取数据集到州、市，然后看到你家乡谁捐献了，捐给了谁。

新泽西的霍博肯只有 449 条记录，逐一翻阅记录也花不了多少时间。但是，如果你要分析的是纽约市的 70850 条记录，通过 ELK stack 提供的交互式用户体现就体现出明显优势了：

回到我的家乡，新泽西的霍博肯，通过几次点击，你就可以构建出为当地参议院和众议院竞选捐献的排行榜。我一直不太明白为什么人们要出钱给 Cory Booker(赢得 56% 选票)和 Albio Sires(赢得 77.3% 选票)参与的非竞争性的比赛。或者只是因为需要支持一下朋友？不过一个关心政治的人，可能就会留意这里面的每一个细节了。

总结

我们刚看过了用 ELKstack 探索 FEC 竞选献金数据能做到什么。希望这也能帮你扩展使用 ELKstack 的思路，应用这些数据发现的规则到其他类型的数据是，不管是结构化的比如事务数据，非结构化的比如纯文本数据，抑或二者的混合体。

个人、非营利组织、政府机构和私人公司，从初创公司到大型企业，都在使用 ELK stack 处理实时数据集，大小从几 MB 到几 PB，随着 Kibana 4 的发布，处理会变得更容易和更强大。

附录 a. 如何在笔记本电脑上运行 elk 分析本数据集

如果你还没有最新版的 ELK stack 的话，可以从 http://www.elasticsearch.org/overview/elkdownloads/ 页面上下载并依照该页说明进行安装。

实际上你并不一定需要 Logstash 来完成这件事情，不过你如果想调试一把 Logstash 配置然后自己加载原始数据，安装 Logstash 还是完全值得的。

恢复 elasticsearch 索引镜像

下载安装完 ELK stack 后，你需要下载献金数据的索引镜像文件(注意：这是一个 1.4GB 大的文件，小心你的手机流量):

http://download.elasticsearch.org/demos/usfec/snapshot_demo_usfec.tar.gz

在你本地磁盘上创建一个叫 snapshots 的文件夹，然后解压下载的 .tar.gz 文件进去。比如：

mkdir -p ~/elk/snapshots
cp ~/Downloads/snapshot_demo_usfec.tar.gz ~/elk/snapshots
cd ~/elk/snapshots
tar xf snapshot_demo_usfec.tar.gz

等你把 Elasticsearch 跑起来以后，恢复索引就只需要两步了：

1) 为镜像注册一个文件系统仓库(修改下例中 “location” 的值到你实际的 usfec 镜像目录):

curl -XPUT 'http://localhost:9200/_snapshot/usfec' -d '{
    "type": "fs",
    "settings": {
        "location": "/tmp/snapshots/usfec",
        "compress": true,
        "max_snapshot_bytes_per_sec": "1000mb",
        "max_restore_bytes_per_sec": "1000mb"
    }
}'

2) 调用恢复接口(Restore API endpoint)开始恢复索引数据到你的 Elasticsearch 实例:

curl -XPOST "localhost:9200/_snapshot/usfec/1/_restore"

现在，去喝个咖啡。等一会儿后，你可以调用 cat recovery API 来检查一下恢复操作是否完成：

curl -XGET 'localhost:9200/_cat/recovery?v'

或者获取索引的文档数：

curl -XGET localhost:9200/usfec*/_count -d '{
        "query": {
                "match_all": {}
        }
}'

如果全部完成的话，这个数应该是 4250251。

指向 kibana 4 到一个 elasticsearch 索引

你通过 localhost:5601 第一次访问 Kibana 的时候，它会要求你定义一个 “index pattern”:

因为 Elasticsearch 集群可能有多个索引，你需要告诉 Kibana 哪些索引里有你希望读取的数据。在本例中，献金镜像包括了四个索引，当你运行索引恢复操作后，应该在你的 Elasticsearch 实例里创建好了四个新索引：

usfec_indiv_contrib: 由个人捐赠给委员会
usfec_comm2cand_contrib: 由委员会捐赠给候选人
usfec_comm2comm_contrib: 由委员会转给其他委员会
usfec_oppexp: 委员会运营支出

你可以输入一个索引名字到输入框，然后选择一个时间字段(我们索引里，应该是 @timestamp)，然后点击 Create：

这篇博文的示例中，我们只用到了个人献金的数据，其他三个索引里其实还有很多价值。甚至你可以在 Kibana 里同时指向这四个索引，然后找出不同数据集之间的联系！

打开 Discover 标签，选择一个合适的时间段(选择 “From” 时间为 2012-12-18)，开始探索吧！

附录 b. 参考链接

fec.gov 的原始数据和数据字典文件 http://www.fec.gov/finance/disclosure/ftpdet.shtml#a2013_2014

OpenSecrets.org 资源中心: 分析献金数据的各种资源。感谢这里提供了 FEC 数据更详细的字典。 https://www.opensecrets.org/resources/create/

存放文件的 Github 仓库: Logstash 配置, 索引模板, 解析数据创建 JSON 的 Python 脚本等 https://github.com/elasticsearch/demo/tree/master/usfec

spark streaming 的 transform 操作示例

2015-02-14T00:00:00+00:00

前两篇，一篇说在 spark 里用 SQL 方便，一篇说 updatestateByKey 可以保留状态做推算。那么怎么综合起来呢？目前看到的 spark streaming 和 spark SQL 的示例全都是在 output 阶段的 foreachRDD 里才调用 SQL。实际在 output 之前，也是可以对 DStream 里的 RDD 做复杂的转换操作的，这就是 transform 方法。

通过 transform 方法，可以做到 SQL 请求的结果依然是 DStream 数据，这样就可以使用 updateStateByKey 方法了。下面是示例：

import org.apache.spark.SparkConf
import org.apache.spark.sql._
import org.apache.spark.sql.SQLContext
import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.StreamingContext._

object LogStash {

  case class Status(avg:Double = 0.0, count:Int = 0) {
    var countTrend = 0.0
    var avgTrend = 0.0
    def %(prev:Status): Status = {
      if (prev.count > 0) {
        this.countTrend = (this.count - prev.count).toDouble / prev.count
      }
      if (prev.avg > 0) {
        this.avgTrend = (this.avg - prev.avg) / prev.avg
      }
      this
    }
    override def toString = {
      s"Trend($avg, $count, $avgTrend, $countTrend)"
    }
  }

  def updatestatefunc(newValue: Seq[Status], oldValue: Option[Status]): Option[Status] = {
    val prev = oldValue.getOrElse(Status())
    val current = if (newValue.size > 0) newValue.last % prev else Status()
    Some(current)
  }

  def main(args: Array[String]) {

    val sparkConf = new SparkConf().setMaster("local[2]").setAppName("LogStash")
    val sc  = new SparkContext(sparkConf)

    val ssc = new StreamingContext(sc, Seconds(10))
    ssc.checkpoint("/tmp/spark-streaming-logstash")

    val sqc = new SQLContext(sc)
    import sqc._

    val lines = ssc.socketTextStream("localhost", 8888)

    lines.transform( rdd => {
      if (rdd.count > 0) {
        sqc.jsonRDD(rdd).registerTempTable("logstash")
        val sqlreport = sqc.sql("SELECT message, COUNT(message) AS host_c, AVG(lineno) AS line_a FROM logstash WHERE path = '/var/log/system.log' AND lineno > 70 GROUP BY message ORDER BY host_c DESC LIMIT 100")
        sqlreport.map(r => (r(0).toString -> Status(r(2).toString.toDouble, r(1).toString.toInt)))
      } else {
        rdd.map(l => ("" -> Status()))
      }
    }).updateStateByKey(updatestatefunc).print()

    ssc.start()
    ssc.awaitTermination()
  }
}

这里有一点需要注意，也是耽误我时间最多的地方：transform 方法的参数和返回，代码里的定义是 RDD[T] 和 RDD[U]。我不懂 Java/Scala，以为是只要是 RDD 对象即可。实践证明，其实要任意场合下返回的 RDD 里的数据类型也保持一致。

在上例中，就是 if 条件下返回的是 RDD[(String, Status)]，那么 else 条件下，也必须返回一个 RDD[(String, Status)]，如果直接返回原始的 rdd(也就是 RDD[String])，就会报错。

spark streaming 的 state 操作示例

2015-02-14T00:00:00+00:00

前一篇学习演示了 spark streaming 的基础运用。下一步进入稍微难一点的，利用 checkpoint 来保留上一个窗口的状态，这样可以做到移动窗口的更新统计。

首先还是先演示一下 spark 里传回调函数的用法，上一篇里用 DStream 处理模拟了 SUM()，这个纯加法是最简单的了，那么如果 AVG() 怎么做呢？

    val r = logs.filter(l => l.path.equals("/var/log/system.log")).filter(l => l.lineno > 70)
    r.map(l => l.message -> (l.lineno, 1)).reduceByKey((a, b) => {
      (a._1 + b._1, a._2 + b._2)
    }).map(t => AlertMsg(t._1, t._2._2, t._2._1/t._2._2)).print()

这段跟之前做 SUM 的那段的区别：

DStream 处理成 PairDStream 的时候，Value 不是单纯的 1，而是一个 Seq[Double, Int]。避免了上一个示例里分开两个 DStream 然后再 join 起来的操作；
给 reduceByKey 传了一个稍微复杂的匿名函数。在这一个函数里计算了 SUM 和 COUNT，后面 map 只需要做一下除法就是 AVG 了。

不过这里还用不上上一次窗口的状态。真正需要上一次窗口状态的，是 reduceByKeyAndWindow 和 updateStateByKey。reduceByKeyAndWindow 和 reduceByKey 的区别，就是除了计算新数据的函数，还要传递一个处理过期数据的函数。

下面用 updateStateByKey ，演示一下如何计算每个窗口的平均值，跟上一个窗口的平均值的涨跌幅度，如果波动超过 10%，则输出：

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.StreamingContext._
import scala.util.parsing.json.JSON

object LogStash {

  case class LogStashV1(message:String, path:String, host:String, lineno:Double, timestamp:String)
  case class Status(sum:Double = 0.0, count:Int = 0) {
    val avg = sum / scala.math.max(count, 1)
    var countTrend = 0.0
    var avgTrend = 0.0
    def +(sum:Double, count:Int): Status = {
      val newStatus = Status(sum, count)
      if (this.count > 0 ) {
        newStatus.countTrend = (count - this.count).toDouble / this.count
      }
      if (this.avg > 0 ) {
        newStatus.avgTrend = (newStatus.avg - this.avg) / this.avg
      }
      newStatus
    }
    override def toString = {
      s"Trend($count, $sum, $avg, $countTrend, $avgTrend)"
    }
  }

  def updatestatefunc(newValue: Seq[(Double, Int)], oldValue: Option[Status]): Option[Status] = {
    val prev = oldValue.getOrElse(Status())
    var current = prev + ( newValue.map(_._1).sum, newValue.map(_._2).sum )
    Some(current)
  }

  def main(args: Array[String]) {

    val sparkConf = new SparkConf().setMaster("local[2]").setAppName("LogStash")
    val sc  = new SparkContext(sparkConf)

    val ssc = new StreamingContext(sc, Seconds(10))

    val lines = ssc.socketTextStream("localhost", 8888)
    val jsonf = lines.map(JSON.parseFull(_)).map(_.get.asInstanceOf[scala.collection.immutable.Map[String, Any]])

    val logs = jsonf.map(data => LogStashV1(data("message").toString, data("path").toString, data("host").toString, data("lineno").toString.toDouble, data("@timestamp").toString))

    val r = logs.filter(l => l.path.equals("/var/log/system.log")).filter(l => l.lineno > 70)
    r.map(l => l.message -> (l.lineno, 1)).reduceByKey((a, b) => {
      (a._1 + b._1, a._2 + b._2)
    }).updateStateByKey(updatestatefunc).filter(t => t._2.avgTrend.abs > 0.1).print()

    ssc.start()
    ssc.awaitTermination()
  }
}

这里因为流数据只有 sum 和 count，但是又想留存两个 trend 数据，所以使用了一个新的 cast class，把 trend 数据作为 class 的 value member。对于 state 来说，看到的就是一整个 class 了。

依然有参考资料：

spark streaming 和 spark sql 结合示例

2015-02-13T00:00:00+00:00

之前在博客上演示过如果在 spark 里读取 elasticsearch 中的数据。自然往下一步想，是不是可以把一些原先需要定期请求 elasticsearch 的监控内容挪到 spark 里完成？这次就是探讨一下 spark streaming 环境上如何快速统计各维度的数据。期望目标是，可以实现对流数据的异常模式过滤。平常只需要简单调整模式即可。

spark 基础预备

之前作为示例，都是直接在 spark-shell 交互式命令行里完成的。这次说说在正式的情况下怎么做。

spark 是用 scala 写的，scala 的打包工具叫 sbt。首先通过 sudo port install sbt 安装好。然后创建目录：

mkdir -p ./logstash/src/main/scala/

sbt 打包的配置文件则放在 ./logstash/logstash.sbt 位置。内容如下(注意之间的空行是必须的)：

name := "LogStash Project"

version := "1.0"

scalaVersion := "2.10.4"

libraryDependencies += "org.apache.spark" %% "spark-core" % "1.2.0"

libraryDependencies += "org.apache.spark" %% "spark-streaming" % "1.2.0"

libraryDependencies += "org.apache.spark" %% "spark-sql" % "1.2.0"

然后是程序主文件 ./logstash/src/main/scala/LogStash.scala，先来一个最简单的，从 logstash/output/tcp 收数据并解析出来。注意，因为 spark 只能用 pull 方式获取数据，所以 logstash/output/tcp 必须以 mode => 'server' 方式运行。

output {
    tcp {
        codec => json_lines
        mode  => 'server'
        port  => 8888
    }
}

spark streaming 基础示例

编辑主文件如下：

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.StreamingContext._
import scala.util.parsing.json.JSON

object LogStash {

  def main(args: Array[String]) {

    val sparkConf = new SparkConf().setMaster("local[2]").setAppName("LogStash")
    val sc  = new SparkContext(sparkConf)
    val ssc = new StreamingContext(sc, Seconds(10))

    val lines = ssc.socketTextStream("localhost", 8888)
    val jsonf = lines.map(JSON.parseFull(_)).map(_.get.asInstanceOf[scala.collection.immutable.Map[String, Any]])

    jsonf.filter(l => l("lineno")==75).window(Seconds(30)).foreachRDD( rdd => {
      rdd.foreach( r => {
        println(r("path"))
      })
    })

    ssc.start()
    ssc.awaitTermination()
  }

}

非常一目了然，每 10 秒挪动一次 window，window 宽度是 30 秒，把 JSON 数据解析出来以后，做过滤和循环输出。这里需要提示一下的是 .foreachRDD 方法。这是一个 output 方法。spark streaming 里对 input 收到的 DStream 一定要有 output 处理，那么最常见的就是用 foreachRDD 把 DStream 里的 RDDs 循环一遍，做 save 啊，print 啊等等后续。

然后用 sbt 工具编译后就可以运行了：

sbt package && ./spark-1.2.0-bin-hadoop2.4/bin/spark-submit --class "LogStash" --master local[2] target/scala-2.10/logstash-project_2.10-1.0.jar

进阶：数据映射和 SQL 处理

下面看如何在 spark streaming 上使用 spark SQL。前面通过解析 JSON，得到的是 Map 类型的数据，这个无法直接被 SQL 使用。通常的做法是，通过预定的 scala 里的 cast class，来转换成 spark SQL 支持的表类型。主文件改成这样：

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.StreamingContext._
import org.apache.spark.sql.SQLContext
import org.apache.spark.sql._
import scala.util.parsing.json.JSON

object LogStash {

  case class LogStashV1(message:String, path:String, host:String, lineno:Double, timestamp:String)
  case class AlertMsg(host:String, count:Int, value:Double)

  def main(args: Array[String]) {

    val sparkConf = new SparkConf().setMaster("local[2]").setAppName("LogStash")
    val sc  = new SparkContext(sparkConf)
    val ssc = new StreamingContext(sc, Seconds(10))

    val sqc = new SQLContext(sc)
    import sqc._

    val lines = ssc.socketTextStream("localhost", 8888)
    val jsonf = lines.map(JSON.parseFull(_)).map(_.get.asInstanceOf[scala.collection.immutable.Map[String, Any]])

    val logs = jsonf.map(data => LogStashV1(data("message").toString, data("path").toString, data("host").toString, data("lineno").toString.toDouble, data("@timestamp").toString))

    logs.foreachRDD( rdd => {
      rdd.registerAsTable("logstash")
      val sqlreport = sqc.sql("SELECT message, COUNT(message) AS host_c, SUM(lineno) AS line_a FROM logstash WHERE path = '/var/log/system.log' AND lineno > 70 GROUP BY message ORDER BY host_c DESC LIMIT 100")
      sqlreport.map(t => AlertMsg(t(0).toString, t(1).toString.toInt, t(2).toString.toDouble)).collect().foreach(println)
    })

    ssc.start()
    ssc.awaitTermination()
  }

}

通过加载 SQLContext，就可以把 RDD 转换成 table，然后通过 SQL 方式写请求了。这里有一个地方需要注意的是，因为最开始转换 JSON 的时候，键值对的 value 类型是 Any(因为要兼容复杂结构)，所以后面赋值的时候需要具体转换成合适的类型。于是悲催的就有了 .toString.toInt 这样的写法。。。

同样效果的非 SQL 实现

不用 spark SQL 当然也能做到，而且如果需要复杂处理的时候，还少不了自己写。如果把上例中那段 foreachRDD 替换成下面这样，效果是完全一样的：

    val r = logs.filter(l => l.path.equals("/var/log/system.log")).filter(l => l.lineno > 70)
    val host_c = r.map(l => l.message -> 1).reduceByKey(_+_).groupByKey()
    r.map(l => l.message -> l.lineno).reduceByKey(_+_).groupByKey().join(host_c).foreachRDD( rdd => {
        rdd.map(t => AlertMsg(t._1, t._2._2.head, t._2._1.head)).collect().foreach(println)
    })

这里面用到的 .groupByKey 和 .reduceByKey 方法，都是专门针对 PairsDStream 对象的，所以前面必须通过 .map 方法把普通 DStream 转换一下。

这里还有一个很厉害的方法，叫 .updatestateByKey 。可以有一个 checkpoint 存上一个 window 的数据，具体示例稍后更新。

更简洁的 jsonRDD 方法

在简单需求的时候，可能还是觉得能用 SQL 就用 SQL 比较好。但是提前定义 cast class 真的比较麻烦。其实对于 JSON 数据，spark SQL 是有提供更简洁的处理接口的。可以直接写成这样：

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.StreamingContext._
import org.apache.spark.sql.SQLContext
import org.apache.spark.sql._

object LogStash {

  case class AlertMsg(host:String, count:String, value:String)

  def main(args: Array[String]) {

    val sparkConf = new SparkConf().setMaster("local[2]").setAppName("LogStash")
    val sc  = new SparkContext(sparkConf)
    val ssc = new StreamingContext(sc, Seconds(10))
    val sqc = new SQLContext(sc)
    import sqc._

    val lines = ssc.socketTextStream("localhost", 8888)

    lines.foreachRDD( rdd => {
      if (rdd.count > 0) {
        val t = sqc.jsonRDD(rdd)
//        t.printSchema()
        t.registerTempTable("logstash")
        val sqlreport =sqc.sql("SELECT host, COUNT(host) AS host_c, AVG(lineno) AS line_a FROM logstash WHERE path = '/var/log/system.log' AND lineno > 70 GROUP BY host ORDER BY host_c DESC LIMIT 100")
        sqlreport.map(t=> AlertMsg(t(0).toString,t(1).toString,t(2).toString)).collect().foreach(println)
      }
    })

    ssc.start()
    ssc.awaitTermination()
  }
}

这样，不用自己解析 JSON，直接加载到 SQLContext 里。可以通过 .printSchema 方法查看到 JSON 被转换成了什么样的表结构。

TODO

SQL 的方式可以很方便的做到对实时数据的阈值监控处理，但是 SQL 是建立在 RDD 上的如何利用 DStream 的上一个 window 的 state 状态实现比如环比变化处理，移动均线处理，还没找到途径。

rsyslog 的 TCP 转发性能测试

2015-02-12T00:00:00+00:00

做一个日志手机系统，一般有两个思路。一个是提供一个多语言 SDK 包，然后开发者只需要找到对应的 SDK 加载即可；一个是采用最通用的日志传输协议，让开发者采用现成的协议实现。在通用协议里，最常见的，就是 syslog 协议。不过 syslog 过去采用 UDP 的印象太过深入人心，rsyslog 虽然宣称在测试用达到了每秒上百万的性能，也没多少人相信。那么，到底用 syslog 协议做跨网络传输，靠不靠谱？自己用压测，来证明一下！

测试环境

两台测试机。其中：

A 配置为 imtcp/514，omfwd 到 B 的 514。

module( load="imtcp" )
input( type="imtcp" port="514" ruleset="forwardruleset" )
Ruleset( name="forwardruleset" )
{
    action (
        type="omfwd"
        Target="$b-server-ip"
        Port="514"
        Protocol="tcp"
        RebindInterval="5000"
        name="action_fwd"
        queue.filename="action_fwd"
        queue.size="50000"
        queue.dequeuebatchsize="1000"
        queue.maxdiskspace="5G"
        queue.discardseverity="3"
        queue.checkpointinterval="10"
        queue.type="linkedlist"
        queue.workerthreads="1"
        queue.timeoutshutdown="10"
        queue.timeoutactioncompletion="10"
        queue.timeoutenqueue="20"
        queue.timeoutworkerthreadshutdown="10"
        queue.workerthreadminimummessages="5000"
        queue.maxfilesize="500M"
        queue.saveonshutdown="on"
    )
    stop
}

B 配置为 imtcp/514，omfile 到本机。

module( load="imtcp" )
input( type="imtcp" port="514" ruleset="recordruleset" )
Ruleset( name="recordruleset" )
{
    action( type="omfile" file="/data1/debug.log" template="defaultLogFormat" asyncWriting="on" flushOnTXEnd="off" ioBufferSize="81920k" flushInterval="5")
}

测试工具

为了控制测试的速度，放弃之前压测 logstash 时候用的 logger 命令，采用 syslog-ng 项目自带的 loggen 命令。本来准备编译一下 syslog-ng，不过报错太多，实在复杂，看了一下 loggen.c 本身没啥依赖，所以决定采用最简单的办法获取 loggen 命令——下载 syslog-ng.rpm，然后直接解压压缩包！

wget http://mirrors.zju.edu.cn/epel/5/x86_64/syslog-ng-2.1.4-9.el5.x86_64.rpm
rpm2cpio syslog-ng-2.1.4-9.el5.x86_64.rpm  | cpio -div

我这不能直接通过 yum install 安装，因为 syslog-ng 跟系统里已有的 rsyslog 是冲突的。

测试命令

rpm 获取的 loggen 命令还不支持 --read-data 参数，只能自己模拟填充数据。所以测试命令如下：

./usr/bin/loggen -r 10000 -i -s 500 -I 600 $a-server-ip 514

意即单条长度 500 字节，每秒 10000 条的频率，持续发送 600 秒。

验证方式

rsyslog 有专门的 impstats 模块，输出本身运行情况的统计，可以通过如下配置开启：

module( load="impstats" interval="60" severity="6" log.syslog="on" format="json" resetCounters="on")
template( name="dynaFileRsyslog" type="string" string="/data1/rsyslog/impstats/%$year%/%$month%/%$day%_impstats.log" )
if ( $syslogfacility-text == 'syslog' ) then
{
    action  ( type="omfile"  DynaFile="dynaFileRsyslog" FileCreateMode="0600" )
    stop
}

每 60 秒会输出 JSON 格式的统计数据，类似这样：

2015-02-11T20:00:43.176325+08:00 localhost rsyslogd-pstats: {"name":"action_fwd queue","size":0,"enqueued":0,"full":0,"discarded.full":0,"discarded.nf":0,"maxqsize":0}

其中，enqueued 表示进入队列的条目数，size 表示暂存在内存中的条目数，discarded.full 表示队列满丢弃的条目数，discarded.nf 表示队列将满丢弃的条目数。

如果内存队列都不够用，那么 rsyslog 会记录到磁盘队列上，这时候看到类似上面的统计数据的另一条记录，区别是 "name":"action_fwd queue[DA]"，这个 DA 就是磁盘队列的意思。

测试结果

每秒 5 万条的发送，可以做到毫无 size 的全部即时转发。
加大 queue.size 到 10 倍，即时转发能力提高到 12 万条。
再加大 queue.workerthreads 到 10，即时转发能力提高到 15 万条。
单独加大 queue.dequeuebatchsize 到 10 倍，即时转发能力提高到 17 万条。
同时加大 queue.size 和 queue.dequeuebatchsize 到 10 倍，即时转发能力提高到 18 万条。
加大频率到 24 万，进入磁盘队列，因为这时候已经到千兆网卡瓶颈。
加大模拟长度到 5000 字节，即时转发能力下降到 1 万。

最后，尽可能删除掉各种配置，以默认方式运行，发现转发能力也能达到 5 万条。查了一下源码，默认的 queue.size 是 1000，queue.dequeuebatchsize 是 16。说明在这段大小(初始测试值是默认值的 50 多倍)内，性能变化不大。

长期运行

测试每次只运行几分钟，还需要长期运行的考验。运行两三天的观察，同时加大到 10 倍的配置(即短期测试可以跑满网卡的配置)，在长期稳定每秒 5 万条的测试中，也会出现内存队列的 size 数。还需继续观察 size 是否累积，以及更大量的情况是否会出现磁盘队列。

Python 批量写入 Elasticsearch 脚本

2015-02-11T00:00:00+00:00

Elasticsearch 官方和社区提供了各种各样的客户端库，在之前的博客中，我陆陆续续提到和演示过 Perl 的，Javascript 的，Ruby 的。上周写了一版 Python 的，考虑到好像很难找到现成的示例，如何用 python 批量写数据进 Elasticsearch，今天一并贴上来。

#!/usr/bin/env pypy
#coding:utf-8

import re
import sys
import time
import datetime
import logging
from elasticsearch import Elasticsearch
from elasticsearch import helpers
from elasticsearch import ConnectionTimeout

es = Elasticsearch(['192.168.0.2', '192.168.0.3'], sniff_on_start=True, sniff_on_connection_fail=True, max_retries=3, retry_on_timeout=True)
logging.basicConfig()
logging.getLogger('elasticsearch').setLevel(logging.WARN)
logging.getLogger('urllib3').setLevel(logging.WARN)

def parse_www(logline):
	try:
		time_local, request, http_user_agent, staTus, remote_addr, http_referer, request_time, body_bytes_sent, http_x_forwarded_proto, http_x_forwarded_for, http_host, http_cookie, upstream_response_time = logline.split('`')
		try:
			upstream_response_time = float(upstream_response_time)
		except:
			upstream_response_time = None

		method, uri, verb = request.split(' ')
		arg = {}
		try:
			url_path, url_args = uri.split('?')
			for args in url_args.split('&'):
				k, v = args.split('=')
				arg[k] = v
		except:
			url_path = uri

		# Why %z do not implement?
	        date = datetime.datetime.strptime(time_local, '[%d/%b/%Y:%H:%M:%S +0800]')
		ret = {
			"@timestamp": date.strftime('%FT%T+0800'),
			"host": "127.0.0.1",
			"method": method.lstrip('"'),
			"url_path": url_path,
			"url_args": arg,
			"verb": verb.rstrip('"'),
			"http_user_agent": http_user_agent,
			"status": int(staTus),
			"remote_addr": remote_addr.strip('[]'),
			"http_referer": http_referer,
			"request_time": float(request_time),
			"body_bytes_sent": int(body_bytes_sent),
			"http_x_forwarded_proto": http_x_forwarded_proto,
			"http_x_forwarded_for": http_x_forwarded_for,
			"http_host": http_host,
			"http_cookie": http_cookie,
			"upstream_response_time": upstream_response_time
		}
		return {"_index":"logstash-mweibo-www-"+date.strftime('%Y.%m.%d'), "_type":"nginx","_source":ret}
	except:
		return {"_index":"logstash-mweibo-www-"+datetime.datetime.now().strftime('%Y.%m.%d'), "_type":"nginx","_source":{"message":logline}}

def get_log():
    start_time = time.time()
    log_buffer = []
    while True:
        try:
            line = sys.stdin.readline()
        except:
            break
        if not line:
            helpers.bulk(es, log_buffer)
            del log_buffer[0:len(log_buffer)]
            break

        if line:
            ret = parse_www(line.rstrip())
            log_buffer.append(ret)
            while ( len(log_buffer) > 2000 and len(log_buffer) % 2000 == 0 ):
                try:
                    helpers.bulk(es, log_buffer)
                except ConnectionTimeout:
                    print("try again")
                    continue
                del log_buffer[0:len(log_buffer)]
                break

        else:
            if (time.time() - startime > timeout ):
                helpers.bulk(es, log_buffer)
                start_time = time.time()
                del log_buffer[0:len(log_buffer)]
            time.sleep(1)

if __name__ == '__main__':
    get_log()

和 Perl、Ruby 的客户端不同，Python 的客户端只支持两种 transport 方式，urllib3 或者 thrift。也就是说，木有像事件驱动啊之类的办法。

测试一下，这个脚本如果不发送数据，一秒处理日志条数在15k，发送数据，一秒只有2k。确实比较让人失望，于是决定换成 pypy 试试——我司不少日志处理脚本都是用 pypy 运行的。

服务器上使用 pypy ，是通过 EPEL 安装的，之前都只用核心模块，这次需要安装 elasticsearch 模块。所以需要先给 pypy 加上 pip：

wget https://raw.github.com/pypa/pip/master/contrib/get-pip.py
pypy get-pip.py

网上大多说之前还要下载一个叫 distribute_setup.py 的脚本来运行，实测不需要，而且这个脚本的下载链接也失效了。

然后通过 pip 安装 elasticsearch 包即可：

/usr/lib64/pypy-2.0.2/bin/pip install elasticsearch

测试，pypy 比 python 处理日志速度快一倍，写 ES 速度快一半。不过 3300eps 依然很慢就是了。

测试中碰到的其他问题

可以看到脚本里已经设置了多次重试和超时重连，不过依然会收到写入超时和失败的返回，原来 Elasticsearch 默认对每个 node 做 segment merge 的时候，有磁盘保护措施，速度上限限制在 20MB/s。这在压测的时候就容易触发。

[2015-01-10 09:41:51,273][INFO ][index.engine.internal ] [node1][logstash-2015.01.10][2] now throttling indexing: numMergesInFlight=6,maxNumMerges=5

修改配置重启即可：

indices.store.throttle.type：merge
indices.store.throttle.max_bytes_per_sec：500mb

关于这个问题，ES 也有讨论：Should we lower the default merge IO throttle rate?。或许未来会有更灵活的策略。

更多 ES 性能测试和优化建议，参考：http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/indexing-performance.html

LogStash::Outputs::ElaticSearch 使用 http 协议时的内存泄露问题

2015-02-10T00:00:00+00:00

Logstash 早年有三种不同的插件写数据到 Elasticsearch 中，分别采用 node，http 和 river 方式。从 1.4 版本以后，在重构的 LogStash::Outputs::ElasticSearch 插件中，通过 protocol 参数，完成了对多种方式的整合。其中，node 和 transport 方式，都是调用 Java 库的 API，而 http 方式，则调用的 REST API。

在 Elasticsearch 集群和 Logstash 集群不在一个网段的时候，一般都只能采用 REST API 写数据。而且根据测试情况，采用 http 方式的写入性能，也要稍微高过 node 方式，所以，我一直都推荐采用这种方式。不过随着系统的长期运行，却发现日志流转总是不太顺畅，实际写入 Elasticsearch 的数据慢慢的就会越来越少。因为 Logstash 本身内部并无缓存机制，所以比较难判断到底是哪步出了问题——甚至可能就是 Elasticsearch 在高负载情况下就写不动？

和 childe 聊了一下携程采用 transport 方式运行的情况，发现他们的 Elasticsearch 集群没有出现过类似越写越少的情况。把 logstash 的配置改成写文件，也一直没有再出现堵塞消息队列的情况。问题就此锁定在 logstash 写数据的 http 过程中。

进到源码目录里阅读相关代码，发现在 build_client 方法里有很有趣的一段注释：

Use FTW to do indexing requests, for now, until we

can identify and resolve performance problems of elasticsearch-ruby

这个好玩了。因为我在两年前用过官方出的 elasticsearch 的 Perl 客户端库，性能是非常不错的。怎么 Ruby 库会这么被嫌弃？

于是又切换到当前最新的 1.5.0beta1 版本看看这块是怎么处理的。最新版已经放弃了作者自己的 FTW 库，用上了官方的 Ruby 库，具体传输层用的是 JRuby 专有的 Manticore 库。

然后又发现 github 上几个相关的 issue：

所以问题很明确了，logstash-1.4.2 依赖的 ftw-0.0.39，有内存泄露问题。logstash 开发者在去年十一月升级了 ftw-0.0.40 解决这个问题，但是 logstash-1.4 那时候已经没有 release 计划了…… 差不多同时间，LogStash::Outputs::ElasticSearch 更换了底层 HTTP 依赖库为性能跟 FTW 相近的 Manticore，并且在前些天随 1.5.0beta1 版本发布。

升级成 1.5.0beta1 后，测试运行几天，Elasticsearch 的写入数据量一直没有下降。可以认定问题解决。

Logstash-1.5 和 Logstash-1.4 在 plugin API 方面没有什么变化，有写自己 plugin 的童鞋不用太过担心，可以放心测试然后升级使用。我目前发现的唯一一个变化就是：Logstash-1.5 改用 jackson 库替代原生 json 库了。所以原先可以直接：

    parsed = JSON.parse(msg)

现在应该通过 logstash 内部方式调用：

    require 'logstash/json'
    parsed = LogStash::Json.load(msg)

JRuby 调用 maxmind-java 测试

2015-01-22T00:00:00+00:00

GeoIP 是一个非常有用的信息，也是使用 ELKstack 时一般都会加上的过滤器插件。不过 geoip 插件的性能，有些时候却会成为整个系统的瓶颈。另一个问题，则是 GeoIP 数据文件的准确度，在国内比较头疼。即使你有一个自己处理出来的准确度较高的 IP 库，GeoIP 也没有提供现成的修改数据文件内容的工具。这个时候，MaxMind 公司的 GeoIP2 就进入我的视线了。

GeoIP2 在字段上比 GeoIP 更丰富。而且还提供了 MaxMind::DB::Writer 库方便使用者自己生成 GeoIP2 数据文件！感谢@纯白色燃烧童鞋用自己的 CPAN 库成功倒逼 MaxMind 公司。

据@纯白色燃烧介绍，GeoIP2 比 GeoIP 有六到七倍的性能提升。不过他是在 C 平台下，使用 libmaxminddb 库做的测试，而 logstash 是 JRuby 平台，所以我们需要的是验证如何在 JRuby 上使用 GeoIP2，以及跟 GeoIP 的性能对比。

在 JRuby 上用模块，有两种方式，一种是纯 Ruby 实现，一种是纯 Java 实现。MaxMind 提供了纯 Java 实现，社区另外有一个纯 Ruby 实现的库。下面开始测试。

准备工作

首先需要准备环境。安装 JRuby，纯 Ruby 实现的 maxminddb 库；然后下载 GeoIP2 数据文件，下载 Java 实现的 MaxMind-Java 库。

sudo port install jruby
sudo jgem install maxminddb
wget https://geolite.maxmind.com/download/geoip/database/GeoLite2-City.mmdb.gz
gzip -d GeoLite2-City.mmdb.gz
wget https://github.com/maxmind/GeoIP2-java/releases/download/v2.1.0/geoip2-2.1.0-with-dependencies.zip
unzip geoip2-2.1.0-with-dependencies.zip

测试程序

准备就绪，然后就是如何测试的问题了。为了贴近 logstash 运行环境，我扒拉了一下 logstash 最核心的 pipeline.rb 文件，简化出来了一个测试程序。相当于是 logstash -w 20 -e 'input {generator {}} filter {geoip{}} output {null{}} 的效果：

#!/usr/bin/env jruby
require "geoip"
require "maxminddb"
require "thread"
require "java"

# 测试数据
ip = '202.106.0.20'

# 加载 maxmind-java 的所有 jar 包
Dir["/Users/raochenlin/geoip2-2.1.0/lib/*.jar"].each { |jar| require jar }

# 导入关键性的 java 类
import com.maxmind.geoip2.DatabaseReader
import java.net.InetAddress
# 这个原生的 java 写法是：
#   File database = new File("/Users/raochenlin/GeoLite2-City.mmdb")
#   DatabaseReader reader = new DatabaseReader.Builder(database).build()
# 之前对 java 不太懂，想直接 import Builder 进来
# 其实 Builder 是DatabaseReader 类里的静态类(public final static class)，不能直接 import
database = java.io.File.new("/Users/raochenlin/GeoLite2-City.mmdb")
@reader = DatabaseReader::Builder.new(database).build()

# 纯 Ruby 实现的库
@db = MaxMindDB.new('/Users/raochenlin/GeoLite2-City.mmdb')

# 老的 GeoIP 库，需要制定不同的数据文件类型，这部分直接抄自 logstash 源码
@geo = GeoIP.new('/Users/raochenlin/Downloads/logstash-1.4.2/vendor/geoip/GeoLiteCity.dat')
@geoip_type = case @geo.database_type
when GeoIP::GEOIP_CITY_EDITION_REV0, GeoIP::GEOIP_CITY_EDITION_REV1
  :city
when GeoIP::GEOIP_COUNTRY_EDITION
  :country
when GeoIP::GEOIP_ASNUM_EDITION
  :asn
when GeoIP::GEOIP_ISP_EDITION, GeoIP::GEOIP_ORG_EDITION
  :isp
else
  raise RuntimeException.new "This GeoIP database is not currently supported"
end

# 开始 logstash 流程
# 创建从 input 到 filter 的缓冲队列，固定大小 20
# SizedQueue 是 thread 库导入的
@input_to_filter = SizedQueue.new(20)

# 具体的 geoip 过滤器线程
def geoworker
    begin
        while true
            ip = @input_to_filter.pop

# GeoIP 查询方法
#            data = @geo.send(@geoip_type, ip)
#            puts data.to_hash[:city_name]

# MaxMind-java 查询方法，注意传入的是 InetAddress 对象
            data = @reader.city(InetAddress.getByName(ip))
#            puts data.getCountry().getName()

# maxminddb 查询方法
#            data = @db.lookup(ip)
#            puts data.country.name
        end
    end
end

# 定义 input 线程，传入一百万次 IP 到缓冲队列
lines_num = 1000000
input = Thread.new do
    lines_num.times.each do |i|
        @input_to_filter.push(ip)
    end
# IP 发送完毕，计算每秒处理的速率
    end_time = Time.now.to_f * 1000
    puts lines_num * 1000 / (end_time - @start_time)
end

# 定义 filter 线程，启动 20 个
arr = 20.times.collect do
    Thread.new do
        geoworker
    end
end

# 记录开始时间，运行定义好的各线程
@start_time = Time.now.to_f * 1000
input.join
arr.each{|t| t.join}

测试结果

在一百万次查询的测试中，结果如下：

geoip worker 的查询 qps 是：6038.902610617599
maxminddb worker 的查询 qps 是：4621.093443130513
maxmind-java worker 的查询 qps 是：27943.88867154753

可见，对于这部分有性能要求的，完全可以改用 maxmind-java 库，可以数倍提高。

扩展 Zabbix Web 页面功能

2015-01-21T00:00:00+00:00

zabbix 是目前非常流行的一个开源监控系统。虽然核心代码是 C 的，却通过 PHP 的 web 端提供了非常方便的界面和 RPC 接口。可以看到很多讲如何通过 RPC 接口自动化 zabbix 操作的文章。不过，如果你想做的事情正好没有现成的接口或者界面，怎么办呢？这时候就感谢 zabbix 的后端是用的 MySQL 数据库了，这意味着我们可以很方便的扩展 Zabbix 页面和接口的功能。

打个比方：我们一般都会按照 hostgroup 给某个 item 做一个 summary 汇总，然后针对 summary 的值来做报警。但是收到报警的时候，怎么能快速的知道这个 group 里是哪些 host 情况相对更严重呢？

zabbix 页面和接口，都没有提供这种信息查看方式。所以，我们需要自动动手，实现这个功能。

@南非蜘蛛的 zatree 项目，解决了跟这个类似的问题。它的着手点是：针对 hostgroup 查看 graph，通过 graph 完成肉眼查看对比和 item 值的排序。但是，单个 graph 上可能就需要加载很多 item 信息。在 hostgroup 较大，或者单 host 监控项较多的情况下，zatree 直接就因为获取过多信息得不到 MySQL 响应变得无法正常访问了。

我的思路是：

获取 hostgroup 列表供选择；
根据选择的 hostgroup 获取 item 列表；
根据选择的 hostgroup 和 item 获取全部 host 的 lastvalue 并排序；
排序后的 host 应该提供 history 的 graph 查看链接；
尽可能借用 zabbix-web 的界面。

这其中的第 1、3 步都是有现成的 API 的，直接用 hostgroup.get 和 item.get 即可。主要说说第 2、5 步。

新增 API

前面说了，API 扩展其实就是通过 MySQL 操作完成。这里通过已知 groupid 获取 item 列表，放到 MySQL 里其实就是一行 select 语句：SELECT DISTINCT key_ FROM items WHERE hostid IN (SELECT hostid FROM hosts_groups WHERE groupid='1');。

而要实现在界面上，最简单的方式，参考 include/items.inc.php 里的 get_item_by_hostid 方法，可以定义函数如下：

function get_items_by_groupid($groupid) {
        $items = array();
        $sql = 'SELECT DISTINCT key_ FROM items WHERE hostid IN (' .
                       'SELECT hostid FROM hosts_groups WHERE groupid=' . zbx_dbstr($groupid) .
                       ')';
        $db_items = DBselect($sql);
        while ($item = DBfetch($db_items)) {
                array_push($items, $item['key_']);
        }
        return $items;
}

这就可用了。

不过这个函数你只能在 require 了 items.inc.php 的 PHP 页面里使用，不能暴露成 RPC 接口。

修改为 RPC 接口

首先要简介一下 zabbix 的 RPC 接口是怎么传递的：

api_jsonrpc.php
|-> api/rpc/class.cjsonrpc.php
    |-> api/rpc/class.czbxrpc.php
        |-> include/classes/api/API.php

在 API.php 中，通过 getObjectClassName 方法，在本文件里的 $classMap 获取对象的类名。

所以，添加一个接口，分为几步：

实现新的类；
在 API.php 的 $classMap 里添加对应键值对；
在 API.php 中添加返回对应类的方法(这步是为了能在其他代码里用 API::Item() 这样的调用方式)。

好，第一步，创建 api/classes/CItemByGroup.php 文件，内容如下：

<?php
class CItemByGroup extends CZBXAPI {
        public function get($groupid) {
                $items = array();
                $sql = 'SELECT DISTINCT key_ FROM items WHERE hostid IN (' .
                               'SELECT hostid FROM hosts_groups WHERE groupid=' . zbx_dbstr($groupid) .
                               ')';
                $db_items = DBselect($sql);
                while ($item = DBfetch($db_items)) {
                        array_push($items, $item['key_']);
                }
                return $items;
        }
}

第二步，添加 $classMap 键值对，内容如下：

    'itembygroup' => 'CItemByGroup',

第三步，添加对应方法，内容如下：

        /**
         * @return CItemByGroup
         */
        public static function ItemByGroup() {
                return self::getObject('itembygroup');
        }

这样，之前页面中直接使用 get_items_by_groupid($groupid) 的代码，就可以改写成：

$items = API::ItemByGroup()->get($groupid);

而在其他程序里，则可以用过 itembygroup.get 这个 RPC 接口获取相同结果了。

Zabbix Web 的布局和各种 helper 函数

zatree 项目中完全自己写了整个页面，所以像授权啊、返回其他页啊都比较麻烦。所以我们尽量了解一下 zabbix web 本身是怎么写的页面，把数据融合到整体风格里面去。

其实 zabbix web 页面布局非常简单。主要分为三部分：

include/page_header.php
new CWidget
include/page_footer.php

header 和 footer 是很顾名思义的。不过 page_header.php 里，通过 include/menu.inc.php 的 zbx_construct_menu() 方法，会校验访问者的权限。

新增页面授权

menu.inc.php 也很简单，跟前面 api 类似，也是一个大变量来控制菜单和页面的权限，这个变量叫 $ZBX_MENU。$ZBX_MENU 数组存放的，就是 zabbix web 顶部菜单大家看到的那几个标签，Monitoring、Report 等等。如果打算把页面加在顶部菜单上，那么就直接添加一个元素到 $ZBX_MENU 数组，如下：

        'sort' => array(
                'label'                 => _('Sort'),
                'user_type'             => USER_TYPE_ZABBIX_USER,
                'default_page_id'       => 0,
                'force_disable_all_nodes'=> true,
                'pages' => array(
                        array(
                                'url' => 'sort.php','label' => _('Sort')
                        )
                )
         ),

如果打算加到到次级菜单，比如放到 Monitoring 下面，那么找到 view 元素(其 label 为 “Monitoring”)，在其 pages 数组里加上即可：

                'pages' => array(
			...
                        array(
                                'url' => 'sort.php',
                                'label' => _('Sort'),
                        )
                )
        ),

CWidget 及其他组件

zabbix 虽然没有使用特别明确的 MVC 框架，倒也不用大家到处自己去拼接输出 HTML 代码，它已经实现了很多 helper 函数。

比如：

group 和 item 的选择器，可以用 CComboBox() 生成；
页面交互的表单，可以用 CForm() 生成；
数据展示的表格，可以用 CTableInfo() 生成；
history graph 的链接，可以用 CLink() 生成；

然后，CTableInfo() 可以 ->addRow()；CForm()、 CComboBox() 和 CWidget() 都可以 ->addItem()。

把各种元素都添加到 CWidget 里以后，调用 ->show() 方法即可。

此外，还提供有 check_fields, get_request, validate_sort_and_sortorder, getPageSortOrder, make_sorting_header 和 order_result 等方法帮助处理请求参数和数据表格展示。

最后效果如下：

给 Kibana3 添加脚本化字段支持

2015-01-06T00:00:00+00:00

Kibana4 中确实有不少让人眼前一亮的新特性，但是整体框架和使用思路上的重构实在让人较难上手。所以，把一些有需要的特性，port 回目前更稳定的 Kibana3 就有必要了。好在去年在自己 fork 中已经做了很多铺垫，包括一些基础库的版本更新。这些特性基本都只需要几行代码的变动就可以实现。

从上次写博客介绍的 uniq histogram 去重统计功能后，这段时间又添加了两个功能。

table 的数据导出

kibana3 已经带有 filesaver.js，所以加一个 exportAsCsv 函数即可。要点在于怎么给 table panel 右上角那排小按钮加上一个新图标。

我之前说过，kibana3 代码划分的很细致，每个 panel 都固定只需要提供 editor.html，module.html，module.js 三个文件即可。panel 本身的框架，是不用关心的。因为这部分代码，在 app/directives/kibanaPanel.js 中。这次我们想修改 panel 外围的样式，就需要来看这个的代码了。最关键的部分在这里：

            '<span ng-repeat="task in panelMeta.modals" class="row-button extra" ng-show="task.show">' +
              '<span bs-modal="task.partial" class="pointer"><i ' +
                'bs-tooltip="task.description" ng-class="task.icon" class="pointer"></i></span>'+
            '</span>' +

也就是说，它会读取你在 module.js 里定义的 $scope.panelMeta.modals 数组，然后依次显示。那么就好办了，在我们 table/module.js 里定义下就好了：

     $scope.panelMeta = {
       modals : [
         {
          description: "Export",
          icon: "icon-download-alt",
          partial: "app/panels/table/export.html",
          show: $scope.panel.exportable
        },

为了跟其他的比如 inspector, editor 图标行为一致，这里又新增了一个 $scope.panel.exportable 变量。而这也带来一个问题：之前已经存在的 dashboard，他们的 schema 里是没有这个变量的，所以即便使用带有这个特性的 kibana 打开老 dashboard，依然看不到导出按钮。这时候，可以手动修改一下 schema 的 JSON 内容，添加上一行 "exportable": true，也可以点击 panel 上的 dup 复制按钮，复制出来的 panel 会读取默认变量设置，就会出现导出按钮了。然后删掉原 panel ，保存 dashboard 即可。

注意：导出的数据只是 table 里的内容，这只是一个 js 功能。不要把它理解成调用 scroll API 获取 Elasticsearch 集群里的全部数据。

scriptField 聚合

Kibana4beta3 的另一个重要特性，是可以预定义一段 script 为 scriptedField，然后在搜索、聚合的时候可以当做普通 field 一样使用这个 scriptedField。示例见官方博客说明(可以直接看我的翻译)。至于 script 本身能在 Elasticsearch 里做些什么，之前博客里也写过两个小示例。

动态 script 功能在 ES 1.4 之前是因为安全问题被建议关闭的。1.4 开始加入了沙箱功能，才这么大胆的使用。

我印象中 script field 应该是不能保存在 mapping 里的，于是稍微看了一下 kibana4 的代码，疑似是另外用一个索引来存储这个信息。不确保是这样，kibana4 的代码比 kibana3 难懂多了。

kibana3 整个界面结构跟 kibana4 不一样，没有单独的字段管理页面，而是通过 app/services/fields.js 提供了 fields.list 在各个 panel 的 editor.html 里做 bs-typeahead。所以，如果完整的思路 port 回来，应该是写一个 app/services/scriptFields.js 来提供 scriptedField 的增删改查，然后还要自己写个页面来提供操作界面。

作为页面手残党，我迅速决定放弃这个思路，选择一个更简单的方式来完成类似目的：直接在最常用的 terms panel 里提供输入 script 字符串的功能，反正每个 dashboard 最后会固化成 JSON 的。而且其他 panel 应该不太会用到这个功能(如果要在 table 里也实现，改动又稍大了。Kibana4 里我猜测应该是直接返回勾选的 fields，这个接口是支持 script 的；Kibana3 里则是返回全部字段，然后在 js 里完成的表格字段选择性展示)。

terms panel 中对类似情况就有示例在。这里本是有个 tmode 参数，用来选择是用 termsFacet 还是 termstatsFacet API。照葫芦画瓢，我新加了一个 fmode 参数，用来选择是普通字段(“normal”)还是脚本字段(“script”)：

      <div class="editor-option" ng-show="panel.fmode == 'script'">
        <label class="small">ScriptField</label>
        <input type="text" class="input-large" ng-model="panel.script" ng-change="set_refresh(true)">
      </div>

然后在生成 request 的时候，做一下判断：

        if($scope.panel.fmode === 'script') {
          terms_facet.scriptField($scope.panel.script)
        }

这就 OK 了~

接下来另一个难点：terms panel 是支持点击生成 filtering 过滤条件的。

显然 filtering 里没有 script 的支持。filtering 的功能都出自 app/services/filterSrv.js 服务。其中 toEjsObj 方法调用不同的 Elastic.js 的 Filter 方法。在这里面可以看到原本 terms 的是怎么生成的：

      case 'terms':
        return ejs.TermsFilter(filter.field,filter.value);

那么我就添加一个：

     case 'script':
        return ejs.ScriptFilter(filter.script);

filterSrv 支持搞定。最后一步，就是返回 terms panel 的 module.js 里完成调用。过一遍 click 关键字很容易找到 build_search 方法。其中原先是这么生成过滤的：

      if(_.isUndefined(term.meta)) {
         filterSrv.set({type:'terms',field:$scope.field,value:term.label,
           mandate:(negate ? 'mustNot':'must')});

那么在这个前面判断一下：

      if($scope.panel.fmode === 'script') {
        filterSrv.set({type:'script',script:$scope.panel.script + ' == \"' + term.label + '\"',
          mandate:(negate ? 'mustNot':'must')});
      } else if(_.isUndefined(term.meta)) {

大功告成！

2014 年度个人总结

2014-12-26T00:00:00+00:00

又到一年底，总结个人业绩和得失的时候了。于我个人而言，2014 年真是精彩纷呈。

说说写作

首先，4 月份我写的《网站运维技术与实践》面市。开卖之前，有好心的朋友叮嘱说，万一碰到在网店评论区捣乱的，千万不要理会。不过半年多过去，似乎最差的评论也只是说章节名字取得太烂。这点真心承认，尤其是第一章，各小节标题直接就是各种 linux 命令，偏巧一般网上目录介绍默认就只显示最前面一点而不是展开全部目录的，第一眼看过去就好像本书是一本命令大全！

第一次写书，留下几个遗憾。第一，忘了写致谢！第二，章节的安排次序在我心中其实是有一个完整的先后逻辑的，然而我竟然忘记在前言中讲明。直到半年后有人问及为什么没有说说一个产品交付运维的完整流程应该如何，我回答说：看书目录的次序就是了。

好在销量据说尚可，这应该让我有机会在第二版中弥补。

为此书写的《西江月》最后是印在了封底内页，或许第二版，我给每章写一句诗做副标题？

其次，跟刘宇、长元、春生一起翻译的《Puppet Cookbook》应该也快面市了。一本 200 页的小书，编辑也忍耐我们这么多人来打酱油，呼呼~ Puppet 本身是一个到处都有新矿可挖的生态圈。曾经有同事看过刘宇的《Puppet 实战》和我的《网站运维技术与实践》Puppet 章节后说：你写的 puppet 跟刘宇的完全不一样的技术点，完全可以叫《Another Puppet 实战》。那么，现在大家有福了，这本翻译的 cookbook 内容大多又是我们两个之前没覆盖到的，可算是《Yet Another Puppet 实战》。

在这两个之外，还在 gitbook.com 上写了两本电子书，是关于实时大数据处理 ELKstack 的。稍后再单独说。

技术写作这件事情，本身在圈内就很有争议。比如左耳朵耗子就多次明嘲暗贬。我还是觉得，抛开赚钱的话题(其实就是根本不赚钱，一本书稿费还不抵作者半个月薪水呢)，认认真真给自己的技术归纳体系，列目录，写总结，完善用例，深挖根源，一般情况下绝对是很难真的动手而且万难坚持下来的事情。一旦你决定要写成“书”而不是散落的“文本”，各方面的压力就从此变成动力。

突然想起来这段感慨在去年应该就写过了……因为《网站运维技术与实践》其实在去年秋天就完稿的。

读书

之前听过一句话：读书学习是性价比最高的个人投资。如果说之前我还习惯看 pdf 的话，随着自己拿到第一笔也是目前为止唯一一笔稿费，深刻感受到作者们辛苦劳动的不值钱，现在已经很主动的买书了。今年一共买了《Go 语言程序设计》《预测背后的逻辑》《机器学习实践指南》《金融时间序列分析》《时间序列预测实践教程》《Python 自动化运维》《日志管理与分析权威指南》《链接》《失控》《Time Management for System Administrators》《黑天鹅》《反脆弱》十二本纸质书，《神经漫游者》《追风筝的人》《汉语词律学》《汉语韵律词研究》四本电子书，借阅了《Splunk 大数据分析》《Docker 技术入门与实践》《Go 语言编程》三本书，受赠《深度解析SDN: 利益、战略、技术、实践》《设计之下: 搜狐新闻客户端的用户体验设计》《MacTalk 人生元编程》《互联网创业密码》《Zabbix 监控系统深度实践》《进化: 我们在互联网上奋斗的故事》《单页 Web 应用: JavaScript 从前端到后端》《Elasticsearch Server》《Puppet Cookbook》九本书。

合计二十八本，看完十二本，占 42.8%。明年希望尽力提高买书的有效利用率~

工作和生活

5 月去了苏州旅游。作为一个婚假都忘了休的人，这真是一次美好的记忆。原先计划要跑遍长三角，结果看着苏州园林，听着吴侬软语，吃着生煎，就挪不动步子，彻彻底底在苏州呆完了整个假期。现在一边写着这份总结，一边又想起昆曲博物馆里坐我左手边的那个台湾老教授，想起虎丘山门外林立的名家碑文。这是怎样一种奢侈。

7 月换了份工作到新浪。新浪的面试官是惯来喜欢砸人的，于是我先前在一家公司呆久了，就会先找个新浪的面试，被砸一砸，然后回去就可以安心的继续工作或者研究。不料这次真的进新浪了，开始了我“砸”别人的日子……

9 月是最紧张的时候，丢掉之前各种规划，接手一个没有测试报告，没有设计文档，没有运行状态，只有“又不行了”的日志系统。老妈正好这个月来北京，于是一边想着不能让老妈觉得我其实一直这么苦逼的拼命啊，一边半夜三点回家……

这破烂状态虽然现在结束了，但是手头已有和要有的这摊子事情，依然都是没测试没设计没文档的状态，真心要吐槽，一点“大公司”的感觉都没有啊。

社区活动

4 月 CSDN 邀请了 Larry Wall 来中国。对于 Perl 程序员简直是再幸福不过了。好玩的是教主在我的大骆驼书上签名时划破了那页纸，于是他拿起他的大骆驼印章，给那页上一口气按了十多个骆驼==！

12 月，主动提起应该继续 PerlChina 的 Advent 活动，在 fayland 的帮助下，搭建了 http://advent.perl-china.com 网站，而且 24 篇 gift 我写了 11 篇。还是那句话，坚持是最大的困难……

同样在坚持的，还有 @perldaily 这个微博号，一年来每周的 perlweekly、rubyweekly、devopsweekly，都坚持阅读，并且挑选转发到微博上。12 月更是同时阅读着每天的 perladvent、perl6advent、catalystadvent、danceradvent、perladvent.kr、perladvent.jp、rubyadvent、goadvent、sysadvent、performanceadvent，并且转发到微博。

技术动态

docker

年初的时候跟着去年下半年的惯性，还是很积极的跟踪尝试 docker 来着。包括用 docker 做了一个类似 JSFiddle 的 Perl 在线代码调试工具。唯一的问题就是 fork 炸弹，然后靠 ulimit 启动解决。

稍后还参加了第一次 docker beijing meetup。差不多时间接赵鹏的邀请试用了一把他的 visualops，转身自己用开源的 diagramo 试了试如何在页面拖动服务器图标生成 fig.yml 配置。不过玩起来好搞，搞成产品，那就难了，visualops 做的是真到位，赞！

docker 的故事就到这里，之后就没机会再参与了。

perl

模仿 serverspec 工具写了 Rex::Test::Spec 模块，结果被 rex 项目作者邀请加入了 RexOps 开发组。不过实话是 Perl 确实现在式微，2013 年，Rex 跟 Saltstack、Ansible 感觉都是差不多的小众产品，到今年，后二者风头正劲，无数人开始问“salt 跟 puppet 哪个好啊”的问题。公司内部也没有 Perl 氛围，我也就保持着自己个人使用，懒得推广了。

另一个一直在保持跟踪的是 Perl6。测试过用 Perl6 写 Puppet 的 ENC 脚本，还为此去修复了 Perl6 版本的 YAML::Dump 模块。测试过用 Perl6 如何做并发编程，了解了 Promise、Supply 等概念。但愿教主和 jnthn 能在明年解决一定的性能问题，发布 6.0 版吧……

今年还订阅了 Perl5Porter 的邮件组，看着 Perl5 开发者们是如何维护 Perl5 代码的。跟昨天 Larry Wall 发表在 Perl6 Advent 上的想法真是出奇的一致：Perl 是一个健全的城市，不需要五年计划，有人愿意盖房子，市议会负责别让他影响其他人就够了。就在这个思想的指导下，今年 5 月发的 Perl5 version 20 加上了 sub signature，实现者是今年 2 月份才提出自己要做的；而下半年突然出现的俄罗斯大神则提出要给 Perl5 的 OOP 性能提高一倍，然后看着 P5P 的人一步一步教他怎么用 git，怎么拆分他的大 patch 成一个一个 commit 和 test，让人无比期待明年的 Perl5 version 22 了。

ELKstack

ELKstack 在今年占据了我大量的精力，从博客中就可以看到。2014 年，一共发了 64 篇博客，标记为 ELK 相关的有 27 篇，接近一半。

ES 公司从今年 4 月开始停止了 Kibana3 的开发，专门去做 Kibana4 的重构工作，至今还没发布正式版。在这大半年的空档期内，我在自己的 fork 仓库里，新增了 11 项功能，替换 Facet 为 Aggr 接口，百分比统计、区间分布统计、去重数据走势、高德地图、请求生成器、阈值通知、数值统计值地图、单图表引用、表单导出等等。还提供了社区最完整的验证授权代理功能。目前收到了 40 个 star。

去年底建的 QQ 群，到目前有接近 400 人加入。尤其开心的，这让我发现 ELK 的使用者，很多是开发工程师、安全工程师。这种交叉领域的聊天非常舒服，给人启发。当然要感谢携程的几位朋友，wood 童鞋老早在群里公开自己的十亿级用例的 ppt，也是官网文档的活字典，childe 童鞋最早开始写 statisictrend panel，没他吃螃蟹在先，我可能还想不到自己动手做 kibana 去。

QQ 群里经常出现的重复问题，也触发我最终选择在 gitbook.com 上写电子书。很遗憾 ELK 还不够火，所以单独写纸质书的可能性是微乎其微了，好在 gitbook 的使用感觉还不错，需要吐槽的就是定价只能涨不能降这个设定，此外，不凑够 $50 不能取现，不取现不能删除书籍也让我头疼不已，我真的不是有意给自己电子书设置价格的。

两本书的 markdown 源码都发在了 github 上托管。分别有 82 和 34 个 star。此外，还收到了共计 573.87 元支付宝打赏。然后我花了其中两百多去买了一个很有意思的域名：kibana.logstash.es。哈哈~

ELK 本身的讨论和思考，年终总结里就不再啰嗦了，基本都写在电子书里，欢迎大家阅读、点赞和打赏……

10 月，medcl 主办了 ES 中国的第三次大会，也是第一届正式的大会(突然有第 24 次第一届搞笑诺贝尔奖即视感)。应该有 200 人到会场。我做了《{{More}} Kibana》的分享。认识了几位演讲嘉宾，一个赛一个的年轻，全都是 85 后。

11 月，长元离京前的 Puppet 群组 8 人小聚会上，分享 ELK 概念和演示常见配置用法。

12 月，Beijing.pm 例行月度 7 人小聚会上，分享 ELK 概念和演示常见配置用法。

加上明年 1 月准备在火龙果上做的 ELK 分享。这会是连续 4 个月在外分享 ELKstack 了。这或许又会是一种坚持？看看明年 2 月以后还有没有机会继续吧……

【翻译】Kibana 4 beta 3 发布，重新支持过滤器

2014-12-19T00:00:00+00:00

本文是 Elasticsearch 官方博客内容，原文地址：http://www.elasticsearch.org/blog/kibana-4-beta-3-now-more-filtery/

Kibana 4 Beta 3 出来啦! 我们依然给你机会直接下载 Kibana 4 Beta 3。不过还是要建议你阅读本文对主要特性的讲解。嗯，先暂停一下下载，开始阅读吧！

交互式图表和仪表盘

过滤器回到了仪表盘上，也可以在单个可视化页上使用了！柱状图、点图、饼图都可以通过点击的方式创建可切换的过滤器。我们还添加了一些函数来操作所有的过滤器，这样你可以一键切换整个过滤效果。

脚本化字段

Kibana 现在支持 Elasticsearch 脚本了！不单是可以写脚本，还可以给它命名，并且在应用中跟用普通字段一样调用你取的名字。创建一个脚本化字段，这个字段就像本来就存在一样的显示在你的 Kibana 文档里了。唯一需要注意的是，脚本毕竟不是 Elasticsearch 索引的内容，你不能在这个字段里进行搜索。

你可以用脚本来连接多个字段，或者在数值字段上做运算，然后把结果导入可视化页里。为了帮助你上手，我们在脚本化字段屏下添加了一个标题叫“从时间字段创建的示例”的连接。你可以在设置(Settings)标签页的索引(Index)区域里找到这个连接。选择或者创建一个索引表达式，然后点击“脚本化字段(Scripted Fields)”标签。

做完这些以后，你就可以在聚合页里找到一些新的数值字段可用。比如说，我们可以查一天的 24 个小时，然后获取 30 天来每个小时的 hits 数的总和：

高亮和 _source 的新格式

JSON 很棒，我们都爱 JSON。谁会不爱 JSON 呢？XML，这是谁？完全无关紧要嘛。

JSON 在查看上可能有点乱，所以我们对格式做了一点优化。原始的 JSON 内容，当然可以在点击 JSON 标签展开事件后查看。Kibana 现在还会自动高亮匹配上的字段，甚至把他们挪到本行开头的位置展示：

hit 连接

可能你已经注意到前面截屏上的 “Link to..” ? 你可能不需要分享整个可视化结果或者一个搜索结果，你只是想让别人看到一条重要的命中的记录。现在，这事儿简单了！

metric visualization

有时候你不需要图或者文档！你只需要一个数值在仪表盘上就够了。现在可以做到了：

好了，就是这些！还是那句话，到 GitHub 上给我们提问题，建议，贡献。或者，如果你跟我们一样喜欢 IRC，加入我们在 Freenode 上的 #kibana 频道。

Kibana 中几个不同的 filtering

2014-12-08T00:00:00+00:00

用过 kibana 的都知道，kibana 的图表上，可以直接点击某个值，就能自动添加这个过滤条件到 filtering 里，然后整个 dashboard 上所有的图表都会刷新成在这个过滤条件下的新状态。但是如果你要想自己手动添加 filtering 的时候，就会发现，自己添加的，写法好像跟自动生成的长得不太一样。

而今天，我在同事的提醒下，发现更进一步的情况，即使都是通过点击图表添加上的 filtering，其实长得也不一样，如下图：

在 histogram 面板上拖拽鼠标，生成的是 range filtering
在 terms 面板上点击某个值，生成的是 term filtering
在 table 面板左侧列表上点击某个字段，浮出的小面板里点击某个值，生成的是 query filtering
在 filtering 手工添加，生成的是 query_string filtering

这几个页面上的不同，反应在实际的请求 JSON 里又有什么区别呢？

我们可以点开面板右上角的 inspect 按钮看生成的 curl 命令。其中 filtering 部分如下：

    "filter": {
      "bool": {
        "must": [
          {
            "range": {
              "@timestamp": {
                "from": 1418009781101,
                "to": "now"
              }
            }
          },
          {
            "terms": {
              "_type": [
                "mweibo_webinf"
              ]
            }
          },
          {
            "fquery": {
              "query": {
                "query_string": {
                  "query": "host:(\"web093.mweibo.tc.sinanode.com\")"
                }
              },
              "_cache": true
            }
          },
          {
            "fquery": {
              "query": {
                "query_string": {
                  "query": "host:\"web093.mweibo.tc.sinanode.com\""
                }
              },
              "_cache": true
            }
          }
        ]
      }
    }

前面两个不出意外，都是很标准的 api 示例的样子。比较特殊的是后面两个：

第三个其实就是通过 table 左侧字段菜单点出来的，虽然通过鼠标点击操作，只可能生成一个单一的键值查询，但这里却给加上了一对小括号！这是完全没有必要的，简直可以怀疑是不是当初开发人员手抖了……

当然，并不是说这种生成完全没有用。比方说，其实你本来是打算查询来自两台机器的日志。如果没想到用括号，可能直接在 query_string 里就写 host:"web001" OR host:"web002" 了。但是在这个 query filtering 里，因为页面上已经有单独填字段的地方了。那就只用在 query 那栏写 "web001" OR "web002" 好了。

以上。不过我依然怀疑是开发人员手抖。

利用脚本灵活定制 Elasticsearch 中的聚合效果

2014-11-27T00:00:00+00:00

这几天阅读 Splunk 书，发现 Splunk 作为一个不需要提前结构化数据的处理工具，在自动发现的 “interesting fields” 以外，也提供了在页面通过正则临时产生新字段的能力。类似下面这样：

sourcetype="impl_splunk_gen"
  | rex "ip=(?P<subnet>\d+\.\d+\.\d+)\.\d+"
  | chart values(subnet) by user network

这就蛮让人流口水的了。毕竟谁也不可能保证自己在结构化的时候做到了万事俱备。不过，ELK 虽然建议大家在 logstash 里通过 grok 来预处理，其实本身也是有这个能力的。今天稍微测试了一下，通过 ES 的 scripting 模块，完全可以实现这个效果。

测试在 Elasticsearch 1.4.1 上进行。较低的版本可能在支持的语言方面稍有差异。

因为 scripting 在早先 1.2 的时候出过安全问题，所以后来就都不再允许直接通过 POST 的内容里提交 scripting 代码了。现在有两种方式，一种是在 elasticsearch-1.4.1/config/ 目录下新建一个 scripts 目录，然后把准备要用的脚本都放在这个目录里，ES 会自动探测并加载编译；另一种是开启动态 scripting 功能，再通过 /_script 接口上传脚本。

下面示例两种实现获取 client_ip 字段的 C 段的统计的方式：

通过简单的切割合并

创建 config/scripts/split.groovy 文件，内容如下：

doc[fieldname].value.split('.')[0..-2].join('.')

稍等一下，看到 ES 的日志显示探测到并且编译成功后。就可以发送请求了：

curl '127.0.0.1:9200/logstash-2014.11.27/_search?pretty&size=0' -d '{
    "aggs" : {
        "ipaddr" : {
            "terms" : {
                "script" : "split",
                "params" : {
                    "fieldname": "client_ip.raw"
                }
            }
        }
    }
}'

注意这里一定要传递是 “not_analyzed” 的字段过去！ ES 流程上是先过分词器再到 scripting 模块的，这里要是切一下，到你脚本里就不知道长啥样了……

结果如下：

{
  "took" : 30,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "failed" : 0
  },
  "hits" : {
    "total" : 786,
    "max_score" : 0.0,
    "hits" : [ ]
  },
  "aggregations" : {
    "ipaddr" : {
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [ {
        "key" : "127.0.0",
        "doc_count" : 786
      } ]
    }
  }
}

通过正则捕获

前面的方式虽然达到目的，但是不像 splunk 的做法那么通用，所以更高级的是这样：

创建 config/scripts/regex.groovy 文件，内容如下：

matcher = ( doc[fieldname].value =~ /${pattern}/ )
if (matcher.matches()) {
    matcher[0][1]
}

同样等识别编译，然后发送这样的请求：

curl '127.0.0.1:9200/logstash-2014.11.27/_search?pretty&size=0' -d '{
    "aggs" : {
        "ipaddr" : {
            "terms" : {
                "script" : "regex",
                "params" : {
                    "fieldname": "client_ip.raw",
                    "pattern": "^((?:\d{1,3}\.?){3})\.\d{1,3}$"
                }
            }
        }
    }
}'

得到一模一样的结果。

下一次试验一下在脚本中尝试加载其他库做更复杂处理的话，会如何呢？

利用动态仪表板实现kibana单图表导出功能

2014-11-23T00:00:00+00:00

昨天和朋友聊天，说监控报表的话题，他们认为 kibana 的仪表板形式，还是偏重技术人员做监控的 screen 思路，对 erp 之类的报表不是很友好。要想跟其他系统结合，或者说嵌入到其他系统中，就必须得有单个图表的导出，或者 URL 引用方式。当时我直觉上的反应，就是这个没问题，可以通过 javascript 动态仪表板这个高级功能完成。回来试了一下，比我想的稍微复杂一点点，还是可以很轻松完成的。

读过仪表板纲要一文，或者自己看过源代码中 src/app/dashboards/logstash.json 文件的人，应该都知道 kibana 中有些在页面配置界面里看不到的隐藏配置选项。其中很符合我们这次需求的，就有 editable, collapsable 等。所以，首先第一步，我们可以在自己的 panel.js(直接从 logstash.js 复制过来) 中，把这些关掉：

dashboard.rows = [
  {
    editable: false,         //不显示每行的编辑按钮
    collapsable: false,      //不显示每行的折叠按钮
    title: "Events",
    height: "400px",
    panels = [{
      editable: false,       //不显示面板的编辑按钮
      title: 'events over time',
      type: 'histogram',
      time_field: ARGS.timefield||"@timestamp",
      auto_int: true,
      span: 12
    }]
  }
];
dashboard.editable = false;     //不显示仪表板的编辑按钮
dashboard.panel_hints = false;  //不显示面板的添加按钮

然后要解决面板上方的 query 框和 filtering 框。这个同样在纲要介绍里说了，这两个特殊的面板是放在垂幕(pulldows)里的。所以，直接关掉垂幕就好了：

dashboard.pulldowns = [];

然后再往上是顶部栏。顶部栏里有时间选择器，这个跟垂幕一样是可以关掉的：

dashboard.nav = [];

好了，javascript 里可以关掉的，都已经关了。

但是运行起来，发现顶部栏里虽然是没有时间选择器和配置编辑按钮了，本身这个黑色条带和 logo 图什么的，却依然存在！这时候我想起来有时候 config.js 没写对，/_nodes 获取失败的时候，打开的页面就是背景色外加这个顶条 —— 也就是说，这部分代码是写在 index.html 里的，不受 app/dashboards/panel.js 控制。

所以这里就得去修改一下 index.html 了。不过为了保持兼容性，我这里没有直接删除顶部栏的代码，而是用了 angularjs 中很常用的 ng-show 指令：

<div ng-cloak class="navbar navbar-static-top" ng-show="dashboard.current.nav.length">

因为之前关闭时间选择器的时候，已经把这个 nav 数组定义为空了，所以只要判断一下数组长度即可。

效果如下：

因为 dashboard.services 的定义没有做修改，所以这个其实照样支持你用鼠标拉动选择时间范围，支持你在 URL 后面加上 ?query=status:404&from=1h 这样的参数，效果都是对的。只不过不会再让你看到这些文字显示在页面上了。

如果要求再高一点，其实完全可以在 ARGS 里处理更复杂的参数，比如直接 ?type=terms&field=host&value_field=requesttime 就生成 dashboard.rows[0].panels[0] 里的对应参数，达到自动控制图表类型和效果的目的。

用 phantomjs 截图

2014-11-20T00:00:00+00:00

昨儿给 kibana 加上了 table 面板数据导出成 CSV 的功能。朋友们就问了，那其他面板的图表怎么导出保存呢？其实直接截图就好了嘛……

FireFox 有插件用来截全网页图。不过如果作为定期的工作，这么搞还是比较麻烦的，需要脚本化下来。这时候就可以用上 phantomjs 软件了。phantomjs 是一个基于 webkit 引擎做的 js 脚本库。可以通过 js 程序操作 webkit 浏览器引擎，实现各种浏览器功能。

因为用了 webkit ，所以软件编译起来挺麻烦的，建议是直接从官方下载二进制包用得了。

想要给 kibana 页面截图，几行代码就够了：

var page = require('webpage').create();
var address = 'http://kibana.dip.sina.com.cn/#/dashboard/elasticsearch/h5_view';
var output = 'kibana.png';
page.viewportSize = { width: 1366, height: 600 };
page.open(address, function (status) {
    if (status !== 'success') {
        console.log('Unable to load the address!');
        phantom.exit();
    } else {
        window.setTimeout(function () {
            page.render(output);
            phantom.exit();
        }, 20000);
    }
});

这里两个要点：

要设置 viewportSize 里的宽度，否则效果会变成单个 panel 依次往下排列。
要设置 setTimeout，否则在获取完 index.html 后就直接返回了，只能看到一个大白板。用 phantomjs 截取 angularjs 这类单页 MVC 框架应用时一定要设置这个。

在 kibana 里实现去重计数

2014-11-19T00:00:00+00:00

如何在 elk 里统计或者展示去重计数，是一个持续很久的需求了。几乎每个月都会有新手提问题说：“我怎么在 kibana 里统计网站 UV 啊？”可惜这个问题的回答总是：做不到……

其实 Elasticsearch 从 1.1.0 版本开始已经可以做到去重统计了。但是 kibana3 本身是在 0.90 版本基础上实现的，所以也就没办法了。

今天抽出时间，把 histogram 面板的代码重写了一遍，用 aggregations 接口替换了 facets 接口。改造完成后，再加上去重就很容易了。

aggregations 接口最大的特点是层级关系。不过也不是可以完全随便嵌套的，原先 date_histogram facets 里的 global 参数，被拆分成了 global aggregation，但是这个 global aggregation 就强制要求必须用在顶层。所以最后 request 相关代码就变成了这个样子：

var aggr = $scope.ejs.DateHistogramAggregation(q.id);
if($scope.panel.mode === 'count') {
  aggr = aggr.field($scope.panel.time_field);
} else if($scope.panel.mode === 'uniq') {
  aggr = aggr.field($scope.panel.time_field).agg($scope.ejs.CardinalityAggregation(q.id).field($scope.panel.value_field));
} else {
  aggr = aggr.field($scope.panel.time_field).agg($scope.ejs.StatsAggregation(q.id).field($scope.panel.value_field));
}
request = request.agg(
  $scope.ejs.GlobalAggregation(q.id).agg(
    $scope.ejs.FilterAggregation(q.id).filter($scope.ejs.QueryFilter(query)).agg(
      aggr.interval(_interval)
    )
  )
).size($scope.panel.annotate.enable ? $scope.panel.annotate.size : 0);

完整的代码已经提交到 github，见 https://github.com/chenryn/kibana-authorization/commit/6cb4d28a6c610d28680fffdb81c9f6c83cfaf488

【翻译】Kibana 4 beta 2 发布

2014-11-18T00:00:00+00:00

原文地址见：http://www.elasticsearch.org/blog/kibana-4-beta-2-get-now/

哈哈哈哈哈哈哈哈哈！来啦！Kibana 4 Beta 2 现在正式雪地 360° 裸跪求调戏，包括你家喵星人都行，只要你给反馈。(译者注：ES 的发版日志越来越活泼，我也翻译的更中文化点好了)

如果你已经等不及要开动，从这里下载 Kibana 4 Beta 2，否则继续阅读下面的亮点。

除了很多小的修复和改进，这个版本里还有一些非常值得一看的新东西：

地图支持

地图回来啦，而且比过去更强大了！新的瓦片式地图可视化用上了 Elasticsearch 强大的 geohash_grid 来显示地理数据，比如可视化展示相对响应时间：

可视化选项

在 Beta 1 里，柱状图是固定成堆叠式的。在 Kibana 4 Beta 2 里，我们添加了选项让你修改可视化展示数据的方式。比如，分组柱状图：

或者百分比式柱状图：

区域图

Beta 2 里区域图也回来了，包括堆叠式和非堆叠式：

高级参数

我们目标是支持尽可能多的 Elasticsearch 特性，不过有时候我们确实还没覆盖到某个聚合选项，而你偏偏现在就要用它。这种情况下，我们引入了 JSON 输入，让你可以定义附加的聚合参数到发送的请求里。比如，你可能想在一个 terms 聚合里传递一个 shard_size，或者在一个基数聚合里调大 precision_threshold。在下面示例中，我们传了一个小脚本作为高级参数，计算 bytes 字段的 _value 的对数值，然后用它作为 X 轴：

数据表格

有时候你想要个动态图，有时候可能只想要数值就够了。数据表格可视化达成你这个愿望：

喂！我的仪表盘哪去了？

Kibana 内部使用的索引从 kibana-int 改名叫 .kibana 了。我们建议你从老索引里把文档(比如：仪表盘，设置，可视化等)都挪到新索引来。不过，你还是可以在 kibana.yml 里直接定义 kibanaIndex: "kibana-int" 的。

我们现在在做什么？

可以从 roadmap 上看到我们离 Kibana 4 正式版还有多远。另外，我们永远欢迎你在 GitHub 的反馈、bug 报告、补丁等等。

用 perl6-bench 做 perl6 性能对比

2014-10-28T00:00:00+00:00

Perl6 成员上周在奥地利大会上做了一次大聚集，写了不少博客讲过去几个月的优化以及未来几个月的优化。但是我发现似乎从8月以来就一直没有正式的 perl6-bench 的图表报告了。于是想：干脆自己跑一把吧。

perl6-bench 项目地址见：https://github.com/japhb/perl6-bench。

项目的主程序 bench 本身是用 Perl6 写的。所以运行前，得先安装好 Rakudo Star：

wget http://rakudo.org/downloads/star/rakudo-star-2014.09.tar.gz
tar zxvf rakudo-star-2014.09.tar.gz
cd rakudo-star-2014.09
perl Configure.pl --backend=moar --gen-moar

编译完成后，会在 rakudo-star 目录下创建一个 install 子目录，里面有 bin，lib 等编译完成的文件，把这个 bin 加入到你的 $PATH 里去。

sed -i 's!\(PATH=.*\)$!\1:~/download/rakudo-star-2014.09/install/bin!' ~/.bash_profile
source ~/.bash_profile

项目的测试程序 timeall 是用 Perl5 写的。运行前，也得安装几个 CPAN 模块：

cpanm Capture::Tiny Data::Alias DateTime JSON JSON::XS List::MoreUtils IPC::Run

然后就可以开始测试了：

./bench setup

这个命令会在 components 子目录下逐一 clone 下来各种可以测试的 perl6 实现的源代码 git 库，包括有：

arane   niecza  nqp-jvm   nqp-parrot  perl5    rakudo-jvm   rakudo-parrot
moarvm  nqp-js  nqp-moar  parrot      perlito  rakudo-moar

下面就开始正式测试了。用时同样会比较长，和上面 git clone 一样，都建议放在 screen 里运行。

然后设定本次测试你打算对比哪些：

export CHECKOUTS='perl5/v5.20.1 rakudo-jvm/2014.10 rakudo-moar/2014.10 rakudo-moar/2014.09'

这个写法规范是：git 库名/git tag名

然后运行：

./bench extract $CHECKOUTS

这一步会分别 checkout 具体的 tag 到同级的新目录里，然后开始编译：

./bench build   $CHECKOUTS

然后运行测试程序：

./bench time    $CHECKOUTS

一共有 65 个测试，测试项在 microbenchworks.pl 文件的大数组里定义了。

我在测试中发现，第 15/65 测试用例，在 nqp-moar 时会死循环运行，无法正常完成测试，已回报给作者。

./bench 还可以添加其他运行参数。比如 ./bech --verbose time $CHECKOUTS。注意参数必须写在 “time” 前面。这是 Perl6 的 MAIN 函数特性：

multi MAIN ('time', *@components, :$variants?, :$tests?, :$tests-tagged?,
                              :$runs?, :$enough-time?, :$min-scaling-points?,
                              Bool :$verbose?) { }

代码里用了 *@components，所有写在 “time” 后面的参数都会存入这个数组。

最后运行结果对比评分：

./bench compare $CHECKOUTS

结果显示，moar 比 jvm 领先一些，比 perl5 还差着呢：

==> perl6-bench version 997c920 (ignoring startup time and compile time)
--- showing PEAK RATE (/s), TIMES SLOWER THAN FASTEST (x), and SUMMARY SCORES (skipping incomplete data)

                                - Perl 5 -   -------------- Perl 6 --------------
                                 v5.20.1      2014.10      2014.09      2014.10  
                                   perl5       rakudo       rakudo       rakudo  
TEST                               perl5          jvm       moarvm       moarvm  
                                -------------------------------------------------
empty                                --             0/s          4/s          4/s
                                    FAIL         34.0x         1.0x         1.1x 
zero                                 --             0/s          4/s          4/s
                                    FAIL         33.3x         1.0x         1.1x 
hello                                --             0/s          4/s          4/s
                                    FAIL         33.2x         1.0x         1.1x 
while_empty                     26678545/s     223006/s    1730328/s    3403743/s
                                     1.0x       119.6x        15.4x         7.8x 
while_empty_native              26800035/s   1291144447/s   27583644/s   168949423/s
                                    48.2x         1.0x        46.8x         7.6x 
while_bind                           --        249216/s    1682441/s    3381083/s
                                    FAIL         13.6x         2.0x         1.0x 
while_concat                    13404147/s      26589/s     166714/s     206047/s
                                     1.0x       504.1x        80.4x        65.1x 
while_concat_native             13400671/s      65891/s    4138382/s    5216637/s
                                     1.0x       203.4x         3.2x         2.6x 
while_int2str                    6026835/s      57112/s     364208/s     455797/s
                                     1.0x       105.5x        16.5x        13.2x 
while_int2str_native             6283498/s     111754/s     543142/s     671402/s
                                     1.0x        56.2x        11.6x         9.4x 
while_int2str_concat             8711901/s       7006/s      89566/s      93480/s
                                     1.0x      1243.5x        97.3x        93.2x 
while_int2str_concat_native      8403097/s      13824/s     153347/s     167585/s
                                     1.0x       607.9x        54.8x        50.1x 
while_push_join                  3656434/s      15223/s      18917/s     111952/s
                                     1.0x       240.2x       193.3x        32.7x 
while_push                       7821809/s      90685/s      21289/s     239678/s
                                     1.0x        86.3x       367.4x        32.6x 
while_pushme                    14440088/s    3184098/s    1225845/s    1560029/s
                                     1.0x         4.5x        11.8x         9.3x 
while_array_set                  6171761/s     112655/s     276032/s     335751/s
                                     1.0x        54.8x        22.4x        18.4x 
while_hash_set                   1525235/s      58647/s     158810/s     171691/s
                                     1.0x        26.0x         9.6x         8.9x 
postwhile_nil                   36412794/s     515093/s    2939870/s    4147168/s
                                     1.0x        70.7x        12.4x         8.8x 
postwhile_nil_native            36083908/s   1676476937/s   34716639/s   167547820/s
                                    46.5x         1.0x        48.3x        10.0x 
loop_empty                      24051967/s     257307/s    1686547/s    3321511/s
                                     1.0x        93.5x        14.3x         7.2x 
loop_empty_native               24181034/s   2276716196/s   28050857/s   193967640/s
                                    94.2x         1.0x        81.2x        11.7x 
for_empty                       33943008/s     894886/s    2315939/s    2515590/s
                                     1.0x        37.9x        14.7x        13.5x 
for_bind                             --       1571035/s    2331450/s    2586230/s
                                    FAIL          1.6x         1.1x         1.0x 
for_assign                      17713024/s    1532922/s    2006784/s    2391570/s
                                     1.0x        11.6x         8.8x         7.4x 
for_assign_native               17765094/s    1658168/s    1895988/s    2006162/s
                                     1.0x        10.7x         9.4x         8.9x 
for_postinc                     16640609/s     386218/s    1398445/s    1802886/s
                                     1.0x        43.1x        11.9x         9.2x 
for_postinc_native              16670507/s    1037555/s    1859233/s    1994065/s
                                     1.0x        16.1x         9.0x         8.4x 
for_concat                      14998496/s      29144/s     182410/s     205988/s
                                     1.0x       514.6x        82.2x        72.8x 
for_concat_native               15053529/s      49506/s    1353377/s    1465293/s
                                     1.0x       304.1x        11.1x        10.3x 
for_concat_2                     8646049/s      15854/s     107213/s     117943/s
                                     1.0x       545.4x        80.6x        73.3x 
for_concat_2_native              8659225/s      23751/s     791213/s     986208/s
                                     1.0x       364.6x        10.9x         8.8x 
for_push                         8496867/s     122034/s      25166/s     333166/s
                                     1.0x        69.6x       337.6x        25.5x 
for_array_set                    7810807/s      57463/s     286036/s     388650/s
                                     1.0x       135.9x        27.3x        20.1x 
for_hash_set                     1567864/s      32265/s     168643/s     171446/s
                                     1.0x        48.6x         9.3x         9.1x 
reduce_range                     4964114/s     181283/s     318258/s     345797/s
                                     1.0x        27.4x        15.6x        14.4x 
reduce_int_comb_range             470778/s       1495/s       3355/s       3406/s
                                     1.0x       314.8x       140.3x       138.2x 
any_equals                       2646212/s      15684/s      61867/s      81787/s
                                     1.0x       168.7x        42.8x        32.4x 
trim_string                     13660958/s   33565139/s    9291330/s   17910365/s
                                     2.5x         1.0x         3.6x         1.9x 
split_string_constant            5615519/s     100014/s     133572/s     171231/s
                                     1.0x        56.1x        42.0x        32.8x 
split_string_regex               2017912/s       4137/s      12573/s      16553/s
                                     1.0x       487.8x       160.5x       121.9x 
charrange                         363103/s       3416/s      19831/s      24667/s
                                     1.0x       106.3x        18.3x        14.7x 
charrange_ignorecase              363529/s       3788/s      14433/s      17899/s
                                     1.0x        96.0x        25.2x        20.3x 
visit_2d_indices_while           7276084/s     152635/s     746903/s    1484712/s
                                     1.0x        47.7x         9.7x         4.9x 
visit_2d_indices_while_native   11180261/s     553619/s    1177498/s    1451682/s
                                     1.0x        20.2x         9.5x         7.7x 
visit_2d_indices_loop           10123295/s     177783/s     834515/s    1843586/s
                                     1.0x        56.9x        12.1x         5.5x 
visit_2d_indices_loop_native    12457926/s   440172780/s    1227550/s    1431680/s
                                    35.3x         1.0x       358.6x       307.5x 
visit_2d_indices_for             8548538/s     255887/s     675743/s     847728/s
                                     1.0x        33.4x        12.7x        10.1x 
visit_2d_indices_cross           1367865/s       4685/s      31407/s      40470/s
                                     1.0x       292.0x        43.6x        33.8x 
create_and_copy_2d_grid_cross     541914/s       2230/s      11564/s      13778/s
                                     1.0x       243.0x        46.9x        39.3x 
create_and_iterate_hash_kv           --          1564/s      12248/s      12651/s
                                    FAIL          8.1x         1.0x         1.0x 
rat_mul_div_cancel                  7439/s       4852/s      33910/s      40614/s
                                     5.5x         8.4x         1.2x         1.0x 
rat_harmonic                        1080/s       1732/s      11089/s      11678/s
                                    10.8x         6.7x         1.1x         1.0x 
rand                            10885068/s     230938/s     183511/s     213786/s
                                     1.0x        47.1x        59.3x        50.9x 
array_set_xx                    13585287/s    1533694/s     545243/s     597926/s
                                     1.0x         8.9x        24.9x        22.7x 
parse-json                            23/s          1/s          1/s          1/s
                                     1.0x        29.6x        37.0x        22.8x 
parse-json-no-obj-creation           --             1/s          1/s          1/s
                                    SKIP          1.4x         1.9x         1.0x 
rc-forest-fire                      1374/s          2/s          9/s          9/s
                                     1.0x       588.4x       155.8x       146.7x 
rc-man-or-boy-test                187464/s        --         41252/s      39966/s
                                     1.0x        FAIL          4.5x         4.7x 
rc-self-describing-numbers        219156/s        571/s        775/s        782/s
                                     1.0x       383.9x       282.9x       280.1x 
rc-dragon-curve                   149131/s       1704/s       5937/s       6260/s
                                     1.0x        87.5x        25.1x        23.8x 
rc-9-billion-names                  1821/s         93/s        216/s        500/s
                                     1.0x        19.7x         8.4x         3.6x 
rc-mandelbrot                       1168/s        702/s       1440/s       1519/s
                                     1.3x         2.2x         1.1x         1.0x 
spinner                              971/s          4/s          5/s          5/s
                                     1.0x       228.7x       193.1x       182.9x 
rc-forest-fire-stringify           11162/s         25/s         35/s         41/s
                                     1.0x       438.8x       314.7x       275.2x 
string-escape                    1448636/s        --           --           --   
                                     1.0x        FAIL         FAIL         FAIL  
                                =================================================
SUMMARY SCORE                     2253.9         40.5        100.0        139.6  

如何把数据用图的形式展示，我还没有找到办法。

ESCC 参会笔记

2014-10-27T00:00:00+00:00

10 月 25 号举办了 ESCC(ElasticSearch China Conference)。作为个人习惯，稍作记录。

会议的筹备时间其实特别短，8 月 20 号，ansj 说他跟 medcl 喝了瓶芬达，然后就敲定开搞。中间 medcl 默默承担了各种工作，直到 9 月 11 号，告诉我们场地已经搞定，分头写 ppt 吧。然后 9 月 30 号在 meetup.com 上创建组织，正式发出 meetup 公告。

medcl 办事是放心的。两年前，我们二三十号人在人人公司培训教室里听 medcl 一个人培训式的宣讲了一下午，场控能力绝对有保障。

最后我几乎是卡着点到的会场。国奥花园酒店非常贴心，一路上主动贴好了指路牌，而且免费给会场内每个座位发了一瓶矿泉水。会议中，甚至有服务员悄悄给前排的茶杯里续水……

ansj 第一个演讲，话题很学术，演讲很生动。演讲结束后提问者络绎不绝，眼瞧着赞助商的小礼品都要不够发了，逼得 medcl 站出来表示后续问题转成私下讨论。

我第二个演讲，时间上把握得还算好。由于转换成 ppt 在 windows 下播放，所以准备的 demo 就没在演讲中使用。不过在后来 QA 环节，有妹纸问到 Kibana3 和 Kibana4 的区别的时候，完全应该换成自己电脑演示一下这两个版本完全不同的效果的。感觉这个问题我纯靠口述基本没能让听众明白……

而后祝威廉告诉我：因为讲台灯光问题，ppt 拍摄效果很糟糕。等我自己回座位看后面的演讲，黑底白字确实比白底黑字效果好多了。这点算是教训，以后要注意。

接下来演讲的是黄琛。之前只看过他开源的 repo 的 README 说明，这次还见到了完整的 demo 页。漂亮的自定义语法，我个人想：如果能再实现一层，| timechart/| pie 这样的语法接在现有语法的后面，就能自动在页面生成时间序列图，饼图之类的，那就更帅了！会场上好几位同事问我为什么要搞这么个语法，感觉即不像搜索也不像 SQL。答曰：splunk 用户看着亲切~

然后是祝威廉。演讲主题是自己的一套 CS 系统。很高兴能在 ESCC 才刚第三届的时候，就有这种非强相关的话题，我觉得这是社区活跃的一种象征。听完演讲，我的感觉是：CS 主要点在那层 Strategies 上。由 strategies 来完成客户端接收，数据存储的请求，以及实际的逻辑处理。或许可以类比数据库的中间件？这种解耦确实在规模运维和频繁变更的时候更方便了。不过 ES 是一个讲究上手简单的系统，应该不太会走这个路线。

最后是刘刚。回归 ES 功能本身，讲了一下 func_score。跟我工作不太相干，之前了解也不多。只能表示很好很强大了……

总的来说，5 个演讲分别涉及 ES 的分词原理，聚合函数用法，请求解析的内部实现，服务架构的对比以及评分的用法。应该是比较全面了。（当然，我个人觉得其实 medcl 没时间也可以把半个月前在 Qcon shanghai 的演讲在北京同好这再讲一次）

会议休息和结束后，大家都在通过微信互加好友（我 ppt 上的微博二维码估计是没人扫描了）。

不过直到我们七个人一起晚饭的时候，才想起来为啥不统一在会场搞一个“面对面建群”，把大家都加进一个统一的群里呢？

吃饭的时候互叙了一轮年庚，发现我们多是 85 后。ES 社区也算是年轻社区了。刷微博看到有用户评价说：“收获满满，哈哈。对elasticsearch 中文社区好感直线上升，这是一个不吹水的社区。”开心！

Anyway，感谢这 150 多名冒着严重雾霾来聚会的 Elasticsearch 爱好者。

注：后来发现其实在半个月前，我在 perlweekly 里就发过一篇 ES 的自定义打分的博客链接：http://blogs.perl.org/users/mateu/2014/10/elasticsearch-custom-scoring.html

在终端命令行上调试 grok 表达式

2014-10-18T23:43:00+00:00

用 logstash 的人都知道在 http://grokdebug.herokuapp.com 上面调试 grok 正则表达式。现在问题来了：~~翻墙技术哪家强?~~ 页面中用到了来自 google 域名的 js 文件，所以访问经常性失败。所以，在终端上通过命令行方式快速调试成了必需品。

其实在 logstash 还在 1.1 的年代的时候，官方 wiki 上是有一批专门教大家怎么通过 irb 交互式测试 grok 表达式的。但不知道为什么后来 wiki 这页没了…… 好在代码本身不复杂，稍微写几行脚本，就可以达到目的了：

#!/usr/bin/env ruby
require 'rubygems'
gem 'jls-grok', '=0.11.0'
require 'grok-pure'
require 'optparse'
require 'ap'

options = {}
ARGV.push('-h') if ARGV.size === 0
OptionParser.new do |opts|
  opts.banner = 'Run grokdebug at your terminal.'
  options[:dirs] = %w(patterns)
  options[:named] = false
  opts.on('-d DIR1,DIR2', '--dirs DIR1,DIR2', Array, 'Set grok patterns directories. Default: "./patterns"') do |value|
    options[:dirs] = value
  end
  opts.on('-m MESSAGE', '--msg MESSAGE', 'Your raw message to be matched') do |value|
    options[:message] = value
  end
  opts.on('-p PATTERN', '--pattern PATTERN', 'Your grok pattern to be compiled') do |value|
    options[:pattern] = value
  end
  opts.on('-n', '--named', 'Named captures only') do
    options[:named] = true
  end
end.parse!

grok = Grok.new
options[:dirs].each do |dir|
  if File.directory?(dir)
    dir = File.join(dir, "*")
  end
  Dir.glob(dir).each do |file|
    grok.add_patterns_from_file(file)
  end
end
grok.compile(options[:pattern], options[:named])
ap grok.match(options[:message]).captures()

测试一下：

$ sudo gem install jls-grok awesome_print
$ ruby grokdebug.rb
Run grokdebug at your terminal.
    -d, --dirs DIR1,DIR2             Set grok patterns directories. Default: "./patterns"
    -m, --msg MESSAGE                Your raw message to be matched
    -p, --pattern PATTERN            Your grok pattern to be compiled
    -n, --named                      Named captures only
$ ruby grokdebug.rb -m 'abc123' -p '%{NUMBER:test}'
{
         "test" => [
        [0] "123"
    ],
    "BASE10NUM" => [
        [0] "123"
    ]
}
$ ruby grokdebug.rb -m 'abc123' -p '%{NUMBER:test:float}' -n
{
    "test" => [
        [0] 123.0
    ]
}

没错，我这比 grokdebug 网站还多了类型转换的功能。它用的 jls-grok 是 0.10.10 版，而我用的是最新的 0.11.0 版。

Rsyslog 性能数据 impstats 直接写入 Elasticsearch

2014-10-18T21:48:00+00:00

Rsyslog 的性能数据，可以通过自带的 impstats 插件输出。但是在用的比较复杂的场景下，每次输出都会有好几十个 action 的各种状态，肉眼观察变得比较困难，这时候，我们可以直接输出给 Elasticsearch ，然后利用 Kibana 做快速搜索和分析。

Rsyslog 官方提供了直接输出给 Elasticsearch 的插件：omelasticsearch。配置如下：

module(load="omelasticsearch")
module(load="impstats" interval="120" severity="6" log.syslog="on" format="json" resetCounters="on")
template(name="logstash-index" type="list") {
    constant(value="logstash-rsyslog-")
    property(name="timereported" dateFormat="rfc3339" position.from="1" position.to="4")
    constant(value=".")
    property(name="timereported" dateFormat="rfc3339" position.from="6" position.to="7")
    constant(value=".")
    property(name="timereported" dateFormat="rfc3339" position.from="9" position.to="10")
}
template(name="plain-syslog" type="list") {
    constant(value="{")
    constant(value="\"@timestamp\":\"") property(name="timereported" dateFormat="rfc3339")
    constant(value="\",\"host\":\"")    property(name="hostname")
    constant(value="\",")   property(name="msg" position.from="2")
}
if ( $syslogfacility-text == 'syslog' ) then {
    action( type="omelasticsearch"
            template="plain-syslog"
            server="10.13.57.35"
            searchIndex="logstash-index"
            searchType="impstats"
            bulkmode="on"
            dynSearchIndex="on"
    )
    stop
}

这里用到一个小窍门。impstats 只是 message 部分内容是 JSON 格式，那么如果合在总的内容里，可能就得跟老版的 logstash 事件格式一样，专门放在 @fields: 里面去了。但是，利用 position.from 参数，把 message 部分的开头 { 给删掉，就把整个内容都提升到顶层了，变成了新版 logstash 的事件格式了！

Rsyslog 的 template 语法多变，实现这个同样的目的，在 mmjsonparse 或者 mmnormalize 的配合下，就可以有不同写法：

Rsyslog 官方的 $!all-json 玩法 Parsing JSON (CEE) Logs and Sending them to Elasticsearch
Rackspace 官博的 subtree 玩法 rsyslog & ElasticSearch

normalize 是 rsyslog 作者自己写的一个日志格式分析工具，搞怪的是它的文本格式示例文件后缀名叫 .rb，不是 Ruby，而是 RuleBase……

RuleBase 支持的语法不多：

date-rfc3164: date as specified in rfc3164 (example: %date:date-rfc3164%)
date-rfc5424: date as specified in rfc5424 (example: %date:date-rfc5424%)
ipv4: IP adress (example: %ip:ipv4%)
number: sequence of numbers (example: %port:number%)
word: everything until the next blank (example: %host:word%)
char-to: the field will be defined by the sign in the additional information (example: %tag:char-to:\x3a%: (x3a means “:” in the additional information))
quoted-string: If a quoted string is present, a property can be filled with the whole string (example: %quote:quoted-string%)
date-iso: date in ISO format (example: %date:date-iso%)
time-24hr: detects time in 24hr format (example: %time:time-24hr%)
time-12hr: detects time in 12hr format (example: %time:time-12hr%)
iptables: parses IP tables messages and fills properties accordingly(example: %tables:iptables%)

从这个格式设计也可以看出，主要还是用来分析系统日志比较多。

目前来看，使用 Rsyslog 做整套日志处理系统的话，在数据结构化这步，还是用 mmexternal 插件来完成比较合适。

mmexternal 模块类似 squid 的 url_rewrite_program ，都是支持用任意语言写的脚本，死循环接收 STDIN(可以配置传输 line 还是 json 格式)，处理完成后(JSON 格式)输出给 STDOUT 即可。官方示例见：https://github.com/rsyslog/rsyslog/blob/master/plugins/external/messagemod/anon_cc_nbrs/anon_cc_nbrs.py。性能如何，有待测试了。

LogStash::Inputs::Syslog 性能测试与优化

2014-10-18T00:01:00+00:00

最近因为项目需要，必须想办法提高 logstash indexer 接收 rsyslog 转发数据的性能。首先，就是要了解 logstash 到底能收多快？

之前用 libev 库写过类似功能的程序，所以一开始也是打算找个能在 JRuby 上运行的 netty 封装。找到了 foxbat 库，不过最后发现效果跟官方的标准 socket 实现差不多。（这部分另篇讲述）

后来又发现另一个库：jruby-netty，注意到这个作者就是 logstash 作者 jordansissel！

当然，最终并不是用上这个项目的代码来改写 logstash，而是从这里面学到了如何方便的进行 syslog server 性能压测。测试方式：

yes "<44>May 19 18:30:17 snack jls: foo bar 32" | nc localhost 3000

或者

loggen -r 500000 -iS -s 120 -I 50  localhost 3000

loggen 是 syslog-ng 带的工具，还得另外安装。而上面第一行的方式，这个 yes 用的真是绝妙！

就用这个测试方法，最终发现单机上 LogStash::Inputs::Syslog 的每秒处理能力只有 700 条：

input {
    syslog {
        port => 3000
    }
}
output {
    stdout {
        codec => dots
    }
}

logstash 配置文件见上。然后测试启动命令如下：

./bin/logstash -f syslog.conf | pv -abt > /dev/null

注意，centos 上的 pv 命令可能还没有 -a 参数。

为了逐一排除性能瓶颈。我依次注释掉了 lib/logstash/inputs/syslog.rb 中 @date_filters.filter(event) 和 @grok_filters.filter(event) 两段，并重新运行上次的测试。结果发现：

TCPServer 接收的性能是每秒 50k 条
TCPServer 接收并完成 grok filter 的性能是每秒 5k 条
TCPServer 接收并完成 grok 和 date filter 的性能是每秒 700 条

性能成几何级的下降！

而另外通过 input { generator { count => 3000000 } } 测试可以发现，logstash 本身空数据流转的性能也不过就是每秒钟几万条。所以，优化点就在后面的 filter 上。

注：空数据流转的测试采用 inputs/generator 插件

LogStash::Inputs::Syslog 中，TCPServer 对每个 client 单独开一个 Thread，但是这个 Thread 内要顺序完成 @codec.decode，@grok_filter.filter 和 @date_filter.filter 三大步骤后，才算完成。而我们都知道：Logstash 配置中 filter 阶段的插件是可以多线程完成的。所以，解决办法就来了：

input {
    tcp {
        port => 3000
    }
}
filter {
    grok {
        overwrite => "message"
        match => ["message", "<\d+>%{SYSLOGLINE}"]
    }
    date {
        locale => "en"
        match => ["timestamp", "MMM dd HH:mm:ss", "MMM  d HH:mm:ss"]
    }
}
output {
    stdout {
        codec => dots
    }
}

然后重新测试，发现性能提高到了每秒 4.5k。再用下面命令运行测试：

  ./bin/logstash -f syslog.conf -w 20 | pv -bt > /dev/null

发现性能提高到了每秒 30 k 条！

此外，还陆续完成了另外一些测试。

比如：

outputs/elasticsearch 的 protocol 使用 node 还是 http 的问题。测试在单台环境下，node 只有 5k 的 indexing 速度，而 http 有7k。
在 inputs/file 的前提下，outputs/stdout{dots} 比 outputs/elasticsearch{http} 处理速度快一倍，即有 15k。
下载了 heka 的二进制包，通过下面配置测试其接受 syslog 输入，并以 logstash 的 schema 输出到文件的性能。结果是每秒 30k，跟之前优化后的 logstash 基本一致。

[hekad]
maxprocs = 48

[TcpInput]
address = ":5140"
parser_type = "token"
decoder = "RsyslogDecoder"

[RsyslogDecoder]
type = "SandboxDecoder"
filename = "lua_decoders/rsyslog.lua"

[RsyslogDecoder.config]
type = "mweibo"
template = '<%pri%>%TIMESTAMP% %HOSTNAME% %syslogtag%%msg:::sp-if-no-1st-sp%%msg:::drop-last-lf%\n'
tz = "Asia/Shanghai"

[ESLogstashV0Encoder]
es_index_from_timestamp = true
fields = ["Timestamp", "Payload", "Hostname", "Fields"]
type_name = "%{Type}"

# [ElasticSearchOutput]
# message_matcher = "Type == 'nginx.access'"
# server = "http://10.13.57.35:9200"
# encoder = "ESLogstashV0Encoder"
# flush_interval = 50
# flush_count = 5000

[counter_output]
type = "FileOutput"
path = "/tmp/debug.log"
message_matcher = "TRUE"
encoder = "ESLogstashV0Encoder"

heka 文档称 maxprocs 设置为 cpu 数的两倍。不过实际测试中，不配置跟配置总共也就差一倍的性能。

在 JRuby 上用 netty 模拟 eventmachine

2014-10-17T00:00:00+00:00

上一篇说到在 JRuby 上利用 netty 库实现事件驱动。事实上，为了让 Ruby 程序员更习惯，foxbat 模块是把 netty 库封装成 eventmachine 的接口来提供给用户使用的。所以，我们可以把程序写得更通用一些：

  if defined?(JRUBY_VERSION)
    require 'foxbat'
  end
  require 'eventmachine'
  require 'socket'

  module SyslogRecv
    def initialize(options)
      @output_queue = options[:queue]
      @codec = options[:codec]
      @grok_filter = options[:grok_filter]
      @date_filter = options[:date_filter]
    end
    def syslog_relay(event)
      @grok_filter.filter(event)
      if event["tags"].nil? || !event["tags"].include?("_grokparsefailure")
        event["timestamp"] = event["timestamp8601"] if event.include?("timestamp8601")
        @date_filter.filter(event)
      else
        @logger.info? && @logger.info("NOT SYSLOG", :message => event["message"])
      end
    end
    def post_init
      (@@connections ||= []) << self
    end
    def receive_data(data)
      @@connections.each do |client|
        if defined?(JRUBY_VERSION)
          ip = client.get_peername.getAddress.getHostAddress
          port = client.get_peername.getPort
        else
          port, ip = Socket.unpack_sockaddr_in(client.get_peername)
        end
        ::LogStash::Util::set_thread_name("input|syslog|tcp|#{ip}:#{port}}")
        @codec.decode(data) do |event|
          event["host"] = ip
          syslog_relay(event)
          @output_queue << event
          end
        end
      end
    end
  end
  def run(output_queue)
    @logger.info("Starting syslog tcp listener", :address => "#{@host}:#{@port}")
    EventMachine::run do
      EventMachine::start_server @host, @port, SyslogRecv, {
        :queue => output_queue,
        :codec => @codec,
        :grok_filter => @grok_filter,
        :date_filter => @date_filter
      }
    end
  end

初次用 EventMachine，发现写法还蛮奇怪的。start_server 传递参数必须是 module 或者 class，然后变量只能随后通过额外的哈希传递进去。

木有看 CPP 的 EM 实现，看这里 foxbat 的实现，发现在 JRuby 里使用 Java 还真是简单啊：

#!/usr/bin/env ruby
require "java"
require File.join(File.dirname(__FILE__), "netty-3.2.4.Final.jar")
require File.join(File.dirname(__FILE__), "syslogdecoder.jar")
java_import "com.loggly.syslog.SyslogDecoder"
java_import "org.jboss.netty.channel.SimpleChannelHandler"
java_import "org.jboss.netty.channel.ChannelPipelineFactory"
java_import "org.jboss.netty.channel.Channels"
java_import "org.jboss.netty.channel.socket.nio.NioServerSocketChannelFactory"
java_import "org.jboss.netty.bootstrap.ServerBootstrap"

class SyslogServerHandler < SimpleChannelHandler
  class << self
    include ChannelPipelineFactory
    def getPipeline
      return Channels.pipeline(SyslogDecoder.new, self.new)
    end # def getPipeline
  end # class << self

  def initialize
    super
  end # def initialize

  def messageReceived(context, event)
    e = event.getMessage.toString
    print('.')
  end # def messageReceived

  def exceptionCaught(context, exception)
    exception.getCause.printStackTrace
    exception.getChannel.close
  end # def exceptionCaught
end # class SyslogServerHandler

class RubySyslogServer
  def initialize(host, port)
    @factory = NioServerSocketChannelFactory.new(
      java.util.concurrent.Executors.newCachedThreadPool(),
      java.util.concurrent.Executors.newCachedThreadPool()
    )

    @bootstrap = ServerBootstrap.new(@factory)
    @bootstrap.setPipelineFactory(SyslogServerHandler)
    @bootstrap.setOption("child.tcpNoDelay", true);
    @bootstrap.setOption("child.keepAlive", true);

    @host = host
    @port = port
  end # def initialize

  def start
    address = java.net.InetSocketAddress.new(@host, @port)
    return @bootstrap.bind(address)
  end # def start

end # class SyslogServer

if __FILE__ == $0
  host = ARGV[0]
  port = ARGV[1].to_i
  RubySyslogServer.new(host, port).start
end

直接加载 jar 包，导入各种类。然后就能照样用了。

PerlAPI 里的 Magic 简介

2014-10-11T00:00:00+00:00

前几天看到 cindylinz 发了一个新 CPAN 模块叫 Scalar::Watcher，有朋友问我这个是怎么实现的，在无限循环啊，多线程啊，IO 阻塞啊等情况下，还能被触发么？

于是我去仔细看了一下这个模块的代码。最关键的就是下面这几行：

        SvUPGRADE(target, SVt_PVMG);
        sv_magicext(target, handler_cv, PERL_MAGIC_ext, &modified_vtbl, NULL, 0);

这里其实用的是 perlapi 里的 Magic：

第一行，设置监听变量为 SVt_PVMG，即带有 Magic 的标量；

SvUPGRADE 函数见 perlguts 文档的 “Assigning Magic” 部分。
第二行，设置该变量的 Magic 扩展，即往标量的 Magic 链表上加内容。

sv_magicext 函数说明见 perlapi 文档的 “SV-Body Allocation” 部分。

Magic 主要有两个作用，一个叫 Hook Method，一个叫 Managed Data。我们都很熟悉的 Moose 框架就是利用的 Magic 的 Managed Data 实现的。而这里，用到的是 Hook Method。

Scalar::Watcher 模块文档较少，虽然好用但是不好懂。我在 CPAN 上发现另一个模块，Variable::Magic 。文档写的很详细。其中的 set 方法就是跟 Scalar::Watcher 类似的作用，大家可以读一读这个模块的文档。

所以可以回答朋友的问题了，在循环之类的地方每次都可以触发没问题。但是如果你在回调函数里面做阻塞操作，那肯定也是堵塞的。

从源代码运行 Kibana 4

2014-10-10T00:00:00+00:00

Kibana 4 发布了，出人意料的是提供的居然是一个 jar 包的运行方式。好在有源码可看，根据源码可以分析得知，v4 版其实是一个 angularjs 写的 kibana 配上一个 sinatra 写的 proxyserver。这么一来，我们也就知道怎么来从源代码运行 Kibana 4，而不是用 Java 启动了。

# 安装 nodejs 和 npm 命令，仅用于下载依赖包，实际运行不需要
port install nodejs npm
# 下载 kibana 4 源码
git clone https://github.com/elasticsearch/kibana.git kibana4
cd kibana4/
# 安装 bower 工具
npm install -g bower
# 读取目录中的 bower.json，
# 依此下载所有 js 依赖库到其中定义的路径
# src/kibana/bower_components 下
bower install
cd src/server
# 安装 bundler 工具
gem install bundler
# 读取目录中的 Gemfile，
# 依此安装所有的 RubyGem 依赖库
bundle install
# 安装 lessc 工具
npm install -g less
# kibana 4 源码中在导入 lesshat 的时候都没写具体路径，所以要切换到对应目录下执行
cd ../src/kibana/bower_components/lesshat/build
# 编译 kibana 内的 *.less 文件为 *.css 文件
for i in `find ../../.. -name '[a-z]*.less' | grep -v bower_components`;do
    ../../../../../node_modules/.bin/lessc $i ${i/.less/.css/}
done
# 进入代理服务器目录
cd ../../../../server/
# 启动 sinatra 服务器
./bin/initialize

这样就可以通过 “localhost:5601” 访问了。

此外，Elasticsearch 集群的地址，在 src/server/config/kibana.yml 中配置。注意里面的 kibana-int 建议大家使用的时候改个名儿，不然万一跟你原先 kibana3 的混合在一起了就不好了。

最后，如果你的集群版本低于 1.4.0.BETA1，也不要着急，其实目前代码并没有用上什么这个版本的特性，所以可以通过修改 src/kibana/index.js 改变这个版本检测：

--- a/src/kibana/index.js
+++ b/src/kibana/index.js
@@ -33,7 +33,7 @@ define(function (require) {
     // Use this for cache busting partials
     .constant('cacheBust', window.KIBANA_COMMIT_SHA)
     // The minimum Elasticsearch version required to run Kibana
-    .constant('minimumElasticsearchVersion', '1.4.0.Beta1')
+    .constant('minimumElasticsearchVersion', '1.1.0')
     // When we need to identify the current session of the app, ef shard preference
     .constant('sessionId', Date.now())
     // attach the route manager's known routes

Kibana 4 的界面，改成了 Query -> Visual -> Dashboard 三个解耦层次。而且不再是固定的提供某种某种 panel，改成自己选择、拼接甚至书写 Aggr 聚合函数的方式来灵活的生成图表。可以说，对使用者的 ES 知识，要求更高了。

后续如何发展，大家一起关注吧。

【翻译】Elasticsearch 1.4.0 beta 1 发版日志

2014-10-10T00:00:00+00:00

原文见：http://www.elasticsearch.org/blog/elasticsearch-1-4-0-beta-released/

今天，我们很高兴公告基于 Lucene 4.10.1 的 Elasticsearch 1.4.0.Beta1 发布。你可以从这里下载并阅读完整的变更列表：Elasticsearch 1.4.0.Beta1。

1.4.0 版的主题就是弹性：让 Elasticsearch 比过去更稳定更可靠。当所有东西都按照它应该的样子运行的时候，就很容易变得可靠了。但是不在意料中的事情发生时，复杂的部分就来了：节点内存溢出，它们的性能被慢垃圾回收或者超重的 I/O 拖累，网络连接失败，或者数据传输不规律。

这次 beta 版主要在三方面力图改善弹性：

通过减少内存使用提供更好的节点稳定性。
通过改进发现算法提供更好的集群稳定性。
通过checksums提供更好的数据损坏检测。

分布式系统是复杂的。我们已经有一个广泛的测试套件，可以创建随机场景，模拟我们自己都没想过的条件。但是依然会有无限多在此范围之外的情况。1.4.0.Beta1 里已经包含了我们目前能做到的各种优化努力。真心期望大家在实际运用中测试这些变更，然后告诉我们你碰到的问题。

内存管理

内存压力
swap (参见 memory settings)
太大的 heaps

这次发版包括了一系列变更来提升内存管理，并由此提升节点稳定性：

doc values

fielddata 是最主要的内存大户。为了让聚合、排序以及脚本访问字段值时更快速，我们会加载字段值到内存，并保留在内存中。内存的堆空间非常宝贵，所以内存里的数据需要使用复杂的压缩算法和微优化来完成每次计算。正常情况下这样会工作的很好，直到你的数据大小超过了堆空间大小。这个问题看起来可以通过添加更多节点的方式解决。不过通常来说，堆空间问题总是会在 CPU 和 I/O 之前先到达瓶颈。

现有版本已经添加了 doc values 支持。本质上，doc values 提供了和内存中 fielddata 一样的功能，不过他们在写入索引的时候就直接落到了磁盘上。而好处就是：他们消耗很少的堆空间。Doc values 在读取的时候也不是从内存，而是从磁盘上读取。虽然访问磁盘很慢，但是 doc values 可以利用内核的文件系统缓存。文件系统缓存可不像 JVM 的堆，不会有 32GB 的限制。所以把 fielddata 从堆转移到文件系统缓存里，你只用消耗更小的堆空间，也意味着更快的垃圾回收，以及更稳定的节点。

在本次发版之前，doc values 明显慢于在内存里的 fielddata 。而这次我们显著提升了性能，几乎达到了和在内存里一样快的效果。

用doc values 替换内存 fielddata，你只需要向下面这样构建新字段就行：

PUT /my_index
{
  "mappings": {
    "my_type": {
      "properties": {
        "timestamp": {
          "type":       "date",
          "doc_values": true
        }
      }
    }
  }
}

有了这个映射表，要用这个字段数据都会自动从磁盘加载 doc values 而不是进到内存里。注意：目前 doc values 还不能在经过分词器的 string 字段上使用。

request circuit breaker

fielddata 断路器之前已经被加入，用作限制 fielddata 可用的最大内存，这是导致 OOM 的最大恶因。而限制，我们把这个机制扩展到请求界别，用来限制每次请求可用的最大内存。

bloom filters

Bloom filters 在写入索引时提供了重要的性能优化 – 用以检查是否有已存在的文档 id ，在通过 id 访问文档时，用来探测哪个 segment 包含这个文档。不过当然的，这也有代价，就是内存消耗。目前的改进是移除了对 bloom filters 的依赖。目前 Elasticsearch 只在写入索引(仅是真实用例上的经验，没有我们的测试用例证明)的时候构建它，但默认不再加载进内存。如果一切顺利的话，未来的版本里我们会彻底移除它。

集群稳定性

提高集群稳定性最大的工作就是提高节点稳定性。如果节点稳定且响应及时，就极大的减少了集群不稳定的可能。换句话说，我们活在一个不完美的世界 – 事情总是往意料之外发展，而集群就需要能无损的从这些情况中恢复回来。

我们在 improve_zen 分支上花了几个月的时间来提高 Elasticsearch 从失败中恢复的能力。首先，我们添加测试用例来复原复杂的网络故障。然后为每个测试用例添加补丁。肯定还有很多需要做的，不过目前来说，用户们已经碰到过的绝大多数问题我们已经解决了，包括issue #2488 – “minimum_master_nodes 在交叉脑裂时不起作用”。

我们非常认真的对待集群的弹性问题。希望你能明白 Elasticsearch 能为你做什么，也能明白它的弱点在哪。考虑到这点，我们创建了弹性状态文档。这个文档记录了我们以及我们的用户碰到过各种弹性方面的问题，有些可能已经修复，有些可能还没有。请认真阅读这篇文档，采取适当的措施来保护你的数据。

数据损坏探测

从网络恢复过来的分片的 checksum 帮助我们发现过一个压缩库的 bug，这是 1.3.2 版本的时候发生的事情。从那天起，我们给 Elasticsearch 添加了越来越多的 checksum 认证。

在合并时，segment 中的所有文件都有自己的 checksum 验证(#7360).
重新开所有索引的时候，segment 里的小文件完整的验证，大文件则做轻量级的分段验证(LUCENE-5842).
从 transaction 日志重放事件的时候，每个事件都有自己的 checksum 验证(#6554).
During shard recovery, or when restoring from a snapshot, Elasticsearch needs to compare a local file with a remote copy to ensure that they are identical. Using just the file length and checksum proved to be insufficient. Instead, we now check the identity of all the files in the segment (#7159).

其他亮点

你可以在 Elasticsearch 1.4.0.Beta1 changelog 里读到这个版本的所有特性，功能和修复。不过还是有些小改动值得单独提一下的：

groovy 代替了 mvel

Groovy 现在成为了新的默认脚本语言。之前的 MVEL 太老了，而且它不能运行在沙箱里也带来了安全隐患。Groovy 是沙箱化的(这意味着可以放心的开启)(译者注：还记得1.2版本时候的所谓安全漏洞吧)，而且 Groovy 有个很好的管理团队，运行速度也很快！更多信息见博客关于脚本的内容。

默认关闭 cors

默认配置下的 Elasticsearch 很容易遭受跨站攻击。所以我们默认关闭掉 CORS。Elasticsearch 里的 site 插件会照常工作，但是外部站点不再被允许访问远程集群，除非你再次打开 CORS。我们还添加了更多的CORS 配置项让你可以控制哪些站点可以被允许访问。更多信息请看我们的安全页。

请求缓存(query cache)

一个新的实验性分片层次的请求缓存可以让在静态索引上的聚合请求瞬间返回响应。想想你有一个仪表板展示你的网站每天的 PV 数。这个书在过去的索引上不可能再变化了，但是聚合请求在每次页面刷新的时候都需要重新计算。有了新的请求缓存，聚合结果就可以直接从缓存中返回，除非分片中的数据发生了变化。你不用担心会从缓存中得到过期的结果 – 它永远都会跟没缓存一样。

新的聚合函数

我们添加了三个新的聚合函数：

filters

这是 `filter` 聚合的扩展。允许你定义多个桶(bucket)，每个桶里有不同的过滤器。

children

相当于 `nested` 的父子聚合，`children` 可以针对属于某个父文档的子文档做聚合。

scripted_metric

给你完全掌控数据数值运算的能力。提供了在初始化、文档收集、分片层次合并，以及全局归并阶段的钩子。

获取 /index 的接口

之前，你可以分别为一个索引获取他的别名，映射表，配置等等。而get-index 接口现在让你可以一次获取一个或者多个索引的全部信息。这在你需要创建一个跟已有索引很类似或者几乎一样的新索引的时候，相当有用。

索引写入和更新

在文档写入和更新方面也有一些改进：

我们现在用 Flake IDs 自动生成文档的 ID。在查找主键的时候，能提供更好的性能。
如果设置 detect_noop 为 true，一个不做任何实际变动的更新操作现在消耗更小了。打开这个参数，就只有变更了 _source 字段内容的更新请求才能写入新版本文档。
更新操作可以完全由脚本控制。之前，脚本只能在字段已经存在的时候运行，否则会插入一个 upsert 文档。现在 scripted_upsert 参数允许你在脚本中直接处理文档创建工作。

function score

非常有用的 function_score 请求现在支持权重参数，用来优化每个指定函数的相关性影响。这样你可以把更多权重给新近的而不是热点的，给价格而不是位置。此外，random_score函数不再被 segment 合并影响，增强了排序一致性。

试一试

请下载 Elasticsearch 1.4.0.Beta1，尝试一下，然后在 Twitter 上@elasticsearch) 说出你的想法。你也可以在 GitHub issues 页上报告问题。

【翻译】Kibana 4 beta 1 发版日志

2014-10-07T00:00:00+00:00

原文地址见：http://www.elasticsearch.org/blog/kibana-4-beta-1-released/

今天，我们~~自豪高兴满意控制不住地兴奋过头欣喜若狂~~相当高兴得给大家分享一下 Kibana 项目的未来，以及 Kibana 4 的第一个 beta 版本。

我现在就要！快给我！

从这里下载，然后看 README.md 里新的而且更简单的安装流程。当然，你最好还是读一下本文剩下的内容，有很多超棒的秘诀呢！

欢迎来到 kibana 4

我们正走在 Kibana 4 的漫漫长路上：可以预见还会有好几个 beta 版本，每个都有新的特性，可视化和改善。我们梳理了各种反馈、邮件列表、IRC 以及 Github 的 issue ，把特性加入到这个 beta1 版本中，真是罪孽深重。我们已经在为 beta2 版本努力工作，在此，很高兴分享一下我们的 roadmap，查看 Github 上打有 “Roadmap” 标签的 issue。你们的反馈是我们永远做正确的事的保证。

反馈之外，我们回头想了想人们是怎么看数据的，更进一步，人们是怎么解决真实问题的。我们发现一个问题总是能引出另一些问题，而这些问题又能引出更多其他问题。如果你参加了 Monitotama，或者其他 Elasticsearch 见面会，你可能已经看到过 Kibana 4 概念性的原型演示。它可以让你创建更复杂的图标，Kibana 4 从 PoC 出发，扩展出一大堆新特性，让你编写问题，得到解答，然后解决之前从来没这么解决过的问题。

这种组合方式在 Kibana 4 中体现为聚合、搜索、可视化和仪表板融合在一起的方式。为了简化组成，我们把 Kibana 4 分成 3 个不同的界面，虽然一起工作，但是每个负责解决不同的一部分问题。

熟悉的界面

如果你是 Kibana 老用户，你会发现主页上 Discover 标签页的样子很熟悉。

Discover 功能跟原先的带有一个文档表格和事件时间轴的搜索界面很像。在搜索框里输入，敲回车，然后让 Kibana 去挖掘你的 Elasticsearch 索引。说到索引，有一个快速下拉菜单让你在搜索的时候灵活的在多个索引之间切换。要切换回上一个索引，点击浏览器的回退按钮即可。不喜欢新的搜索关键词？同样点击回退按钮就能返回原来的搜索词了。当然，搜索框的历史中也存着过去的记录。

说道搜索，你既可以输入 Lucene Query String 语法，也可以用上一个经常被要求的特性，Elasticsearch JSON 搜索 到搜索框里。我们知道 JSON 格式可能比较难输对，所以不管你输入的是 Lucene Query String 还是 JSON，我们都会在发送给 Elasticsearch 之前替你验证一遍语法。不管你在 Kibana 4 的任何位置输入请求，这点都是生效的。

这样搜索也可以保存下来留待后用。重要的是：搜索不在绑定在仪表板上，他们可以在 Discover 页上再次调用，也可以运用在可能稍后才添加到仪表板上的可视化页里。因为，不管你在仪表板的哪一屏，搜索一直都会通过 URL 传递，所以链接到搜索非常简单。

画图的在这里

Kibana 4 的 Visualize 标签是之前说的概念原型里最高潮的地方。Kibana 4 把 Elasticsearch 的 nested 聚合函数的威力带到鼠标点击上。比如我想知道哪些国家访问我的网站，什么时候访问的，他们是否登录认证了？通过一个 canvas 上的单一请求，我就可以问出上面这些问题，然后看到结果是怎么相互联系的：

Kibana 3 的时候，时间只能在 histogram 面板上显示，而 terms 只能在柱状图上显示。Kibana 4 可以利用多个 Elasticsearch 聚合函数。这包括 bucket 和 metric 聚合函数，其中有备受期待的基数(又叫唯一计数)聚合函数，更多支持还在实现中。我们不得不创建了一个全新的可视化框架来处理复杂的聚合函数。目前有三种支持的类型：柱状图，线状图和光圈图。同样，更多支持还在实现中。未来每个 Kibana 4 的 beta 版本都值得你期待。

光圈图类似多层次的饼图。理论上它可以有无限的环：

柱状图现在还不单单可以做时间。这里我们展示根据文件后缀名分解文件大小范围。

现在你可能已经注意到每个可视化页底部的灰色小条。点击它，就可以看到图背后的源数据，然后，在大众要求下，提供了导出到CSV 以便后续分析的功能。你还可以看到 Elasticsearch 请求和响应的内容，以及请求的处理耗时。

Visualization 既可以互动式搜索创建，让你在建图的时候修改请求，也可以关联到一个之前通过 Discover 标签创建保存的请求上。这样你可以关联一个请求到多个可视化页，如果需要更新一个搜索参数，只需要更新单独一个请求就行了。比如，假设你有多个图表，是用下面语句搜索图片内容的：

png OR jpg

保存成 “Images”。然后你打算支持动态 GIF 格式，你只需要更新 “Images” 的内容然后保存即可。所有关联了 “Images” 请求的图都会自动应用变更。

]

给我看更多的图！

当然，你依然可以创建令人惊叹的仪表板，而且它们现在更方便创建和管理了。过去那堆凌乱的配置框一去不复返了。添加进仪表板的每个面板都可以在 Visualize 标签页理创建、保存，并且重复利用。就像保存了的搜索可以在多个 visualizations 里使用一样，保存了的 visualization 也可以在多个仪表板里使用。你需要更新一个 visualization 的话，只需要在一个地方修改好，每个仪表板里的都会应用变更。

更进一步，虽然请求和可视化是绑定到一个选定的索引的，仪表板却不用。一个仪表板可以有从不同索引来的可视化。这意味着，你可以从你的用户索引关联到网站流量索引，从销售数据关联到市场研究再关联到气象站日志。这些都可以在同一屏上！

一篇博客里完全不够说完全部内容，所以去下载安装然后亲自试试 HERE 吧。如果你来自 Kibana 3，我们收集了一个小小的 FAQ 解释：HERE。还是老话，我们需要你的反馈，构建 Kibana 4 的每一天，我们都用得着这些反馈，而我们也会继续让 Kibana 变得更好，更快，更简单。

【翻译】Kibana 3 升级到 4 的常见问答

2014-10-07T00:00:00+00:00

原文见https://github.com/elasticsearch/kibana/blob/master/K3_FAQ.md。

问：我在 Kibana 3 里最想要的某某特性有了么？答：就会有了！我们已经以 ticket 形式发布了目前的 roadmap。查看 GitHub 上的 beta 里程碑，看看有没有你想要的特性。

问：仪表板模式是否兼容？答：不好意思，不兼容了。要创建我们想要的新特性，还是用原先的模式是不可能的。Aggregation 跟 Facet 请求从根本上工作方式就不一样，新的仪表板不再绑定成行和列的样式，而且搜索框，可视化和仪表板的关系过于复杂，我们不得不重新设计一遍，来保证它的灵活可用。

问：怎么做多项搜索？答：”filters” Aggregation 可以运行你输入多项搜索条件然后完成可视化。甚至你可以在这里面自己写 JSON。

问：模板化/脚本化仪表板还在么？答：看看 URL 吧。每个应用的状态都记录在那里面，包括所有的过滤器，搜索和列。现在构建脚本化仪表板比过去简单多了。URL 是采用 RISON 编码的。

译者注：

RISON 是一个跟 JSON 很类似，还节省不少长度的东西。其官网见：http://mjtemplate.org/examples/rison.html。但是我访问看似乎已经挂了，更多一点的说明可以看https://github.com/Nanonid/rison。

Mojolicious 应用的自定义子命令

2014-10-01T00:00:00+00:00

Mojolicious 框架开发应用的时候，可以跟 RoR 一样通过一系列子命令简化很多复杂操作。最简单的来说，就是快速生成整个 web 项目目录：mojo generate youapp。更多子命令见：http://cpan.php-oa.com/perldoc/Mojolicious/Commands

其实我们还可以自己扩展这个子命令方式，实现自己的子命令。如果打算继续使用 mojo subcommand 的方式，那就把自己的子命令模块叫做 Mojolicious::Command::yourcommand，而如果打算在自己的名字空间下使用，比如叫 MyApp::Command::mycommand，那么需要在 MyApp.pm 里加一行代码，设置一下名字空间：

    sub startup {
        my $self = shift;
        push @{$self->commands->namespaces}, 'MyApp::Command';
        ...
    };

然后就可以写自己的 MyApp::Command::mycommand 了：

package MyApp::Command::mycommand;
use strict;
use warnings;
use Mojo::Base 'Mojolicious::Command';
use Mojo::UserAgent;

has usage       => "usage: $0 migratint [username] [dashboards...]\n";
has description => "kibana-int index migration for auth users\n";
has ua          => sub { Mojo::UserAgent->new };

sub run {
    my ( $self, $user) = @_;
    my $config = $self->app->config;
    my $ua = $self->ua;
    ...
}

1;

大致就是这样：

继承 Mojolicious::Command 类。这样就会有 usage 和 description 两个属性和 run 方法。

usage 属性用来在你执行 script/myapp help mycommand 的时候输出信息；
description 属性用来在你执行 script/myapp help 罗列全部可用子命令的时候描述该命令的作用；
run 方法是命令的入口函数。命令行后面的参数都会传递给 run 方法。如果你的子命令需要复杂处理，这里依然可以用 GetOpt::Long 模块中的 GetOptionsFromArray 函数处理。

在 logstash 里使用其他 RubyGems 模块

2014-09-24T00:00:00+00:00

在开发和使用一些 logstash 自定义插件的时候，几乎不可避免会导入其他 RubyGems 模块 —— 因为都用不上模块的小型处理，直接写在 filters/ruby 插件配置里就够了 —— 这时候，运行 logstash 命令可能会发现一个问题：这个 gem 模块一直是 “no found” 状态。

这其实是因为我们一般是通过 java 命令来运行的 logstash，这时候它回去寻找的 Gem 路径跟我们预计中的是不一致的。

要查看 logstash 运行时实际的 Gem 查找路径，首先要通过 ps aux 命令确定 ruby 的实际运行方式：

$ ps uax|grep logstash
raochenlin      27268  38.0  4.3  3268156 181344 s003  S+    7:10PM   0:22.36 /Library/Internet Plug-Ins/JavaAppletPlugin.plugin/Contents/Home/bin/java -Xmx500m -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -Djava.awt.headless=true -XX:CMSInitiatingOccupancyFraction=75 -XX:+UseCMSInitiatingOccupancyOnly -jar /Downloads/logstash-1.4.2/vendor/jar/jruby-complete-1.7.11.jar -I/Users/raochenlin/Downloads/logstash-1.4.2/lib /Users/raochenlin/Downloads/logstash-1.4.2/lib/logstash/runner.rb agent -f test.conf

看，实际的运行方式应该是：java -jar logstash-1.4.2/vendor/jar/jruby-complete-1.7.11.jar -Ilogstash-1.4.2/lib logstash-1.4.2/lib/logstash/runner.rb 这样。

那么我们查看 gem 路径的命令也就知道怎么写了：

java -jar logstash-1.4.2/vendor/jar/jruby-complete-1.7.11.jar `which gem` env

你会看到这样的输出：

RubyGems Environment: - RUBYGEMS VERSION: 2.1.9 - RUBY VERSION: 1.9.3 (2014-02-24 patchlevel 392) [java] - INSTALLATION DIRECTORY: file:/Downloads/logstash-1.4.2/vendor/jar/jruby-complete-1.7.11.jar!/META-INF/jruby.home/lib/ruby/gems/shared - RUBY EXECUTABLE: java -jar /Downloads/logstash-1.4.2/vendor/jar/jruby-complete-1.7.11.jar - EXECUTABLE DIRECTORY: file:/Downloads/logstash-1.4.2/vendor/jar/jruby-complete-1.7.11.jar!/META-INF/jruby.home/bin - SPEC CACHE DIRECTORY: /.gem/specs - RUBYGEMS PLATFORMS: - ruby - universal-java-1.7 - GEM PATHS: - file:/Downloads/logstash-1.4.2/vendor/jar/jruby-complete-1.7.11.jar!/META-INF/jruby.home/lib/ruby/gems/shared - /.gem/jruby/1.9 - GEM CONFIGURATION: - :update_sources => true - :verbose => true - :backtrace => false - :bulk_threshold => 1000 - “install” => “–no-rdoc –no-ri –env-shebang” - “update” => “–no-rdoc –no-ri –env-shebang” - :sources => [“http://ruby.taobao.org/”] - REMOTE SOURCES: - http://ruby.taobao.org/ - SHELL PATH: - /usr/bin - /bin - /usr/sbin - /sbin - /usr/local/bin

看到其中的 GEM PATHS 部分，是一个以 file: 开头的路径！也就是说，要求所有的 gem 包都打包在这个 jruby-complete-1.7.11.jar 里面才认。

所以我们需要把额外的 gem 包，也加入这个 jar 里：

jar uf jruby-completa-1.7.11.jar META-INF/jruby.home/lib/ruby/1.9/CUSTOM_RUBY_GEM_LIB

注：加入 jar 是用的相对路径，所以前面这串目录要提前创建然后复制文件进去。

当然，其实还有另一个办法。

让我们返回去再看一次 logstash 的进程，在 jar 后面，还有一个 -I 参数！所以，其实我们还可以把文件安装在 logstash-1.4.2/lib 目录下去。

最后，你可能会问：那 --pluginpath 参数指定的位置可不可以呢？

答案是：也可以。

这个参数指定的位置在 logstash-1.4.2/lib/logstash/agent.rb 中，被加入了 $LOAD_PATH 中：

  def configure_plugin_path(paths)
    paths.each do |path|
      if !Dir.exists?(path)
        warn(I18n.t("logstash.agent.configuration.plugin_path_missing",
                    :path => path))
      end
      plugin_glob = File.join(path, "logstash", "{inputs,codecs,filters,outputs}", "*.rb")
      if Dir.glob(plugin_glob).empty?
        @logger.warn(I18n.t("logstash.agent.configuration.no_plugins_found",
                    :path => path, :plugin_glob => plugin_glob))
      end
      @logger.debug("Adding plugin path", :path => path)
      $LOAD_PATH.unshift(path)
    end
  end

$LOAD_PATH 是 Ruby 的一个特殊变量，类似于 Perl 的 @INC 或者 Java 的 class_path 。在这个数组里的路径下的文件，都可以被 require 导入。

可以运行如下命令查看：

$ java -jar logstash-1.4.2/vendor/jar/jruby-complete-1.7.11.jar -e 'p $LOAD_PATH'
["file:/Users/raochenlin/Downloads/logstash-1.4.2/vendor/jar/rar/jruby-complete-1.7.11.jar!/META-INF/jruby.home/lib/ruby/1.9/site_ruby", "file:/Users/raochenlin/Downloads/logstash-1.4.2/vendor/jar/rar/jruby-complete-1.7.11.jar!/META-INF/jruby.home/lib/ruby/shared", "file:/Users/raochenlin/Downloads/logstash-1.4.2/vendor/jar/rar/jruby-complete-1.7.11.jar!/META-INF/jruby.home/lib/ruby/1.9"]

这三种方式，你喜欢哪种呢？

Kibana 认证鉴权方案

2014-09-23T00:00:00+00:00

Kibana 作为一个纯 JS 项目，一直都没有提供完整的权限控制方面的功能。只是附带了一个 nginx.conf 做基本的 Basic Auth。社区另外有在 nodejs 上实现的方案，则使用了 CAS 方式做认证。

不过我对这两种方案都不太满意。

认证方式太单一，适应性不强；
权限隔离不明确，只是通过修改 kibana-int 成 kiban-int-user 来区分不同用户的 dashboard，并不能限制用户对 ES 索引的访问。

加上 nodejs 我也不熟，最终在多番考虑后，决定抽一个晚上自己写一版。

最终代码见 https://github.com/chenryn/kibana。

原理和实现

全站代理和虚拟响应

这里不单通过 config.js 限定了 kibana 默认连接的 Elasticsearch 服务器地址和端口，还拦截伪造了 /_nodes 请求的 JSON 响应体。伪造的响应中也只包含自己这个带认证的 web 服务器地址和端口。

这么做是因为我的 kibana 版本使用的 elasticjs 库比官方新增了 sniff 功能，默认会自动轮训所有 nodes 发送请求。
新增 kibana-auth 鉴权索引

在通常的 kibana-int-user 区分 dashboard 基础上，我新增加 kibana-auth 索引，专门记录每个用户可以访问的 ES 集群地址和索引前缀。请求会固定代理到指定的 ES 集群上，并且确认是被允许访问的索引。

这样，多个用户通过一个 kibana auth 服务器网址，可以访问多个不同的 ES 集群后端。而同一个 ES 集群后端的索引，也不用担心被其他人访问到。
Authen::Simple 认证框架

这是 Perl 一个认证框架，支持十多种不同的认证方式。项目里默认采用最简单的 htpasswd 文件记录方式，实际我线上是使用了 LDAP 方式，都没问题。

部署

方案采用了 Mojolicious 框架开发，代码少不说，最关键的是 Mojolicious 无额外的 CPAN 模块依赖，这对于不了解 Perl 但是又有 Kibana 权限控制需求的人来说，大大减少了部署方面的麻烦。

curl -Lk http://cpanmin.us -o /usr/local/bin/cpanm
chmod +x /usr/local/bin/cpanm
cpanm Mojolicious Authen::Simple::Passwd

三行命令，就可以完成整个项目的安装需求了。然后运行目录下的:

hypnotoad script/kbnauth

就可以通过 80 端口访问这个带有权限控制的 kibana 了。

2015 年 1 月 6 日更新：

目前已经提供了 bundle 方式。有编译环境的可以直接用

./vendor/bin/carton install --cached
./vendor/bin/carton exec local/bin/hypnotoad script/kbnauth

权限赋值

因为 kibana-auth 结构很简单，kibana 一般又都是内部使用，所以暂时还没做权限控制的管理页面。直接通过命令行方式即可赋权：

curl  -XPOST http://127.0.0.1:9200/kibana-auth/indices/sri -d '{
  "prefix":["logstash-sri","logstash-ops"],
  "server":"192.168.0.2:9200"
}'

这样，sri 用户，就只能访问 192.168.0.2 集群上的 logstash-sri 或 logstash-ops 开头的日期型索引(即后面可以-YYYY, -YYYY.MM, -YYYY.MM.dd 三种格式)了。

下一步

考虑到新方案下各用户都有自己的 kibana-int-user 索引，已经用着官方 kibana 的用户大批量的 dashboard 有迁移成本，找个时间可能做一个迁移脚本辅助这个事情。

开发完成后，得到了 @高伟童鞋的主动尝试和各种 bug 反馈支持，在此表示感谢~也希望我这个方案能帮到更多 kibana 用户。

注：我的 kibana 仓库除了新增的这个 kbnauth 代理认证鉴权功能外，本身在 kibana 分析统计功能上也有一些改进，这方面已经得到多个小伙伴的试用和好评，自认在官方 Kibana v4 版本出来之前，应该会是最好用的版本。欢迎大家下载使用！

新增功能包括：

仿 stats 的百分比统计面板(利用 PercentileAggr 接口)
仿 terms 的区间比面板(利用 RangeFacets 接口)
给 bettermap 增强的高德地图支持(利用 leaflet provider 扩展)
给 map 增强的中国地图支持(利用 jvectormap 文件)
给 map 增强的 term_stats 数据显示(利用 TermStatsFacets 接口)
给 query 增强的请求生成器(利用 getMapping/getFieldMapping 接口和 jQuery.multiSelect 扩展)
仿 terms 的 statisticstrend 面板(利用 TermStatsFacets 接口)
仿 histogram 增强的 multifieldhistogram 面板(可以给不同query定制不同的panel setting，比如设置某个抽样数据 * 1000 倍和另一个全量数据做对比)
仿 histogram 的 valuehistogram 面板(去除了 histogram 面板的 X 轴时间类型数据限制，可以用于做数据概率分布分析)
给 histogram 增强的 threshold 变色功能(利用了 jquery.flot.threshold 扩展)
单个面板自己的刷新按钮(避免调试的时候全页面刷新的麻烦)
重写 histogram 并增强了 uniq 去重统计模式(利用 CardinalityAggr 接口)
给 terms 增强的自定义脚本化字段聚合功能(利用 scriptField 方法)
给 filterSrv 增强的自定义脚本化过滤器功能，配合上条的点击生成(利用 scriptFilter 接口)
给 table 增强的导出 CSV 功能(利用 filesaver.js)

效果截图同样在 README 里贴出。欢迎试用和反馈！

用 Spark 处理数据导入 Elasticsearch

2014-09-04T00:00:00+00:00

Logstash 说了这么多。其实运用 Kibana 和 Elasticsearch 不一定需要 logstash，其他各种工具导入的数据都可以。今天就演示一个特别的~用 Spark 来处理导入数据。

首先分别下载 spark 和 elasticsearch-hadoop 的软件包。注意 elasticsearch-hadoop 从最新的 2.1 版开始才带有 spark 支持，所以要下新版：

wget http://d3kbcqa49mib13.cloudfront.net/spark-1.0.2-bin-cdh4.tgz
wget http://download.elasticsearch.org/hadoop/elasticsearch-hadoop-2.1.0.Beta1.zip

分别解压开后，运行 spark 交互命令行 ADD_JARS=../elasticsearch-hadoop-2.1.0.Beta1/dist/elasticsearch-spark_2.10-2.1.0.Beta1.jar ./bin/spark-shell 就可以逐行输入 scala 语句测试了。

注意 elasticsearch 不支持 1.6 版本的 java，所以在 MacBook 上还设置了一下 JAVA_HOME="/Library/Internet Plug-Ins/JavaAppletPlugin.plugin/Contents/Home" 启用自己从 Oracle 下载安装的 1.7 版本的 Java。

基础示例

首先来个最简单的测试，可以展示写入 ES 的用法：

import org.apache.spark.SparkConf
import org.elasticsearch.spark._

// 更多 ES 设置，见<http://www.elasticsearch.org/guide/en/elasticsearch/hadoop/2.1.Beta/configuration.html>
val conf = new SparkConf()
conf.set("es.index.auto.create", "true")
conf.set("es.nodes", "127.0.0.1")

// 在spark-shell下默认已建立
// import org.apache.spark.SparkContext    
// import org.apache.spark.SparkContext._
// val sc = new SparkContext(conf)

val numbers = Map("one" -> 1, "two" -> 2, "three" -> 3)
val airports = Map("OTP" -> "Otopeni", "SFO" -> "San Fran")

sc.makeRDD(Seq(numbers, airports)).saveToEs("spark/docs")

这就 OK 了。尝试访问一下：

$ curl '127.0.0.1:9200/spark/docs/_search?q=*'

返回结果如下：

{"took":66,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":2,"max_score":1.0,"hits":[{"_index":"spark","_type":"docs","_id":"BwNJi8l2TmSRTp42GhDmww","_score":1.0, "_source" : {"one":1,"two":2,"three":3}},{"_index":"spark","_type":"docs","_id":"7f7ar-9kSb6WEiLS8ROUCg","_score":1.0, "_source" : {"OTP":"Otopeni","SFO":"San Fran"}}]}}

文件处理

下一步，我们看如何读取文件和截取字段。scala 也提供了正则和捕获的方法：

var text = sc.textFile("/var/log/system.log")
var Pattern = """(\w{3}\s+\d{1,2} \d{2}:\d{2}:\d{2}) (\S+) (\S+)\[(\d+)\]: (.+)""".r
var entries = text.map {
    case Pattern(timestamp, host, program, pid, message) => Map("timestamp" -> timestamp, "host" -> host, "program" -> program, "pid" -> pid, "message" -> message)
    case (line) => Map("message" -> line)
}
entries.saveToEs("spark/docs")

这里示例写了两个 case ，因为 Mac 上的 “system.log” 不知道用的什么 syslog 协议，有些在 [pid] 后面居然还有一个 (***) 才是 :。正好就可以用这个来示例如果匹配失败的情况如何处理。不加这个默认 case 的话，匹配失败的就直接报错不会存进 entries 对象了。

注意：.textFile 不是 scala 标准的读取文件函数，而是 sparkContext 对象的方法，返回的是 RDD 对象(包括后面的 .map 返回的也是新的 RDD 对象)。所以后面就不用再 .makeRDD 了。

网络数据

Spark 还有 Spark streaming 子项目，用于从其他网络协议读取数据，比如 flume，kafka，zeromq 等。官网上有一个配合 nc -l 命令的示例程序。

import org.apache.spark.streaming._
val ssc = new StreamingContext(sc, Seconds(1))
val lines = ssc.socketTextStream("localhost", 9999)
...
ssc.start()
ssc.awaitTermination()

有时间我会继续尝试 Spark 其他功能。

山寨一个 Splunk 的 source 上下文查看功能

2014-08-29T00:00:00+00:00

跟很多朋友在聊 elk stack 的时候，都会不知不觉的开始跟 Splunk 做对比。最常见的两个抱怨就是：Splunk 的搜索构建语法比 Kibana 方便，以及 Splunk 搜索出来的消息可以通过点击 Source 按钮查看其原始日志中的前后几条日志。

平心而论，这个上下文查找的功能确实在排错过程中非常有用。但是在 elk 里却不那么容易实现，原因是：

elasticsearch 是一个分布式项目，其索引的 _id 默认使用的是 UUID 方式生成的随机字符串，你没法根据 UUID 来判断数据的先后。

LogStash::Outputs::Elasticsearch 提供了让你指定 _id 内容的选项，但是在集群环境下，你很难自己搞定一个全局自增 ID。

相反，虽然我不知道 splunk 的数据存储的内部实现，但是就他昂贵的报价来说，基本只见过单机案例。就单机而言，自增 id 太轻松了

所以，从原理上来说，就很难实现一个通用的 elk 版上下文查看功能。

不过我们缩小一下使用场景，却未必不能自己山寨一个对自己可用的办法来。

假设我们一个最常见的场景，就是从各 web 服务器上收集不同日志到中心。那么这时候，通过 %{host} 和 %{path} 的 “AND” 过滤，我们就可以把范围缩小到一个单一的文件内容里。所以，我们只需要能够搞定这个文件的自增 id 就够了！

logstash.conf 示例

input {
    file {
        path => ["/var/log/*.log"]
    }
}
filter {
    ruby {
        init => '@incr={}'
        code => "key = event['host']+event['path']
                 if @incr.has_key?(key)
                     @incr[key] += 1
                 else
                     @incr[key] = 1 
                 end
                 event['lineno'] = @incr[key]"
    }
}
output {
    elasticsearch {
    }
}

上下文查询 curl 示例

使用上面的配置运行起来 logstash 之后，假设我们现在搜到一条 syslog 日志，其 lineno 是 20，那么查看它的前后 5 条记录的 curl 命令就是：

curl -XPOST 'http://localhost:9200/logstash-2014.08.29/_search?pretty=1' -d '
{
  "query":{
    "range":{
      "lineno": {
        "gt":15,
        "lte":25
      }
    }   
  },  
  "filter":{
    "term":{
      "host.raw":"raochenlindeMacBook-Air.local",
      "path.raw":"/var/log/system.log"
    }
  },
  "sort":[{"lineno":"asc"}],
  "fields":["message"],
  "size":10
}'

得到的结果是：

{
  "took" : 3,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "failed" : 0
  },
  "hits" : {
    "total" : 10,
    "max_score" : null,
    "hits" : [ {
      "_index" : "logstash-2014.08.29",
      "_type" : "logs",
      "_id" : "ILkv4oZOQRGXkH5nxjPT6Q",
      "_score" : null,
      "fields" : {
        "message" : [ "Aug 29 23:34:44 raochenlindeMacBook-Air.local stunnel[304]: LOG5[4391727104]: Service [sproxy] accepted connection from 127.0.0.1:52673" ]
      },
      "sort" : [ 16 ]
    }, {
      "_index" : "logstash-2014.08.29",
      "_type" : "logs",
      "_id" : "frRzVZUDQr-dkRog9LEypQ",
      "_score" : null,
      "fields" : {
        "message" : [ "Aug 29 23:34:44 raochenlindeMacBook-Air.local stunnel[304]: LOG5[4391727104]: s_connect: connected 50.116.12.155:65080" ]
      },
      "sort" : [ 17 ]
    }, {
      "_index" : "logstash-2014.08.29",
      "_type" : "logs",
      "_id" : "fQ50VrbuSfy6AmhNOaHpFg",
      "_score" : null,
      "fields" : {
        "message" : [ "Aug 29 23:34:44 raochenlindeMacBook-Air.local stunnel[304]: LOG5[4391727104]: Service [sproxy] connected remote server from 192.168.0.102:52674" ]
      },
      "sort" : [ 18 ]
    }, {
      "_index" : "logstash-2014.08.29",
      "_type" : "logs",
      "_id" : "Bpza8x6gSQi3OFRfAz3vPA",
      "_score" : null,
      "fields" : {
        "message" : [ "Aug 29 23:35:23 raochenlindeMacBook-Air.local stunnel[304]: LOG5[4391882752]: Service [sproxy] accepted connection from 127.0.0.1:52710" ]
      },
      "sort" : [ 19 ]
    }, {
      "_index" : "logstash-2014.08.29",
      "_type" : "logs",
      "_id" : "I7SQ4o-aSr--em1WXO0y0A",
      "_score" : null,
      "fields" : {
        "message" : [ "Aug 29 23:35:24 raochenlindeMacBook-Air.local stunnel[304]: LOG5[4391882752]: s_connect: connected 50.116.12.155:65080" ]
      },
      "sort" : [ 20 ]
    }, {
      "_index" : "logstash-2014.08.29",
      "_type" : "logs",
      "_id" : "POLq7XA_QVe6E5f9cP9V-w",
      "_score" : null,
      "fields" : {
        "message" : [ "Aug 29 23:35:24 raochenlindeMacBook-Air.local stunnel[304]: LOG5[4391882752]: Service [sproxy] connected remote server from 192.168.0.102:52711" ]
      },
      "sort" : [ 21 ]
    }, {
      "_index" : "logstash-2014.08.29",
      "_type" : "logs",
      "_id" : "sXCLVr7URu-2uKhcOP3wjA",
      "_score" : null,
      "fields" : {
        "message" : [ "Aug 29 23:35:35 raochenlindeMacBook-Air.local stunnel[304]: LOG5[4391882752]: Connection closed: 0 byte(s) sent to SSL, 0 byte(s) sent to socket" ]
      },
      "sort" : [ 22 ]
    }, {
      "_index" : "logstash-2014.08.29",
      "_type" : "logs",
      "_id" : "3wxxElNuS7OgyvjSm8CQfg",
      "_score" : null,
      "fields" : {
        "message" : [ "Aug 29 23:36:25 raochenlindeMacBook-Air.local stunnel[304]: LOG5[4391571456]: Connection closed: 2825 byte(s) sent to SSL, 2407 byte(s) sent to socket" ]
      },
      "sort" : [ 23 ]
    }, {
      "_index" : "logstash-2014.08.29",
      "_type" : "logs",
      "_id" : "xdsiB1cmRpagWiMxtAjMzQ",
      "_score" : null,
      "fields" : {
        "message" : [ "Aug 29 23:36:52 raochenlindeMacBook-Air.local stunnel[304]: LOG5[4391493632]: Connection closed: 1109 byte(s) sent to SSL, 583 byte(s) sent to socket" ]
      },
      "sort" : [ 24 ]
    }, {
      "_index" : "logstash-2014.08.29",
      "_type" : "logs",
      "_id" : "mLScPMbwTzSPMz9WqOPXlw",
      "_score" : null,
      "fields" : {
        "message" : [ "Aug 29 23:36:52 raochenlindeMacBook-Air.local stunnel[304]: LOG5[4391571456]: Service [sproxy] accepted connection from 127.0.0.1:52719" ]
      },
      "sort" : [ 25 ]
    } ]
  }
}

没错，这就是我们想要的结果了！

注释

这里两个要点：

自增 id 为啥不用行号，因为 LogStash::Inputs::File 实现是通过 File.seek 和 File.sysread(16394) 完成的，这种时候 File.lineno 永远都是 0。获取真的行号很困难。
自增 id 为什么不指定成 _id 而是另外存字段，因为 _id 是特殊字段，要求在一个 _index/_type 里是唯一的。我们对 logstash 的使用一般情况下都是多个 host 内容存在同一个 _index/_type 下，会发生重复的(重复写入 _id 相同的数据等同于 update 操作)。

延伸

数据如何通过 kibana 展示，则是另外一个层面的内容。有时间可能我会也做一下。

非 input/file 方式的其他场景，只要你能通过 event 中其他字段确定出来源唯一，都可以采用这个方式做。

用 ES 的 RangeFacets 接口实现一个查看区间占比的 Kibana 面板

2014-08-18T00:00:00+00:00

公司用 kibana 的同事提出一个需求，希望查看响应时间在不同区间内占比的饼图。第一想法是用 1.3.0 新加的 percentile rank aggregation 接口。不过仔细想想，其实并不合适 —— 这个接口目的是计算固定的 [0 TO $value] 的比例。不同的区间反而还得自己做减法来计算。稍微查了一下，更适合的做法是专门的 range aggregation。考虑到 kibana 内大多数还是用 facet 接口，这里也沿用：http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/search-facets-range-facet.html。

range facet 本身的使用非常简单，就像官网示例那样，直接 curl 命令就可以完成调试：

curl -XPOST http://localhost:9200/logstash-2014.08.18/_search?pretty=1 -d '{
    "query" : {
        "match_all" : {}
    },
    "facets" : {
        "range1" : {
            "range" : {
                "field" : "resp_ms",
                "ranges" : [
                    { "to" : 100 },
                    { "from" : 101, "to" : 500 },
                    { "from" : 500 }
                ]
            }
        }
    }
}'

不过在 kibana 里，我们就不要再自己拼 JSON 发请求了 —— 虽然之前我实现 percentile panel 的时候就是这么做的 —— 前两天合并了 github 上一个 commit 后，现在可以用高版本的 elastic.js 了，所以我也把原来用原生 $http.post 方法写的 percentile panel 用 elastic.js 对象重写了。

elastic.js 关于 range facet 的文档见：http://docs.fullscale.co/elasticjs/ejs.RangeFacet.html

因为 range facet 本身比较简单，所以 RangeFacet 对象支持的方法也比较少。一个 addRange 方法添加 ranges 数组，一个 field 方法添加 field 名称，就没了。

所以这个新 panel 的实现，更复杂的地方在如何让 range 范围值支持自定义填写。这一部分借鉴了同样是前两天合并的 github 上另一个第三方面板 multifieldhistogram 的写法。

另一个需要注意的地方是饼图出来以后，单击饼图区域，自动生成的 filterSrv 内容。一般的面板这里都是 terms 类型的 filterSrv，传递的是面板的 label 值。而我们这里 label 值显然不是 ES 有效的 terms 语法，还好 filterSrv 有 range 类型(histogram 面板的 time 类型的 filterSrv 是在 daterange 基础上实现的)，所以稍微修改就可以了。

最终效果如下：

面板的属性界面如下：

代码已经上传到我个人 fork 的 kibana 项目里：https://github.com/chenryn/kibana.git

我这个 kibana 里已经综合了 8 个第三方面板或重要修改。在官方年底推出 4.0 版本之间，自觉还是值得推荐给大家用的。具体修改说明和效果图见 README。

Kibana 动态仪表板的使用

2014-07-28T00:00:00+00:00

半年前，Kibana3.4 版刚出来的时候，曾经在官方博客上描述了一个新功能，当时我的翻译见：【翻译】Kibana3 里程碑 4。

今天我实际使用了一下这个新功能，感觉还是蛮有用的，单独拿出来记录一下用法和一些没在之前文章里提到的细节。

使用方法

使用方法其实在官方描述里已经比较清楚了。就是在原本的 http://127.0.0.1:9292/#/dashboard/file/logstash.json 地址后面，再加上请求参数 ?query=*** 即可。

注意事项

看起来好像太过简单，不过用起来其实还是有点注意事项的：

Kibana 目前不支持对保存在 Elasticsearch 中的 dashboard 做这个事情。

所以一定得保存成 yourname.json 文件放入 app/dashboards/ 目录里才行。

静态的 JSON 文件其实是利用模板技术。

所以直接导出得到的 JSON 文件还不能直接起作用。需要稍微做一点修改。

你可以打开默认可用的 logstash.json 文件，看看有什么奇特的地方，没错，就是下面这样：

"query": "{<span>{</span>ARGS.query || '*'}}"

而你自己保存下来的 JSON，这里都会是具体的数据。所以，要让自己的 JSON 布局也支持动态仪表板的话，按照这个写法也都加上 ARGS.query 就好了！

从 logstash.json 里还可以看到，除了 ?query= 以外，其实还支持 from= 参数，默认是 24h。

query 参数的特殊字符问题。

比如我之前在搜索框里输入的 querystring 是这样的：type:mweibo_action AND urlpath:"/2/statuses/friends_timeline.json" 。

那么实际用的时候，如果写成这样一个 url：http://127.0.0.1:9292/#/dashboard/file/logstash.json?query=type:mweibo_action AND urlpath:"/2/statuses/friends_timeline.json"，实际是不对的。我一度怀疑是不是 urlpath 里的 / 导致的问题，后来发现，其实是 " 在进 JSON 文件模板变量替换的时候给当做只是字符串赋值引号的作用，就不再作为字符串本身传递给 Elasticsearch 作为请求内容本身了。所以需要用 \ 给 " 做转义。

(这里一定要有 " 的原因是，ES 的 querystring 里，field:/regex/ 是正则匹配搜索的语法，刚好 url 也是以 / 开头的)

所以可用的 url 应该是：http://127.0.0.1:9292/#/dashboard/file/logstash.json?query=type:mweibo_action AND urlpath:\"/2/statuses/friends_timeline.json\"！

经过 url_encode 之后就变成了：http://127.0.0.1:9292/#/dashboard/file/logstash.json?query=type:mweibo_action%20AND%20urlpath:%5C%22%2F2%2Fstatuses%2Ffriends_timeline.json%5C%22

这样就可以了！

用 JSON 的局限。

动态仪表板其实有两种用法，这里只用到了 file/logstash.json 静态文件方式，这种方式只支持一个 query 条件，也没有太多的附加参数支持。而 script/logstash.js 方式，支持多个 query 条件，以及 index、pattern、interval、timefield 等更多的参数选项。

当然，研究一下 angularjs 的用法，给 JSON 文件里也加上 ARGS.query 的 split 方法，也不算太难。

在 MacBook 上使用 PDL 绘图

2014-07-27T00:00:00+00:00

之前在 Linux 服务器上使用 PDL，主要是一些矩阵函数，这次准备在个人电脑上使用 PDL，尤其是本身的绘图功能，其一目的就是导出 zabbix 中存储的监控数据，通过 PDL 绘图观察其季节性分布情况。

不过在使用的时候，发现在 MacBook 上跑 PDL 还是有点上手难度的。和 pylab 不同，PDL 是使用了 X11 的，而 MacBook 最新的版本里，X11 已经不再是自带的了。所以需要单独去下载 XQuartz 安装包来提供 X11 支持。

安装好了 XQuartz 以后，再安装 PDL::Graphics:: 名字空间下的几个模块就好办了。

PDL::Graphics::Simple
PDL::Graphics::Gnuplot
PDL::Graphics::PGPLOT
PDL::Graphics::Prima

另外还有 PDL::Graphics::PLplot 等，不过通过 port install plplot 安装的 plplot 没有 header 文件，所以 PDL::Graphics::PLplot 是安装不上的，既然前面已经有了不少，这里也就不再追求自己下载 plplot 源代码来安装了。

PDL::Graphics::Simple 是《PDL Book》开篇第一个示例就使用的模块，其实际就是按顺序尝试加载 ::Gnuplot、::PGPLOT、::PLplot 和 ::Prima。所以，保证有一个可用就好了。

不过在我的 air 上实际的效果来看，perldl 命令在使用子进程跟 gnuplot 交互的时候非常非常非常的慢！

好了，现在就可以运行程序了：

#!/usr/bin/env perl
use strict;
use warnings;
use utf8;
use feature ':5.16';
use Path::Tiny;
use YAML;
use PDL;
use PDL::Graphics::PGPLOT;
use Zabbix2::API;

my $config = Load( path('config.yml')->slurp );
my $zbconf = $config->{'zabbix'};
my $zabbix =
  Zabbix2::API->new(
    server => "http://$zbconf->{'addr'}/zabbix/api_jsonrpc.php" );

eval {
    $zabbix->login(
        user     => $zbconf->{'user'},
        password => $zbconf->{'pass'}
    );
};
if ($@) { die 'could not authenticate' }

my $items = $zabbix->fetch(
    'Item',
    params => {
        groupids => 21,
        hostids  => 11036,
        graphids => 1824829,
    }
);
for my $item (@$items) {
    say $item->data->{'name'};
    my $itemid = $item->data->{'itemid'};
    say $itemid;
    my $sitems = $zabbix->fetch_single(
        'Item',
        params => {
            itemids => $itemid,
        }
    );
    my $pdl = pdl(map {$_->{value}} @{ $sitems->history( time_from => time() - 24 * 3600 ) });
    bin(hist($pdl));
    my $lline = pct($pdl, 0.25);
    my $uline = pct($pdl, 0.75);
    my $low = 2 * $lline - $uline;
    my $up  = 2 * $uline - $lline;
    say $pdl->where($pdl>$up | $pdl<$low);
}

这里使用了 Zabbix2::API 模块，相对比 zabbix 官方博客示例直接使用 JSON::RPC 模块，以及 python 的 pyzabbix 模块来说，Zabbix2::API 模块封装的非常好，history 是作为 item 对象的属性出现，而不是单独再请求一次 history.get；item 的 name 等属性也非常友好和有用。

另外，不知道为什么，使用 pyzabbix 模块就一直无法正常使用，而自己写 requests 和 json 却没问题。上面的 perl 脚本用 python 改写就是下面这样：

#!/usr/bin/env python
"""
Read item history from zabbix, and plot as histogram
"""
import matplotlib
import numpy as np
import matplotlib.mlab as mlab
import matplotlib.pyplot as plt
import requests
import json
import time
from datetime import datetime

ZABBIX_URI = 'http://test.zabbix.com/zabbix/api_jsonrpc.php'
ZABBIX_USR = 'user'
ZABBIX_PWD = 'pass'
HOURS = 24 * 1

def zabbixLogin(user, passwd):
  params = {
    'user':user,
    'password':passwd
  }
  return zabbixCall('user.login', params)

def zabbixCall(method='', params={}, auth=''):
  data = {
    'jsonrpc':'2.0',
    'method':method,
    'params':params,
    'id':1
  }
  if len(auth) != 0:
    data['auth'] = auth
  r = requests.post(ZABBIX_URI, data=json.dumps(data), headers={'content-type':'application/json-rpc'})
  return r.json()['result']

authId = zabbixLogin(ZABBIX_USR, ZABBIX_PWD)
params = {
  'groupids':21,
  'hostids':11036,
  'graphids':1824829
}
items = zabbixCall('item.get', params, authId)

begin = time.mktime(datetime.now().timetuple()) - 3600 * HOURS
for item in items:
  params = {
    'output':'extend',
    'history':0,
    'itemids':item['itemid'],
    'time_from':begin
  }
  ret = zabbixCall('history.get', params, authId)
  history = map(lambda x: float(x['value']), ret)
  v = np.array(history)

  plt.figure()
  plt.hist(v, bins=200, normed=1)
  plt.title('item: ' + item['itemid'])

#  lline = numpy.percentile(v, 25)
#  uline = numpy.percentile(v, 75)
#  low = 2 * lline - uline
#  up = 2 * uline - lline
  plt.figure()
  plt.boxplot(v, sym='+', notch=True)
  plt.title('item: ' + item['itemid'])
  plt.show()

Rex::Test::Spec 模块

2014-07-08T00:00:00+00:00

上篇说了 serverspec 工具，我一直对 Rspec 的语法蛮有好感的，于是昨晚花了点时间模仿这个给 Rex 写了个类似的工具，叫 Rex::Test::Spec，源代码地址见：https://github.com/chenryn/Rex--Test--Spec。

语法大概是这样的：

    use Rex::Test::Spec;
    describe "Nginx Test", sub {
        context run("nginx -t"), "nginx.conf testing", sub {
            like its('stdout'), qr/ok/;
        };
        context file("~/.ssh/id_rsa"), sub {
            is its('ensure'), 'file';
            is its('mode'), '0600';
            like its('content'), qr/name\@email\.com/;
        };
        context file("/data"), sub {
            is its('ensure'), 'directory';
            is its('owner'), 'www';
            is its('mounted_on'), '/dev/sdb1';
            isnt its('writable');
        };
        context service("nginx"), sub {
            is its('ensure'), 'running';
        };
        context pkg("nginx"), sub {
            is its('ensure'), 'present';
            is its('version'), '1.5.8';
        };
        context cron, sub {
            like its('www'), 'logrotate';
        };
        context gateway, sub {
            is it, '192.168.0.1';
        };
        context group('www'), sub {
            ok its('ensure');
        };
        context port(80), sub {
            is its('bind'), '0.0.0.0';
            is its('proto'), 'tcp';
            is its('command'), 'nginx';
        };
        context process('nginx'), sub {
            like its('command'), qr(nginx -c /etc/nginx.conf);
            ok its('mem') > 1024;
        };
        context routes, sub {
            is_deeply its(1), {
                destination => $dest,
                gateway     => $gw,
                genmask     => $genmask,
                flags       => $flags,
                mss         => $mss,
                irtt        => $irtt,
                iface       => $iface,
            };
        };
        context sysctl, sub {
            is its('vm.swapiness'), 1;
        };
        context user('www'), sub {
            ok its('ensure');
            is its('home'), '/var/www/html';
            is its('shell'), '/sbin/nologin';
            is_deeply its('belong_to'), ['www', 'nogroup'];
        };
    };
    done_testing;

从 Rspec 学来的 context/describe/it/its 语法，保留了 Test::More 的 is/like/is_deeply/done_testing 语法。

这里把 Test::More 里导入的指令都重载了，因为把 context 指令后面的资源类型通过 local $msg 变量传递过来，就可以显示出来每个 its 测试是什么资源类型的了。因为这个原因，指令导出的时候就没法用 Exporter 模块，因为 Exporter 里的 import 函数没有 no strict;no warnings。所以得自己写 import 函数导出。

具体的资源类型，第一次学习了一下 AUTOLOAD 的用法。还是蛮好玩的~

因为我是在 Mac 上写的代码，而 Rex 本身不怎么支持 Darwin 平台，所以源码里就测了一下 run 指令可用。欢迎大家帮忙补齐其他指令的测试用例，以及如何在 Rex 的 task 里通过 SSH 方式远程做这些测试（公司平台也没法让我做这个 SSH 测试）。

Serverspec 工具介绍

2014-06-13T00:00:00+00:00

去年曾经写过一篇文章里提到做 puppet 的测试，用的是 rspec-puppet 工具。不过这个工具的作用只是能确保在 Puppet Master 上你撰写的 .pp 文件可以按照你的预期正常编译完毕，并不代表真实的节点就是按照这个状态维护的。所以今天介绍另一个工具，Serverspec，它拥有和 rspec-puppet 类似的语法(都是 Rspec 衍生品)，同时又是真的 SSH 到远程主机上去做测试！官网见：http://serverspec.org。

安装直接通过 gem install serverspec 方式即可完成。然后通过 serverspec-init 命令可以创建处理来一个测试模板：

.
├── Rakefile
└── spec
    ├── 10.4.1.21
    │   └── puppet_spec.rb
    ├── spec_helper.rb

文件其实非常简单，所以之后就可以不用命令，自己创建目录和测试文件好了。目录以远端主机 IP 命名，测试文件叫 foobar_spec.rb 也没关系，反正在 Rakefile 里是通过 spec/*/*_spec.rb 载入的。

下面是我写的这个 puppet_spec.rb 实例：

require 'spec_helper'

describe "system" do
  # TODO: bonding
  context interface('eth2') do
    it { should have_ipv4_address("192.168.0.200") }
    its(:speed) { should eq 1000 }
  end
  context file('/data') do
    it { should be_mounted.with( :type => 'ext4' ) }
  end
  context linux_kernel_parameter('vm.swappiness') do
      its(:value) { should eq 0 }
  end
  context yumrepo('epel') do
    it { should exist }
    it { should_not be_enabled }
  end
end

describe "puppetmaster" do
  context group('puppet') do
    it { should exist }
  end
  context user('puppet') do
    it { should exist }
    it { should belong_to_group 'puppet' }
    it { should_not have_login_shell '/bin/sh' }
  end
  context package('puppet') do
    it { should be_installed.by('gem').with_version('3.6.1') }
  end
  context package('nginx') do
    it { should be_installed }
  end
  context service('nginx') do
    it { should be_enabled   }
    it { should be_running   }
  end
  %w[8140 18140].each do |port|
    context port(port) do
      it { should be_listening }
    end
  end
  context file('/etc/nginx/sites-enabled/puppet') do
    it { should be_linked_to '/etc/puppet/webui/ngx_puppetmaster.conf' }
    it { should be_readable.by_user('nobody') }
    its(:content) { should match /\n\s*server 127.0.0.1:18140;/ }
  end
  context command("nginx -t") do
    it { should return_stderr /ok/ }
    it { should return_exit_status 0 }
  end
end

describe process('rrdcached') do
  it { should be_running }
  its(:args) { should match /-j \/omd\/sites\/cdn\/var\/rrdcached/ }
end

基本上可以说跟 puppet 最常用的几个类型对应的测试就都在上面展示了。此外，Serverspec 与时俱进，还提供了 cgroup 和 lxc 的测试器。这里就没写了。

这里有个注意到的问题就是网卡速度那里，是不支持测试 bonding 网卡的。它 ssh 上去后其实就是执行 ethtool 命令，ethtool 命令获取不到，自然也就没法测试，肯定会报测试失败。

另一个问题就是文件内容匹配那块，虽然文档示例里用了 /^begin/ 但是实测这个会把整个文本读成一个大字符串来匹配，所以单行的开头不能用 ^ 而是用 \n 来做。

正常情况下，写完测试用例，就可以运行 rake spec 命令跑测试了。不过熟悉我的朋友都知道人人网这边服务器都是统一通过 Kerberos 认证来管理权限的，而各种语言的 SSH 模块默认都不太支持 krb5。所以我这还需要先解决 Serverspec 的 krb5 支持问题。

感谢 @懒桃儿吃桃儿童鞋贡献的模块，部署过程如下：

$ git clone https://github.com/Lax/net-ssh-kerberos.git
$ pushd net-ssh-kerberos
$ gem build net-ssh-kerberos.gemspec
$ gem install net-ssh-krb-0.3.0.gem
$ popd
$ diff spec/spec_helper.rb spec/spec_helper.rb.orig
4,5d3
< require 'rubygems'
< require 'net/ssh/kerberos'
29d26
<       options[:auth_methods] = ["gssapi-with-mic"]

模块文档上说可以通过 Gemfile 配合 Bundler.require 指令直接运行，我测试自己写脚本的话确实没有问题，但是融合到 spec_helper.rb 里就不行，所以只能自行编译安装，然后通过 rubygems 模块来加载了。

最后，就可以看到下面这样的输出了：

$ rake spec
/usr/bin/ruby -S rspec spec/10.4.1.21/nginx_spec.rb
.......................

Finished in 9.99 seconds
23 examples, 0 failures

用 Redis 做分布式 DNS/HTTP 检测汇总系统

2014-06-13T00:00:00+00:00

一年前搞的一套小脚本，今天翻博客发现没发过，现在发上来好了。主要背景是这样：考虑到有 DNS 和 HTTP 劫持需要监控，但是很多 DNS 服务器对非本区域本运营商的来源请求是拒绝做出响应的，所以得把监控点分散到各地去。其实做这个事情用 nagios 的分布式就足够了，不过如果想做即时触发的紧急任务，就算在 nagios 页面上点击立刻执行，到返回全部结果也得有一阵子。所以选择了自己写一套分布式的异步系统。

中控端脚本如下：

#!/usr/bin/perl
use Modern::Perl;
use AnyEvent;
use AnyEvent::Redis::RipeRedis;
use Storable qw/freeze thaw/;
use YAML::Syck;
use utf8;
my $area = $ARGV[0];
my $domain = 'fmn.xnimg.cn';
my $master = '10.4.1.21';
my $cv     = AnyEvent->condvar;
my $redis  = AnyEvent::Redis::RipeRedis->new(
    host     => $master,
    port     => 6379,
    encoding => 'utf8',
);
my $dnslist = LoadFile("DNS.yml");
for my $isp ( sort keys %$dnslist ) {
    if ( defined $area ) {
        next unless defined $dnslist->{$isp}->{$area};
        say $area, $isp, join ", ", @{ $dnslist->{$isp}->{$area} };
        my $data = freeze({ domain => $domain, dnslist => $dnslist->{$isp}->{$area} });
        $redis->publish( 'task', $data );
    } else {
        for my $list ( sort keys %{ $dnslist->{$isp} } ) {
            my $data = freeze({ domain => $domain, dnslist => $dnslist->{$isp}->{$list} });
            $cv->begin;
            $redis->publish( 'task', $data );
        }
    }
}
$redis->subscribe(
    qw( report ),
    {
        on_done => sub {
            my $ch_name  = shift;
            my $subs_num = shift;
            print "Subscribed: $ch_name. Active: $subs_num\n";
        },
        on_message => sub {
            my $ch_name = shift;
            my $msg     = thaw( shift );
            printf "%s A %s @%s in %s got %s length %s\n", $domain, $msg->{ip}, $msg->{dns}, $msg->{local}, $msg->{status}, $msg->{len};
            $cv->end;
        },
        on_error => sub {
            print @_;
        },
    }
);
$cv->recv;

分布在各地的客户端脚本如下：

#!/usr/bin/perl
use Modern::Perl;
use AnyEvent;
use AnyEvent::Socket;
use AnyEvent::DNS;
use AnyEvent::Redis::RipeRedis;
use AnyEvent::HTTP;
use Storable qw/freeze thaw/;
use Digest::MD5 qw/md5_hex/;
use utf8;
my $master = '10.4.1.21';
my $local  = '192.168.0.2';
my $cv     = AnyEvent->condvar;
my $redisr = AnyEvent::Redis::RipeRedis->new(
    host          => $master,
    port          => 6379,
    encoding      => 'utf8',
);
my $redisp = AnyEvent::Redis::RipeRedis->new(
    host          => $master,
    port          => 6379,
    encoding      => 'utf8',
);
$redisr->subscribe(
    'task',
    {
        on_done => sub {
            my $ch_name  = shift;
            my $subs_num = shift;
            print "Subscribed: $ch_name. Active: $subs_num\n";
        },
        on_message => sub {
            my $ch_name = shift;
            my $msg     = thaw(shift);
            for my $dns ( @{ $msg->{dnslist} } ) {
                resolv( $dns, $msg->{domain} );
            }
        },
        on_error => sub {
            my $err_msg  = shift;
            my $err_code = shift;
            print "Error: ($err_code) $err_msg\n";
        },
    }
);
$cv->recv;
sub resolv {
    my ( $dns, $domain ) = @_;
    return unless $dns =~ m/^\d+/;
    my $resolver =
      AnyEvent::DNS->new( server => [ AnyEvent::Socket::parse_address $dns ], );
    $resolver->resolve(
        "$domain" => 'a',
        sub {
            httptest($dns, $domain, $_->[-1]) for @_;
        }
    );
}
sub httptest {
    my ($dns, $domain, $ip) = @_;
    my $url = "http://$domain/10k.html";
    my $begin = time;
    http_get $url, proxy => [$ip, 80], want_body_handle => 1, sub {
        my ($hdl, $hdr) = @_;
        my ($port, $peer) = AnyEvent::Socket::unpack_sockaddr getpeername $hdl->{'fh'};
        my $data = freeze( { dns => $dns, status => $hdr->{Status}, local => $local, ip => $peer, len => $hdr->{'content-length'} } );
        $redisp->publish('report', $data);
    };
}

这里需要单独建立两个 $redisr 和 $redisp ，因为前一个已经用来 subscribe 之后就不能同时用于 publish 了，会报错。从理解上这是个很扯淡的事情，不过实际运行结果就是如此。。。

Rex 简明手册

2014-06-12T00:00:00+00:00

Rex 是 Perl 编写的基于 SSH 链接的集群配置管理系统，语法上类似 Puppet DSL。官网中文版见 http://rex.perl-china.com 。本文仅为本人在部门 Wiki 上编写的简介性文档。

常用命令参数

rex 命令参数很多，不过因为我们的环境是 krb 认证的，所以有些参数只能写在 Rexfile 里。所以一般固定在存放了 Rexfile 的 /etc/puppet/webui 下执行命令，很多配置就自动加载了。那么还需要用到的命令参数基本就只有下面几个：

-Tv：查看当前 Rexfile 里定义了哪些 Task 任务，以及服务器组。

-H：指定 Task 将在哪些 Host 上执行。这里比较方便的地方是支持 10.5.16.[95..110] 这样的写法。

-G：指定 Task 将在哪些 Group 上执行。Group 的定义方式很多，Rex 默认支持的有直接在 Rexfile 里通过 group 指令指定，通过 ini 配置文件设定等等。目前我是实现了一个 groups_db 指令，来从我们的 sqlite 里获取。groups_db('cdnbj::nginx') 就会自动生成一个名叫 ‘cdnbj::nginx’ 的服务器组，包括 cdnbj 里所有部署了 nginx 的服务器。

-e：指定一个临时任务。通常是’say run “ipconfig”‘这样的简单命令形式。如果需要复杂逻辑，还是在 Rexfile 里书写 Task。

-q：指定运行日志级别，有 -q 和 -qq。

-d：指定运行日志级别，有 -d 和 -dd。

Rexfile 介绍

参数设置部分：

    set connection => "OpenSSH";
    user "root";
    krb5_auth;
    parallelism 10;

这四行指定采用 kerberos 认证，并发 10 个进程执行 ssh 命令。

    desc "install puppet agent";
    task "puppet_install", sub {
    }
    before "puppet_install", sub {
    }
    after "puppet_install", sub {
    }

这几行就是 Rexfile 的任务定义主体格式。task 指令定义任务，任务会在具体的 -H 或者 -G 服务器上执行。其他都是可选项，desc内容会在 -Tv 的时候显示；before 和 after 定义的任务会在执行对应 task 之前或之后，在’'’rex命令执行处，即10.4.1.21本地’'’执行。

常用指令介绍

运行命令。如果有回调函数，那么会把 stdout 和 stderr 传给回调函数；如果没有，直接把 stdout 作为返回值。

比如：

    say run "uptime";
    run "nginx -v", sub { my ($out, $err) = @_; say $err };

file

分发文件。语法类似 Puppet 的 file。支持 source、template、ensure、on_change 等操作。注意：rex 是顺序执行 Rexfile 的，所以不用设置 Puppet 的 require 指令。

比如：

    file "/etc/yum.repos.d/xiaonei-private.repo",
      source => "repos/xiaonei-private.repo";
    file "/etc/nginx/nginx.conf",
      content => template("templates/etc/nginx/nginx.conf.tpl"),
      owner  => "nginx",
      group  => "nginx",
      mode   => 644,
      ensure => 'file',
      on_change => sub { service nginx => "restart"; };
    file "/etc/nginx/conf.d",
      ensure => "directory", 

安装软件包，在早期版本命令写作 install package => "nginx" ，最近改成 pkg 了，更像 Puppet 语法了。

也支持传递数组作为 pkg 内容。另外，rex 还提供了一个 update_package_db 指令，用于执行 yum clean all 或者 apt-get update 操作。这点是 Puppet 欠缺的。

比如：

   update_package_db();
   my $packages = case operating_system,
      Debian => ["apache2", "libphp5-apache2"],
      CentOS => ["httpd", "php5"],
   pkg $packages,
     ensure => "present";

ensure 也支持 present、absent、latest 等几种含义。同 Puppet。

account

用户管理原先用 create_user 和 create_group 指令，最近把 create_user 更新为 account 指令。

比如：

  create_group 'puppet';
  account "puppet",
    ensure   => "present",
    uid      => 509,
    home     => '/home/puppet',
    comment  => 'Puppet Account',
    expire   => '2015-05-30',
    groups   => ['puppet'],
    password => 'puppet',
    system   => 1,
    no_create_home => TRUE,
    ssh_key        => "ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABAQChUw...";

tail

用来同时观测多台主机的日志的最新追加情况。应该是比较有用的一个小功能。代码如下：

   tail "/var/log/syslog", sub {
     my ($data) = @_;
     my $server = Rex->get_current_connection()->{'server'};
     print "$server>> $data\n";
   };

远程主机详情相关变量

Puppet 有专门的 Facts 变量来判定远程主机的详情。Rex 因为走 SSH 连接，不会在远程主机上跑一个 agent 来收集这些信息，所以还是通过远程执行命令的方式来提供相关内容。目前常用的几个函数(也可以认为是变量)有：

is_redhat

这个用来判断操作系统是否是 RedHat 系列。之前因为有一批 Debian 的机器，所以 Rexfile 里一直有这么个操作逻辑：

    if ( is_debian ) {
    } elsif ( is_redhat ) {
    } else {
    }

operating_system_version

这个用来判断具体的操作系统版本号。比如 CentOS5 跟 CentOS6 应该应用的操作就不一样，甚至 CentOS6.5 和 CentOS6.2 也有可能不一致。

比如 Rexfile 里的 1w10 任务：

    if ( is_redhat and operating_system_version >= 64 )
    }

route

rex 可以收集的信息比 puppet 要多很多，比如网络相关、sysctl 相关等等。Rexfile 里的 1w10 任务用到了 route 信息来获取默认网关和网卡接口。

    my ($default_route) = grep {
      $_->{"flags"} =~ m/UG/ && (
        $_->{"destination"} eq "0.0.0.0" ||
        $_->{"destination"} eq "default" )
      } route;
    if ($default_route) {
        my $default_gw = $default_route->{"gateway"};
        my $default_if = $default_route->{"iface"};
        run "ip route change default via ${default_gw} dev ${default_if} initcwnd 10 initrwnd 10";
    };

connection

在多台主机执行任务的时候，大多希望在输出的时候看到某条结果是哪个主机返回的。前面 tail 任务就用到了，不过写起来非常复杂的样子。其实 rex 提供给更简洁一点的写法。就是 connection->server。

  task 'tellmewhoyouare', sub {
    say connection->server;
  }

当前连接的服务器的整个信息，也可以通过 get_system_information 指令来获取，这两个指令其实是等同的。不过根据字面意思一般用来不同语境下。

这些信息如果要完整查看，可以通过 dump_system_information 指令来查看。这个命令跟 print Dumper get_system_information() 不一样的是，会把每个键作为单独变量。而这些变量就是可以直接用于 rex 的 template 里的内嵌变量。比如：

  listen <%= $eth0_ip %>:80;
  visible_hostname <%= $hostname %>

不在 dump_system_information 清单里的变量，也想在 template 里使用的，就必须显式传递。这点和 Puppet 不一致，puppet 在 template 里可以通过 scope.lookupvar() 指令获取任意pp类里设定的变量，这一点完全无视词法作用域的存在==！

比如：

   file '/etc/elasticsearch/elasticsearch.yml',
     content => template('files/es.yml.tmpl', conf => {
       clustername => 'logstash'
     });

对应的 es.yml.tmpl 里写作：

  clustername: <%= $conf->{'clustername'} %>

这样才行。

PerlDancer 框架笔记

2014-06-12T00:00:00+00:00

Dancer 是 Perl 的 web 开发框架，在 metacpan 上有 100 多个 like。其语法结构都起源自 Ruby 的 sinatra 框架，sinatra 曾经在自己官网上悬挂“perldancer is good”标语以示对 perldancer 的支持。Dancer 官网见： http://perldancer.org/ 本文系本人在部门 Wiki 上稍微写的几行介绍性质的笔记。

简单示例

Dancer 作为微框架，可以直接单文件快速运行简单的 web 功能。示例如下：

    use Dancer;
    get '/' => sub {
        return "hello world";
    };
    dance;

然后直接通过 perl test.pl 命令既可以在 localhost:3000 运行起来一个 hello world 页面了。

目录结构

完整的 Dancer 应用，可以通过 dancer -a MyApp 命令创建，目录结构如下：

MyApp/
├── bin
│   └── app.pl                    # 程序运行入口，可以直接通过./app.pl运行，也可以通过plackup -s Starman app.pl来切换其他高性能服务器
├── config.yml                     # 主配置文件
├── environments
│   ├── development.yml
│   └── production.yml
├── lib
│   └── MyApp.pm                  # Perl代码入口，route、controller、ORM 等都在 lib 下
├── Makefile.PL
├── MANIFEST
├── MANIFEST.SKIP
├── public                         # public/ 下的文件会直接作为静态文件发布，相当于 DocumentRoot
│   ├── 404.html
│   ├── 500.html
│   ├── css
│   │   ├── error.css
│   │   └── style.css
│   ├── dispatch.cgi
│   ├── dispatch.fcgi
│   ├── favicon.ico
│   ├── images
│   │   ├── perldancer-bg.jpg
│   │   └── perldancer.jpg
│   └── javascripts
│       └── jquery.js
├── t
│   ├── 001_base.t
│   └── 002_index_route.t
└── views                           # views/ 下的文件是页面模板，在 lib 里通过 template('index') 方式调用
    ├── index.tt
    └── layouts
        └── main.tt                 # layouts 是页面模板的底层模板，主底层模板可以在 config.yml 里指定

常用插件

目前用 Dancer 写的 CdnManage 平台，用到的插件包括：

Dancer::Template::Xslate

采用 Text::Xslate 作为模板引擎。xslate 引擎是用 XS 写的类 Perl6 语法模板引擎，性能很好。语法示例如下：

<: $object.accessor :>
<: $str :>
<: $array.0 :>
<: $hash.key :>
: for $arrayref -> $item {
    index: <: $~item :> value: <: $item :>
: }
: if ( $var == nil ) {
: } else if ( $val == "text" ) {
: } else {
:     while $dbh.fetch() -> $item {
:     }
: }

注意，CdnManage 中，因为是从 TT2 模板迁移到 xslate 里的，所以单独配置了 config.yml，没有用 : 号而是沿用了 % 号。

Dancer::Session::YAML

采用 YAML 存储 session，这个作为内部应用足够了，升级的话应该用 mysql、mongo、elasticsearch之类的存储，都有现成插件。

Plack::Middleware::Deflater
Plack::Middleware::ETag

上面两个作为给 public/ 下文件加缓存和压缩的优化。在 config.yml 里添加如下配置即可使用：

plack_middlewares:
  -
    - Plack::Middleware::Deflater
    - Plack::Middleware::ETag

Dancer::Plugin::Auth::Extensible

给 route 加认证功能，有 require_role 和 require_user 两种形式，示例如下：

    get '/admin' => require_user 'admin' => sub {};
    post '/purge' => require_role qr/^purge_\w+/ => sub {};

Dancer::Plugin::Email

发邮件

Dancer::Plugin::GearmanXS

将需要较长时间运行完的任务通过 gearman 分发到其他后台任务脚本上去完成。

Dancer::Plugin::Datebase

数据库插件，可以直接按照 DBI 操作，也提供了简单的 quick_select/insert 等指令。示例如下：

    get '/users/:id' => sub {
        template 'display_user', {
            person => database->quick_select('users', { id => params->{id} }),
        };
    };

如果在 config.yml 定义了多个库，则通过 database('name') 的方式来调用。

  Database:
    connections:
      puppet:
        driver: "SQLite"
        database: "/etc/puppet/webui/node_info.db"
      cdnmanage:
        driver: "mysql"
        database: "cdnmanage"
        host: "127.0.0.1"
        port: 3306
        username: "user"
        password: "pass"
        connection_check_threshold: 10
        on_connect_do: ["SET NAMES 'utf8'", "SET CHARACTER SET 'utf8'" ]

更完善的 ORM 使用，见 Dancer::Plugin::DBIC 插件，他使用的是 DBIx::Class 框架做 ORM，示例如下：

    get '/users/:user_id' => sub {
        my $user = schema('default')->resultset('User')->find(param 'user_id');
        # 如果只有一个默认的schema在config.yml里那么上面这行可以简写成下行
        $user = rset('User')->find(param 'user_id');
        template user_profile => {
            user => $user
        };
    };

Dancer::Plugin::ElasticSearch

elasticsearch 插件，类似 Dancer::Plugin::Database；所以同理，也有更偏 ORM 一点的 Dancer::Plugin::ElasticModel 插件。

Dancer::Plugin::Deferred

页面消息提示插件。使用示例：

    hook before => sub {
        if (    request->uri =~ m#^/puppetdb/#
            and request->uri !~ m#^/puppetdb/api/#
            and !user_has_role('SOM') )
        {
            deferred error => 'no permission';
            redirect '/';
        }
    };

然后在底层模板layouts/main.tt 中：

%% if $deferred.error {
  <div class="alert alert-success"> [% $deferred.error %] </div>
%% }

Dancer::Plugin::Ajax

扩展默认的 get/post/delete/put 指令，提供 ajax 指令。

Dancer::Plugin::SimpleCRUD

提供简便的数据库 CRUD 操作表单。目前 Puppet 的 SQLite 操作实例如下：

  simple_crud(
    db_connection_name => 'puppet',
    db_table           => 'node_info',
    key_column         => 'id',
    prefix             => 'node_info',
    record_title       => 'Puppet Node',
    deleteable         => 1,
    paginate           => 50,
    validation         => {
        classes     => '/^(\w,?)+$/',
        role        => '/^\w+$/',
        environment => '/^\w+$/',
    },
    message => {
        classes => 'enter like "puppetd,repos"',
        role    => 'an english word only',
    },
    display_columns => [qw(node_fqdn environment role)],
    custom_columns  => {
        include_classes => {
            raw_column => 'classes',
            transform  => sub {
                my @classes = split( /,/, shift );
                my $self    = shift;
                my $role    = $self->{'role'};
                my $env     = $self->{'environment'};
                my @lines;
                push @lines, "<a href='/puppetdb/$env/$_/$role/view'>$_</a>"
                  for @classes;
                return join( " / ", @lines );
            },
        },
    },
  );

Perl 编程的个人惯例

2014-06-12T00:00:00+00:00

Perl 代码规范可以参考著名的《Perl 最佳实践》一书。当然，PBP 上的规定比较严格，实际生活中绝对多数 Perl 程序都无法通过以 PBP 规范编写的 Perl::Critic 模块的校验。本文仅为本人在部门 Wiki 上以部分常见用法作为示例的介绍性文档。

格式化

所有已经完成功能的 Perl 脚本，强烈推荐使用 Perl::Tidy 模块格式化其内容。具体命令为：

perltidy your.pl && mv your.pl.tdy your.pl

模板

为调试和使用方便，强烈建议在所有 Perl 程序开始位置使用如下模板：

    use warnings;
    use strict;
    use utf8;

这个模板最重要最常见的作用，就是说，程序内不允许直接使用未经初始化的变量，强制要求指定变量作用域范围，也不允许跨越词法作用域调用变量。

此外，考虑 CentOS6 已经成为我们线上主流操作系统，建议继续添加下行模板：

    use 5.010;

10 版本是 Perl5 的一次重大更新，添加了 state 变量、say 指令、// 判断符、%+ 正则捕获哈希、given-when流程和 ~~ 智能匹配符，都是比较常用和好用的功能。

注释与文档

Perl 注释以 ‘#’ 号开头，但是并没有提供方便的读取注释的方法。所以如果有需要，建议书写 POD 式的文档型注释。CPAN 提供有一系列模块处理程序内部的 POD 文档，比如可以直接从 POD 生成 –help 输出，README 文本等等。

POD 格式包括：

标题

  =pod

  标记文档开始

  =head1 大标题

  标记为标题文档，类似 HTML 的 <h1> ，同理还有 head2/3/4

  =over

  标记一段落开始

  =item 元素

  标记该段落中某个列表元素

  =back

  标记该段落结束。over 和 back 在用 POD 书写函数注释的时候非常常见，每个函数上面一对

代码示例

直接空四格，这点类似 markdown

变量和链接格式的快捷书写方式

C<code> 内含代码中如果本身带有<和>符号的，可以写作 C<< code >>的形式

L<name> 内含name为 CPAN 模块名，自动生成该模块在 CPAN 上的 url 地址连接

modern perl

OOP

Perl5 采用 bless 指令将一个数据结构跟一个类名结合到一起就成为了类，其最简写法如下：

    package Foo { sub new { bless shift, {} } }

但是不推荐如此构建类。强烈推荐使用 Moo 模块完成 Perl5 的 OOP。文档见： https://metacpan.org/pod/Moo

最常用的属性、继承和角色三大功能示例如下：

    package Foo {
       use Moo;
    }
    package Bar::Roles {
        use Moo::Role;
        requires 'length';
        sub width { return 'bar' };
    }
    package Foo::Bar {
        use Moo;
        extends 'Foo';
        with 'Bar::Roles';
        has name => ( is => 'ro', default => sub { return 'foo' } );
        has hight => ( is => 'lazy' );
        sub _build_hight {
            my $self = shift;
            return $self->name . $self->width;
        };
        sub length { return shift->hight };
    }
    my $fb = Foo::Bar->new( name => 'myfoo' );
    print $fb->length;                            # myfoobar

TODO

Perl5 有独特的 TODO 语法叫 ‘…‘，在没有实现的地方，使用这个指令就可以了。不运行到这个地方就毫无影响，到这里就会直接显示“Unimplemented at line N”的返回。

示例如下：

    sub somthing_todo {
        ...
    }

正则

正则式是　Perl5 最强大和头疼的地方。这里不好说太多。只能说，能找到 CPAN 模块实现的，就不要自己写正则了。。。

如果要写，尽量使用 ‘/x’ 开启多行模式，然后每行写注释。

最常用的正则模块有 Regexp::Common 和 Regexp::Log。

日志处理方面，对 IP 归类建议采用 Net::IP::Match::Trie 模块。此外，前缀树优化在 Perl5.14 开始成为正则引擎默认行为，所以请尽量使用新版本。

文件操作

open指令请使用三参数结构避免歧义以及恶意文件名问题：

   open my $fh, '>', 'data.txt' or die "$!";

在 5.10.1 以后，autodie 模块进入 corelist，所以可以这样：

   use autodie;
   open my $fh, '>', 'data.txt';

更好的版本，推荐 Path::Tiny 模块，这是最近一年来在 metacpan 上多次周评分榜单第一的模块。

    use Path::Tiny;
    my $f = path('data.txt');
    # 不存在就先创建
    $f->touch unless $f->exists;
    # 读取全部内容
    print $f->slurp;
    # 按行读取内容
    while ($f->lines) { print };
    # 写入内容
    $f->spaw('new data');
    # 追加内容
    $f->append('newer data');
    # 目录操作
    my $d = path('/tmp');
    for ( $d->children( qr/^\.\w$/ ) ) { print $_->stat };
    # 类似 File::Find
    my $iter = $d->iterator({recurse => 1});
    while ( my $next = $iter->() ) { print $_->stringify }

而 File::Find 的更好的替代版本，推荐 Path::Iterator::Rule 模块，速度也比上面 Path::Tiny 里的 ‘$d->iterator()’ 要好。

网络操作

HTTP 客户端一直以来一般使用 LWP::UserAgent 模块，不过作为小规模应用，推荐使用 HTTP::Tiny 模块，因为该模块已经在 Perl5.14 版本进入 corelist，在简单请求下性能也比 LWP 要好，不少模块已经在迁移依赖到 HTTP::Tiny 上。

而对于高性能需求，推荐使用 AnyEvent::HTTP 模块，基于 EV 事件驱动库，示例如下：

    use AnyEvent::HTTP;
    use AnyEvent;
    my $cv = AnyEvent->condvar;
    for my $url ( @urls ) {
        $cv->begin;
        http_get $url, sub {
            my ($data, $headers) = @_;
            $cv->end;
        }
    }
    $cv->recv;

如需并发控制，事件流程的同步控制等功能，推荐使用 Promises 或者 Future 模块。同名的相关概念目前在 JS 和 Scala 中都有。

对于 HTML 解析，较为规范的情况下，不要再使用正则解析，而通过 DOM 树本身来做。以 XPath 路径查询的，推荐 Web::Scraper 模块；以 CSS 选择器查询的，推荐 Mojo::UserAgent 配合 Mojo::DOM 模块完成。示例如下：

    say Mojo::UserAgent->new->get('www.perl.org')->res->dom->html->head->title->text;

非 HTTP 的网络编程，一般使用 IO::Socket::INET 模块，这里推荐继续使用 AnyEvent::Socket 模块，以利用 AnyEvent 的事件驱动性能。示例如下：

    tcp_server undef, 8888, sub { my ($fh, $host, $port) = @_; syswrite $fh "hello"; }
    tcp_connect 'localhost', 8888, sub { my $fh = shift; sysread $fh, my $msg, 8; print $msg; }

web 编程

CGI.pm 已经从 Perl5.20 开始准备移出 corelist，所以不要再使用 CGI 做 web 编程了，Plack/PSGI 才是王道。作为简单应用，推荐使用 Dancer 微框架，完整的复杂应用，可以使用 Mojolicious 框架。

Dancer 框架示例如下：

    use Dancer;
    get '/:name' => sub {
        return 'hello '.param('name');
    };
    dance;

用 LEK 组合处理 Nginx 访问日志

2014-06-11T00:00:00+00:00

Tengine 支持通过 syslog 方式发送日志（现在 Nginx 官方也支持了），所以可以通过 syslog 发送访问日志到 logstash 平台上，这种做法相对来说对线上服务器影响最小。最近折腾这件事情，一路碰到几个难点，把解决和优化思路记录一下。

少用 Grok

感谢群里 @wood 童鞋提供的信息，Grok 在高压力情况下确实比较容易率先成为瓶颈。所以在日志格式可控的情况下，最好可以想办法跳过使用 Grok 的环节。在早先的 cookbook 里，就有通过自定义 LogFormat 成 JSON 样式的做法。我前年博客上也写过 nginx 上如此做的示例：http://chenlinux.com/2012/09/21/json-event-for-logstash/index.html。

不过这次并没有采用这种方式，而是定义日志格式成下面的样子，因为这种分割线方式对 Hive 平台同样是友好的。

log_format syslog '$remote_addr|$host|$request_uri|$status|$request_time|$body_bytes_sent|'
                  '$upstream_addr|$upstream_status|$upstream_response_time|'
                  '$http_referrer|$http_add_x_forwarded_for|$http_user_agent';
access_log syslog:user:info:10.4.16.68:29125:tengine syslog ratio=0.1;

那么不用 Grok 怎么做呢？这里有一个很炫酷的写法。下面是 logstash 配置里 filter 段的实例：

filter {
    ruby {
        remove_field => ['@version', 'priority', 'timestamp', 'logsource', 'severity', 'severity_label', 'facility', 'facility_label', 'pid','message']
        init => "@kname = ['client','servername','url','status','time','size','upstream','upstreamstatus','upstreamtime','referer','xff','useragent']"
        code => "event.append(Hash[@kname.zip(event['message'].split('|'))])"
    }
    mutate {
        convert => ["size", "integer", "time", "float", "upstreamtime", "float"]
    }
    geoip {
        source => "client"
        fields => ["country_name", "region_name", "city_name", "real_region_name", "latitude", "longitude"]
        remove_field => [ "[geoip][longitude]", "[geoip][latitude]" ]
    }
}

而要达到跟这段 ruby+mutate 效果一致的 grok ，写法是这样的：

filter {
    grok {
        match => ["message", "%{IPORHOST:client}\|%{HOST:servername}\|%{URIPATHPARAM:url}\|%{NUMBER:status}\|(?:%{NUMBER:time:int}|-)\|(?:%{NUMBER:size}|-)\|(?:%{HOSTPORT:upstream}|-)\|(?:%{NUMBER:upstreamstatus}|-)\|(?:%{NUMBER:upstreamtime:int}|-)\|(?:%{URI:referer}|-)\|%{GREEDYDATA:xff}\|%{GREEDYDATA:useragent}"]
        remove_field => ['@version', 'priority', 'timestamp', 'logsource', 'severity', 'severity_label', 'facility', 'facility_label', 'pid','message']
    }
}

syslog 瓶颈

运行起来以后，通过 Kibana 看到的全网 tengine 带宽只有 60 MBps左右，这个结果跟通过 NgxAccounting 统计输出的结果差距太大了。明显是有问题。

首先怀疑不会是 nginx.conf 通过 Puppet 下发重启的时候有问题吧？实际当然没有。

这时候运行 netstat -pln | grep 29125 命令，发现 Recv-Q 已经达到了 228096，并且一致维持在这个数没有变化。

由于之前对 ES 写入速度没太大信心，所以这时候的反应就是去查看 ES 服务器的状态，结果其实服务器 idle% 在 80% 以上，各种空闲，Kibana 上搜索反应也非常快。通过 top 命令看具体的线程情况，logstash 的 output/elasticsearch worker 本身占用资源就很少。包括后来实际也尝试了加大 output 的 workers 数量，加大 bin/logstash -w 的 filter worker 数量，其实都没用。

那么只能是 input/syslog 就没能收进来了。

之前写 filter 的时候，开过 -vv 模式，所以注意到过 input/syslog 里是利用 Logstash::Filter::Grok 来判定切割 syslog 内容的。按照前一节的说法，那确实可能是在收 syslog 的时候性能跟不上啊？

于是去翻了一下 Logstash::Input::Syslog 的代码，主体逻辑很简单，就是 Thread.new { UDPSocket.new } 这样。也就是说是一个单线程监听 UDP 端口！

然后我又下载了同为 Ruby 写的日志收集框架 fluentd 的 syslog 插件看看源代码，fluent-plugin-syslog 里，用的是 Cool.io 库作 UDP 异步处理。好吧，其实在此之前我只知道 EventMachine 库。。。不过由于 Logstash 是 JRuby 平台，又不清楚其 event 代码(以前基本只是看各种 plugin 的代码就够了)，担心这么把 em 加上去会不会不太好。所以在摸清 logstash 代码之前，先用自己最熟悉的手段，搞定这个问题：

用 Perl 的高性能 EV 库解决

前年我同样提到过 Perl 也有仿照 Logstash 写的框架叫 Message::Passing，这个框架就是用 AnyEvent 和 Moo 写的，性能绝对没问题。不过各种插件和文档比较潦草，要想兼容现在 logstash 1.4 的 schema 比较费劲。所以，最后我选择了自己根据 tengine 日志的情况单独写一个脚本，结果如下：

80 行左右的代码，从 input 到 output 都是 anyevent 驱动。( Search::Elasticsearch::Async 默认是基于 AnyEvent::HTTP 的，不过用 Promises 模块做了封装，所以写起来好像看不太出来～)

最终到 elasticsearch 里的数据结构跟 logstash 一模一样，之前配置好的 Kibana 样式完全不需要变动。而实际运行起来以后，Recv-Q 虽然不是一直保持在 0，但是偶然累积的队列也肯定会在几秒钟内被读取处理完毕。完全达到了效果。Kibana 上，带宽图回复到了跟 NgxAccounting 统计结果一样的 300 MBps 。成功！

配合 avbot 的 HTTP 接口做自动应答的 Perl 脚本

2014-06-08T00:00:00+00:00

前两天博客里介绍了 avbot，其中提到 avbot 提供了 HTTP 接口可以收发信息。那么，我们就可以自己写脚本来实现比原先的 .qqbot help 更详细的自动应答啦。今晚有空就写了几行 Perl ，实现了一个简单的扩展：

use utf8;
use strict;
use warnings;
use JSON::XS;
use AnyEvent;
use AnyEvent::HTTP;

my $f = {
    help => ".logstashbot support subcommand:\n\t",
    grok => '请主动使用 http://grokdebug.herokuapp.com',
    tnnd => '请直接说问题不要浪费口水问有人帮忙么',
    book => '支持原作者，请购买 www.logstashbook.com 上电子版',
};
$f->{'help'} .= join("\n\t", keys %$f);

$AnyEvent::HTTP::TIMEOUT = 86400;
my $url = 'http://127.0.0.1:6176/message';
my $cv = AnyEvent->condvar;

my $ua;$ua = sub {
    $cv->begin;
    http_get $url, sub {
        my ($data, $header) = @_;
        my $hash = decode_json $data;
        my $msg = $hash->{'message'}{'text'};
        my $from = '@' . $hash->{'who'}{'nick'} . '(' . $hash->{'who'}{'code'} . ")\n";
        if ( $msg =~ /^\.logstashbot (\w+)/ ) {
            my $body = encode_json({
                protocol => delete $hash->{'protocol'},
                channel  => delete $hash->{'channel'},
                message  => {
                    text => $from . ( $f->{$1} // $f->{'help'} ),
                },
            });
            $cv->begin;
            http_post $url, $body, sub {
                $cv->end;
            };
        };
        $ua->();
        $cv->end;
    };
};
$ua->();

$cv->recv;

原先是打算在回调里 undef $ua 然后通过 AnyEvent->timer 里检测 $ua 是否还在，否则再起来的方式。后来一想 timer 还有间隔，直接函数内部通过 $cv->end 控制计数，不断的重新运行 $ua->() 来保持持续获取，间隔更短，就改成现在这样了。

用 Perl5 改写 skyline 异常检测算法

2014-06-04T00:00:00+00:00

一直以来都知道 Perl5 里也有类似 numpy 的库叫 PDL，但是因为上手资料比较少，官网文档比较烂，就没认真看过。这次因为要了解 skyline 里用到的 9 种异常检测算法的具体原理，正好一一对照重写一下，当做是学习 PDL 了。

最终修改完的 Perl5 版如下：

要承认 PDL 在上手方面比不过 numpy，比如取数组长度，PDL 里居然写作 $p->nelem；取数组最后一个元素的值，更是要写作 $p->index($p->nelem - 1) 这么长！相比在 numpy 方面几乎看起来还是跟操作原生的 python 类型一样。。妈蛋 PDL 你多重载几个操作符会死啊！

2014 年 06 月 09 日更新：在blogs.perl.org上得到指点，可以用 $p->at(-1) 来获取。PDL 自己的文档里 ->at() 的示例都是获取数组的……

稍微复杂一点的多维操作 PDL 还是很方便的。比如程序里 least_squares 检验法的时候，numpy 有这么一句：

    A = np.vstack([x, np.ones(len(x))]).T

而在 PDL 里可以写作：

    my $A = $x->dummy(0)->append(1);

PDL 里也有 ones() 函数来生成全部由 1 构成的数组，不过我觉得上面这个写法明显更好理解最终目的，就是90°倒转数组然后每个元素作为子数组后面加第二个元素嘛。

当然，比较好玩的是最后我发现 least_squares 在 PDL 里可以直接搞出来结果，不用这么复杂

比较基础的数值统计还是比较好搞的，麻烦的是一些现成的正态分布检验法。python 版里使用的是 K-S 检验法——其实只是命名，里面实际还用了 A-D 检验法做改进——我还记得这是 skyline 开源以后社区人帮忙实现的，Etsy 一开始都没有。按说 K-S 检验法是非常基础的一个，但是我找遍了 CPAN 确实就没有(大概是因为 Perl 里调用 R 太方便了，大家都习惯直接用 Statistics::R 模块吧)。于是最后这个改成 S-W 检验法。

根据 SPSS 的规范，一般在数值序列长度小于 5000 的时候，S-W 检验法可信度高于 K-S 检验法；大于 5000 的时候，K-S 检验法可信度大于 S-W 检验法。

考虑这里一般只会检查最近一个小时的数据。一个小时内就算一秒钟一次也就是 3600 个点。事实上应该至少是 10 秒钟出一个统计值才会做比较。那么也就是几百个点，用 S-W 检验法应该更有效。

在重写这个脚本的时候，找到了很多关于这方面的资料，下面这两个链接应该是非常不错:

此外，脚本中本身用到的 ta-lib 和 Statistics::Distributions 模块也还有更多的算法函数提供，值得留意。

注：PDL::Finance::Talib 模块必须先自己编译了 ta-lib 依赖后才能安装。之前测试在美团云主机上做的，结果还安装失败。后来发现是内存不够大==!然后在作者的指导下学会一招，在内存不够大的机器上，可以删除掉 CCFLAGS 里的 -pipe 参数，也能正常编译通过。

用 avbot 机器人记录 QQ 群聊天记录

2014-06-04T00:00:00+00:00

这是一件蛮有趣的事情。我因为做 logstash 的 QQ 群管理员，碰到了一个幸福的烦恼：群里有不少高水平且乐于分享的朋友时常给人解答问题，而且一来一回的能牵扯出来不少让人眼前一亮的实践，但是 QQ 聊天记录不像邮件列表和 IRC 那样可以很方便的长期保存共享给后来人学习查找！这简直是国内参与开源技术最头疼的一件事情了，知识没法复用，偏偏越是需要这些知识的人，越是喜欢通过 QQ 来寻求帮助！前两天偶然想到，其实可以通过机器人潜水进来获取聊天记录，然后发布出来！询问了一下 @比尔盖子V 童鞋，他推荐给我 avbot 项目。#妈蛋这名字怎能不吐槽#

作者非常 nice 的提供好了 RPM 可以直接安装在服务器上。所以安装步骤真的就没啥可讲的了。

不过这个项目本意是做 QQ、IRC 和 XMPP 的互联互通，所以把心思用来了 --map 的实现，作为我们这里只想单单记录 QQ 群聊天记录来说，它不支持指定只获取某个群的记录，所以最好的办法就是新申请一个 QQ 号，只加这一个群……

运行起来以后，会在当前目录下生成一个 avlog.db 库，记录聊天记录，同时生成一个 QQ 群号命名的目录，里面按日期存放当天的聊天记录的 HTML 文件。直接用 nginx 发布出来就好啦！

照搬 avbot 官网 demo 页面做好了 logstash 群聊天记录的查看搜索页，见：http://logstash.chenlinux.com/

下一步可以做的事情是做自动应答。已经测试过可以通过 RPC 接口收发消息。不过昨天碰到的一个怪事情是，没能准确收到 QQ 群号，于是变成了 none，结果发送就一直失败。这个重启进程让他重新获得一次就可以了。

收消息示例：

curl 'http://localhost:6176/message'
{
    "protocol": "qq",
    "channel": "315428175",
    "room":
    {
        "code": "3614128622",
        "groupnumber": "315428175",
        "name": "Logstash"
    },
    "op": "0",
    "who":
    {
        "code": "225519360",
        "nick": "田间",
        "name": "田间",
        "qqnumber": "",
        "card": ""
    },
    "preamble": "qq(田间): ",
    "message":
    {
        "text": "我们这暂时没运维   "
    }
}

发消息示例：

curl -XPOST http://localhost:6176/message -d '{"protocol":"qq","channel":"315428175","message":{"text":"Hi, my name is logstashbot, this message came from curl command!"}}'

直接从 elasticsearch 获取数据进入 skyline 异常检测

2014-06-04T00:00:00+00:00

这几天搭建 elasticsearch 集群做日志分析，终于有机会可以实际跑一下 skyline 的效果。不过比较麻烦的事情是，skyline 是一个比较完备的系统而不是插件，要求我们把数据通过 msgpack 发过去存到 redis 里。这是个很没有道理的做法，早在去年刚看到这个项目的时候我就在博客里写下了愿景是应该用 elasticsearch 替换掉 redis。等了这么久没等到，干脆就自己动手实现。修改后，skyline 其余的程序完全可以直接扔掉，只留下这一个脚本定时运行就够了：

其实改动的地方很少~这让我愈发不理解 etsy 原来那样做的理由了。

这里面主要就是拼了一下 elasticsearch 的 date_histogram 类型的 facet 请求，获取最近 1 个小时的每 5 分钟统计值构成的时间序列数据。然后发给前面那些检验算法。

之前用过 js 和 perl 的 elasticsearch 客户端，对象封装的都蛮细的，而 python 的这个客户端写起来就非常像 curl 命令了。

如果要推广用，把里面这个 code.504 提出来做一个可配置项就行了。

巧用 Puppet 的 stdlib 库

2014-05-28T00:00:00+00:00

这几天上线机器给 Elasticsearch 集群扩容，开始撰写 Puppet 的 elasticsearch 类来规范化管理。这里碰到一个小问题，相信在很多大容量集群的机器上都会有。那就是每台机器上都挂载有十几二十块磁盘，怎么用 Puppet 给快速方便的创建各磁盘上的工作目录呢？

一个一个写 File 资源申明肯定不可取；File 资源申明支持接受数组，但是二十多个元素写一个大数组也没方便到哪里去。有没有比较简单的办法来生成这个大数组，而不是手写呢？

有，就是使用 Puppet 官方出的这个 stdlib 库 http://forge.puppetlabs.com/puppetlabs/stdlib。

安装方法很简单，在 Puppet Master 上运行命令 puppet module install puppetlabs-stdlib 即可。

因为 puppet 默认会分发所有 module 的 lib/ 目录，所以即便你没有在自己的类里 import stdlib，也是可以直接使用它提供的各种函数的。

下面就是我的 elsticsearch 类配置：

class elasticsearch {

    $esdatadir = suffix( prefix( range(1, $::datadircount-1), '/data'), '/elasticsearch')

    package {['java-1.7.0-openjdk', 'elasticsearch']:
        ensure  => 'present',
        require => Class['repos'],
    }->
    file {$esdatadir:
        ensure  => 'directory',
        owner   => 'elasticsearch',
    }->
    file {'/etc/elasticsearch/elasticsearch.yml':
        ensure  => 'file',
        owner   => 'elasticsearch',
        content => template('elasticsearch/elasticsearch.yml.erb'),
    }
    }~>
    service {'elasticsearch':
        ensure  => true,
        enable  => true,
    }
}

其中 $::datadircount 是我自定义的 Facts 变量，插件代码见两年前的博客《puppet安装／Facter插件和puppet模板编写》。

然后 elasticsearch.yml.erb 里的数据目录配置定义如下：

path.data:
<% scope.lookupvar("elasticsearch::esdatadir").each do |dir| -%>
  - <%= dir %>
<% end %>

puppetlibs-stdlib 实现了很多对基础类型的扩展函数，比如本例中用到了 range、prefix 和 suffix 三个。依次生成了 1 到 N 的数组，给数组每个元素加上 /data 前缀字符串，再给每个元素加上 /elasticsearch 后缀字符串，最后变成了 /dataN/elasticsearch 这种格式的元素构成的数组。

puppetlibs-stdlib 实现的非常漂亮的地方是，很多函数都根据常见用途提供了不同场景下的不同行为。

比如 range 即可以 1 到 N，也可以 01 到 NN，甚至可以先加上 prefix 后再 ‘/data1’ 到 ‘/dataN’ 都支持。
比如 unique 既可以针对字符串去重，也可以针对数组元素去重。

更多函数说明，见源码仓库 README 文档。

XS 初体验

2014-05-20T00:00:00+00:00

今天翻 ganglia 源代码发现两年前加上了 perl_module 的支持，不过跟 python_module 相比，descriptors 里的 call_back 不是真的写作回调函数而是写作和实际函数同名的字符串，这点让我觉得很别扭和奇怪，于是想到去看看 gmond 里内嵌的 perl 解释程序是怎么做这步的。顺带就第一次动手写了一点 XS 代码，这里一并发上来，留作存档。

示例代码框架源自上周 Dancer 作者 SawyerX 发布的 XS-Fun 项目。所以这里如何使用 h2xs 命令创建 XS 模块文件就不讲解了。

主要分作五个小示例，由最简单到很简单依次如下：

返回一个字符串

编辑 XSFun.xs 内容如下：

#include "EXTERN.h"
#include "perl.h"
#include "XSUB.h"
#include "ppport.h"

/* C functions */

MODULE = XSFun		PACKAGE = XSFun		

# XS code

SV *
runcb()
    CODE:
        STRLEN len;
        const char* str = "testsub";
        SV* val = newSVpv(str, len);
        RETVAL = val;
    OUTPUT: RETVAL

这个其实就相当于 sub runcb { return "testsub" } 。

返回一个哈希的指定键的值

因为起因是 gmond 里的代码，所以这里就开始主要研究如何解析 descriptor 哈希的键值对了。下面是 runcb() 的代码片段：

SV *
runcb(SV *sref)
    CODE:
        HV* plhash = (HV*)(SvRV(sref));

        const char* key = "call_back";
        SV* val = *hv_fetch(plhash, key, strlen(key), 0);
        RETVAL = val;
    OUTPUT: RETVAL

这里两个要点，一个是传递进来的哈希引用如何解引用(perl程序里任何时候都不应该直接传递哈希或者数组，而应该传递引用，所以这里直接就研究这步了)；一个是 hv_fetch 的返回值是 SV** 而不是 SV*。

发现 XS 语法里比较有意思的一点，就是变量类型转换的时候，大小写的意义。像 SvRV 就是从 SV 变成 RV，而 SViv 就是从 IV 变成 SV，基本是谁大写就是转变成谁。

调用 Perl 函数并获取其返回值

刚才说到了 descriptor 里的 “call_back” 键的值其实是函数名，所以这一步就试图运行这个 Perl 函数。

SV *
runcb(SV *sref)
    CODE:
        HV* plhash = (HV*)(SvRV(sref));
        const char* key = "call_back";
        SV* cb = *hv_fetch(plhash, key, strlen(key), 0);
        int count = call_sv(cb, G_SCALAR);
        RETVAL = POPs;
    OUTPUT: RETVAL

这里的要点：

call_sv 函数(传递的是函数引用)。在 gmond 源码里用的是 call_pv 函数(传递的是函数名字符串)。可见原来在代码层这里写起来几乎是一样的，看来定义成写字符串纯粹是作者个人偏好了。
这里要给被调用的函数设定上下文，我这里要求返回字符串，就是 G_SCALAR，还有 G_VOID 等等，详见 perlcall文档。
POPs 操作。call_sv 函数返回值只代表被调用的函数的返回值个数，被调用函数的返回值本身，需要另外逐一获取，这个获取就是通过 POPs( 这个是取SV，类似的还有 POPi 等)来完成。

给被调用的 Perl 函数传参

在上面我们可以看到 call_sv 函数也没有传递参数的地方。那么怎么传递参数给被调用的 Perl 函数呢？

SV *
runcb(SV *sref, SV *argv)
    CODE:
        HV* plhash = (HV*)(SvRV(sref));
        const char* key = "callback";
        SV* cb = *hv_fetch(plhash, key, strlen(key), 0);
        STRLEN len;
        PUSHMARK(SP);
        XPUSHs(sv_2mortal(argv));
        PUTBACK;
        int ret = call_sv(cb, G_SCALAR);
        SPAGAIN;
        if (ret != 1) {
            croak("error");
        };
        SV* s = POPs;
        printf("Here: %d %s\n", ret, SvPV(s, len));
        RETVAL = s;
        PUTBACK;
    OUTPUT: RETVAL

比较复杂啦~~

这里需要有一系列处理 Perl 堆栈的命令来完成传参处理，命令以 dSP 开头，不过如果编写的是 XS 函数，这步会自动处理可以省略，所以我们这里只需要从 PUSHMARK 开始。

以 PUSHMARK 标示开始推入参数到临时区域，然后具体的推入命令是 XPUSHs(多个就重复推)，最后以 PUTBACK 标示参数推入完成。这时候 Perl 解释器就明白，给下面的 sub 准备的 @_ 已经完毕了，具体大小就是这么多不会再多了。

SPAGAIN 的作用是清理临时区域，因为说不准被调用函数里对临时区域做了什么操作。

同样是 POPs 取出，这里如果直接在 C 代码里 printf 的话，要注意把 SV 转换成 PV，否则是看不对的。

遍历哈希和返回数组

前面都是单个变量操作，最后我们来试试哈希遍历，然后返回数组变量。

AV *
runcb(SV *href)
    CODE:
        HV* plhash = (HV*)(SvRV(href));
        char *key;
        SV* sv_value;
        I32 ret;
        RETVAL = newAV();
 
        hv_iterinit(plhash);
        while ((sv_value = hv_iternextsv(plhash, &key, &ret))) {
            av_push(RETVAL, sv_value);
        }
    OUTPUT: RETVAL

这里几个要点：

runcb() 函数的返回类型要改成 AV* 了。
RETVAL 需要单独声明赋值才行。

写到这里我顺带想到，虽然 Perl5 一直都不对函数传参做什么验证，但是其实 XS 是 C 的自定义语言，所以写 XS 的时候，传参是会自动验证的。Perl5 二十年轮回，今年终于把传参验证给加上了，只能说一代人有一代人的想法啊。。。

给 Kibana 实现百分比统计图表

2014-05-17T00:00:00+00:00

kibana 图表类型中有个 stats 类型，返回对应请求的某指定数值字段的数学统计值，包括最大值、最小值、平均值、方差和标准差(当前通过 logstash-1.4.1 分发的 kibana 版本还只支持单列显示，前天，即 5 月 15 日刚更新了 Kibana 3.1 版，支持多列同时显示)。这个 stats 图表是利用 Elasticsearch 的 facets 功能来实现的。而在 Elasticsearch 1.0 版本以后，新出现了一个更细致的功能叫 aggregation，按照官方文档所说，会慢慢的彻底替代掉 facets。具体到 1.1 版本的时候， aggregation 里多了一项 percentile，可以具体返回某指定数值字段的区间分布情况。这对日志分析可是大有帮助。对这项功能，Elasticsearch 官方也很得意的专门在博客上写了一篇报道：Averages can be misleading: try a percentile。

周五晚上下班前，我突然决定试试给 Kibana 加上 percentile 图表类型。因为群里正好携程的同学说到他们仿造 trend 类型做了 stat_trend 图表，我想 percentile 从数据结构到展示方法跟 stats 都很像，应该难度不大，正好作为学习 angularjs 的入手点好了。

花了半天多的时间，基本搞定这件事情，中间几度碰到难题，这里记录一下：

kibana 3.1 中的 elasticjs 版本

这是一个非常非常坑爹的地方，kibana/src/vendor/elasticjs/elastic.js 文件开头写着版本号是 v1.1.1，但是其实它是大半年前(2013-08-14)的。而实际它加上 aggregation 支持的时间是今年的 3 月 16 号，最近版本是 3 月 21 号发布的 ——但是版本号依然是 v1.1.1！！

我在昨天晚上花了一个多小时慢慢看完了 elasticjs 官网上 v1.1.1 的接口说明，结果其实在 kibana3.1 自带的 elasticjs 上完全不可用。

elasticjs 新版用法

随后我替换成了最新的 elasticjs 文件，结果依然不可用，仔细看过文档后发现，新的 elasticjs 只专心处理请求的 DSL，把客户端初始化、配置、收发等事情都交给了 Elasticsearch 官方发布的 elasticsearch.js 来完成。原先版本自带的 elastic-angular-client.js 压根就没用了。

变动大成这样了，居然还不改版本号！？！？

elasticsearch.js 的多层目录

下载了 elasticsearch.js 源码后，发现目录里有一个 elasticsearch.angular.client.js 文件，于是我很开心的想，官方考虑的还是很周全的嘛！然后花了一阵功夫在 kibana/src/app/app.js、kibana/src/app/components/require.config.js 等各处添加上了这个 elasticsearch 模块。结果依然不可用。

原来整个 elasticsearch.js 把功能模块化拆分到了很多个不同的多层次的目录里，然后相互之间广泛采用类似 require('../lib/util/') 这样的语句进行加载。

但是：Kibana 采用的是 requirejs 和 angularjs 合作的模式，整个 js 库的加载过程完全在 kibana/src/app/components/require.config.js 一个文件里定义，你可以看到这个文件里就写了很多 jquery 的子项目文件，但是这些文件都是平铺在 kibana/src/vendor/jquery/ 这个目录里的。

所以，即便在 require.config.js 里写了 elasticsearh 也没用，文件里的 require 语句依然是报错的。而且再往下的压根没法继续添加到 require.config.js 里了，因为太复杂了，肯定得修改 elasticsearch.js 源码的各个文件。

总的来说，就是 elasticsearch.js 不适合跟 requirejs 一起工作。

至此，简单更新 js 库然后调用现成接口的计划完全破产。

感谢 Elasticsearch 本身就是一个 RESTful 接口，所以还剩下一个不太漂亮但是确实好用的办法，那就是自己组装请求数据，直接通过 angularjs 内置的 $http 收发。

aggregation_name 的限制

angularjs 的 $http.post 使用跟 jquery 的 $.post 非常类似，所以写起来难度不大，确定这个思路之后唯一碰到的问题却是 Elasticsearch 本身的新限制。

目前 Kibana 里都是以 alias 形式来区分每一个子请求的，具体内容是 var alias = q.alias || q.query;，即在页面上搜索框里写的查询语句或者是搜索框左侧色彩设置菜单里的 Legend value。

比如我的场景下，q.query 是 “xff:10.5.16.*“，q.alias 是”教育网访问”。那么最后发送的请求里这条过滤项的 facets_name 就叫 “stats_教育网访问”。

同样的写法迁移到 aggregation 上就完全不可解析了。服务器会返回一条报错说：aggregation_name 只能是字母、数字、_ 或者 - 四种。

(这里比较怪的是抓包看到 facets 其实也报错说请求内容解析失败，但是居然同时也返回了结果，只能猜测目前是处在一种兼容状态？)

于是这里稍微修改了一下逻辑，把 queries 数组的 _.each 改用 $.each 来做，这样回调函数里不单返回数组元素，还返回数组下标，下标是一定为数字的，就可以以数组下标作为 aggregation_name 了。后面处理结果的 queries.map 同样以下标来获取即可。

目前效果图如下：

我的改动已经上传到 github 上，欢迎大家一起改进。

目前的问题有两个：图表里的列排序功能不可用，还没找到原因；percents 值还没在 editor.html 里提供自定义办法。

2014.05.26 更新： percents 值已经可以自定义

2014.06.06 更新：排序功能可用。原因是 elasticsearch 不管你提交的 percents 带不带小数点，返回值里都会保留小数点后一位，而在 sortBy 里头，这个小数点就会被理解成 javascript 里获取数据结构键值的意思。所以收到响应后，用 parseInt 函数干掉小数点就可以了。

用 Graphite 存储 Nagios 数据

2014-05-10T00:00:00+00:00

我们都知道 nagios 上可以用 pnp4nagios 来转换 perfdata 成 rrd 图。不过 graphite 以其扩展性及更好的 HTTP 接口目前越来越受欢迎，加上最近刚出来的 grafana 项目(从 LEK 的 Kibana 转化来的)，更是让 graphite 的可视化效果也上了一个台阶。

那么怎么用 grafana 来查看我们用 nagios 收集来的监控数据呢？

我在 github 上看到有一个叫 graphios 的项目。不过上面介绍的方法已经比较老了，目前 omd 使用的是 npcmod 的 bulk mode，并不会分别产生 host-perfdata.$TIMET$ 和 service-perfdata.$TIMET$ 文件。所以照着 README 做是没效果的。

最好的办法就是利用 Net::Graphite 模块自己改写 process-perfdata.pl，把数据直接发给 carbon 进程。不过我懒得动手，目前只是写了几行 perl ，在调用 process-perfdata.pl 之前，先过一遍 perfdata.$TIMET 文件，分离出来 host 和 service 两个文件放到新目录里，这样就可以继续走通 graphios 的流程了。(当然性能上比较烂，因为磁盘 IO 翻倍了)

然后是 grafana 部分。grafana 本身基于 kibana 改造而来，所以也是一个纯 js 应用，不过请求 graphite 数据可能涉及跨域 ajax，要求 graphite 的 apache 配置加上几个 Header，这个照着 README 做就可以了。然后不要忘了修改 config.js 里对应的 es 和 graphite 两个服务器地址。

graphite 毕竟数据是以 tree 的唯一格式存在，所以在 grafana 上创建图形时的操作跟 kibana 上不太一样。添加 panel 后，默认是空数据的，然后要在 panel正上方的标题上点击鼠标，选择 edit，就会出现配置框。

在配置框的 Metrics 栏选择 Add query，然后 select metric 一路选择下去到你想到添加的数值。数值之后点 + 号还可以添加一些 graphite 计算的值，像平均数啊之类的。这些可以参考 graphite 接口文档。

一个简单的效果图如下：

在 Perl6 脚本中并发执行 ssh 命令

2014-05-04T00:00:00+00:00

前几天翻 Perl6 模块清单，发现没有用作 SSH 的。虽说 Perl6 里可以很方便的用 NativeCall 包装 C/C++ 库，但是 libssh2 本身就不支持我的 kerberos5 认证环境，所以还是只能通过调用系统命令的方式来完成。

Thread 示例

说起来 Perl6 近年一直在宣传 Promise 啊，Supply 啊并发编程，但是 API 变化太快，2013 年中期 jnthn 演讲里演示的 async 用法，现在就直接报这个函数不存在了，似乎改成 start 了？天知道什么时候又变。所以还是用底层的 Thread 和 Channel 来写。话说其实这还是我第一次写 Thread 呢。

use v6;
class OpenSSH {
    has $!user = 'root';
    has $!port = 22;
    has $!ssh  = "ssh -oStrictHostKeyChecking=no -l{$!user} -p{$!port} ";
    multi method exec($host, $cmd) {
        my $out;
        my $shell = $!ssh ~ $host ~ ' ' ~ $cmd;
        try { $out = qqx{ $shell }.chomp }
        CATCH { note("Failed: $!") };
        return $out;
    }
    multi method exec(@hosts, $cmd) {
        my $c = Channel.new;
        my @t = @hosts.map({
            Thread.start({
                my $r = $.exec($_, $cmd);
                $c.send($r);
            })
        });
        @t>>.finish;
        return @hosts.map: { $c.receive };
    }
}

my $ssh = OpenSSH.new(user => 'root');
say $ssh.exec('10.4.1.21', 'uptime');
my @hosts = '10.4.1.21' xx 5;
my @ret = $ssh.exec(@hosts, 'sleep 3;echo $$');
say @ret.perl;

很简陋的代码。首先一个是要确认 ssh 不用密码登陆，因为没有写 Expect；其次是没用 ThreadPool，所以并发操作不能太猛，会扭着腰的。

这里演示了几个地方：

class 的定义和 attr 的定义和用法
try-catch 的用法

也可以不写 try，直接 CATCH {}
qqx{} 的用法

这是变动比较大的地方，qqx 后面只能用 {} 不能用其他字符对了。Perl6 提供另外的 shell() 指令，返回 Proc::Status 对象。不过这个对象其实也就是个状态码，不包括标准输出、错误输出什么的。
字符串连接符 ~ 的用法
multi method 的定义和用法
函数 signature 的定义和用法，可选参数和命名参数的定义和用法见下一小节。
>> 操作符的用法

这里其实相当于是 .finish for @t。这个怪怪的操作符据说可以在可能的时候自动线程化数组操作，所以返回顺序不会跟.map一样。
xx 操作符的用法

Perl5 里有 x 操作符，Perl6 里又增加了 xx、 X 和 Z 等操作符。分别是字符扩展成数组、数组扩展成多维数组和多数组压缩单个数组(也就是zip操作)。
Channel 和 Thread 对象的用法

在 roast 测试集里，只有 thread 和 lock 的测试用例。 semaphore 其实也支持(因为 MoarVM 是基于 libuv 的嘛，libuv 支持它当然也支持)，但是连测试用例都没写……

默认的并发编程会采用 ThreadPoolScheduler 类，稍微看了一下，默认设置的线程数是 16。考虑下一步是仿照该类完善我的小脚本呢，还是重新学习一下 Supply 或者 Promise 看看到底怎么用。

有兴趣用 libssh2 的童鞋，可以学习一下 NativeCall 的用法。

ThreadPoolScheduler 示例

根据 S17-concurrency 文档的内容，改写了几行脚本，实现了 ThreadPool 的效果：

    multi method exec(@hosts, $cmd, :$parallel = 16) {
        my $c = Channel.new;
        my $s = ThreadPoolScheduler.new(max_threads => $parallel);
        @hosts.map({
            $s.cue({
                my $r = $.exec($_, $cmd);
                $c.send($r);
            })
        });
        return @hosts.map: { $c.receive };
    }

这里把默认并发值改成了 16，跟 Rakudo 保持一致。如果不需要可调的话，这里其实可以直接写成 $*SCHEDULER.cue({})。

然后调用方法也对应修改一下，考虑到辨识度，把并发值改成了命名参数。调用方法如下：

my @hosts = slurp('iplist.txt').lines;
my @ret = $ssh.exec(@hosts, 'sleep 3;echo $$', :parallel(5));

运行可以看到，虽然 iplist.txt 里放了 40 个ip，但是并发的 ssh 只有 5 个。

Promise 示例

继续，S17 内容下一节是 Promise，之前博客里已经提过几次 Perl5 的 Promises 模块或者类似的东西(比如 Mojo::IOLoop::Delay )，包括 JavaScript 等也有一样的名字。

不过 Perl5 的 Promises 思路参照的是 Scala，语法则偏向 nodejs 和 golang(都用一个叫 defer 的指令来创建 Promises 对象)，写起来跟 Perl6 的原生 Promise 差距较大。

考虑 ssh 这个场景可能不太用的上 Promise 的 .in、.then、.anyof 之类的流程控制(尤其 .in 这个还不一定能用，因为 Promise 底层也是用的 $*SCHEDULER.cue()，而这个在 MoarVM 上目前还不支持 :in/:at/:every 等参数)，就直接展示最简单的并发了：

    multi method exec(@hosts, $cmd, :$parallel = 16) {
        $*SCHEDULER = ThreadPoolScheduler.new(max_threads => $parallel);
        await @hosts.map: {
            start {
                $.exec($_, $cmd);
            };
        };
    }

简单来说，就是每个 start {&c} 创建一个 Promise 对象，根据 &c 的返回值自动作 $p.keep($result) 或 $p.break(Exception)。然后 await(*@p) 回收全部 Promise 的结果。

这里直接修改了 $*SCHEDULER ，这是一个全局变量，即当前进程的调度方式。Promise 类默认就采用这个变量。如果想跟上一小节一样使用 $s，那这里就不能用 start {} 而是要用 Promise.start({}, $s)。显然写起来不怎么漂亮。

Supply 示例

Supply 是响应式编程，类似 Java 里的 Reactive 概念。应该适合的是一件事情多个进程重复做。场景不太对，二来目前 S17 也不全，就不写了。

Perl6 的 YAML::Dumper 模块

2014-04-24T00:00:00+00:00

这两天决定试一把 Perl6，因为扶凯兄已经把还没有正式发行 Rakudo Star 包的 MoarVM 编译打包好了，所以可以跳过这步直接进入模块安装。当然，源码编译本身也没有太大难度，只不过从 github 下源码本身耗时间比较久而已。

既然木有 Star 包，那么安装好 MoarVM 上的 Rakudo 后我们就有必要先自己把 panda 之类的工具编译出来。这一步需要注意一下你的 @*INC 路径和实际的 $PERL6LIB 路径，已经编译之后的 panda 存在的 $PATH 是不是都正确，如果不对的修改一下 ~/.bashrc 就好了。

我的尝试迁移对象是一个很简单的 Puppet 的 ENC 脚本，只涉及 SQLite 的读取，以及 YAML 格式的输出。通过 panda install DBIish 命令即可安装好 DBIish 模块。

脚本本身修改起来难度不大，结果如下：

#!/usr/bin/env perl6
use v6;
use DBIish;
use YAML;
my $base_dir = "/etc/puppet/webui";
# 函数在 Perl6 中依然使用 sub 关键字定义，不过有个超酷的特性是 multi sub
# 脚本中没有用到，但是在 YAML::Dumper 中遍地都是，这里也提一句。
# MAIN 函数在 Perl6 里可以直接用 :$opt 命令参数起 getopt 的作用
# 不过 ENC 脚本就是直接传一个主机名，用不上这个超酷的特性
sub MAIN($node) {
# connect 方法接收参数选项是 |%opts，所以可以把哈希直接平铺写
# 这个 | 的用法一个月前在《Using Perl6》里看到过
    my $dbh = DBIish.connect( 'SQLite', database => "{$base_dir}/node_info.db" );
    my $sth = $dbh.prepare("select * from node_info where node_fqdn = ?");
    $sth.execute("$node");
    my $ret = $sth.fetchrow_hashref;
    my $res;
    if ( !$ret ) {
        $res = {
# Perl5 的 qw() 在 Perl6 里直接写成 <> 。也不用再通过 [] 来指明是引用
            classes     => <puppetd repos>,
            environment => 'testing',
        };
    }
    else {
        $res = {
            environment => $ret{'environment'},
            parameters  => { role => $ret{'role'} },
            classes     => {},
        };
# 这个 for 的用法，在 Perl5 的 Text::Xslate 模板里就用过
        for split(',', $ret{'classes'}) -> $class {
            if ( $class eq 'nginx' ) {
# 这个 <== 符号指明数据流方向，完全可以把数组倒过来，然后用 ==> 写这行
# 如果不习惯这种流向操作符的，可以用,号，反正不能跟 Perl5 那样啥都不写
# 这里比较怪的一点是我试图把这么长的一句分成多行写，包括每行后面加\，我看到 YAML 代码里就用\分行了，但是我这就会报错
# Perl6 的正则变化较大，这里 /^#/ 要写成 /^'#'/ 或者 /^\x23/
# 正则 // 前面不加 m// 不会立刻开始匹配
# 原先的 s///g 可以写作 s:g///，也可以写作对象式的 .subst(m//, '', :g)，. 前面为空就是默认的 $_
# 捕获的数据存在 @() 数组里，也可以用 $/[i] 的形式获取
# 字符串内插时，不再写作 ${*}，而是 {$*} 的形式
# 命名捕获这里没用上，写个示例：
#     $str ~~ /^(\w+?)$<laststr>=(\w ** 4)\w$/;
#     $/<laststr>.chomp.say;
# 注意里面的 \w{4} 变成了 \w ** 4
                my @needs <== map { .subst(m/^(.+)\:(\d+)$/, "{$/[0]} max_fails=30 weight={$/[1]}", :g) } <== grep { !m/^\x23/ } <== split(',', $ret{'extstr'});
                $res{'classes'}{'nginx'}{'iplist'} = @needs;
            }
            else {
# Perl5 的 undef 不再使用，可以使用 Nil 或者 Any 对象
                $res{'classes'}{$class} = Nil;
            }
        }
    };
    $dbh.disconnect();
# 这个 dump 就是 YAML 模块导出的函数
# Perl6 的模块要导出函数不再需要 Exporter 那样，直接用 our sub dump($obj) {} 就可以了
    say dump($res);
};

但是麻烦的是 YAML 模块本身，这个模块是 ingydotnet 在好几年前草就，后来就没管了，实际现在压根跑不起来。花了半天时间，一边学习一边修改，总算修改正常了。主要涉及了 Attribute 对象，Nil 对象，twigls 前缀符，:exists 定义几个概念，以及 YAML 格式本身的处理逻辑。

YAML 模块修改对比如下：

diff --git a/lib/YAML/Dumper.pm b/lib/YAML/Dumper.pm
index d7a7981..ec47341 100644
--- a/lib/YAML/Dumper.pm
+++ b/lib/YAML/Dumper.pm
@@ -2,16 +2,16 @@ use v6;
 class YAML::Dumper;
 
 has $.out = [];
-has $.seen is rw = {};
+has $.seen = {};
 has $.tags = {};
 has $.anchors = {};
 has $.level is rw = 0;
-has $.id is rw = 1;
+has $.id = 1;
 has $.info = [];
 
 method dump($object) {
     $.prewalk($object);
-    $.seen = {};
+    $!seen = {};
     $.dump_document($object);
     return $.out.join('');
 }
@@ -45,11 +45,11 @@ method dump_collection($node, $kind, $function) {
 
 method check_special($node) {
     my $first = 1;
-    if $.anchors.exists($node.WHICH) {
-    if $.anchors.exists($node.WHICH) {
+    if $.anchors{$node.WHICH}:exists {
         push $.out, ' ', '&' ~ $.anchors{$node.WHICH};
         $first = 0;
     }
-    if $.tags.exists($node.WHICH) {
+    if $.tags{$node.WHICH}:exists {
         push $.out, ' ', '!' ~ $.tags{$node.WHICH};
         $first = 0;
     }
@@ -64,7 +64,7 @@ method indent($first) {
             return;
         }
         if $.info[*-1]<kind> eq 'seq' && $.info[*-2]<kind> eq 'map' {
-            $seq_in_map = 1;
+            $seq_in_map = 0;
         }
     }
     push $.out, "\n";
@@ -155,7 +155,8 @@ method dump_object($node, $type) {
     $.tags{$repr.WHICH} = $type;
     for $node.^attributes -> $a {
         my $name = $a.name.substr(2);
-        my $value = pir::getattribute__PPs($node, $a.name);     #RAKUDO
+        #my $value = pir::getattribute__PPs($node, $a.name);     #RAKUDO
+        my $value = $a.get_value($node);                         #for non-parrot
         $repr{$name} = $value;
     }
     $.dump_node($repr);

这里的 $.seen 和 $!seen 是不是晕掉了？其实 $.seen 就相当于先声明了 $!seen 后再自动创建一个 method seen() { return $!seen }。

另一处是 pir::getattribute__PPs() 函数，pir 是 parrot 上的语言，而 MoarVM 和 JVM 上都是先实现了一个 nqp 再用 nqp 写 Perl6，不巧的是这个 pir 里的 getattribute__PPs() 刚好至今还没有对应的 nqp 方法。(在 pir2nqp.todo 文件里可见)

所以只能用高级的 Perl6 语言来做了。

总的来说，这个 yaml-pm6 代码里很多地方都是试来试去，同样的效果不同的写法，又比如 .WHICH 和 .WHAT.perl 也是混用。而且我随手测试了一下，即使在 parrot 上，用 pir::getattribute__PPs 的速度也比 Attribute.get_value 还差点点。

最后提一句，目前 ENC 脚本在 perl5、perl6-m、perl6-p、perl6-j 上的运行时间大概分别是 0.13、1.5、2.8、12s。MoarVM 还差 Perl5 十倍，领先 parrot 一倍。不过 JVM 本身启动时间很长，这里不好因为一个短时间脚本说它太慢。

另外还试了一下如果把我修改过的 YAML::Dumper 类直接写在脚本里运行，也就是不编译成 moarvm 模块，时间大概是 2.5s，比 parrot 模块还快点点。

不过如何把 perl6 脚本本身编译成 moarvm 的 bytecode 格式运行还没有研究出来，直接 perl6-m --target=mbc --output=name.moarvm name.pl6 得到的文件运行 moar name.moarvm 的结果运行会内存报错。

TCP Fast Open 测试(2)

2014-04-21T00:00:00+00:00

接上篇。

18 日提到采用 wireshark 而不是 tcpdump 来抓取数据。wireshark 会自动把一些数据解释成可读的内容，于是看到其实在每次 httping 发出请求的时候，第一个 SYN 包后面都有附加了 TCP FASTOPEN COOKIE 请求：

于是回头重新好好读了一下 TFO 的原理，发现自己对 TFO 的理解是有问题的 - 原先我以为在 SYN 里是可以直接带上请求数据的 - 而这很容易被攻击。实际上的流程应该是：

客户端发送 SYN 包，包尾加的是一个 FOC 请求，只有 4 字节。
服务器端收到 FOC 请求，验证后根据来源 IP 地址生成 COOKIE(8 字节)，将这个 COOKIE 加载 SYN+ACK 包的末尾发送回去。
客户端缓存住获取到的 COOKIE 可以给下一次使用。
下一次请求开始，客户端发送 SYN 包，这时候包后面带上缓存的 COOKIE，然后就是要正式发送的数据。
服务器端验证 COOKIE 正确，将数据交给上层应用处理得到响应结果，然后在发送 SYN+ACK 时，不再等待客户端的 ACK 确认，即开始发送响应数据。

示图如下：

所以可以总结两点：

第一次请求是不会有时间节约的效果的，测试至少要 httping -F -c 2。
从第二次开始节约的时间可以认为是第一个来回，httping 本身是个 HEAD 请求，可以认为是 50% 的节约。

但是用 -c 2 运行依然没有看到 RTT 变化。这时候用stap 'probe kernel.function("tcp_fastopen_cookie_gen") {printf("%d\n", $foc->len)}' 命令发现这个最重要的生成 COOKIE 的函数(net/ipv4/tcp_fastopen.c里)居然一直没有被触发！

认真阅读了一下调用这个函数的 tcp_fastopen_check 函数(net/ipv4/tcp_ipv4.c里)，原来前面首先有一步检查 sysctl 的逻辑：

    if ((sysctl_tcp_fastopen & TFO_SERVER_ENABLE) == 0 ||
        fastopenq == NULL || fastopenq->max_qlen == 0)
        return false;

这个 TFO_SERVER_ENABLE 常量是 2。而我电脑默认的 net.ipv4.tcp_fastopen 值是 1。1 只开启客户端支持 TFO，所以这里要改成 2(或者 3，如果你不打算把客户端搬到别的主机上测试的话)。

重新开始 httping 测试，RTT 依然没有缩短。这时候的 stap 命令发现 tcp_fastopen_cookie_gen 函数虽然触发了，但是函数里真正干活的这段逻辑依然没有触发(即 crypto_cipher_encrypt_one)：

void tcp_fastopen_cookie_gen(__be32 addr, struct tcp_fastopen_cookie *foc)
{
    __be32 peer_addr[4] = { addr, 0, 0, 0 };
    struct tcp_fastopen_context *ctx;

    rcu_read_lock();
    ctx = rcu_dereference(tcp_fastopen_ctx);
    if (ctx) {
        crypto_cipher_encrypt_one(ctx->tfm,
                      foc->val,
                      (__u8 *)peer_addr);
        foc->len = TCP_FASTOPEN_COOKIE_SIZE;
    }
    rcu_read_unlock();
}

我试图通过 stap 'probe kernel.function("tcp_fastopen_cookie_gen"){printf("%s\n", $$locals$$)}' 来查看这个 ctx 是什么内容。输出显示 ctx 结构里的元素值都是问号。

目前就卡在这里。

为了验证除了这步没有其他问题，我”野蛮”的通过 systemtap 修改了一下 tcp_fastopen_cookie_gen 里的变量。命令如下：

stap 'probe kernel.function("tcp_fastopen_cookie_gen") { $foc->len = 8 }'

赋值为 8，就是 TCP_FASTOPEN_COOKIE_SIZE 常量的值。

然后再运行测试，就发现 httping 的第二次运行的 RTT 时间减半了(最后那个 F 应该就是标记为 Fastopen 的意思吧)！可见目前问题就出在这里。

$ httping -F -g http://192.168.0.100 -c 2
PING 192.168.0.100:80 (/url):
connected to 192.168.0.100:80 (154 bytes), seq=0 time= 45.60 ms 
connected to 192.168.0.100:80 (154 bytes), seq=1 time= 23.43 ms  F
--- http://192.168.0.100/url ping statistics ---
2 connects, 2 ok, 0.00% failed, time 2069ms
round-trip min/avg/max = 23.4/34.5/45.6 ms

注：上面这个强制赋值 foc->len 没有改变其实 foc->val 是空的事实，所以只能是测试验证一下想法，真用的话多客户端之间会乱套的。

TCP Fast Open 测试(1)

2014-04-16T00:00:00+00:00

首先，这是一个未完成的测试。

新闻上大家都知道，Nginx从1.5.8开始支持fastopen参数，Linux从3.5开始支持fastopen特性，并在3.10开始默认开启。

httping是一个模拟ping输出的http请求客户端。从1.5开始支持发送fastopen请求，目前版本是2.3.4。

我在 fedora 20 (内核3.13版) 上编译了 nginx 1.5.13，yum 安装了 httping 2.3.3版。

开两个终端，一个运行tcpdump，然后另一个运行httping如下：

httping -F -g http://www.google.com.hk/url -c 1

这时候看到前一个终端的输出是这样的：

[chenlin.rao@com21-100 tfo]$ sudo tcpdump -i p5p1 -vvnxXs 0 tcp port 80
tcpdump: listening on p5p1, link-type EN10MB (Ethernet), capture size 65535 bytes
20:40:15.034486 IP (tos 0x0, ttl 64, id 52862, offset 0, flags [DF], proto TCP (6), length 147)
    10.2.5.100.40699 > 74.125.128.199.http: Flags [S], cksum 0xbb34 (correct), seq 3616187260:3616187335, win 29200, options [mss 1460,sackOK,TS val 31091970 ecr 0,nop,wscale 7,exp-tfo cookie 9a8e5a15f1deab96], length 75
	0x0000:  4500 0093 ce7e 4000 4006 913c 0a02 0564  E....~@.@..<...d
	0x0010:  4a7d 80c7 9efb 0050 d78a a37c 0000 0000  J}.....P...|....
	0x0020:  d002 7210 bb34 0000 0204 05b4 0402 080a  ..r..4..........
	0x0030:  01da 6d02 0000 0000 0103 0307 fe0c f989  ..m.............
	0x0040:  9a8e 5a15 f1de ab96 4845 4144 202f 7572  ..Z.....HEAD./ur
	0x0050:  6c20 4854 5450 2f31 2e30 0d0a 486f 7374  l.HTTP/1.0..Host
	0x0060:  3a20 7777 772e 676f 6f67 6c65 2e63 6f6d  :.www.google.com
	0x0070:  2e68 6b0d 0a55 7365 722d 4167 656e 743a  .hk..User-Agent:
	0x0080:  2048 5454 5069 6e67 2076 322e 332e 330d  .HTTPing.v2.3.3.
	0x0090:  0a0d 0a                                  ...
20:40:15.295644 IP (tos 0x0, ttl 30, id 42640, offset 0, flags [none], proto TCP (6), length 52)
    74.125.128.199.http > 10.2.5.100.40699: Flags [S.], cksum 0x71c1 (correct), seq 1878126810, ack 3616187261, win 42900, options [mss 1430,nop,nop,sackOK,nop,wscale 6], length 0
	0x0000:  4500 0034 a690 0000 1e06 1b8a 4a7d 80c7  E..4........J}..
	0x0010:  0a02 0564 0050 9efb 6ff1 f0da d78a a37d  ...d.P..o......}
	0x0020:  8012 a794 71c1 0000 0204 0596 0101 0402  ....q...........
	0x0030:  0103 0306                                ....
20:40:15.295694 IP (tos 0x0, ttl 64, id 52863, offset 0, flags [DF], proto TCP (6), length 115)
    10.2.5.100.40699 > 74.125.128.199.http: Flags [P.], cksum 0x5bf7 (correct), seq 1:76, ack 1, win 229, length 75
	0x0000:  4500 0073 ce7f 4000 4006 915b 0a02 0564  E..s..@.@..[...d
	0x0010:  4a7d 80c7 9efb 0050 d78a a37d 6ff1 f0db  J}.....P...}o...
	0x0020:  5018 00e5 5bf7 0000 4845 4144 202f 7572  P...[...HEAD./ur
	0x0030:  6c20 4854 5450 2f31 2e30 0d0a 486f 7374  l.HTTP/1.0..Host
	0x0040:  3a20 7777 772e 676f 6f67 6c65 2e63 6f6d  :.www.google.com
	0x0050:  2e68 6b0d 0a55 7365 722d 4167 656e 743a  .hk..User-Agent:
	0x0060:  2048 5454 5069 6e67 2076 322e 332e 330d  .HTTPing.v2.3.3.
	0x0070:  0a0d 0a                                  ...
20:40:15.560807 IP (tos 0x0, ttl 30, id 42641, offset 0, flags [none], proto TCP (6), length 40)
    74.125.128.199.http > 10.2.5.100.40699: Flags [.], cksum 0x5720 (correct), seq 1, ack 76, win 670, length 0
	0x0000:  4500 0028 a691 0000 1e06 1b95 4a7d 80c7  E..(........J}..
	0x0010:  0a02 0564 0050 9efb 6ff1 f0db d78a a3c8  ...d.P..o.......
	0x0020:  5010 029e 5720 0000 0000 0000 0000       P...W.........
20:40:15.568068 IP (tos 0x0, ttl 30, id 42642, offset 0, flags [none], proto TCP (6), length 269)
    74.125.128.199.http > 10.2.5.100.40699: Flags [P.], cksum 0x85ae (correct), seq 1:230, ack 76, win 670, length 229
	0x0000:  4500 010d a692 0000 1e06 1aaf 4a7d 80c7  E...........J}..
	0x0010:  0a02 0564 0050 9efb 6ff1 f0db d78a a3c8  ...d.P..o.......
	0x0020:  5018 029e 85ae 0000 4854 5450 2f31 2e30  P.......HTTP/1.0
	0x0030:  2034 3034 204e 6f74 2046 6f75 6e64 0d0a  .404.Not.Found..
	0x0040:  436f 6e74 656e 742d 5479 7065 3a20 7465  Content-Type:.te
	0x0050:  7874 2f68 746d 6c3b 2063 6861 7273 6574  xt/html;.charset
	0x0060:  3d55 5446 2d38 0d0a 4461 7465 3a20 5765  =UTF-8..Date:.We
	0x0070:  642c 2031 3620 4170 7220 3230 3134 2031  d,.16.Apr.2014.1
	0x0080:  323a 3430 3a31 3520 474d 540d 0a53 6572  2:40:15.GMT..Ser
	0x0090:  7665 723a 2067 7773 0d0a 436f 6e74 656e  ver:.gws..Conten
	0x00a0:  742d 4c65 6e67 7468 3a20 3134 3238 0d0a  t-Length:.1428..
	0x00b0:  582d 5853 532d 5072 6f74 6563 7469 6f6e  X-XSS-Protection
	0x00c0:  3a20 313b 206d 6f64 653d 626c 6f63 6b0d  :.1;.mode=block.
	0x00d0:  0a58 2d46 7261 6d65 2d4f 7074 696f 6e73  .X-Frame-Options
	0x00e0:  3a20 5341 4d45 4f52 4947 494e 0d0a 416c  :.SAMEORIGIN..Al
	0x00f0:  7465 726e 6174 652d 5072 6f74 6f63 6f6c  ternate-Protocol
	0x0100:  3a20 3830 3a71 7569 630d 0a0d 0a         :.80:quic....

没错，在第一个 SYN 包的时候就把 HEAD 请求带过去了。

但是发现比较奇怪的是很多时候一模一样的命令，SYN 包上就没带数据。

按我的想法，既然还是第一个 SYN 包，客户端这边压根不知道服务器端的情况，那么应该不管服务器端如何 SYN 里都带有 HEAD 请求啊？

另外，用 httping -F 命令测试自己编译的 nginx 的时候，一直都没看到正确的抓包结果，HEAD 请求一直都是在三次握手后发送的。

试图用 systemtap 来追踪一些问题。

第一步确认我的 nginx 的 socket 是不是真的开了 fastopen：

一个终端运行如下命令：

stap -e 'probe kernel.function("do_tcp_setsockopt") {printf("%d\n", $optname)}'

另一个终端启动nginx，看到前一个终端输出结果为23，查 tcp.h 可以看到 23 正是 TCP_FASTOPEN 没错！

第二步确认 httping 发送的时候是不是开了 fastopen：

一个终端运行如下命令：

stap -e 'probe kernel.function("tcp_sendmsg") {printf("%d %x\n",$msg->msg_namelen,$msg->msg_flags)}'

另一个终端运行最开始提到的 httping -F 命令，看到前一个终端输出结果为 16 20000040，查 socket.h 可以看到 MSG_FASTOPEN 是 0x20000000，MSG_DONTWAIT 是 0x40，也就是说 httping 也没问题。

现在比较郁闷的一点是：在 net/ipv4/tcp.c 里，tcp_sendmsg() 函数会判断 if ((flags & MSG_FASTOPEN))，就调用 tcp_sendmsg_fastopen() 函数来处理。但是试图用 systemtap 来调查这个函数的时候，会报一个错：

WARNING: probe kernel.function("tcp_sendmsg_fastopen@net/ipv4/tcp.c:1005") (address 0xffffffff815cca08) registration error (rc -22)

原因还未知。

留记，继续研究。

注1：发现 chrome 即使在 about:flags 里启用了 fastopen 好像也不行，必须命令行 google-chrome --enable-tcp-fastopen 这样打开才行。

注2：网上看到有人写server和client的demo演示fastopen，但其实不对，demo代码里print的数据是正常三次握手以后socket收到的。这点开tcpdump才能确认到底是什么时候发送的数据。

2014 年 04 月 18 日更新：

今天改用 wireshark 看了一下数据包，在第一个 SYN 包没有带请求数据的时候，其实最末尾可选项里是有 fastopen 的，截图如下。看来还是服务器端的问题。下一步研究 tcp_recvmsg() 函数去。

Larry Wall 来中国参加 OSTC 和 PerlChina Workshop

2014-04-07T00:00:00+00:00

见到教主真身真的很让人兴奋。在 OSTC 会场外的茶座抓住机会完成了签名跟合影。

书是从同事那搜刮来的大骆驼，自己的 Perl 书不好意思拿，因为不是教主亲著，不过后来发现绝大多数人都没大骆驼……

穿上了 PerlChina Workshop 2013 的 T恤，教主夫人帮忙在后面扯直了也让教主签名了。

OSTC 上教主讲的是自己跟开源社区的联系和小故事，以他自己最早期的时候的一个小程序 rn (read news) 的开发过程做了示例。

接着一星期后又单独举办了 PerlChina 的 Workshop，场地是一家叫 Happylatte 的手游公司的作坊，很有氛围。作坊环境的图片大家可以进 Linux Deepin 的王勇写的文章里面去看，他拍了超多图片：http://planet.linuxdeepin.com/archives/5688

PerlChina 送给教主一本全员签名的新华大字典，一个 3D 打印的教主头像。

Linux Deepin的王勇从武汉过来送给教主一个新的笔记本电脑，教主自己那台太老了……

教主首先分享，讲述了一些 Perl 语言的设计思想，跟其他语言的思想上的对比。然后现场演示了一个 Perl6 写的小程序，分别用 MoarVM、JVM 和 Parrot 三种虚拟机上的 Rakudo 实现跑了一下给我们看效果。然后基础语法什么的。

时不时还切换到 Perl6 的 IRC 频道上给外国朋友打个招呼，跑个单行命令让 rakudorobot 自动返回结果什么的：

为了演示 Unicode 支持，教主还联系中文环境，直接从字库里搜索了”“出来，然后问：为什么没有五个龙叠在一起的字呢？哈哈，看来他是把汉字当做纯象形文字来学习了。于是就少不了著名的”biangbiang面”啦：

最后教主也稍微回答了几个我们提前准备的疑问，其中一个是我问的关于 Perl6 是否会去支持直接开发安卓应用的问题，因为有 JVM 实现了嘛。教主意思是”是的，理论上可以。不过实际上现在你要是写肯定会有问题跑不起来的，留作未来吧。”另一个大家都很关心的问题是核心库的问题，一来是 Perl5 的核心库比起 Python 来说少很多，二来是 Perl6 的 Rakudo Star 也要面临这这个第三方模块打包问题了，大家都想知道核心库是怎么选择的，为什么只选择这么多，未来 Perl6 会怎么选？不过教主回答说，核心库这个概念就不该有。语言设计和开发者做好核心，第三方库是发行版的打包者去选择的事情。回答很出乎意料之外，不过想想教主对 Perl6 只写启示录，留给别人做出多种实现，思路似乎是一脉相承的吧。

接着是我们几个人的小分享，本着活泼有趣的原则，都没有讲什么严肃的话题。我讲的是如何操作微博的 API。

最后的互动，教主让大家都说说自己是怎么开始写 Perl 的。一圈说下来起因还是蛮多的。

然后又是签名合影环节。不过这次我就没再去凑热闹了，教主很口耐的估计学每个合影的人的动作搞”镜像”~哈哈

最后照全家福，大家一起说好不喊茄子喊Wall~~

腾讯云技术沙龙笔记

2014-03-30T00:00:00+00:00

昨天去车库咖啡听了 InfoQ 办的腾讯云图技术沙龙，今天又听了 CSDN 办的开源技术大会上腾讯云的宣讲(没错，就是那个发明了”内部开源”概念的意思)，总的来说，幸亏去了昨天的！

沙龙包括三个主题：

手机推送服务

手机推送其实是一个很难有亮点的服务，我之前试用过免费的 JPush 极光推送服务，应该说大家都差不多——引用SDK，通过 RESTful 接口或者网页后台发布通知。

从业务上说，腾讯云提出一个精准投放的推送概念。这其实跟后面的多维度数据是联系在一起的，腾讯因为本身(可怕)的数据收集能力，可以很容易的区分几个基础维度——年龄、性别、地域。 (今天午饭跟@刘江总编在一起，他谈到CSDN如何跟技术社区、出版社一起做技术书籍时，提到类似问题，CSDN 上也有千万级的用户，但是怎么高质量的做推荐才不透支信誉或者徒劳无功呢？)

不过在技术周边介绍中，还是聊到了腾讯的 L5 里的技术点，在这记录一下：

起因是说到服务扩容，新服务器上线时会自动根据响应质量动态调整其在集群中的权重。

这里我跟@liu点cy、@守住每一天先后猜测并推论了几种在 Nginx 的 upstream 上的实现方式及相关技术。

不过这几种方案一般常见的用途都是上下线而不是权重调整(另一个需要注意的就是在线修改upstream不会同步到nginx.conf文本文件里)。

那么就涉及到下一步问题：怎么评定响应质量？

Nginx 里是有个 HealthCheck 模块，不过还很基础。于是联想到 LVS 项目中的调度算法，常见的RR、LC、LBLC和LBLCR，少见的还有NQ、SED。这都算是根据 RS 的情况智能调整流量导向。

后来跟讲师交流，稍微了解到了 L5 内部的一点信息。

流量到应用服务之前会经过两层调度(暂称为DNS agent和local agent)；
DNS agent 负责多个 local agent 之间的流量调度；
local agent 只负责本组(原话是本机)的应用服务的流量权重调整；
一个新服务器上线，首先要经过一次镜像流量的试运行，达到5个9后才正式上线；
local agent将收到的每秒10万个请求分配 1% 给新服务器，根据平均响应延时和成功率，判定是否合格，合格就继续加流量；
如果某个服务器被判定不合格了，比如低于5个9了，也并不是直接剔除，而是减流量；除非直接成功率只有85%这样，那就是直接踢。

从流程里”本机”还是”本组”的用词，很容易让我联想到类似 docker 或者说 PAAS 平台的做法。我个人猜测确实有可能就是一组服务器，但是同时也是在一台真实主机上的多个容器。

这种做法应该适合业务运维尝试；CDN 方面，upstream 列表每次变动都会带来巨大的回源压力，反而是越少变动越好

多维度数据分析

前面提到了腾讯数据分析上最常用的几个维度就是年龄、性别和地域。但其实做数据挖掘维度是超级多的，讲师举了不少例子。

从腾讯云的概念上来说，这个数据分析主要是几个层次。

基础的经过整理和运算得到的 TopView。这个应该就是 Hive 里的表，按照讲师所说，TopView 里有 30 个左右的维度。从交流来看，这个 Hive 表内容应该就是以 QQ 号为中心的用户行为数据。每天从原始数据里花点时间更新这个表。
选取需要的维度信息做 RollUp。也就是从 TopView 的30个维度数据中选取几个维度做统计分析。这个就是排列组合问题，挨个硬算了。
合作用户如果有自定义维度，并且勾选这个维度做统计分析，就要先退回到计算 TopView 这步，把自定义维度按照 TopView 的处理方式来做。

因为对 Hadoop 的 Map/Reduce 稍有了解，也用过 Hive，所以这里的东西不算太难理解。其实整个重点是在如何用用户行为日志整理得到 TopView 这块，从讲师透露信息看，全腾讯的日志提前清洗过滤到一天只有几个 TB ，不到一百台的小集群几个小时就可以完成全部分析任务。但是这块属于纯 coding 问题，没什么太多可讲的。

在边听演讲的时候我也边思考了一下如果这个问题用 Elasticsearch 做，会怎么样？

由于ES不需要定义 schema，所以类似 TopView 整理这段应该更轻松一些； RollUp 计算就是写 bool query。这个效率如何我不太了解。

(今天的会场上有介绍腾讯大数据平台的，应该跟这个多维度分析不是一个平台，今天的讲师说到他们的平台除了Hadoop这套还用到了pgsql)

移动动态加速

这一部分是个人比较关心的部分。移动来源占比越来越大，移动网络质量却一如既往的复杂和烂。如何有效提高移动访问质量现在也是大家都关心的问题，本周网宿也刚发布了他们的私有协议加速产品。

腾讯的做法是也提供了 SDK，但本质上没有做完全的私有协议优化而是尽量利用可靠的自建私有网络，软件的部分应该是今天宣布开源了，地址在：https://code.csdn.net/Tencent/mna。

SDK 的主要工作流程如下：

APP 初次运行，正常访问流程的同时，调用 SDK 开始运作；
SDK 内置有 3 个主要运营商一共 9 个默认 ANS(应该是 application name service 的意思吧)的 IP 地址，同时向这 9 个地址发送 HTTP 请求；请求内容包括应用使用的域名、 SDK 获取到的本机 IP 和接入运营商(后二者如果获取不到，其实 ANS 通过 HTTP 本身也没问题)；
ANS 根据请求，返回尽量近的 OC、RS 和 TEST 三个 IP 地址信息；
SDK 根据最快返回的那个 ANS 的响应结果，开始并发测试本机到 OC 和 TEST 地址的链路情况；其中，OC 应该是跟 SDK 地址在同省同运营商，并且是负载最低的；TEST 应该是跟 RS 在同机房，作为 RS 的替身来参加链路测试工作；
如果 TEST 测试结果占优，那 APP 继续直连 RS，走正常访问流程就可以了；如果 OC 测试结果占优，那么 APP 之后的请求，将改为发往 OC 的地址，由 OC 转发给 RS；
在 APP 运行过程中，链路测试是定时每十分钟做一次；当然类似推送这样的长连接服务，不会因为链路测试结果切换而被主动断开。

OC 方面的主要工作包括：

TCP 代理

TCP 代理就是 sock5 代理。不过针对移动环境做了一些优化，去除了sock5里的一些验证算法；
在 TCP 方面，去掉了 nagle 算法，也就是打开了 TCP_NODELAY 参数。 nagle 算法本身是做小包合大包，提高传输效率的；不过在移动环境下，某个包的丢失或者延迟是个很常态的情况，而 nagle 算法中一个包延迟，所有包都要等在后面的情况就会被放大了，所以打开 TCP_NODELAY 应该可以避免这个情况(个人尚未测试验证过，或许可以相信腾讯)。

HTTP 代理

没细说，应该就是 squid 或者 nginx 之类的。

集群层面

每个机房都做了集群，通过 VIP 统一发布。这方面跟@守住每一天浅聊了一下通过 MPLS 协议实现 Anycast 来在多机房间维护统一的 VIP。不过看起来大家系统运维跟精通 BGP 的网络专家联系都比较远，这方面还处于有所耳闻的状态。

最后还有一个小问题，就是上面我们看到过好几处，提到”并发”、”同时”这样的字眼，于是当时产生一个疑问：“三个演讲中，都反复强调为了手机省电我们做了这做了那的，为什么为了优化级别的测试工作，却这么频繁和高密度的做并发请求呢？比如 ANS 请求，我只给本运营商的2个ip发请求也可以接受啊？”

这个问题正好被旁边围观的另一位听众解答了：手机内的 3G 通信模块，一次大批量的数据发送跟几次小批量的数据发送相比其实更省电。

讲师则从实际效果角度证明，目前的频率和策略，从使用上看，确实看不出来对电量的影响。

Perl5 的 Source Filter 功能

2014-03-10T00:00:00+00:00

去年在 p5-mop-redux 项目里看到他们在 Perl5 里实现了 Perl6 的面向对象设计的很多想法，尤其下面这段示例让人印象深刻：

    use mop;

    class Point {
        has $!x is ro = 0;
        has $!y is ro = 0;

        method clear {
            ($!x, $!y) = (0, 0);
        }
    }

    class Point3D extends Point {
        has $!z is ro = 0;

        method clear {
            $self->next::method;
            $!z = 0;
        }
    }

    my $p = Point3D->new(x => 4, y => 2, z => 8);
    printf("x: %d, y: %d, z: %d\n", $p->x, $p->y, $p->z);

这种 $!x 的变量是怎么实现的？最近几天，又在 CPAN 上看到另一个模块叫 Perl6::Attributes，实现了类似的语法。于是点进去一看，实现原来如此简单！

package Perl6::Attributes;
use 5.006001;
use strict;
no warnings;
 
our $VERSION = '0.04';
 
use Filter::Simple sub {
    s/([\$@%&])\.(\w+)/
        $1 eq '$' ? "\$self->{'$2'}" : "$1\{\$self->{'$2'}\}"/ge;
    s[\./(\w+)][\$self->$1]g;
};

原来这里用到了 Perl5.7.1 以后提供的一个新特性，叫做 Source Filters 。在解释器把 file 变成 parser 的时候加一层 filter。

Docker Meetup 参会总结

2014-03-09T00:00:00+00:00

昨天去车库咖啡参加了 Docker Meetup，一共有三位做了分享。

第一位主要演示用法，这个基本都了解；第二位描述了一下相关生态圈，我自认算是对DevOps工具和动态了解比较多的人了，听完后对这位自称10年前作为运维的Rails开发者不得不说个佩服，知道的真广泛；第三位是BAE的技术负责人，很诚恳的介绍了自己是怎么从一抹黑的环境开始摸索着搞 PAAS 平台的，波折的选型中一些想法和顾虑也都很坦白。

问答聊天过程中，大家主要纠结两个疑难：

docker 和 puppet 会是什么关系？
docker 和 kvm 会是什么关系？

这里我个人也稍微写几句我的想法：

docker 和 puppet

docker 无疑是一种非常干净的大规模部署方案。而 puppet 本质是一个配置管理工具（官网说法是通过简洁易懂的DSL描述服务器配置），注意：这里并没有提到是大规模部署，事实上 puppet 自己就有好几种完全不同架构设计的部署运行方式。

所以，从概念定义上来说，我不觉得这两者会是一个替代关系。

那么，puppet 目前的用法，如何跟 docker 一起工作呢？从当前技术点上来说有两个不适应：

puppet 非常强大的一件事情是 template 系统和 Facts 变量配合达到的灵活性。但是在 docker 容器里，Facts 变量是不可信的！ 刚才测试了一下，以 docker -m 56m run ubuntu facter | grep memorysize 得到的结果是主机原始大小512m。所以，我们原先习惯的通过 Facts 变量来自动生成最佳配置的方法失效了。事实上， docker 官博上关于 metrics 的获取有好几篇文章，也都很明确是从主机上来获取而不是容器内部。
puppet 的通用运行方式，是 agent 和 master 通过 SSL 加密交互，根据 agent 的 hostname 来查询对应配置。但是目前的 docker 里，hostname 设置(docker run -h 参数)是只对容器内部生效的，在容器外部显然无法通过 DNS 反查。以 docker 的愿景，一台主机上就应该运行几百个容器，在某个 master 里维护 hosts 列表显然不现实。而且从目前看， docker 对容器间更偏向采用 IP 的方式。比如 -link 设置的主机，就是在环境变量里提供对方主机 IP。

这两个问题可能更多的不是从技术方面来追求解决它，而是在用法上规避它或者说无视它。

首先，要习惯横向扩展而不是单机提升。应用压力上来了，第一反应不是“申请提高容器的 memory 限额”这样，而是“再开两个完全一样的容器加入负载均衡”。这就是 fip 工具提供 fip scale web=2这种命令的场景吧。这样就规避了 Facts 变量的问题，反正你只会有一种系统一种配置文件，压根用不上异构和模板技术。

其次，从 Vagrant 的 provision 里学用法。目前 Dockerfile 的 RUN 指令其实很类似 Vagrant 的 provision 中的 shell 实现。而 Vagrant 的 provision 实现还包括 puppet、chef等等。所以我们或许能琢磨一种替代 RUN 的优雅的 docker 镜像构建方式。比如 puppet-librarian 的做法或许就是一个思路。Dockerfile 里只需要 ADD 一个 Puppetfile，然后 RUN 一个 librarian-puppet 命令完成容器内一切配置。

docker 和 kvm

前面提到了 docker 中系统性能数据的采集问题。这或许就是容器和虚拟化一个差别问题，即便未来大家越来越普遍采购 ops 产品而不是自己搭建监控系统，也不会完全放心的认可主机提供商的系统性能数据，至少也还有一个核算和度量问题。

此外，容器目前比较普遍的一个用法，是一个容器里只跑一个业务进程。一个完整的业务系统的每个部分，都通过分散的各种服务相互走 API 来调用。迁移到这种环境，对传统业务显然是有重构压力的。而 kvm 虚拟机则基本没有这个问题。当然，最近也已经看到文章在讨论单个 docker 容器里运行多个不同业务进程的问题。这方面，如果 docker 真有心往替代 kvm 努力，除了网络方面的硬技术外，这个 PAAS 层已经养成的思维逻辑也需要改变。

OK，说到网络问题。目前 docker 的运用，通过 -link 来连接，或者通过 etcd、serf 这类工具来获取想要连接的其他服务器的 IP，都是一种在相同主机上的应用。看 pipework 和相关文章，似乎 openswitch 也只是做单个宿主机之上的 VLAN 划分管理？ SDN 到底是怎么回事，我现在还完全不了解。

PAAS 层的另一个习惯用法，在第三个演讲中也提到，就是一般对程序的任何更新，都是重新创建一个新容器，然后在中控转发里转移流量导向，然后删除原有容器。这个和现有 kvm 云主机的玩法也是不一样的。现在还不好评价哪种做法更优。不过个人有个疑惑： BAE 既然试图做到像 kvm 虚拟机一样，对一个用户长期锁定一个 docker 容器使用而不是随着更新开关新容器，那么整个平台上容器的创建删除频率就大大降低了，针对每个用户，整个生命周期里就只有一次初创建，那么他们为什么同时又还在纠结于容器创建和删除的速度太慢，要在 5s 内完成呢？

附

提到的从 warden 学来的 wsh 听起来蛮有趣～

如何搜索 Elasticsearch 中存储的动态请求 URL

2014-03-07T00:00:00+00:00

当我们用 logstash 处理 WEB 服务器访问日志的时候，肯定就涉及到一个后期查询的问题。

可能一般我们在 Kibana 上更多的是针对响应时间做数值统计，针对来源IP、域名或者客户端情况做分组统计。但是如果碰到这么个问题的时候呢——过滤所有动态请求的响应时间。

这时候你可能会发现一个问题：我们肯定都是用 URL 里带有问号? 来作为过滤条件。但是实际是 Kibana 里一条数据都过滤不出来。

于是我开测试库模拟了一下：

# 插入两条数据
curl http://localhost:9200/test/log/1 -d '{"url":"http://locahost/index.html"}'
curl http://localhost:9200/test/log/2 -d '{"url":"http://locahost/index.php?key=value"}'
# 搜索显示全部数据
curl http://localhost:9200/test/log/_search?pretty=1 -d '{"query":{"regexp":{"url":{"value":".*"}}}}'
# 搜索返回请求格式解析失败
curl http://localhost:9200/test/log/_search?pretty=1 -d '{"query":{"regexp":{"url":{"value":"\?.*"}}}}'
# 搜索返回空数据
curl http://localhost:9200/test/log/_search?pretty=1 -d '{"query":{"regexp":{"url":{"value":".*\\?.*"}}}}'

后来发现问题出在分词上面。

# 删除之前的测试数据和索引
curl -XDELETE http://localhost:9200/test/log
# 预定义索引类型的映射，url字段在索引的时候不分词
curl http://localhost:9200/test/log/_mapping -d '{"log":{"properties":{"url":{"index":"not_analyzed","type":"string"}}}}'
# 还是插入两条数据
curl http://localhost:9200/test/log/1 -d '{"url":"http://locahost/index.html"}'
curl http://localhost:9200/test/log/2 -d '{"url":"http://locahost/index.php?key=value"}'
# 同样的搜索请求，返回了一条结果(index.php?这条)
curl http://localhost:9200/test/log/_search?pretty=1 -d '{"query":{"regexp":{"url":{"value":".*\\?.*"}}}}'

上面这个搜索还可以简写成 Query DSL 的样式：

curl 'http://localhost:9200/test/log/_search?q=url:/.*\\?.*/&pretty=1'

而在 Logstash 比较新的 1.3.3 版本之后，有自带的 template 定义，会对每个 fields 采用 multi-fields 特性，也就是除了默认分词的 URL 字段以外，还有一个 URL.raw 字段都是不分词的。所以只要过滤这个字段就可以了。

(注意，ES1.0版的multi-fields的template写法完全不一样了，所以要用这个特性的童鞋还是谨慎测试logstash和es的版本配套)

Medcl 大神提示我：不指定 mapping 的情况下，ES 默认采用 unigram 分词。也就是切成尽可能小的单词。

转换 diagramo 绘制的拓扑图成 fig.yml 格式

2014-03-07T00:00:00+00:00

前几天在微博上跟 @易度-潘俊勇在评论里提到，已经有了 Fig 工具可以通过写一个 fig.yml 来快速定义主机上各 docker 容器的配置和角色。如果再进一步，可以通过绘图的方式，直接拖拽生成整个 docker 集群，那就更好了。

这个FIG挺有趣的，我自己写了一个类似的脚本。不过我觉得终极的解决方案是画个关系图，就配置好了。这个图的存储形式应该就是这个FIG，或者FIG可以转换为图。然后又可以转换为systemd的配置文件。

画关系图，桌面上肯定是 visio，visio保存成 XML 后分析 XML 就可以了。不过 visio 本身也算笨重的了，如果可以在浏览器中完成这个工作，才算够 cool！

网页上的 visio 已经有些产品，不过有名的几个都是有限免费试用的。好在找到一个叫做 diagramo 的项目，虽然提供的元素图表不多，但是也够用了。

下载源码包，在 LAMP/LEMP 环境下就直接跑起来，首次访问会要求注册一个用户名。环境配置中有一点必须重点点出来的：

Apache/Nginx 上配置的 server_name 必须跟你浏览器访问的完全一致

我曾经因为测试，所以写了个 localhost 做 server_name，然后用服务器 IP 地址来访问页面，结果在绘图完成保存的时候会出错！因为这是一个 HTML5 项目，保存这步是调用的 canvas.toDataURL() 函数，这个函数有强制性安全限定，以保证调用这个函数的页面，跟生成的图片路径必须是同一个域名！否则跨域抓图太方便了。

(写到这里感慨一下，chrome的调试工具不会用，这问题最后还是在 IE开发者工具的帮助下发现的 ==！)

然后就可以画关系图了，比如下图这样：

点击保存后，就会在服务器上的 $document_root/editor/data/diagrams 目录下生成对应的 .dia 和 .png 文件。这个所谓的 .dia 文件，其实内容就是 JSON数据。下面我们只要抽取 JSON 里有关的数据就可以了：

use File::Slurp;
use JSON;
use YAML;
use Test::Deep::NoTest;
use 5.010;
use warnings;
use strict;

my $hash = from_json( read_file( $ARGV[0] ) );

my $hostinfo;
for my $host ( @{ $hash->{s}->{figures} } ) {
    $hostinfo->{ $host->{id} } = Load( $host->{primitives}->[1]->{str} );
}

for my $conn ( @{ $hash->{m}->{connectors} } ) {
    my $connid = $conn->{id};
    my $start  = $conn->{turningPoints}->[0];
    my $end    = $conn->{turningPoints}->[1];
    if ( $conn->{endStyle} eq 'Normal' and $conn->{startStyle} eq 'Arrow' ) {
        ( $start, $end ) = ( $end, $start );
    }
    my ( $startid, $endid );
    for my $point ( @{ $hash->{m}->{connectionPoints} } ) {
        if (    eq_deeply( $point->{point}, $start )
            and $point->{parentId} != $connid
            and exists $hostinfo->{ $point->{parentId} } )
        {
            $startid = $point->{parentId};
        }
        elsif ( eq_deeply( $point->{point}, $end )
            and $point->{parentId} != $connid
            and exists $hostinfo->{ $point->{parentId} } )
        {
            $endid = $point->{parentId};
        }
    }
    my ($startname) = keys %{ $hostinfo->{$startid} };
    my ($endname) = keys %{ $hostinfo->{$endid} };
    push @{ $hostinfo->{$startid}->{$startname}->{link} }, $endname;
}

say Dump { map { my ($k) = keys $_; $k => $_->{$y} } values $hostinfo};

生成的 fig.yml 如下：

---
Haproxy:
  link:
   - Serf
Nginx1:
  link:
   - Serf
Serf:
Nginx2:
  link:
   - Serf
MySQL:
  link:
   - Serf

只是根据关系图生成了 link，其他配置都在图里的 Text 里照样写 yaml 格式，会自动带入。当然，示例另一个意思是：大家尽量都只 link 像 serf/etcd 这样的服务自动发现服务器。在 docker 层面就简洁明了。

Gearman 任务的优先级

2014-02-20T00:00:00+00:00

今天同事跟我说 Gearman 客户端添加任务的时候似乎设置优先级没有效果，于是去实现了一下，发现 Gearman 的任务优先级只有在任务本身属性完全一致的时候才能起到作用。比如说：新提交的 background 任务优先级虽然是 high，也不会在已经提交的非 background、优先级是 low 的任务之前执行。

考虑到之前没用过优先级，这里贴一下测试代码当做笔记：

worker

use Gearman::XS::Worker;
my $worker = new Gearman::XS::Worker;
my ($host, $port) = ('10.4.1.21', 4730); 
my $ret = $worker->add_server($host, $port);
my $ret = $worker->add_function("reverse", 0, \&reverse, $options);
 
while (1) {
  my $ret = $worker->work();
}
 
sub reverse {
  my $job = shift;
  my $workload = $job->workload();
  my $result   = $workload;
  printf("Job=%s Function_Name=%s Workload=%s Result=%s\n",
          $job->handle(), $job->function_name(), $job->workload(), $result);
 
  sleep(5);
  return $result;
}

client

use Gearman::XS::Client;
use Time::HiRes qw/time/;
my $client = new Gearman::XS::Client;
my ($host, $port) = ('10.4.1.21', 4730); 
my $ret = $client->add_server($host, $port);
while (1) {
    my ($ret, $job_handle) = $client->do_background("reverse", 'low'.time() );
} 

high-client

use Gearman::XS::Client;
use Time::HiRes qw/time/;
my $client = new Gearman::XS::Client;
my ($host, $port) = ('10.4.1.21', 4730); 
my $ret = $client->add_server($host, $port);
while (1) {
    my ($ret, $job_handle) = $client->do_high_background("reverse", 'high'.time() );
} 

同时运行三个脚本，可以看到 worker 的输出，一直都是这样：

Job=H:YZSJHL1-21.opi.com:29434227 Function_Name=reverse Workload=high:1392887687.87583 Result=high:1392887687.87583 Job=H:YZSJHL1-21.opi.com:29434228 Function_Name=reverse Workload=high:1392887687.87594 Result=high:1392887687.87594 Job=H:YZSJHL1-21.opi.com:29434229 Function_Name=reverse Workload=high:1392887687.87605 Result=high:1392887687.87605

全都是高优先级的任务

Facts 变量中 lsbdistid 和 operatingsystem 的区别

2014-02-20T00:00:00+00:00

Facts 变量是 puppet 里广泛使用的东西。在多种操作系统的混合环境中，通过 Facts 变量灵活定义不同的 package 名称、file 路径等应该是非常好用的办法。

不过关于操作系统，存在两类 Facts 变量，分别是 lsbdistid 和 operatingsystem。一般情况下，这两者结果基本一致，大家(至少我周围是)习惯采用 operatingsystem 这个一目了然的变量。

但是前两天发现有些机器的 puppet agent 运行失败，debug 后发现，居然是 operatingsystem 变量匹配不上！这台 CentOS 的服务器的 operatingsystem 结果是 OracleLinux！

翻看这两个变量的获取代码，他们的获取办法并不一致。

lsbdistid 是通过运行 lsb_release -i -s 命令获取的；
operatingsystem 是通过一串超长的 if-elif-else 逻辑来判断的。恰好其中探测 /etc/oracle-release 是否存在的步骤优先于探测 /etc/redhat-release 的步骤。

而这台服务器上，不知道怎么被人安装了一个 oraclelinux-release-5-8.0.2 的软件包，这个包里只有一个文件，就是 /etc/oracle-release！

这个软件包怎么出现的可以慢慢追查，但是这件事情本身提醒我们，operatingsystem 变量的获取方式过于简单，这些文本文件稍有问题可能就会导致错误。所以在只有 Linux 类服务器的情况，还是尽量确保所有节点都安装有 lsb_release 命令然后使用 lsbdistid 变量吧。

用 logstash 统计 Nginx 的 http_accounting 模块输出

2014-02-19T00:00:00+00:00

继续捡宝贝~

http_accounting 是 Nginx 的一个第三方模块，会每隔5分钟自动统计 Nginx 所服务的流量，然后发送给 syslog。

流量以 accounting_id 为标签来统计，这个标签可以设置在 server {} 级别，也可以设置在 location /urlpath {} 级别，非常灵活。统计的内容包括响应字节数，各种状态码的响应个数。

公司原先是有一套基于 rrd 的系统，来收集处理这些 syslog 数据并作出预警判断、异常报警。不过今天不讨论这个，而是试图用最简单的方式，快速的搞定类似的中心平台。

这里当然是 logstash 的最佳用武之地。

logstash.conf 示例如下：

input {
    syslog {
        port => 29124
    }
}
filter {
    grok {
        match => [ "message", "^%{SYSLOGTIMESTAMP:timestamp}\|\| pid:\d+\|from:\d{10}\|to:\d{10}\|accounting_id:%{WORD:accounting}\|requests:%{NUMBER:req:int}\|bytes_out:%{NUMBER:size:int}\|(?:200:%{NUMBER:count.200:int}\|?)?(?:206:%{NUMBER:count.206:int}\|?)?(?:301:%{NUMBER:count.301:int}\|?)?(?:302:%{NUMBER:count.302:int}\|?)?(?:304:%{NUMBER:count.304:int}\|?)?(?:400:%{NUMBER:count.400:int}\|?)?(?:401:%{NUMBER:count.401:int}\|?)?(?:403:%{NUMBER:count.403:int}\|?)?(?:404:%{NUMBER:count.404:int}\|?)?(?:499:%{NUMBER:count.499:int}\|?)?(?:500:%{NUMBER:count.500:int}\|?)?(?:502:%{NUMBER:count.502:int}\|?)?(?:503:%{NUMBER:count.503:int}\|?)?"
    }
    date {
        match => [ "timestamp", "MMM dd HH:mm:ss", "MMM  d HH:mm:ss" ]
    }
}
output {
    elasticsearch {
        embedded => true
    }
}

然后运行 java -jar logstash-1.3.3-flatjar.jar agent -f logstash.conf 即可完成收集入库！再运行 java -jar logstash-1.3.3-flatjar.jar web 即可在9292端口访问到 Kibana 界面。

然后我们开始配置界面成自己需要的样子：

Top-N 的流量图

点击 Query 搜索栏左边的有色圆点，弹出搜索栏配置框，默认是 lucene 搜索方式，改成 topN 搜索方式。然后填入分析字段为 accounting。

点击 Event Over Time 柱状图右上角第二个的 Configure 小图标，弹出图表配置框：

在 Panel 选项卡中修改 Chart value 的 count 为 total，Value Field 设置为 size，勾选 Seconds 项，转换 size 的累加值成每秒带宽(不然 interval 变化会导致累加值变化)；
在 Style 选项卡中修改 Chart Options 的 Bars 勾选项为 Lines，Y Format 为 bytes；
在 Queries 选项卡中修改 Charted Queries 为 selected，然后点中右侧列出的请求中所需要的那项(当前只有一个，就是*)。

保存退出配置框，即可看到该图表开始自动更新。

50x 错误的技术图

点击 Query 搜索栏右边的 + 号，添加新的 Query 搜索栏，然后在新搜索栏里输入需要搜索的内容，比如 count.500；

鼠标移动到流量图最左侧，会移出 Panel 快捷选项，点击最底下的 + 号选项添加新的 Panel：

选择 Panel 类型为 histogram；
选择 Queries 类型为 selected，然后点中右侧列出的请求中所需要的那项(现在出现两个了，选中我们刚添加的 count.500)。

保存退出，即可看到新多出来一行，左侧三分之一(默认是span4，添加的时候可以选择)的位置有了一个柱状图。

重复这个步骤，添加 502/503 的柱状图。

仪表盘设置存档

页面右上角选择 Save 小图标保存即可。之后再上界面后，就可以点击右上角的 Load 小图标自动加载。

上面这个 grok 写的很难看，不过似乎也没有更好的办法～下一步会研究在这个基础上合并 skyline 预警。

2014 年 5 月 10 日更新：

在 logstash/docs 上发现一个 filter 叫 kv，很适合这个场景，可以大大简化 grok 工作，新的 filter 配置如下：

filter {
    grok {
        match => [ "message", "^%{SYSLOGTIMESTAMP:timestamp}\|\| pid:\d+\|from:\d{10}\|to:\d{10}\|accounting_id:%{WORD:accounting}\|requests:%{NUMBER:req:int}\|bytes_out:%{NUMBER:size:int}\|%{DATA:status}"
    }
    kv {
        target => "code"
        source => "status"
        field_split => "|"
        value_split => ":"
    }
    ruby {
        code => "n={};event['code'].each_pair{|x,y|n[x]=y.to_i};event['code']=n"
    }
}

不晓得为什么 filter/mutate 不提供转换 Hash 的功能，所以只能把这行写在 filter/ruby 里面。kv 截出来的 value 默认都是字符串类型。

2014 年 5 月 28 日更新：

发现默认的 LVS 检查导致的 400 会记录到默认的 accounting 组(“default”)里，虽然不占带宽，却占不少请求数。这类日志可以在 logstash层面就干掉：

filter {
    grok {
        match => [ "message", "^%{SYSLOGTIMESTAMP:timestamp}\|\| pid:\d+\|from:\d{10}\|to:\d{10}\|accounting_id:%{WORD:accounting}\|requests:%{NUMBER:req:int}\|bytes_out:%{NUMBER:size:int}\|%{DATA:status}"
    }
    if [accounting] == 'default' {
        drop { }
    } else {
        kv {
            target => "code"
            source => "status"
            field_split => "|"
            value_split => ":"
        }
        ruby {
            code => "n={};event['code'].each_pair{|x,y|n[x]=y.to_i};event['code']=n"
        }
    }
}

另外说明一下，ngx_http_accounting_module 中设定 http_accounting_id 这步是预先处理的，所以只能写固定字符串，不能用 $host 之类的 nginx.conf 变量。

squid-ssd方案和trafficserver的interim层的异同

2014-02-18T00:00:00+00:00

最近重新捡起来两年前做的 cache 软件测试对比，把原先的 trafficserver 淘宝分支升级到了现在的社区主分支，主要区别就是配置文件里不再直接叫 ssd.storage，而是正规化的起了一个名字叫interim cache layer。

运行结果和当初类似，SATA 盘的 ioutil% 依然是远高于鄙司自创的 squid-ssd 方案。

于是沉下心来思考了一下为什么会有这么大的差距。

首先，squid-ssd 的设计其实非常简单，参照 Facebook 的 flashcache 原理扩展了 squid 原有的 COSS 存储引擎而已。所以我们先回忆一下 flashcache 的原理：

flashcache 是利用了 Linux 的 device-mapper 机制来虚拟逻辑块设备，在 ssd 和 sata 设备之间，flashcache 设计了三种模式：

Writethrough 模式，数据同时写到 ssd 和 sata 硬盘，官方文档的说明是：

safest, all writes are cached to ssd but also written to disk immediately. If your ssd has slower write performance than your disk (likely for early generation SSDs purchased in 2008-2010), this may limit your system write performance. All disk reads are cached (tunable).

Writearound 模式，数据绕过 ssd，直接写到 sata 设备上，官方文档的说明是：

again, very safe, writes are not written to ssd but directly to disk. Disk blocks will only be cached after they are read. All disk reads are cached (tunable).

Writeback 模式，数据一开始只写到 ssd 上，然后根据缓存策略再移到 sata 设备上，官方文档的说明是：

fastest but less safe. Writes only go to the ssd initially, and based on various policies are written to disk later. All disk reads are cached (tunable).

squid-ssd 方案，学习的是 Writeback 模式，这种模式极大的缓解了普通 sata 设备的读写压力，牺牲了一定的数据安全。但是作为 CDN 缓存软件，本身就不需要保证这点 —— 这应该是源站来保证的。

相反，阅读了 ats 的文档说明后，发现 ats 的 interim 方案学习的是 Writearound 模式，而且默认的 tunable 那点还设的比较高， sata 设备上一个缓存对象要累积 2 次读取请求(最低可以修改到1，不能到0)后，才会缓存到 ssd 设备里去。

这一点从另一个细节上也可以反映出来：ats 的监控数据中，proxy.process.cache.bytes_total 是只计算了 storage.config 里写的那些 sata 设备容量的，不包括 interim 在的 ssd 设备容量。

【翻译】Kibana 发生什么事了？

2014-02-08T00:00:00+00:00

注：本文是 Elasticsearch 官方博客 2014 年 1 月 27 日《what’s cooking in kibana》的翻译，原文地址见：http://www.elasticsearch.org/blog/whats-cooking-kibana/

Elasticsearch 1.0 即将发布， Kibana 团队也准备发布自己的新版。除了一些常见的 bug 修复和小调整，下一个版本中还有一些超棒的特性：

面板组

面板现在可以组织成组的形式，组内可以容纳你乐意加入的任意多的面板。每行的删减都很干净，隐藏面板也不会消耗任何资源。

图表标记

变更部署，用户登录以及其他危险性事件导致的流量、内存消耗或者平均负载的变动，图表标记让你可以输入自定义的查询来将这些重要事件标记到时间轴图表上。

即时过滤器

创建你自己的请求过滤器然后保存下来以备后用。过滤器将和仪表盘一起保存，而且可以在对比你定义的数据子集的时候菜单式展开或收缩。

top-n 查询

单击某个查询旁边的带色的点，就可以设置这个查询的颜色。新版的top-N 查询会找出一个字段最流行的结果，然后用他们来完成新的查询。

stats 面板

Stats 面板最后都将把搜索归总成一个单独的有意义的数值。

terms_stats 模式

按国家统计流量？每个用户的收入？每页的内存使用？terms面板的terms_stat模式正是你想要的。

Mojo::IOLoop::Delay 模块测试代码解释

2014-01-22T00:00:00+00:00

昨天有人在群里问起Mojolicious/t/mojo/delay.t 中一段代码的执行原理。代码如下：

use Mojo::Base -strict;
 
BEGIN {
  $ENV{MOJO_NO_IPV6} = 1;
  $ENV{MOJO_REACTOR} = 'Mojo::Reactor::Poll';
}
 
use Test::More;
use Mojo::IOLoop;
use Mojo::IOLoop::Delay;
 
my $delay = Mojo::IOLoop::Delay->new;
my $finished;
my $result = undef;

$delay->on(finish => sub { $finished++ });
$delay->steps(
  sub {
    my $delay = shift;
    my $end   = $delay->begin;
    $delay->begin->(3, 2, 1);
    Mojo::IOLoop->timer(0 => sub { $end->(1, 2, 3) });
  },
  sub {
    my ($delay, @numbers) = @_;
    my $end = $delay->begin;
    Mojo::IOLoop->timer(0 => sub { $end->(undef, @numbers, 4) });
  },
  sub {
    my ($delay, @numbers) = @_;
    $result = \@numbers;
  }
);

is_deeply [$delay->wait], [2, 3, 2, 1, 4], 'right return values';
is $finished, 1, 'finish event has been emitted once';
is_deeply $result, [2, 3, 2, 1, 4], 'right results';
done_testing();

首先介绍一下这个 Mojo::IOLoop::Delay 模块，这是异步编程中很火很实用的一个概念，一般叫 Promise / Deferred 。你可以按照顺序编程的思路组合那些异步函数，比如在这个例子里主要就体现了 steps 方法和 finish 事件。

steps 方法中可以传递任意多个异步函数。第一个函数立刻执行，然后等 $delay 信号量(由 begin 方法控制)释放(即重新等于0)后逐次执行后面的函数，直到碰到一个不调用 begin 控制信号量的函数，或者触发 error 或者 finish 事件。

begin 方法返回的回调函数 $end->() 用来减信号量。如果传递了参数给这个回调函数，那么第一个参数会被忽略，剩下的参数会 push 进下一个顺序或者事件触发函数的参数列表里，同时推送到 wait 方法。

所以上面这段测试的数据执行结果是这样的：

$delay->wait 开始整个 ioloop, steps 方法首先执行 sub1 ，首先通过 $delay->begin()给信号量加1；
随即触发 timer 事件，$end->(1, 2, 3) 将 (2, 3) 推入下一个函数 sub2 的 @_ 里，同时把信号量减1；
信号量变成0，继续执行，这一行 $delay->begin()->(3, 2, 1)，将 (2, 1) 推入下一个函数 sub2 的 @_ 里，注意这里信号量实际也加减过一次，只是这里的回调函数直接匿名调用了；
sub1 执行完成，信号量为0，那么开始下一个sub2，sub2 传入的参数列表其实是 ($delay, (2, 3), (2, 1))，也就是说这时候的 @numbers 是 (2, 3, 2, 1)；
sub2 执行流程类似 sub1 ，信号量加1，触发 timer 事件，然后 $end->(undef, @numbers, 4) 把 ((2, 3, 2, 1), 4) 推入下一个函数 sub3 的 @_ 里，同时信号量减1；
sub2 执行完成，信号量为0，那么开始下一个sub3，sub3 传入的参数列表就是 ($delay, (2, 3, 2, 1, 4))，也就是说这时候的 @numbers 是 (2, 3, 2, 1, 4)；
sub3 将 @numbers 的引用赋值给 $result，因为 sub3 里没有对信号量的操作，而且也是最后一个了，steps 完成，触发 finish 事件；
注册的 finish 事件回调函数把 $finish 变量加1；
$delay->wait 这时候也收集完毕前面每个 $end->() 的参数列表，和每步 @numbers 是同步的，同时因为 finish 事件被触发，就此停止 ioloop，程序完成，返回整个列表。

如上。

【翻译】Kibana3 里程碑 4

2014-01-15T00:00:00+00:00

本文来自Elasticsearch官方博客，2013年11月5日的文章Kibana 3: mileston 4，作为kibana3 Milestone 4重要的使用说明，翻译如下：

Kibana 3: Milestone 4 已经发布，带来了一系列性能、易用性和可视化上的提升。让我们来看看这些重大改变。如果你还在Milestone 3上，先看看之前这篇博客里的新特性介绍。

一个全新的界面

Kibana 面板改造成了一个标签更突出，按键和链接更易用，风格全新的样子。改造结果提高了可用度，因为有了更高效的空间利用设计，来支持更大的数据密度和更一致的UI。

一致性查询和过滤布局

为了改善UI，查询和过滤面板现在有自己的可折叠、下拉的区域，具体位置在导航栏的下方。以后不再需要你自己摆放这些基本面板的布局了，它们默认会包含在每一个仪表盘里。和很多Kibana的特性一样，你也可以在仪表盘配置对话框里禁用这个一致性布局。

100%全新的时间范围选择器

如果你熟悉Kibana这两年来的历史，你可能知道曾经存在过好几个时间选择器方案。新的时间选择器经过了完全的重写，不仅占用空间比原来的小，也更容易使用。把这个重要组件移出主仪表盘后，Kibana 现在有更多空间专注于重要数据和图表。还有，新的过滤格式实现了Elasticsearch的时间运算，所以不用每次重新选择一个时间范围来移动你的时间窗口了，每个搜索都能自动更新这个窗口。

可过滤的字段列表

利用表格的”即输即过滤”特性，可以简单而快速的找到字段。

然后，当你找到了这些字段，就可以利用即时 facets 快速分析他们。只需要点击一个字段然后选择可视化即可查看到前10个匹配该字段的term。

研究起来也更加简单了

不需要添加面板，饼图可以直接悬浮出现！

动态的仪表盘和url参数

Kibana 3: Milestone 4现在可以通过URL参数获取输入！这个备受期待的特性体现为两个方式：模板化的仪表盘和脚本化的仪表盘。Kibana 3: Milestone 4附带两个可以和Logstash完美配合的示例，在此基础上你可以构建自己的仪表盘。模板化仪表盘的创建非常简单，导出当前仪表盘结构成文件，编辑文件然后保存添加进你的 app/dashboards 目录既可以了。比如，从 logstash.json 里摘录下面一段：

  "0": {
    "query": "{<span>{</span>ARGS.query || '*'}}",
    "alias": "",
    "color": "#7EB26D",
    "id": 0,
    "pin": false
  }

模板化仪表盘用”handlebar 语法”添加动态区段到基于JSON的仪表盘结构里。比如这里我们就用一个表达式替换掉了查询键的内容：使用URL里的请求参数，如果不存在，使用’*‘。 现在我们可以用下面这条URL访问这个仪表盘了：

http://kibana.example.com/index.html#/dashboard/file/logstash.json?query=extension:zip

更灵活的脚本化仪表盘

脚本化仪表盘在处理URL参数的时候更加强大，它能运用上Javascript的全部威力构建一个完整的仪表盘对象。同样用 app/dashboards 里的 logstash.js 举例。因为脚本化仪表盘完全就是javascript，我们可以执行复杂的操作，比如切割URL参数。如下URL中，我们搜索_最近2天内的HTML, CSS 或者 PHP，然后在表格里显示 request, response 和 user agent。_注意URL本身路径从 file__变成了__script：

http://localhost:8000/index.html#/dashboard/script/logstash.js?query=html,css,php&from=2d&fields=request,response,agent

立刻下载

Milestone 4对作者和使用者都是一个飞跃。它功能更强大，当然使用也更简单。Kibana 继续集成在 Logstash 里，最新发布的 Logstash 1.2.2 中就带有。Kibana现在也可以直接用elasticsearch.org官网下载，地址见：http://www.elasticsearch.org/overview/kibana/installation/。

【翻译】2013 年 9 月的 kibana 周报

2014-01-14T00:00:00+00:00

本文来自Elasticsearch官方博客，2013年9月19日的文章this week in kibana，作为kibana3 Milestone 3重要的使用说明，翻译如下：

直方图零填充

直方图面板经过了一番改造，实现了正确的零填充。也就是说，当一个间隔内查询收到0个结果的时候，就显示为0，而不是绘制一条斜线连接到下一个点。零填充也意味着堆叠式直方图从顶端到底部的次序将保持不变。

此外，堆叠提示栏现在允许你在累积和个人模式之间自由选择。

数组字段的微分析

数组字段现在可以在微分析面板上单独或者分组处理。比如，如果我有一个tags数组，我即可以看到前10个最常见的tags，也可以看到前10个最常见的tags组合。

`_source` 作为默认的表字段

如果你没有给你的表选择任何字段，Kibana现在默认会给你显示 _source 里的 json 数据，直到你选择了具体的字段。

可配置的字段截取

注意到下面截图中 _source 字段末尾的”…“了吗？表格字段能被一个可以配置的”因子”截断。所谓因子就是，表格的列数除以它，得到一个字段的最大长度，然后各字段会被很好的截断成刚好符合这个长度。比如，如果我的截断因子是300，而表格有3列，那么每个字段会被截断成最大100个字符，然后后面跟上’…‘。当然，字段的完整内容还是可以在细节扩展视图里看到的。

关于细节视图

你可能已经知道单击表格某行后可以看到包含这个事件的字段的表格。现在你可以选择你希望如何观察这个事件的细节了，包括有语法高亮的JSON以及原始的未高亮的JSON。

更轻，更快，更小，更好

Kibana有了一个全新的构建系统！新的系统允许我们构建一个优化的，小巧的，漂亮的新Kibana。当你升级的时候它还可以自动清除原来的缓存，定期构建的Kibana发布在 http://download.elasticsearch.org/kibana/kibana/kibana-latest.zip ，zip包可以直接解压到你的web服务器里。

如果愿意，你也可以从 Github repository 开始运行。不用复制整个项目，只需要上传 src/ 目录到服务器就可以了。不过我们强烈建议使用构建好的版本，因为这样性能好很多。

【翻译】kibana发生什么变化了？

2014-01-14T00:00:00+00:00

本文来自Elasticsearch官方博客，2013年8月21日的文章kibana: what’s cooking，作为kibana3重要的使用说明，翻译如下：

还没有升级Kibana么？那你可错过了一个好技术！Kibana 发生了翻天覆地的变化，新面板只是这个故事中的一部分。整个系统都被重构，给表盘提供统一的颜色和图例方案选择。接口也经过了标准化，很多函数都修改成提供更简单，快速和功能更强大的方式。让我们进一步看看现在的样子。

Terms 面板；全局色彩；别名和查询；过滤器。

新的查询输入

新的查询面板替代了原来的“字符串查询”面板作为你输入查询的方式。每个面板都有自己独立的请求输入。你也还可以为特殊的面板定制请求，不过你要先在这里输入他们，包括可以有别名和颜色设置，然后再在面板编辑器里选取。在没有被激活修改的时候，查询也可以被固定在一个可折叠的区域。

分配查询到具体面板

分配查询到具体面板非常非常简单。面板编辑器里就可以直接打开或关闭查询，哪怕这个查询已经更新或者过滤掉，它的别名是保持全局一致性的。你还会注意到配置窗口被分割成了选项卡形式，已提供更清晰的配置界面。

自定义颜色和别名

当你给一个查询分配某个颜色的时候，它会立刻反映到所有的面板上。通常用于做图例值的别名也一样。这样，我们可以很简单的通过在一个逻辑组里分配颜色变化，调节整个仪表盘和数据的意义。

你好，terms!

引入了一个新的terms面板，可以使用3种不同的格式展示顶层字段数据：饼图、柱状图和表格。而且都可以点击进入新的过滤器面板。

过滤器面板?

刚刚提到过滤器面板，对吧？没错，过滤器！过滤器允许你深入分解数据集而不用你去修改查询本身。然后，过滤器也可以被删除、隐藏和编辑。过滤器有三种模式：

must: 记录必须匹配这个过滤器；
mustNot: 记录必须不能匹配这个过滤器；
either: 记录必须匹配这些过滤器中的一个。

字段列表和微面板

字段面板集成在表格面板里。字段列表现在会通过访问Elasticsearch的/_mappingAPI来自动填充。注意你可能需要更新自己的代理服务器配置来适应这个变更。为了节约空间，这个字段列表现在也是可折叠的，而新的图形也添加到了微面板。

嗨，那配色方案呢?!

对，你在我解释之前已经发现这个变化了！Kibana现在允许你在黑白两个配色方案之间切换以刚好的匹配你自己的环境和偏好。

汇报完毕！当然kibana一直在更新，注意继续关注这里，给我们的github项目加星，然后上推特fo @rashidkpc 和 @elasticsearch。

私有 docker 仓库部署测试

2014-01-08T00:00:00+00:00

docker 的官方仓库 CDN 的ip 总是被 GFW 认证。为了更好的使用 docker ，有必要在自己内部搭建一个私有仓库。方法很简单：

git clone https://github.com/dotcloud/docker-registry.git
cd docker-registry
# 安装依赖
yum install python-devel libevent-devel python-pip openssl-devel xz-devel --enablerepo=epel
python-pip install -r requirements.txt
# 默认读取config/config.yml里的dev配置
WORKER_SECRET_KEY="${WORKER_SECRET_KEY:-$(< /dev/urandom tr -dc A-Za-z0-9 | head -c 32)}"
cat > config/config.yml<EOF
dev:
    storage: local
    storage_path: /tmp/registry
    secret_key: ${WORKER_SECRET_KEY}
EOF

# 默认的镜像存储位置，可以在 config.yml 里更改 storage_path
mkdir /tmp/registry
# 默认监听5000端口，前台运行，可以加入daemontools、supervisor、ubic之类的来负责
sh run.sh

这就完成了。如果想用 nginx 作代理和加速镜像下载性能的，代码里也提供了 nginx.conf 可用。不过注意要求 nginx 版本在 1.3.9 以上，同时编译的时候还要加上 chunkin 模块。否则镜像上传的时候会出错。

然后就是客户端如何指定镜像推送到私有仓库里：

# 在私有仓库注册用户
docker login 127.0.0.1:5000
# 给要提交的镜像打标签
docker tag <IMAGE ID> 127.0.0.1:5000/tagname
# 推送到私有仓库
docker push 127.0.0.1:5000/tagname

注意这里推送的时候使用的是REPOSITORY，也就是说不能是 127.0.0.1:5000/ubuntu:12.04 这样的格式。

现在就可以在其他地方用了：

docker pull 192.168.0.2:5000/tagname

利用 staticperl 和 upx 生成单个可执行 perl

2014-01-06T00:00:00+00:00

Perl 程序打包的问题由来已久。

最早是 perlcc，但是从5.10版本以后，B::CC 等一系列模块跟不上开发脚本导致 perlcc 也无法使用。

然后是PAR::Packer，唐凤大神的作品。

今天介绍另一个模块，App::Staticperl，同样是大神级作品，作者是Marc Lehmann。他的 AnyEvent、Coro、EV 无不大名鼎鼎。而staticperl，就是他开发出来用以方便自己部署程序的。

staticperl 官网上有一句很霸气的描述：“perl, libc, 100 modules, all in one standalone 500kb file”。

不过经我测试，按照官网上的步骤是做不出来这么小的单文件的！幸运的是我在 Perlmonks 上的发问很快收到了答案，这个还要用上另一个工具：upx。

测试过程如下：

# cpanm App::Staticperl
# staticperl install
# staticperl instcpan AnyEvent AnyEvent::HTTP
# staticperl mkperl -MAnyEvent -MAnyEvent::HTTP
# staticperl mkapp myapp --boot myapp.pl -MAnyEvent -MAnyEvent::HTTP

而如果是官网说的 smallperl，则是采用 mkbundle 的方法。

除了使用单独的配置文件存放太长的参数，其他和 mkapp / mkperl 一致。

不过运行结果是：生成的单个文件有3.5MB大小。

然后使用 upx：

# apt-get install upx
# upx --best smallperl.bin

就得到压缩后的超小型perl了。这个perl内含了AE、Socket、common::sense、List::Util 等一系列常用模块可以直接使用。不过大小依然有 1.7MB 。看来是 Perl5.14 本身大小也变大了。

补充

按照评论里的建议，改用 --lzma 选项再压缩一次：

# upx -d smallperl.bin
# upx --lzma smallperl.bin

结果到 1.4MB 大小。

通过网页运行 Perl 代码的安全实现

2014-01-05T00:00:00+00:00

这几天折腾Perl中国用户组网站，觉得类似 Ruby 的 tryruby，Scala 的 scala-tour 这样的新手入门教程非常好玩。于是准备自己也尝试一下。

理论上，通过 Ajax 传递代码到服务器上，直接 eval {} 即可。不过这样会导致一个安全问题。如何防止用户执行错误代码导致严重后果呢？

我想到了最近一直在跟踪看的 Docker 容器。如果我们把代码放在 Docker 里运行，不就不怕了么。

首先要构建一个可以运行大多数示例代码的 Docker 镜像。

首先打开一个终端运行初始镜像：

# docker run -i -t ubuntu /bin/sh
# apt-get install -y wget gcc make
# useradd tour
# echo 'tour hard nproc 8' >> /etc/security/limits.conf
# wget http://cpanmin.us -O bin/cpanm
# cpanm List::AllUtils Moo Path::Tiny DBD::SQLite AnyEvent::HTTP DateTime

然后打开另一个终端保存前一个终端的变更：

# docker ps
CONTAINER ID ...
# docker commit <ID> perl-tour

注意一定要在之前 cpanm 已经成功执行完毕后保存，但是前面登录进 docker 的会话千万不要退出，否则后面的 docker ps 就查看不到 id 了。退出时这些临时变更都毁掉了。

2014 年 1 月 7 日补充

被莫莫用死循环 fork() 轰炸了一回，发现 docker 容器的一个问题，容器技术本身没有对用户最大进程数的限制。因为其实际运行的是 docker -d 服务进程的子进程。

直接在镜像里编辑 /etc/security/limits.conf 实测没有作用。而主机上限定普通用户的 nproc 也没用(因为普通用户运行不了 docker )。

最后想到的办法，是启动 docker -d 的时候，先 ulimit -HSu 16，这样这个 docker 下一共也跑不了多少 fork 了。

顺带提一句，查阅系统日志可以发现，在 fork 的时候，其实触发了主机的 OOM-killer，但是这个机制在死循环这个变态攻击下挽救不了主机……

END

现在我们已经有了一个安装好很多常用 CPAN 模块的镜像了。可以取构建网站了。

网站里添加下面一段：

use Dancer::Plugin::Ajax;
use File::Temp qw(tempfile);
use IPC::Run qw(start harness timeout);
ajax '/run' => sub {
    my $code = param('code');
    my @cmd = qw(docker run -m 128m -u tour -v /tmp/:/tmp:ro perl-tour perl);
    my ($fh, $temp) = tempfile();
    binmode($fh, ':utf8');
    print $fh $code;
    push @cmd, $temp;
    my $h;
    eval {
        $h = harness \@cmd, \$in, \$out, \$err, timeout(5);
        start $h;
        $h->finish;
    };
    if($@) {
        my $x = $@;
        $h->kill_kill;
        return $x;
    };
    unlink $temp;
    return to_json({
        Errors => [ split(/\n/, $err) ],
        Events => [ split(/\n/, $out) ],
    });
};

页面上通过 Ajax 请求交互：

  $.ajax("/run?code=" + encodeURIComponent(codeStr), {
    type: "GET",
    dataType: "json",
    success: function(data) {
      if (!data) {
        return;
      }
      if (data.Errors && data.Errors.length > 0) {
        setOutput(outputDiv, null, null, data.Errors);
        return;
      }
      setOutput(outputDiv, data.Events, data.ErrEvents, false);
    },
    error: function() {
      outputDiv.addClass("error").text(
        "Error communicating with remote server.");
    }
  });

静态页面部分严重参考了 Scala 的 Tour 页。趁机学习了 impress.js 制作幻灯片效果、codemirror 实现代码高亮效果。

最终效果见少年 Perl 的魔法世界。欢迎大家莅临指导~

最后，阅读了 Golang Tour 关于 Go Playground 的原理说明，发现它们是在 Google App Engine 上运行实例，然后走消息队列把代码发送给后台实例运行结果。

当然，Go Playground 不单单是支持 Tour，而且还包括社区各式第三方模块的测试和使用。把角色拆分出来也是正常的。

Future模块和AnyEvent事件驱动的结合

2014-01-05T00:00:00+00:00

上个月的 advent calendar 活动中，有一个新的模块进入我们视野，这就是 IO::Async 模块作者写的 Future 模块。通过 Future 模块，我们可以做到对异步请求的各种控制，比如：

needs_all / needs_any / wait_any / wait_all
then / else / and_then / or_else / followed_by
on_ready / on_done / on_fail / on_cancel

目前来说，IO::Async 是原生支持 Future 了的。但是 AnyEvent 框架才是目前 Perl 社区事件驱动编程的主流选择。还好 Future 源码目录下 examples/ 里有关于 AnyEvent 和 POE 如何跟 Future 一起运行的示例。

示例统一举例的是 timer 事件。而我更看好的是 Future::Utils 提供的一些关于循环的函数，比如 fmap 可以很简单的控制住异步的并发数。稍微试验，得到脚本如下：

package Future::AnyEvent;
use base qw( Future );
use AnyEvent;
use AnyEvent::HTTP; 
sub await {
   my $self = shift;
   my $cv = AnyEvent->condvar;
   $self->on_ready(sub { $cv->send });
   $cv->recv;
}
sub httpget {
   my $self = shift->new;
   http_get(shift, sub {
      my ($content, $headers) = @_;
      $self->done($content);
   });
   return $self;
}
 
package main;
use Future::Utils qw/fmap/;
my @urls = qw(
    http://www.sina.com.cn
    http://www.baidu.com
    http://www.sohu.com
#    ...
);
my $f = fmap {
    Future::AnyEvent->httpget( shift );
} foreach => \@urls, concurrent => 5;
my @res = $f->get;
print @res;

看起来稍显复杂。这里其实最关键的就是几个接口函数：

await / on_ready

Future 对象到实际执行时(即->get调用处)，会寻找 await 方法。所以必须给自己选用的事件驱动实现这个 await 方法。

ready 状态即一个 Future 执行完成，注意执行完成不意味着执行成功，ready 状态包括 success 和 fail 两种，其实是可以分别定义 on_success 和 on_failure 回调的。 on_ready 回调的作用是：在该 Future 对象达到 ready 状态的时候，执行这步调用。

在本例使用 AnyEvent 的时候，也就是一般来说都会在每步操作结束的 $cv->send 改到这里来等待调用。

done / done_cb

那 Future 对象的 ready 状态是怎么来的呢？就是这步了：$f->done 一旦被调用，就意味着该 Future 对象进入了 ready and success 状态。

同样，如果你要详细控制 Future 对象进入具体的 ready but failure 状态，就使用 $f->fail 好了。

调用 ->done|fail() 的时候，你可以选择传递具体哪些数据。比如本例中，就只传递了抓取的 $content 而没有 $headers。

Future 提供了 ->done_cb 和 ->fail_cb 两个回调函数，默认传递回当前全部数据。本例如果要传回全部，就可以直接写成http_get shift, $self->done_cb。

好了，就到这里。这个例子虽然比 Future 自带的 anyevent.pl 示例稍微复杂一点，但是依然很简单。如果能引起大家的兴趣，请直接阅读官方文档。

2013 年度个人总结

2013-12-31T00:00:00+00:00

又到了一年年底。照例(虽然这个例也就是去年开始的)开始年度总结。

在一年前写总结时，我决然想不到今年会是这样。事实上，当初的计划是往底层深入学习，在 Linux 或者 TCP/IP 方面有所得。但是一年后现在看，今年的工作依然集中在 Puppet 和监控两方面。所以今年盘点，可能能让自己记忆深刻的，大多“功夫在课外”了。

年初，在编辑鼓励下开始尝试整理过去的知识体系，准备写一本网站运维相关的书籍。感谢这几年坚持记录博客，大几百的 Word 文档最后还比原计划提前写完了。写书的几个月中，我总是开玩笑的说“赚点钱买的起沙发就满足了”，虽然书还没出版，但其实这个过程中本身的收获已然很多。网上很多大神们说写书没意义，或许我还没到那种举重若轻的层次吧，我觉得这真的是一个不错的提升自我修养的手段。（当然，即便是现在回想，也觉得这过程中犯傻不断，给我一个重来的机会，绝对不选这么大话题动笔）

年中，参与 Perl 中国社区大会的举办。和其他老手不同，我本身只在三年前听过一次 Perl Beijing Workshop 而已，这次直接就被“骗上贼船”，作为报名网站的管理员维护一点信息发布，邀请还不算很熟的朋友一同演讲，当然也贡献了自己的第一次公开演讲。演讲前一晚，特意在家试讲让老婆帮忙提意见，毫不意外的被老婆批为乱七八糟。最后临场刚好卡在45分钟结束，但是从反响来看，依然选题有些宽泛，要在一个演讲里同时展示 Elasticsearch 的知识、logstash 的知识、Message::Passing 的知识，只能让听众更加迷惑。意外之喜是这次演讲的 slide 后来发到网上，倒是被不少外国人 like 甚至转到 twitter 上，赢得不少关注。

原本在 ChinaUnix 论坛上答应在大会的 lighting talk 上稍微讲一下 autobox 的运用，结果有事提前退场了，感觉失约这种事情真是超级不好意思，但愿明年还有 Perl Workshop 来给我弥补！

会上见到了 90 后的 Perler，会后没多久读到 stevan little 收回他《Perl isn’t dead, Perl is dead end》一文并重启 MOP 计划的通告，让我对 Perl 的未来依然有信心多了。

话题之外，参加了 RubyConfChina2013，Rubist 普遍比 Perl Monger 土豪多了。我们演讲人清一色小黑，他们清一色苹果……

年底读了许式伟的《Go 语言编程》，完全不是给我们这些非科班的运维人员读的东西，看完以后一点对 golang 的兴趣都没有增加，虽然本人依然坚持“能够在运维社区火起来的东西肯定是比较靠谱的”。

博客方面，欠了两篇一直没时间写，关于 docker 如何自己作image，以及 staticperl 的使用。

工作之外，花了点时间在一些开源社区：

logstash

logstash 在今年渐成气候，连它的竞争对手 fluentd 在年度报告中都承认 logstash 在美国已经势不可挡(fluentd的主阵地是日本)。个人在 logstash 代码方面只是保持跟踪阅读，因为没有业务需求推动，所以不再跟去年那样大肆修改代码。倒是通过weibo、QQ等方式回答了应该有好几十个人的问题，最后在各方鼓励下开设了 logstash 的QQ群(315428175)，欢迎爱好者加入～

另一个惊喜的事情，两位 logstash 同好在问完问题之后，主动送了《Elasticsearch Server》和《thelogstashbook》给我。
Rexify

Rexify 是德国2012年度最佳开源软件。不过受国内 Perl 社区总体不给力的影响，不可能如 Python 的 SaltStack 那样突然窜起。去年提交的 krb5 认证的 patch 在今年终于被作者合并，年中翻译完成了 Rexify 中文站后，有一段时间没有进展了。
Docker

这是今年下半年重点看好的项目。博客中从 8 月开始就有好几篇关于这个内容，甚至专门订阅了 DockerWeekly。Docker 文档非常全，使用非常简单，实在爱不释手，最近老琢磨如何用在工作中去。最后这周，配合 pstuifzand 改进 Docker 的 Perl 客户端，主要是他写的时候 docker 默认还是监听在本地的 4243 端口，现在已经改成 /var/run/docker.sock 了。于是把 Net::Docker 里 LWP::UserAgent 和 AnyEvent::HTTP 的 Unix-Socket 支持都实现出来。

另一方面，也给 Rexify 项目实现了 Rex::Virtualization::Docker 的支持，不过这个则是调用 docker 命令行的方式。

最后，强烈谴责 GFW 屏蔽 Docker 的 CDN 边缘节点 IP 地址的行为。我本来提议让官方提供镜像方式，让我们在国内作镜像服务。结果官方表示 docker pull 的过程中连接了多个 api 服务，不是单单搞镜像可以解决的。目前只能是通过绑定 /etc/hosts 的方式直接访问官方的源站 IP，不走 CDN 了。
Perl

Perl5 社区今年发起了一系列活动，激发社区活跃性。其中包括一项挽救濒死模块。根据自己的情况，花了 3 个月时间走流程，最终成功认领了 HTML::TagHelper 模块。这个模块的原作者是个北欧妹纸，后来写 php 去了，看 linkedin 信息都已经是 CTO 了。

因为工作中用到 MooseFS，所以仿造 moosefs.cgi 里的接口写了 Perl 版的模块发到 CPAN，结果 moosefs 的作者之一 peter aNeutrino 主动发邮件来问是否需要更多帮助。只能说大神们真的好热情……

和氓氓等一起试图给 PerlChina 增加活跃气氛，申请了 @perldaily 帐号专门发技术内容，创建了 www.perl-china.com 网站。总的来说，努力过，成效就不在能力范围内了。

再说一些跟国外的事情，虽然都是小事，但迈出第一步，总是值得纪念的：

Perl 社区每年12月会发起 advent calendar 活动。今年主动去日本的 Qiita 技术社区投稿，写了一篇文章讲 Rex::Box 的运用。虽然写不来日语，不过代码就是最好的语言～～
被 facebook 的 tech recruiter 找上来聊天，算是见识了一下除了美剧以外的英语，嗯，也就如此了。

最后一项不得不记的，关于比特币。我个人其实没有资金投入到这场狂欢中，不过暴赚几十万的同事、步步踩空的同事历历在目。一方面也回顾了一下当初的股票分析知识，通过程序作出了一些“不负责任的”指导意见，没有被同事们暴揍，算是一件很值得娱乐的事情～从严肃意义上来说，这件事情提醒了已经迈向26岁的自己，你已经不年轻了，Perl 之外，请考虑人生和理财的问题。

“Yes, sir!”

为比特币绘制 MACD、BOLL、KDJ 指标图

2013-12-09T00:00:00+00:00

比特币是最近相当火爆的一个金融衍生品(瞧咱这口径)。比特币中国提供了一系列 API 来获取和操纵其市场内的比特币。我的小伙伴们基于其 API，完成了一套交易程序。为了提高操作的有效性和技术性，同时作为 python 学习需要，我也参与进来，仿造股票交易软件，为比特币中国绘制了一系列指标图，包括 MACD、BOLL、KDJ 等。截止上周，btc123 也开始提供了 MACD 指标图，所以把自己的实现贴到博客。

首先是获取数据，比特币中国的 API 是个很鬼怪的东西，实时交易数据的接口，返回的数据中最高最低和成交量都是基于过去24小时的，要知道比特币交易是没有休市的啊。所以获取数据过程中需要自己计算这些。这里考虑到股市一般一天实际交易4小时，所以整个设计也是默认4小时的图形展示。

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# query price data from BTCChina.
from urllib import urlopen
from ast import literal_eval
import MySQLdb
import json
import yaml
import time

config = yaml.load(open('config.yaml'))
conn = MySQLdb.connect(host=config['database']['host'],user=config['database']['username'],passwd=config['database']['password'],db =config['database']['databasename'],charset=config['database']['encoding'] )

def write_db(datas):
    try:
        cur_write = conn.cursor()
        sql =  "insert into ticker(sell, buy, last, vol, high, low) values( %s, %s, %s,%s,%s,%s)"
        cur_write.execute(sql,datas)
        conn.commit()
        cur_write.close()
    except MySQLdb.Error,e:
        print "Mysql error %d : %s." % (e.args[0], e.args[1])

def get_tid():
    try:
        vol_url = config['btcchina']['vol_url']
        remote_file = urlopen(vol_url)
        remote_data = remote_file.read()
        remote_file.close()
        remote_data = json.loads(str(remote_data))
        return remote_data[-1]['tid']
    except MySQLdb.Error,e:
        print "Mysql error %d : %s." % (e.args[0], e.args[1])

def get_ohlc(num):
    try:
        read = conn.cursor()
        hlvsql = "select max(last),min(last) from ticker where time between date_add(now(),interval -%s minute) and now()" % num
        read.execute(hlvsql)
        high, low = read.fetchone()
        closesql = "select last from ticker where time between date_add(now(),interval -%s minute) and now() order by time desc limit 1" % num
        read.execute(closesql)
        close = read.fetchone()
        opensql = "select last from ticker where time between date_add(now(),interval -%s minute) and now() order by time asc limit 1" % num
        read.execute(opensql)
        opend = read.fetchone()
        return opend[0], high, low, close[0]
    except MySQLdb.Error,e:
        print "Mysql error %d : %s." % (e.args[0], e.args[1])

def write_ohlc(data):
    try:
        cur_write = conn.cursor()
        ohlcsql =  'insert into ohlc(open, high, low, close, vol) values( %s, %s, %s, %s, %s)'
        cur_write.execute(ohlcsql, data)
        conn.commit()
        cur_write.close()
    except MySQLdb.Error,e:
        print "Mysql error %d : %s." % (e.args[0], e.args[1])
    except Exception as e:
        print("执行Mysql写入数据时出错: %s" %  e)

def instance():
    try:
    # returns something like {"high":738.88,"low":689.10,"buy":713.50,"sell":717.30,"last":717.41,"vol":4797.32000000}
        remote_file = urlopen(config['btcchina']['ticker_url'])
        remote_data = remote_file.read()
        remote_file.close()
        remote_data = json.loads(str(remote_data))['ticker']
    #   remote_data = {key:literal_eval(remote_data[key]) for key in remote_data}
    except:
        remote_data = []
    datas = []
    for key in remote_data:
        datas.append(remote_data[key])
    return datas

lastid = 0
ohlc_period = 60
next_ohlc = int(time.time()) / ohlc_period * ohlc_period
while True:
    datas = instance()
    if datas:
        write_db(datas)
    if(int(time.time()) > next_ohlc):
        next_ohlc += ohlc_period

        data = list(get_ohlc(1))

        latestid = get_tid()
        data.append(int(latestid) - int(lastid))
        lastid = latestid

        write_ohlc(data)
        time.sleep(1)

这里主要把实时数据存入ticker表，分钟统计数据存入ohlc表。然后是各指标算法。首先是 MACD ：

#/*******************************************************************************
# * Author: Chenlin Rao | Renren inc.
# * Email: rao.chenlin@gmail.com
# * Last modified: 2013-11-26 22:02
# * Filename: macd.py
# * Description: 
#       EMA(12)=LastEMA(12)* 11/13 + Close * 2/13
#       EMA(26)=LastEMA(26)* 25/27 + Close * 2/27
#       
#       DIF=EMA(12)-EMA(26)
#       DEA=LastDEA * 8/10 + DIF * 2/10
#       MACD=(DIF-DEA) * 2
# * *****************************************************************************/
#!/usr/bin/env python
# -*- coding: utf-8 -*-

import time
import hashlib
import MySQLdb
import yaml

class MACD():

    def __init__(self):
        config = yaml.load(open('config.yml'))
        self.sleep_time = config['btcchina']['trade_option']['sleep_time']
        self.conn = MySQLdb.connect(host=config['database']['host'],user=config['database']['username'],passwd=config['database']['password'],db =config['database']['databasename'],charset=config['database']['encoding'] )

    def _getclose(self, num):
        read = self.conn.cursor()
        sql = "select close,time from ohlc order by id desc limit %s" % num
        count = read.execute(sql)
        results = read.fetchall()
        return results[::-1]

    def _ema(self, s, n):
        """
        returns an n period exponential moving average for
        the time series s

        s is a list ordered from oldest (index 0) to most
        recent (index -1)
        n is an integer

        returns a numeric array of the exponential
        moving average
        """
        if len(s) <= n:
            return "No enough item in %s" % s
        ema = []
        j = 1

        #get n sma first and calculate the next n period ema
        sma = sum(s[:n]) / n
        multiplier = 2 / float(1 + n)
        ema.append(sma)

        #EMA(current) = ( (Price(current) - EMA(prev) ) x Multiplier) + EMA(prev)
        ema.append(( (s[n] - sma) * multiplier) + sma)

        #now calculate the rest of the values
        for i in s[n+1:]:
            tmp = ( (i - ema[j]) * multiplier) + ema[j]
            j = j + 1
            ema.append(tmp)

        return ema

    def getMACD(self, n):
        array = self._getclose(n)
        prices = map(lambda x: x[0], array)
        t = map(lambda x: int(time.mktime(x[1].timetuple())) * 1000, array)

        short_ema = self._ema(prices, 12)
        long_ema = self._ema(prices, 26)
        diff = map(lambda x: x[0]-x[1], zip(short_ema[::-1], long_ema[::-1]))
        diff.reverse()

        dea = self._ema(diff, 9)

        bar = map(lambda x: 2*(x[0]-x[1]), zip(diff[::-1], dea[::-1]))
        bar.reverse()

        return zip(t[33:], diff[8:]), zip(t[33:], dea), zip(t[33:], bar)

然后是 BOLL ：

#/*******************************************************************************
# * Author: Chenlin Rao | Renren inc.
# * Email: rao.chenlin@gmail.com
# * Last modified: 2013-11-26 22:02
# * Filename: macd.py
# * Description: 
#       MA=avg(close(20))
#       MD=std(close(20))
#       
#       MB=MA(20)
#       UP=MB + 2*MD
#       DN=MB - 2*MD
# * *****************************************************************************/
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import random
import hashlib
import MySQLdb
import yaml
import time

class BOLL():

    def __init__(self):
        config = yaml.load(open('config.yml'))
        self.sleep_time = config['btcchina']['trade_option']['sleep_time']
        self.conn = MySQLdb.connect(host=config['database']['host'],user=config['database']['username'],passwd=config['database']['password'],db =config['database']['databasename'],charset=config['database']['encoding'] )
     
    def _getMA(self, array):
        length = len(array)
        return sum(array) / length
    
    def _getMD(self, array):
        length = len(array)
        average = sum(array) / length
        d = 0
        for i in array: d += (i - average) ** 2
        return (d/length) ** 0.5
    
    def getOHLC(self, num):
        read = self.conn.cursor()
        sql = "select time,open,high,low,close,vol from ohlc order by id desc limit %s" % num
        count = read.execute(sql)
        results = read.fetchall()
        return map(lambda x: [int(time.mktime(x[0].timetuple())) * 1000, x[1],x[2],x[3],x[4],x[5]], results[::-1])

    def _getCur(self, fromtime):
        curread = self.conn.cursor()
        cursql = "select last,vol from ticker where time between date_add('%s', interval -0 minute) and now()" % time.strftime('%F %T', time.localtime(fromtime))
        curread.execute(cursql)
        curlist = map(lambda x: x[0], curread.fetchall())
        vollist = map(lambda x: x[1], curread.fetchall())
        if len(curlist) > 0:
            return int(time.time())*1000, curlist[0], max(curlist), min(curlist), curlist[-1], sum(vollist)
        else:
            return None

    def _getClose(self, matrix):
        close = map(lambda x: x[4], matrix)
        return close
    
    def getBOLL(self, num, days):
        matrix = self.getOHLC(num)
        cur = self._getCur(matrix[-1][0]/1000)
        if cur:
            matrix.append(cur)
        array = self._getClose(matrix)
        up = []
        mb = []
        dn = []

        x = days
        while x < len(array):
            curmb = self._getMA(array[x-days:x])
            curmd = self._getMD(array[x-days:x])
            mb.append( [ matrix[x][0], curmb ] )
            up.append( [ matrix[x][0], curmb + 2 * curmd ] )
            dn.append( [ matrix[x][0], curmb - 2 * curmd ] )
            x += 1

        return matrix[days:], up, mb, dn

最后是 KDJ ：

#/*******************************************************************************
# * Author: Chenlin Rao | Renren inc.
# * Email: rao.chenlin@gmail.com
# * Last modified: 2013-11-26 22:02
# * Filename: macd.py
# * Description: 
#       RSV=(close-low(9))/(high(9)-low(9))*100
#       K=SMA(RSV(3), 1)
#       D=SMA(K(3), 1)
#       J=3*K-2*D
# * *****************************************************************************/
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import hashlib
import MySQLdb
import yaml
import time

class KDJ():

    def __init__(self):
        config = yaml.load(open('config.yml'))
        self.sleep_time = config['btcchina']['trade_option']['sleep_time']
        self.conn = MySQLdb.connect(host=config['database']['host'],user=config['database']['username'],passwd=config['database']['password'],db =config['database']['databasename'],charset=config['database']['encoding'] )

    def _getHLC(self, num):
        read = self.conn.cursor()
        sql = "select high,low,close,time from ohlc order by id desc limit %s" % num
        count = read.execute(sql)
        results = read.fetchall()
        return results[::-1]

    def _avg(self, a):
        length = len(a)
        return sum(a) / length
    
    def _getMA(self, values, window):
        array = []
        x = window
        while x < len(values):
            curmb = self._avg(values[x-window:x])
            array.append( curmb )
            x += 1
        return array
    
    def _getRSV(self, arrays):
        rsv = []
        times = []
        x = 9
        while x < len(arrays):
            high = max(map(lambda x: x[0], arrays[x-9:x]))
            low = min(map(lambda x: x[1], arrays[x-9:x]))
            close = arrays[x-1][2]
            rsv.append( (close-low)/(high-low)*100 )
            t = int(time.mktime(arrays[x-1][3].timetuple())) * 1000
            times.append(t)
            x += 1
        return times, rsv

    def getKDJ(self, num):
        hlc = self._getHLC(num)
        t, rsv = self._getRSV(hlc)
        k = self._getMA(rsv,3)
        d = self._getMA(k,3)
        j = map(lambda x: 3*x[0]-2*x[1], zip(k[3:], d))
        return zip(t[2:], k), zip(t[5:], d), zip(t[5:], j)

最后通过一个简单的python web框架完成界面展示，这个叫 bottle.py 的框架是个单文件，相当方便。

#!/usr/bin/python
import json
import yaml
from macd import MACD
from boll import BOLL
from kdj import KDJ
from bottle import route, run, static_file, redirect, template
 
config = yaml.load(open('config.yml'))
color = {
    'cn':{'up':'#ff0000','dn':'#00ff00'},
    'us':{'dn':'#ff0000','up':'#00ff00'},
}

@route('/')
def index():
    redirect('/mkb/240')

@route('/mkb/<ago:int>')
def mkb(ago):
    like = config['webui']['color']
    return template('webui', ago = ago, color = color[like])

@route('/js/<filename>')
def js(filename):
    return static_file(filename, root='./js/')

@route('/boll')
def boll():
    return "boll"

@route('/macd/<day:int>')
def macd(day):
    m = MACD()
    dif, dea, bar = m.getMACD(day)
    return json.dumps({'dif':dif, 'dea':dea, 'bar':bar})

@route('/boll/<day:int>')
def boll(day):
    b = BOLL()
    ohlc, up, md, dn = b.getBOLL(day, 20)
    return json.dumps({'ohlc':ohlc, 'up':up, 'md':md, 'dn':dn})

@route('/kdj/<day:int>')
def kdj(day):
    kdj = KDJ()
    k, d, j = kdj.getKDJ(day)
    return json.dumps({'k':k, 'd':d, 'j':j})

run(host='127.0.0.1', port=8000, debug=True)

唯一的一个 html 就是具体用 highcharts 画图的地方，如下：

<html>
<head>
   <meta http-equiv="refresh" content="60">
   <script type="text/javascript" src="http://ajax.googleapis.com/ajax/libs/jquery/1.8.2/jquery.min.js"></script>
   <script type="text/javascript" src="/js/highstock.js"></script>
   <script type="text/javascript" src="/js/highcharts.js"></script>
   <script>
    $(function () {
        Highcharts.setOptions({  
            global: {  
                useUTC: false  
            }  
        }); 
        $.getJSON('/boll/', function(bolldata) {
            var ohlc = []
                volume = [],
                dataLength = bolldata['ohlc'].length;
            for (i = 0; i < dataLength; i++) {
                ohlc.push([
                    bolldata['ohlc'][i][0],
                    bolldata['ohlc'][i][1],
                    bolldata['ohlc'][i][2],
                    bolldata['ohlc'][i][3],
                    bolldata['ohlc'][i][4],
                ]);
                volume.push([
                    bolldata['ohlc'][i][0],
                    bolldata['ohlc'][i][5],
                ])
            };
            $.getJSON('/kdj/', function(kdjdata) {
               $.getJSON('/macd/', function(macddata) {
                    $('#container').highcharts('StockChart', {
                        rangeSelector: {
                            enabled: 0
                        },
                        chart: {
                            backgroundColor: '#333333',
                        },
                	    tooltip: {
                	    	formatter: function() {
                				var s = '<b>'+ Highcharts.dateFormat('%A, %b %e, %H:%M', this.x) +'</b>';
                				$.each(this.points, function(i, point) {
                					s += '<br/>'+this.series.name+': '+parseFloat(point.y).toFixed(2);
                				});
                				return s;
                			}
                	    },
                        plotOptions: {
                            series: {
                                marker: {
                                    enabled: false
                                },
                                lineWidth: 1.1,
                            }
                        },
                        yAxis: [{
                          title: {
                              text: 'MACD(12,26,9)'
                          },
                          height: 200,
                        }, {
                          title: {
                              text: 'KDJ(9,3,3)'
                          },
                          top: 250,
                          height: 150,
                          offset: 0,
                          gridLineDashStyle: 'Dash',
                          tickPositions: [0, 20, 50, 80, 100, 200]
                        }, {
                            title: {
                                text: 'BOLL(20)'
                            },
                            top: 450,
                            height: 300,
                            offset: 0,
                        }, {
                            title: {
                                text: 'VOL'
                            },
                            top: 800,
                            height: 100,
                            offset: 0,
                        }],
                        series: [{
                            name: 'BAR',
                            color: '',
                            negativeColor: '',
                            borderColor: '#333333',
                            type: 'column',
                            data: macddata['bar'],
                            yAxis: 0,
                        }, {
                            name: 'DIFF',
                            color: '#ffffff',
                            type: 'line',
                            data: macddata['dif'],
                            lineWidth: 2,
                            yAxis: 0,
                        }, {
                            name: 'DEA',
                            color: '#ffff00',
                            type: 'line',
                            data: macddata['dea'],
                            lineWidth: 2,
                            yAxis: 0,
                        }, {
                            name: 'K',
                            color: '#ffffff',
                            type: 'line',
                            data: kdjdata['k'],
                            yAxis: 1,
                        }, {
                            name: 'D',
                            color: '#ffff00',
                            type: 'line',
                            data: kdjdata['d'],
                            yAxis: 1,
                        }, {
                            name: 'J',
                            color: '#cc99cc',
                            type: 'line',
                            data: kdjdata['j'],
                            yAxis: 1,
                        }, {
                            type: 'candlestick',
                            name: 'ohlc',
                            data: ohlc,
                            upColor: '',
                            upLineColor: '',
                            color: '',
                            lineColor: '',
                            yAxis: 2,
                        }, {
                            type: 'spline',
                            name: 'up',
                            data: bolldata['up'],
                            color: '#ffff00',
                            lineWidth: 2,
                            yAxis: 2,
                        }, {
                            type: 'spline',
                            name: 'md',
                            data: bolldata['md'],
                            color: '#ffffff',
                            lineWidth: 2,
                            yAxis: 2,
                        }, {
                            type: 'spline',
                            name: 'dn',
                            data: bolldata['dn'],
                            color: '#cc99cc',
                            lineWidth: 2,
                            yAxis: 2,
                        }, {
                            name: 'VOL',
                            borderColor: '#333333',
                            type: 'column',
                            data: volume,
                            yAxis: 3,
                        }]
                    });
                });
            });
        });
    }); 
   </script>
</head>
<body>
   <div id="container" style="min-width:800px;height:1000px;"></div>
</body>
</html>

highcharts 有个问题，就是不能跟 amcharts 或者 echarts 那样提供一个画笔工具，让用户自己在生成的图形上再涂抹线条，这个功能其实在蜡烛图上判断压力位支撑位的时候很有用。不过蜡烛图 btc123 也提供了，我也就懒得再用 amcharts 重写一遍。

效果如下：

为 gitolite 实现 mailinglist 命令行操控

2013-12-09T00:00:00+00:00

gitolite 是一个很常用的 git 仓库管理软件，可以通过命令行方式便捷操作自己拥有权限的项目仓库。不过不是所有的操作都可以通过命令完成，很多还是需要通知 gitolite 管理员来统一修改配置然后生效。比如通过 hook 发邮件这件事情。邮件收件人地址肯定每个项目就不一样，这个还要让管理员逐一来改，就不太好。所以这里实现了一个 mailinglist 的命令行操作子命令。

使用说明

要求.gitolite.rc 中开启 GIT_CONFIG_KEYS 允许 hooks
要求.gitolite.rc 中开启 ENABLE 允许 mailinglist
在.gitolite/hooks/common/ 下软连接 git 默认的 post-receive-email 成 post-receive 文件

注意这里修改的 hooks 是针对整个 gitolite 的总 hooks 目录。而不是每个 repo 自己的 hooks，这个是单独有 repo-special-hooks 命令来管理的。

代码修改

代码上的修改主要就是两处：

新增文件 src/commands/mailinglist 如下；

    #!/usr/bin/perl
    use strict;
    use warnings;
    use Data::Dumper;
    use lib $ENV{GL_LIBDIR};
    use Gitolite::Rc;
    use Gitolite::Common;
    use Gitolite::Easy;
    use Gitolite::Conf::Load;
    
    our %one_repo;
    our %one_config;
    
    my $repo = $ARGV[0];
    my $addr = $ARGV[1];
    
    $ENV{GL_USER} or _die "GL_USER not set";
    
    my $generic_error = "repo does not exist, or you are not authorised";
    
    _die $generic_error if not owns($repo);
    
    if ( $addr ) {
        # write
        _chdir("$rc{GL_REPO_BASE}/$repo.git");
    
        if ( -f "gl-conf" ) {
            my $cc = "./gl-conf";
            _die "parse '$cc' failed: " . ( $! or $@ ) unless do $cc;
        }
    
        my $num;
        my $i;
        for ( @{ $one_config{$repo} } ) {
            $num = $_->[0];
            next unless $_->[1] eq 'hooks.mailinglist';
            $_->[2] = $addr and $i++ and last;
        }
        push @{$one_config{$repo}}, [ $num, 'hooks.mailinglist', $addr] unless $i;
    
        open( my $compiled_fh, ">", "gl-conf" ) or _die $!;
    
        my $dumped_data = '';
        $dumped_data = Data::Dumper->Dump( [ \%one_repo ], [qw(*one_repo)] );
        $dumped_data .= Data::Dumper->Dump( [ \%one_config ], [qw(*one_config)] );
    
        print $compiled_fh $dumped_data;
        close $compiled_fh;
    
    } else {
        # read
        my $val  = git_config($repo, 'hooks.mailinglist');
        print $val->{'hooks.mailinglist'};
    }
    
    1;

修改 src/lib/Gitolite/Rc.pm 如下：

@@ -459,7 +459,7 @@ DATA UMASK => 0077,

   # look for "git-config" in the documentation   -    GIT_CONFIG_KEYS                 =>  '',   +    GIT_CONFIG_KEYS                 =>  'hooks.*',
 
   # comment out if you don't need all the extra detail in the logfile
   LOG_EXTRA                       =>  1,   @@ -520,6 +520,7 @@ __DATA__
           'info',
           'perms',
           'writable',   +            'mailinglist',

gitolite 本身相关的代码解析，和实现思路，我写成了这个 slide，欢迎观看：

Puppet 的类参数传递

2013-11-04T00:00:00+00:00

之前使用 ENC 管理 puppet，尽量保持了输出 yaml 内容的简单，只提供了一个统一的全局参数定义 node 的 role。(题外话，puppetlabs 推荐了另一个通过继承关系实现 role 的示例，见：Designing Puppet - Roles and Profiles。)

但是 puppet 中有些配置确实修改比较频繁，文件操作不得不说是一件不甚方便的事情，于是重新考虑通过类参数的方式来灵活化某些配置的操作。

修改前

nginx/manifests/init.pp

class nginx {
    include "nginx::${::role}"
}

nginx/manifests/loadbalancer.pp

class nginx::loadbalancer {
    $iplist = ['192.168.0.2:80']
    file { 'nginx.conf':
        content => template('nginx/nginx.conf.erb'),
    }
}

enc nginxhostname

---
classes:
  - nginx
  - base
environment: production
parameters:
  role: loadbalancer

修改后

nginx/manifests/init.pp

class nginx ($iplist = []) {
    class { "nginx::${::role}":
        iplist => $iplist
    }
}

nginx/manifests/loadbalancer.pp

class nginx::loadbalancer ($iplist = []) {
    file { 'nginx.conf':
        content => template('nginx/nginx.conf.erb'),
    }
}

enc nginxhostname

---
classes:
  nginx:
    iplist:
      - 192.168.0.2:80
  base: ~
environment: production
parameters:
  role: loadbalancer

要点

虽然真正需要 $iplist 的是下面的一个子类，但是 ENC 传值是给的父类，所以需要一层层传递下去；
ENC 中给类传参，类就要写成哈希形式，否则是数组形式；
有参数的类，在调用的时候无法使用 include 形式的写法，只能用资源调用形式的写法。

修改中出现了一个很搞笑的错误，因为是在 vim 里批量转换，结果子类名字后面多了一个空格，成了class { "nginx::${::role} ":这样。结果 puppet 一直返回报错说 “Invalid Parameter”。这时候一个习惯性的思维造成了误会：我们一般会认为:后面的那一行行键值对才是 parameter，但其实这里子类名也是 class 这个资源调用的 parameter。当然，如果可以在这里报一个 Class Not Found 就更好了。

用 Perl 读取通达信日线数据

2013-11-04T00:00:00+00:00

之前看 skyline 的报警机制的时候，为了寻找测试数据，曾经想到是不是可以用股价走势。其实股价走势分析也是一个很深的编程领域，有些选股软件一份就好几千的卖。当然我这里没兴趣和时间搞那么复杂了。简单的说一下如何从通达信的存档里读取日线数据，说到底还是 pack/unpack 的运用：

#!perl
open my $fh, '<', 'C:\new_sxzq_v6\vipdoc\sh\lday\sh000001.day';
while ( sysread $fh, my $buf, 32 ) {
# 日期，开盘，最高，最低，收盘，成交金额，成交量，预留位
    my ( $date, $open, $high, $low, $close, $amount, $vol, $reserved ) =
      unpack( 'Ii4fi2', $buf );
    printf "%s %.2f %.2f %.2f %.2f %d %d\n", $date, $open / 100, $high / 100,
      $low / 100, $close / 100, $amount, $vol;
}

注意这里一定要一边 sysread 一边 while，否则一只股票的历史(上例中是上证指数)都没读完就会内存溢出的。

selinux 对 webserver 文件发布的影响

2013-10-26T00:00:00+00:00

SELinux 在国内是一个很少有人用的东西，一般来说，服务器上手第一件事情就是把 SELinux 关掉，以至于有问题的时候排查思路里都压根没检查 SELinux 这步。

昨天在个人电脑的 Fedora 上搭建一个 webserver 发布几个文件，本来想着简单任务越快越好，几行命令完成：

sudo yum install httpd
sudo mv ~/src /var/www/html/
sudo service httpd start

结果居然一直返回 403 Denied！

看 httpd 的 error.log ，一直报这么一行错误：

[core:error] [pid 3806] (13)Permission denied: [client 127.0.0.1:59180] AH00035: access to /src/master.zip denied (filesystem path '/var/www/html/src') because search permissions are missing on a component of the path

很奇怪吧，于是我先去确认了 httpd.conf 里关于 <Directory "/var/www/html"> 的配置(因为 Fedora19 的 httpd 版本是 2.4.6，我以为新版本有变化了)，然后去确认了 /var/www/html/src 的权限是不是 755，其他用户可读的。都没问题！

最后还是在 apache 的 httpd 官方文档上找到了关于这个错误码的详细解释，原来还有一种可能性，就是 SELinux 的安全控制！这个可以通过下面这个命令看到：

$ ls -lZ /var/www /var/www/html
/var/www:
drwxr-xr-x. root   root   system_u:object_r:httpd_sys_script_exec_t:s0 cgi-bin
drwxr-xr-x. apache apache system_u:object_r:httpd_sys_content_t:s0 html

/var/www/html:
drwxr-xr-x. chenlin.rao chenlin.rao unconfined_u:object_r:user_home_t:s0 src

看到没有，这里这些文件的 SELinux 类型是不一样的，默认的 /var/www/html 是 httpd_sys_content_t，/var/www/cgi-bin 是 httpd_sys_script_exec_t，而从我家目录移过去的 /var/www/html/src 是 user_home_t！

解决办法也很简单，把这个类型也改过来就好了：

$ chcon -R -t httpd_sys_content_t /var/www/html/src

这是第一次接触 SELinux 的安全管理，真的是好细致！

用 plenv 代替 perlbrew 管理 Perl5

2013-10-25T00:00:00+00:00

我们都知道有 virtualenv 啊，rvm 啊之类的工具来管理 python，ruby的多版本问题，后来台湾的朋友也引入到了 Perl 世界，这就是 perlbrew。

不过 perlbrew 在使用的时候，有个非常让我不理解的地方，就是切换 Perl 版本后，整个终端的环境变量都被清空了。后来发现了一个新项目，叫 plenv，没错，一眼就可以看出来这是 rlenv 工具的 Perl 版。

和 perlbrew 不一样，目前版本的 plenv 已经是一个纯粹的 shell 工具。说起来原先一直是 shell 工具的 rvm，这周却在募捐准备改用 Ruby 重写了(据说是因为已经 2 万行的 bash 代码，作者快控制不住了)。

用法非常简单：

git clone git://github.com/tokuhirom/plenv.git ~/.plenv
echo 'export PATH="$HOME/.plenv/bin:$PATH"' >> ~/.bash_profile
echo 'eval "$(plenv init -)"' >> ~/.bash_profile
exec $SHELL -l # 这步相当于退出重登录终端
git clone git://github.com/tokuhirom/Perl-Build.git ~/.plenv/plugins/perl-build/
plenv install 5.18.0
plenv rehash # 每次在 $HOME/.plenv/bin 下安装了新的命令后都要执行一次这个
plenv install-cpanm
plenv rehash
plenv shell 5.18.0 # 还有 global 和 local 两者可设

目前我已经用 plenv 管理自己电脑上的 Perl5 了，你们呢？

Perl 的 overload 妙用

2013-10-16T00:00:00+00:00

在使用 Mojolicious 的时候，通常我们会发现一个很有趣的现象。

use ojo;
say g('http://www.baidu.com')->dom->at('script');
say g('http://www.baidu.com')->dom->at('script')->text;

这里可以看到，在用 at() 方法之后得到的结果，如果从上一行解读，似乎应该是一个字符串；但是从下一行解读，又还是一个对象，可以继续调用 ->text 属性。

Perl 本身不是一个纯对象式的语言，字符串本身是没有对象属性的。而直接打印对象的话，应该输出的是类似 Mojo::DOM->HASH(0x1234567) 的效果。那这个效果是怎么实现的呢？

翻了 Mojo 的代码之后，发现原来 Mojo 里是把字符串、数组等都实现成了对象，分别是 Mojo::ByteStream 和 Mojo::Collection 两个类。然后再实现中，运用了 overload 来实现这个效果。代码很简单，Mojo::ByteStream 里是这样的：

use overload '""' => sub { shift->to_string }, fallback => 1;
sub to_string { ${$_[0]} }

此外， Mojo::DOM，Mojo::URL，Mojo::JSON 等十多个类中都用了这个方法。

看起来似乎还不是很明了，再贴两段 overload 的 POD 就清楚了：

It also defines an anonymous subroutine to implement stringification: this is called whenever an object blessed into the package Number is used in a string context...
For example, the subroutine for '""' (stringify) may be used where the overloaded object is passed as an argument to print,...

这下清楚了吧。一旦在某个类里 overload 了双引号，那么这个类的对象在标量环境下调用的时候就会先调用这个函数。最典型的例子就是用在 print 的时候。

下面我们可以自己也试试：

package Test 0.01 {
    use overload '""' => sub { join " overloaded.\n", @{+shift} };
    sub new { bless [@_[1 .. $#_]], shift };
}
my $obj = new Test(1, 3, 2);
print $obj;

输出结果：

1 overloaded.
3 overloaded.
2

【翻译】用 elasticsearch 和 logstash 为数十亿次客户搜索提供服务

2013-10-09T00:00:00+00:00

原文地址：http://www.elasticsearch.org/blog/using-elasticsearch-and-logstash-to-serve-billions-of-searchable-events-for-customers/

今天非常高兴的欢迎我们的第一个外来博主，Rackspace软件开发工程师，目前为Mailgun工作的 Ralph Meijer。我们在 Monitorama EU 会面后，Ralph 提出可以给我们写一篇 Mailgun 里如何使用 Elasticsearch 的文章。他本人也早就活跃在 Elasticsearch 社区，经常参加我们在荷兰的聚会了。

Mailgun 收发大量电子邮件，我们跟踪和存储每封邮件发生的每个事件。每个月会新增数十亿事件，我们都要展示给我们的客户，方便他们很容易的分析数据，也就是全文搜索。下文是我们利用Elasticsearch和Logstash技术完成这个需求的技术细节（很高兴刚写完这篇文章就听说《Logstash加入Elasticsearch》了）。

事件

在 Mailgun 里，event可能是如下几种：进来一条信息，可能被接收可能被拒绝；出去一条信息，可能被投递可能被拒绝(垃圾信息或者反弹)；信息是直接打开还是通过链接点击打开；收件人要求退订。所有这些事件，都有一些元信息可以帮助我们客户找出他们的信息什么时候，为什么，发生了什么。这个元信息包括：信息的发送者，收件人地址，信息id，SMTP错误码，链接URL，geo地理位置等等。

每个事件都是由一个时间戳和一系列字段构成的。一个典型的事件就是一个关联数组，或者叫字典、哈希表。

事件访问设计

假设我们已经有了各种事件，现在需要一个办法来给客户使用。在Mailgun的控制面板里，有一个日志标签，可以以时间倒序展示事件日志，并且还可以通过域名和级别来过滤日志，示例如下：

在这个示例里，这个事件的级别是”warn”，因为SMTP错误码说明这是一个临时性问题，我们稍后会重试投递。这里有两个字段，一个时间戳，一个还没格式化的非结构化文本信息。为了醒目，这里我们会根据级别的不同给事件上不同的底色。

在这个网页之后，我还有一个接收日志的API，一个设置触发报警的hook页面。后面的报警完全是结构化了的带有很多元数据字段的JSON文档。比如，SMTP错误码有自己的字段，收件人地址和邮件标题等也都有。

不幸的是，原有的日志API非常有限。他只能返回邮件投递时间和控制面板里展示的非结构化的文本内容。没办法获取或者搜索多个字段(像报警页面里那样)，更不要说全文搜索了。简单说，就是控制面板缺乏全文搜索。

用elasticsearch存储和响应请求

要给控制面板提供API和访问，我们需要一个新的后端来弥补前面提到的短板，包括下面几个新需求：

允许大多数属性的过滤。
允许全文搜索。
支持存储至少30天数据，可以有限度的轮滚。
添加节点即可轻松扩展。
节点失效无影响。

而Elasticsearch，是一个可以“准”实时入库、实时请求的搜索引擎。它基于Apache Lucene，由存储索引的节点组成一个分布式高可用的集群。单个节点离线，集群会自动把索引(的分片)均衡到剩余节点上。你可以配置具体每个索引有多少分片，以及这些分片该有多少副本。如果一个主分片离线，就从副本中选一个出来提升为主分片。

Elasticsearch 是面向文档的，某种层度上可以说也是无模式的。这意味着你可以传递任意JSON文档然后就可以索引成字段。对我们的事件来说完全符合要求。

Elasticsearch 同样还有一个非常强大的请求/过滤接口，可以对特定字段搜索，也可以做全文搜索。

事件存入elasticsearch

有很多工具或者服务可以用来记录事件。我们最终选择了 Logstash，一个搜集、分析、管理和传输日志的工具。

在内部，通过webhooks推送来的event同时在我们系统的其他部分也有使用，目前我们是用Redis来完成这个功能。Logstash有一个Redis输入插件来从Redis列表里接收日志事件。通过几个小过滤器后，事件通过一个输出插件输出。最常用的输出插件就是 Elasticsearch 插件。

利用 Elasticsearch 丰富的 API 最好的办法就是使用 Kibana，这个工具的口号是“让海量日志有意义”。目前最新的 Kibana 3 是一个纯粹的 JavaScript 客户端版，随后也会成为 Logstash 的默认界面。和之前的版本不同的是，它不在依赖于一个类Logstash模式，而是可以用于任意Elasticsearch索引。

认证

到这步，我们已经解决了事件集中的问题，也有了丰富的API来深入解析日志。但是我们不想把所有日志都公开给每个人，所以我们需要一个认证，目前Elasticsearch 和 Kibana 都没提供认证功能，所以寄希望于 Elasticsearch API 是不可能的了。

我们选择了构建双层代理。一层代理用来做认证和流量限速，一层用来转义我们的事件 API 成 Elasticsearch 请求。前面这层代理我们已经以 Apache 2.0 开原协议发布在Github上，叫 vulcan 。我们还把我们原来的那套日志 API 也转移到了 Elasticsearch 系统上。

索引设计

有很多种方法来确定你如何组织自己的索引，基于文档的数目(每个时间段内)，以及查询模式。

Logstash 默认每天创建一个新索引，包括当天收到的全部时间。你可以通过配置修改这个时间，或者采用其他属性来区分索引，比如每个用户一个，或者用事件类型等等。

我们这里每秒有1500个时间，而且我们希望每个账户的轮转时间段都是可配置的。可选项有：

一个大索引。
每天一个索引。
每个用户账户一个索引。

当然，如果需要的话，这些都可以在未来进一步切分，比如根据事件类型。

管理轮滚的一个办法是在 Elasticsearch 中给每个文档设定 TTLs 。到了时间 Elasticsearch 就会批量删除过期文档。这种做法使得定制每个账户的轮转时间变得很简单，但是也带来了更多的 IO 操作。

另一个轻量级的办法是直接删除整个索引。这也是 Logstash 默认以天创建索引的原因。过了这天你直接通过 crontab 任务删除索引即可。

不过后面这个办法就没法定制轮转了。我们有很多用户账户，给每个用户每天保持一个索引是不切实际的。当然，给所有用户每天存一个索引又意味着我们要把所有数据都存磁盘上。如果一个账户是保持两天数据的轮转，那么在缓存中的数据就是有限的。在查询多天的垃圾邮件时，处理性能也就受限了。所以，我们需要保留更多的日志以供Kibana访问。

映射

为了定义文档(中的字段)如何压缩、索引和存储在索引里，Elasticsearch 有一个叫做 mapping 的概念。所以为每个字段它都定义了类型，定义了如何分析和标记字段的值以便索引和查询，定义了值是否需要存储，以及其他各种设置。默认的情况，mapping是动态的，也就是说 Elasticsearch 会从它获得的第一个值来尝试猜测字段的类型，然后正式应用这个设置到索引。

如果你的数据来源单一，这样就很好了。但实际可能来源很复杂，或者日志类型根本就不一样，比如我们这，同一个名字的字段的数据类型可能都不一样。 Elasticsearch 会拒绝索引一个类型不匹配的文档，所以我们需要自定义 mapping 。

通过我们的 Events API ，我给日志事件的类型定义了一个映射。不是所有的事件都有所有这些字段，不过相同名字的字段肯定是一致的。

分析器

默认情况下，字段的 mapping 中就带有标准分析器。简单的说，就是字符串会被转成小写，然后分割成一个一个单词。然后这些标记化的单词再写入银锁，并指向具体的字段。

有些情况，你可能想要些别的东西来完成不同的效果。比如说账户 ID，电子邮件地址或者网页链接 URL之类的，默认标记器会以斜线分割，而不考虑把整个域名作为一个单独的标记。当你通过 facet 统计域名字段的时候，你得到的会是域名中一段一段标签的细分结果。

要解决这个问题，可以设置索引属性，给对应字段设置成 not_analyzed。这样在插入索引的时候，这个字段不再经过映射或者标记器。比如对 domain.name 字段应用这个设置后，每个域名都会完整的作为同一个标签统计 facet 了。

如果你还想在这个字段内通过部分内容查找，你可以使用 multi-field type。这个类型可以映射相同的值到不同的核心类型或者属性，然后在不同名称下使用。我们对 IP 地址就使用了这个技术。默认的字段(比如叫sending-ip)的类型就是 ip，而另一个非默认字段(比如叫 sending-ip.untouched)则配置成 not_analyzed 而且类型为字符串。这样，默认字段可以做 IP 地址专有的范围查询，而 .untouched 字段则可以做 facet 查询。

除此以外，绝大多数字段我们都没用分析器和标记器。不过我们正在考虑未来可以结合上面的多字段类型技巧，应用 pattern capture tokenfilter 到某些字段(比如电子邮件地址)上。

监控

要知道你的集群怎么样，你就必须要监控它。 Elasticsearch 有非常棒的 API 来获取 cluster state 和 node statistics。我们可以用 Graphite 来存储这些指标并且做出综合表盘，下面就是其中一个面板：

为了收集这些数据并且传输到 Graphite，我创建了 Vör，已经在 Mochi Media 下用 MIT/X11 协议开源了。另外一个保证 Redis 列表大小的收集器也在开发中。

除此以外，我们还统计很多东西，比如邮件的收发、点击数，API调用和耗时等等，这些是通过 StatsD 收集的，同样也添加到我们的 Graphite 表盘。

这绝对是好办法来观察发生了什么。Graphite 有一系列函数可以用来在绘图前作处理，也可以直接返回JSON文档。比如，我们可以很容易的创建一个图片展示 API 请求的数量与服务器负载或者索引速度的联系。

当前状况

我们的一些数据：

每天大概4kw 到 6kw 个日志事件。
30天轮转一次日志。
30个索引。
每个索引5个分片。
每个分片一个1副本。
每个索引占 2 * 50 到 80 GB空间(因为有副本所以乘2)。

为此，我们启动了一共 9 台 Rackspace 云主机，具体配置是这样的：

6x 30GB RAM, 8 vCPUs, 1TB disk: Elasticsearch 数据节点。
2x 8GB RAM, 4 vCPUs: Elasticsearch 代理节点， Logstash， Graphite 和 StatsD。
2x 4GB RAM, 2 core: Elasticsearch 代理节点， Vulcan 和 API 服务器

大多数主机最终会迁移到专属的平台上，同时保留有扩展新云主机的能力。

Elasticsearch 数据节点都配置了 16GB 内存给 JVM heap。其余都是标准配置。此外还设置了 fieldcache 最大大小为 heap 的 40%，以保证集群不会在 facet 和 sort 内容很多的字段时挂掉。我们同时也增加了一点 cluster wide settings 来加速数据恢复和重均衡。另外，相对于我们存储的文档数量来说，indices.recovery.max_bytes_per_sec 的默认设置实在太低了。

总结

我们非常高兴用 Elasticsearch 来保存我们的事件，也得到了试用新 API 和新控制面板中新日志页面的客户们非常积极的反馈。任意字段的可搜索对日志挖掘绝对是一种显著的改善，而 Elasticsearch 正提供了这种高效无痛的改进。当然，Logstash，Elasticsearch 和 Kibana 这整条工具链也非常适合内部应用日志处理。

如果你想了解更多详情或者对我们的 API 有什么疑问，尽管留言。也可以在 Mailgun 博客上阅读更多关于事件 API 的细节。

开心处理日志，开心发送邮件！

用 ElasticSearch 支持 Rexify 网站的搜索功能

2013-09-14T00:00:00+00:00

最近给 Rexify 官网做中文化工作，除了文字翻译之外，还要负责把服务正常跑起来。网站本身就是一个 Mojolicious 写的小东西，用 morbo html/website.pl 命令直接运行就可以监听在 3000 端口，然后通过 nginx 代理发布即可。

不过官网上还有一个高级功能需要另外支持，那就是搜索。

Rexify 官网的搜索功能是通过 ElasticSearch 提供的。这里需要注意一点，官方提供的 create_index.pl 中，并不是直接把文件内容本身存入 ES 索引的(之前介绍过的 devopsweekly_index.pl 脚本就是这样做的)，而是编码成 Base64 之后再以附件形式存储。

一开始我没注意到这点，结果搜索结果里一直只有标题和链接，没有高亮内容。后来发现是存的 base64 编码后又很疑惑 Rexify 官网是如何把 base64 再解码回来到网页上显示的。幸亏后来想到去 ElasticSearch 官网搜索一下 base64 关键词，然后发现了专门的介绍页面。原来是有一个插件实现的附件解析，调用了 Apache Tika 库，也就意味着支持 HTML/XML/Office/ODF/PDF/Epub/RTF/TXT/ZIP/MP3/JPG/FLV/Mbox/JAR 等等各种格式的文件。

所以，安装这个插件，然后重建索引，就可以正常提供搜索功能了：

/usr/share/elasticsearch/bin/plugin -install elasticsearch/elasticsearch-mapper-attachments/1.9.0
rexify-website/create_index.pl localhost 9200 html/templates

脚本本身超级简单，欢迎大家自行阅读。

Perl 和 Python 的 pack 函数格式字符的区别

2013-09-10T00:00:00+00:00

MooseFS 是运用很广泛的一个分布式文件系统，其自带有一个 python 写的 CGI 页面，可以查看集群状态。不过对于运维来说，这就不太方便纳入 nagios 等其他现有的监控体系中。好在既然它的 CGI 是 python 写的，那么自己照样临摹出一个监控脚本也不是太复杂。

其实整个数据是由 master 的 9421 端口进行 TCP 交互获取的，不过比较麻烦的是并不是普通文本流。CGI 中采用了 pack/unpack 函数来处理 TCP 包。根据数据的前 8 字节确定数据总长度和 MooseFS 的版本，然后依照不同版本的 pack 方式来 unpack 剩余内容。

笔者熟悉 Perl，所以就准备将这个处理流程改用 Perl 完成。结果发现原来 pack/unpack 在 Perl 和 Python 中，写法是不一样的。以 MooseFS 的 info 信息读取代码为例，Python 版如下：

s = socket.socket()
s.connect((masterhost, masterport))
mysend(s, struct.pack(">LL", 510, 0))
header = myrecv(s, 8)
cmd, length = struct.unpack(">LL", header)
if cmd == 511 and length == 76:
    data = myrecv(s, length)
    v1, v2, v3, memusage, total, avail, trspace, trfiles, respace, refiles, nodes, dirs, files, chunks, allcopies, tdcopies = struct.unpack(">HBBQQQQLQLLLLLLL", data)
    ver = '.'.join([str(v1), str(v2), str(v3)])

而 Perl 版最终写完是这样的：

my $s = IO::Socket::INET->new(
    PeerAddr => $host,
    PeerPort => $port,
    Proto    => 'tcp',
);
my ($header, $data);
print $s pack('(LL)>', 510, 0);
sysread $s, $header, 8;
my ($cmd, $length) = unpack('(LL)>', $header);
if ( $cmd == 511 and $length == 76 ) {
    sysread $s, $data, $length;
    my ($v1, $v2, $v3, $memusage, $total, $avail, $trspace, $trfiles, $respace, $refiles, $nodes, $dirs, $files, $chunks, $allcopies, $tdcopies) = unpack('(SCCQQQQLQLLLLLLL)>', $data);
    my $ver = "$v1.$v2.$v3";
};

不同处主要有两点：

关于 big-endian 定义的 > 符号位置不同，Python 里写在起首一次性全部生效；Perl 里需要每个格式符单独定义，或者采用括号合起来总定义；
Python 里的 H 格式符表示 unsigned short，在 Perl 里应该是 S；Python 里的 B 格式符表示 unsigned char，在 Perl 里应该是 C。

翻看了一下，在 PHP 和 Ruby 中，格式符定义和 Perl 是一样的，不清楚为什么 Python 这么特殊==!

各语言关于 pack 格式符的文档链接如下：

编译最新 3.10 内核在 RHEL6 上支持 Docker

2013-08-27T00:00:00+00:00

之前在 Fedora19 上试图自己通过编译 3.10 内核的方式来完成 aufs 的支持，但是一直有问题，哪怕同样的步骤，github 上其他人都可以，只能怀疑是我个人电脑问题了。不过后来通过 SPEC 方式完成了最终测试，感谢 sciurus 童鞋的项目。

部署过程如下：

# 安装这个包以便使用 mock 命令在 chroot 环境下打包
yum install -y fedora-packager
# 下载我的而不是原作者的，因为里面 aufs 和 lxc 的下载链接都已经更新了，原来的404了
git clone https://github.com/chenryn/docker-rhel-rpm.git

spectool -g -C docker docker/docker.spec 
mock -r epel-6-x86_64 --buildsrpm --spec docker/docker.spec --sources docker --resultdir output
mock -r epel-6-x86_64 --rebuild --resultdir output output/docker-0.6.0-1.el6.src.rpm 

spectool -g -C lxc lxc/lxc.spec
mock -r epel-6-x86_64 --buildsrpm --spec lxc/lxc.spec --sources lxc --resultdir output
mock -r epel-6-x86_64 --rebuild --resultdir output output/lxc-0.8.0-3.el6.src.rpm

spectool -g -C kernel-ml-aufs kernel-ml-aufs/kernel-ml-aufs-3.10.spec
mock -r epel-6-x86_64 --buildsrpm --spec kernel-ml-aufs/kernel-ml-aufs-3.10.spec --sources kernel-ml-aufs --resultdir output
mock -r epel-6-x86_64 --rebuild --resultdir output output/kernel-ml-aufs-3.10.5-1.el6.src.rpm

cd output
yum localinstall --nogpgcheck kernel-ml-aufs-3.10.5-1.el6.x86_64.rpm lxc-0.8.0-3.el6.x86_64.rpm lxc-libs-0.8.0-3.el6.x86_64.rpm docker-0.6.0-1.el6.x86_64.rpm

echo 'none                    /sys/fs/cgroup          cgroup  defaults        0 0' > /etc/fstab
reboot

kernel 文件来自 RHEL，不过我试了下，在我的Fedora19上也正常可用。3.10.5 和 3.2 相比，第一 3.10 将会是未来一段时间内 kernel 的主线支持；第二 docker 官方说在 3.8 之前有点小 bug 可能会被触发。

在 Docker 上运行 PerlDancer 示例

2013-08-26T00:00:00+00:00

搭建好了 docker 环境后，就可以来试试用 docker 跑一个应用实例来看看了。和 Vagrant 比较类似，docker 也是用一个配置文件来规划其基础镜像内的部署，不过值得注意的是，在 Dockerfile 里的每一个指令成功执行后，docker 默认都会 commit 一次，这样就节省了一些空间和时间。

构建失败的镜像，在 docker images 命令输出中显示为 <none> 可以根据具体的 commit id，调用 docker rmi <id> 命令清除。

一个比较简单的 Dockerfile 示例是这样的：

FROM centos:6.4
RUN yum install make gcc wget perl perl-devel perl-Time-HiRes perl-CGI perl-libwww-perl perl-Module-Build perl-Test-Simple perl-Test-Deep perl-YAML
RUN wget http://cpanmin.us
RUN perl cpanm Dancer
ADD /var/www/dancerapp app
EXPOSE 3000
CMD perl app/bin/app.pl

然后运行如下命令构建镜像：

docker build -t chenryn/perldancer

如果构建都成功的话，那就是正式运行了：

docker run -p 8080:3000 -d chenryn/perldancer

运行起来以后，可以通过 docker ps 命令看到本机上运行着的容器状态信息。同样，也可以通过映射的 8080 端口访问到页面了。

正在测试通过 plenv 来使用高版本的 perl，目前比较郁闷的是因为 plenv 是通过 ~/.profile 来在每次登陆的时候自动切换到指定版本的，而 docker 里的 RUN 调用 /bin/sh -c 不会调用到这些文件，所以一直还是使用系统自带版本。而在 RUN 指令里每行都写一个 source $HOME/.profile 也很难看的。

快速在 CentOS6 上运行 docker

2013-08-24T00:00:00+00:00

docker 是由著名 PAAS 公司 dotcloud 开源的 linux 容器项目，在此之前，只有 cloudfoundry 下属的 warden 半死不活的慢慢前进着。

不管是 docker 还是 warden，其原理大多是通过 LXC( 即 CGroup 和 namespace 的结合)以及 AUFS 的结合，完成比较彻底的容器虚拟化。这里有个问题：AUFS 不是 linux 官版内核支持的文件系统。所以到现在，各种 PAAS 都是运行在 Ubuntu 系统上，因为只有这个系列的发行版默认打了 AUFS 的补丁。这也严重影响了 PAAS 开源社区的扩容：

RedHat 发行版系列才是企业用户最多的 linux 发行版；
Debian 社区已经宣布在未来会放弃默认打 AUFS 补丁的做法。

docker 目前已经在积极准备将代码 port 到 BtrFS 上以备未来，不过在此之前，我们还是可以通过自己打补丁的方式，在 RedHat 系列上尝试 docker 的。目前社区已经有很多尝试：

其中，包括有三种内核，源代码编译支持3.8的，spec编译支持3.10的，以及已经打包完成的3.2的。

我已经尝试过在 Fedora19 上通过源代码编译，似乎内核从3.8到3.10有些变化，编译失败了。(但是尝试过编译3.8的确实没问题)

下面通过最简单的已经打包完成的3.2内核来快速部署 docker 到 CentOS6 上，以便尝鲜：

rpm -e kernel-firmware
rpm -i http://get.docker.io/kernels/kernel-3.2.40_grsec_dotcloud-4.x86_64.rpm
/sbin/dracut --add-drivers dm-mod --add-drivers linear "" 3.2.40-grsec-dotcloud
grub-install /dev/sda1
echo "blacklist evbug" >> /etc/modprobe.d/blacklist.conf
echo "kernel.grsecurity.chroot_caps = 0" >> /etc/sysctl.conf
echo "sysctl kernel.grsecurity.chroot_caps=1" >> /etc/rc.local
echo "net.ipv4.ip_forward = 1" >> /etc/sysctl.conf
mkdir /cgroup
echo "none /cgroup cgroup defaults 0 0" >> /etc/fstab
cat >> /boot/grub/grub.conf<<EOF
title CentOS (3.2.40_grsec_dotcloud-4.x86_64)
	root (hd0,0)
	kernel /boot/vmlinuz-3.2.40-grsec-dotcloud ro root=LABEL=/ rd_NO_LUKS rd_NO_LVM LANG=en_US.UTF-8 rd_NO_MD SYSFONT=latarcyrheb-sun16 crashkernel=auto  KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM selinux=0
	initrd /boot/initramfs-3.2.40-grsec-dotcloud.img
EOF
reboot

内核的更新就是这些，记住这个包不支持 selinux，所以启动项里要加上 selinux=0。

然后重启登录重启并选择了新内核的主机，继续安装一些依赖工具：

wget "ftp://ftp.pbone.net/mirror/ftp5.gwdg.de/pub/opensuse/repositories/home%3A/awk2007%3A/fixes/Fedora_17/src/aufs-util-9999-14.1.src.rpm"
sudo yum install glibc-static
rpmbuild --rebuild aufs-util-9999-14.1.src.rpm
rpm -U /root/rpmbuild/RPMS/x86_64/aufs-util-9999-14.1.x86_64.rpm
wget ftp://ftp.univie.ac.at/systems/linux/dag/redhat/el6/en/x86_64/dag/RPMS/lxc-0.8.0-1.el6.rf.x86_64.rpm
wget http://apt.sw.be/redhat/el6/en/x86_64/dag/RPMS/lxc-libs-0.8.0-1.el6.rf.x86_64.rpm
rpm -U lxc-0.8.0-1.el6.rf.x86_64.rpm lxc-libs-0.8.0-1.el6.rf.x86_64.rpm

然后下载 docker 的二进制文件运行，用源代码的话比较麻烦，docker 是用 golang 写的……

wget http://get.docker.io/builds/Linux/x86_64/docker-latest.tgz
tar xzf docker-latest.tgz
cd docker-latest

启动 docker 进程，输出如下：

[root@localhost docker-latest]# ./docker -d &
2013/08/24 18:24:18 WARNING: You are running linux kernel version 3.2.40-grsec-dotcloud, which might be unstable running docker. Please upgrade your kernel to 3.8.0.
2013/08/24 18:24:18 Listening for HTTP on /var/run/docker.sock (unix)

然后就可以通过 docker 命令运行了，示例及输出如下所示：

[root@localhost docker-latest]# ./docker run -i -t busybox /bin/sh
2013/08/24 18:24:30 POST /v1.4/containers/create
2013/08/24 18:24:30 POST /v1.4/images/create?fromImage=busybox&tag=
Pulling repository busybox

Pulling image e9aa60c60128cad1 (latest) from busybox
Pulling e9aa60c60128cad1 metadata
Pulling e9aa60c60128cad1 fs layer
Downloading 2.284 MB/2.284 MB (100%)
2013/08/24 18:28:37 POST /v1.4/containers/create
2013/08/24 18:28:37 POST /v1.4/containers/cdf0feaf24a9/start
2013/08/24 18:28:37 POST /v1.4/containers/cdf0feaf24a9/resize?h=27&w=121
2013/08/24 18:28:37 POST /v1.4/containers/cdf0feaf24a9/attach?logs=1&stderr=1&stdin=1&stdout=1&stream=1
BusyBox v1.19.3 (Ubuntu 1:1.19.3-7ubuntu1.1) built-in shell (ash)
Enter 'help' for a list of built-in commands.

/ # 
/ # ls
bin    dev    etc    lib    lib64  proc   sbin   sys    tmp    usr
/ # cd /root
/bin/sh: cd: can't cd to /root

可以看到，现在登录进来是不能切换目录到 root 家目录的。

docker 已经运行起来了，更多实例，就可以看着 docker.io 上的文档慢慢进行了

BeiJing Perl Workshop 2013 参会总结

2013-08-14T00:00:00+00:00

上周六在万通会议中心参加了 BeiJing Perl Workshop 2013 ，并做了 40 分钟长的关于 ElasticSearch 的演讲。上届 2011 作为一个看客，两年后作为一个积极参与和演讲者，真的有必要记录一下。

一天中最让大家惊奇和感兴趣的无疑是胡松涛带来的 3D 打印机以及每人都有的 Perl 小挂件 —— 没错，就是用 3D 打印出来的小东西。

最遗憾的是来自alibaba的两位演讲者因为公司问题临时退出。

DeNA 的演讲者是一位由程序员转职的产品经理，明显演讲的技巧水平是要高过我们这些纯码农的，节奏控制完全值得学习。不知道对于其他 perler 来说，测试是否会主动去做，但是我是蛮习惯使用 Dancer::Test 的，包括其他项目用 Test::More，我觉得都是蛮好的习惯。所以对董余康在演讲中比较重点的提到测试的便捷我是比较有爱的，但是从 QQ 群上的反应来看，大家更期待的功能和开发便捷上的介绍？总的来说，演讲题目偏于 PerlDancer 的 hello world，我个人本身对 Dancer 有一定了解，所以内容上没太注意。如果以后发现大家对 Dancer 有进一步的兴趣，我考虑可以在 YY 频道上介绍一下用 Dancer::Plugin 实现一个自己喜欢的keyword？

扶凯的 Mojolicious 演讲应该就比较符合大众的期待。我是不太喜欢单独定义 route 的方式，不管是 RoR 还是 mojo，除此以外，mojo 另一个不错的就是 TagHelper 了。我觉得将 Dancer 和 Mojolicious::Lite 相比是不厚道的，Dancer 也可以多文件使用，dancer -a web_app 命令就生成了完整的项目层次。关于 mojo 的演讲，牛氓同学说没有关于 Mojo 的 OO 实现的内容，我也觉得比较遗憾，不过这个内容是否适合在面对上百听众的时候分享，也是一个问题？

李瑞彬演讲中提到的 cpanspec 和 yum search perl(LWP::Simple) 两个小技巧很不错～

刘刊和大家不同，采用了直接 code 解读和 shell 演示的办法介绍了他的 pantheon 里面的一些思想和简单用法。其实我去年就见过这个的使用，不过似乎到现在依然没有完整的文档？作为一个在雅虎超大环境下经过实践的自动化运维平台项目，如果配上完善的文档，应该可以成为一个可以对 Perl 普及有很不错推动力的好项目。真心希望刘刊和 pantheon 的其他使用者可以花点时间，整理一份快速入手的 cookbook，迁移代码到github，独立域名发布，完成从内部项目到社区项目的转身～目前只能通过 CPAN 安装，安装很方便，但是没人演示教导，真的不知道怎么用……

也来说说我自己的演讲。这个话题其实比较尴尬，前三分之一介绍 ElasticSearch，中间还有一部分是 logstash，都是 Perl 无关的内容。演讲完后其实发现很多人依然不清楚到底是可以用来干吗……或许我直接只讲 Message::Passing ，每个插件如何用，效果应该更好一些吧？唯一高兴的，是演讲刚好控制到了40分钟内讲完。

许大师提到一个大计划，要把 AnyEvent 和 nginx 无缝结合。这个好是好，能不能出来是另一回事……

闪电演讲依然火爆，不过我有事情先走了，不知道后来还有几位超时被敲锣的～～对了，第一个闪电提到的 $obj->can($func_name)->() 这个用法很帅，记录一下。

原本在 CU 上答应网友在闪电上分享一下 autobox 的用法，也没法做了，有点违约的小羞愧。以后也争取在 YY 频道上说说。

作为演讲者，还另外免费领了一本《HBase管理指南》，实在其他几本 Perl 的都已经有了——而且大多数演讲者都是～～

BJPW 之后第二天就开始 YAPC::EU，国外大神基本都在欧洲讨论 Future Perl，北京的朋友们自娱自乐也还是比较成功了～

最后吐槽一个，全天没有 Perl6 的演讲，结果文化衫上是 Perl6 的蝴蝶。。。其实如果能让广州那个 MoarVM 的开发者叫来讲讲也挺好的。

附另外两位同仁的大会感受博文：

@赵涛Alick 的《Perl China 2013 活动后记》
Aka.Why 的《参加Beijing Perl Workshop 2013后感》

Selenium 测试框架介绍

2013-07-22T00:00:00+00:00

Selenium 是一个自动化网站测试框架，包括 IDE、WebDriver 和 Grid 三个套件。其官网地址见：http://docs.seleniumhq.org/projects/。其中 Grid 用以跨主机的集群测试，今天就不讲了。而 WebDriver 则是用以控制 Selenium Server(Server 上可以接受并启动的浏览器包括Firefox、IE、Chrome、Safari、Android、IPhone、PhantomJS 等等)进行具体测试动作的客户端，其早期版本叫做 Remote Control。

最有特色和帮助的，是 IDE 部分，这是一个 Firefox 的 xpi 插件。通过下载安装，就可以启用，然后就是最简单不过的浏览器操作录制，结束动作后就可以自动导出各种支持的语言版本的 WebDriver 程序。

注意在安装好 xpi 后，在 IDE 上并不能同步看到生成的程序内容，并不是说没有录制，而是默认不显示 options/format 的内容。在 options/options 里把 active developer tools 选项激活就可以了。

Selenium 是一个 java 项目，官方支持的客户端程序包括 Java、C#、Ruby 和 Python2。社区支持的包括 Perl、PHP 和 Haskell 等等。

注意 Selenium 的 WebDriver 和 Remote Control 两个版本之间 API 已经完全不一样，所以在 IDE 录制的时候，format 已经要选 WebDriver API 的才能用——除非你还找得到老版本的 Selenium Server，反正我是没找到。

不巧的是目前官网上的插件列表中，只有官方支持的四个更新了 WebDriver 的 IDE 支持。所以直接从官网上安装的 Perl plugin 其实是没用的。不过不要紧，我很容易就找到了支持 WebDriver 的 Perl 模块，并且还使用 Perl 模块完成了对 Selenium Server 的管理。

这里要用到两个 CPAN 模块：Selenium::Server 和 Selenium::Remote::Driver。

由于 Firefox addons 网站上的 Selenium IDE: Perl Formatter 还是老版本的，即 Test::WWW::Selenium 配套的，所以我们需要自行安装新版本插件。

新版本插件也就是一段 javascript 代码，在 Selenium::Remote::Driver 代码库目录中已经存在，即 https://github.com/aivaturi/Selenium-Remote-Driver/blob/master/ide-plugin.js。

按照 js 文件开头注释中的介绍，在 Selenium IDE 的 options/options 菜单的 Formats 选项卡上点击 Add 按钮，给新的 format 取名为 Perl-WebDriver，然后把整个 js 文件内容贴进文本框内保存即可。

现在，录制操作只需选择使用 Perl-WebDriver 格式，就可以生成 Perl 测试脚本使用了。

下一个问题，就是 Selenium Server 的运行。IDE 生成的脚本只负责连接 server 并发送命令。server 的状况在 IDE 中是在 options/formats 中定义的变量，即 Selenium RC host 、Selenium RC port 和 environment。默认是 localhost、4444 和 firefox。在生成脚本的时候会自动替换。

也就是说，我们需要自己部署程序，再运行一个脚本，启用 java 程序，来运行 Selenium Server。

这里就可以用上 Selenium::Server 了。程序的下载、启用、参数配置和停止，都有该模块完成。

最后一步，我们可以把 Selenium::Server 的相关代码，也贴进 IDE 的 options/formats 的 Header 和 Footer 模板里。这样不用每次自己粘贴了——自己粘贴代码还不如直接自己启用一个固定监听 4444 端口的 java 程序得了。

IDE 截图如下：

生成脚本如下所示：

    use strict;
    use warnings;
    use Selenium::Server;
    use Selenium::Remote::Driver;
    use Test::More;
    
    my $server = Selenium::Server->new;
    $server->start;
    
    my $driver = Selenium::Remote::Driver->new(
        remote_server_addr => $server->host,
        port               => $server->port
    );
    
    $driver->get("http://10.2.21.100:8081/?results=88ceefac3c0c588d14f579d0c47f74fc");
    $driver->find_element("DNS可用性测试", "link")->click;
    like(qr/^[\s\S]*各地测试可用性[\s\S]*$/,$driver->find_element("BODY", "css")->get_text);
    $driver->quit();
    done_testing();
    
    $server->stop;

脚本中这个 click 操作显然是直接根据动作录制的，那么 find_element()->get_text 是怎么来的呢？其实 Selenium IDE 已经修改了浏览器内鼠标右键菜单的选项。在选中的任意网页元素上单击鼠标右键，菜单中就有 Show All Available Commands 子菜单，只需要选择就可以了。方便吧！

生成的脚本直接运行，就可以完成测试了。

和 Selenium 类似的，还有 WWW::WebKit 模块，它是调用 Gtk3::WebKit 作为后端浏览器支持，不过经过我个人电脑测试，要安装好 Gtk3::WebKit 本身就是一件很复杂的事情。加上有时候我们也需要比较不同浏览器的效果是不是有所不同。所以，还是用 Selenium 吧。

注：在最近一期 PerlWeekly 对 Perl 社区创业公司 Lokku/Nestoria 的访谈中，Lokku 公司 CTO，Alex Balhatchet 也提到准备使用 Selenium 改造公司的自动化测试。

补：刚发现 Selenium 的 PHP 客户端，是 Facebook 写的。

2013 年 07 月 25 日补

Selenium 的另一个功能是自己插入 javascript 到页面里执行。比如我们可以利用 HTML5 的 WebTiming 特性测试页面的下载时间：

    my $webtiming = q{
        var performance = window.performance
                       || window.webkitPerformance
                       || window.mozPerformance
                       || window.msPerformance
                       || {};
        var timings     = performance.timing || {};
        return timings;
    };
    $driver->get("http://stackoverflow.com/");
    my $res = $driver->execute_script($webtiming);
    for ( sort keys %$res ) {
        printf "%s %s\n", $_, $res->{$_}/1000;
    };

WebTiming 详细列出了每个阶段的时间。如果 js 写的好，可以写具体某个点触发，就更好了。

2013 年 07 月 26 日补

Selenium::Remote::Driver 只发送操作命令到远端服务器，不具有操作本地浏览器功能。所以无法像 Ruby 的 Selenium::WebDriver 那样控制本地浏览器，甚至包括插入 .xpi 插件到自定义的 profile 里完成更复杂的功能：比如用 Firebug。有一个 Ruby 模块叫 capybara-firebug，就是利用这个办法扩展了 capybara 测试框架。

【Logstash 系列】根据事件统计值报警

2013-07-11T00:00:00+00:00

之前已经用很多博文说过了 logstash 如何配合 elasticsearch 以及 kibana 来做日子分析和实时搜索。其实 logstash 上百个插件还有很多其他的玩法，绝不是局限在日志搜索统计方面的。今天就展示另一个做法。根据日志中的异常值出现频率报警。

在 logstash 的官网上，针对这个问题采用的办法是讲异常值计数 output 到 statsd 中，然后可以用通过观测 graphite 图形变化来判断异常。(或者配合 nagios 的 check_graphite 插件？) 官网说明见：http://logstash.net/docs/1.1.13/tutorials/metrics-from-logs

如果不想一直盯着页面看的话，可以利用另外几个插件来实现类似的做法，比如我要监控访问日志，如果其中 504 状态码~~每分钟~~超过 100 次，就报警出来。logstash 配置如下：

2014 年 08 月 20 日注：上面说法有误，rate_1m 的含义是：最近 1 分钟内的每秒速率！

    input {
        stdin {
            type => "apache"
        }
    }
    filter {
        grok {
            pattern => "\[%{HTTPDATE:ts}\] %{NUMBER:status} %{IPORHOST:remotehost} %{URIHOST} %{WORD} %{URIPATHPARAM:url} HTTP/%{NUMBER} %{URIHOST:oh} %{NUMBER:responsetime:float} %{NUMBER:upstreamtime:float} (?:%{NUMBER:bytes:float}|-)"
            type => "apache"
        }
        metrics {
            type => "apache"
            meter => "error.%{status}"
            add_tag => "metric"
            ignore_older_than => 10
        }
        ruby {
            tags => "metric"
#            code => "event.cancel if event['@fields']['error.504.rate_1m'] < 100"
#           2014/08/20: 每秒速率，所以要乘以60s。另，新版本没有了@fields，都存在顶级field里。
            code => "event.cancel if event['error.504.rate_1m']*60 < 100"
        }
    }
    output {
        exec {
            tags => "metric"
            command => "sendsms.pl -m '%{error\.504\.rate_1m}'"
        }
    }

其中关键在两个 filter。 metrics 插件可以每5秒(前天刚更新了源码，这个值可以自己指定了)更新一次统计值，支持 meter 和 timer 两种，timer 除了 count 和 rate_1|5|15m 外，还可以统计 min|max|stddev|mean 和 p1|5|10|90|95|99 等详细数据。

ruby 插件则是直接 eval 写在 code 配置里的代码。

需要注意的是： output 里使用的时候，需要用 \ 转义 .。否则配置解析后会认为变量不存在。这是目前官网文档上写的有问题的地方。我已經跟作者提过，或许过些天会修改。

值得一提的是：metrics 插件的输出是一个全新的 event，而不会去改变原先 grok 生成的 event。

获取 Perl 程序中 GET 请求发向的具体 IP

2013-06-28T00:00:00+00:00

在运维工作中我们经常需要检测用户访问是否正常，一般来说，直接通过 DNS 客户端获取 A 记录就可以满足需要。不过如果我们可以获得具体连接的 IP 地址，那么就可以缩小问题的判断范围，因为 DNS 的 A 记录通常是有多个的。

AE::HTTP 模块可以返回 sock 给用户进行具体操作，我们可以通过 sock 接口很简单的获得对端的 IP 地址：

package Web::Checker::Util::HTTP;
use Moo;
use MooX::Types::MooseLike::Base qw/Str Num/;
use AnyEvent::HTTP;
use AnyEvent::Socket;
use AnyEvent;
use Time::HiRes qw/time/;

has peer    => ( is => 'rw', isa => Str );
has reptime => ( is => 'rw', isa => Num );
has clength => ( is => 'rw', isa => Num );
has body    => ( is => 'ro', isa => Str );
has proxy   => ( is => 'ro', isa => Str, default => sub { undef } );
has cv => ( is => 'ro', default => sub { AnyEvent->condvar } );

sub get {
    my ( $self, $url ) = @_;
    $self->cv->begin;
    my $begin = time;
    http_get $url,
      proxy            => $self->proxy,
      # 就是这里发挥了作用，默认应该是直接返回 body 字符串的
      want_body_handle => 1,
      sub {
        my ( $hdl, $headers ) = @_;
        my ( $port, $peer ) =
          AnyEvent::Socket::unpack_sockaddr getpeername $hdl->{fh};
        $self->peer( AnyEvent::Socket::format_address $peer );
        if ( $headers->{Status} =~ /^2/ ) {
            my $end = time;
            $self->reptime( $end - $begin );
            $self->clength( $headers->{'content-length'} );
            $self->cv->end;
        }
      };
    $self->cv->recv;
}

1;

其实 AE::HTTP 还可以在 tcp_connect 的时候获取 sock，这时候就需要自己用 AnyEvent::Handle 写一遍 AnyEvent::HTTP::tcp_connect 已经写过的东西了(当然如果你本来就打算干点别的事情，那就是另外一回事情了)~~

计算两个时间点之间隔了几天

2013-06-24T00:00:00+00:00

两个时间点字符串，像这样：2013-06-21，怎么计算相距多少天呢？

有两种办法。

DateTime 模块

use DateTime;
use List::MoreUtils qw(zip);
use Data::Dumper;
print Dumper(
    DateTime->new( zip @{ [qw/year month day/] },
        @{ [ split /-/, '2013-06-21' ] } )->subtract_datetime(
        DateTime->new(
            zip @{ [qw/year month day/] },
            @{ [ split /-/, '2012-05-20' ] }
        )
        )->deltas
);

缺点是 DateTime::Duration 的 days() 只能返回进位 months() 之后剩余的天数。所以这里只能输出整个 deltas() 来看。

timestamp 时间戳

use POSIX qw(mktime);
sub trans {
    my @str = split /-/, shift;
    mktime(
        0, 0, 0, $str[2],
        $str[1] - 1,
        $str[0] - 1900,
    );
}
my $dt1 = trans('1999-05-21');
my $dt2 = trans('2013-06-26');
print( ( $dt2 - $dt1 ) / ( 60 * 60 * 24 ) );

这里就是要注意，mktime 里的 month 是以 0 开始的，year 是从 1900 开始的。

2014 年 01 月 22 日更新：

在2013 年底的 advent calendar 和 perlmaven 上学习到了另外两个模块，这里补充一下：

Time::Piece 模块

这个模块是 Perl5 的corelist 模块，所以不用另外安装就能使用：

use Time::Piece;
my $t1 = Time::Piece->strptime('2013-06-26', '%Y-%m-%d');
my $t2 = Time::Piece->strptime('2012-06-21 GMT', '%Y-%m-%d %Z');
print +($t1 - $t2)->days;

Time::Piece 模块重载了加减号，所以直接两个时间相减后就得到了 Time::Seconds 对象，然后调用 days 方法返回具体天数就可以了。

这里有个奇怪的问题，在采用 strptime 方法解析创建对象的时候，%Z 格式似乎除了 GMT 之外写其他的都会爆出：

Error parsing time at /usr/lib/perl/5.14/Time/Piece.pm line 469.

这个真的很诡异了。

2014 年 01 月 23 日补充：

去看了一下 Piece.xs 的内容，发现虽然文档上说是学习的 FreeBSD 的 strptime 实现，但是差的也太多了～直接里面 _strptime 函数关于时区的就一个 *got_GMT 真假判断 ==!

完整的 strptime 见 POSIX::strptime 模块，或许我可以写一个扩展？

DateTime::Moonpig 模块

这个模块是最近出的，属于 DateTime 模块的接口封装和优化。

use DateTime::Moonpig;
my $t3 = DateTime::Moonpig->new(year => 2013, month => 6, day => 26, time_zone => 'America/New_York');
my $t4 = DateTime::Moonpig->new(year => 2012, month => 6, day => 21, time_zone => 'GMT');
print int( ($t3 - $t4) / (60 * 60 * 24) );

从示例可以看出两点优化：

可以灵活调整 DateTime::Moonpig 对象的时区，而不用分别 use DateTime;use DateTime::TimeZone；
直接加减返回的不再是那个不好用的 DateTime::Duration 对象而是秒数。

如何去除 rpmbuild 自动发现的依赖关系

2013-06-21T00:00:00+00:00

同事在用简单的 SPEC 配置打包 nagios 套件的时候，发现最后生成的 RPM 包附加了很多依赖关系。其中 perl-Net-SNMP 这个包，是服务器默认安装中没有的。这也不是什么大问题。不过这个出现还是蛮奇怪的。值得研究一下。

后来在 /usr/lib/rpm/ 目录下发现了一系列脚本，诸如javadeps/perl.req/pythondeps/find-requires/mono-find-requires等等。

这些脚本的作用是，用 file 命令判断文件，如果是二进制的，用ldd判断依赖；如果是脚本，过滤文件中对应的 use/requires/import 语句。这样就可以找出来源代码的内部依赖了。

那么怎么才能跳过这段逻辑呢？

最暴力的办法，这些文件都是 bash 或者 perl 脚本，直接修改。

但是还可以文明一点，像下面这段，添加在 SPEC 文件中：

    %setup
    
    %prep
    cat << \EOF > %{name}-req
    #!/bin/sh
    %{__perl_requires} $* |\
    sed -e '/perl(Net::SNMP)/d'
    EOF
    %define __perl_requires %{_builddir}/%{name}-%{version}/%{name}-req
    chmod 755 %{__perl_requires}

这里重定义了一个脚本，原先的定义在 /usr/lib/rpm/macros 中，是：

    #%__find_provides       /usr/lib/rpm/rpmdeps --provides
    #%__find_requires       /usr/lib/rpm/rpmdeps --requires
    %__find_provides        /usr/lib/rpm/find-provides
    %__find_requires        /usr/lib/rpm/find-requires
    #%__perl_provides       /usr/lib/rpm/perldeps.pl --provides
    #%__perl_requires       /usr/lib/rpm/perldeps.pl --requires
    %__perl_provides        /usr/lib/rpm/perl.prov
    %__perl_requires        /usr/lib/rpm/perl.req
    %__python_provides      /usr/lib/rpm/pythondeps.sh --provides
    %__python_requires      /usr/lib/rpm/pythondeps.sh --requires
    %__mono_provides        /usr/lib/rpm/mono-find-provides %{_builddir}/%{?buildsubdir} %{buildroot} %{_libdir}
    %__mono_requires        /usr/lib/rpm/mono-find-requires %{_builddir}/%{?buildsubdir} %{buildroot} %{_libdir}

然后将加入了 sed 命令的新脚本定位为新的 MACROS 变量给 rpmbuild 后续使用。

通过 Rex 命令行参数向动态服务器组发起任务

2013-06-20T00:00:00+00:00

Rex 默认的服务器组定义方式有三种，直接写在 Rexfile 文件中；每行一个写成 IP 列表保存成文件，然后通过 lookup_file 读取；把组名和 IP 写成 .ini 格式文件，通过 groups_file "$name.ini" 一次性获取。

如果服务器信息存在数据库里，那么可以通过 Rex::Commands::DB 来快速读取数据库信息，构建服务器组。不过，如果我们是想从数据库中根据查询条件，动态获取服务器列表完成指定任务的话，就没法提前定义好 group 了。这个时候，怎么办呢？

我们可以利用 task 可以接受命令行参数这个特点，完成这个功能：

use Rex::Commands::DB {
    dsn      => "dbi:SQLite:dbname=/etc/puppet/webui/node.db",
    user     => "",
    password => "",
};

task "sqlite", sub {
    my $param = shift;
    my $role  = $param->{role};
    my $class = $param->{class};
    my $todo  = $param->{todo};
    grep { run_task $todo, on => $_->{ip} } db select => {
        fields => "ip",
        from   => "node_info",
        where  => "role like '$role\%' and classes like '\%${class}\%'",
    };
};

task 'hello', sub {
    say run "w";
};

然后这样运行命令即可：

rex sqlite --role=cdn --class=nginx --todo=hello

【Etsy 的 Kale 系统】skyline 的过滤算法

2013-06-19T00:00:00+00:00

监控大户 Etsy 最近有公布了一个全新的监控分析系统，叫 Kale，博客地址：http://codeascraft.com/2013/06/11/introducing-kale/。

上一篇博客介绍了安装部署和数据导入的方法。但是对 skyline 组件的过滤原理没有做研究。今天花了点时间看 wiki 和源码，大概搞清楚了 skyline 的工作方式。很有趣，值得记录一下。

同样作为时间序列存储的 rrdtool 和 graphite，都偏重在预测算法，也就是说根据现有数据推测下一个数据应该是多少；而 skyline 则是根据现有数据统计最新数据是否异常。

目前，skyline 一共提供了 7 个异常检测算法，如果有 5 个以上认为是异常，那么 skyline 就认为这个序列异常了。(当然，这都是可以修改的)

异常检测算法实际写在了 src/analyzer/algorithms.py 里，包括有：

first_hour_average

这是最简单的。先求本周期内最前面的第一个小时的平均值和标准差，然后和最新的三个值的平均值(tail_avg()，这是后面多数算法都通用的做法)做比较。如果 tail_avg 和第一小时平均值的差距大于 3 倍的标准差，那么认定为异常。

simple_stddev_from_moving_average

把上面算法的范围扩大化，求的是整个周期内全部数据的平均值和标准差。

stddev_from_moving_average

在上面算法的基础上，采用指数加权移动平均值。对周期内采点数量较少的情况更好一些。

mean_subtraction_cumulation

做法是这样的：

排除最后一个值；
求剩余序列的平均值；
全序列减去上面这个平均值；
求剩余序列的标准差；
判断全序列最后一个值是否大于 3 倍的标准差

在代码中本来还计算了一次序列的指数加权移动平均值，但是算完了却没用，感觉怪怪的。

least_squares

采用最小二乘法拟近时间序列，然后用实际值减去拟近值得到新序列。然后判断新序列的最后三个值的平均值是否大于 3 倍的新序列标准差。

所谓最小二乘法，简单说就是对一个 [x, y] 序列，会有一对常数 [m, c]，让 Y = mx + c 等式中的 Y 和 y 在全序列上最接近。

histogram_bins

将整个周期序列的数据按照直方图统计法归入 15 个直方中，然后看最后三个值的平均值属于这 15 个直方的具体哪个。如果这个直方中包含的数据小于 20 个，判断为异常。

从算法中可以知道，如果周期内数据量不够，很容易被判断为异常的。

grubbs

将整个周期序列的数据按照格拉布斯法求异常值。

标准的格拉布斯法是这样的：

从小到大排序；
求序列的平均值和标准差；
计算最小值和最大值与平均值的差距，更大的那个为可疑值；
可疑值减去平均值，再除以标准差，如果大于格拉布斯临界值，那么就是异常值；
排除异常值，对剩余序列循环做 1-5 步骤。

这里只用判断时间序列的最后是否异常，所以直接将最后三个值的平均值作为可疑值判断是否异常即可。

2013 年 07 月 23 日更新

新增了一个异常算法，现在有 8 个了，要通过 6 个才算真异常。

新增的是”绝对中值偏差法”

median_absolute_deviation

具体实现是：序列的最后一个值，比该序列的绝对中值大 6 倍以上，即判断为异常。

注意这里是中值，不是平均值。

2013 年 08 月 14 日更新

新增一个异常算法，现在有 9 个了。

新增的是”柯尔莫诺夫-斯米尔诺夫检验法”

Kolmogorov-Smirnov_test

具体实现是：计算序列内最近十分钟的数值的ks测试分布，然后计算序列中最近一个小时前到十分钟前这 50 分钟的数值的ks测试分布；如果两个分布相差较大，即判断为异常。

【Etsy 的 Kale 系统】简介、部署和应用

2013-06-18T00:00:00+00:00

监控大户 Etsy 最近有公布了一个全新的监控分析系统，叫 Kale，博客地址：http://codeascraft.com/2013/06/11/introducing-kale/。

目前的介绍内容比较简单。两个组件 skyline 和 oculus 之间的关系也还没搞清楚。大概上， skyline 是一个 python 程序，接受 cPickle 和 MessagePack 两种数据包，解压后的数据格式类似 graphite 接收的，然后存在 Redis-server 中。在 webapp 上提供一个类似 rrdtool 的功能，显示触发阈值线的趋势图(不触发的不会显示，自动过滤了)。

安装步骤：

    pip install -r requirements.txt
    apt-get install -y numpy scipy
    pip install pandas patsy statsmodels msgpack_python
    cp src/settings.py.example src/settings.py
    mkdir /var/log/skyline
    mkdir /var/run/skyline
    mkdir /var/log/redis
    # 必须用最新版的 redis-server 才能正常存储
    wget http://redis.googlecode.com/files/redis-2.6.13.tar.gz
    tar zxvf redis-2.6.13.tar.gz
    cd redis-2.6.13
    make
    ./src/redis-server ../bin/redis.conf
    cd ../src
    # 这里会启动 UDP 2024 端口接受 cpickle 包，2025 端口接受 msgpack 包
    ../bin/horizon.d start
    ../bin/analyzer.d start
    # 这里会启动 TCP 1500 端口接受 web 访问
    ../bin/webapp.d start
    # 测试是否正常
    cd ../utils
    ./seed_data.py

oculus 是一个 rack 应用，需要定时从 skyline 中导入数据到 ElasticSearch 中。同时，oculus 还提供了一个 ElasticSearch 分析器插件，可以在 ES 中完成 FastDTW 和 Euclidian 两种位移算法（用来给不同时间序列的近似度打分）。在rack 页面上，提供搜索框，你可以提交一个 metric 名称——经过测试，目前应该是采用完全匹配的方式搜索——然后展示这个 metric 的图形，以及按照 score 打分排序的近似时间序列。

欧几里德算法原理：根据两点的坐标系计算直线距离；
动态时间归整原理：将时间序列进行延伸或者缩短，然后再计算。

http://www.cnblogs.com/kemaswill/archive/2013/04/18/3028610.html

安装步骤：

    # 只能用 0.20.5 版，0.90 版目前不支持
    wget https://download.elasticsearch.org/elasticsearch/elasticsearch/elasticsearch-0.20.5.tar.gz
    tar zxvf elasticsearch-0.20.5.tar.gz
    mv elasticsearch-0.20.5 /opt/elasticsearch
    # 编译插件
    cp -r resources/elasticsearch-oculus-plugin /opt/elasticsearch/
    pushd /opt/elasticsearch/elasticsearch-oculus-plugin
    rake build
    cp OculusPlugins.jar /opt/elasticsearch/lib/OculusPlugins.jar
    # 加载分析器和脚本
    cat >>/opt/elasticsearch/config/elasticsearch.yml<<EOF
    script.native:
      oculus_euclidian.type: com.etsy.oculus.tsscorers.EuclidianScriptFactory
      oculus_dtw.type: com.etsy.oculus.tsscorers.DTWScriptFactory
    EOF
    # 启动
    /opt/elasticsearch/bin/elasticsearch
    
    popd
    bundle install
    mkdir /var/run/oculus
    mkdir /var/log/oculus
    # 启动 worker 进程，这是import.rb 和 ES 交流的渠道
    rake resque:start_workers
    # 编辑 config/config.yml，注意里面ES一定要提供两台，哪怕写一个127.0.0.1一个localhost，后面 import 会验证数目
    vi config/config.yml
    # 从 skyline 导入数据
    ./scripts/import.rb
    echo '*/2 * * * * ~/oculus/scripts/import.rb &> /var/log/oculus/import.log' >> cron.list
    crontab -u root cron.list
    # 启动web
    thin start
    # 默认用户密码都是admin，需要先点击初始化
    gnome-open localhost:3000/admin

oculus 的测试我是做出来了。如图：

这个数据我是通过 perl 生成的随机数，所以也没什么近似队列了。展示一下脚本，这样说明我们可以通过其他脚本扩展 Kale 系统的用途。

    #!/usr/bin/env perl
    use strict;
    use warnings;
    use Data::MessagePack;
    use AnyEvent::Handle::UDP;
    
    my $mp = Data::MessagePack->new->utf8->prefer_integer;
    
    my $cv   = AnyEvent->condvar;
    my $sock = AnyEvent::Handle::UDP->new(
        connect   => [ '127.0.0.1', '2025' ],
        on_recv   => sub { },
        autoflush => 1,
    );
    
    my $timer = AnyEvent->timer(
        after    => 0,
        interval => 5,
        cb       => sub {
            print "send...\n";
            my $data = [ 'localhost.loadavg', [ time(), rand() * 2 ] ];
            my $packed = $mp->pack($data);
            $sock->push_send("$packed");
        },
    );
    
    $cv->recv;

从源码中，看到还有 ganglia_to_skyline.rb 脚本。目前看，Kale 应该是想着用 skyline 代替 graphite-web，得用 redis 来代替 graphite-whisper，不过我觉得似乎意义不是很大，还不如直接把数据存入 ElasticSearch，形成一套类似 openTSDB 的，但是完全基于 ES 的高扩展分布式方案。

【翻译】运维的85条规则

2013-06-12T00:00:00+00:00

2007 年，时任虚拟世界游戏公司 Vivaty 运维副总裁的 Jon Prall 在他的个人博客上发表过一篇《运维的85条规则》。2010 年他跳槽到视频电话公司 Tango 之初，做了两处更新，兹翻译如下：

容量第一，优化第二——这条规则在故障发生时生效。在宕机的时候别研究什么优化，先恢复设备。
保留所有可以捕获的记录——以 PostgresQL 为例，包括有 WAL 文件，Slony 复制，快照技术，基于硬盘的 DB 版本(快照附带的)
不要因为优化引入更多问题。通常我们解决问题时做出来的东西都会转变成之后运维工作的负担。请确认为运维工作开发的那些工具已经完全交付使用。这些东西经常无法正常运行结果要返回开发组重来。更重要的，这种变更请求通常会打破团队原本安排好的工作计划。
保持简单，不要让事情变得太复杂，聪明的你一定可以做到的。
谨慎使用缓存以保护那些难以水平扩展的资源。当然，如果你可以水平扩展它，那么给他加缓存层就不用考虑太多。一旦用上了缓存层，它的目的应该是提高最终用户的访问性能，而不是增加网站的容量。否则，你不过是给自己加上了一个新的非常不可靠的瓶颈。他们潜在的负面影响可能危及整个系统。事实上缓存层失效带来的，经常是雪崩式的级联故障。
不要什么都自己写代码实现，也不要什么都从厂家买——要在适当的时候采用适当的工具。
谈判——和真正有实力的厂家谈判的唯一办法就是提前做好功课，准备好一切可行项。这样一旦有必要，你可以从你的首选厂家里选择离开。不用搞虚张声势那套了。
永远要准备好 N+1 的服务器。如果 N 等于 1，那么不管什么情况都不要动用这个 +1 的设备，专职等待 N 失效后的接管。当你使用冗余的服务器来均衡负载的时候，就只有49%或者更少的容量可管理了。通常我们会获得 N+2 的机会——一定要好好利用起来。
数据丢失是任何一家公司都不敢冒的风险——这是一条普遍真理。丢失数据造成的损耗远远超过用于保证数据不丢失的花费。
随时随地的并行化——这是一种很重要的思维方式。比如，如果 MogileFS 设置为位置感知的方式并且需要实时复制，那么每个 MogileFS 服务器都必须可以复制自己的数据到负载均衡器指定的另一端。只要有可能，尽量实现这种多对多的方式。
RTFM——就在今天我还要阅读一对 RAID 卡的说明书来比较他们微妙的差异。魔鬼在于细节。像做家庭作业一样读文档吧！
了解每一层上的瓶颈以及如何发现瓶颈。必须要知道你是在磁盘，内存，还是 CPU 上受限制了，搞清楚这个其实挺简单的。
要有一个固定的容量管理流程——而且是主动式的，不是被动式的。要知道系统的弱点在哪里，让实际负荷曲线跑到容量曲线之上是极度危险的。
不促成失败，也不惧怕改变。
不要吸进你自己的废气。别以为你现在的工作结果会变成未来你如何工作的动力。
运维人员要写的代码是运维工具，而不是应用软件。
不要低估运维团队中项目经理、技术作者、金融分析师的价值。这些人通常比你给的工资值钱多了。
监控所有的东西——报警只用在异动的时候，其他的都记录下来供趋势分析。
要有一个固定的流程来查看每个地方的趋势数据。
不要让监控太吵闹，那样很快就变得没作用了。
确保你的监控系统简单易用到公司里每个人都能上手。监控数据指标转换成为业务指标、市场指标和销售指标等等的频率可能高的让你吃惊。
只在可以做出相应改变的地方做总结，否则就是白白浪费时间。
总结要公开，同时附上事件相关的数据。这样大家可以很容易的找到总结的关键点并且跳转到对应数据。
要让技术的每一个点都有人员在负责。
同时为这些负责人准备好备份人员。
不断发招聘——哪怕没有名额了。
做自己最严厉的批评者。不管自己或者自认多聪明，总有可以提高的地方。
多往外看，拿自身的水平和尽量多的公司的职位需求做对比。
每年参加一个技术交流大会。如果一年有好几个，那选最好的那一个去就够了。
买你需要的而不是你想要的。绝不摘下你公司的帽子换上那个写着“对我来说什么最简单最安全”的。
只做对业务最好的事情，哪怕这件事是让你滚蛋……
问责制度正规化——记录承诺，事后追究没有完成者。
不允许重复失败。听起来有些过于苛责了。不过要区分不可挽回的失误和失误的差别。
无情——因为对手都是无情的。
工作是你要在完成的时候亲自署名的东西。署名同时也意味着完成任务。
保持对外的可用联络。
创业的伙伴——告诉他们你的专长和能力范围。你会得到免费的产品回报，有时候是生活中的。
容量是一个业务/产品问题。也就是说每个页面、上传或者登录等请求的网络消耗，都必须是可见的，以协助完成正确的业务/产品决策。
一定要打败预算！运维团队总是预算金额最大的挥霍者。公司的收入目标经常达不到，运维团队应该有很多办法来推迟自己的花费。
过去的经验不一定适用于现在乃至将来——多尝试没错，而且要有恰当的测试工具来做这件事。
文档——所有事情都应该好好记录成文档。避免团队的新成员绕着圈的找遍全团队逐一了解工作内容。
画一张超大尺寸的网络拓扑图，描绘你的数据中心。
为你的每个产品都画一个逻辑流程图。
维基——让大家可以很容易的发布“如何修复这个问题”的文档并且容易查找。这是技术作者发挥作用的地方，不过维基可以让哪怕非正式的文档或者增增改改的小段落也更好查看。
确保团队的每个成员，对，是每一个，都是可以替换的。
有些人在家里干活比在公司的时候还好，但有些人却不行。
订单打包签订——把硬件需求打包成大订单后再去咨询最大的折扣合同，记得订单里要包括所有一切，比如备件包，租赁条件等等。
和供应商保持长期联系，哪怕你换到下一份工作的时候也能联系上他们。
给运维团队每个人都配上一切他们可以远程操控的东西——掌上电脑， 3G 网卡，24 寸 LCD 屏幕……你为有才华的人付出得到的回报，远超过在远程雇佣的现场工程师。记住，运维工程师都是电力狂人，他们知道并且能充分利用屏幕上每个像素。
除非 Mac 可以运行 office 2007 和 outlook，否则团队里总需要几个 windows。这事很破坏团队的会议安排，联系人管理和邮件列表等等。
要有一个简化的采购流程——前提是你要了解自己的预算，并且能够管理好。我们可以从财务报告中得到实际。技术驱动的报告和财务驱动的报告之间通常存在差距。一个好的运维经理可以创建一些模型，将这些差别计入销售总成本中。而理解这些的 CFO 才可以帮助推动业务决策。
周会一定要持续举行，对上周的事件逐一总结和问责。
创建一个独立的升级系统，来管理那些对运维产生负面影响的代码开发工程。这个想法的来源是：一个同时涉及运维和开发的问题，在运维或者开发的跟踪系统里大多被湮没无视，最后没人理睬，所以给这些问题单独创建一个跟踪系统反而更加简单清楚。
产品开发从设计开始的每个阶段都要和运维技术相结合。这样，扩展性，监控和可靠性都融入到产品里。这样同时也可以确保运维负责的硬件采购、监控系统按时到位，运行手册即时更新，最后产品按照预计时间上线运行并且都符合运维标准。
像一个真正的公司一样运作——萨班斯法案，WebTrust 安全审计认证，SAS 70 审计标准，Visa 组织和银行等等。如果你真的成功了，这些都是你不得不打交道的。早点开始这些准备其实很简单，不需要太多的知识。不过就是开发一个工单/任务跟踪工具，然后好好使用。把变更控制和管理放进同样的系统里，好好使用。其他信息也放进来。系统就可以帮助我们找出像“上周变更了什么”这类信息。
给冗余留空间。一开始或许很难，但是一个没有真正的扩展性和可靠性的系统，才会真正耽误你获得成功的时间。
买个 Oracle 标准版(或者微软 SQL Server 标准版)是值得的。如果你可以限制住自己不超过标准版的需求，那就绝对值得买，哪怕你刚刚开始创业。
Postgres 和 MySQL 的免费不错。如果你不是特别在意事务完整性，MySQL 其实挺好的。
容量设计应该按照每日峰值再上抛 20% 到 30% 的冗余。除非你是个 vmotion(译注：VMWare 的热迁移技术)达人。
尽量多读一些贸易杂志。它们通常是免费的，只要你填写一些调查问卷就好了。新闻的价值是巨大的。对了，记得让他们投递到你家里，工作的时候读杂志的机会趋近于零。
注意安全。开发人员不应该有生产线的权限，而应该去做代码复核。这是和运维之间的职责分离。然后运维中应该有人控制设置其他运维人员权限的权限。创建一个员工手册，警告大家违反安全条例会有很严重的后果。从一开始就要记住从物理的、逻辑的、功能的各个方面来保护客户的数据安全和隐私。万一有客户要和你对簿公堂，你回忆起来发现自己只是靠勇气和勤奋来保护客户数据，这感觉可不怎么好。
控制好访问入口。首先要保证大家可以正常完成工作；其次要确保你知道他们是从哪里进来的。快去实现双因素身份验证方法吧。
对于人们访问生产环境必经之路的堡垒机和网关，键盘记录是至关重要的。对于 Windows 可能稍微有点难度，不过有些网关可以提供自动截屏功能。
确保有多种办法登录生产环境。不要期望公司的 VPN 在网络中断的时候还能起作用。直接把 VPN 架设在生产环境里。
使用 LDAP 做认证，哪怕你只有 10 台机器，通过复制 passwd 和 shadow 文件的方式来管理，你也要 LDAP 认证。
不要低估在 UNIX 环境中一台 Windows Server 2008 设备是多么有用。如果只是因为不懂 Windows，那么去学，而不是贬低它。
不要用那些无效的无线方案浪费大家的时间。公司里所有人都在移动，沙发上，会议室里，门口，到处都要上网。千万维护好你的无线路由。
总有些人把额外的精力和时间都投入到工作上——直接通过他们的请假单好了。而另一些人恰恰相反只把注意力放在怎么通过自己的请假单。在个人时间安排上，运维人员总是做出巨大的牺牲，他们随时准备凌晨3点爬起床快速响应排障需求。
通过集中式的 RDBMS 管理你所有的设备资产。然后复制资产，人员，网络，合同等所有数据到异地。没错，要的是一个在线的实时可用的复制，而不是每天晚上备份到磁带。
自动使用多进程以确认安全，包括操作系统或者产品的上线，文件的推送，日志的分析等。
自动化操作必须和运维的 RDBMS 数据相关联。
设备通常有三种状态——离线，服务中，预备。预备状态就是说正在通过 cfengine、rsync 或者其他你在使用的工具完成配置。服务中就是已经运行着流量了。同时还需要一个状态，这个状态下的设备可以在不提供生产服务的情况下收集或者测试数据。
尊重日志数据。在设备下线或者重建之前，一定要先导出日志。
如果业务飞速发展让你没有太多时间来做优化，那就尽力锁定一切——进程还能工作，就不要改变它，直到后来有了绝对必要的理由。总之，锁定默认值，等待成长到必要时再审视。
你永远无法避免运维工程师在你基础设施最关键的地方犯点啥错——比如在哪台机器上不小心执行 rm -rf / 命令。
为团队保持好玩和有趣的气氛——如果他们不再享受他们的工作，他们就会找别的事情来消遣。要让团队有主人翁意识，运维不是哪个经理的个人任务。
提供 99.999% 可用性的真正价值在于让我们有能力保持灵活。这意味着当你需要的时候可以充分利用系统冗余。物理变更、设备迁移、代码修改和回退等等都游刃有余。这个对于公司本身价值巨大，甚至比对客户还大。
如果你能做到 99.999%，那就给客户一个 100% 的SLA承诺。
不要湮没软件热更新的能力。应该被湮没的是你自己回滚或者转移到旧版本代码的能力。压根就不应该“处理”这种徒劳的失败转移。当事情变得不如人意的时候，你更应该做的是找个大玩意儿来挡住你的肥屁股。CYA（译注：Cover Your Ass，就是前面说的盖屁股） = 保持敏捷 = 成功的公司。
记住你为客户构建产品的思路里每一步的原因和目的——不管你部署给最终用户的是什么，把这些放在最先考虑，即你所有（基础设施、流程和人员）的设计都是为了提供最好的服务和产品。
第一次就要成功。很少有机会让你回去重新开始的。重做是对公司资源的巨大浪费。
多联系业内的合作伙伴、盟友和类似的企业，看看他们的运维是怎么做的。很可能他们碰到了跟你一样的挑战，而解决的更为巧妙。不要害怕分享自己的经验和处理过程，因为别人也会回馈的。
招人就要招那些足以让自己担心会被挤掉目前工作的，招那些你欣赏和可以学习的榜样，招那些你愿意和他一起工作的。这感觉甚至超过你招聘一个工作考评为A的员工。
IT 和运维是完全不同的两个概念。一个不错的运维经理应该可以管理好企业 IT，但是一个传统的 IT 工程师很难有能力处理互联网运维任务。
当你开始一份新工作或者在每年的起始，都应该去争取预算。这不是说滚着那个滋滋响的轮子往前走(应该是指循规蹈矩照本宣科)，而是要一个基于历史数据做出的优秀的文案。如果你正在评估一份新工作，请确认你完完全全的知道预算以及预算的来源。同时，还应该有的是改善这份预算的权利。

puppet和rex的常用资源写法类比

2013-05-28T00:00:00+00:00

首先要申明，rex 和 puppet 本质上是不同的，puppet 追求的是状态，rex 追求的是操作。puppet 用户经常关心的是 agent 运行了没，而 rex 用户关心的是怎么写 Rexfile 能让中控运行 rex 时的命令参数更简洁漂亮(个人感受==!)。所以哪怕在本文中列举的这些资源写法很类似，也请读者们注意：rex 的资源关键词命名，都是带有动作性的，比如 create，add，install，upload，download，sync 等等。甚至精确的说，rex 里这些不是资源(Puppet::Types::***)，他们是 Rex::Commands::***。

因为 rex 基于并发 ssh 连接，所以它有一些操作是 puppet 所没有的，比如 tail，file_append，fdisk，sysctl 和 iptables 等等，这里暂时不列举。总的来说，本文目的是总结类似的部分，而不是不同的用法……

Cron 资源

puppet 写法

    cron { 'check_starttime':
        ensure  => present,
        minute  => 30,
        hour    => '*/2',
        user    => 'root',
        command => 'sh /usr/local/bin/check_start_time.sh',
        require => File['/usr/local/bin/check_start_time.sh'],
    }

rex 写法

    cron add => "root", {
        minute       => '5',
        hour         => '*',
        day_of_month => '*',
        month        => '*',
        day_of_week  => '*',
        command      => '/path/to/your/cronjob',
    };

File 资源

puppet 写法

    file { '/etc/squid/squid.conf':
        ensure    => file,
        mode      => '0755',
        content   => template('squid/squid.conf.erb'),
        require   => Package['squid'],
        subscribe => Service['squid'],
    }

rex 写法

    file "/etc/squid/squid.conf",
        content   => template("templates/squid.tpl", vars => \%var ),
        owner     => "root",
        group     => "root",
        mode      => 700,
        needs     => SquidPkgTask,
        on_change => sub { service squid => 'restart' };

这里的 on_change 是 File 资源独有的。

通用资源方面，rex 中在同一个 task 内，是按照书写顺序执行；在 task 之间，通过 needs 可以定义依赖。

另外 rex 还有 before，after，around 三个关键字作用于 task 上。不过这三个是在 rex 控制端执行，不是在远端主机上执行。

注意这里，这个 file 看起来没有使用操作性的动词，但其实他是下面这个写法的简写而已：

    install file  => 'templates/etc/hosts.tpl', {
        source    => "/etc/hosts",
        owner     => "root",
        group     => "root",
        mode      => 700,
        on_change => sub { say "Something was changed." },
        template  => {
                        greeting => "hello",
                        name     => "Ben",
                     },
    };

另外，还有一个通过 SFTP 接口上传的写法：

    upload "hosts" => "/etc/";

Package 资源

puppet 写法

    package { 'ganglia-gmond-modules-python-plugin':
        ensure  => installed,
        require => Class['repos'],
    }

rex 写法

    repository add => myrepo,
        url => 'http://rex.linux-files.org/CentOS/$releasever/rex/$basearch/';
    update_package_db;
    install package => 'vim';

Class 定义

puppet 写法

    class squid {
        include squid::install
    }

rex 写法

rex 执行的 Rexfile 其实就是 perl 的模块文件，所以写法就是标准的 perl 写法。

    package Squid {
        require Squid::Install;
    }

呼呼，新版本的 Perl 中可以用 {} 来包裹 package 定义的内容，看起来是不是更像一些？不过 CentOS6 的 5.10 版还不支持，所以通用起见，还是这样写吧：

    package Squid;
    require Squid::Install;
    1;

Directory 资源

puppet 写法

    file { 'murder-client':
        ensure  => 'directory',
        path    => '/usr/local/murder',
        recurse => true,
        purge   => true,
        source  => 'puppet:///modules/murder/dist',
    }

rex 写法

rex 中采用 rsync 来完成目录文件的同步：

    mkdir('/usr/local/murder');
    sync 'dist/*' => '/usr/local/murder', {
        exclude    => "*.sw*",
        parameters => '--backup --delete',
    };

Shell 资源

puppet 写法

    exec {'init-reload':
        command     => '/sbin/initctl reload-configuration && /sbin/initctl start svscan',
        subscribe   => File['/etc/init/svscan.conf'],
        refreshonly => true,
    }

rex 写法

    run "cmd", sub {
        my ($out, $err) = @_;
    };

这个回调函数可以不要，那么 run 命令返回输出到变量。这种用法在单行命令中最常用，比如这样：

    rex -H '192.168.0.[10..30]' -e 'say run "df -h"'

User/Group 资源

puppet 写法

    group {'puppet':
        ensure => present,
        gid    => 501,
        system => true,
    }
    user {'puppet':
        ensure => present,
        uid    => 501,
        system => true,
        groups => ['puppet', '...'],
        expiry => '2013-05-30',
        managehome => false,
    }

rex 写法

    create_group 'puppet', {
        gid    => 501,
        system => 1,
    }
    create_user 'puppet',
       uid => 501,
       home => '/etc/puppet',
       expire => '2013-05-30',
       groups  => ['puppet', '...'],
       password => 'blahblah',
       system => 1,
       no_create_home => TRUE,
       ssh_key => "ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABAQChUw...";

Service 资源

puppet 写法

    service {'nginx':
        ensure => true,
        enable => true,
    }

rex 写法

    service apache2 => ensure => "started";
    service apache2 => "start";

再次可见，rex 认为 service 命令和 chkconfig/update-rc.d 命令是两件事情，所以要分开两个写法。

Mount 资源

puppet 写法

    mount {'/mnt/sda6':
        ensure  => present;
        device  => '/dev/sda6',
        fstype  => 'ext3',
        options => 'noatime,async';
    }

rex 写法

    mount "/dev/sda6", "/mnt/sda6",
       fs => "ext3",
       options => [qw/noatime async/];

Facts 变量和模板

puppet 写法

在 puppet 中，Facts 变量有两种用法，一个是 *.pp 里的写法：

    $::lsbdistid

另一种是在 *.erb 里的写法，值得注意的是变量的作用域：

    <%= scope::lookupvar('ipaddress') %>
    <%= scope::lookupvar('nginx::name') %>

rex 写法

在 rex 中，远端主机的系统状态有多种获取方式，比如：

    # 全部，这些变量默认会传递给 template
    my $sysinfo = Rex::Helper::System::info;

    # 实际就是从上面info里取具体的变量
    my $lsd = get_operating_system;

    # 这个慎用，会死人的
    my @ns = netstat;

也可以使用 set 指令，这种变量和使用 perl 标准 my $name 方式不同的是它可以直接在模板中读取：

    set name => 'CDN';

至于 rex 的模板，它默认没有使用 CPAN 上任何一种现成的模块，而是自己实现了一个，写法如下：

    template('your.tpl', yourvars => \%hash );

然后在模板中这样引用：

    My variable is <%= $::yourvars->{key} %>
    My name is <%= $::name %>
    My lsd is <%= $::operatingsystem %>

明显有模仿 puppet 的痕迹，传递进模版的变量以 $:: 开头，个人比较汗……

所以个人建议还是更换成 CPAN 上的流行模板，比如 Text::Xslate 或者 Text::MicroTemplate 等等，使用 set_template_option 即可。

使用 Rex::Box 代替 Vagrant 的工作

2013-05-27T00:00:00+00:00

Vagrant 是近来 devops 界内非常流行和火爆的工具，它和 puppet/chef 的结合，成为运维开发和测试，甚至预热部署的重要手段。比如在 cloudfoundry 官方放弃使用 vcap_setup 脚本部署后，社区大多对其 BOSH 不买账，转而研究使用 vagrant 部署了。

对于 perl 运维人员，使用 Rex 工具做集群管理的话，其实完全不用再使用 vagrant 了。因为 Rex 自带有 Box 功能。完全可以一体化工作。下面从 Rex 官网上半翻译半截取两篇文章，展示 Rex::Box 的使用。两篇原文分别是：

环境准备

rexify $project-name --template box
cd $project-name
rex init --name=$vm-name --url=$url-to-prebuild-vm-image

虚拟机定义

这里有两种方式，一种是类似 Vagrantfile 定义的 Rexfile 写法：

set box => "VBox";
task mytask => sub {
   box {
      my ($box) = @_;
      $box->name("boxname");
      $box->url("http://box.rexify.org/box/base-image.box");
      $box->network(1 => {
        type => "bridged"      # 默认是 "nat",
        bridge => "eth0",
      });
      $box->forward_port(ssh => [2222, 22]);
      $box->share_folder(boxhome => "/path/to/myuser");
      $box->auth(
        user => "root",
        password => "box",
      );
      $box->setup(qw/setup_frontend/);
   };
};

另一种是采用 YAML 配置：

type: VBox
vms:
   fe01:
      url: http://box.rexify.org/box/ubuntu-server-12.10-amd64.ova
      network:
         1:
            type: bridged
            bridge: eth0
      setup: setup_frontend
   db01:
      url: http://box.rexify.org/box/ubuntu-server-12.10-amd64.ova
      network:
         1:
            type: bridged
            bridge: eth0
      setup: setup_db

虚拟机初始化

在 Vagrant 中有一个概念叫 provision，也就是在虚拟机第一次运行时，通过 shell/puppet/chef 等进行初始化操作。Rex::Box 自然是通过 Rex 本身来进行这个任务。也就是上例中的 setup 定义的 task 名称。

task 'setup_frontend', sub {
    install nginx;
    file '/etc/nginx.conf',
        content   => template('template/httpd.conf.tpl'),
        owner     => "root",
        group     => "root",
        on_change => sub { service nginx => "restart"; };
};

因为 rex 本身是通过 ssh 管理，所以在 setup 之前，必须定义好如何 auth，自己做的镜像不说了，通过 rexify.org 下载的默认镜像，就是默认的 root/box 了。

说到镜像，其实 vagrant 的 .box 也就是 .ova ，都是把 virtualbox 的 .vmdk 和 .ovf 打了个包而已。

当然，也可以在 task 写 shell，通过 run 的方式，其实 run 应该也是 Rex 最常用的 task 了。

task 'setup_frontend', sub {
    run "echo Hello, world";
};

虚拟机使用

定义完成后，就可以使用 init 配置虚拟机环境，然后 start/stop 管理虚拟机。

比如在使用 YAML 配置的时候，配置环境的 Rexfile 最后是这样的：

use Rex::Commands::Box init_file => "box.yml";
group myboxes => map { get_box($_->{name})->{ip} } list_boxes;
task "box", sub {
   boxes "init";
};

像要做成命令行管理也比较简单，比如启动和停止虚拟机的 task 这样写：

task "stop", sub {
    my $param = shift;
    boxes stop => $param->{name};
};

就可以在命令行直接这样启动某个虚拟机了：

rex stop --name=myvbox

事实上，本文最开头的默认 box 模板生成的命令，就是通过前一步生成的 Rexfile 里定义的 task "init", sub {...}; 实现的。

2013 年 07 月 23 日附注：

虽然如此，但是 Vagrant 目前已经成为开源社区风头正劲的一个产品，其开放的 plugin 机制导致周边产品大量出现，已经形成了一个不错的社区氛围。还是建议大家了解 Vagrant 。目前 vagrant-plugin 列表见：https://github.com/mitchellh/vagrant/wiki/Available-Vagrant-Plugins。

用mojo抓取数据并gocr替换图片内容

2013-05-14T00:00:00+00:00

现在的网站越来越狡猾，连招聘网站的信息都懂的把公司的联系方式动态图片化了。还好为了观看方便，没加什么干扰。所以写个脚本来识别还是可以的。虽然到目前为止没发现比较好的 OCR 工具——我指的是可以直接apt-get安装的，有朋友知道哪个比较好的话，欢迎告诉我~

尝试了一下 tesseract-ocr 和 gocr ，还是 gocr 靠谱一点点。所以 apt-get install gocr 安装然后运行下面这个 Perl 脚本：

use ojo;
use 5.010;
g("http://search.buildhr.com/job/581968.html")->dom->charset("UTF-8")->find("div .postjob .padding")->[-1]->find("p")->each(sub{
    my $line = shift;
    my $img_element = $line->at('img');
    if (defined $img_element) {
        my $img_url = $img_element->{src};
        g($img_url)->content->asset->move_to("test.jpg");
        my $seem_str = `gocr test.jpg`;
        chomp($seem_str);
        say join($seem_str, split(/ /, $line->text));
    }
});

不过老是把 7 识别成 _。

真是越来越觉得 ojo 好用啊~

Newbie::Gift 所用知识总结

2013-04-19T00:00:00+00:00

通过 Newbie::Gift 项目的开发过程，学习和深入了解了不少 Perl 知识，虽然这个模块估计短期内不会再继续开发和更新了，不过还是值得记录一下这段过程中的心得。

gensym

封装 IPC::Open3 模块时，通过 smokeping 代码中学到了 Symbol 模块的 gensym 指令的使用。

通过 gensym 指令可以直接返回一个临时文件句柄来使用。

$cb->()

在 SPEC 设计中，所有导出指令都采用回调的方式。在 Perl 中实现起来其实特别简单。像下面这样就好了：

sub keyword {
    my ( $str, $cb ) = shift;
    my $res = do_some_func($str);
    $cb->($res);
}

selector_to_xpath

之前一直有使用 Mojo::UserAgent 配合 Mojo::DOM 完成网页抓取工作，这次自己实践，参考的是另一个 Web::Query 模块。其中最关键的两步，第一是通过 selector_to_xpath 指令把选择器的写法转换成 XPath 语言；第二是通过 XPath 操作网页的 HTML::Tree。

不过 Mojo 里对象化的很完整，返回的数组和字符串都是对象，所以可以一直反复调用方法连接起来处理，写的会很爽。用 Web::Query 没有这个效果。

File::stat

stat 是 perl 默认的函数，不过返回的数组在 mode 和 time 方面可读性都不好，所以封装一下，提供更加可读的 0644 这样的 mode 格式，直接用 sprintf 就可以做到：

    sprintf( "%04o", $ret->get(2) & 07777 );

DateTime

Perl 的 DateTime 模块太重，CPAN 上其实也有很多人提交简化版的 DT，其实就是利用 localtime，strftime 和 mktime 几个默认函数做出来的对象调用。

Exporter

import 和 export_to_level 都是 Exporter 模块的方法，所有继承自 Exporter 的模块可以用。比如下面示例，启用该模块，就相当于启用了 strict，warnings，utf8 和 Perl5.10 版的新特性，同时导出了 keywords 关键字。

    use base 'Exporter';
    our @EXPORT = qw/keywords/;
    sub keywords { ... }
    sub import {
        my $class = shift;
        strict->import;
        warnings->import;
        utf8->import;
        feature->import(':5.10');
        Try::Tiny->import;
        $class->export_to_level(1, $class, @EXPORT);
    }

zip

多数组可以通过 zip 命令逐一对位融合到一起。这个在 List::MoreUtils 中有，这次用 NG::Array 对象实现了一边，其原理是先记录每个数组的长度，然后以最长的那个数组为标杆，循环一遍即可。

autobox

CPAN 上 Rubyish、Perl6::、Perl5i:: 等模块都利用了 autobox 实现完全的对象化。autobox 是一个库，本身不提供对象方法，而是要自己自己实现针对某个类型的对象方法后，通过 autobox 关联到 Perl 的数据类型上去。

比如想要实现一个 "Hello World"->lc->words 的语法，显然就是要针对 Perl 中的 STRING 数据类型实现 lc 和 words 两个方法。那么先实现一个自己的 string 对象：

    package your::string;
    sub lc    { CORE::lc           $_[0] }
    sub words { CORE::split /\s+/, $_[0] }
    1;

然后开始关联：

    package your::autobox;
    use base qw(autobox);
    use your::string;
    sub import {
        shift->SUPER::import(
            STRING => 'your::string',
            @_
        );
    }
    1;

最后在前面提到过的 Exporter 的 import 函数里加上一行：

    your::autobox->import;

autobox 可以关联的数据类型还有很多，绝对是值得一看的模块。

eval(‘*’.$class.’::new’)

实现 def_class 关键词的过程中学习颇多，首先是符号表。实现中完成模块代码几乎全靠符号表来绑定一个个函数和变量。像这样：

    *t = eval('*'.$class.'::ISA');
    *t = [$parent];

    *t = eval('*'.$class.'::new');
    *t = sub {
        my ($class, @args) = @_;
        push @args, '' if $#args % 2 == 0;
        my $o = bless {@args}, ref $class || $class;
        if(defined $methods->{build}){
            $o->build(@args);
        }
        $o;
    }

不过这个实现有个问题，就是对象只能是基于哈希的引用，不能是数组的了。

对象的元数据

实现 def_class 的时候比 spec 多新增了一个默认属性叫meta，所有用 def_class 实现的类，会自动记录他们(包括他们的用 def_class 实现的父类)的属性和方法到meta属性里。

为此阅读了一下 Moo 和 Moos 的代码。 原来他们都是把属性和方法也实现为类。然后再有 *::Meta 类来记录这些属性和方法的类。

而 Newbie::Gift 计划中没打算把对象化搞得这么彻底，所以就只是存了一个 hash 到默认 meta 属性里。

:lvalue

对象除了方法还要有属性，def_class 里也有实现，同样是用符号表绑定的。

不过这里用到了 Perl5.10 的一个新东西，函数属性，这里绑定的不是普通变量而是函数，但是函数只会读写一个变量值，具体的说就是使用 sub :lvalue {} 定义。使用方法如下所示：

    my $val;
    sub canmod :lvalue {
        # return $val; this doesn't work, don't say "return"
        $val;
    }
    sub nomod {
        $val;
    }
    canmod() = 5;   # assigns to $val
    nomod()  = 5;   # ERROR

lvalue 的说明见 perldoc perlsub 文档。在这里还是个比较有趣的用法的，这个用法来自 Newbie::Gift 项目另一位参与者 fmpdceudy。

使用 Foreman 来监控统计 puppet 的 reports 信息

2013-04-16T00:00:00+00:00

foreman 是社区比较推荐的一款 puppet 辅助工具。可以用来实现 ENC 控制，class 编写，Facts 变量统计和 reports 分析查询等等。

鉴于我一直以来都是用 gem 安装 puppet，所以这里也就没法通过 yum/apt 来安装 foreman，只能源码操作了：

    git clone https://github.com/theforeman/foreman.git -b develop
    cd foreman
    bundle install --without postgresql mysql mysql2 
    cp config/settings.yaml.example config/settings.yaml
    cp config/database.yml.example config/database.yml
    RAILS_ENV=production bundle exec rake db:migrate
    rake puppet:import:hosts_and_facts RAILS_ENV=production
    ./script/rails server -p 3333 -e production -d

然后就可以通过3333端口访问并查看刚才导入的 Facts 变量了，默认的用户名密码是 admin/changeme。

新版本的 foreman，必须使用 smart-proxy 才能接收 reports。所以还要继续安装：

    git clone git://github.com/theforeman/smart-proxy.git
    cd smart-proxy
    sed -i 's/^#:puppet:.*/:puppet: true/' config/settings.yml
    ./bin/smart-proxy.rb

foreman 提供了一个 ruby 脚本，用来扩充 puppet 的 reports 功能。下载放到对应的 ${GEM_PATH}/gems/puppet-${version}/lib/puppet/reports/ 下，然后修改其中的 $foreman_url 变量即可。

我们也可以在 puppet 自带的 http.rb 基础上稍微修改得到相同效果，总的来说，就是通过 POST 方法，提交 report => self.to_yaml 到 $foreman_url/reports/create?format=yml 就可以了。

然后在 foreman 页面上配置 smart-proxy 地址。注意这里有个小坑：__如果你填写的是域名，那么解析出来的 ip 还要被反解验证一次。__我当初为了 puppet master 迁移方便，给 master 配置了一个单独的域名，包括 puppet cert 生成证书时也特意指定用这个域名，但是默认的 hostname 其实是另一个域名的。于是在此悲剧了很久。。。

错误的现象是：采用 puppet master 启动时，功能一切正常；采用 rackup + Nginx 代理的方式启动时，默认的 store 功能正常，而采用 foreman 接收 reports 的话，可以在 rackup 的访问日志中看到 POST 200 的记录，foreman 里却没有接到请求。

目前还不清楚为什么两种不同方式启动 puppet 的 master 会对 smart-proxy 造成什么区别影响，但是修改 foreman 里配置的 smart-proxy 地址为默认 hostname 而不是单独的域名后，就成功了。

另外一个使用上的小问题。foreman 页面上的 Reports 标签的 <a href=""> 属性默认是带搜索参数 eventful 的。也就是说优先展示的是有事件发生的日志，比如 failed，restart 等等；而不是直接以日期排序。

Graphite 安装

2013-04-03T00:00:00+00:00

Graphite 是近来比较流行的类 rrd tool 系统。不过官网的安装文档真的很烂，特记录一下自己的步骤。

由于是事后追忆，同样不保证好用……

apt-get install python-pip libapache2-mod-wsgi subversion git
git clone https://github.com/graphite-project/graphite-web.git
git clone https://github.com/graphite-project/carbon.git
git clone https://github.com/graphite-project/whisper.git
# 这两个是直接通过 pip 安装的不顶用，只能另外下非标准的包安装
git clone https://github.com/graphite-project/ceres.git
svn checkout http://django-tagging.googlecode.com/svn/trunk/ tagging-trunk

cd whisper
sudo python setup.py install

cd ../carbon
python setup.py install 

cd ../graphite-web
python check-dependencies.py
# 很奇怪 python 居然不自动解决依赖，check 出来一个列表还得自己来
apt-get install python-memcache python-txamqp python-rrdtool python-pyparsing python-django
python setup.py install

cd ../ceres
python setup.py install

cd ../tagging-trunk
python setup.py install

groupadd graphite
ln -s /opt/graphite/examples/example-graphite-vhost.conf /etc/apache2/conf.d/graphite.conf
# 默认的 run/wsgi 会在 /etc/apache2/ 目录下，权限有问题
sed -i 's!^\(WSGISocketPrefix\) \(run/wsgi\)$!\1 /var/\2$!' /etc/apache2/conf.d/graphite.conf
chown -R www-data:graphite /opt/graphite/storage/
service apache2 restart

cd /opt/graphite/webapp/graphite
cp local_settings.py.example local_settings.py
# 默认的 database 配置是针对 python2.4 的，需要开启针对 python2.5 以上版本的配置:
# DATABASES = {
#     'default': {
#         'NAME': '/opt/graphite/storage/graphite.db',
#         'ENGINE': 'django.db.backends.sqlite3',
#         'USER': '',
#         'PASSWORD': '',
#         'HOST': '',
#         'PORT': ''
#     }
# }
sed -i '167,176s/^#//' local_settings.py
python manage.py syncdb

cd /opt/graphite/conf
rename 's/.example//' *.example

cd /opt/graphite/
# 会监听 2003 端口
./bin/carbon-cache.py start

# 通过 socket 发送本机的 loadavg 到 2003 端口
python /opt/graphite/examples/example-client.py

效果如下：

还可以点击 plot 成下面这样，并且添加 event 以供查看：

用 Perl6 解析 puppet 的配置语法

2013-04-02T00:00:00+00:00

前段时间看到报道说，puppet 的作者本来是用 perl 完成的原型设计，后来改用的 ruby。所以我想，目前这个 puppet 的 DSL 设计，用 perl 来完成的话，应该如何做。

这里碰到一个问题，就是 puppet 中 resource_type 的 title 后面有个冒号，这事儿比较麻烦，不过这时候我突然想到了 Perl6 ，稍微翻了一下文档，发现这事用 Perl6 来实现很容易：

use v6;

sub infix:<:>($a, %b){
    return $a, %b;
};

sub service(&service) {
    my @res = &service.();
    say @res.shift => @res.hash;
}

class nginx::install {
	my $nginxparams = "nginx";
	service { "$nginxparams":
        conf => "#",
        source => "http" 
    }
}

运行结果如下：

perl6 /data/perl6/script/puppet-style.pl
"nginx" => {"conf" => "#", "source" => "http"}

当然实际上 puppet 要复杂很多，这里其实更多是为了说明 Perl6 如何自定义操作符~

用 Mojo 命令行抓取数据完成自动更新 rpm 构建

2013-04-01T00:00:00+00:00

我一直很喜欢 Dancer 里的 keyword 方式，所以很少使用 Mojolicious 框架来写网站，不过 Mojo::UserAgent 和 Mojo::DOM 在一起作为爬虫工具使用，真是太方便了。这两天需要自己打包 tengine ，考虑自动化因素，需要从 tengine 和其他第三方模块的 github 托管网页上定期查询其更新，都是一行代码就搞定了。整个 Build.PL 如下：

#!/usr/bin/env perl
use Modern::Perl;
use IPC::Run qw(run);
use File::Slurp;
use POSIX qw(strftime);
use Template;
use ojo;

my @ModuleList = qw(
    renren/ngx_http_accounting_module
    agentzh/echo-nginx-module
    agentzh/chunkin-nginx-module
    simpl/ngx_devel_kit
    calio/form-input-nginx-module
    chaoslawful/lua-nginx-module
    renren/ngx_http_consistent_hash
);

my $TengineMD5 = (split(/ /, g("http://tengine.taobao.org/download_cn.html")->dom->at(".one_col li span")->text))[-1];

write_file("md5.txt", "firstimetorun") unless -f "md5.txt";
my $TengineOldMD5 = read_file( "md5.txt" );

say $TengineOldMD5;
say $TengineMD5;

if ( $TengineMD5 ne $TengineOldMD5 ) {
    gettarball(\@ModuleList);
    write_file("md5.txt", $TengineMD5);
}

sub gettarball {
    my $ModuleList = shift;

    my $TengineUrl = g("http://tengine.taobao.org/download_cn.html")->dom->at(".one_col li a")->{href};
    my $TengineVersion = $1 if $TengineUrl =~ m!download/tengine-(.*).tar.gz!;
    my $TengineRelease = strftime("%Y%m%d%H%M",localtime);

    run('wget', "http://tengine.taobao.org/${TengineUrl}", '-O', "SOURCES/tengine-${TengineVersion}.tar.gz");

    my @ModuleFile;
    my $i = 10;
    for my $Module ( @{ $ModuleList } ) {;
        my $GitUrl = "https://github.com/${Module}";
        say $GitUrl;
        my $GitCommit = substr(g("${GitUrl}")->dom->at(".sha")->text, 0, 7);
        ( my $StoreName = $Module ) =~ s!/!-!;
        my $StoreFile = "${StoreName}-${GitCommit}.tar.gz";
        push @ModuleFile, [ "Source${i}" => "${StoreName}-${GitCommit}" ];

        run('wget', "${GitUrl}/tarball/master", '-O', "SOURCES/$StoreFile");

        $i++;
    }

    unlink('SPECS/tengine.spec');
    my $template = Template->new;
    $template->process("tengine.spec.tt", {
        TengineVersion => $TengineVersion,
        TengineRelease => $TengineRelease,
        TengineAddons  => \@ModuleFile,
    }, "SPECS/tengine.spec");

    buildrpm($TengineVersion, $TengineRelease);
}

sub buildrpm {
    my ( $TengineVersion, $TengineRelease ) = @_;
    my ( $out, $err );
    run ['rpmbuild', '-bb', 'SPECS/tengine.spec'], undef, \$out, $err;
    mail2author($err);
}

sub mail2author {
    my $output = shift;
    my $body = $output ? "Build Error: $output" : "Build OK";
    p("http://email.notify.d.xiaonei.com/eml/tengine-build/chenlin.rao" => { DNT => 1 } => $body);
}

直接 g 就是 GET 方法， p 就是 POST 方法。然后 ->dom->at() 后采用类似 jQuery 的写法就可以直接定位，然后还可以用 ->text 来获取内容，或者 ->{attr} 来获取属性值。

顺带，今天刚知道原来 Template 模块也有 filter 可用。tengine.spec.tt 中就用了一个大写过滤：

Summary:    a HTTP and reverse proxy server
Name:       tengine
Version:    [% TengineVersion %]
Release:    [% TengineRelease %]

Source0:    %{name}-%{version}.tar.gz
Source1:    init.nginx
Source2:    logrotate.nginx
Source3:    nginx-renren-conf.tar.gz
[% FOREACH Module IN TengineAddons -%]
[% Module.0 %]:    [% Module.1 %].tar.gz
[% END %]

Group:      System Environment/Daemons
License:    BSD

BuildRoot:  %{_tmppath}/%{name}-%{version}-%{release}

Requires:      pcre,zlib,lua
BuildRequires: pcre-devel,zlib-devel,lua-devel
Requires(post):    chkconfig
Conflicts:     nginx

%description
Nginx with modules: 1) ngx_http_consistent_hash; 2) ngx_http_accounting_module; 3) agentzh-chunkin-nginx-module. 

%prep
#%setup -q 
%setup -n tengine-%{version}
tar zxvf %{SOURCE3}
[% FOREACH Module IN TengineAddons -%]
tar zxvf %{[% Module.0 FILTER upper %]}
[% END %]

...;

Haml 简介

2013-03-28T00:00:00+00:00

Haml 是 Ruby 社区的一种 HTML 标记语言，它利用强制缩进和类似 jQuery 属性标签的风格，简化书写 HTML 的工作。文档见：http://haml.info/docs.html。

下面是一段官网上的快速入门，从标准的 erb 模板转变成 haml 模板：

<div id='content'>
  <div class='left column'>
    <h2>Welcome to our site!</h2>
    <p><%= print_infomation %></p>
  </div>
  <div class='right' id='item<%= item.id %>'>
    <%= render :partial => "item" %>
  </div>
</div>

用 haml 只用这么写：

#content
  .left.column
    %h2 Welcome to our site!
    %p= print_information
  .right{:id => "item#{item.id}"}
    = render :partial => "sidebar"

看起来相当 cool，回头在 CPAN 上一翻，原来 perl 社区也有 port 过来的 Text::Haml 了。根据 perl 的特点有所改变，但是省键盘的特点依然在。

下面是一个例子：

use Text::Haml;
my $haml = Text::Haml->new();
my $hash = {
    title => 'my title',
    content => { line1 => "test", line2 => "test2" }
};
print $haml->render_file('test.haml', %$hash);

test.haml 如下：

%html{ :xmlns => "http://www.w3.org/1999/xhtml", :lang => "zh"}
  %head
    %title= $title
  %body
    #content
      .container
        %strong= $title
        - for my $line ( keys %$content ) {
            .row-fluid= $content->{$line}
        - }

生成的 HTML 内容如下：

<html xmlns='http://www.w3.org/1999/xhtml' lang='zh'>
  <head>
    <title>my title</title>
  </head>
  <body>
    <div id='content'>
      <div class='container'>
        <strong>my title</strong>
          <div class='row-fluid'>test</div>
          <div class='row-fluid'>test2</div>
        
      </div>
    </div>
  </body>
</html>

Text::Haml 还提供了一个初始化参数 vars_as_subs，可以把变量变成同名函数，这样写起来就更像 ruby 了。不过目前只能是纯变量，复杂语句还是不行，所以好看不中用……

Text::Haml 向 Text::Xslate 学习，也提供了 cache_dir, filter 等等功能，所以性能和功能方面应该也不差。

Template::Tookit 也有插件 Template::Plugin::Haml 可以参看。

wrapper.tt

!!! 5
%html
[% content %]

hello.tt

[%- message='Hello World' %]
[%- USE Haml -%]
[%- WRAPPER wrapper.tt | haml -%]
[%- FILTER haml -%]
 %head
  %meta{:charset => "utf-8"}
  %title hello
 %body
  %p [% message %]
  %ul
  [%- total=0; WHILE total < 5 %]
   %li [% total=total+1 %][% total %]
  [%- END -%]
[%- END -%]

perl 三大 web 框架 Catalyst/Mojo/Dancer也都有对应的模板插件。

用 Mod_Gearman 实现 Nagios 分布式

2013-03-27T00:00:00+00:00

在 2011 年年底，我曾经连续写过四篇介绍 OMD 的文章。

不过之前都停留在代码观摩和安装文档的阶段。这几天刚好有点需求，真正测试了一下如何利用 mod_gearman 实现分布式的 Nagios 监测集群。

OMD 的安装一如既往的简单，尤其是作为中控端，不需要讲究太多通用性，可以选择使用 ubuntu 系统，直接通过 deb 安装：

wget http://omdistro.org/attachments/download/197/omd-0.56_0.wheezy_i386.deb
dpkg -i omd-0.56_0.wheezy_i386.deb
omd create cdn-monitor
su - cdn-monitor
omd start

这就已经启动了。

不过要使用 mod_gearman 的话，还需要通过 omd config 界面开启。

默认开启之后，是运行在本机多 worker 的 Load Balance 状态下。我们现在要做的是把worker拆分到其他机房去变成 Distributed 状态。

图上已经列出 server 和 worker 的主要配置不同。我们只需要照着这样改就可以了。

不过在作为纯 worker 端的机房服务器上，我们没有必要安装完整的 OMD 了，这厮安装包都有100MB大……

http://mod-gearman.org/download/v1.4.2/ 上提供了 mod_gearman 的独立安装包，我们只需要根据服务器发行版选择下载就可以，这里以 CentOS6 为例，相信现在这个也应该是服务器的主流。

wget http://mod-gearman.org/download/v1.4.2/rhel6/x86_64/gearmand-0.25-1.rhel6.x86_64.rpm
wget http://mod-gearman.org/download/v1.4.2/rhel6/x86_64/mod_gearman-1.4.2-1.e.rhel6.x86_64.rpm
rpm -ivh gearmand-0.25-1.rhel6.x86_64.rpm mod_gearman-1.4.2-1.e.rhel6.x86_64.rpm

除了图中列出的几行关键配置以外，还有两个地方是需要修改的：

gearmand 的监听

OMD 安装的 gearmand 默认是监听在 127.0.0.1 上的，需要修改/omd/sites/cdn-monitor/etc/mod-gearman/port.conf 文件变成可以被其他机器访问的 IP 地址并重启。

同样分布式的 /etc/mod_gearman/mod_gearman_worker.conf 里，也需要修改 server 配置并重启服务。

encryption 配置

OMD 默认启用 encryption 并且会在 /omd/sites/cdn/etc/mod-gearman/ 下生成 secret.key 文件。

但是 mod_gearman 默认开启 encryption ，却不可能知道中控端的密码，所以默认是在配置文件中指定的 key=should_be_changed。这里我们需要修改一致：

scp nagios:/omd/sites/cdn/etc/mod-gearman/secret.key /etc/mod_gearman/
sed 's!#keyfile.*!keyfile=/etc/mod_gearman/secret.key!' /etc/mod_gearman/mod_gearman_worker.conf
service mod_gearman_worker restart

事情还没完。这时候你会在 webUI 上看到分配给这个 worker 的检测全部报错，退出码 127。具体内容是：”/omd/sites/cdn-monitor/lib/nagios/plugins/check_http do not exists”之类的话。

因为，在 OMD 上，commands.cfg 上，配置的 $USER1$/check_http 替换为具体路径后，直接 add_task 到 gearmand 里，所以 worker 上收到 command 并执行也就是这样的了。目前还没有发现可以在 worker 端替换 commands 字符串的简单办法。所以，我们还得自己创建一个软链接：

mkdir -p /omd/sites/cdn-monitor/lib/nagios/
yum install -y nagios-plugins-all --enablerepo=epel
ln -s /usr/lib64/nagios/plugins /omd/sites/cdn-monitor/lib/nagios/plugins

OK，现在这个机房(即nagios配置中的hostgroup)的监测任务，就都分发给本机房的 worker 来进行了。比如 check_http 任务，可以看到原先跨机房访问带来的几十毫秒的延时，都变成了一两毫秒。

logrotate 配置文件强制为 0644 属性

2013-03-18T00:00:00+00:00

在一次包更新后，发现 Nginx 服务器的每晚日志切割不再进行了。找遍了各种地方，最后在一次偶然的ls -l中发现：

# ll /etc/logrotate.d/
total 64
-rw-r--r-- 1 root root  326 2012-08-04 06:08 apache2
-rw-r--r-- 1 root root   84 2009-02-08 05:18 apt
-rw-r--r-- 1 root root   79 2008-12-05 17:15 aptitude
-rw-r--r-- 1 root root  330 2008-03-08 05:36 atop
-rw-r--r-- 1 root root  232 2011-11-10 14:33 dpkg
-rw-r--r-- 1 root root  267 2013-01-31 13:20 foreman-proxy
-rw-r--r-- 1 root root  151 2007-09-29 19:23 iptraf
-rw-r--r-- 1 root root  880 2012-10-29 17:10 mysql-server
-rwxr-xr-x 1 root root  356 2012-08-05 00:17 nginx
-rw-r--r-- 1 root root 1061 2008-03-08 05:36 psaccs_atop
-rw-r--r-- 1 root root  512 2008-03-08 05:36 psaccu_atop
-rw-r--r-- 1 root root  260 2012-06-23 00:52 rabbitmq-server
-rw-r--r-- 1 root root  126 2012-06-09 00:22 redis-server
-rw-r--r-- 1 root root  515 2012-09-27 02:40 rsyslog
-rw-r--r-- 1 root root  285 2008-11-18 21:20 stunnel4

这里的nginx多了可执行权限。于是我尝试性的执行了chmod -x nginx；结果居然真的恢复了。

这事儿说起来蛮奇怪了。于是去 https://fedorahosted.org/logrotate 找来 logrotate 的源码看，结果在logrotate-3.8.3/config.c 里发现这么一段：

               if ((sb.st_mode & 07533) != 0400) {
                       message(MESS_DEBUG,
                               "Ignoring %s because of bad file mode.\n",
                               configFile);
                       close(fd);
                       return 0;
               }

只有文件权限是 0644 的时候，配置文件才会被读取！0755 的与结果是 0511，不等于 0400。相关 st_mode 的内容可以通过 man 2 stat 查看。

可以写一小段 perl 代码来验证：

#!/usr/bin/perl
my $mode = (stat($ARGV[0]))[2];
printf "Permissions are %04o\n", $mode & 07533;

在 ChangeLog 里，看到如下一段话：

2.1 -> 2.2:
    - ignore nonnormal files when reading config files from a directory
    - (these were suggested and originally implemented by
      Henning Schmiedehausen)

不过比较早了，就懒得从历史堆里再翻为什么当初会有这么个提议了…………

Puppet 自定义 Provider

2013-03-15T00:00:00+00:00

Puppet 默认提供了相当多的资源类型，不过我们还可以更进一步的扩展这个庞大的阵营。比如在 package 类型的资源里，我们看到 puppet 除了系统级别的yum,apt之类意外，还提供了 gem,pip 来管理 ruby 和 python 的 package。那么很自然的，我们就可以进一步扩充 package 来管理 perl 的 package 。只需要新加一个 provider 就可以了。

关于 provider 开发的原理说明，见 http://docs.puppetlabs.com/guides/provider_development.html。

下面是 /etc/puppet/modules/production/myclass/lib/puppet/provider/package/cpan.rb 的内容，他会被 puppet 以 pluginsync 的方式下发。

# 加载父类，这里是扩展 package 功能
require 'puppet/provider/package'

Puppet::Type.type(:package).provide :cpan, :parent => Puppet::Provider::Package do

  desc "CPAN modules support.  You can pass any `source` which `cpanm` support, 
    like URL, git repos and local tar.gz. If source is not present at all,
    the module will be installed from the default CPAN source.
    You must install App::cpanminus, App::pmodinfo, App::pmuninstall before."

  has_feature :versionable

  # 下面这个是 Puppet::Provider 提供的私有方法，用来指定类内部适用的系统命令
  # puppet agent 会通过对这个的运行测试来确认该 provider 是否适用于本机
  # 所以在使用这个 provider 之前，要先通过其他方式在 node 上安装好这三个命令
  commands :cpanmcmd => "cpanm"
  commands :pmodinfocmd => "pmodinfo"
  commands :pmuninstallcmd => "pm-uninstall"

  def self.pmodlist(options)
    pmodlist_command = [command(:pmodinfocmd),]

    if options[:local]
      pmodlist_command << "-l"
    else
      pmodlist_command << "-c"
    end
    if name = options[:justme]
      pmodlist_command << name
      # execute 是 Puppet::Util::Execution 提供的方法，接受数组传入，输出标准输出结果字符串
      list = [execute(pmodlist_command)].map {|set| pmodsplit(set) }.reject {|x| x.nil? }
    else
      list = execute(pmodlist_command).lines.map {|set| pmodsplit(set) }.reject {|x| x.nil? }
    end

    if name = options[:justme]
      return list.shift
    else
      return list
    end
  end

  def self.pmodsplit(desc)

    if desc =~ /^(\S+) version is (.+)\.(\n  Last cpan version: (.+))?/
      name = $1
      # 整个rb是从gem.rb复制过来的，gem list -r所有版本列成一行，split成一个数组
      # 这里为了改动少点，就照样做成数组
      versions = [$2]
      if latest_version = $3
        versions.unshift($4)
      end
      {
        :name     => name,
        :ensure   => versions,
        :provider => :cpan
      }
    else
      Puppet.warning "Could not match #{desc}" unless desc.chomp.empty?
      nil
    end
  end

  # 这个 instances 方法是 provider 必须提供，在package里就是本地模块的列表
  def self.instances(justme = false)
    pmodlist(:local => true).collect do |hash|
      new(hash)
    end
  end

  # 往下的方法都是 package 要求提供的
  def install(useversion = true)
    command = [command(:cpanmcmd)]
    # cpanm 指定安装版本的命令格式是这样： cpanm Dancer@1.000
    resource[:name] += '@' + resource[:ensure] if (! resource[:ensure].is_a? Symbol) and useversion
    command << resource[:name]

    output = execute(command)
    self.fail "Could not install: #{output.chomp}" if output.include?("failed")
  end

  def latest
    pmodinfo_options = {:justme => resource[:name]}
    hash = self.class.pmodlist(pmodlist_options)
    # 这里就是前面要用数组的原因了
    hash[:ensure][0]
  end

  # 请求本地是否存在具体某个包
  def query
    self.class.pmodlist(:justme => resource[:name], :local => true)
  end

  def uninstall
    pmuninstallcmd resource[:name]
  end

  def update
    self.install(false)
  end
end

在一台没有安装 cpanm 等命令的主机上运行 puppet agent --debug，可以看到这么一行输出：

debug: Puppet::Type::Package::ProviderCpan: file cpanm does not exist

极光推送demo

2013-03-14T00:00:00+00:00

之前已经陆续写过很多种告警的方式。今天再稍微试验一种更新潮一些的 —— 手机推送通知。原先我的想法是移植 HTML5 的 websocket + notification 页面到手机上。但是发现手机上的浏览器都还没有 notification 功能。即便是用 PhoneGap 包装 HTML5 应用，PhoneGap 的 notification API 也不是我想象中的状态栏通知，而是类似 js 的 alert 对话框。

不过这个时候我发现了极光推送。嗯，本来蛮有挑战的事情顿时变成了十分钟内解决的小菜：

整个过程如下：

注册帐号

官网地址: http://jpush.cn

新建应用

都是纯页面操作，填写应用名称而已。

下载 example 包

在应用详情里有下载链接。

用 adt eclipse 打开 example

adt eclipse 直接从 android 官网下载 adt-bundle-linux-x86-20130219.tar.gz 解压即可运行。更多配置见 android 官网说明。

然后在 File 菜单栏选择 new -> android application project 就可以新建自己的项目。然后创建自己的 workspace，把下好的 JPush example 包解压倒入workspace，然后就可以 run 了。

不过这里 run 会启动一个 android 虚拟机，很可能是连不上网的，原因似乎是 android vm 默认是 10.0.0.0 网段。

其实这时候我们会在 workspace/push-example/bin/ 下发现一个 push-example.apk 文件。复制出来，通过豌豆荚或者别的什么工具直接装进自己手机就可以运行了。

测试页面发送通知

在极光的 portal 页面 http://www.jpush.cn/apps/${your app key}/notification 上可以直接提交通知内容。然后你就可以在手机状态栏通知上看到啦！

测试命令行发送通知

文档见http://docs.jpush.cn/pages/viewpage.action?pageId=2621796。

比如通过简易通知推送接口发送如下：

    #!/bin/sh
    #下面两个是你新建应用后就分配的
    APP_KEY=$1
    API_MasterSecret=$2
    #自赠序列号，这个最好是通过mysql的auto_increment管理
    sendno=2
    #这里有1,2,3,4,分别对应对指定IMEI/tag/alias/all的用户推送
    receiver_type=4
    verification_code=`echo -ne "$sendno$receiver_type$API_MasterSecret" | md5sum | awk '{print $1}'`
    #platform包括android,ios等等，可以用逗号分开写多个
    curl http://api.jpush.cn:8800/sendmsg/v2/notification -d "sendno=${sendno}&app_key=${APP_KEY}&receiver_type=${receiver_type}&platform=android&txt=123&verification_code=${verification_code}"

然后收到如下响应：

    {"sendno" :"2", "errcode":0,  "errmsg":"Succeed"}

手机也同时响起~成功。

Nginx 万兆网络环境测试

2013-02-25T00:00:00+00:00

测试目标
测试设备
测试环境说明
特别注意事项
测试项目
- 测试一
- 测试二
- 测试三
- 测试四
- 测试五
- 测试六
- 测试七
术语及缩写说明
附注

测试目标

本次测试的目标是将nginx作为7层负载均衡软件，应用于万兆环境下，获得

极限性能
在服务质量保证约束条件下的极限性能
提升极限性能的方法
在万兆环境下部署的一般方法和特殊注意事项

同时，由于nginx还作为静态页面的提供者，附带还进行获得nginx作为静态文件服务器的

极限性能
在服务质量保证约束条件下的极限性能
提升极限性能的方法
在万兆环境下部署的一般方法和特殊注意事项

操作系统是一个很大的影响因素，在测试开始，会对操作系统版本进行选择，以确定哪个是更合适的平台。

测试设备

测试设备如下

万兆网卡X520-DA2
万兆交换机DCS-7124SX-F
万兆DA线
SNB服务器
WSM服务器

测试环境说明

所有测试服务器连接在同一个万兆交换机下，处于同一个网段。

服务器划分为

服务器（以S简称）：提供静态或动态页面，次要测试对象
7层负载均衡（以LB简称）：提供负载均衡功能，主要测试对象
客户端（以C简称）：提供测试压力

特别注意事项

Keepalive

由于LB和S数量少，高RPS情况下，LB如果采用短连接方式连接S，LB的outgoing port会很快用尽。

解决的方法有两种：

S采用多IP配置，模拟众多S的情况，减小每个S所要消耗的LB outgoing port；
LB与S之间采用keepalive连接

短连接的方式下，CPU会有相当一部分消耗在三次握手上，这主要是操作系统开销（小包处理），以及nginx初始化会话上下文的开销。

RPS、PPS与流量吞吐率

极限测试下，PPS考验服务器的CPU能力；而HTTP协议请求头的处理也是CPU密集型任务。

相同流量吞吐率下

较小的响应意味着较高的RPS
当响应小于一个最大TCP报文长度时，响应越小，也意味着PPS越高

极限测试中，需要测试以下三种情形

全部是大报文。可以通过构造响应为一个最大TCP报文长度实现
全部是小报文。可以通过构造响应为最小HTTP响应实现
混合报文。可以通过构造响应为一个或两个TCP报文，一个是最大TCP报文长度，另外一个的长度可以控制，来满足特定的混合比例

流量吞吐率是一个表观指标，但我们更关心的是在带宽足够的条件下，RPS指标（的范围）。

压缩

在我们的实际使用中，LB是不负责压缩的。但测试中需要测试压缩对RPS的影响。需要考察压缩方面的优化方法。

规则集

负载均衡规则集大小对性能会有影响。由于规则集处理开销正比于RPS，测试中应对较大的规则集进行测试以找出影响大小和可能的优化措施。

实际网络情况

一般而言，极限性能是最理想情况。在本次测试中，我们还需要测试接近实际网络情况下的极限性能，这可以通过引入丢包率、延时来模拟。

测试项目

测试一

测试目标：了解nginx的带宽满载的最小文件大小（web服务器模式），确定之后测试的文件大小上限

测试工具：ab

测试方法：

S上Nginx做简单配置，使其成为web server；
在C1上使用 <测试工具> 对S测试10000字节文件，每次减小1000字节，至带宽和RPS均为最高为止。
根据第二步测试情况调整文件大小，以逼近S的带宽恰好满载且CPU占用率最高时的情况，并记录最终的阈值大小和RPS/PPS指标。

测试结果：

文件大小(Bytes)	CPU idle(%)	带宽(MBps)	PPS
10K	65	1140	606K
3K	12	1135	1060K
2590	0	1088	1138K
1K	0	585	783K

在采用kernel的pktgen发包测试中，苏能达到的最大PPS为1200K。2590Bytes文件测试中的PPS已经很接近纯发包测试的极限，所以最终，最充分利用CPU和带宽的文件大小是2590Bytes。

测试二

测试目标：了解 nginx 的大致性能（web服务器模式）

测试工具：ab

测试方法：

S上Nginx做简单配置，使其成为web server；
在C1上使用 <测试工具> 对S分别测试空文件、616字节文件(半个包长度)、1232字节文件（即含header字节数为1448，整TCP包长度）、1 233字节文件（超过一个TCP/IP包大小1字节）和2590字节文件；3. 测试中记录S的网络吞吐量和CPU状况；C1的RPS，PPS指标波动情况。

测试预期：

吞吐量应超过1Gbps；
吞吐量接近5Gbps；
适当调整网卡等其他配置，应使RPS超过50万（原有百兆环境下的极限值）。

初步测试：

1、在CentOS6.2系统上，十次测试平均结果发现空文件的RPS仅为458005，响应时间0.88715ms，S带宽121M，未能达到预期。

2、检查发现CentOS6.2的ixgbe驱动版本为3.4.8，与最新版本差距较大，升级ixgbe驱动至最新版3.11.33。

更新后原先的8核client已经无法压满server，更换Client设备，ab并发由50×8提高到50×24，测试不同的InterruptThrottle Rate条件下数据如下：

1000：

1500：

2500：

3500：

4500：

根据以上数据可知，在ITR1500的情况下，空文件的RPS最高，对比数据如下：

ITR	RPS	带宽(MBps)	user%	sys%	irq%
1000	688425	186.886	30.112	52.936	16.951
1500	691614	187.408	30.125	52.208	17.667
2500	682326	183.277	29.191	53.253	17.556
3500	650367	175.477	26.803	56.732	16.382
4500	630178	169.474	26.417	56.708	16.833

（注：表格中RPS和带宽数据均为峰值，CPU数据为平稳运行期的中间时刻采样值。下同）

所以在新驱动ITR1500的条件下，重新测试616,1232,1233,2590字节的数据：

616：

1232：

1233：

2590

测试过程出现剧烈的吞吐量波动，在原有的itr1500的条件下服务极不稳定。

总结ITR1500条件下各文件大小的测试数据对比如下：

文件大小(Btyes)	RPS	带宽(MBps)	CPU usr%	CPU sys%	CPU irq%
0	691614	187.408	30.125	52.208	17.667
616	586296	459.435	29.583	54.250	16.083
1232	579103	838.146	29.471	50.563	16.048
1233	513099	772.826	28.417	48.875	22.708
2590	418226	1173.760	23.343	41.934	18.216

另经测试，ITR上调到15000后，2590字节文件测试的S吞吐量恢复成稳定满带宽运行。而且支持并发到80×24。对比ITR5000/10000/15000 条件下数据：

ITR5000图

ITR10000图：

ITR15000图：

2.59KB文件在不同ITR下的测试数据对比如下：

ITR	RPS	带宽(MBps)	usr%	sys%	irq%	错误进程
1500	418226	1173.760	23.343	41.934	18.216	6
5000	418216	1172.530	24.250	55.792	19.667	3
10000	417989	1171.960	24.625	52.958	22.292	2
15000	404330	1132.490	23.802	52.855	23.343	0

测试三

测试目标：了解nginx配置对性能的影响(access_log)

测试工具：ab

测试方法：

S上做简单配置，关闭 access_log 后进行测试；
再测试关闭 access_log buffer 的情况（对比测试二的 access_log buffer=1024k 的情况）
在C1上使用 <测试工具> 对S分别测试空文件(ITR为1500)
测试中记录CPU占用率，网络吞吐量，RPS和平均响应时间指标

测试结果：

1、设置access_log /data/access_log main;的情况：

与关闭日志相比，吞吐量下降，并且无法支持相同数并发（平均有20%的ab进程退出），只能在30×24的并发数情况下完成稳定测试。

2、将日志写入SSD磁盘，验证是否有性能提升。

由上两图对比，可见虽然将日志写入SSD对RPS稍有提升，但离关闭日志的70万差距甚远，更换SSD没有实质的意义。

3、普通磁盘上设置buffer=1024k参数

4、设置buffer=64k参数

5、设置buffer=4k参数

可见在使用buffer参数后，RPS明显提升到和关闭日志时一个数量级的水准。而buffer的大小，从4k到1024k，也可以提高10%左右。

测试三各项数据对比如下：

配置	RPS	带宽(MBps)	Usr%	Sys%	irq%	稳定并发
关闭日志	691614	187.408	30.125	52.208	17.667	50*24
打开日志	180148	49.074	8.966	21.337	4.483	30*24
使用SSD	144347	39.179	10.875	25.708	5.750	30*24
buffer4K	588767	159.297	27.613	55.352	16.951	50*24
buffer64K	593022	160.172	26.845	57.065	16.048	50*24
buffer1M	659290	177.959	32.042	51.875	16.000	50*24

测试四

测试目标：了解nginx配置对性能的影响(tcp_nopush off)

测试工具：ab

测试方法：

S上做简单配置，同时关闭tcp_nopush off;
在C1上使用 <测试工具> 对S分别测试1232字节文件和1233字节文件
测试中记录网络吞吐量，RPS和PPS指标

测试预期：

根据对TCP_NOPUSH的理解，在关闭此参数的情况下，1232字节文件的rps应该和开启状态下有较大差别。

测试结果：

1232字节文件数据：

当ITR为1500时：

峰值带宽比测试二中的数据稍差，但是运行不稳定，CPU的波动与rps图相对应，尝试加大并发则有client进程出现connection timeout错误。

加大itr到15000后波动变的比较稳定。但RPS下降到40万，与测试二相差接近30%。数据如下：

该项测试相关数据对比如下：

配置	RPS	带宽(MBps)	Usr%	Sys%	Irq%	退出进程
tcp_nopush on+ITR1500	579103	838.146	29.471	50.563	16.048	0
tcp_nopush off+ITR1500	543050	817.746	27.095	51.438	21.467	1
tcp_nopush off+ITR15000	393416	593.411	22.458	55.583	21.958	0

测试五

测试目标：了解nginx的大致性能（代理模式）

测试工具：ab

测试方法：

S上nginx做简单配置，使其成为webserver，作为后端；
LB上nginx做简单配置，使其成为L7 HTTP 代理，所有请求代理至S。LB后端keepalive在测试中测试两种情况，即打开和关闭
在C1/C2上使用 <测试工具> 对LB分别测试空文件、1232字节文件和2590字节文件
测试中记录S和LB的CPU占用率，网络吞吐量，RPS三个指标

测试预期：

Keepalive关闭时，可能需要对LB的内核参数进行调整才能够完成测试；
Keepalive关闭时，仅调整内核参数可能不够，S需绑定多个IP地址，LB需使用S的多个IP地址；

测试结果：

（注：因为C1/C2的主板架构/CPU配置不一。8核的C2会先于24核的C1结束测试，后半段数据不如前半段稳定，不过单C1运行也基本可以逼近LB极限，不影响数据采集和判断。）

1、空文件：

2、1232字节文件

3、2590字节文件

4、10K字节文件

根据测试二的经验，非空文件ITR为15000时表现更稳定，修改后数据如下：

1、1232字节：

2、2590字节：

3、10k字节文件

4、100k字节文件

关闭proxy_keepalive，使用2台Client测试，并发2400。空文件测试带宽只能压到18MBps，LB和S的CPU idle都在85%以上。平均响应时间长达40ms。限于环境，压力测试无法继续进行。

本测试proxy_keepalive情况时各项数据对比如下：

ITR+文件大小	RPS	带宽(MBps)	Usr%	Sys%	Irq%
ITR1500+0Byte	392406	165.185	39.533	26.647	30.234
ITR1500+1232Bytes	369582	588.209	41.142	28.595	28.929
ITR1500+2590Bytes	296866	898.885	34.250	29.417	36.167
ITR1500+10KBytes	118163	1167.280	17.870	18.319	15.218
ITR15000+1232Bytes	370590	588.422	41.167	28.375	29.208
ITR15000+2590Bytes	297289	897.755	34.890	28.429	35.682
ITR15000+10KBytes	118033	1168.160	21.137	21.426	25.752
ITR15000+100KBytes	11388	1168.890	4.798	12.542	10.522

测试六

测试目标：nginx LB在多域名情况下的性能

测试工具：ab

测试方法：

1、S上nginx做简单配置，使其成为webserver，作为后端；

2、LB上nginx使用我司实际代理配置(800+域名)，使其成为L7 HTTP 代理，所有请求代理至S。LB后端keepalive在测试中测试两种情况，即打开和关闭

3、在C1上使用 <测试工具> 对LB分别测试单域名和随机多域名空文件请求

4、测试中记录S和LB的CPU占用率，网络吞吐量，RPS三个指标

测试预期：

多域名代理情况下性能应和直接通过IP访问在一个数量级内。

测试结果：

1、单域名：

2、随机域名。因为测试在2台服务器上一共开启了32个ab进程，即随机选出32个域名做的测试，结果如下：

3、关闭keepalive的情况：

可见代理模式使用多个domain和upstream配置，对性能没有太大影响。有影响的依然是keepalive是否开启。具体数据对比如下：

测试条件	RPS	带宽(MBps)	Usr%	Sys%	Irq%
IP访问	392406	165.185	39.533	26.647	30.234
单域名	377292	179.832	41.091	26.811	29.559
多域名	384513	185.632	43.297	27.186	28.185
No keepalive	34879	28.310	5.973	7.341	9.083

测试七

测试目标：其他常见server性能对比

测试工具：ab

测试方法：

Resin4pro加临时lisence，默认配置(关闭日志)，测试空文件。

测试结果：

与nginx的webserver模式对比如下：

Webserver	RPS	带宽(MBps)	Usr%	Sys%	Irq%
resin4	44873	32.353	3.884	4.545	10.455
Nginx1.2	691614	187.408	30.125	52.208	17.667

术语及缩写说明

RPS: Requests per Second，每秒请求数

PPS: Packets per second，每秒报文数

附注

生成图片的 GNUplot 脚本见http://chenlinux.com/2012/11/22/gnuplot-to-draw-multi-graph。

STF 2.0 安装测试

2013-02-22T00:00:00+00:00

STF 更新到 2.0 版本，支持使用 redis 队列做任务分发，比原先的 Q4M 容易上手多了；新增了 cluster 概念，虽然目前看没什么用，不过估计以后肯定要在这方面做文章的。

部署步骤如下：

    # 因为 stf 要求在 Perl5.12 以上运行，CentOS6 还是 5.10 的老版本，所以直接用 Debian 测试了
    apt-get install -y memcached redis-server libmysqlclient-dev libdbd-mysql-perl
    # 设置 mysql-server 包安装时需要的问答
    echo mysql-server-5.5 mysql-server/root_password select 123456 | debconf-set-selections
    echo mysql-server-5.5 mysql-server/root_password_again select 123456 | debconf-set-selections
    apt-get install mysql-server-5.5

    # 系统依赖解决，开始 perl 部分
    git clone git://github.com/stf-storage/stf.git
    cd stf
    cpanm Redis Data::Dumper::Concise
    cpanm --installdeps .

    # 创建 mysql 库和用户
    mysql -uroot -p -e 'create database stf'
    mysql -uroot -p -e 'grant all privileges on stf.* to stf@"%" identified by "654321"'
    # 默认监听本机，分布式系统肯定是要放开这个的
    sed -i 's/127.0.0.1/0.0.0.0/' /etc/mysql/my.cnf
    service mysql restart
    # 导入 sql 建表
    mysql -ustf -p stf < misc/stf.sql

    # 给 worker 和 dispatcher 设置队列使用 redis
    export STF_QUEUE_TYPE=Redis
    export STF_REDIS_HOSTPORT=192.168.0.101:6379
    # 所有的角色都要有自己独有的 hostid
    export STF_HOST_ID=1
    export STF_HOME=/root/stf

    # 启动 dispatcher，这里目前还只会用 plack，不知道怎么用 nginx/apache
    export USE_PLACK_REPROXY=1
    # 研究阶段可以打开 debug 看系统是怎么分发怎么平衡怎么确定使用哪个storage的file的过程
    export STF_DEBUG=1
    plackup -a etc/dispatcher.psgi

    # 启动 worker
    ./bin/stf-worker

    # 启动管理界面网站，可以通过 web 添加 cluster 和 storage
    plackup -a etc/admin.psgi -p 9000 &

    # 一个 cluster 下至少需要有 3 个 storage，这里用三个目录三个端口来模拟
    mkdir -p /data{1,2,3}
    export STF_STORAGE_ROOT=/data1
    plackup -a etc/storage.psgi -p 8888 &
    export STF_STORAGE_ROOT=/data2
    plackup -a etc/storage.psgi -p 8889 &
    export STF_STORAGE_ROOT=/data3
    plackup -a etc/storage.psgi -p 8890 &

然后上 9000 端口的 web 添加 cluster 和 storage，如下截图：

最后测试一下上传下载，如果上面 psgi 是 DEBUG 运行的，就可以看到详细的过程了。

    lwp-request -m PUT http://192.168.0.101/bucket
    ^D
    lwp-request -m PUT http://192.168.0.101:5000/bucket/test.txt
    test
    ^D
    lwp-request http://192.168.0.101:5000/bucket/test.txt
    ls /data1/p/e/g/k/pegkuclninhsyqxftuzpwcuhgughpa.txt
    ls /data2/p/e/g/k/pegkuclninhsyqxftuzpwcuhgughpa.txt

2013 年 03 月 20 日更新

前面测试记录的，都是纯 perl 的部分。实际运用的时候，有些地方是可以用 nginx 来替代的。

源代码包中，apache-sample.conf 比 nginx-sample.conf 要全面的多。不过其实还是 nginx 配置起来容易，比如给 dispatcher.psgi 加上 nginx 代理，只需要这样就可以了：

server {
    listen 80;
    server_name stf;
    location / {
        proxy_pass http://192.168.0.101:5000/;
    }
    location /reproxy {
        internal;
        set $reproxy $upstream_http_x_reproxy_url;
        proxy_pass $reproxy;
    }
}

然后我们就可以直接通过 http://192.168.0.101/bucket/test.txt 来访问了。

Puppet 自定义 type 和 function

2013-01-31T00:00:00+00:00

Puppet 除了原有 DSL 以外，还提供了不少接口方便大家开发插件来更简单的完成一些高级功能。

Define Type

比如我们要维护一个上千域名组成的 ProxyServer 集群，其域名配置是相近的。那么我们就可以提炼出 template 里会变化的部分作为参数。由此定义出一个 type 如下：

    define nginx::vhost4proxy(
        $iplist = [],
        $domainlist = [],
        $extconf = ''
    ) {
        $nginx_proxy_name    = $name
        $nginx_proxy_servers = $iplist
        $nginx_server_names  = $domainlist
    
        file { "${nginx_proxy_name}.server.conf":
            ensure  => file,
            require => File['/etc/nginx/conf.d'],
            path    => "/etc/nginx/conf.d/${nginx_proxy_name}.server.conf",
            content => template('nginx/vhost_proxy.conf.erb'),
            notify  => Service['nginx'],
        }
    }

然后在 template 里使用参数来生成结果：

    upstream <%= nginx_proxy_name %> {
            consistent_hash $request_uri;
    <% nginx_proxy_servers.each do |ip| -%>
            server <%= ip %>;
    <% end %>
    }
    server {
        listen 80;
        server_name <% scope.lookupvar("nginx_server_names").each do |name| -%> <%= name -%><% end %>;
    
        location / {
            proxy_pass       http://<%= scope.lookupvar("nginx_proxy_name") %>;
            include          conf.d/proxy.conf;
        }
    <% if has_variable?("extconf") %>
        <%= scope.lookupvar("extconf") %>
    <% end %>
    }

这样我们只需要在 puppet 中这样调用，就可以直接生成对应的配置了：

    nginx::vhost4proxy('server1':
        ['1.1.1.1 weight=2', '2.2.2.2 weight=3'],
        ['server1.domain', 'server1.alias.domain'],
        'access_log /path/to/other_log format'
    )

Custom Function

不过用上面 define type 还不能完全解决我们提出的问题。因为在 puppet 配置里写几千行 nginx::vhost4proxy 也是一件很可怕的事情！

这时候可以更进一步，把 vhost4proxy 的调用过程隐藏成一个 function，如下：

    require 'yaml'
    module Puppet::Parser::Functions
      newfunction(:gen_proxy_confd, :type => :statement) do |args|
        Puppet::Parser::Functions.autoloader.loadall
        resource_type = args[0]
        yaml_dir = args[1]
        Dir.foreach(yaml_dir) do |yaml_file|
          file_path = "#{yaml_dir}/#{yaml_file}"
          next unless file_path[-5..-1].eql?('.yaml')
          res_params = YAML.load_file(file_path)
          function_create_resources([resource_type, res_params])
        end
      end
    end

然后只要把原先传递给 vhost4proxy 的参数写成 yaml 文件放好就行了。

    --- 
    server1: 
      iplist: 
        - 1.1.1.1 weight=2
        - 2.2.2.2 weight=3
      domainlist:
        - server1.domain
        - '*.server1.alias.domain'
      extconf: |-
        chunkin on;
        error_page 411 = @my_411_error;
        location @my_411_error {
            chunkin_resume;
        }
        access_log /path/to/other_log format;

大家看起来是不是有点眼熟？没错，这个 yaml 的思路完全是借鉴了 hiera 的写法。但是 hiera 的设计是垂直继承的，不适合这里假设的平面式的情况 —— 当然，如果你觉得把这几千个 yaml 都写在一个大 yaml 文件里也不费劲的话。就不用上我这么折腾了~~

最后在 puppet 配置中只用一行就搞定全部：

    gen_proxy_confd('nginx::vhost4proxy',"${modulepath}/nginx/yaml")

要点

type 基本没有什么难度，因为他还是属于 puppet DSL 的运用。可以在其他配置文件内部直接写 define type，不过 puppet-lint 工具会报一个 warnings，所以建议还是单独拆分出来。

function 首先是路径和命名问题。

要把写 function 的文件放在 ${modulepath}/yourmodule/lib/puppet/parser/functions/ 路径下；
和其他 type、class 一样，文件名必须和 function 一致，puppet 才能 autoload；
格式是固定的，注意有两种:type，statement和rvalue。如果你的 function 目的是返回一个值给 puppet 继续使用，要指定好。默认是 statement；
在自定义 function 里调用其他 function 有两种办法，一种写全路径 Puppet::Parser::Functions.function('file')；一种是使用 Puppet::Parser::Functions.autoloader.loadall 加载全部 function，然后用 function_** 的方式来调用；
示例中最关键的一个是调用了 function_create_resources 。create_resources 用来批量创建资源。直接在 puppet 配置文件里使用的时候，接收的是列表参数。但是在 Ruby 里直接使用 function_create_resources 的话，接收的是一个匿名数组作为唯一参数。
function 和 type 在 puppet 中可以认为是 class 的一种，所以它们也是有自己的作用域的。所以看到传递参数时写的是 “nginx::vhost4proxy”。

参考内容

关于 Facts 在 function 中的运用，rvalue 的示例等更多内容见官网：http://docs.puppetlabs.com/guides/custom_functions.html。

关于 puppet 自带的各种 function 的说明，见官网(很多也没写)：http://docs.puppetlabs.com/references/latest/function.html。

鸣谢

感谢 @liu.cy 童鞋提醒我变量作用域的问题。function 的调试过程很痛苦。

用 systemtap 调试 kmsg dump

2013-01-11T00:00:00+00:00

google 之前推出了一个 netoops 的 patch，可以让 linux kernel 在崩溃的时候通过 udp 协议把信息发送到远端主机上。我之前在 CentOS6.2 的内核上做过测试，详细做法可以参见淘宝内核组 wiki 的编译使用淘宝内核和 netoops 使用指南。唯一有区别的地方就是淘宝使用的 RedHat6 的内核在 CentOS6 上有签名问题，需要自己从 CentOS 官网 ftp 下载 src.rpm 来用 —— 当然如果要自己搞定编译那步，少不了就要自己修改 config-genaric 和 kernel.spc 文件了。

昨天同事升级修改到 CentOS6.3 内核( 2.6.32.220 -> 2.6.32.279 )上。结果发现修改冲突代码编译通过后，再使用 soft dump 方式测试，远端主机 nc 收不到结果了。

稍微 grep 一下代码，发现是在 kernel/printk.c 里定义 void kmsg_dump() 的。好了，使用 systemtap 来检查这里：

    stap -ve 'probe kernel.function("kmsg_dump"){printf("%s\n",$$vars$$)}'

结果发现在 soft dump 的时候有输出，也就是说调用了 kmsg_dump()。

比较 2.6.32.220 和 2.6.32.279 的代码，发现在 kmsg_dump() 里，新内核多了一点判断，如果reason 低于 KERNEL_OOPS 而且没有设置 always_kmsg_dump 变量，那么直接返回不再 dumper->dump() 了。

1546    if ((reason > KMSG_DUMP_OOPS) && !always_kmsg_dump)
1547            return; 

我们验证一下是不是这个原因：

    stap -gve 'probe kernel.statement("*@kernel/printk.c:1548")  { printf("%s\n",$$parms$$) }'

显然测试的时候 reason 是 KERNEL_SOFT，这个是不好调的，那么我们可以调整这个变量，找了一下没发现这个可以在 sysctl 什么的里面，所以继续用 systemtap 搞定：

    stap -gve 'probe kernel.statement("*@kernel/printk.c:1545")  { $always_kmsg_dump=1; printf("%d",$always_kmsg_dump); printf("%s\n",$$parms$$) }'

果然搞定。

升级 Puppet 到 3.0 及其他附件简介

2013-01-10T00:00:00+00:00

今天把 puppet 从2.7 升级到了 3.0。同时放弃了之前通过 ENC 定义所有 top scope variable 的做法，改成只定义一个 role 变量，然后在各个 module 里根据 $role 加载不同的module::role ，把变量都写在 module::role 里。

经历过上次事故后，我对全局变量已经大大的有不安全感，包括 puppet 3.0 新进内核的 hiera (官网介绍文档中也说是”like a lightweight ENC”)。虽然 module::role 看起来很多是重复内容，还是让人工的操作多经过一些检测才放心。

从 2.7 升级到 3.0 没有太多的不适应。官网上列了很多不同。不过实际上基本没改动什么。

运行命令统一成 puppet command 的形式，2.7的时候还保留的一堆命令都没有了。
--apply 改成 --catalog 了。不过这个其实我没用过。
pluginsync 默认开启了。这个是替代 factsync 的。2.7 的时候默认还是关闭。给 facter 写插件应该是很容易而且很必要的事情。
master 内置 webserver 取消了。也就是说原先各种优化文档里的 --servertype=mongrel 没用了。但是 3.0 变成了标准 Rack 应用。直接在 /etc/puppet/rack 下运行 rackup -s thin -p 18140 -D -P /tmp/puppetmaster.pid 就可以了。
自然对应的 rack 配置文件 config.ru 改了，看 example 就好。
include 可以传递数组
agent 的 lockfile 把 fork running 和 disabled 区分成两个文件了。不知道能不能消灭掉原先 agent 跑着跑着僵死的情况。

以上是官网列举的主要内容。以下还有我__实际测试中发现的问题__：

agent 的 puppet.conf 里需要添加一行 preferred_serialization_format = yaml，否则默认使用 pson 会直接报错。

今天重温了一下 github 在 puppetconf 上的讲演《chatops》。当然对其中的 hubot 不是重点关注。主要是其中提到的 rodjek 的几个 puppet 相关的项目觉得蛮有用的。

puppet-lint

地址：https://github.com/rodjek/puppet-lint.git

这是一个语法格式检查器，如果 ERROR 会 exit 1。之前两天我还刚在 CPAN 上发现过一个 Puppet::Tidy 模块。不过目前为止，这两个都不是很满意：

puppet-lint 只能检查格式而不会替你修改格式。
puppet-tidy 可以修改格式但是它对格式的检查太简陋了。

当然比 puppet-tidy 稍微好一些的 puppet-lint 也不是很精准，比如他会对所有用双引号定义的变量报 “WARNING: double quoted string containing no variables”；而 puppet-tidy 更奇怪的给我 ip 地址的最后一段再加上了一个单引号变成了下面这个样子：

    $iplist = ["192.168.1.'2'","192.168.1.'3'"]

只能说规范化任重道远。

puppet-profiler

地址：https://github.com/rodjek/puppet-profiler.git

这是一个 agent 执行的调试器，不过至今为止功能也还很简单：就是执行一次

    puppet agent --test --evaltrace --nocolor

排序各个 Resource 的执行耗时，并打印前十名。

rspec-puppet

地址：https://github.com/rodjek/rspec-puppet

这是一个 puppet 的 rspec 测试工具扩展。注意他依赖于 puppetlabs_spec_helper 但是 gem 里却没写。。。

使用方法看 github 上的说明比较详细了，稍后我再单写一篇介绍。

给 puppet 写 Rspec 测试用例

2013-01-10T00:00:00+00:00

上文提到 github 给 puppet 开发的几个附件。其中有扩展 rspec 的 rubygems 模块叫做 rspec-puppet。官网见：http://rspec-puppet.com

照着官网 Tutorial，很容易能写出来测试用例。我这样ruby入门没看完的水准，从发现这个gem到写完第一个测试用例，也就花了不到半个小时。

安装

    gem install puppetlabs_spec_helper rspec_puppet

创建测试用例环境

以测试 nginx 模块为例：

    cd /etc/puppet/modules/nginx
    rspec-puppet-init

这个 init 脚本其实就是执行了一串 mkdir -p 和 ln -s 命令，最后生成一个总的 Rakefile 。详情见官网Setup。

编写测试用例

扩展给 Rspec 增加的方法其实不多，官网 Matchers 页面上有说。主要就是下面几个：

include_class()
contain_<resource>()
run()
.with()
.without()

现在来写我们的第一个测试用例 /etc/puppet/modules/nginx/spec/classes/common_spec.rb 吧：

    # 这个文件被 init 自动生成在 /etc/puppet/modules/nginx/spec/ 下了
    # 其内容就是加入这个目录下所有的文件
    require 'spec_helper'
    # 这里定义你要测试的 puppet module
    describe 'nginx' do
        it do
            should include_class('nginx::sysctl')
            should include_class('nginx::install')
        end
    end
    
    describe 'nginx::common' do
        # 使用let定义变量
        let(:node) { 'common-nginx-2.domain.com' }
        # 不定义的话，测试中只有从前面:node 生成的 hostname,domain,fqdn 三个
        let(:facts) { {
            :ipaddress_eth0 => '192.168.1.2',
            :processorcount => '8',
        } }
        it do
            should include_class('nginx::common')
            # 注意这里要写 Resource 的名字，而不是 file 的 path
            # 这个是下面 .with 检查的 :param
            should contain_file('proxy.conf').with({
                'ensure' => 'file',
                'mode'   => '0644',
                'path'   => '/etc/nginx/conf.d/proxy.conf'
            })
        end
        context 'access_log' do
            expect_line = 'access_log /data/nginx/logs/access.log main buffer=16k;'
            it do
                # 注意这里是把整个 content 作为 String 对象传递
                should contain_file('nginx.conf').with_content(/#{expect_line}/)
            end
        end
        context 'upstream' do
            expect_line = '192.168.1.2:80;'
            it do
                should contain_file('upstream.conf').with_content(/#{expect_line}/)
            end
        end
        context 'conf.d' do
            it do
                dir = '/etc/puppet/modules/nginx/files/conf.d'
                # eq 是 rspec 本身的方法
                Dir.entries(dir).length.should eq(15)
            end
        end
    end

然后你就可以运行测试了：

    cd /etc/puppet/modules/nginx
    rake spec

如果测试用例有失败，会在终端看到错误信息。

注意到，rspec 是以 do ... end 来计算 examples 个数的。在一个 do ... end 里写多个 should 或者 expect，也算一个 example。

限制单个进程的带宽

2013-01-06T00:00:00+00:00

限制带宽简直就是系统管理员的永恒话题之一。当然我这里就不讨论端口限速什么的了，百度一下一大把。但如果要的是限制某个特定进程的带宽，事情就有趣多了。

iptables

大多数文档还是提供的传统思路，用 iptables 的 owner 模块，给 --pid-owner 加上 MARK，然后 tc 里针对这个 MARK 做限速。用法和限制如 http://lists.netisland.net/archives/plug/plug-2004-09/msg00454.html 说的这样。不过和这个快十年前的文章相比，现在的服务器上，基本已经普及了 SMP ，更进一步的，内核已经在自动发现支持 SMP 的时候，在 iptables 里把 owner 模块的 pid/cmd/sid 三个 match 都去掉了！现在的 owner 里只有 uid/gid 两个。所以这条路，在生产环境上基本行不通。

在 stackexchange 上，大家集思广益、献策献宝，又提出了另外两个工具，那个叫 pipeviewer 的应用场景比较特定(楼主问题是发生在 sshfs 上)，就不多说了。剩下这个 trickle 真是小众利器。值得一提：

trickle

官方主页：http://monkey.org/~marius/pages/?page=trickle

这是一个在 BSD 上诞生的项目，官网上说只在 i386 的 linux 验证过。不过我在 x86_64 的 linux 替大家尝试了一把，没有问题~

    yum install libevent-devel
    wget http://monkey.org/~marius/trickle/trickle-1.06.tar.gz
    tar zvxf trickle-1.06.tar.gz
    cd trickle-1.06
    ./configure
    # 生成的 config.h 里重复定义了 in_addr_t 结构体
    # 跟 include 的 /usr/include/netinet/in.h 里冲突
    # 会报错 "error: two or more data types in declaration specifiers"
    sed -i 's!\(#define in_addr_t\)!//\1!' config.h
    make
    make install

命令使用非常简单：

    trickle -s -d 100 wget http://domain/path/to/file.suffix -O /dev/null

-s 表示独立运行，因为 trickle 还有一个 trickled 管理端可以用；
-d 表示下载方向；
-u 表示上传方向，两个的单位都是KB/s。

这个工具使用了 ELF 的 preloader 机制，在命令执行的时候替换掉标准库中的 socket recv() 和 send() 部分，达到限速的效果。其原理图在官方PDF 中，如下：

不过总监大人及时提示我们：由于该机制的限制，此工具对静态编译的程序无效，对采用 suid 的程序无效！

cgroup

排除上面两个无效，其实 trickle 依然无法覆盖全部应用场景 —— 比如说已经启动的后台进程长期运行，我有 pid ，但是不想中断掉重新起来；或者说这个进程可能我想让他白天跑 10MBps 晚上跑 40MBps 这样动态的。

这个时候就需要动用一些高级工具了，欢迎 CGROUP 上场。

cgroup 有 net_cls 控制器。不过和其他控制器不太一样的是它不直接控制网络读写，只是给网络包打上一个标记，然后把专业的事情交给专业的 TC 去做。嗯，思路和原先的 iptable 是很类似的。

参考文档很少，感觉大家使用 cgroup 都集中在 cpu 和 blkio 方面了。目前所见只有 redhat 这个 pdf：http://vger.kernel.org/netconf2009_slides/Network%20Control%20Group%20Whitepaper.odt 。实施步骤如下：

启用 tc

    tc qdisc del dev eth0 root
    tc qdisc add dev eth0 root handle 1: htb
    tc class add dev eth0 parent 1: classid 1: htb rate 1000mbit ceil 1000mbit
    tc class add dev eth0 parent 1: classid 1:3 htb rate 10mbit 
    tc class add dev eth0 parent 1: classid 1:4 htb rate 10kbit
    tc filter add dev eth0 protocol ip parent 1:0 prio 1 handle 1: cgroup

配置 cgroup

    # 命令行使用
    mount -t cgroup net_cls -o net_cls /cgroup/net_cls/
    cd !$
    cgcreate -g net_cls:test
    echo '0x10004' > /cgroup/net_cls/test/net_cls.classid 
    # 然后可以导出成文件之后通过工具管理
    yum install -y libcgroup
    cgsnapshot -s > /etc/cgconfig.conf
    /etc/init.d/cgconfig restart

测试 cgroup 效果

    time scp bigfile root@192.168.0.26:/tmp/
    time cgexec -g net_cls:test scp bigfile root@192.168.0.26:/tmp/
    echo $$ > /cgroup/net_cls/test/tasks
    tc class change dev eth0 parent 1: classid 1:4 htb rate 1mbit
    time scp bigfile root@192.168.0.26:/tmp/

可以看到后两次的速度比第一次慢很多。

第三次也被限制住，是因为 cgroup 会自动把子进程的 pid 也加入 tasks 里。

总结及其它

trickle 在 download 的时候限制非常管用，在 upload 的时候大概起始速度会比限制值高几倍，然后以 100KB/s 的速度往下减。感觉是 smooth 的问题，不过调整相关参数也没见到区别。
cgroup 给 tc 打标签的办法，看到 tc 限制下的速度波动比较大，猜测 tc 应该是类似 10 秒钟统计一次平均值是否超过限制这样的行为？

2012 年个人总结

2012-12-30T00:00:00+00:00

2012 年还剩下最后 30 个小时。总结一下这一年。

4 月是本年度最重要的一个月，在这个月换工作到了人人，告别了之前八个月乱七八糟的工作状态，再不换，人就要被玩残了。感谢@懒桃儿吃桃儿的飞速决断。作为自我激励，在换工作的那个周末去搞定了人生大事（好吧，其实压根不是啥激励，应该叫水到渠成）……

9 月是另一个关键点，入职的第一个季度总结，确认自己虽然荒废了八个月，但还没掉队。既然安心自己不至于失业，也就顺带去转职了房奴。

技术博客上还是说点技术点的。

第一、大半年的事情在和 `logstash` + `ElasticSearch` 系统打交道。

这个偶然在 oschina 上看到的项目，已经成为我心目中 splunk 的最佳开源替代品。从 5 月动手测试，到现在为止，写过 2 个相关的 ppt，做过 1 次技术分享，发了 8 篇相关原创博客文章，翻译了 2 篇官网文章，在微博和 QQ 上和大概 10 个左右的朋友交流了搭建、优化的心得。考虑是不是搞个地方存一下这些交流。前几天看 CloudFoundry 里都有专门的 ElasticSearch 组件。相信云时代这个穷人版 splunk 可以走得更远 —— 嗯，不会写 java 用 hadoop 的运维真的都可以试试。

第二、Perl 相关。

本年度关于 Perl 最多的运用是 Dancer web开发框架。在 dancer 和 twitter bootstrap 的帮助下做的内部运维工具网站看起来还有那么点意思。使用过程中学会用 IRC 工具和社区进行交流，提供了一个 plugin-upload-progress 的想法，发了两个 patch ，一个给 plugin-flashmessage 同时支持使用 coderef 的 TT2 和 object 的 Text::Xslate 模版，一个给 plugin-auth-extensible 的角色认证加上正则匹配的特性。虽然扶凯已经全面转向使用 Mojolicious 框架了，不过我依然喜欢 dancer 这种广泛使用关键字的方式 —— 少写好多 $self-> 或者 app-> 呢~ 另一个记忆深刻的是某天有人热心的上来说：“我们要多写博客宣传 Dancer 在云计算的运用”，被作者喷还不如给我多写两个插件……

然后是 Message::Passing 框架，这是 logstash 项目的 perl port。不过个人纯属好玩和不服气，看完代码当作学习 perl 的 Moo 对象系统了。值得一提是虽然没线上用，倒是找了个周末写了两个模块 Message::Passing::Filter::Regexp 和 Message::Passing::Output::PocketIO 上传到 CPAN 了。总算不是光拿不贡献的 perler 了。然后发现 Test::More 真的蛮不错的，写第二个模块的时候基本就是先写好 test 再写 lib 了，据说这叫 TDD ？

然后是 Rex 项目，这是一个类似 func 和 capistrano 的项目。这类项目和 puppet、chef、cfengine 和 lcfg 的区别，我觉得是运行目的。cf 系要求的是保持 agent 的配置一致，而 rex 等的目的是给同类目的执行同类任务。这个区别在 2008 年的 sysadmin 里就已经解释过，不过似乎很多人一直在重复问~ 因为 perl 目前还没有像 ruby 的 rakefile 这样流行的任务清单控制(其实有个日本人写的pake，不过在日本人的诸多 modern perl 项目里，我觉得这个 clone 的不咋地)，所以我现在都用 Rexfile 来做 task 了，也算一种用法。顺带给只能用 Net::SSH2 的 Rex 提交了 Net::OpenSSH 驱动，不过作者很负责任的说要等自己搞出来一套 KerberOS5 认证环境测试我的 pull request 是否能运行后才 merge …… 国内还有哪里用 krb5 认证滴？

最后是 SmokePing 项目。说实话真没想到这么有名的监控项目代码乱成这个样子。好几次涌现出改写整个项目的疯狂念头，不过看看时间表，想想 rrd 那部分代码看不太懂，放弃了。只好在边边角角上做点修改 —— 顺带再次证明，在 web 开发方面，perl 不是输给了 php/python/ruby ，而是不会 css/js 的 perler 输给了那些会 css/js 的phper/pythoner/rubyer……

附带提一下 nginx_perl 项目，这个和 nginx_lua 一样的全流程非阻塞式的东东，最终我还是没找到机会真正用上，白瞎偶去年底很开心的给它写 ppt 推介了。大抵还用 perl 的同学觉得用 Nginx 内置的阻塞式的 perl 已经够用了？

第三、运维、测试

要感谢人人这个平台，日常运维之余完成了几个测试，Apache Traffic Server 的因为前设条件比较多，结论不具有普遍性；Nginx 的万兆网络环境测试还是很有趣的 —— 嗯，虽然最后的脚本依然很难看，拿不出手见人，不过结果还是有力的。@张纹华，你的框架要好好搞~

Squid 从我工作以来就在折腾，看样子是要继续折腾下去。感谢 systemtap 工具，或许明年我在缓慢的学习 C 语言开发的同时，尽量快的搞定那两个问题吧，阿弥陀佛，哈利路亚……

puppet 已经风靡全球，也确实还算好用。我从接触开始就一眼相中了 ENC 接口，不过好像问一圈没谁注意这个。大多数人直接把 hostname 规划和 puppet 连起来了。这部分到底怎样才是 best practice ，还要慢慢看了。

fpm 命令行工具，又是一个 jordansissel 的 ruby 项目。一般情况下的 package 生成，绝对够用，和 logstash 一样也是我有事没事就推广一下的好东东。

linux 的邮件列表订阅之后迅速的被我过滤掉了，那么多邮件，你们是怎么看过来的，kernel 学习任重道远。

第四、学习

上半年，@邓侃博士在北航的云计算公开课基本都去听了。虽然个人工作重点完全不在这方面，不过依然觉得是有所得的。顺带想起某节课后和 @R_exify 在北航东门外的肯德基里推导怎么设计一个对外透明的 MySQLaaS。大概吹牛就是这样子的……

关于 lua，ruby，javascript，基本都是用到临头抱佛脚，不过对 ruby 和 js 都有深入学习的想法，但是我怨念已久的 C 啊，啥时侯才能学会你。不知道为什么对 python 就是没感觉。话说昨晚在微博上看到有人说看 python 的源码觉得它的 OO 和 lua 很像。顿时我就很郁闷，因为之前我看 lua 的时候觉得 lua 实现的 OO 和 Perl5 很像的好吧。尼玛大家都像来像去的，你们 Pythoner 整天鄙视 Perl 干吗……

关于 CloudFoundry ，关注来关注去，基本停留在看新闻的阶段，一行代码没瞄过，连一个 micro 环境都没搭建过。嗯，不过考虑到毕竟看了不少新闻，还是留一笔。

关于微博，有微博之后，学习成本确实降低了，因为很多问题你可以直接圈人……不过我的同学朋友们肯定对我的微博内容是“眼不见心不烦”了的。哈哈~

总之，这是无比充实的一年。

排除掉每个季度末，比如现在，对下季度工作计划的茫然外。

感谢自己依然充满对知识的渴望，让年终的总结显得这么充实和踏实。

perl 模块打包加入外部依赖程序

2012-12-30T00:00:00+00:00

Perl 社区并不是所有的东西都发布在 CPAN 上。甚至专门有一个 Module::ThirdParty 模块记录这些非 CPAN 的 perl 项目列表。其中最有名的应该就属写博客的 Movable Type 和做监控的 SmokePing 了。

但是如果个人图方便又想把 smokeping 打包方便部署使用的时候，就会发现一点小问题：打包成rpm，很多 perl 的依赖模块不一定在系统 repo 里存在；打包成 perl 的模块，smokeping 最常用的几个 probe 比如 fping、curl 什么的，又是非 perl 程序，cpanm 没法解决这个 requires_external_bin ，最多只能报错退出。

其实这里可以采取一些别的办法，虽然笨一些，但是解决问题。

首先还是让我们创建一个示例模块：

    cpanm Module::Starter Module::Build
    module-starter --module Alien::FPing --author="Jeff Rao" --email="myname@gmail.com" --mb

然后就会在本目录下创建一个 Alien-FPing 目录，自带好了 Build.PL 等模块文件。这里使用了 Alien:: 的名字空间，是一个潜规则，有些项目依赖 C 源码的库和头文件，就用 perl 包一层来安装，都放在这个空间下，比如 Alien::V8, Alien::Gearmand, Alien::IE7 等等。

现在让我们下载 fping 的源码放到模块里：

    mkdir Alien-FPing/src
    wget http://www.fping.org/dist/fping-3.4.tar.gz -O Alien-FPing/src/fping-3.4.tar.gz

接下来应该就是编写 Build.PL 了。不过为了尽量让 Build.PL 看起来简洁而且一眼看出目的。我们最好把编译操作单独定义一个模块来使用：

    package Alien::FPing::Build;
    use base qw(Module::Build);
    use File::Spec;
    use Archive::Tar;
    my $RootDir = File::Spec->rel2abs(".");
    my $SrcDir = File::Spec->catdir($RootDir, "src");
    my $FPingVersion = '3.4';
    my $FPingName = "fping-${FPingVersion}";
    my $FPingSrc = "${FPingName}.tar.gz";
    sub ACTION_build {
        my $self = shift;
        chdir($SrcDir);
        if (  !-x "/usr/sbin/fping" and !-d $FPingName ) {
            my $tar = Archive::Tar->new();
            $tar->read($FPingSrc);
            $tar->extract();
            chdir($FPingName);
            system('./configure', '--prefix=/usr/', '--enable-ipv6');
            system('make');
            system('make install');
        }
        $self->SUPER::ACTION_build();
    };
    1;

几乎就是调用 shell 而已，唯一需要讲一下的就是这个 ACTION_build。这是 Module::Build 定义好的提供给 subclass 用的方法，事实上 ./Build help 看得到的所有 action 都有类似的方法可以用。

然后稍微修改一下 Build.PL 如下：

    use 5.006;
    use strict;
    use warnings FATAL => 'all';
    use lib 'inc';
    use Alien::FPing::Build;
    my $builder = Alien::FPing::Build->new(
        module_name         => 'Alien::FPing',
        license             => 'perl',
        dist_author         => q{Jeff Rao <myname@gmail.com>},
        dist_version_from   => 'lib/Alien/FPing.pm',
        release_status      => 'stable',
        configure_requires => {
            'Module::Build' => 0,
        },
        build_requires => {
            'Test::More' => 0,
        },
        requires => {
            #'ABC'              => 1.6,
            #'Foo::Bar::Module' => 5.0401,
        },
        add_to_cleanup     => [ 'Alien-FPing-*' ],
        create_makefile_pl => 'traditional',
    );
    $builder->create_build_script();

把 Module::Build 替换成 Alien::FPing::Build 而已，其他都不用动。

然后试一下吧：

    cd Alien-FPing
    perl Build.PL
    ./Build

看到编译输出，并且成功安装有 /usr/sbin/fping 了吧。现在可以打包了。注意默认生成的 ignore.txt 里，是排除掉了 inc 目录的，需要去除掉，然后修改 MANIFEST 文件加入 inc 和 src 里的文件，然后再打包出来的 perl 模块就可以直接用了。

    sed -i '/inc/d' ignore.txt
    echo 'inc/Alien/FPing/Build.pm' >> MANIFEST
    echo 'src/fping-3.4.tar.gz' >> MANIFEST
    ./Build dist

给 Sysadmin Advent 快速搭建本地浏览网站

2012-12-22T00:00:00+00:00

一年一度的 advent 集合中，除了 perl 的部分，还有 sysadmin 的也很吸引我等运维的眼球。不过 sysadmin 的一直是发表在blogspot 上，光荣的被 GFW 认证了。虽然说翻墙应该是这年头越来越普及的技能，但是能提供免墙的办法，想来那真真是极好的。

这里提供一个私以为很不错的办法。因为我很开心的发现 sysadvent 有托管在 github 上。

    sudo apt-get install git
    git clone git://github.com/jordansissel/sysadvent.git
    sudo wget http://xrl.us/cpanm --no-check-certificate -O /sbin/cpanm
    sudo chmod +x /sbin/cpanm
    cpanm Plack DocLife

好了，准备工作完毕。然后在 sysadvent 目录下创建 app.psgi 文件如下：

    use Plack::Builder;
    use Plack::App::Directory;
    use DocLife::Markdown;
    my $html_app = DocLife::Markdown->new(
        root => '.',
        base_url => '/html/',
        suffix => '.html',
    );
    my $md_app = DocLife::Markdown->new(
        root => '.',
        suffix => '.md',
        base_url => '/md/'
    );
    my $dir_app = Plack::App::Directory->new({
        root => '.',
    });
    builder {
        mount '/md' => $md_app;
        mount '/html' => $html_app;
        mount '/' => builder {
            enable "Plack::Middleware::SimpleContentFilter",
            filter => sub {
                s#(/\d{4}/\d{2}/\S+\.md)#/md\1#;
                s#(/\d{4}/\d{2}/\S+\.html)#/html\1#;
            };
            $dir_app
        };
    };

Plack::App::Directory 模块是 Plack 自带的一个静态目录自动索引发布模块。不过他会把 markdown 当成 “text/plain” 发布，不好看。所以这里引入了另一个 DocLife 模块。他可以自动把 markdown 和 pod 格式的文档美化转换成 html 格式。本来 DocLife 本身也提供目录索引功能，不过他的问题是他不考虑 MIME 问题，会把 png 等图片也以 “text/plain” 发布。所以我们用 Plack::App::URLMap 把两个模块挂在到一起，然后用 Plack::Middleware::SimpleContentFilter 过滤内容，替换原本的目录链接成针对性的目录。

大功告成！运行命令开始享受世界级运维们的分享吧：

    plackup &
    open localhost:5000

注：另外有个 Plack::App::Directory::Markdown 模块，不过他写死了只处理 md，连 html 都被 next。比较好玩的是这个模块自己把 bootstrap.css js 给放到 __DATA__ 块里一起分发了，页面倒是更好看一点。

Dancer::Plugin::Adapter 模块介绍

2012-12-22T00:00:00+00:00

Dancer 活跃的社区和强大又方便的插件开发导致出现了太多好玩的插件，有位新同学在刚上手的这两周内就已经往 CPAN 提交了四个插件了。

今天这里介绍一个刚在 IRC 上被推荐的东东，额，这个插件的作者跟上面提到的同学说：大哥，看看偶这个模块吧，就不用你这么辛苦的啥都写新插件了。

Dancer::Plugin::Adapter 模块的作用，就是当你的项目需要在多处使用某个模块的时候，不用频繁的到处去new，直接在 config.yml 里一定义，它会自动给你实例化成 Dancer::Object，然后缓存住，你就可以直接用 service 关键词调用了。

用法示例：

    # in config.yml
    plugins:
      Adapter:
        ua:
          class: HTTP::Tiny
          options:
            max_redirect: 3
        postmark:
          class: WWW::Postmark
          options: POSTMARK_API_TEST
     
    # in your app
    use Dancer::Plugin::Adapter;
    get '/' => sub {
      eval {
        service("postmark")->send(
          from    => 'me@domain.tld',
          to      => 'you@domain.tld, them@domain.tld',
          subject => 'an email message',
          body    => "hi guys, what's up?"
        );
      };
      return $@ ? "Error: $@" : "Mail sent";
    };
    get '/proxy/:url' => sub {
      my $res = service('ua')->get( params->{'url'} );
      if ( $res->{success} ) {
        return $res->{content};
      }
      else {
        template 'error' => { response => $res };
      }
    };

话说我还是喜欢上代码，不喜欢完整的翻译 POD 啊…………

用 Amcharts 和 ElasticSearch 做日志分析

2012-12-22T00:00:00+00:00

之前有一篇从 ElasticSearch 官网摘下来的博客《【翻译】用ElasticSearch和Protovis实现数据可视化》。不过一来 Protovis 已经过时，二来不管是 Protovis 的进化品 D3 还是 Highchart 什么的，我觉得在多图方面都还不如 amcharts 好用。所以在最后依然选择了老牌的 amcharts 完成。

展示品的大概背景还是 webserver 日志，嗯，这个需求应该是最有代表性的了。我们需要对webserver的性能有所了解。之前有一篇文章《Tatsumaki框架的小demo一个》，讲的是通过 terms_stats 获取固定时段内请求时间的平均值。其实这个demo是可以参照官网博客修改成纯js应用的。因为 Tatsumaki 在这里除了处理 HTTP 请求参数，什么都没干。而且这个demo目的是展示 perl 框架的处理，所以amchart方面直接就写死了各种变量。

但是还有一种需求，比如你需要的是针对某个情况超过某个百分比的分时走势统计。这时候必须多次请求 ES 来做运算，再让 js 做，不是说不行，但是多一倍数据在网络中传输，就不如在服务器端封装 API 了 —— 其实是我 js 太烂这种事情，我会告诉你们么。。。

先上两张效果图，其实这个布局我是从 facetgrapher 项目偷来的，但这个项目只适合比较不同 index 之间同时间段的数据，我建议作者修改，作者说”我自己js也是半吊子水平”。。。

2013 年 2 月 21 日更新：利用 bullet 大小来表示 hasErr 的程度

查询的 ES 库情况如下：

    $ curl "http://10.4.16.68:9200/demo-photo/log/_mapping?pretty=1"
    {
      "log" : {
        "properties" : {
          "brower" : {
            "type" : "string"
          },
          "date" : {
            "type" : "date",
            "format" : "dateOptionalTime"
          },
          "fromArea" : {
            "type" : "string",
            "index" : "not_analyzed"
          },
          "hasErr" : {
            "type" : "string"
          },
          "requestUrl" : {
            "type" : "string",
            "index" : "not_analyzed"
          },
          "timeCost" : {
            "type" : "long"
          },
          "userId" : {
            "type" : "string"
          },
          "xnforword" : {
            "type" : "string"
          }
        }
      }
    }
    $ curl "http://10.4.16.68:9200/demo-photo/log/_search?pretty=1&size=1" -d '{"query":{"match_all":{}}}'
    {
      "took" : 14,
      "timed_out" : false,
      "_shards" : {
        "total" : 10,
        "successful" : 10,
        "failed" : 0
      },
      "hits" : {
        "total" : 2330679,
        "max_score" : 1.0,
        "hits" : [ {
          "_index" : "demo-photo",
          "_type" : "log",
          "_id" : "iSI5xic7Qg2p9Sqk5yp-pQ",
          "_score" : 1.0, "_source" : {"hasErr":"false","date":"2012-12-06T15:04:21,983","userId":"123456789","requestUrl":"http://photo.demo.domain.com/path/to/your/app/test.jpg","brower":"chrome17.0.963.84","timeCost":750,"xnforword":["192.168.1.123","10.10.10.10"],"fromArea":"CN-UNI-OTHER"}
        } ]
      }
    }

然后后台是我惯用的 Dancer 框架：

    package AnalysisDemo;
    use Dancer ':syntax';
    use Dancer::Plugin::Ajax;
    use ElasticSearch;
    use POSIX qw(strftime);
    no  warnings;
    
    my $elsearch         = ElasticSearch->new( { %{ config->{plugins}->{ElasticSearch} } } );
    my $index_prefix     = 'demo-';
    my $type             = 'log';
    # 这里是对ip库的归类。数据是需要提前导入ES的，这可以是logstash发挥作用
    my $default_provider = {
        yidong    => [qw(CN-CRN CN-CMN)],
        jiaoyu    => [qw(CN-CER CN-CST)],
        dianxin   => [qw(CN-CHN)],
        liantong  => [qw(CN-UNI CN-CNC)],
        guangdian => [qw(CN-SCN)],
        haiwai => [qw(OS)],
    };
    
    get '/' => sub {
        # 通过 state API 获取 ES 集群现有的所有index列表
        # 因为是一个域名一个index，这样就有了前段页面上的域名下拉选择框
        my $indices = $elsearch->cluster_state->{routing_table}->{indices};
        template 'demo/chart',
          {
            providers => [ sort keys %$default_provider ],
            datasources =>
              [ grep { /^$index_prefix/ && s/$index_prefix// } keys %$indices ],
            inputfrom => strftime("%F\T%T", localtime(time()-864000)),
            inputto => strftime("%F\T%T", localtime()),
          };
    };
    
    # 这里把 api 拆成服务商和区域两个，没啥特殊原因，因为是分两回写的，汗
    # 其实可以看到最开始的请求参数类似，最后json的field名字都一样
    ajax '/api/provider' => sub {
        my $param = from_json(request->body);
        my $index = $index_prefix . $param->{'datasource'};
        my $from  = $param->{'from'} || 'now-10d';
        my $to    = $param->{'to'} || 'now';
        my $providers = $param->{'provider'};
        my ( $pct, $chartData );
        for my $provider ( sort @{$providers} ) {
            my $provider_pct;
            # 这里是比较麻烦的一点，因为一个区域在ip库里可能标记成多个，比如铁通和移动，现在都是移动
            for my $area ( @{ $default_provider->{$provider} } ) {
                my $res = pct_count( $index, $area, $from, $to );
                for my $time ( sort keys %{$res} ) {
                    $provider_pct->{$time}->{count} += $res->{$time}->{count};
                    $provider_pct->{$time}->{error} += $res->{$time}->{error};
                    $provider_pct->{$time}->{slow}  += $res->{$time}->{slow};
                }
            }
            # 这里因为可能没有错误，所以前面关闭了常用的 warnings 警告
            for my $time ( sort keys %{$provider_pct} ) {
                my $right_pct = 100;
                $right_pct =
                  100 -
                  $provider_pct->{$time}->{slow} / $provider_pct->{$time}->{count}
                  * 100;
                $pct->{$time}->{$provider} = sprintf "%.2f", $right_pct;
                $pct->{$time}->{"${provider}Err"} = sprintf "%.2f",
                  $provider_pct->{$time}->{error} / $provider_pct->{$time}->{count}
                  * 100;
                $pct->{$time}->{"${provider}Size"} = sprintf "%.0f",
                  $pct->{$time}->{"${provider}Err"};
            }
        };
    
        for my $time ( sort keys %$pct ) {
            my $data->{date} = $time;
            for my $provider ( @$providers ) {
                $data->{$provider} = $pct->{$time}->{$provider} || 100;
                $data->{"${provider}Err"} = $pct->{$time}->{"${provider}Err"} || 0;
                # 百分比太低，所以翻 5 倍来作为 bullet 的大小
                $data->{"${provider}Size"} =
                  $pct->{$time}->{"${provider}Size"} * 5 || 0;
            };
            push @$chartData, $data;
        };
    
        my $res = {
            type => "line",
            categoryField => "date",
            graphList => $providers,
            chartData => $chartData,
        };
    
        return to_json($res);
    };
    
    ajax '/api/area' => sub {
        my $param = from_json(request->body);
        my $index = $index_prefix . $param->{'datasource'};
        my $limit = $param->{'limit'} || 50;
        my $from  = $param->{'from'} || 'now-10d';
        my $to    = $param->{'to'} || 'now';
        # 这是后来写的，尽可能把 sub 拆分了，所以 ajax 这里就很简略
        # 当然因为不考虑多运营商的问题，本身也容易一些
        my $res = pct_terms( $index, $limit, $from, $to );
        return to_json($res);
    };
    
    sub pct_terms {
        my ( $index, $limit, $from, $to ) = @_;
        my $area_all_count = area_terms( $index, 0,    $limit, $from, $to );
        my $area_err_count = area_terms( $index, 2000, $limit, $from, $to );
        my ( $error, $chartData );
        for ( @{$area_err_count} ) {
            $error->{ $_->{term} } = $_->{count};
        }
        for ( @{$area_all_count} ) {
            push @$chartData, {
                area  => $_->{term},
                error => $error->{ $_->{term} } || 0,
                right => $_->{count} - $error->{ $_->{term} },
            };
        }
        my $res = {
            type => "column",
            categoryField => "area",
            graphList => [qw(right error)],
            chartData => $chartData,
        };
        return $res;
    }
    
    sub pct_count {
        my ( $index, $area, $from, $to ) = @_;
        my $level = $area eq 'OS' ? 3000 : 2000;
        my $all_count  = histo_count( $index, 0,      $area, $from, $to );
        my $slow_count = histo_count( $index, $level,   $area, $from, $to );
        my $err_count  = histo_count( $index, 'hasErr', $area, $from, $to );
        my $res;
        for ( @{$slow_count} ) {
            $res->{ $_->{time} }->{slow} = $_->{count};
        }
        for ( @{$err_count} ) {
            $res->{ $_->{time} }->{error} = $_->{count};
        }
        for ( @{$all_count} ) {
            $res->{ $_->{time} }->{count} = $_->{count};
        }
        return $res;
    }
    
    # 下面开始的两个才是真正发 ES 请求的地方

    sub area_terms {
        my ( $index, $level, $limit, $from, $to ) = @_;
        my $data = $elsearch->search(
            index  => $index,
            type   => $type,
            size   => 0,
            facets => {
                area => {
                    facet_filter => {
                        and => [
                            {
                                range => {
                                    date => {
                                        from => $from,
                                        to   => $to
                                    },
                                },
                            },
                            {
                                numeric_range =>
                                  { timeCost => { gte => $level, }, },
                            },
                        ],
                    },
                    # 使用最简单的 terms facets API，因为只用计数就好了
                    terms => {
                        field => "fromArea",
                        size  => $limit,
                    }
                }
            }
        );
        return $data->{facets}->{area}->{terms};
    }
    
    sub histo_count {
        my ( $index, $level, $area, $from, $to ) = @_;
        # 根据 level 参数判断使用 hasErr 还是 timeCost 列数据
        my $level_ref =
          $level eq 'hasErr'
          ? { term => { hasErr => 'true' } }
          : { numeric_range => { timeCost => { gt => $level } } };
        my $facets = {
            pct => {
                facet_filter => {
                    # 这里条件比较多，所以要用 bool API，不能用 and 了
                    bool => {
                        # must 可以提供多个条件作为 AND 数组
                        # 此外还有 must_not 作为 AND NOT 数组
                        # should 作为 OR 数组
                        must => [
                            {
                                range => {
                                    date => {
                                        from => $from,
                                        to   => $to
                                    },
                                },
                            },
                            { prefix => { fromArea => $area } },
                            $level_ref,
                        ],
                    },
                },
                # 这里是需要针对专门的时间列做汇总，所以用 date_histogram 了，具体说明之前有博客
                date_histogram => {
                    field    => "date",
                    interval => "1h",
                }
            }
        };
        my $data = $elsearch->search(
            index  => $index,
            type   => $type,
            facets => $facets,
            size   => 0,
        );
        return $data->{facets}->{pct}->{entries};
    }

其实把里面请求的hash拆开来一个个定义，然后根据情况组合，但是不方便察看作为 demo 的整体情况。

然后看template里怎么写。这里虽然有两个效果图，但是只有一个template哟：

<link rel="stylesheet" href="[% $request.uri_base %]/amcharts/style.css" type="text/css">
<script src="[% $request.uri_base %]/amcharts/amcharts.js" type="text/javascript"></script>
<script type="text/javascript">
  var chart;

  function createAmChart(data) {
    // 清空原有图形
    $("#chartdiv").empty();
    // 如果是时间轴线图，需要把date字符转成Date对象
    if ( data.categoryField == "date" ) {
      for ( var j = 0; j < data.chartData.length; j++ ) {
        data.chartData[j].date = new Date(Number(data.chartData[j].date));
      }
    }

    chart = new AmCharts.AmSerialChart();
    // 拖动条等图片的路径
    chart.pathToImages = "/amcharts/images/";
    chart.dataProvider = data.chartData;
    chart.categoryField = data.categoryField;
    // 如果是柱状图，可以显示 3D 效果
    if ( data.type == 'column' ) {
//      chart.rotate = true;
      chart.depth3D = 20;
      chart.angle = 30;
    }
    var categoryAxis = chart.categoryAxis;
    categoryAxis.fillAlpha = 1;
    categoryAxis.fillColor = "#FAFAFA";
    categoryAxis.axisAlpha = 0;
    categoryAxis.gridPosition = "start";
    // 时间轴需要解析Date对象
    if ( data.categoryField == "date" ) {
      categoryAxis.parseDates = true;
      categoryAxis.minPeriod = "hh";
    }

    var valueAxis = new AmCharts.ValueAxis();
    valueAxis.dashLength = 5;
    valueAxis.axisAlpha = 0;
    // 指定柱状图为叠加模式，这里有多种模式可以看文档
    if ( data.type == 'column' ) {
      valueAxis.stackType = "regular";
    }
    chart.addValueAxis(valueAxis);

    // 这里有个有趣的事情，如果不把graph当数组直接循环，效果也没问题
    // 我只能猜测是 addGraph 后数据其实已经缓存到 chart 了
    var graph = [];
    var colors = ['#FF6600', '#FCD202', '#B0DE09', '#0D8ECF', '#2A0CD0', '#CD0D74', '#CC0000', '#00CC00', '#0000CC', '#DDDDDD', '#999999', '#333333', '#990000'];
    for ( var i = 0; i < data.graphList.length; i++ ) {
      graph[i] = new AmCharts.AmGraph();
      graph[i].title = data.graphList[i];
      graph[i].valueField = data.graphList[i];
      graph[i].type = data.type;
      if ( data.type == 'column' ) {
        graph[i].lineAlpha = 0;
        graph[i].fillAlphas = 1;
      } else {
        graph[i].valueField = data.graphList[i];
        graph[i].descriptionField = data.graphList[i] + "Err";
        graph[i].bulletSizeField = data.graphList[i] + "Size";
        graph[i].bullet = "round";
        // 设定为空心圆圈
        graph[i].bulletColor = "#ffffff";
        graph[i].bulletBorderAlpha = 1;
        // amchart 本来有默认颜色，不过前面因为修改了圆内的颜色，所以其他颜色无法继承默认设定了
        graph[i].bulletBorderColor =  colors[i];
        graph[i].lineColor =  colors[i];
        graph[i].lineAlpha = 1;
        graph[i].lineThickness = 1;
        graph[i].balloonText = "[[value]]% / hasErr:[[description]]%";
      }
      chart.addGraph(graph[i]);
    }

    // 加图例，这样可以在图上随时勾选察看具体某个数据，也方便某数据异常的时候影响察看其他
    var legend = new AmCharts.AmLegend();
    legend.position = "right";
    legend.horizontalGap = 10;
    legend.switchType = "v";
    chart.addLegend(legend);

    // 加拖拉轴，这样可以拖动察看细节，这个功能很赞
    var scrollbar = new AmCharts.ChartScrollbar();
    scrollbar.graph = graph[0];
    scrollbar.graphType = "line";
    scrollbar.height = 30;
    chart.addChartScrollbar(scrollbar);

    var cursor = new AmCharts.ChartCursor();
    chart.addChartCursor(cursor);

    chart.write("chartdiv");
  };

  function drawChart() {
    var provider = [];
    $("#provider :selected").each(function(){
       provider.push( $(this).val() );
    });
    var datasource = $("#datasource :selected").val();
    var apitype = $(":radio:checked").val();
    var from = $("#from").val();
    var to = $("#to").val();
    $.ajax({
      processData: false,
      url: "[% $request.uri_base %]/demo/api/" + apitype,
      data: JSON.stringify({"provider":provider, "datasource":datasource, "from":from, "to":to}),
      type: "POST",
      dataType: "json",
      success : createAmChart
    });
  };

  function showselect() {
    $("#providers").show();
  };
  function hideselect() {
    $("#providers").hide();
  };
</script>

      <div class="well">
        <div class="span8">
          <input type="text" class="input-medium" id="from" name="from" value="[% $inputfrom %]">
          <input type="text" class="input-medium" id="to" name="to" value="[% $inputto %]">
          <select class="input-medium" id="datasource">
%% for $datasources -> $datasource {
            <option value="[% $datasource %]">[% $datasource %]</option>
%% }
          </select>
        </div>
        <div class="span2">
          <label class="radio">
            <input type="radio" name="querytype" value="provider" onclick="showselect()">服务商趋势
          </label>
          <label class="radio">
            <input type="radio" name="querytype" value="area" checked onclick="hideselect()">分地区统计
          </label>
        </div>
        
        <button type="submit" class="btn btn-primary" onclick="drawChart()">查询</button>
        
        <div id ="providers" class="controls hide">
          <select class="input-medium" id="provider" multiple="mulitiple">
%% for $providers -> $provider {
            <option value="[% $provider %]" selected>[% $provider %]</option>
%% }
          </select>
        </div>
      </div><!--/well-->
      <div id="chartdiv" style="width: 100%; height: 400px;">
      </div>

学习 Dancer::Plugin::Auth::Extensible 模块

2012-12-21T00:00:00+00:00

首先介绍一下 Dancer::Plugin::Auth::Extensible 模块。这是一个认证验证的框架，之前 Dancer 里这方面的框架是 RBAC ，不过 RBAC 是实现的 auth 对象，然后提供 ->asa，->can，->roles 等方法。在使用的时候，需要自己在每个 route 里写 if 或者 switch 代码，显得比较繁琐。而 Extensible 模块提供了另一个（或者说是两个）思路。同时借此深入了解 Dancer::Plugin 和 Dancer::Hook 的用法，外加熟悉 perl 的一些不常见的对象使用。收获良多，不可不记。

上面之所以说算是两个思路。是因为在这个模块出来的短短十天内，其 0.001 和 0.010 版本已经完全从实现到使用方法都变了样子。下面先说 0.001 版。

这个原始版本的使用方法大概是这样的：

    get '/secret' => sub :RequireRole(God) { DestroyWorld(); };
    get '/users' => sub :RequireLogin {
        my $user = logged_in_user;
        return "Hi there, $user->{username}";
    };

哇，我是第一次见到在 sub 后面还可以写这样的东西（好吧，暴露了本人的菜鸟本质）！赶紧打开模块的源代码，然后找到了相关的几行：

    use attributes;
    use Scalar::Util;
    use Exporter 'import';
    our @EXPORT=qw(MODIFY_CODE_ATTRIBUTES FETCH_CODE_ATTRIBUTES);
    hook before => sub {
        my $route_handler = shift || return;
        my $requires_login = get_attribs_by_type(
            'RequireLogin', $route_handler->code
        );
        my $roles_required = get_attribs_by_type(
            'RequireRole', $route_handler->code
        );
        ...;
    };
    my %attrs;
    sub MODIFY_CODE_ATTRIBUTES {
        my ($package, $subref, @attrs) = @_;
        $attrs{ refaddr $subref } = \@attrs;
        return;
    } 
    sub FETCH_CODE_ATTRIBUTES {
        my ($package, $subref) = @_;
        my $attrs = $attrs{ refaddr $subref };
        return $attrs ? @$attrs : ();
    }
    sub get_attribs_by_type {
        my ($type, $coderef) = @_;
        return unless $coderef;
        my @desired_attribs = grep { 
            /^$type(?:\([^)]*\))?$/ 
        } attributes::get($coderef);
        return if !@desired_attribs;
        return [
            map {
                my $f = $_;
                $f =~ s/^$type\(\s*([^)]*)\s*\)$/$1/;
                split(/\s+/, $f);
            } @desired_attribs
        ];
    }

代码中的 $route_handler->code 就是应用中写的 sub {}。整个代码中，最关键的部分是这句 attributes::get($coderef) ！

首先有个小问题，因为 Dancer 里，get 是关键词，所以这里写了全路径。attributes::get 的介绍见 POD，大意是会使用 FETCH_type_ATTRIBUTES 方法获取列表。因为这里 attribute 是 sub 的，所以 type 就是 CODE ，也就是用前面定义的 FETCH_CODE_ATTRIBUTES。FETCH_type_ATTRIBUTES 方法的说明见 POD。

在https://metacpan.org/module/perlsub#Subroutine-Attributes中，建议我们看另一个更好用的模块来理解自定义属性的问题，这个模块是Attribute::Handlers。

然后是 0.010 版：

新版本的使用方法如下：

    get '/secret' => require_any_role [qw(God Admin)] => sub { DestroyWorld(); };
    get '/users' => require_login => sub {
        my $user = logged_in_user;
        return "Hi there, $user->{username}";
    };

这种添加新关键词的写法更加的 dancer。所以能从实现中学到更有普适性的 Dancer::Plugin 开发方法。摘要代码如下：

    use Dancer::Plugin;
    use Dancer qw(:syntax);
    sub require_any_role {
        return _build_wrapper(@_, 'any');
    }
    register require_any_role  => \&require_any_role;
    sub _build_wrapper {
        my $require_role = shift;
        my $coderef = shift;
        my $mode = shift;
        my @role_list = ref $require_role eq 'ARRAY' 
            ? @$require_role
            : $require_role;
        return sub {
            my $user = logged_in_user();
            if (!$user) {
                execute_hook('login_required', $coderef);
                return redirect $loginpage;
            }
            my $role_match;
            if ($mode eq 'single') {
                $role_match++ if user_has_role($require_role);
            } elsif ($mode eq 'any') {
                my %role_ok = map { $_ => 1 } @role_list;
                for (user_roles()) {
                    $role_match++ and last if $role_ok{$_};
                }
            } elsif ($mode eq 'all') {
                $role_match++;
                for my $role (@role_list) {
                    if (!user_has_role($role)) {
                        $role_match = 0;
                        last;
                    }
                }
            }
            if ($role_match) {
                return $coderef->();
            }
            execute_hook('permission_denied', $coderef);
            return redirect $deniedpage;
        };
    }
    register_hook qw(login_required permission_denied);

主要摘要了几个部分：

第一，register

摘要中就是 register 了一个关键词 require_any_role 。这样在启用了本 plugin 的应用里，你可以直接使用这个关键词。至于具体的 sub，没有什么特殊的。看前面的用法举例就知道了，传递一个 roles 的数组引用(或者单个role的话就是字符串，这个在后面有判断)和一个 sub 作为参数，也就是 @_。

第二，register_hook

第一个是 Dancer::Plugin 的部分，第二个是 Dancer::Hook 的功能。注册一个叫 login_required 的 hook，然后在需要的地方运行 execute_hook('login_required', $coderef)。

register_hook 接受 $name 和 $coderef 参数。如果只有 name 的话，Dancer::Hook 里也会自动生成一个 $compiled_filter ，作用就是除非你调用 halt 了，不然就输出一条 core 级别的日志(这里其实还用到了 Dancer::Hook::Properties，判断是否需要运行，默认初始化参数空的时候返回真，不运行 app，继续往下到记录日志)。然后，将这个对象传递给 Dancer::Factory::Hook。这里会把前面的生成的 coderef 加入到一个 $class->hooks->{$hook_name} 数组，而 name 加入到 $self->registered_hooks 数组。

在execute_hook 的时候，从前面的 $self->registered_hooks 判断是否有这个 name，然后从 $class->hooks->{$hook_name} 里依次取出全部 coderef 执行。

第三，any

和前面 0.001 类似，这里也有一个关键词冲突的问题，前面的 get 和这里的 any 都是 Dancer 的关键词。不然的话，其实这里使用 Perl6::Junction 或者 Syntax::Keyword::Junction 模块是正当其时啊。我之前都用 Perl6::Junction，不过昨天的 Perl Advent Calendar 文章里推荐了后面这个 Syntax::Keyword::Junction，meta::cpan 上也都是两个喜欢。另外题外话说一句，那篇文章里推荐的另一个 Function::Parameters 可真是好东西，唯一问题是低于 Perl 5.014的版本用不了，因为他不是 source filter 而是 keyword plugin api 的。这是新版本的功能。

12 月 30 日附：

在 github 上提交了一个短短的 patch ，给 DPAE 加上了正则匹配 role 的功能，感谢 Perl5.10的强大，代码其实就修改一行足以实现：

    lib/Dancer/Plugin/Auth/Extensible.pm @ 891cd02
    @@ -266,7 +266,9 @@ sub _build_wrapper {
             my $role_match;
             if ($mode eq 'single') {
    -            $role_match++ if user_has_role($require_role);
    +            for (user_roles()) {
    +                $role_match++ and last if $_ ~~ $require_role;
    +            }
             } elsif ($mode eq 'any') {
                 my %role_ok = map { $_ => 1 } @role_list;
                 for (user_roles()) {

    t/01-basic.t @ 891cd02
    @@ -81,6 +81,9 @@ response_status_is [ GET => '/allroles' ], 200,
     response_status_is [ GET => '/regex/a' ], 200,
         "We can request a regex route when logged in";
     
    +response_status_is [ GET => '/piss/regex' ], 200,
    +    "We can request a route requiring a regex role we have";
    +
     # ... but can't request something requiring a role we don't have
     response_redirect_location_is  [ GET => '/piss' ],
         'http://localhost/login/denied?return_url=%2Fpiss',

    t/lib/TestApp.pm @ 891cd02
    @@ -39,6 +39,10 @@ get '/piss' => require_role BearGrylls => sub {
         "You can drink piss";
     };
     
    +get '/piss/regex' => require_role qr/beer/i => sub {
    +    "You can drink piss now";
    +};
    +
     get '/anyrole' => require_any_role ['Foo','BeerDrinker'] => sub {
         "Matching one of multiple roles works";
     };

Dancer 框架使用 Text::XSlate 模版的注意事项

2012-12-19T00:00:00+00:00

Dancer 框架自带有一个 Simple 模版，不过推荐使用 Template 模块作为替代品。不过从性能上来说，TT2 比之前博客里陆续介绍过的 HTML::Template 和 Text::MicroTemplate 都要差。而这方面最好的，就是 Text::XSlate 模块了。今天尝试将一个 Dancer 应用迁移到 Text::XSlate 上。踩进两个坑，特此记录。

关于语法什么的，可以看 POD ，扶凯有翻译的中文版POD 。足以十分钟入门。就不多说了。

第一个坑：session 的处理

website 少不了 session 的运用。在 template 里使用 [% session.username %] 可以很方便的控制显示面板还是登陆啊什么的。

不过切换成 XSlate 后（即 <: $session.username :>），请求会 crash 掉，报错大意是: $session 没有 username 这个 method。

XSlate 提供了 dump 语法糖，让我们可以直接使用 <: $session | dump :> 检查问题。这时候发现显示如下：

    $VAR1 = { blessed( { id => '2131232131', username => 'user1' } ), Dancer::Session::YAML };

尝试使用 <: $session.id :> ，发现可以正常输出 2131232131 。

进去看 Dancer::Session 的代码，原来在 Dancer::Session::Abstract 里，有这么一行：

    __PACKAGE__->attributes('id');

说实话不太理解这行的用法，不过不妨碍我们用简单办法解决问题…… 在我们的应用中给 Dancer::Session::YAML 定义一个叫 username 的 method 就可以骗过去了：

    package DancerApp;
    use Dancer ':syntax';
    use Dancer::Session::YAML;
    
    sub Dancer::Session::YAML::username {
        return session('username');
    };
    
    use Dancer::Plugin::Auth::Extensible;
    get '/' => sub :RequireLogin { template 'index' };
    ...;
    
    true;

2013 年 03 月 25 日更新

今天莫莫也换成 Xslate 模板，顺带告诉我这里一个更通用和优雅的修改方式：

    package DancerApp;
    use Dancer ':syntax';
    use Dancer::Session::Abstract;
    use Dancer::Plugin::Auth::Extensible;

    Dancer::Session::Abstract->attributes( qw(username) );

    get '/' => sub :RequireLogin { template 'index' };
    ...;
    
    true;

这样可以在各种 Session 引擎下通用了。

更新完毕

第二个坑：flashmessage 的处理

这是一个外加模块，叫做 Dancer::Plugin::FlashMessage 。用它配合模版的 layout 功能，可以很方便的给应用提供全局的消息通知。使用方法如下：

首先在模块里加载 flash 变量：

    package DancerApp::First;
    use Dancer ':syntax';
    use Dancer::Plugin::FlashMessage;
    use Dancer::Plugin::Auth::Extensible;
    
    get '/first/:name' => sub :RequireRole('MAN') {
        flash message => 'Hello! You are the first man here.';
        template 'first', { name => param('name') };
    };
    
    true;

然后在模版里判断显示：

    [% IF flash.message %]
      <div class="alert alert-success">
        [% flash.message %]
      </div>
    [% END %]

同样，在修改成 XSlate 后，模版是这样：

    : if $flash.message {
      <div class="alert alert-success">
        <: flash.message :>
      </div>
    : }

结果发现页面上的 div 一直保持，而且显示着 CODE(0x39a5c30) 这样的字样。同样使用 dump 语法糖，看到 $flash 其实是 { message => sub {"DUMMY"} }。

这个就有趣了，居然是个代码段~~于是翻源码来看：

    hook before_template => sub {
        shift->{$token_name} = {
            map { my $key = $_; my $value;
                ( $key, sub { defined $value and return $value;
                    my $flash = session($session_hash_key) || {};
                    $value = delete $flash->{$key};
                    session $session_hash_key, $flash;
                    return $value;
                } );
            } ( keys %{session($session_hash_key) || {} })
        };
    };

map 里面，确实是一个 $key => sub {} 。

这个时候我切换两个 template 做了个测试。在里面那个匿名 sub 里写了一行 die;。结果。XSlate “正常”运行过去，在页面上显示前面说过的 CODE()；而在 Template 模版下，500 了。看 console 的日志，发现 die 这个动作不是在 before_template 阶段发生的。而是在随后的 render 阶段，Dancer::Template::Abstract 里才挂了。

所以，最终，两个坑归结起来并成了一个问题：模版系统是支持 coderef 还是支持 object 的问题。就在我写着这句话的同时，IRC 上还为 Dancer::Plugin::FlashMessage 的新实现而争论不休。xdg 童鞋已经在我提问的一个小时内快速的搞出来一个把 flash “object 化”的 patch，而 bigpresh 童鞋坚定的认为应该把 delete 操作放在 hook after_template 里完成。原作者 dams 则”相信”更多的模版是支持 coderef 不支持 object 的。

不过我觉得，其实改动最小的办法，就是别用 map 这么高档的语法。拆成两段处理，确保传递给 template_render 的是字符串即可：

    hook before_template => sub {
        my %hash;
        my $flash = session($session_hash_key) || {};
        for ( keys %{$flash} ) {
            $hash{$_} = delete $flash->{$_};
        };
        session $session_hash_key, $flash;
        shift->{$token_name} = \%hash;
    };

最后的最后，就在我测试完我的改动版本在两种模版下都可以运行的时候，dams 已经决定先同时保持 coderef 和 object 的写法并提供 setting 配置。然后慢慢搜集各种模版系统做覆盖测试。

20 日增

最后最后的最后，在 github 上搜到两个用 dancer 和 xslate 写的 repo。他们都采用了在应用 app 里自定义 hook before_template ，把 session('username') 和 flash('message') 两个变量传递给 $token 哈希的办法。

perl发起HTTP请求时如何设置Host头

2012-12-16T00:00:00+00:00

之所以写这么个内容，是今天突然发现之前有个脚本的效果完全不对。这个脚本是用 Furl 模块发 HTTP 请求。看 POD 的说明，以为这样写是生效的：

    use HTTP::Request;
    use Furl;
    my $r = HTTP::Request->new( GET => "http://192.168.0.2/path/to/file" );
    $r->header( Host => "www.example.com" );
    my $furl = Furl->new();
    my $res = $furl->request($r);
    say $res->code();

但是随后在 192.168.0.2 上发现日志记录中，Host 并没有修改成 www.example.com 。

然后尝试了各种 POD 上介绍的 header 写法，包括在 new HTTP::Request 的时候使用 [Host => "www.example.com"] 参数，在 $furl->request 的时候使用 headers => [Host => "www.example.com"] 参数。结果都一样。

然后只能改思路，用设置 proxy 的办法。结果发现 Furl 模块的 proxy 不可用……

POD 上是说直接在 new 的时候传递 %args 或者 \%args 就行。但是我使用的时候发现直接会报错：

Passed malformed URL: 192.168.0.2

最后只能放弃使用 Furl 模块，改回古老的 LWP 模块。LWP 与 Coro 配合如下：

    use Coro;
    use LWP::Protocol::Coro::http;
    use LWP::UserAgent;
    sub co_http_get {
        my ( $domain, $urlpath, $iplist ) = @_;
        my @coros;
        my $msg = '';
        my $ua = LWP::UserAgent->new();
        foreach my $ip ( @{$iplist} ) {
            push @coros, async {
                $ua->proxy('http', "http://$ip:3128/");
                my $res = $ua->get("http://$domain$urlpath");
                $msg .= "$ip: " . $res->code() . "\n";
            }
        }
        $_->join for @coros;
        return $msg;
    }
    print co_http_get("www.example.com", "/path/to/file", [qw(192.168.0.1 192.168.0.2)]);

不小心踩进ElasticSearch.pm模块的坑里了

2012-12-11T00:00:00+00:00

在今天以前，我一直认为perl的ElasticSearch.pm是除了原生java库以外封装最好的。不过今天踩进一个硕大的坑里，多亏 dancer-user 邮件列表里外国友人的帮助，才算爬了出来……

事情是这样的

用 dancer 搭建的一个 webserver 用来提供 api 给前端图表页面。dancer 收到 ajax 请求后组装成 json 发给 ElasticSearch。因为要算百分比，无法在单次请求内完成，不然的话直接从页面上发给 ES 服务器了。

这个 webserver 是之前已经创建过的。而且作用类似，也就是说，之前已经存在一个 DancerApp/lib/DancerApp/First.pm 里使用了 ElasticSearch 模块。相关代码如下：

    use Dancer ':syntax';
    use ElasticSearch;
    my $elsearch = ElasticSearch->new( config->{ElasticSearch} );

然后给新项目创建 DancerApp/lib/DancerApp/Second.pm 同样使用 ElasticSearch 模块，代码原样复制。然后在 DancerApp/lib/DancerApp.pm 里先后加载：

    use Dancer ':syntax';
    use FindBin qw($Bin);
    use lib "$Bin/../lib";
    use DancerApp::First;
    use DancerApp::Second;

启动应用后访问页面。怪事出现了： First 应用正常，Second 应用报错说 ElasticSearch 连接不上。

仔细看报错信息，发现Second 里的 $elsearch 连接的不是 config.yml 里设定的 servers，而是模块默认的 127.0.0.1:9200。

更换DancerApp/lib/DancerApp.pm 里的加载次序，就变成了 Second 正常，First 失败。

试图使用下面的代码检查 config ，发现 config 里其他的设置都没问题，唯独和 ElasticSearch 相关的设定发生了变化：

    use Data::Dumper;
    get '/config' => sub { return Dumper config };

结果中 config->{ElasticSearch} 只剩下 trace_calls: 0 一条设定， servers、transport、no_refresh 和 max_requests 都消失了！

真相只有一个

ElasticSearch 模块在初始化的时候，会把参数传递给 ElasticSearch::Transport 模块做具体的操作（包括之前我很欣赏的自动选择节点服务器）。而就在这里，问题出现了：

参数一直是以引用身份传递的，任何修改都会修改原始数据

    my $servers = delete $params->{servers}
        || '127.0.0.1:' . $transport_class->default_port;

随着 delete 操作，悲剧就此发生了。Dancer 里的全局变量 config->{ElasticSearch} 中的 servers 元素就此消失……

善后事宜

解决办法很容易，在每个模块里初始化 ElasticSearch 实例的适合，传递一个全局 config->{ElasticSearch} 的_副本的引用_过去。

    my $elsearch = ElasticSearch->new( { %{ config->{ElasticSearch} } } );

亲爱的 David Precious 童鞋已经把这个问题上报给 ElasticSearch.pm 开发者了。或许之后会由模块内部做副本操作。目前只能自己来了。

issue 地址：https://github.com/clintongormley/ElasticSearch.pm/issues/34

用gnuplot绘制直方图

2012-12-10T00:00:00+00:00

越来越喜欢用 gnuplot 画图了，因为有时候发现自己实在是不会用 Excel……

之前基本上用gnuplot画的都是时间轴形式的，诸位客官肯定已经看多了。但是 gnuplot 可不止是这点。还有一种很常见的功能也很方便，就是与时间无关的多个数据做对比的时候，还画成两条连线，就不如画成直方图更体现价值了。比如下面这组数据：

地区	总数(A)	总数(B)
美洲	16682	20344
澳洲	4021	3672
欧洲	2902	2878

只需要几行配置，就可以生成很漂亮滴直方图对比了。

set key right top Left reverse width 0 box 3
set xlabel "各大洲区域"
set ylabel "请求总数"
set ytics 0, 500
set mytics 5
set grid
set boxwidth 0.9 absolute
set style fill solid 1.00 border -1
set style histogram clustered gap 1 title offset character 0, 0, 0
set style data histograms
set terminal png size 1024, 512
set output "oversea.png"
plot 'oversea.csv' using 2:xtic(1) ti col, '' u 3 ti col

注意如果行比较多，默认大小的图上X轴的标记就会挤在一块了，所以在 set terminal 后面设置图片大小，这和 set size 是不一样的。后者设置的相对值是本次要 plot 的图形在总画布上的比例大小。

plot 里 using 的两列也是和画 line 图时反过来的顺序，而且 X 轴的列要用 xtic() 包起来写，否则 gnuplot 会认为这应该是个自增序列，然后找不到 xrange 出错。

效果图如下：

把docx文档转换成markdown格式发布

2012-12-01T00:00:00+00:00

有些Word文档想搬到博客上来，而博客用的是markdown的格式。最简单的办法是在Word里转成html格式另存为，因为markdown和html是兼容的。不过word直接另存为的html里面带有“海量”的无聊样式，实在不方便之后我们再用vim的工具编辑。所以还是想办法整整。

相对来说，Word的docx格式比doc格式要容易处理，因为docx是微软特意推出的open xml格式。其实就是记录了文本内容的content.xml、附件media/*和对应附件路径的_ref.xml等的zip包而已。所以相对必须在Windows平台上调用WIN32OLE的API来处理的doc来说，我们在linux平台上也可以很容易的处理docx文件了。比如rubygems上就有一个很不错的gem叫ydocx。一般的docx库都是只抽取docx里的content文字，而这个ydocx很负责的把media/*也复制到docxname_files/images/*下面，并且在html里生成<img>标签了。

然后另一步就是把html转换成markdown，这在github上也有现成的repo叫downmark_it。嗯，这名字一目了然就是反过来……

(ydocx用的是nokogiri，downmark\_it用的是hpricot，或许应该也改用nokogiri比较好~不过nokogiri官网可耻的被墙了)

首先安装依赖

  apt-get install libxslt1-dev libxml2-dev
  gem install rubyzip htmlentities rmagick ydocx hpricot
  wget https://raw.github.com/cousine/downmark_it/master/downmark_it.rb

编写转换脚本

  require 'rubygems'
  require 'ydocx'
  $: << File.dirname(__FILE__)
  require 'downmark_it'
  filename = ARGV.shift
  ydocx = YDocx::Document.open(filename)
  html = ydocx.to_html.gsub(/\n/, '')
  puts DownmarkIt.to_markdown(html)

这样就能看到输出了。目录里的每个章节都有引用格式凸现，美中不足是对word里的标题样式识别不太好，本来期望是可以自己生成<h1>、<h2>的，但是ydocx生成的html里只把第一个标题一变成<h1>，其他的都是普通的<p>。

另一个问题是上面脚本里直接调用to_html的方法，不会保存住unzip出来的images文件夹。自己再另写一段unzip的代码:

  require 'fileutils'  
  require 'zip/zip'  
  require 'zip/zipfilesystem'  
    
  def unzip(zip_file, dest_dir)
    Zip::ZipFile.open(zip_file) do |zf|
      zf.each do |e|
        path = File.join(dest_dir, e.name)
        FileUtils.mkdir_p(File.dirname(path))
        zf.extract(e, path) { true }
      end  
    end  
  end
  dirname = File.basename(filename, '.docx')
  unzip(filename, "/tmp/#{dirname}")
  FileUtils.mv("/tmp/#{dirname}/media/", "/images/")
  FileUtils.rm_rf("/tmp/#{dirname}")

比较普通的办法，是直接使用ydocx自带的脚本docx2html --format none file.docx，会在docx文档的同级目录下生成同名html和_files目录。然后再写一个单行脚本转成markdown的。

用 Tatsumaki 框架写 elasticsearch 界面

2012-11-22T00:00:00+00:00

Tatsumaki是Plack作者的一个小框架，亮点是很好的利用了psgi.streaming的接口可以async的完成响应。不过因为缺少周边支持，所以除了几个webchat的example，似乎没看到什么应用。笔者之前纯为练手，却用tatsumaki写了个sync响应的小demo，算是展示一下用tatsuamki做普通web应用的基础步骤吧：

(代码本来是作为一个ElasticSearch数据分析的平台，不过后来发现社区有人开始做纯js的内嵌进ElasticSearch的plugin了，所以撤了repo，这里贴下代码)

所有的psgi/plack应用都一样有自己的app.psgi文件： ```perl our $VERSION = 0.01;
app.psgi

use Tatsumaki::Error; use Tatsumaki::Application; use Tatsumaki::HTTPClient; use Tatsumaki::Server;

read config

use File::Basename; use YAML::Syck; my $config = LoadFile(dirname(FILE) . ‘/config.yml’);

elasticsearch init

use ElasticSearch; #这里yml的写法借鉴Dancer::Plugin::ElasticSearch了 my $elsearch = ElasticSearch->new( $config->{‘options’} );

index init

use POSIX qw(strftime); my $index = join ‘-‘, ( (+split( ‘-‘, $config->{‘index’} ))[0], strftime( (+split( ‘-‘, $config->{‘index’} ))[1], localtime ) ); my $type = $config->{‘type’}; #首页类，调用了模板 package MainHandler; use parent qw(Tatsumaki::Handler); sub get { my $self = shift; $self->render(‘index.html’); }; #具体的API类 package ListHandler; use parent qw(Tatsumaki::Handler); sub get { #这里自动把urlpath切分好了 my ( $self, $group, $order, $interval ) = @_; return ‘Not valid order’ unless $order eq ‘count’ or $order eq ‘mean’; return ‘Not valid interval’ unless $interval =~ m#\d+(h|m|s)#; my ($key_field, $value_field); if ( $group eq ‘url’ ) { $key_field = ‘url’; $value_field = ‘responsetime’; } elsif ( $group eq ‘ip’ ) { $key_field = ‘oh’; $value_field = ‘upstreamtime’; } else { return ‘Not valid group field’; };

# get index mapping and sort into array my $mapping = $elsearch->mapping( index => “$index”, type => “$type”, ); my @res_map; for my $property ( sort keys %{ $mapping->{$type}->{‘properties’} } ) { if ($property eq ‘@fields’ ) { my @fields; push @fields, { name => $, type => $mapping->{$type}->{‘properties’}->{$property}->{‘properties’}->{$}->{‘type’} } for sort keys %{ $mapping->{$type}->{‘properties’}->{$property}->{‘properties’} }; push @res_map, \@fields; } else { push @res_map, { name => $property, type => $mapping->{$type}->{‘properties’}->{$property}->{‘type’} }; } }

# get value stat group by key field my $data = $elsearch->search( index => “$index”, type => “$type”, size => 0, query => { “range” => { ‘@timestamp’ => { from => “now-$interval”, to => “now” }, }, }, facets => { “$group” => { “terms_stats” => { “value_field” => “$value_field”, “key_field” => “$key_field”, “order” => “$order”, “size” => 20, } }, } ); my @res_tbl; for ( @{$data->{facets}->{“$group”}->{terms}} ) { my $key = $->{term}; my $mean = sprintf “%.03f”, $->{mean}; my $code_count = code_count($key_field, $key, $interval); push @res_tbl, { key => $key, min => $->{min}, max => $->{max}, mean => $mean, code => $code_count, count => $_->{count}, }; };

render可以接收参数，并且默认把$self带进去，具体key是handler

$self->render('index.html', { table => \@res_tbl, mapping => \@res_map }); };

sub code_count { my ($key_field, $key, $interval) = @; my $result; my $data = $elsearch->search( index => “$index”, type => “$type”, size => 0, query => { range => { ‘@timestamp’ => { from => “now-$interval”, to => “now” }, }, }, facets => { “code” => { facet_filter => { term => { $key_field => “$key” } }, terms => { field => “status”, } } } ); for ( @{$data->{facets}->{code}->{terms}} ) { $result->{$->{term}} = $_->{count}; }; return $result; }; #画图数据API类，因为响应的是Ajax请求，所以这里开启了async，不过其实没意义了。因为这个ElasticSearch代码不是async格式的。应该改造用ElasticSearch::Transport::AEHTTP才能做到全程async。 package ChartHandler; use parent qw(Tatsumaki::Handler); PACKAGE->asynchronous(1); use JSON; sub post { my $self = shift; my $api = $self->request->param(‘api’) || ‘term’; my $key = $self->request->param(‘key’) || ‘oh’; my $value = $self->request->param(‘value’); my $status = $self->request->param(‘status’) || ‘200’;

my $field =  $key eq 'oh' ? 'upstreamtime' : 'responsetime';
my $data = $elsearch->search(
    index => "$index",
    type  => "$type",
    size  => 0,
    query => {
        match_all => { }
    },
    facets => {
        "chart" => {
            facet_filter => {
                and => [
                    {
                        term => {
                            status => $status,
                        },
                    },
                    {
                        $api => {
                            $key => $value,
                        },
                    },
                ]
            },
            date_histogram => {
                value_field => $field,
                key_field => '@timestamp',
                interval => "1m"
            }
        },
    },
);
my @result;
for ( @{$data->{'facets'}->{'chart'}->{'entries'}} ) {
    push @result, {
       time => $_->{'time'},
       count => $_->{'count'},
       mean => sprintf "%.3f", $_->{'mean'} * 1000,
    };
};
header('Content-Type' => 'application/json');
to_json(\@result); }; #主函数 package main; use File::Basename; #通过Tatsumaki::Application绑定urlpath到不同的类上。注意下面listhandler那里用的正则捕获。对，上面类里传参就是这么来的。注意最多不超过$9。 my $app = Tatsumaki::Application->new([
'/' => 'MainHandler',
'/api/chartdata' => 'ChartHandler',
'/api/(\w+)/(\w+)/(\w+)' => 'ListHandler', ]); #指定template和static的路径。类似Dancer里的views和public $app->template_path(dirname(__FILE__) . '/templates'); $app->static_path(dirname(__FILE__) . '/static'); #psgi app组建完成 return $app->psgi_app; true; ``` static里都是bootstrap的东西就不贴了。然后说说template。目前Tatsumaki只支持Text::MicroTemplate::File一种template，当然自己在handler里调用其他的template然后返回字符串也行。不过其实Text::MicroTemplate也蛮强大的。下面上例子： ```html %# 这就是Text::MicroTemplate强大的地方了，行首加个百分号就可以直接使用perl而不像TT那样尽量搞自己的语法 %# 配合render传来的handler(前面说了是类$self)，整个环境全可以任意调用。 % my $mapping = $_[0]->{'mapping'}; % my $table = $_[0]->{'table'}; %# 比如这里其实就是通过handler调用request了。 % my $group = $_[0]->{handler}->args->[0]; % my @codes = qw(200 206 302 304 400 403 404 499 502 503 504); <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
    "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

Bubble -- a perl webui for logstash & elasticsearch

% if ( $table ) { % for ( @codes ) { % } % for my $list ( @{ $table } ) { % for ( @codes ) { % if ( $list->{'code'}->{$_} ) { % } else { % } % } % }

<%= $group %>	平均响应时间	最大响应时间	下载数	<%= $_ %>
<%= $list->{'key'} %>	<%= $list->{'mean'} %>	<%= $list->{'max'} %>	<%= $list->{'count'} %>	<%= $list->{'code'}->{$_} %>

% }

```

效果如下：

2012 年 12 月 30 日附注：

更好的纯 js 版本已经作为独立的 elasticsearch-plugin 项目发布在 github 上。地址：https://github.com/chenryn/elasticsearch-logstash-faceter 。欢迎大家试用!!

用gnuplot绘制多图

2012-11-22T00:00:00+00:00

以前已经提过多次gnuplot的简便快捷了。不过大多是最基本的单图上画条线之类的。这次碰到需求，稍微help了一下在一个图上画多个区域。主要需要注意的就是set size的定位点到底从什么角度算，说实话蛮麻烦的。

上文件：

    result=$1
    begin=`head -n 1 $result.txt | awk '{print $1}'`
    end=`tail -n 1 $result.txt | awk '{print $1}'`
    cat > conf/$result.conf <<EOF
    set terminal png
    set output "png/$result.png"
    set multiplot
    set xdata time
    set timefmt "%H:%M:%S"
    set format x "%M:%S"
    set size 1.0,0.5
    set origin 0.0,0.5
    set ylabel "KRps"
    unset xtics
    plot "res/$result.txt" using 1:(\$2/1000) with points linewidth 2 title ""
    set origin 0.0,0.0
    set size 1.0,0.35
    set xtics
    set xrange ["$begin":"$end"]
    set ylabel "%usr:sys:irq"
    plot "res/$result.csv" using 2:(\$3+\$4+\$8) with boxes fs solid 1.0 title "", \
         "res/$result.csv" using 2:(\$3+\$4) with boxes fs solid 1.0 title "", \
         "res/$result.csv" using 2:3 with boxes fs solid 1.0 title ""
    set origin 0.0,0.3
    set size 1.0,0.25
    unset xtics
    set ylabel "MBps"
    plot "res/$result.csv" using 2:(\$11/1024/1024) with boxes fs solid 0.7 linecolor rgb "green" title "", \
         "res/$result.csv" using 2:(\$12/1024/1024) with lines linewidth 2 linecolor rgb "blue" title ""
    EOF
    
    cat conf/$result.conf | gnuplot

注意：新增了一行xrange配置，如果不指定这个几张小图的xtics会不统一，而上面两张图的xtics又已经被unset了，结果看起来就跟不同步似的。

效果如下：

syslog实时报警"说出来"

2012-11-19T00:00:00+00:00

syslog应该是大家最常用的，也基本可以说是最重要的服务器监控信息来源了。

syslog的传输，应该不用再说，哪怕在百度里搜都有足够多的靠谱结果。而关于报警的问题，之前我也写了好几篇，比如《用Juggernaut实时推送syslog分析结果》讲了如何用websocket推送结果，《Chrome的APP简单用法》讲了如何利用chrome后台页面开机自动运行进行桌面提示。

那么，如果我既不想开网页看，也不好安装chrome浏览器，有没有够简便的办法接收呢？有！Linux社区从来不缺乏各种神奇工具。下面介绍两个同样强大的提示办法。

第一个，非chrome型的桌面通知notify-send命令，依发行版不同，可能属于libnotify-tools或者libnotify-bin包，自己搜索即可；

第二个，Espeak命令，著名Text To Speech软件，虽然电子音怪了点，但是支持中文而且文件很小，同样直接在源里安装即可。

下面就是如何把这两个强大的工具和server结合起来的问题了，出动胶水语言代表perl。代码如下：

use Mojo::UserAgent;
use JSON;

my $ua = Mojo::UserAgent->new();
my ( $sid, $ws );
# 本来用Protocol::WebSocket::Handshake::Client模块，指定IP和端口，自动会获取sid拼ws地址的，不过测试发现open后没反应。奇怪
LABEL:
$sid = (+split(/:/, $ua->get('http://syslog.domain.com:8080/socket.io/1/')->res->body))[0];
$ws = "ws://syslog.domain.com:8080/socket.io/1/websocket/${sid}";
$ua->websocket( $ws => sub {
    my ($ua, $tx) = @_;
    $tx->send('3:::{"type":"subscribe","channel":"syslog"}');
    $tx->on(finish  => sub {
        # 很怪的是，mojo::useragent的websocket client总是在不到一分钟内就进入on_finish状态，所以这里只好返回重连
        Mojo::IOLoop->stop;
        goto LABEL;
    });
    $tx->on(message => sub {
        my ($tx, $msg) = @_;
        if ( length( $msg ) > 5 ) {
            my $syslog = from_json( substr( $msg, 3 ) );
            notify( $syslog );
        };
    });
});
Mojo::IOLoop->start unless Mojo::IOLoop->is_running;

sub notify {
    my $data = $_;
    return if $data->[2] eq 'btn';
    exec("notify-send \"$data->[0] $data->[1]\" \"$data->[3] $data->[4]\"");
    # 注意设定-s 120，默认是175，念得飞快
    exec("espeak -vzh+f2 -s 120 \"$data->[1]\""); # 指定中文报ip，不然很难听懂
    # f是女生，m是男声，至于第几个声音，我没听出来多大差别，都跟九十年代初电影里的机器人一样
    exec("espeak -ven+m2 -s 120 \"$data->[3] $data->[4]\""); # 指定英文报内容，不然用中文的声音念更难听懂
};

以上抛砖引玉，大家可以试试Ekho(余音)，这是国人开发的真人语音TTS开源软件，还支持粤语，文言文等选择，汗……

【翻译】用ElasticSearch和Protovis实现数据可视化

2012-11-18T00:00:00+00:00

搜索引擎最重要的目的，嗯，不出意料就是搜索。你传给它一个请求，然后它依照相关性返回你一串匹配的结果。我们可以根据自己的内容创造各种请求结构，试验各种不同的分析器，搜索引擎都会努力尝试提供最好的结果。

不过，一个现代的全文搜索引擎可以做的比这个更多。因为它的核心是基于一个为了高效查询匹配文档而高度优化过的数据结构——倒排索引。它也可以为我们的数据完成复杂的聚合运算，在这里我们叫它facets。(不好翻译，后文对这个单词都保留英文)

facets通常的目的是提供给用户某个方面的导航或者搜索。当你在网上商店搜索“相机”，你可以选择不同的制造商，价格范围或者特定功能来定制条件，这应该就是点一下链接的事情，而不是通过修改一长串查询语法。

一个LinkedIn的导航范例如下图所示：

Facet搜索为数不多的几个可以把强大的请求能力开放给最终用户的办法之一，详见Moritz Stefaner的试验“Elastic Lists”，或许你会有更多灵感。

但是，除了链接和复选框，其实我们还能做的更多。比如利用这些数据画图，而这就是我们在这篇文章中要讲的。

实时仪表板

在几乎所有的分析、监控和数据挖掘服务中，或早或晚的你都会碰到这样的需求：“我们要一个仪表板！”。因为大家都爱仪表板，可能因为真的有用，可能单纯因为它漂亮~这时候，我们不用写任何OLAP实现，用facets就可以完成一个很漂亮很给力的分析引擎。

下面的截图就是从一个社交媒体监控应用上获取的。这个应用不单用ES来搜索和挖掘数据，还通过交互式仪表板提供数据聚合功能。

当用户深入数据，添加一个关键字，使用一个自定义查询，所有的图都会实时更新，这就是facet聚合的工作方式。仪表板上不是数据定期计算好的的静态快照，而是一个用于数据探索的真正的交互式工具。

在本文中，我们将会学习到怎样从ES中获取数据，然后怎么创建这些图表。

第一个图，我们用ES中比较简单的termsfacet来做。这个facet会返回一个字段中最常见的词汇和它的计数值。

首先我们先插入一些数据。

curl -X DELETE "http://localhost:9200/dashboard"
curl -X POST "http://localhost:9200/dashboard/article" -d '
             { "title" : "One",
               "tags"  : ["ruby", "java", "search"]}
'
curl -X POST "http://localhost:9200/dashboard/article" -d '
             { "title" : "Two",
               "tags"  : ["java", "search"] }
'
curl -X POST "http://localhost:9200/dashboard/article" -d '
             { "title" : "Three",
               "tags"  : ["erlang", "search"] }
'
curl -X POST "http://localhost:9200/dashboard/article" -d '
             { "title" : "Four",
               "tags"  : ["search"] }
'
curl -X POST "http://localhost:9200/dashboard/_refresh"

你们都看到了，我们存储了一些文章的标签，每个文章可以多个标签，数据以JSON格式发送，这也是ES的文档格式。

现在，要知道文档的十大标签，我们只需要简单的请求：

curl -X POST "http://localhost:9200/dashboard/_search?pretty=true" -d '
{
    "query" : { "match_all" : {} },

    "facets" : {
        "tags" : { "terms" : {"field" : "tags", "size" : 10} }
    }
}
'

你看到了，我接受所有文档，然后定义一个terms facet叫做“tags”。这个请求会返回如下样子的数据：

{
    "took" : 2,
    // ... snip ...
    "hits" : {
        "total" : 4,
        // ... snip ...
    },
    "facets" : {
        "tags" : {
            "_type" : "terms",
            "missing" : 1,
            "terms" : [
                { "term" : "search", "count" : 4 },
                { "term" : "java",   "count" : 2 },
                { "term" : "ruby",   "count" : 1 },
                { "term" : "erlang", "count" : 1 }
            ]
        }
    }
}

JSON中facets部分是我们关心的，特别是facets.tags.terms数组。它告诉我们有四篇文章打了search标签，两篇java标签，等等…….(当然，我们或许应该给请求添加一个size参数跳过前面的结果)

这种比例类型的数据最合适的可视化方案就是饼图，或者它的变体：油炸圈饼图。最终结果如下(你可能希望看这个可运行的实例)：

我们将使用Protovis一个JavaScript的数据可视化工具集。Protovis是100%开源的，你可以想象它是数据可视化方面的RoR。和其他类似工具形成鲜明对比的是，它没有附带一组图标类型来供你“选择”。而是定义了一组原语和一个灵活的DSL，这样你可以非常简单的创建自定义的可视化。创建饼图就非常简单。

因为ES返回的是JSON数据，我们可以通过Ajax调用加载它。不要忘记你可以clone或者下载实例的全部源代码。

首先需要一个HTML文件来容纳图标然后从ES里加载数据：

<!DOCTYPE html>
<html>
<head>
    <title>ElasticSearch Terms Facet Donut Chart</title>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

    <!-- Load JS libraries -->
    <script src="jquery-1.5.1.min.js"></script>
    <script src="protovis-r3.2.js"></script>
    <script src="donut.js"></script>
    <script>
        $( function() { load_data(); });

        var load_data = function() {
            $.ajax({   url: 'http://localhost:9200/dashboard/article/_search?pretty=true'
                     , type: 'POST'
                     , data : JSON.stringify({
                           "query" : { "match_all" : {} },

                           "facets" : {
                               "tags" : {
                                   "terms" : {
                                       "field" : "tags",
                                       "size"  : "10"
                                   }
                               }
                           }
                       })
                     , dataType : 'json'
                     , processData: false
                     , success: function(json, statusText, xhr) {
                           return display_chart(json);
                       }
                     , error: function(xhr, message, error) {
                           console.error("Error while loading data from ElasticSearch", message);
                           throw(error);
                       }
            });

            var display_chart = function(json) {
                Donut().data(json.facets.tags.terms).draw();
            };

        };
    </script>
</head>
<body>

  <!-- Placeholder for the chart -->
  <div id="chart"></div>

</body>
</html>

文档加载后，我们通过Ajax收到和之前curl测试中一样的facet。在jQuery的Ajaxcallback里我们通过封装的display_chart()把返回的JSON传给Donut()函数.

Donut()函数及注释如下：

// =====================================================================================================
// A donut chart with Protovis - See http://vis.stanford.edu/protovis/ex/pie.html
// =====================================================================================================
var Donut = function(dom_id) {

    if ('undefined' == typeof dom_id)  {                // Set the default DOM element ID to bind
        dom_id = 'chart';
    }

    var data = function(json) {                         // Set the data for the chart
        this.data = json;
        return this;
    };

    var draw = function() {

        var entries = this.data.sort( function(a, b) {  // Sort the data by term names, so the
            return a.term < b.term ? -1 : 1;            // color scheme for wedges is preserved
        }),                                             // with any order

        values  = pv.map(entries, function(e) {         // Create an array holding just the counts
            return e.count;
        });
        // console.log('Drawing', entries, values);

        var w = 200,                                    // Dimensions and color scheme for the chart
            h = 200,
            colors = pv.Colors.category10().range();

        var vis = new pv.Panel()                        // Create the basis panel
            .width(w)
            .height(h)
            .margin(0, 0, 0, 0);

        vis.add(pv.Wedge)                               // Create the "wedges" of the chart
            .def("active", -1)                          // Auxiliary variable to hold mouse over state
            .data( pv.normalize(values) )               // Pass the normalized data to Protovis
            .left(w/3)                                  // Set-up chart position and dimension
            .top(w/3)
            .outerRadius(w/3)
            .innerRadius(15)                            // Create a "donut hole" in the center
            .angle( function(d) {                       // Compute the "width" of the wedge
                return d * 2 * Math.PI;
             })
            .strokeStyle("#fff")                        // Add white stroke

            .event("mouseover", function() {            // On "mouse over", set the "wedge" as active
                this.active(this.index);
                this.cursor('pointer');
                return this.root.render();
             })

            .event("mouseout",  function() {            // On "mouse out", clear the active state
                this.active(-1);
                return this.root.render();
            })

            .event("mousedown", function(d) {           // On "mouse down", perform action,
                var term = entries[this.index].term;    // such as filtering the results...
                return (alert("Filter the results by '"+term+"'"));
            })


            .anchor("right").add(pv.Dot)                // Add the left part of he "inline" label,
                                                        // displayed inside the donut "hole"

            .visible( function() {                      // The label is visible when its wedge is active
                return this.parent.children[0]
                       .active() == this.index;
            })
            .fillStyle("#222")
            .lineWidth(0)
            .radius(14)

            .anchor("center").add(pv.Bar)               // Add the middle part of the label
            .fillStyle("#222")
            .width(function(d) {                        // Compute width:
                return (d*100).toFixed(1)               // add pixels for percents
                              .toString().length*4 +
                       10 +                             // add pixels for glyphs (%, etc)
                       entries[this.index]              // add pixels for letters (very rough)
                           .term.length*9;
            })
            .height(28)
            .top((w/3)-14)

            .anchor("right").add(pv.Dot)                // Add the right part of the label
            .fillStyle("#222")
            .lineWidth(0)
            .radius(14)


            .parent.children[2].anchor("left")          // Add the text to label
                   .add(pv.Label)
            .left((w/3)-7)
            .text(function(d) {                         // Combine the text for label
                return (d*100).toFixed(1) + "%" +
                       ' ' + entries[this.index].term +
                       ' (' + values[this.index] + ')';
            })
            .textStyle("#fff")

            .root.canvas(dom_id)                        // Bind the chart to DOM element
            .render();                                  // And render it.
    };

    return {                                            // Create the public API
        data   : data,
        draw   : draw
    };

};

现在你们看到了，一个简单的JSON数据转换，我们就可以创建出丰富的有吸引力的关于我们文章标签分布的可视化图标。完整的例子在这里。

当你使用完全不同的请求，比如显示某个特定作者的文章，或者特定日期内发表的文章，整个可视化都照样正常工作，代码是可以重用的。

Protovis让创建另一种常见的可视化类型也非常容易：时间线。任何类型的数据，只要和特定日期相关的，比如文章发表，事件发生，目标达成，都可以被可视化成时间线。

最终结果就像下面这样(同样可以看运行版)：

好了，让我们往索引里存一些带有发表日期的文章吧：

curl -X DELETE "http://localhost:9200/dashboard"
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "1",  "published" : "2011-01-01" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "2",  "published" : "2011-01-02" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "3",  "published" : "2011-01-02" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "4",  "published" : "2011-01-03" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "5",  "published" : "2011-01-04" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "6",  "published" : "2011-01-04" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "7",  "published" : "2011-01-04" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "8",  "published" : "2011-01-04" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "9",  "published" : "2011-01-10" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "10", "published" : "2011-01-12" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "11", "published" : "2011-01-13" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "12", "published" : "2011-01-14" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "13", "published" : "2011-01-14" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "14", "published" : "2011-01-15" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "15", "published" : "2011-01-20" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "16", "published" : "2011-01-20" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "17", "published" : "2011-01-21" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "18", "published" : "2011-01-22" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "19", "published" : "2011-01-23" }'
curl -X POST "http://localhost:9200/dashboard/article" -d '{ "t" : "20", "published" : "2011-01-24" }'
curl -X POST "http://localhost:9200/dashboard/_refresh"

我们用ES的date histogram facet来获取文章发表的频率。

curl -X POST "http://localhost:9200/dashboard/_search?pretty=true" -d '
{
    "query" : { "match_all" : {} },

    "facets" : {
        "published_on" : {
            "date_histogram" : {
                "field"    : "published",
                "interval" : "day"
            }
        }
    }
}
'

注意我们是怎么设置间隔为天的。这个很容易就可以替换成周，月，或者年。

请求会返回像下面这样的JSON：

{
    "took" : 2,
    // ... snip ...
    "hits" : {
        "total" : 4,
        // ... snip ...
    },
    "facets" : {
        "published" : {
            "_type" : "histogram",
            "entries" : [
                { "time" : 1293840000000, "count" : 1 },
                { "time" : 1293926400000, "count" : 2 }
                // ... snip ...
            ]
        }
    }
}

我们要注意的是facets.published.entries数组，和上面的例子一样。同样需要一个HTML页来容纳图标和加载数据。机制既然一样，代码就直接看这里吧。

既然已经有了JSON数据，用protovis创建时间线就很简单了，用一个自定义的area chart即可。

完整带注释的Timeline()函数如下：

// =====================================================================================================
// A timeline chart with Protovis - See http://vis.stanford.edu/protovis/ex/area.html
// =====================================================================================================

var Timeline = function(dom_id) {
    if ('undefined' == typeof dom_id) {                 // Set the default DOM element ID to bind
        dom_id = 'chart';
    }

    var data = function(json) {                         // Set the data for the chart
        this.data = json;
        return this;
    };

    var draw = function() {

        var entries = this.data;                        // Set-up the data
            entries.push({                              // Add the last "blank" entry for proper
              count : entries[entries.length-1].count   // timeline ending
            });
        // console.log('Drawing, ', entries);

        var w = 600,                                    // Set-up dimensions and scales for the chart
            h = 100,
            max = pv.max(entries, function(d) {return d.count;}),
            x = pv.Scale.linear(0, entries.length-1).range(0, w),
            y = pv.Scale.linear(0, max).range(0, h);

        var vis = new pv.Panel()                        // Create the basis panel
            .width(w)
            .height(h)
            .bottom(20)
            .left(20)
            .right(40)
            .top(40);

         vis.add(pv.Label)                              // Add the chart legend at top left
            .top(-20)
            .text(function() {
                 var first = new Date(entries[0].time);
                 var last  = new Date(entries[entries.length-2].time);
                 return "Articles published between " +
                     [ first.getDate(),
                       first.getMonth() + 1,
                       first.getFullYear()
                     ].join("/") +

                     " and " +

                     [ last.getDate(),
                       last.getMonth() + 1,
                       last.getFullYear()
                     ].join("/");
             })
            .textStyle("#B1B1B1")

         vis.add(pv.Rule)                               // Add the X-ticks
            .data(entries)
            .visible(function(d) {return d.time;})
            .left(function() { return x(this.index); })
            .bottom(-15)
            .height(15)
            .strokeStyle("#33A3E1")

            .anchor("right").add(pv.Label)              // Add the tick label (DD/MM)
            .text(function(d) {
                 var date = new Date(d.time);
                 return [
                     date.getDate(),
                     date.getMonth() + 1
                 ].join('/');
             })
            .textStyle("#2C90C8")
            .textMargin("5")

         vis.add(pv.Rule)                               // Add the Y-ticks
            .data(y.ticks(max))                         // Compute tick levels based on the "max" value
            .bottom(y)
            .strokeStyle("#eee")
            .anchor("left").add(pv.Label)
                .text(y.tickFormat)
                .textStyle("#c0c0c0")

        vis.add(pv.Panel)                               // Add container panel for the chart
           .add(pv.Area)                                // Add the area segments for each entry
           .def("active", -1)                           // Auxiliary variable to hold mouse state
           .data(entries)                               // Pass the data to Protovis
           .bottom(0)
           .left(function(d) {return x(this.index);})   // Compute x-axis based on scale
           .height(function(d) {return y(d.count);})    // Compute y-axis based on scale
           .interpolate('cardinal')                     // Make the chart curve smooth
           .segmented(true)                             // Divide into "segments" (for interactivity)
           .fillStyle("#79D0F3")

           .event("mouseover", function() {             // On "mouse over", set segment as active
               this.active(this.index);
               return this.root.render();
           })

           .event("mouseout",  function() {             // On "mouse out", clear the active state
               this.active(-1);
               return this.root.render();
           })

           .event("mousedown", function(d) {            // On "mouse down", perform action,
               var time = entries[this.index].time;     // eg filtering the results...
               return (alert("Timestamp: '"+time+"'"));
           })

           .anchor("top").add(pv.Line)                  // Add thick stroke to the chart
           .lineWidth(3)
           .strokeStyle('#33A3E1')

           .anchor("top").add(pv.Dot)                   // Add the circle "label" displaying
                                                        // the count for this day

           .visible( function() {                       // The label is only visible when
               return this.parent.children[0]           // its segment is active
                          .active() == this.index;
            })
           .left(function(d) { return x(this.index); })
           .bottom(function(d) { return y(d.count); })
           .fillStyle("#33A3E1")
           .lineWidth(0)
           .radius(14)

           .anchor("center").add(pv.Label)             // Add text to the label
           .text(function(d) {return d.count;})
           .textStyle("#E7EFF4")

           .root.canvas(dom_id)                        // Bind the chart to DOM element
           .render();                                  // And render it.
    };

    return {                                            // Create the public API
        data   : data,
        draw   : draw
    };

};

完整示例代码在这里。不过先去下载protovis提供的关于area的原始文档，然后观察当你修改interpolate('cardinal')成interpolate('step-after')后发生了什么。对于多个facet，画叠加的区域图，添加交互性，然后完全定制可视化应该都不是什么问题了。

重要的是注意，这个图表完全是根据你传递给ES的请求做出的响应，使得你有可能做到简单立刻的完成某项指标的可视化需求。比如“显示这个作者在这个主题上最近三个月的出版频率”。只需要提交这样的请求就够了：

 author:John AND topic:Search AND published:[2011-03-01 TO 2011-05-31]

总结

当你需要为复杂的自定义查询做一个丰富的交互式的数据可视化时，使用ES的facets应该是最容易的办法之一，你只需要传递ES的JSON响应给Protovis这样的工具就好了。

通过模仿本文中的方法和代码，你可以在几小时内给你的数据跑通一个示例。