跳到主要內容

Cacti介紹

Cacti提供監控SNMP流量與系統資訊,也可外掛script與template來產生多種監控圖表。

Installation

網路上可以找到不少的安裝流程,如相關資源3,我使用的是Ubuntu,所以只要apt-get install cacti和mysql config即可。我另外還安裝phpmyadmin,這會讓我安心些。第一次連至cacti會出現installation畫面,只要稍為看一下cacti偵測的資訊與設定的資料庫資訊是否正確即可。第一次登入使用的帳號密碼為admin/admin,登入後會要求你修改密碼。

Device

首先加要Monitor的Device。基本操作Cacti中文研究站有說明,我也不再贅述。我認為要注意的部分有幾個: Builtin的Host Template中,Local Linux Machine僅能用在localhost上。Cacti算是一種Agentless的監控軟體,而大部分的監控功能都是透過snmpget。如果要透過wmi或shellscript等外部程式方式,可以裝nagios plugin。

Graph

目前我使用的Graph設定方式,共有兩種。第一種是必須先建立Data Source再建立Graph: 舉例來說,我想要監控記憶體的使用量,我必須先選擇ucd/net - Memory - Buffers、ucd/net - Memory - Cache與ucd/net - Memory - Free的Data Source。

接著到Graph Management新增ucd/net - Memory Usage,如下圖,要選擇對應的data source才會有資料。
第二種必須透過Data Query的方式,可以參考Cacti中文研究站。如下面的範例是在監控CPU使用量,這台主機有8個core,我選擇想監控的core,再點擊右下create鍵去產生graph。因為core 0和core 1已經在被建立過graph,所以UI呈現灰色不讓使用者點擊。

Summary

除了我上述的,Cacti還提供客制data與graph template的功能,但要如何使用需要花點時間研究,這也不是我涉略範圍。官網上可以找到別人做好的plugin與template,不乏針對Apache、Mysql、Oracle等應用程式的效能監控,與基於lm-sensor去監控硬體資訊,還有許多針對各大廠所硬體所客制化的template。對於發生問題的機器,也可以透過安裝threshold或alert的plugin,寄送通知給管理者。有哪些好用的plugin與template,就交由使用者們去費心思研究了! 另外我必須提醒一下,許多的template有著作業系統相依性,使用時必須注意,避免圖一直產生不出來。
發自內心的獨白: 要使用這個軟體的人,需要對於作業系統、script、snmp等知識有一定程度的認識才能使用的。

Related Resource

Template

Memory

CPU

Process

Disk

Common

  • Win32 System Stats,可以看到每秒鐘的context switch與system call的數量。
  • Builtin-ucd/net - Load Average,只能用於Linux。

留言

這個網誌中的熱門文章

解決RobotFramework從3.1.2升級到3.2.2之後,Choose File突然會整個Hand住的問題

考慮到自動測試環境的維護,我們很久以前就使用java去執行robot framework。前陣子開始處理從3.1.2升級到3.2.2的事情,主要先把明確的runtime語法錯誤與deprecate item處理好,這部分內容可以參考: link 。 直到最近才發現,透過SeleniumLibrary執行Choose File去上傳檔案的動作,會導致測試案例timeout。本篇文章主要分享心路歷程與解決方法,我也送了一條issue給robot framework: link 。 我的環境如下: RobotFramework: 3.2.2 Selenium: 3.141.0 SeleniumLibrary: 3.3.1 Remote Selenium Version: selenium-server-standalone-3.141.59 首先並非所有Choose File的動作都會hang住,有些測試案例是可以執行的,但是上傳一個作業系統ISO檔案一定會發生問題。後來我透過wireshark去比對新舊版本的上傳動作,因為我使用 Remote Selenium ,所以Selenium會先把檔案透過REST API發送到Remote Selenium Server上。從下圖我們可以發現,在3.2.2的最後一個TCP封包,比3.1.2大概少了500個bytes。 於是就開始了我trace code之路。包含SeleniumLibrary產生要送給Remote Selenium Server的request內容,還有HTTP Content-Length的計算,我都確認過沒有問題。 最後發現問題是出在socket API的使用上,就是下圖的這支code: 最後發現可能因為開始使用nio的方式送資料,但沒處理到尚未送完的資料內容,而導致發生問題。加一個loop去做計算就可以解決了。 最後我有把解法提供給robot framework官方,在他們出新的版本之前,我是將改完的_socket.py放在我們自己的Lib底下,好讓我們測試可以正常進行。(shutil.py應該也是為了解某個bug而產生的樣子..)

第一次寫MIB就上手

SNMP(Simple Network Management Protocol)是用來管理網路設備的一種Protocol,我對它的認識也是從工作接觸開始。雖說是管理網路設備,但是主機、電源供應器、RAID等也都可以透過它來做管理。如果你做了一個應用程式,當然所有的操作也都可以透過SNMP來完成,不過可能會很痛苦。前陣子遇到一個學弟,它告訴我說:「我可能不會想寫程式。」為什麼? 因為這是他痛苦的根源。 在這篇文章中,不是要告訴你SNMP是什麼,會看這篇文章的大哥們,應該已經對SNMP有些認識了。 是的!主題是MIB(Management information base)! 對於一個3th-party的SNMP oid,有MIB可以幫助你去了解它所提供的資訊是什麼,且可以對它做什麼操作。最近我運氣很好剛好做到關於修改MIB的工作,也讓我順便了解一下它的語法,接下來我要交給大家MIB的基礎認識。 smidump 我並非使用什麼高強的Editor去編寫MIB,我僅透過Nodepad++編輯和smidump編譯而已。smidump是Kay教我使用的一個將MIB module轉成樹狀結構或oid列表的工具,唯一的缺點是不會告訴你哪一行打錯。當然有錢直接買編輯樹狀結構的工具就可以不需要了解語法了! 安裝 在Ubuntu上可先輸入smidump確認是否安裝,如果沒安裝可透過apt-get install libsmi2ldbl安裝。(CentOS可以透過yum install libsmi) root@tonylin:~/multi-boot-server# smidump The program 'smidump' is currently not installed. You can install it by typing: apt-get install libsmi2ldbl 使用 透過下面兩行指令,就可以將mib file產生出對應的tree與oid列表的檔案。也可以透過這個結果確認MIB是不是你想要的。 smidump -f tree example1.mib > xtree.txt smidump -f identifiers example1.mib > xiden.txt 如果有參考其它檔案要加上p的參數: smidum...

升級SeleniumLibrary到4.5.0與Selenium到3.141.0

最近我們將RobotFramework升級至4.1.2,因為Jython的關係這個是目前可以使用Java執行的最後版本。 我們目前Selenium相關的Libraries版本如下: Selenium2Library - 3.0.0 (Latest, https://github.com/robotframework/Selenium2Library ) SeleniumLibrary - 3.0.0 ( https://github.com/robotframework/SeleniumLibrary/releases ) Selenium - 3.8.0 其中Selenium2Library已經沒在維護,也是最後一個版本,它所做的事情僅僅是把keyword forward給SeleniumLibrary。所以升級重點在SeleniumLibrary與Selenium。 而要升級這些Libraries,最重要的就是要知道它們彼此之間的相依,還有python版本的支援度。在我查詢套件的release note之後,因為4.1.2版本的jython只能支援到python 2.7.x,所以能升級的版本就有限制。其中SeleniumLibrary的情況如下: SeleniumLibrary 5.0.0 - 不支援Python 2 and Jython  SeleniumLibrary 4.5.0 - Python 2.7 and Selenium 3.141.0+  SeleniumLibrary 3.3.1 - Python 2.7 and Selenium 3.4+ 所以搭配了Selenium後,以下為我的第一個升級計畫: Selenium - 3.141.0 SeleniumLibrary - 3.3.。主要想確定是否會有deprecated items產生。 升級方式就是把以上原始碼丟到Lib底下,執行robot測試的時候會透過jython重新編譯。在我執行後,出現了urllib3找不到的問題: 我想可能是原本的套件中有包含urllib3,因此我到urllib3的package網站查了release note,找了可以匹配python 2.7的版本: urllib3 - 1.26.20 (https://pypi.org/project/...