跳到主要內容

Clonezilla Live in DRBL

源起

某一次我將DRBL Server從舊型的主機板移到新型的主機板上,過程中遇到了不少奇怪的問題。可能是由於新主機板用到比較新的晶片且速度較快。這是我移機一開始所碰到的兩個問題:

  • 我掛載硬碟到備份還原使用的/home/partimag/上。Client在備份還原時,有時/home/partimag會是掛載之前的資料,導致找不到對應的images。後來我透過mount指令,發現/home在/home/partimag後才mount。所以我透過修改client的/etc/fstab,並將mount /home給註解,又稱了好幾天。
  • 回原時常出現unable to find target partition “sda1”,還原就因此中斷。這都發生在RHEL系列的作業系統要還原到其它種類作業系統時。在那之後檢查/dev/sda1的確是不存在的,但卻出現/dev/dm-0與/dev/dm-1。
和DRBL作者Steven討論我發現的情況後,猜測可能是Ubuntu Kernel反應不及與平行開機的問題,於是他建議我更新Ubuntu Kernel且透過Clonezilla Live的方式去做備份還原。

使用

要使用Clonezilla Live 模式,一樣執行/opt/drbl/sbin/drblpush -i去做config。照之前的選擇直到選擇DRBL的模式,讓我們選擇3: Clonezilla Live模式:
接著選擇要使用的版本。由於我們的版子都使用比較新的晶片,因此我選擇用Ubuntu-based的Clonezilla Live image:
在之後的DRBL設定步驟中,它會自行去下載最新的Clonezilla Live image下來安裝。

問題

在上述配置後,一般的User應該都可以正常使用了。但是我卻又碰到兩個問題(多災多難):

  1. 網路不通,無法透過NFS掛載Server上的image資料夾。後來透過dmesg | grep eth指令檢查網卡相關資訊,並發現它的script會在多張網卡情況下發生問題。在發生這問題後,Steven也很有意思,沒多久就改了新版給我,確實也可以解決這個問題。更新它給我的iso,是透過這個指令:
    /opt/drbl/sbin/drbl-ocs-live-prep -i clonezilla-live-1.2.11-47-i686-pae.iso
  2. 雖然現在多張網卡雖然都被找到,但依然無法掛載NFS。我的網路卡eth0是公司網路,eth1是DRBL網路,從螢幕上發現它只啟動了eth0就去掛載eth1網段的nfs,當然會有問題!後來我透過修改它xpe的設定,多加入了live-netdev,並指定為eth1。主要原因是/scripts/live-premount/select_eth_device會去確認這個參數。
    APPEND initrd=Clonezilla-live-initrd.img boot=live hostname=oneiric config quiet noswap nolocales edd=on nomodeset ocs_live_run="ocs-live-general" ocs_live_extra_param="" ocs_live_keymap="" ocs_live_batch="no" ocs_lang="" video=uvesafb:mode_option=800x600-16 nosplash noprompt netboot=nfs nfsroot=10.68.0.254:/tftpboot/node_root/clonezilla-live/ ocs_server="10.68.0.254"
一直這樣執行好幾個月都非常的順利。直到最近又因為手賤去更新Clonezilla Live才又無法正常執行,出現錯誤是sudo locales tzdata upstart-tty keyboard-configuration initramfs-tools unil-linux login openssh-server umountfs.。只要在pxe append內加入ip=frommedia就解決了。

總結

用了Clonezilla Live後,果然順了很多。這次變更也讓我知道: 在穩定的時候,不要亂改設定與硬體阿!

後記-20181223

為了支援新板子,在更新20180812-bionic clonezilla live後,發生This Live System image failed to boot的問題。這個問題是由於較新的linux kernel會根據網卡的種類去顯示裝置名稱,原本的eth*會變成eno*,導致指定live-netdev會有問題。經過實驗,只要加入以下參數,就可以讓名稱維持eth開頭:
net.ifnames=0
在順利讀取clonezilla live後,會卡在keyboard configuration的畫面,可以加以下參數讓它直接使用預設keybaord layout:
keyboard-layouts=NONE
除此之外,由於我有兩張網卡,但我發現drbl使用非預期的網卡ip去mount nfs。針對這個問題,可以修改/opt/drbl/conf/drbl-ocs.conf: (新版本可能要改/etc/drbl/drbl-ocs.conf)
ocs_prerun_for_pxe_ocs_live="mount -t nfs 10.68.0.254:/home/drbl_partimag/ /home/partimag"
它預設會使用第一張網卡的IP。

目前使用的參數

要修改/tftpboot/nbi_img/pxelinux.cfg/default:

APPEND initrd=Clonezilla-live-initrd.img boot=live hostname=bionic config quiet noswap nolocales edd=on nomodeset ocs_live_run="ocs-live-general" ocs_live_extra_param="" ocs_live_keymap="" ocs_live_batch="no" ocs_lang="" video=uvesafb:mode_option=800x600-16 nosplash noprompt netboot=nfs nfsroot=10.68.0.254:/tftpboot/node_root/clonezilla-live/ ocs_server="10.68.0.254" live-netdev=eth1 ip=frommedia net.ifnames=0 keyboard-layouts=NONE
APPEND initrd=Clonezilla-live-initrd.img boot=live union=aufs noswap noprompt nolocales vga=788 netboot=nfs nfsroot=10.68.0.254:/tftpboot/node_root/clonezilla-live/ ocs_server="10.68.0.254" net.ifnames=0 live-netdev=eth1 keyboard-layouts=NONE

2023-01-13

 APPEND initrd=Clonezilla-live-initrd.img boot=live hostname=oneiric config noswap nolocales edd=on nomodeset ocs_live_extra_param="" ocs_live_keymap="NONE" ocs_live_batch="no" ocs_lang="en_US.UTF-8" nosplash noprompt netboot=nfs nfsroot=10.68.0.254:/tftpboot/node_root/clonezilla-live/ ocs_server="10.68.0.254" live-netdev=eth1 ip=frommedia net.ifnames=0 biosdevname=0 keyboard-layouts=NONE ocs_daemonon="ssh" ocs_prerun="mount -t nfs 10.68.0.254:/home/drbl_partimag/ /home/partimag"

Reference

留言

這個網誌中的熱門文章

解決RobotFramework從3.1.2升級到3.2.2之後,Choose File突然會整個Hand住的問題

考慮到自動測試環境的維護,我們很久以前就使用java去執行robot framework。前陣子開始處理從3.1.2升級到3.2.2的事情,主要先把明確的runtime語法錯誤與deprecate item處理好,這部分內容可以參考: link 。 直到最近才發現,透過SeleniumLibrary執行Choose File去上傳檔案的動作,會導致測試案例timeout。本篇文章主要分享心路歷程與解決方法,我也送了一條issue給robot framework: link 。 我的環境如下: RobotFramework: 3.2.2 Selenium: 3.141.0 SeleniumLibrary: 3.3.1 Remote Selenium Version: selenium-server-standalone-3.141.59 首先並非所有Choose File的動作都會hang住,有些測試案例是可以執行的,但是上傳一個作業系統ISO檔案一定會發生問題。後來我透過wireshark去比對新舊版本的上傳動作,因為我使用 Remote Selenium ,所以Selenium會先把檔案透過REST API發送到Remote Selenium Server上。從下圖我們可以發現,在3.2.2的最後一個TCP封包,比3.1.2大概少了500個bytes。 於是就開始了我trace code之路。包含SeleniumLibrary產生要送給Remote Selenium Server的request內容,還有HTTP Content-Length的計算,我都確認過沒有問題。 最後發現問題是出在socket API的使用上,就是下圖的這支code: 最後發現可能因為開始使用nio的方式送資料,但沒處理到尚未送完的資料內容,而導致發生問題。加一個loop去做計算就可以解決了。 最後我有把解法提供給robot framework官方,在他們出新的版本之前,我是將改完的_socket.py放在我們自己的Lib底下,好讓我們測試可以正常進行。(shutil.py應該也是為了解某個bug而產生的樣子..)

第一次寫MIB就上手

SNMP(Simple Network Management Protocol)是用來管理網路設備的一種Protocol,我對它的認識也是從工作接觸開始。雖說是管理網路設備,但是主機、電源供應器、RAID等也都可以透過它來做管理。如果你做了一個應用程式,當然所有的操作也都可以透過SNMP來完成,不過可能會很痛苦。前陣子遇到一個學弟,它告訴我說:「我可能不會想寫程式。」為什麼? 因為這是他痛苦的根源。 在這篇文章中,不是要告訴你SNMP是什麼,會看這篇文章的大哥們,應該已經對SNMP有些認識了。 是的!主題是MIB(Management information base)! 對於一個3th-party的SNMP oid,有MIB可以幫助你去了解它所提供的資訊是什麼,且可以對它做什麼操作。最近我運氣很好剛好做到關於修改MIB的工作,也讓我順便了解一下它的語法,接下來我要交給大家MIB的基礎認識。 smidump 我並非使用什麼高強的Editor去編寫MIB,我僅透過Nodepad++編輯和smidump編譯而已。smidump是Kay教我使用的一個將MIB module轉成樹狀結構或oid列表的工具,唯一的缺點是不會告訴你哪一行打錯。當然有錢直接買編輯樹狀結構的工具就可以不需要了解語法了! 安裝 在Ubuntu上可先輸入smidump確認是否安裝,如果沒安裝可透過apt-get install libsmi2ldbl安裝。(CentOS可以透過yum install libsmi) root@tonylin:~/multi-boot-server# smidump The program 'smidump' is currently not installed. You can install it by typing: apt-get install libsmi2ldbl 使用 透過下面兩行指令,就可以將mib file產生出對應的tree與oid列表的檔案。也可以透過這個結果確認MIB是不是你想要的。 smidump -f tree example1.mib > xtree.txt smidump -f identifiers example1.mib > xiden.txt 如果有參考其它檔案要加上p的參數: smidum...

Windows DLL - 32-bit dll with 64-bit driver

前言 在64-bit作業系統上所使用的驅動程式,一定是64-bit,然而應用程式卻可能是32或64-bit。當32-bit應用程式傳值給驅動程式時是有可能會發生溢位的。主要原因是32與64-bit指標所佔用記憶體長度的不同。接下來我將透過Reference 1中的程式PhyMem,來告訴大家問題在哪與如何修改。(最後改完的程式碼恕我不提供) PhyMem介紹 這是一個中國人寫的程式。作用與WinIO相同,可以存取windows的io port與physical memory。這個程式包含pmdll、driver與test三個專案,分別產生dll、sys與exe。作者僅提供32-bit的版本,但只要修改編譯設定就可以讓它產生出64-bit的artifact。但如同我前言所說,如果你是32-bit的dll要存取64的sys該怎麼辦? 可以規定User在64-bit的OS用64-bit的應用程式就好了阿! 但是將一個32-bit應用程式改為64-bit的有這麼簡單嗎? 除此之外,中間傳遞的資料型態也會影響到正常功能。 設定driver專案 我開發環境是VC2008與DDK6000,下載Reference1的專案是無法直接編譯的,可以參考我的設定去修改編譯、連結參數。輸出檔可以看個人需求,根據32或64命名,或者是用同一個檔案名稱。 32-bit C/C++ > 一般 > 其它Include目錄($(DDKROOT)為設定於環境變數的DDK安裝目錄): $(DDKROOT)\inc\ddk";"$(DDKROOT)\inc\api";"$(DDKROOT)\inc\crt";"$(DDKROOT)\inc\crt\gl";"$(DDKROOT)\inc\crt\sys" 連結器 > 一般 > 其它程式庫目錄: $(DDKROOT)\lib\wnet\i386。 連結器 > 資訊清單檔: 將產生資訊清單與UAC選擇否,因為這不適用於driver。 連結器 > 進階 > 隨機化的基底位置: 選擇預設。 64-bit Reference1僅提供32-bit設定。64-bit可在建置>組態管理員中,新增x64平台,而設定檔可從win32複製過來修...