跳到主要內容

Java Design - 可重複使用的Retry

Why...

當系統發生了例外情況時,夠強健的系統會重新嘗試(retry)發生問題的操作,最常見的例子就是連線中斷的重連。也有可能會另尋其它路徑,像是使用備援的系統或資料來源。一開始我採用了while/for loop的方式做retry,然而當這樣的程式碼夠多後,看了也挺令人厭煩的。Spring有提供RetryTemplate,讓你可以實做想要的Retry。但Spring實在太大包了,除非系統中一定會用到Spring,否則要包這個東西進去,也是挺OOXX的。

I Thinking & Trying

於是我開始嘗試著造輪子。我參考Reference的三篇文章,並設計了一個折中的方式,可以滿足大部分的需求(我需要的需求)。

  1. 設定重試次數
  2. 設定重試條件
  3. 設定重試延遲時間
  4. 可做Alternative操作

我參考了Reference中的三篇文章,設計了一個我認為好擴充與方便使用的RetryableTask類別,讓我可以將這些繁瑣的動作給包裝起來:

概念相當簡單:

  • RetryableTask負責執行這些retry的動作,它依賴於Callable、ISleepStrategy、IRetryablePolicy類別。
  • Callable類別讓Programmer將操作給包裝起來,管你是要從DB還是從檔案取資料,這裡就是提供功能的操作流程。
  • ISleepStrategy負責讓RetryableTask知道每次Retry時,需要先等待幾秒鐘。目前提供了BasicSleepStrategy(固定時間)與VariableSleepStrategy(變化時間)。
  • IRetryablePolicy會根據每次操作的結果,決定是否要Retry。這裡使用了Composite Pattern,讓你可以使用多個Policy去控制Retry策略。目前提供了AttemptRetryablePolicy(最大次數)、NullRetryablePolicy(不可為NULL)、ExceptioRetryablePolicy(例外情形)三種策略。

Programming

IRetryableTask

首先讓我們看看RetryableTask的member與constructor,預設是使用BasicSleepStrategy與ExceptioRetryablePolicy,當然也可以透過set method去更改。功能執行的主體則是透過Callable,Client必須把它的操作流程先實做好再丟進來。

private Callable<T> mCallable = null;
private Object mResult = null;
private ISleepStrategy mSleepStrategy = new BasicSleepStrategy();
private IRetryablePolicy mRetryablePolicy = new ExceptioRetryablePolicy();
 
public RetryableTask(Callable<T> callable){
	mCallable = callable;
}

接著是最核心的部分。基本上就是透過ISleepStrategy與IRetryablePolicy去控制流程,透過mCallable.call()去執行主要功能。萬一都重試失敗,就將結果回傳或將例外往上丟。(結果也許會由mCallable.call()回傳一個Default value)

@Override
public T call() throws Throwable {
	boolean isFirstTime = true;
	do {
		if(!isFirstTime && mSleepStrategy != null){
			ThreadUtil.sleep(mSleepStrategy.getSleepTime());
		}
		try {
			T result = mCallable.call();
			mResult = result;
		} catch( Exception e ){
			mResult = e;
		}
	} while( isNeedToRetry(mResult) );
 
	if( mResult instanceof Throwable ){
		throw (Throwable)mResult;
	}
	return (T)mResult;
}
 
private boolean isNeedToRetry(Object aData){
	if( mRetryablePolicy != null ){
		return mRetryablePolicy.needToRetry(aData);
	}
	return false;
}

ISleepStrategyISleepStrategy

就是實做每次Retry時,你要Sleep多久的規則而已。

public class VariableSleepStrategy implements ISleepStrategy {
 
	private int mCurrentIndex = 0;
	private long[] mSleepTimes;
	private int mMaxLenghth = 0;
 
	public VariableSleepStrategy(long[] sleepTimes){
		mMaxLenghth = sleepTimes.length;
		mSleepTimes = new long[mMaxLenghth];
		System.arraycopy(sleepTimes, 0, mSleepTimes, 0, mMaxLenghth);
	}
 
	@Override
	public long getSleepTime() {
		if( mCurrentIndex == mMaxLenghth ){
			throw new RuntimeException("Over the max length.");
		}
		return mSleepTimes[mCurrentIndex++];
	}
}

IRetryablePolicy

IRetryablePolicy會根據執行結果決定是否要Retry,我以ExceptionRetryablePolicy為例。ExceptionRetryablePolicy提供三個建構子,一個支援如果執行結果為Exception類別或子類別就要Retry;另外兩個會根據你給定的例外類別列表,結果有在其中才Retry。

public class ExceptionRetryablePolicy implements IRetryablePolicy {
 
	private List<Class<? extends Throwable>> mExceptinList = null;
 
	public ExceptionRetryablePolicy() {
		this(Exception.class);
	}
 
	public ExceptionRetryablePolicy(Class<? extends Throwable> throwableClass) {
		mExceptinList = new ArrayList<Class<? extends Throwable>>();
		mExceptinList.add(throwableClass);
	}
 
	public ExceptionRetryablePolicy(List<Class<? extends Throwable>> exceptinList) {
		mExceptinList = exceptinList;
	}
 
	@Override
	public boolean needToRetry(Object data) {
		if( data == null || mExceptinList == null )
			return false;
		for( Class<? extends Throwable> throwableClass : mExceptinList ){
			if( throwableClass.isInstance(data)){
				return true;
			}
		}
		return false;
	}
}

CompositeRetryablePolicy支援多個策略,像是你可以同時支援最大次數、例外情況或NULL情況。實做就是去呼叫各Policy的needToRetry去決定。

public class CompositeRetryablePolicy implements IRetryablePolicy {
 
	private List<IRetryablePolicy> mPolicyList = null;
 
	public CompositeRetryablePolicy(){
 
	}
 
	public CompositeRetryablePolicy(List<IRetryablePolicy> policyList){
		mPolicyList = policyList;
	}
 
	@Override
	public boolean needToRetry(Object data) {
		if( mPolicyList == null ){
			return false;
		}
		boolean needRetry = !mPolicyList.isEmpty();
		for( IRetryablePolicy policy : mPolicyList ){
			if(!policy.needToRetry(data)){
				needRetry = false;
			}
		}
		return needRetry;
	}
}

NullRetryablePolicy是在結果為NULL時,去做Retry;AttemptRetryablePolicy則是用來控制最大的重試次數。

Testing

我透過Powermock,並實做一個Alternative retry給大家看看。首先讓我們mock要呼叫的method: userDao1.getUser()與userDao2.getUser(),假設userDao1 from DB,userDao2 from file。userDao1為第一次執行使用,會拋出一個例外;userDao2在第二次使用,會回傳正確結果。

IUser user_expect = PowerMock.createMock(IUser.class);
 
String errorMsg = "Testing error msg";
final IUserDao userDao1 = PowerMock.createStrictMock(IUserDao.class);
userDao1.getUser(EasyMock.anyObject(String.class));
PowerMock.expectLastCall().andThrow(new RuntimeException(errorMsg)).once();
 
final IUserDao userDao2 = PowerMock.createStrictMock(IUserDao.class);
userDao2.getUser(EasyMock.anyObject(String.class));
PowerMock.expectLastCall().andReturn(user_expect).once();
 
PowerMock.replayAll();

Callable call()的實做透過userDao1與userDao2去交互執行,若userDao1.getUser執行失敗就會用userDao2.getUser。像要取得一個local port,也許就可以透過遞增或遞減port number去實做。

Callable<IUser> platformUtil = new Callable<IUser>() {
	private boolean switchFlag = true;
	@Override
	public IUser call() throws Exception {
		switchFlag = !switchFlag;
		if( !switchFlag )
			return userDao1.getUser("1234");
		else {
			return userDao2.getUser("1234");
		}
	}
};

RetryableTask的部分使用了AttemptRetryablePolicy與ExceptionRetryablePolicy,要求重試次數小於3且發生例外時要Retry。最後我們期望的是能夠透過userDao2.getUser取得與user_expect相同的結果,因此使用了PowerMock.verifyAll()去確認那些mock object都有被呼叫到。

IRetryableTask<IUser> retryableTask = new RetryableTask<IUser>(platformUtil);
IRetryablePolicy compositeRetryablePolicy = new CompositeRetryablePolicy(Arrays.asList(new IRetryablePolicy[]{
		new AttemptRetryablePolicy(3),
		new ExceptionRetryablePolicy()
}));
retryableTask.setRetryablePolicy(compositeRetryablePolicy);
try {
	assertEquals(user_expect, retryableTask.call());
} catch (Throwable e) {
	fail();
}
 
PowerMock.verifyAll();

Summary

就目前的需求,這是我所能想到的設計。也許可以把更多的東西做抽像化來增加更多的擴充性,但是目前這樣就能滿足我了。

友藏內心獨白: 有先請教過學姐,再稍稍做修改。也許還達不到最令人滿意的設計。

Reference

留言

這個網誌中的熱門文章

解決RobotFramework從3.1.2升級到3.2.2之後,Choose File突然會整個Hand住的問題

考慮到自動測試環境的維護,我們很久以前就使用java去執行robot framework。前陣子開始處理從3.1.2升級到3.2.2的事情,主要先把明確的runtime語法錯誤與deprecate item處理好,這部分內容可以參考: link 。 直到最近才發現,透過SeleniumLibrary執行Choose File去上傳檔案的動作,會導致測試案例timeout。本篇文章主要分享心路歷程與解決方法,我也送了一條issue給robot framework: link 。 我的環境如下: RobotFramework: 3.2.2 Selenium: 3.141.0 SeleniumLibrary: 3.3.1 Remote Selenium Version: selenium-server-standalone-3.141.59 首先並非所有Choose File的動作都會hang住,有些測試案例是可以執行的,但是上傳一個作業系統ISO檔案一定會發生問題。後來我透過wireshark去比對新舊版本的上傳動作,因為我使用 Remote Selenium ,所以Selenium會先把檔案透過REST API發送到Remote Selenium Server上。從下圖我們可以發現,在3.2.2的最後一個TCP封包,比3.1.2大概少了500個bytes。 於是就開始了我trace code之路。包含SeleniumLibrary產生要送給Remote Selenium Server的request內容,還有HTTP Content-Length的計算,我都確認過沒有問題。 最後發現問題是出在socket API的使用上,就是下圖的這支code: 最後發現可能因為開始使用nio的方式送資料,但沒處理到尚未送完的資料內容,而導致發生問題。加一個loop去做計算就可以解決了。 最後我有把解法提供給robot framework官方,在他們出新的版本之前,我是將改完的_socket.py放在我們自己的Lib底下,好讓我們測試可以正常進行。(shutil.py應該也是為了解某個bug而產生的樣子..)

第一次寫MIB就上手

SNMP(Simple Network Management Protocol)是用來管理網路設備的一種Protocol,我對它的認識也是從工作接觸開始。雖說是管理網路設備,但是主機、電源供應器、RAID等也都可以透過它來做管理。如果你做了一個應用程式,當然所有的操作也都可以透過SNMP來完成,不過可能會很痛苦。前陣子遇到一個學弟,它告訴我說:「我可能不會想寫程式。」為什麼? 因為這是他痛苦的根源。 在這篇文章中,不是要告訴你SNMP是什麼,會看這篇文章的大哥們,應該已經對SNMP有些認識了。 是的!主題是MIB(Management information base)! 對於一個3th-party的SNMP oid,有MIB可以幫助你去了解它所提供的資訊是什麼,且可以對它做什麼操作。最近我運氣很好剛好做到關於修改MIB的工作,也讓我順便了解一下它的語法,接下來我要交給大家MIB的基礎認識。 smidump 我並非使用什麼高強的Editor去編寫MIB,我僅透過Nodepad++編輯和smidump編譯而已。smidump是Kay教我使用的一個將MIB module轉成樹狀結構或oid列表的工具,唯一的缺點是不會告訴你哪一行打錯。當然有錢直接買編輯樹狀結構的工具就可以不需要了解語法了! 安裝 在Ubuntu上可先輸入smidump確認是否安裝,如果沒安裝可透過apt-get install libsmi2ldbl安裝。(CentOS可以透過yum install libsmi) root@tonylin:~/multi-boot-server# smidump The program 'smidump' is currently not installed. You can install it by typing: apt-get install libsmi2ldbl 使用 透過下面兩行指令,就可以將mib file產生出對應的tree與oid列表的檔案。也可以透過這個結果確認MIB是不是你想要的。 smidump -f tree example1.mib > xtree.txt smidump -f identifiers example1.mib > xiden.txt 如果有參考其它檔案要加上p的參數: smidum...

Windows DLL - 32-bit dll with 64-bit driver

前言 在64-bit作業系統上所使用的驅動程式,一定是64-bit,然而應用程式卻可能是32或64-bit。當32-bit應用程式傳值給驅動程式時是有可能會發生溢位的。主要原因是32與64-bit指標所佔用記憶體長度的不同。接下來我將透過Reference 1中的程式PhyMem,來告訴大家問題在哪與如何修改。(最後改完的程式碼恕我不提供) PhyMem介紹 這是一個中國人寫的程式。作用與WinIO相同,可以存取windows的io port與physical memory。這個程式包含pmdll、driver與test三個專案,分別產生dll、sys與exe。作者僅提供32-bit的版本,但只要修改編譯設定就可以讓它產生出64-bit的artifact。但如同我前言所說,如果你是32-bit的dll要存取64的sys該怎麼辦? 可以規定User在64-bit的OS用64-bit的應用程式就好了阿! 但是將一個32-bit應用程式改為64-bit的有這麼簡單嗎? 除此之外,中間傳遞的資料型態也會影響到正常功能。 設定driver專案 我開發環境是VC2008與DDK6000,下載Reference1的專案是無法直接編譯的,可以參考我的設定去修改編譯、連結參數。輸出檔可以看個人需求,根據32或64命名,或者是用同一個檔案名稱。 32-bit C/C++ > 一般 > 其它Include目錄($(DDKROOT)為設定於環境變數的DDK安裝目錄): $(DDKROOT)\inc\ddk";"$(DDKROOT)\inc\api";"$(DDKROOT)\inc\crt";"$(DDKROOT)\inc\crt\gl";"$(DDKROOT)\inc\crt\sys" 連結器 > 一般 > 其它程式庫目錄: $(DDKROOT)\lib\wnet\i386。 連結器 > 資訊清單檔: 將產生資訊清單與UAC選擇否,因為這不適用於driver。 連結器 > 進階 > 隨機化的基底位置: 選擇預設。 64-bit Reference1僅提供32-bit設定。64-bit可在建置>組態管理員中,新增x64平台,而設定檔可從win32複製過來修...