跳到主要內容

ShellScript-找尋被佔用的Port

現在大部分的軟體,不管是對內或對外,都有可能會使用到主機的port來做為溝通管道。我的故事是這樣子的: 某個軟體移除後再安裝,有時候會安裝不起來。原因是前一次的連線還沒釋放。 為了解決這個問題,我們可以在安裝之前透過kill指令將佔用port的process砍掉。但如果User已經安裝了這個軟體,又使用同一個port,我們該怎麼辦?

針對這個問題可以透過netstat -na指令去確認port是否有被使用,原先所使用的判別方式是確認結果是否有包含:{port_number},但這樣的方式並不正確。以netstat指令而言,它所會顯示的結果如下:

Proto Recv-Q Send-Q Local Address           Foreign Address         State
tcp        0      0 0.0.0.0:139             0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:5900            0.0.0.0:*               LISTEN
tcp        0      0 192.168.12.131:22       192.168.12.130:60852    ESTABLISHED
tcp        0      0 192.168.12.131:22       192.168.12.130:62760    ESTABLISHED
tcp        0      0 127.0.0.1:32001         127.0.0.1:31001         ESTABLISHED
tcp       38      0 192.168.12.131:49830    91.189.89.106:443       CLOSE_WAIT
tcp        1      0 192.168.12.131:45602    91.189.89.31:80         CLOSE_WAIT
netstat分為Local Address與Foreign Address,主機連線所使用的是Local Address,而連這個位置的叫Foreign Address。以上面的例子來說,127.0.0.1:32001的Local Address連線來源為91.189.89.106:443,目前連線已經建立;而0.0.0.0:139的Local Address,還在等待建立中。因此,如果我們儘判斷:{port_number}是否在這坨字串中,可能會判斷到Foreign Address。
我提供了兩個解決方法,第一個方法是使用fuser。我們直接以例子來說明。假設被佔用的port是tcp 80,可以透過fuser -u 80/tcp去確認是否有對應的pid,也可以得知這個port是否有被佔用。我想不可能會有幽靈port出現吧? 如下圖,可以發現總共有11個process在使用80 port。 (這裡要注意的是: pid屬於stdout,其它的都是sdterr。)
fuser -u 80/tcp
80/tcp:               1811(root)  4919(www-data)  4922(www-data)  5100(www-data)  5101(www-data)  
8576(www-data)  8577(www-data)  8578(www-data)  8580(www-data) 22278(www-data) 22283(www-data)
第二個解決方法,是透過netstat指令並取出Local Address欄位的值判斷。首先將netstat -na | grep “:$1 “的結果存成array(以\n分割),接著透過for loop再將各行內容取出第四個項目,如果有:$1也代表著主機正占用著這個port。
#! /bin/sh
IFS=$'\n'
netstat_list=(`netstat -na | grep ":$1 "`)
 
for netstat_line in ${netstat_list[@]}; do
  IFS=' '
  netstat_item=($netstat_line)
  echo ${netstat_item[4]} | grep ":$1"
done
用awk可以簡化上面的script:
netstat -na | awk '{print $5}' | grep $1
額外贈送給大家windows上該如何做,以確認80 port為例:
for /f "tokens=2" %i in ('"netstat -na | findstr :80"') do echo %i

後記

留言

這個網誌中的熱門文章

Show NIC selection when setting the network command with the device option

 Problem  在answer file中設定網卡名稱後,安裝時會停在以下畫面: 所使用的command參數如下: network --onboot = yes --bootproto =dhcp --ipv6 =auto --device =eth1 Diagnostic Result 這樣的參數,以前試驗過是可以安裝完成的。因此在發生這個問題後,我檢查了它的debug console: 從console得知,eth1可能是沒有連接網路線或者是網路太慢而導致的問題。後來和Ivy再三確認,有問題的是有接網路線的網卡,且問題是發生在activate階段: Solution 我想既然有retry應該就有次數或者timeout限制,因此發現在Anaconda的說明文件中( link ),有提到dhcptimeout這個boot參數。看了一些人的使用範例,應該是可以直接串在isolinux.cfg中,如下: default linux ksdevice = link ip =dhcp ks =cdrom: / ks.cfg dhcptimeout = 90 然而我在RHEL/CentOS 6.7與6.8試驗後都無效。 因此我就拿了顯示的錯誤字串,問問Google大師,想找一下Anaconda source code來看一下。最後找到別人根據Anaconda code修改的版本: link ,關鍵在於setupIfaceStruct函式中的setupIfaceStruct與readNetConfig: setupIfaceStruct: 會在dhcp時設定dhcptimeout。 readNetConfig: 在writeEnabledNetInfo將timeout寫入dhclient config中;在wait_for_iface_activation內會根據timeout做retry。 再來從log與code可以得知,它讀取的檔案是answer file而不是boot command line。因此我接下來的測試,就是在answer file的network command上加入dhcptimeout: network --onboot = yes --bootproto =dhcp --ipv6 =auto --device =eth1 --dhcptimeo

解決RobotFramework從3.1.2升級到3.2.2之後,Choose File突然會整個Hand住的問題

考慮到自動測試環境的維護,我們很久以前就使用java去執行robot framework。前陣子開始處理從3.1.2升級到3.2.2的事情,主要先把明確的runtime語法錯誤與deprecate item處理好,這部分內容可以參考: link 。 直到最近才發現,透過SeleniumLibrary執行Choose File去上傳檔案的動作,會導致測試案例timeout。本篇文章主要分享心路歷程與解決方法,我也送了一條issue給robot framework: link 。 我的環境如下: RobotFramework: 3.2.2 Selenium: 3.141.0 SeleniumLibrary: 3.3.1 Remote Selenium Version: selenium-server-standalone-3.141.59 首先並非所有Choose File的動作都會hang住,有些測試案例是可以執行的,但是上傳一個作業系統ISO檔案一定會發生問題。後來我透過wireshark去比對新舊版本的上傳動作,因為我使用 Remote Selenium ,所以Selenium會先把檔案透過REST API發送到Remote Selenium Server上。從下圖我們可以發現,在3.2.2的最後一個TCP封包,比3.1.2大概少了500個bytes。 於是就開始了我trace code之路。包含SeleniumLibrary產生要送給Remote Selenium Server的request內容,還有HTTP Content-Length的計算,我都確認過沒有問題。 最後發現問題是出在socket API的使用上,就是下圖的這支code: 最後發現可能因為開始使用nio的方式送資料,但沒處理到尚未送完的資料內容,而導致發生問題。加一個loop去做計算就可以解決了。 最後我有把解法提供給robot framework官方,在他們出新的版本之前,我是將改完的_socket.py放在我們自己的Lib底下,好讓我們測試可以正常進行。(shutil.py應該也是為了解某個bug而產生的樣子..)

PostgreSQL - Unattended installation on windows

Introduction 要將別人軟體包裝到自己軟體中,不可或缺的東西就是Unattended installation。以Unattended installation來說,我們可以選擇透過Installer的silent mode安裝,也可以透過把目標軟體做成portable的版本。本篇文章分享這兩種方法,教導大家如何將PostgreSQL透過Unattended installation方式安裝到目標系統成為service。 Note. 本篇以PostgreSQL 10.7為例。 Install with installer Tips 安裝程式或反安裝程式的參數,除了可以直接上官網搜尋Installation User Guide以外,也可以直接使用help參數查詢: postgresql- 10.7 - 2 -windows-x64.exe --help Windows安裝程式主要有EnterpriseDB與BigSQL兩種。BigSQL版本安裝元件是透過網路下載且支援參數不如EnterpriseDB版本多,以我們需求來說,我們傾向於使用EnterpriseDB版本。接下來分享給大家安裝與反安裝方法。 Installation @ echo off set INSTALL_DIR =C:\postgres10 set INSTALLER =postgresql- 10.7 - 2 -windows-x64.exe   rem options for installation set SSMDB_SERVICE =postgresql- 10 set MODE =--unattendedmodeui none --mode unattended   set DB_PASSWD =--superpassword postgres set DB_PORT =--serverport 5432   set SERVICE_NAME =--servicename % SSMDB_SERVICE %   set PREFIX =--prefix "%INSTALL_DIR%" set DATA_DIR =--datadir "%INSTALL_DIR%\data"   set OPTIONS =