PDJJ14 WIKI : 04. VM 성능 테스트

1. 하드웨어/OS 구성

ProcessorInter(R) Xeon(R) CPU E5-2698 v3 @ 2.30GHz, 2 processor socket, 16 cores per socket
Memory384 GB
StorageHP Serial Attached SCSI Disk 300GB (RAID 1 구성)

2. K3 PMS Standalone 설치

StepActionNote
1Matlab Library 설치 
2

.Net Framework 4.0 x64 설치 (MS 홈페이지에서 다운로드 받은 파일 사용)

 
3.Net Framework 3.0 설치 (MS Server 2008 에서 기능 추가 사용) 
4.Net Framework 3.5 SP1 x64 설치 (MS 홈페이지에서 다운로드 받은 파일 사용) 
5MS Visual C++ 2008 Redistributable 과 SP1 설치 (MS 홈페이지에서 다운로드 받은 파일 사용) 
6MS Visual C++ 2010 Redistributable 설치 (MS 홈페이지에서 다운로드 받은 파일 사용) 
7Standalone 폴더 복사 및 Config 수정
  • Processor/CalNmrScene 실행 파일 위치 수정
  • L0F 파일 위치 수정
  • Workorder 폴더 위치 수정
8K3Processor 폴더 복사 및 \K3Processor\K3SIPConfig.xml config 수정
  • V2.10 2015-01-19 버전
  • DEM 폴더 Path 와 JPLEphemerides 폴더 Path 를 Local Path 로 변경
    • DEM 폴더는 60GB 가 넘어서 빈 폴더로 구성
    • JPLEphemerides 폴더는 14 MB 데이터를 복사해서 넣어둠

위의 설치 과정에서 식별된 설치 파일들을 하나의 ISO 파일로 생성

  • Standalone 과 Processor 의 경우에는 PMS 라는 하나의 폴더로 묶었음
    • Config 수정 완료된 버전
    • C:\ 에 PMS 폴더를 복사하면 됨

3. VM 성능 테스트 결과

OSVM 개수VM 별 CPU 할당 (Socket * Core)VM 별 메모리 할당VM 별 Storage 할당I/O 속도 (Read/Write) [MB/s]Catalog 생성 시간L1R 단독 생성 시간L1G 단독 생성 시간L1R/L1G 동시 생성 시간
Windows Server 2008 SP2 x6412 * 16 = 32128 GB40 GB

34 sec3,350 sec = 55.8 min3,586 sec = 59.7 min
  • L1R: 4,123 sec = 68.7 min
  • L1G: 4,163 sec = 69.3 min
Windows Server 2008 SP2 x6422 * 16 = 32128 GB40 GB상동
  • VM1: 34 sec
  • VM2: 34 sec
  • VM1: 3,430 sec = 57.1 min
  • VM2: 3,387 sec = 56.4 min
  • VM1: 3,653 sec = 60.8 min
  • VM2: 3,698 sec = 61.6 min
  • VM1
    • L1R: 4,592 sec = 76.5 min
    • L1G: 4,660 sec = 77.7 min
  • VM2
    • L1R: 4,437 sec = 73.9 min
    • L1G: 4,650 sec = 77.5 min
Windows Server 2008 SP2 x6432 * 16 = 3264 GB40 GB상동
  • VM1: 37 sec
  • VM2: 37 sec
  • VM3: 37 sec
  • VM1: 3,702 sec = 61.7 min
  • VM2: 3,661 sec = 61.0 min
  • VM3: 3,759 sec = 62.6 min
  • VM1: 3,983 sec = 66.3 min
  • VM2: 3,847 sec = 64.1 min
  • VM3: 3,992 sec = 66.5 min

N/A

Windows Server 2012 R2 x6412 * 16 = 32128 GB40 GB

44 sec3,187 sec = 53.1 minN/AN/A

 

4. 참고자료

4.1. Desktop/Server 영상 처리 정보

IPCPUMemoryStorageOSI/O 속도 (Read/Write) [MB/s]Catalog 생성 시간L1R 단독 생성 시간L1G 단독 생성 시간L1R/L1G 동시 생성 시간
192.168.0.250i7-2600 @ 3.4GHz 3.70 GHz, 2 sockets?, 4 cores per a socket?8 GB500GB HDDWindows 7 Professional K SP1 x64

38 sec2346 sec = 39 min2292 sec = 38 minN/A
192.168.0.241 (PAN 처리 못한 버전)Inter(R) Xeon(R) CPU E5-2630 v3 @ 2.40GHz, 2.39 GHz, 2 sockets, 16 cores per a socket64 GB240GB SSDWindows Server 2012 R2 x64

38 sec365 sec = 6.0 min435 sec = 7.2 min
  • L1R: 441 sec = 7.3 min
  • L1G: 498 sec = 8.3 min
192.168.0.241 (PAN 처리 못한 버전)Inter(R) Xeon(R) CPU E5-2630 v3 @ 2.40GHz, 2.39 GHz 2 sockets, 16 cores per a socket64 GB2TB HDDWindows Server 2012 R2 x64

38 sec364 sec = 6.0 min437 sec = 7.2 min
  • L1R: 421 sec = 7.0 min
  • L1G: 497 sec = 8.2 min
192.168.0.241 (정상 버전)Inter(R) Xeon(R) CPU E5-2630 v3 @ 2.40GHz, 2.39 GHz, 2 sockets, 16 cores per a socket64 GB240GB SSDWindows Server 2012 R2 x64PAN 처리 못한 버전과 동일38 sec2,680 sec = 44.6 min2,784 sec = 46.4 min 
192.168.0.241 (정상 버전)Inter(R) Xeon(R) CPU E5-2630 v3 @ 2.40GHz, 2.39 GHz, 2 sockets, 16 cores per a socket64 GB2TB HDDWindows Server 2012 R2 x64PAN 처리 못한 버전과 동일39 sec2,720 sec = 45.3 min2,860 sec = 47.6 min
  • L1R: 2,808 sec = 46.8 min
  • L1G: 2,859 sec = 47.6 min
192.168.1.168 (VM Test 장비)Inter(R) Xeon(R) CPU E5-2698 v3 @ 2.30GHz, 2 processor socket, 16 cores per socket384 GB300 GB RAID 1Windows Server 2012 R2 x64

41 sec3,303 sec = 55.0 min3,624 sec = 60.4 min
  • L1R: 3,524 sec = 58.7 min
  • L1G: 3,663 sec = 61.0 min
192.168.0.111 (필리핀 납품용 PMS 장비)Inter(R) Xeon(R) CPU E5-2660 v3 @ 2.6GHz, 2 processor socket, 10 cores per socket64 GB400GB HDDWindows Server 2012 R2 x64 44 sec2,853 sec = 47.5 min3,153 sec = 52.5 min
  • L1R: 3,554 sec = 59.2 min
  • L1G: 3,714 sec = 61.9 min

 

4.2. Level 1R 처리 단계별 소요 시간 (seconds)

 DLL Init.DenosingMTFCDLL TerminateOverlapZoneWriteFullSceneImageRPCWrite ProductGenerateCatalogJGWFileXmlAuxFileNote
VM (Server 2008 x64)2465524330.746414550.10.12 
VM (Server 2012 x64)242522174136312130.202 
192.168.0.250 (Windows 7 x64)222431368156112850.50.13 
192.168.0.241 (Server 2012 x64) (PAN 처리 못한 버전)512124713830.20.02
  • VS C++ 2005 Redistributable 이 설치되어 있지 않았음
  • VS C++ 2010 Redistributable 의 버전이 달랐음
  • 위의 차이를 같게 맞추고 난 뒤에도 결과는 동일했음
  • PAN 영상 처리가 정상적으로 이뤄지지 않았음
    • Denosing 과 MTFC 는 PAN band 에 대해서만 수행되는 알고리즘임 (오금희, 김인영 확인)
    • ENVI 에서 확인 결과, PAN band 영상이 까만색이었음
    • MS band 영상들은 정상이었음
192.168.0.241 (Server 2012 x64) (정상 버전)1633717730.648513530.10.03
  • 비어 있는 HDD Drive 에 Windows Server 2012 설치하여 테스트
  • 영상 처리에 필요한 설치 파일들만 동일하게 설치
  • HDD Drive 처리 기준
192.168.1.168 (Server 2012 x64)1841723890.638911530.10.02 

4.3. Level 1R Maximum DN

 241 (PAN 처리 못한 버전)241 (정상 버전)250VM (Server 2008)VM (Server 2012)192.168.1.168
PAN0 17556175561755617556
MS114893 12495124951225412757
MS415634 16165134191569314720

 

4.4. Level 1R 처리 시 리소스 사용 내용

 CPU 최대 점유율 (관찰값)최대 쓰레드 수 (관찰값)
VM (2008)80135
VM (2012)80136
192.168.0.241 (PAN 처리 못한 버전)3030
192.168.0.241 (정상 버전)2588
192.168.1.16830100

 

4.5. DAUM Encoder 성능 테스트

240MB 의 동영상을 동일한 옵션으로 인코딩하는 시간 측정

환경인코딩 시간 (sec)
VM (Server 2008 x64)242
VM (Server 2012 x64)245
192.168.0.250 (Windows 7 x64)92
192.168.0.241 (Server 2012 x64) (PAN 처리 못한 버전)120
192.168.0.241 (Server 2012 x64) (정상 버전) 
192.168.1.168230

 

5. 결과 분석

  • 비교 기준 대비 VM 의 영상 처리 속도가 약 50% (약 19분) 느림
    • CPU Clock 을 제외하고는 VM 의 자원이 더 좋음
    • 테크아이에 문의했을 때, 동일한 H/W 를 기준으로 OS 대비 VM 이 일반적으로 5% 의 성능저하가 있다고 함
    • 느린 이유를 아직 찾지 못함
  • VM 1 개를 돌렸을 경우 대비 VM 2 개를 돌렸을 경우, 아래와 같이 성능 저하가 발생했음
    • L1R: 1% (약 0.9분)
    • L1G: 2.5% (약 1.5분)
    • L1R/L1G 동시 처리: 10% (약 7.4분)
  • 테스트 Server 에 일반 OS 를 설치했을 경우와 VM 1 개를 설치했을 경우, Level 1R 처리 시간이 55 분 : 59 분으로 약 8% 의 성능 차이를 보였음
  • 동일한 L0F, Workorder, Processor (config 포함) 을 사용했음에도 불구하고 모든 장비 (VM 포함) 에서 Band 별 Maximum DN 값이 차이를 보였음
    • 동일한 장비에서 여러 번 처리했을 경우에도 차이가 발생하는 장비(192.168.1.168)가 있는가 하면 차이가 발생하지 않는 장비(192.168.0.241)가 있었음
    • 확인 결과, Denosing/MTFC/Overlap 등을 수행할 때, 기준점이 조금씩 달라질 수 있어서 Maximum DN 의 값이 변할 수 있다고 함 (by 오금희)
      • 차이가 발생하지 않았던 장비의 경우, Denosing 과 MTFC 가 수행되지 않았기 때문이라 판단됨
  • 현재까지 파악된 K3 Level Processor 성능에 큰 영향을 끼치지 않는 요소들

6. 참고 사이트