벤치좀 부탁드립니다.
Moderator: 류광
벤치좀 부탁드립니다.
http://websgt.com/btool2/profile_bt_10sec.zip
OpenMP 적용되서 코어가 많을수록 잘나올겁니다.
정말 나눗셈이 비용이 가장 비싼 명령이더군요...
픽셀단위로 정수 나누기 3개 한것을 제외만 시켜도 전체처리시간이 절반으로 줄어드니 원 ;_;
수퍼스칼라적용되게 3개를 다닥다닥 붙여놓으면 될거라는 말듣고 해봤지만 전혀 효과없고;;;
SIMD계열명령어 중에 정수팩나누기는 없는듯 싶어서
어떻게 직접 만들어야할 판이네요
구글링해보면 이런 단서만 나오고 Google for "multiple precision division"
열심히 해봐야겠습니다.
AMD Athlon(tm) 7750 Dual-Core Processor
402483
MKDAB 404124 1641
ALPHA 404671 547
TOBMP 408312 3641
C5CLK 412562
btool2
5829 1715 cycles 수치가 클수록 좋습니다.
btool1
4250 2352 cycles
OpenMP 적용되서 코어가 많을수록 잘나올겁니다.
정말 나눗셈이 비용이 가장 비싼 명령이더군요...
픽셀단위로 정수 나누기 3개 한것을 제외만 시켜도 전체처리시간이 절반으로 줄어드니 원 ;_;
수퍼스칼라적용되게 3개를 다닥다닥 붙여놓으면 될거라는 말듣고 해봤지만 전혀 효과없고;;;
SIMD계열명령어 중에 정수팩나누기는 없는듯 싶어서
어떻게 직접 만들어야할 판이네요
구글링해보면 이런 단서만 나오고 Google for "multiple precision division"
열심히 해봐야겠습니다.
AMD Athlon(tm) 7750 Dual-Core Processor
402483
MKDAB 404124 1641
ALPHA 404671 547
TOBMP 408312 3641
C5CLK 412562
btool2
5829 1715 cycles 수치가 클수록 좋습니다.
btool1
4250 2352 cycles
-
- Posts: 2764
- Joined: 2003-05-13 03:34
- Location: NCSOFT LE팀
장비가 좀 좋습니다. (쿼드 * 2 긁적..)Intel(R) Xeon(R) CPU E5440 @ 2.83GHz
736199
MKDAB 737946 1747
ALPHA 738446 500
TOBMP 739319 873
C5CLK 743157
btool2
3120 3250 cycles
btool1
3838 2642 cycles
Last edited by zupet on 2009-10-15 18:20, edited 1 time in total.
-
- Posts: 464
- Joined: 2005-01-17 12:22
- Contact:
-
- Posts: 464
- Joined: 2005-01-17 12:22
- Contact:
개발자 컴퓨터에서 왜 재배포 패키지를 설치해야했는지 모르겠지만 ㅜㅜ
아무튼 잘 실행되네요 감사합니다^^
Intel(R) Core(TM)2 Quad CPU Q6600 @ 2.40GHz
271254781
MKDAB 271256484 1703
ALPHA 271256781 297
TOBMP 271258171 1390
C5CLK 271261796
btool2
3390 2949 cycles
btool1
3625 2758 cycles
Intel(R) Core(TM)2 Quad CPU Q6600 @ 2.40GHz
271333843
MKDAB 271335531 1688
ALPHA 271335859 328
TOBMP 271337046 1187
C5CLK 271340624
btool2
3203 3122 cycles
btool1
3578 2794 cycles
두번 테스트 하였는데요, VS 몇개 끄니까 조금 빨라졌네요. 아직도 실행중인게 조금 있지만서도...
저는 다른 분들보다 MKDAB 이 매우 높네요. 좋은건가요 나쁜건가요?
ps. 사실 무슨 측정 프로그램인지도 모르고 돌렸기 때문에 조금 설명좀 해주셨으면..^^;
아무튼 잘 실행되네요 감사합니다^^
Intel(R) Core(TM)2 Quad CPU Q6600 @ 2.40GHz
271254781
MKDAB 271256484 1703
ALPHA 271256781 297
TOBMP 271258171 1390
C5CLK 271261796
btool2
3390 2949 cycles
btool1
3625 2758 cycles
Intel(R) Core(TM)2 Quad CPU Q6600 @ 2.40GHz
271333843
MKDAB 271335531 1688
ALPHA 271335859 328
TOBMP 271337046 1187
C5CLK 271340624
btool2
3203 3122 cycles
btool1
3578 2794 cycles
두번 테스트 하였는데요, VS 몇개 끄니까 조금 빨라졌네요. 아직도 실행중인게 조금 있지만서도...
저는 다른 분들보다 MKDAB 이 매우 높네요. 좋은건가요 나쁜건가요?
ps. 사실 무슨 측정 프로그램인지도 모르고 돌렸기 때문에 조금 설명좀 해주셨으면..^^;
Last edited by tomatowax on 2009-10-15 18:24, edited 1 time in total.
종합
Intel (R) Pentium (R) Dual CPU E2160 @ 1.80GHz
btool2 1039104 1747 cycles
btool1 869112 2089 cycles
--------------------------------------------------------------------------------
AMD Athlon(tm) 64 X2 Dual Core Processor 4000+ (브리)
btool2 2117362 1005 cycles
btool1 1933893 1100 cycles
--------------------------------------------------------------------------------
Intel Core(TM)2 Quad CPU Q6600 @ 2.40GHz
btool2 946971 2537 cycles
btool1 885177 2715 cycles
btool2 1039104 1747 cycles
btool1 869112 2089 cycles
--------------------------------------------------------------------------------
AMD Athlon(tm) 64 X2 Dual Core Processor 4000+ (브리)
btool2 2117362 1005 cycles
btool1 1933893 1100 cycles
--------------------------------------------------------------------------------
Intel Core(TM)2 Quad CPU Q6600 @ 2.40GHz
btool2 946971 2537 cycles
btool1 885177 2715 cycles
설명 잠시 드리겠습니다.
MKDAB 1688 100크기의 댑생성시간 ms (분기/나머지/나누기 일듯?)
ALPHA 328 알파계산시간 (메모리속도/곱하기속도 영향)
TOBMP 1187 레이어 계산시간 (나누기 연산속도 영향)
btool2
3203 3122 cycles 레이어가 적용된 100크기의 Dab을 초당 몇개 찍을수있는지 (멀티코어지원)
btool1
3578 2794 cycles 레이어가 적용되지않은 100크기의 Dab을 초당 몇개 찍을수있는지
MKDAB 경우는 어디서 걸리는건지 저도 감이 안오네요;
ALPHA 328 알파계산시간 (메모리속도/곱하기속도 영향)
TOBMP 1187 레이어 계산시간 (나누기 연산속도 영향)
btool2
3203 3122 cycles 레이어가 적용된 100크기의 Dab을 초당 몇개 찍을수있는지 (멀티코어지원)
btool1
3578 2794 cycles 레이어가 적용되지않은 100크기의 Dab을 초당 몇개 찍을수있는지
MKDAB 경우는 어디서 걸리는건지 저도 감이 안오네요;
-
- Posts: 34
- Joined: 2006-11-20 12:54
- Contact:
다나와표 12월 e7300
Intel(R) Core(TM)2 Duo CPU E7300 @ 2.66GHz
319609
MKDAB 321171 1562
ALPHA 321578 407
TOBMP 323093 1515
C5CLK 326390
btool2
3484 2870 cycles
btool1
3297 3033 cycles
319609
MKDAB 321171 1562
ALPHA 321578 407
TOBMP 323093 1515
C5CLK 326390
btool2
3484 2870 cycles
btool1
3297 3033 cycles