Kingston의 새로운 DC3000ME는 데이터 센터 및 서버급 워크로드를 위해 특별히 제작된 U.2 2.5인치 폼 팩터를 갖춘 최신 엔터프라이즈급 NVMe SSD입니다. PCIe 5.0 x4 인터페이스를 활용하여 고대역폭 처리량과 3D eTLC NAND를 결합하여 강력한 신뢰성과 유연한 용량 확장을 보장합니다. 3.84TB, 7.68TB, 15.36TB 구성으로 제공되는 이 드라이브는 하이퍼스케일 인프라, AI 및 HPC 클러스터, 클라우드 서비스, 트랜잭션 시스템을 비롯한 수요가 높은 환경에 맞게 맞춤화되었습니다.
Kingston DC3000ME 성능 프로필
모든 용량 옵션에서 DC3000ME는 일관된 순차 읽기 성능을 유지하며 각 모델은 최대 14,000MB/s를 제공합니다. 이 속도는 선택한 용량에 관계없이 빠른 데이터 액세스가 필요한 워크로드에 적합합니다. 대조적으로 순차 쓰기 속도는 눈에 띄게 다릅니다. 3.84TB 모델은 5,800MB/s로 최고이고, 7.68TB 모델은 10,000MB/s로 점프하고, 15.36TB 모델은 9,700MB/s로 약간 뒤떨어집니다.
랜덤 성능 측면에서는 7.68TB 모델이 읽기 최대 280만 IOPS, 쓰기 최대 50만 IOPS를 자랑해 가장 빠른 속도를 자랑한다. 이는 읽기 IOPS가 270만 개로 제한되는 3.84TB 및 15.36TB 드라이브보다 성능이 뛰어납니다. 쓰기의 경우 3.84TB 모델은 300,000 IOPS에 도달하고 15.36TB 모델은 400,000 IOPS에 도달합니다. 전반적으로 7.68TB 버전은 바쁘고 수요가 많은 작업을 처리하는 데 가장 적합합니다.
용량당 성능 관점에서 7.68TB 모델은 처리량과 IOPS의 가장 균형 잡힌 조합을 제공하므로 로깅, OLTP 데이터베이스 또는 활성 AI 모델 교육과 같은 쓰기 집약적 애플리케이션에 이상적입니다. 3.84TB 모델은 용량이 최우선 순위가 아닌 읽기 중심 또는 혼합 워크로드에 더 적합한 반면, 15.36TB 버전은 원시 스토리지 밀도를 위해 최대 쓰기 IOPS를 희생합니다.
Kingston DC3000ME 엔터프라이즈 기능
DC3000ME는 생산 시스템에 필수적인 실용적인 엔터프라이즈급 기능을 갖추고 있습니다. 갑작스러운 정전 시 데이터를 보호하기 위한 PLP(Power Loss Protection)는 물론 저장 데이터의 보안을 위해 TCG Opal을 지원하는 AES-256 암호화도 포함되어 있습니다. 드라이브는 최대 128개의 네임스페이스를 지원합니다. 이는 특히 가상화 또는 컨테이너화된 환경에 유용한 기능으로, 고급 U.2 SSD의 기능과 일치하고 대규모 가상화에 가치를 더해줍니다. Kingston은 또한 드라이브 상태, 미디어 마모 및 작동 온도를 모니터링하는 원격 측정 도구를 통합하여 관리자에게 장기적인 안정성에 대한 명확한 가시성을 제공합니다.
킹스턴 DC3000ME 뒷면
전력 소비 범위는 유휴 상태에서 8W부터 전체 쓰기 작업 중 최대 24W이며, 이는 부하가 심한 고밀도 U.2 SSD의 표준입니다. Kingston은 최대 읽기 전력을 8.2W로 지정하여 유휴 전력 소모와 밀접하게 일치하며 읽기가 많은 작업 부하에서 전력 차이가 좁습니다. 내구성 등급은 기업 표준을 충족하며 5년 동안 하루에 한 번의 전체 드라이브 쓰기를 지원합니다(드라이브 용량에 따라 7,008TBW~28,032TBW에 해당).
Kingston DC3000ME는 200만 시간의 MTBF 등급, Kingston의 5년 제한 보증 및 무료 기술 지원을 제공합니다.
킹스턴 DC3000ME 사양
| 사양 | 세부 |
| 폼 팩터 | U.2, 2.5″ x 15mm |
| 인터페이스 | PCIe NVMe Gen5 x4(Gen4와 역호환 가능) |
| 용량 | 3.84TB, 7.68TB, 15.36TB |
| 낸드 종류 | 3D eTLC 낸드 |
| 순차 읽기/쓰기(MB/초) | 3.84TB – 14,000 / 5,800 7.68TB – 14,000 / 10,000 15.36TB – 14,000 / 9,700 |
| 무작위 읽기/쓰기 IOPS(4K) | 3.84TB – 2,700,000 / 300,000 7.68TB – 2,800,000 / 500,000 15.36TB – 2,700,000 / 400,000 |
| 지연 QoS(99%) | 읽기: <10μs, 쓰기: <70μs |
| 정적 및 동적 웨어 레벨링 | 예 |
| 전력 손실 보호 | 예(전원 캡) |
| 암호화 | TCG Opal 2.0, AES 256비트 암호화 |
| 네임스페이스 관리 | 최대 128개의 네임스페이스 지원 |
| 엔터프라이즈 진단 | 원격 측정, 미디어 마모, 온도, 건강 등 |
| 내구성(TBW/DWPD, 5년) | 3.84TB – 7,008TBW, 1 DWPD 7.68TB – 14,016TBW, 1 DWPD 15.36TB – 28,032TBW, 1 DWPD |
| 전력 소비 | 유휴: 8W, 최대 읽기: 8.2W, 최대 쓰기: 24W |
| 작동 온도 | 0°C ~ 70°C |
| 치수 | 100.50mm x 69.8mm x 14.8mm |
| 무게 | 3.84TB – 146.2g 7.68TB – 151.3g 15.36TB – 152.3g |
| 진동(비작동) | 10G 피크(10~1000Hz) |
| MTBF | 200만 시간 |
| 보증 및 지원 | 무료 기술 지원이 포함된 5년 제한 보증 |
Kingston DC3000ME 성능 테스트
드라이브 테스트 플랫폼
이 검토에서는 Ubuntu 22.04.02 LTS를 실행하는 Dell PowerEdge R760을 모든 워크로드에 대한 테스트 플랫폼으로 활용합니다. 직렬 케이블 Gen5 JBOF가 장착되어 U.2, E1.S, E3.S 및 M.2 SSD와 폭넓은 호환성을 제공합니다. 우리의 시스템 구성은 다음과 같습니다:
-
-
- 2 x Intel Xeon Gold 6430(32코어, 2.1GHz)
- 64GB DDR5-4400 16개
- 480GB 델 보스 SSD
- 직렬 케이블 Gen5 JBOF
-
드라이브 비교
- 샌디스크 SN861
- 솔리드다임 PS1010
- 마이크론 9550
- 파스카리 X200P
CDN 성능
현실적인 혼합 콘텐츠 CDN 워크로드를 시뮬레이션하기 위해 SSD는 콘텐츠가 많은 엣지 서버의 I/O 패턴을 복제하도록 설계된 다단계 벤치마크 시퀀스를 거쳤습니다. 테스트 프로세스는 다양한 동시성 수준으로 무작위 및 순차 작업에 분산된 다양한 블록 크기(대형 및 소형)를 다룹니다.
주요 성능 테스트에 앞서 각 SSD는 1MB 블록을 사용하는 100% 순차 쓰기 패스를 통해 전체 장치 채우기를 완료했습니다. 이 프로세스에서는 동기식 I/O와 4개의 대기열 크기를 사용하여 4개의 동시 작업을 가능하게 했습니다. 이 단계에서는 드라이브가 실제 사용량을 반영하는 안정된 상태로 들어가도록 합니다. 순차 채우기 후에는 128K 전송(98.51%)에 중점을 두고 가중 블록 크기 분포(블록 크기/백분율)를 사용하고 128K 미만 블록에서 8K까지 약간의 기여로 보완되는 2차 3시간 무작위 쓰기 포화 단계가 실행되었습니다. 이 단계는 분산 캐시 환경에서 흔히 볼 수 있는 단편화되고 고르지 않은 쓰기 패턴을 에뮬레이트합니다.
주요 테스트 제품군은 가변적인 대기열 깊이 및 작업 동시성에서 드라이브 성능을 측정하기 위해 확장된 무작위 읽기 및 쓰기 작업에 중점을 두었습니다. 각 테스트는 5분(300초) 동안 실행되었으며, 내부 복구 메커니즘이 성능 지표를 안정화할 수 있도록 3분간의 유휴 기간이 이어졌습니다.
테스트는 128K(98.51%)를 선호하는 고정 블록 크기 분포를 사용하여 수행되었으며 나머지 1.49% 작업은 64K에서 8K 범위의 더 작은 전송 크기로 구성되었습니다. 각 구성은 일반적인 에지 쓰기 조건에서 처리량 확장성과 대기 시간을 프로파일링하기 위해 대기열 깊이가 1, 2, 4, 8, 16, 32인 1, 2, 4개의 동시 작업에 걸쳐 다양했습니다.
CDN 콘텐츠 검색을 모방한 심하게 혼합된 블록 크기 프로필도 사용되었습니다. 주요 128K(83.21%) 구성 요소로 시작하여 30개가 넘는 작은 블록 크기(4K ~ 124K)의 긴 꼬리가 뒤따랐으며 각각은 분수 빈도 표현을 사용했습니다. 이 분포는 비디오 세그먼트 가져오기, 썸네일 액세스 및 메타데이터 조회 중에 발생하는 다양한 요청 패턴을 반영합니다. 또한 이러한 테스트는 작업 수와 대기열 깊이의 전체 매트릭스에 걸쳐 실행되었습니다.
사전 조정, 포화 및 혼합 크기 무작위 액세스 테스트의 조합은 지속적인 CDN과 같은 환경에서 SSD가 어떻게 작동하는지 밝히고 대역폭이 많이 사용되는 고도로 병렬화된 시나리오에서 응답성과 효율성을 강조하도록 설계되었습니다.
CDN 워크로드 읽기 1
CDN 워크로드 읽기 테스트(1개 작업)에서 Kingston DC3000ME는 대기열 깊이가 증가함에 따라 효과적으로 확장되는 견고한 성능을 제공했습니다. QD1에서는 940MB/s를 달성하여 SanDisk SN861에 약 26% 뒤처졌습니다. 그러나 대기열 깊이가 증가함에 따라 DC3000ME는 격차를 줄이고 여러 Gen5 드라이브보다 성능이 뛰어났습니다. QD4에서 Kingston DC3000ME는 3,390MB/s에 도달했습니다. 이는 Micron 9550보다 약 42% 빠르고, Pascari X200P보다 40% 빠르며, Solidigm PS1010보다 약 25% 빠르지만 SanDisk SN861보다 약 2.6% 뒤처집니다. QD16에서 DC3000ME는 9,645MB/s를 기록하여 Solidigm PS1010을 ~13%, Micron 9550을 ~20% 능가했습니다. QD32의 최대 테스트 깊이에서 Kingston은 14,131MB/s를 달성하여 Micron 9550과 효과적으로 일치하고 Solidigm PS1010보다 약 15%, SanDisk SN861보다 거의 10% 더 나은 성능을 보였습니다.
Kingston DC3000ME - CDN 워크로드 읽기 1개 작업
CDN 워크로드 읽기 2
2작업 CDN 읽기 워크로드에서 Kingston DC3000ME는 모든 대기열 깊이에 걸쳐 강력한 성능을 유지했습니다. QD1에서는 1,854MB/s를 기록해 Micron 9550(1,548MB/s)보다 20%, Pascari X200P(1,519MB/s)보다 22%, Solidigm PS1010(2,011MB/s)보다 약 8% 빠르지만 SanDisk SN861(2,487MB/s)보다 뒤처졌습니다. 34%.
QD4에서 Kingston은 6,335MB/s에 도달하여 Micron(5,337MB/s), Pascari(5,249MB/s) 및 Solidigm(5,609MB/s)을 눈에 띄게 능가했습니다. 하지만 여전히 6,996MB/s로 1위를 차지한 SanDisk에 뒤처졌습니다.
QD16까지 Kingston은 14,131MB/s를 달성하여 현재 선두를 달리고 있습니다. 최종 테스트 지점(QD32)에서는 14,336MB/s로 약간 증가했습니다. Pascari(15,257MB/s)와 Micron(15,052MB/s)에 각각 ~6%, 5% 뒤처지는 동시에 SanDisk(13,619MB/s) 및 Solidigm(13,721MB/s)에 비해 확고한 선두를 유지했습니다.
CDN 워크로드 읽기 4
4개의 작업이 활성화된 상태에서 Kingston DC3000ME는 계속해서 CDN 읽기 성능을 유지했습니다. QD1에서는 3,639MB/s에 도달하여 Micron 9550(3,070MB/s) 및 Pascari X200P(2,982MB/s)보다 성능이 뛰어났지만 여전히 4,443MB/s로 이 계층을 주도한 SanDisk SN861에 비해 22% 뒤처졌습니다. QD4까지 Kingston은 10,854MB/s를 제공했습니다. 이는 Micron(9,427MB/s)보다 15% 향상되고 Pascari(9,070MB/s)보다 20% 앞서며 Solidigm(9,627MB/s)보다 약간 높습니다. 그러나 여전히 SanDisk의 11,161MB/s에 뒤처졌습니다.
QD8까지 Kingston은 13,926MB/s를 기록했습니다. 이는 Micron과 거의 동일하며 SanDisk(13,619MB/s) 및 Solidigm(12,800MB/s)과 거의 비슷합니다. QD16 및 QD32에서 처리량은 Kingston의 경우 약 14,131~14,233MB/s로 안정되었습니다. 이는 Micron 및 Pascari(둘 다 약 15,052~15,257MB/s)보다 약간 뒤처졌지만 여전히 SanDisk(13,619MB/s) 및 Solidigm(13,721MB/s)보다 앞서 있습니다.
CDN 워크로드 쓰기 1
CDN 쓰기 워크로드(1개 작업)에서 Kingston DC3000ME는 대기열 깊이 전반에 걸쳐 일관된 확장성을 보여주었습니다. QD1에서는 2,118MB/s에 도달해 Micron 9550(2,004MB/s), Pascari X200P(1,885MB/s), Solidigm PS1010(1,718MB/s)보다 빠르며 SanDisk SN861(2,164MB/s)에 불과합니다. QD4에서 Kingston은 4,318MB/s를 기록했습니다. 이는 Solidigm(2,789MB/s)보다 55% 빠르고 Pascari(3,437MB/s)보다 26% 빠르지만 Micron(4,807MB/s)보다 10% 느리고 SanDisk(5,353MB/s)보다 19% 뒤진 것입니다.
QD16에서는 5,880MB/s를 제공하여 Pascari(4,921MB/s)를 20% 앞지르고 Solidigm(2,664MB/s)의 두 배 이상을 제공했지만 여전히 Micron(6,686MB/s)보다 11%, SanDisk(6,939MB/s)보다 15% 낮았습니다. QD32에서 Kingston은 5,987MB/s로 최고치를 기록했습니다. 이는 다시 Pascari(5,913MB/s)에 가깝지만 Micron(7,422MB/s) 및 SanDisk(7,521MB/s)에 각각 ~20% 및 25% 뒤처졌습니다.
Kingston DC3000ME - 쓰기 성능 CDN 워크로드 1개 작업
CDN 워크로드 쓰기 2
2작업 CDN 쓰기 워크로드에서 Kingston DC3000ME는 일반적으로 가장 빠른 Gen5 엔터프라이즈급 SSD에 뒤졌지만 일관된 성능을 보여주었습니다. QD1에서는 2,651MB/s를 기록했는데, 이는 Micron 9550(2,813MB/s)과 Pascari X200P(2,762MB/s) 바로 아래, SanDisk SN861(3,972MB/s)보다 약 33% 뒤진 수치입니다.
대기열 깊이가 증가함에 따라 DC3000ME는 속도를 유지했습니다. QD4에서는 4,807MB/s에 도달했습니다. 이는 Micron 9550(5,902MB/s)보다 약 23% 느리고 SanDisk SN861(5,508MB/s)보다 13% 느리지만 3,154MB/s로 Solidigm PS1010보다 앞서 있습니다.
QD16에서 Kingston은 5,772MB/s를 제공하여 여전히 Micron(7,896MB/s) 및 SanDisk(6,709MB/s)에 뒤처지고 있지만 Solidigm PS1010(3,820MB/s) 및 Pascari X200P(5,417MB/s)와 같은 하위 계층 모델을 계속 능가합니다. QD32에서 DC3000ME는 최고 5,870MB/s로 최고치를 기록했습니다. 이는 Micron 9550(8,670MB/s)보다 약 32%, SanDisk SN861(7,537MB/s)보다 22% 낮았지만 여전히 Solidigm PS1010(2,817MB/s) 및 Pascari(4,585MB/s)보다 앞서 있었습니다.
CDN 워크로드 쓰기 4
4개 작업 CDN 쓰기 워크로드에서 Kingston DC3000ME는 모든 대기열 깊이에 걸쳐 꾸준히 확장되었지만 일반적으로 상위 2개의 Gen5 드라이브에 뒤처졌습니다. QD1에서는 2,202MB/s를 달성하여 Pascari X200P(2,845MB/s), Micron 9550(2,703MB/s), SanDisk SN861(3,544MB/s)에 뒤지고 Solidigm PS1010(2,020MB/s)보다 앞섰습니다. QD2에서 Kingston은 3,165MB/s에 도달했습니다. 이는 다시 SanDisk(4,863MB/s) 및 Micron(4,457MB/s)에 뒤처졌지만 Solidigm(2,872MB/s)보다 앞서고 있습니다.
중간 범위 대기열 깊이에서 Kingston DC3000ME는 QD4에서 3,647MB/s, QD8에서 4,410MB/s를 달성했습니다. 이는 괜찮은 확장성을 보여 주었지만 두 테스트 지점 모두에서 Micron 드라이브(5,539MB/s 및 6,478MB/s) 및 SanDisk 드라이브(5,177MB/s 및 5,575MB/s)보다 뒤처졌습니다. QD16에서 Kingston은 4,865MB/s를 제공했습니다. 이는 QD8에 비해 약간 증가했지만 여전히 SanDisk 드라이브(6,011MB/s) 및 Micron 드라이브(7,474MB/s)에 뒤처져 있습니다. QD32에서 DC3000ME는 5,307MB/s로 최고치에 도달했습니다. 이는 Solidigm(3,894MB/s)보다 훨씬 앞섰지만 Micron(7,941MB/s) 및 SanDisk(7,212MB/s)보다 훨씬 뒤처졌습니다. 성능 선두주자는 아니지만 Kingston 드라이브는 일관된 확장성과 효율성을 유지했습니다.
DLIO 체크포인트 벤치마크
AI 교육 환경에서 SSD의 실제 성능을 평가하기 위해 DLIO(데이터 및 학습 입력/출력) 벤치마크 도구를 사용했습니다. Argonne National Laboratory에서 개발한 DLIO는 딥 러닝 워크로드의 I/O 패턴을 테스트하도록 특별히 설계되어 스토리지 시스템이 체크포인트, 데이터 수집, 모델 교육과 같은 문제를 처리하는 방법에 대한 통찰력을 제공합니다. 아래 차트는 두 드라이브가 36개 체크포인트에서 프로세스를 처리하는 방법을 보여줍니다. 기계 학습 모델을 학습할 때 체크포인트는 모델 상태를 주기적으로 저장하여 중단이나 정전 시 진행 손실을 방지하는 데 매우 중요합니다. 이러한 스토리지 수요에는 특히 지속되거나 집약적인 작업 부하에서 강력한 성능이 필요합니다. 우리는 2024년 8월 13일 릴리스의 DLIO 벤치마크 버전 2.0을 사용했습니다.
벤치마킹에 실제 시나리오가 반영되었는지 확인하기 위해 LLAMA 3.1 405B 모델 아키텍처를 기반으로 테스트했습니다. 모델 매개변수, 최적화 상태 및 레이어 상태를 캡처하기 위해 torch.save()를 사용하여 체크포인트를 구현했습니다. 우리의 설정은 4방향 텐서 병렬 처리와 8개의 GPU에 분산된 2방향 파이프라인 병렬 처리를 갖춘 하이브리드 병렬 처리 전략을 사용하여 8개의 GPU 시스템을 시뮬레이션했습니다. 이 구성으로 인해 체크포인트 크기는 1,636GB가 되었으며 이는 현대의 대규모 언어 모델 교육 요구 사항을 나타냅니다.
DLIO 평균 합격 결과에서 Kingston DC3000ME 7.68TB는 상위 경쟁자보다 약간 뒤처져 5개 드라이브 팩의 중간에 도달했습니다. 체크포인트 시간은 첫 번째 패스에서 평균 465.04초, 두 번째 패스에서 584.38초, 세 번째 패스에서 590.30초였습니다. Pascari X200P 7.68TB(세 패스 모두에서 가장 높은 시간을 기록하여 패스 3에서 674.48초에 도달)보다 지속적으로 빠르지만 Kingston DC3000ME는 Micron 9550 7.68TB 및 Solidigm PS1010 7.68TB보다 뒤처졌습니다. 둘 다 최종 패스에서 565초 미만을 유지했습니다.
아래 차트에서 볼 수 있듯이 Kingston DC3000ME는 초기 체크포인트 시간이 최상위 경쟁업체와 거의 일치하면서 강력한 출발을 보였습니다. 체크포인트 1에서는 469.27초를 기록했는데, 이는 464.01초로 Micron 9550 바로 뒤, 472.65초로 Pascari X200P보다 앞섰습니다. 체크포인트 2부터 4까지 461.92~465.44초의 일정한 범위를 유지했습니다. 다시 한번 Micron 9550 및 Solidigm PS1010에 가깝게 유지되었으며 둘 다 453~465초 범위에 맴돌았습니다.
테스트 중간(체크포인트 5~8)에 Kingston DC3000ME는 체크포인트 시간이 급증하여 체크포인트 7에서 최고 613.01초를 기록했습니다. 이는 Micron 9550(570.42초) 및 SanDisk SN861 7.68TB(559.56초)보다 높았지만 여전히 Pascari X200P(최고 수준에 도달)보다 훨씬 뛰어났습니다. 같은 간격 동안 694.38초). 테스트가 끝날 무렵 Kingston DC3000ME는 약간 안정화되어 체크포인트 12의 경우 571.36초로 완료되었습니다. 이는 Micron 9550보다 약 28초 느리지만 여전히 Pascari X200P(689.68초로 종료)를 능가합니다. 전반적으로 Kingston DC3000ME 7.68TB는 일관된 성능을 보여주었고 검사 작업 부하 전반에 걸쳐 경쟁력 있는 범위 내에서 유지되어 팩의 중간에 배치되었습니다.
FIO 성능 벤치마크
일반적인 업계 지표에 걸쳐 각 SSD의 스토리지 성능을 측정하기 위해 FIO를 사용했습니다. 각 드라이브는 순차 쓰기 워크로드로 2개의 전체 드라이브를 채우는 사전 조정 단계와 꾸준한 성능 측정을 포함하여 동일한 테스트 프로세스를 거쳤습니다. 각 워크로드 유형이 변경됨에 따라 새로운 전송 크기에 대한 또 다른 사전 조정 채우기를 실행했습니다.
이 섹션에서는 다음 FIO 벤치마크에 중점을 둡니다.
-128K 순차
-64K 무작위
-16K 무작위
-4K 랜덤
대용량 전송 크기를 위해 설계된 대용량 QLC SSD를 사용하면 쓰기 속도 테스트가 16K 무작위로 제한됩니다. 4K의 경우 16K 워크로드의 미리 채워진 상태를 사용하여 4K 무작위 읽기 성능만 측정했습니다.
128K 순차 전제조건(IODepth 256 / NumJobs 1)
이 대규모 대기열 사전 조정 테스트에서 Kingston DC3000ME는 1,000초 실행 동안(800초 표시를 바로 지나서 완료됨) 8,944.9MB/s의 꾸준한 쓰기 대역폭을 유지했습니다. Kingston DC3000ME는 가장 빠르지는 않지만(10.3GB/s로 최고치를 기록한 Micron 9550에 약간 뒤처짐) 최소한의 차이로 일관된 처리량을 보여주었습니다.
128K 순차 전제 조건 대기 시간(IODepth 256 / NumJobs 1)
128K 순차 쓰기 전제 조건 대기 시간 테스트에서 Kingston DC3000ME는 3.577ms(최소한의 변동으로 시간이 지나도 안정적으로 유지됨)의 평균 대기 시간을 보여 Micron 드라이브에 이어 2위를 차지했습니다.
128K 순차 쓰기(IODepth 16 / NumJobs 1)
128K 순차 쓰기 테스트에서 Kingston DC3000ME는 8,477.4MB/s를 달성하여 Micron 9550(10,354.6MB/s로 그룹 선두) 바로 뒤를 이었습니다. Kingston DC3000ME는 Pascari X200P보다 성능이 뛰어났으며 Solidigm PS1010과 SanDisk SN861(각각 약 7,100MB/s)에 비해 확고한 선두를 유지했습니다. Kingston의 성능은 속도와 일관성 사이의 강력한 균형을 반영합니다.
128K 순차 쓰기 지연 시간(IODepth 16 / NumJobs 1)
128K 순차 쓰기 대기 시간 테스트에서 Kingston DC3000ME는 235.6μs의 평균 대기 시간으로 견고한 결과를 제공했습니다. 이는 SanDisk SN861(280.7μs)과 Solidigm PS1010(280.3μs)보다 앞서며 Pascari X200P(238.6μs)보다 약간 앞서 있습니다. Kingston DC3000ME는 Micron 9550(192.9μs에서 선두)만큼 빠르지는 않지만 경쟁력을 유지했습니다.
128K 순차 읽기(IODepth 64 / NumJobs 1)
단일 작업으로 대기열 깊이 64의 128K 순차 읽기 테스트에서 Kingston DC3000ME는 13,513.8MB/s를 달성했습니다. 테스트된 드라이브 중 4위를 차지했지만 여전히 강력한 처리량을 제공했습니다(실제 차이는 최소화됨). Pascari X200P(14,242.1MB/s)에 약 5.1%, Solidigm PS1010(14,163.3MB/s)에 4.6%, Micron 9550(14,050.1MB/s)에 약 3.8% 뒤졌지만 SanDisk SN861보다 여유 있게 앞섰습니다. (12,631.2MB/초). 전반적으로 Kingston DC3000ME의 결과는 최고 테스트를 거친 드라이브에 비해 감소가 최소화되어 강력했습니다.
128K 순차 읽기 지연 시간(IODepth 64 / NumJobs 1)
지연 시간의 경우 Kingston DC3000ME는 평균 591.6μs를 기록하여 그룹 중간에 위치했습니다. 이 결과는 마이크론 9550(569.0μs)보다 5.4% 높았고, 솔리드다임 PS1010(564.5μs)보다는 5.4% 낮았다. Pascari X200P는 561.4μs에서 약간 앞선 반면 SanDisk SN861은 633.0μs에서 가장 느린 응답을 보였습니다. 궁극적으로 Kingston DC3000ME는 높은 대기열 깊이 읽기 조건에서 상대적으로 낮은 대기 시간을 유지했습니다.
64K 무작위 쓰기
64K 무작위 쓰기 테스트에서 Kingston DC3000ME는 다양한 대기열 깊이와 스레드 조합에 걸쳐 지속적으로 높은 성능을 제공했으며, 32(IO 깊이)/8(작업 수) 구성에서 최고 6,649MB/s를 기록했습니다. 이는 모든 작업 부하 및 테스트 지점에서 가장 높은 것 중 하나입니다.
차트 전체에서 Kingston DC3000ME는 4,000~5,000MB/s의 안정적인 대역폭 추세를 유지했으며 특히 중간 및 높은 동시성 설정(예: 5,380MB/s에서 32/4, 5,017MB/s에서 16/8)에서 강력한 성능을 보였습니다. 가벼운 조건(1/4, 2/4)에서도 4,200MB/s 이상을 유지했다. 다른 드라이브와 비교하여 Kingston DC3000ME는 일반적으로 대부분의 테스트 지점에서 선두에 섰거나 그 상태를 유지하여 높은 최대 처리량과 일관된 성능을 모두 제공했습니다.
64K 무작위 쓰기 지연 시간
64K 임의 쓰기 대기 시간 테스트에서 Kingston DC3000ME는 대부분의 대기열 깊이와 작업 조합에서 지속적으로 낮은 응답 시간을 제공하여 부하가 심한 경우에도 강력한 쓰기 효율성을 보여주었습니다.
예를 들어:
- 4/1에는 49μs를 보였습니다.
- 8월 1일에는 지연 시간이 102μs로 낮게 유지되었습니다.
- 16/4에서는 1,486μs로 측정되었습니다.
- 그리고 가장 높은 테스트 부하인 32/8에서는 2,402μs에 도달했습니다.
이러한 결과는 Kingston DC3000ME가 예측 가능하게 확장되어 다른 드라이브, 특히 3,000~6,000μs(특히 16/8) 이상의 불규칙한 점프를 보인 Pascari 및 Solidigm 모델에서 볼 수 있는 심각한 대기 시간 스파이크를 피했음을 나타냅니다.
64K 무작위 읽기
64K 무작위 읽기 테스트에서 Kingston DC3000ME는 전체 IOlength/NumJobs 매트릭스에 걸쳐 강력하고 일관된 성능을 제공하여 테스트가 끝날 때까지(약간의 차이로) 4위를 차지했습니다. 최대 대역폭은 32/4에서 13,515MB/s에 도달했으며, 16/4(13,482MB/s) 및 32/8(13,512MB/s)에서도 비슷하게 높은 처리량을 보여 과도한 병렬 읽기 작업 부하에서 탁월한 확장성을 보여주었습니다. 더 낮은 로드(1/4 및 2/2)에서 Kingston DC3000ME는 각각 2,298MB/s 및 2,234MB/s를 측정했습니다.
64K 무작위 읽기 지연 시간
Kingston DC3000ME의 64K 대기 시간은 모든 테스트 지점에서 상대적으로 낮게 유지되었습니다. 모든 드라이브는 비슷한 성능을 보였지만 SanDisk SN861은 테스트가 끝날 때 다른 드라이브보다 눈에 띄게 더 높았습니다. Kingston DC3000ME는 1/2에서 시작하여 106μs를 측정했고, 그 뒤를 이어 1/4에서 108μs, 8/1에서 131μs, 4/4에서 133μs, 8/4에서 177μs를 측정했습니다. 동시성이 높을수록 16/4에서는 305μs, 32/1에서는 174μs, 32/2에서는 301μs로 증가했으며, 32/8에서는 1,184μs로 최고치를 기록했습니다. 이는 그룹의 나머지 부분과 일치합니다. 전반적으로 Kingston DC3000ME의 대기 시간 프로필은 최소한의 지터 또는 이상치 스파이크(테스트된 모든 드라이브에 공통)를 사용하여 최고 성능 제품과 밀접하게 추적되었습니다.
16K 무작위 쓰기
16K 무작위 쓰기 테스트에서 Kingston DC3000ME는 대기열 깊이 및 스레드 수의 전체 범위에 걸쳐 강력한 대역폭을 제공하여 경쟁 드라이브 중 2위를 차지했습니다. 32/16 구성에서 427,592 IOPS를 기록했습니다. 다른 고성능 지점에는 32/8에서 338,521 IOPS, 16/4에서 251,428 IOPS, 1/8에서 226,606 IOPS가 포함되었으며 모두 다양한 병렬 로드에서 탁월한 컨트롤러 효율성을 보여주었습니다. 적당한 로드 설정(2/16 및 1/4)에서도 드라이브는 각각 218,300 IOPS 및 204,867 IOPS를 달성했습니다. 전반적으로 Kingston DC3000ME는 테스트 매트릭스 전체(일부 영역 제외)에서 지속적으로 160,000 이상의 IOPS를 달성하여 이 워크로드에서 더욱 균형 잡힌 드라이브 중 하나가 되었습니다.
16K 무작위 쓰기 지연 시간
Kingston DC3000ME의 16K 쓰기 대기 시간 성능은 탁월하여 순위표 1위를 차지했습니다(Pascari 드라이브는 약간 뒤처짐). 하이라이트에는 1/1에서 14μs, 2/1에서 18μs, 1/4에서 19μs, 1/2에서 29μs가 포함되었습니다. 부하가 증가함에 따라 Kingston은 강력한 대기 시간 프로필(8/4에서 126μs, 2/16에서 146μs, 16/4에서 254μs, 16/8에서 575μs)을 유지했습니다. 가장 무거운 구성(32/16)에서도 대기 시간은 1,197μs로 제어되었습니다.
16K 무작위 읽기
16K 무작위 읽기 조건에서 Kingston DC3000ME는 8/8에 도달할 때까지 일관되게 강력한 성능을 보여주다가 약간 뒤쳐지기 시작했습니다. 최대 IOPS는 QD32에서 4개 작업으로 800K(648,686)에 약간 못 미쳤고, 그 뒤를 이어 QD4에서 16개 작업으로 641K IOPS, QD16에서 4개 작업으로 623K IOPS를 기록했습니다. 불행하게도 Kingston DC3000ME는 SanDisk 드라이브와 함께 순위표 최하위권에 머물렀습니다.
16K 무작위 읽기 지연 시간
최대 처리량(QD8/8)에서 Kingston DC3000ME의 대기 시간은 99μs에 불과했으며 약 16/8까지 대부분의 구성에서 좁고 낮은 대기 시간 대역 내에 머물렀다가 약해지기 시작했습니다. 가장 좋은 대기 시간은 QD1/4(74μs)에서 관찰되었으며, 큐 깊이가 낮거나 보통인 경우 80μs 미만의 다른 결과도 여러 개 있었습니다. 더 높은 부하(예: QD32/16)에서 Kingston DC3000ME는 826μs를 기록했는데, 이는 테스트를 거친 다른 드라이브(SanDisk 제외)보다 상당히 높은 수치입니다.
4K 무작위 읽기
4K 무작위 읽기 테스트에서 Kingston DC3000ME는 테스트 범위 전반에 걸쳐 탁월한 확장성을 보여 16/16 구성에서 최고 1,957.92K IOPS를 기록했습니다. 8월 32일에 1,923.42K IOPS, 8월 16일에 1,361.32K IOPS, 16/8에 1,326.03K IOPS의 높은 처리량을 유지하여 Solidigm 및 Micron과 함께 지속적으로 리더보드 1위에 올랐습니다.
4K 무작위 읽기 지연 시간
Kingston DC3000ME는 1/1 구성에서 60μs부터 시작하여 4K 무작위 읽기 테스트 전반에 걸쳐 낮은 대기 시간을 유지했습니다. 1/4에서는 61μs로 약간 개선되었고, 1/8에서는 63μs로 안정적으로 유지되었습니다. 동시성이 증가함에 따라 대기 시간은 예상대로 확장되었습니다. 2/4에서 66μs, 2/16에서 67μs, 4/4에서 71μs, 8/4에서 80μs입니다. 더 무거운 구성에서는 16/4에서 94μs, 16/8에서 99μs, 32/8에서 135μs, 32/16에서 최고 266μs로 완만하게 증가했습니다.
4K 무작위 쓰기
4K 무작위 쓰기에서 Kingston DC3000ME는 32/16에서 최대 979,636 IOPS, 32/8에서 979,173 IOPS로 강력한 성능을 보여 최고 성능(최고 성능에서 160만 IOPS를 초과한 Pascari X200P)보다 훨씬 뒤처졌습니다. 즉, Kingston DC3000ME는 중급 부하에서 상당한 수치를 기록했습니다. 즉, 8월 16일에 879K IOPS, 16월 16일에 944K IOPS, 16/4에 745K IOPS입니다.
4K 무작위 쓰기 지연 시간
무작위 쓰기 대기 시간에서 Kingston DC3000ME는 1/1 미만의 11μs에서 시작하여 8/8 깊이에 도달할 때까지 약 20~50μs를 유지했으며 32/8에서는 261μs, 32/16에서는 522μs로 확장되었습니다. 지연 시간이 가장 낮지는 않았지만 Kingston DC3000ME는 16개 스레드를 넘어서 더 큰 변동성을 보인 Solidigm 및 Pascari와 같은 드라이브에서 볼 수 있는 스파이크 없이 예측 가능하고 적당한 확장성을 유지했습니다.
GPU 다이렉트 스토리지
이 테스트벤치에서 수행한 테스트 중 하나는 Magnum IO GPU Direct Storage(GDS) 테스트였습니다. GDS는 NVMe 드라이브나 기타 고속 저장 장치에 저장된 데이터에 액세스할 때 GPU가 CPU를 우회할 수 있도록 NVIDIA에서 개발한 기능입니다. GDS는 CPU와 시스템 메모리를 통해 데이터를 라우팅하는 대신 GPU와 저장 장치 간의 직접 통신을 가능하게 하여 대기 시간을 크게 줄이고 데이터 처리량을 향상시킵니다.
GPU 다이렉트 스토리지 작동 방식
일반적으로 GPU가 NVMe 드라이브에 저장된 데이터를 처리할 때 데이터는 GPU에 도달하기 전에 먼저 CPU와 시스템 메모리를 통과해야 합니다. 이 프로세스에서는 CPU가 중개자 역할을 하여 대기 시간이 추가되고 귀중한 시스템 리소스가 소모되므로 병목 현상이 발생합니다. GPU 다이렉트 스토리지는 GPU가 PCIe 버스를 통해 스토리지 장치의 데이터에 직접 액세스할 수 있도록 하여 이러한 비효율성을 제거합니다. 이 직접 경로는 데이터 이동 오버헤드를 줄여 더 빠르고 효율적인 전송을 가능하게 합니다.
AI 워크로드, 특히 딥 러닝은 데이터 집약적입니다. 대규모 신경망을 훈련하려면 테라바이트 규모의 데이터를 처리해야 하며, 데이터 전송이 지연되면 GPU 활용도가 낮아지고 훈련 시간이 길어질 수 있습니다. GPU 다이렉트 스토리지는 데이터가 가능한 한 빨리 GPU에 전달되도록 보장하고 유휴 시간을 최소화하며 계산 효율성을 최대화함으로써 이러한 문제를 해결합니다.
또한 GDS는 대규모 데이터 세트 스트리밍(예: 비디오 처리, 자연어 처리 또는 실시간 추론)과 관련된 워크로드에 특히 유용합니다. GDS는 CPU에 대한 의존도를 줄여 데이터 이동을 가속화하고 다른 작업에 CPU 리소스를 확보하여 전체 시스템 성능을 더욱 향상시킵니다.
읽기 처리량
GDSIO 순차 읽기 테스트 전반에 걸쳐 Kingston DC3000ME는 16K, 128K 및 1MB 블록 크기에 걸쳐 일관되고 효율적인 처리량 확장을 보여주었습니다. 하지만 성능 추세는 전송 크기에 따라 약간씩 다릅니다. 16K 블록의 경우 처리량은 스레드 수가 증가함에 따라 꾸준히 증가하여 32개 스레드로 최대 3.70GiB/s에 도달한 후 128개 스레드로 점차 3.41GiB/s로 감소했습니다. 128K 전송의 경우 드라이브는 16개 스레드에서 5.88GiB/s라는 최상의 결과를 달성했으며, 32개 스레드를 통해 이 수준을 유지한 후 128개 스레드별로 ~5.35GiB/s로 떨어졌습니다. 1MB에서 처리량은 이전에 정체되어 16개 스레드에서 6.54GiB/s를 달성하고 128개 스레드에서 5.91GiB/s로 완만하게 감소했습니다.
읽기 지연 시간
대기 시간 측면에서 DC3000ME는 예측 가능한 확장성을 보여주었습니다(테스트된 모든 드라이브와 일치). 스레드 수가 적으면 모든 블록 크기에 걸쳐 응답 시간이 낮아지고 스레드가 확장되면 대기 시간이 늘어납니다. 16K에서 지연 시간은 504μs에서 시작하여 128개 스레드로 점차 582μs로 증가했습니다. 128K의 경우 대기 시간은 260μs에서 시작하여 가장 높은 스레드 수에서 3,228μs로 증가했습니다. 1MB 블록의 경우 지연 시간은 더 무거운 페이로드로 인해 스레드 1개에서 2,609μs에서 시작하여 128개 스레드에서 2,703μs로 증가하여 더 큰 점프를 보여주었습니다.
쓰기 처리량
읽기 작업의 경우 16K 블록의 평균 대기 시간은 단일 스레드에서 2,247μs에서 시작하여 128개 스레드에서 504μs로 감소하여 동시성에서 효율적인 확장을 보여줍니다. 128K 블록의 경우 지연 시간은 처음에 4,035μs에서 시작하여 128개 스레드에서 점차적으로 2,601μs로 감소했습니다. 1M 블록을 갖춘 Kingston DC3000ME는 스레드 1개에서 2,609μs에서 시작하여 128개의 스레드를 통해 2,500~2,700μs 범위로 유지
연락처 세부 사항
Beijing Qianxing Jietong Technology Co., Ltd.
담당자: Ms. Sandy Yang
전화 번호: 13426366826



