많은 기업에서 데이터 웨어하우스는 전략적 자산에서 운영 부담으로 변모했습니다. Teradata와 같은 오랜 독점 플랫폼은 Snowflake와 같은 클라우드 전용 서비스와 함께 확장성과 성능을 제공했지만 공급업체 종속, 예상치 못한 가격 책정 및 제한된 아키텍처 적응성을 희생했습니다.
규제 조사가 강화되고 AI 기반 분석이 경쟁 우위의 핵심이 되면서 조직은 현재 창고 플랫폼이 실제로 장기적인 비즈니스 목표와 일치하는지 여부를 재평가하고 있습니다.
EDB Postgres® AI(EDB PG AI)는 성능 저하 없이 제어, 예측 가능성 및 데이터 주권을 복원하도록 제작된 오픈 소스 페타바이트 규모의 데이터 웨어하우스인 WarehousePG를 통해 이러한 과제를 정면으로 해결합니다. Postgres를 기반으로 구축되고 대규모 병렬 분석을 위해 설계된 WarehousePG는 제한적인 시스템에서 벗어나 총 소유 비용(TCO)을 최대 58%까지 절감할 수 있는 현대적인 방법을 제공합니다.
Postgres를 핵심으로 하는 오픈 소스, 페타바이트 규모 분석
이제 엔터프라이즈 데이터 웨어하우스는 원래 설계 한계를 넘어 확장되고 있습니다. 페타바이트 규모의 데이터 세트, 하이브리드 배포 요구 사항, 데이터 주권 요구 사항 및 AI 기반 분석은 모두 뛰어난 성능과 아키텍처 유연성을 모두 요구하는 프로덕션 환경에 공존합니다.
기존의 독점 플랫폼과 클라우드 전용 웨어하우스는 이러한 요구 사항을 동시에 충족하는 데 어려움을 겪고 있으며 이로 인해 조직은 비용, 제어 및 기능 간의 절충안을 찾아야 합니다.
WarehousePG용 EDB Postgres AI는 Postgres를 기반으로 구축된 완전한 오픈 소스, 페타바이트 규모의 데이터 웨어하우스를 제공하여 이러한 격차를 해소합니다. 고성능 분석, 데이터베이스 내 AI, 온프레미스, 클라우드 및 하이브리드 환경 전반의 유연한 배포를 위해 설계된 이 제품은 레거시 및 클라우드 전용 시스템의 한계를 해결합니다.
아키텍처: 대규모 Postgres 기반 MPP
WarehousePG의 MPP(대량 병렬 처리) 아키텍처를 사용하면 수백 개의 노드에 걸쳐 확장할 수 있습니다. 단일 서버 확장 모델에 의존하는 대신 중앙 코디네이터 노드가 감독하는 여러 세그먼트 노드에 데이터와 쿼리 실행을 모두 분산합니다.
코디네이터는 쿼리 구문 분석, 최적화 및 실행 계획을 처리합니다. 쿼리 계획이 완료되면 작업은 로컬 데이터 파티션에서 병렬로 작동하는 세그먼트에 분산됩니다. 이 접근 방식을 통해 WarehousePG는 페타바이트 규모의 데이터 세트에서 대규모 조인, 집계, 창 기능 및 변환을 포함한 복잡한 분석 쿼리를 효율적으로 실행할 수 있습니다.
이 아키텍처는 Postgres와의 전체 SQL 호환성을 유지하면서 모놀리식 데이터베이스의 고유한 병목 현상을 제거하여 기존 데이터 팀의 학습 곡선을 크게 줄입니다.
독점 제한 없이 예측 가능한 성능
소비 기반 가격 책정 및 불투명한 리소스 관리에 의존하는 클라우드 네이티브 웨어하우스와 달리 WarehousePG는 결정적인 워크로드 동작과 일관된 성능을 제공합니다. 리소스 할당 및 쿼리 실행은 클러스터 내에서 완전히 제어되므로 혼합된 분석 워크로드에서도 안정적인 응답 시간을 보장합니다.
오픈 소스 Postgres를 기반으로 구축된 Apache 2.0 라이선스 솔루션인 WarehousePG는 기업을 독점 스토리지 형식 및 공급업체가 제어하는 실행 엔진으로부터 해방시킵니다. 규정 준수를 위한 온프레미스, 탄력성을 위한 퍼블릭 클라우드, 비용 최적화를 위한 하이브리드 설정 등 조직이 필요로 하는 곳 어디에서나 데이터에 완전히 액세스하고 이동하고 배포할 수 있습니다.
이러한 아키텍처 독립성과 EDB의 코어 기반 가격 책정이 결합되어 TCO를 최대 58% 절감할 수 있습니다. 특히 고가의 독점 플랫폼이나 예측할 수 없는 클라우드 웨어하우스에서 마이그레이션하는 조직의 경우 더욱 그렇습니다.
데이터 레이크에 대한 하이브리드 스토리지 및 SQL 액세스
최신 분석 환경은 점점 더 여러 스토리지 계층에 걸쳐 확산되고 있습니다. WarehousePG는 Amazon S3 및 HDFS(Hadoop Distributed File System)와 같은 객체 저장소 및 분산 파일 시스템에 저장된 외부 데이터에 대한 직접 SQL 액세스를 가능하게 하는 플랫폼 확장 프레임워크(PXF)를 통해 이 문제를 해결합니다.
PXF를 사용하면 데이터 엔지니어는 데이터를 웨어하우스에 복사하지 않고도 Parquet, AVRO, JSON 및 CSV와 같은 형식을 쿼리할 수 있습니다. 이는 하이브리드 "웜 데이터와 콜드 데이터" 전략을 구현하는 동시에 ETL 복잡성과 스토리지 중복성을 크게 줄입니다. 즉, 자주 액세스하는 데이터 세트는 WarehousePG의 고성능 스토리지에 유지되고, 자주 사용되지 않는 데이터는 저가형 개체 스토리지에 상주합니다.
기술적인 관점에서 볼 때 이 접근 방식은 다양한 스토리지 계층 전반에 걸쳐 SQL 의미 체계를 보존하므로 분석 팀이 단일 논리적 데이터 모델로 작업할 수 있습니다.
FlowServer를 통한 실시간 수집
배치 전용 파이프라인은 더 이상 많은 분석 사용 사례에 충분하지 않습니다. WarehousePG에는 실시간 및 거의 실시간 데이터 수집을 위한 전용 FlowServer 구성 요소가 포함되어 있습니다.
FlowServer는 Apache Kafka 및 RabbitMQ와 같은 플랫폼에서 높은 처리량의 이벤트 스트리밍을 지원하여 운영 분석, 사기 탐지 및 실시간 모니터링과 같은 사용 사례를 가능하게 합니다. 스트리밍 데이터를 웨어하우스에 직접 수집함으로써 조직은 운영 시스템과 분석 통찰력 간의 대기 시간을 제거합니다.
이 아키텍처를 사용하면 동일한 분석 플랫폼 내에서 스트리밍 및 배치 워크로드가 공존하여 인프라를 단순화하고 데이터 이동을 줄일 수 있습니다.
데이터베이스 내 AI, ML 및 벡터 처리
WarehousePG용 EDB Postgres AI의 주요 기능은 데이터베이스 내 분석 및 AI를 지원하므로 대규모 데이터 세트를 외부 기계 학습(ML) 플랫폼으로 이동할 필요가 없다는 점입니다.
WarehousePG는 SQL 기반 기계 학습을 위해 MADlib를 통합하여 사용자가 친숙한 관계 구조를 사용하여 데이터베이스 내에서 직접 모델을 훈련하고 점수를 매길 수 있습니다. 고급 사용 사례의 경우 플랫폼은 데이터베이스 내 Python ML 프레임워크를 지원하므로 데이터 과학자가 데이터를 내보내지 않고도 대규모로 작업할 수 있습니다.
pgVector 확장을 통한 기본 벡터 지원을 통해 유사성 검색, 의미 검색 및 RAG(검색 증강 생성) 워크로드가 웨어하우스 내에서 직접 가능합니다. 이 기능은 구조화된 엔터프라이즈 데이터와 문서 및 로그와 같은 구조화되지 않은 콘텐츠를 결합하는 AI 기반 애플리케이션에 점점 더 중요해지고 있습니다.
WarehousePG는 데이터, 분석, AI를 중앙 집중화함으로써 파이프라인 복잡성을 줄이고 통찰력 확보 시간을 단축합니다.
고가용성 및 엔터프라이즈 준비성
WarehousePG는 생산 수준의 신뢰성을 위해 설계되었습니다. 고가용성은 대기 코디네이터를 통해 달성되므로 기본 코디네이터에 장애가 발생하더라도 중단 없는 작동이 보장됩니다. 세그먼트 수준 내결함성을 통해 개별 노드를 사용할 수 없는 경우에도 워크로드가 계속 실행될 수 있습니다.
엔터프라이즈 기능에는 워크로드 관리, 예측 가능한 쿼리 예약, 포괄적인 관찰 가능성이 포함되어 있어 분석 수요가 많을 때 안정적인 운영을 보장합니다.
결정적으로, 조직은 EDB의 Postgres 전문가로부터 연중무휴 지원을 받아 오픈 소스 유연성과 기업 운영 요구 사항 간의 격차를 해소할 수 있습니다.
중단 없는 마이그레이션
레거시 분석 플랫폼을 현대화하는 조직을 위해 WarehousePG는 위험이 낮은 경로를 제공합니다. 기존 Greenplum 워크로드는 바이너리 스왑을 통해 마이그레이션할 수 있으므로 쿼리를 다시 작성하거나 팀을 재교육하지 않고도 신속한 현대화가 가능합니다. 높은 SQL 패리티는 또한 다른 SQL 기반 독점 데이터 웨어하우스로부터의 마이그레이션을 단순화합니다.
이 접근 방식을 통해 기업은 점진적으로 현대화하여 비즈니스 연속성을 유지하는 동시에 분석 스택에 대한 제어권을 다시 확보할 수 있습니다.
최신 분석을 위한 창고 재구축
WarehousePG용 EDB PG AI는 페타바이트 규모의 분석, AI 준비성 및 데이터 주권에 독점 플랫폼이나 클라우드 종속이 필요하지 않음을 입증합니다. Postgres 호환성, MPP 확장성, 하이브리드 스토리지, 실시간 수집, 데이터베이스 내 AI 및 ML 기능을 결합함으로써 WarehousePG는 현대 엔터프라이즈 분석을 위한 기술적으로 강력한 기반을 제공합니다.
아키텍처 제어, 예측 가능한 성능 및 오픈 소스 경제성을 우선시하는 데이터 웨어하우스를 찾는 조직을 위해 WarehousePG는 강력하고 미래 지향적인 대안을 제공합니다.
베이징 Qianxing Jietong Technology Co., Ltd.
양샌디/글로벌 전략 이사
WhatsApp/위챗: +86 13426366826
이메일: yangyd@qianxingdata.com
웹사이트: www.qianxingdata.com/www.storagesserver.com
사업 초점:
ICT 제품 유통/시스템 통합 및 서비스/인프라 솔루션
20년 이상의 IT 유통 경험을 바탕으로 당사는 선도적인 글로벌 브랜드와 협력하여 신뢰할 수 있는 제품과 전문 서비스를 제공합니다.
“기술을 활용한 지능형 세상 구축” 신뢰할 수 있는 ICT 제품 서비스 제공업체!