SAS Intelligence Platform의 데이터 저장으로는 다음과 같은 선택지가 있다.
- SAS data sets(Table) (기본 SAS 스토리지)
- SAS 테이블은 SAS 소프트웨어가 생성하고 처리하는 파일이며, SAS 라이브러리의 구성요소이다.
- SAS 라이브러리는 하나 또는 여러 개의 SAS 파일의 집합이며, SAS 파일은 SAS 소프트웨어에서 인식, 참조, 저장되는 하나의 단위이다.
- 관계형 DB 테이블과 유사.
- SAS 소프트웨어에서 처리될 수 있는 관측치 값(행)과 변수(열)로 이루어진 테이블에 의해 구성된 데이터를 포함.
- 데이터 타입, 열 길이, 데이터를 생성하는데 사용되는 SAS 엔진과 같은 데이터 디스크립터(descriptor)를 포함.
- SAS 테이블에 대한 공유 엑세스의 경우, 다수의 사용자에 대한 SAS 파일 동시 업데이트 액세스를 제공하는 'SAS/SHARE' 소프트웨어를 사용하면 됨. - SAS SPD(Scalable Performance Data) Engine tables
- SAS SPD Engine은 BASE SAS 소프트웨어에 포함되어 있음.
- 단일 유저 데이터 저장소 솔루션으로, SAS SPD Server와 함께 고성능 병렬 처리 및 병렬 I/O(다중 스레드 사용 가능) 기능을 공유하지만, 다중 유저 서버 환경에서의 추가적인 복잡성을 지원하기에는 적합하지 않음.
- 몇몇 OS에서의 2GB 파일크기 제한을 넘어 확장되는 테이블을 포함하여 수백만개의 관측값이 포함된 테이블들을 읽고 쓸 수 있음.
- 파일 사이즈가 큰 SAS 데이터셋을 '간소화된 파일 형식(streamlined file format)'으로 어플리케이션에 제공하는데, 이 간소화된 파일 형식은 다중 CPU 및 I/O 채널들이 병렬 I/O 기능을 수행할 수 있게끔 함. - SAS SPD Server(별도의 제품으로 제공됨.)
- SAS SPD Engine에 추가적으로 포괄적인 보안 인프라, 백업/복원 유틸리티, 정교한 관리 및 튜닝 옵션을 갖춘
다중 사용자 병렬 처리 데이터 서버. - SAS OLAP cubes
- OLAP : 사용자가 다차원 DB 테이블(큐브)에 저장된 데이터를 동적으로 분석할 수 있도록 하는 소프트웨어 기술.
- 다차원 DB(큐브) : SAS Intelligence Platform에서 제공하는 또 다른 스토리지 옵션으로, *드릴다운 기능을 통해 비즈니스 사용자에게 다양한 데이터 보기를 제공.
- 큐브는 SAS Data Integration 또는 SAS OLAP Cube Studio에 있는 'Cube Designer wizard' 를 통해 생성될 수 있으며, 이는 SAS 테이블, SAS SPD Engine 테이블, SAS/ACCESS DB 테이블 등으로부터 파생된다.
- SAS Business Intelligence 어플리케이션은 MDX(Multi-Dimensional Expression) 쿼리 랭귀지를 이용하여 큐브에 대한 쿼리를 수행하며, 이때 큐브들은 다음에 나오는 툴들을 사용하여 SAS OLAP 서버에 연결된 클라이언트 응용 프로그램에서 액세스할 수 있다.
=> OLAP용 SQL pass-through 기능 : PROC SQL 환경 내에서 MDX 쿼리를 처리하도록 설계됨
/ OLAP 및 ADO MD용 OLE DB와 같은 개방형 액세스 기술 - SAS Web Infrastructure Platform Data Server
- 'SAS Content Server'의 데이터 뿐만 아니라, 댓글, 알림과 같은 중간 계층 데이터의 default 저장소.
- 일반적인 데이터 저장 목적으로는 사용될 수 없으며, 주로 타사 DBMS를 사용하는 것에 대한 대안으로 제공됨. - 타사 데이터 저장소 및 ERP 시스템을 활용
- SAS/ACCESS 인터페이스 : 다양한 데이터 저장소에 대한 직접 접근 기능(복사본을 따로 만들지 않음)을 제공.
- SAS/ACCESS 엔진은 응용 프로그램이 한번에 하나의 레코드만 읽는 대신 전체 데이터 블록을 읽을 수 있도록 하는 I/O 서브 시스템을 사용.
=> I/O 병목 현상을 줄이고 프로시저가 처리할 수 있는 한 빠르게 데이터를 읽을 수 있음.
- SAS In-Database : 네트워크를 통한 데이터 이동을 최소화하는 동시에 정교한 쿼리를 가능하게 하고 결과를 보다 빠르게 생성하게 해주는 기술. SAS 솔루션, SAS 분석 프로세스 및 타사 DBMS를 통합하는 기능 제공.
DB 내에서 스코어링 모델, Base SAS 및 SAS/STAT 프로시저, 정형화된 SQL 쿼리 실행 가능.
- Oracle, Sybase, DB2, SQL Server 및 Teradata와 같은 RDMBS 활용 가능
- SAS Data Surveyor for SAP : SAP R/3 와 SAP Business Warehous 시스템으로부터 직접 데이터를 읽어들이는 SAS Data Integration Studio 작업들을 구축할 수 있게 해줌.
- 블록으로 분할되어 함께 작동하는 연결된 여러 노드에 저장되는 Hadoop 데이터 저장 가능
- IBM IMS(정보 관리 시스템)와 같은 계층적 데이터베이스 저장 가능
- 네트워크 모델 데이터베이스 시스템인 Computer Associates CA-IDMS(통합 DB 관리 시스템) 저장 가능
출처
https://go.documentation.sas.com/doc/en/bicdc/9.4/biov/p1hjj986ud7plwn14igulkk40cd6.htm
https://go.documentation.sas.com/doc/en/bicdc/9.4/biov/n1grfcwipq5x7gn1g65yxgbdm30t.htm
'Middleware > 기타' 카테고리의 다른 글
[SAP] SAP 및 SAP Netweaver의 정의, ECC 코어 모듈, 아키텍처 (0) | 2022.03.04 |
---|---|
[SAS] SAS License Renewal (라이선스 갱신) (0) | 2022.02.17 |
[SAS] 2. SAS Viya(바이아) 아키텍처 (0) | 2022.02.09 |
[SAS] 0. SAS Intelligence Platform 아키텍처 개요 (0) | 2022.02.08 |
최근댓글