본문 바로가기

카테고리 없음

[Azure] AZ-104 Azure 관리자 필수 조건 - 데이터 스토리지 접근 방식

애플리케이션 데이터는 구조적, 반구조적, 비구조적이라는 세 가지 방법 중 하나로 분류할 수 있다.

1. 데이터 분류

1) 정형 데이터

관계형 데이터라고 하는 정형 데이터는 stict 스키마를 준수하는 데이터이므로 모든 데이터에 동일한 필드 또는 속성이 있다. 공유 스키마를 사용하면 SQL과 같은 쿼리 언어로 이러한 유형의 데이터를 쉽게 검색할 수 있다. 이 기능을 통해 CRM 시스템, 예약 및 재고 관리와 같은 애플리케이션에 적합하다.

 

정형 데이터는 종종 테이블의 한 행이 다른 테이블의 다른 행에 있는 데이터와 어떻게 관련되어 있는지 나타내기 위해, 키 열과 함께 행과 열이 있는 데이터 베이스 테이블에 저장된다. 

2) 반정형 데이터

반정형 데이터는 정형 데이터보다 덜 조직화되어 있으며, 필드가 테이블, 행 및 열에 제대로 맞지 않으므로 관계형 형식으로 저장되지 않는다. 반정형 데이터에는 데이터의 계층과 조직을 명핵하게 하는 태그가 포함된다. 반정형 데이터는 비관계형 또는 NoSQL 데이터라고도 한다. 이 스타일의 데이터식 및 구조는 serialization 언어에 의해 정의된다.

 

소프트웨어 개발자의 경우, 데이터  serialization 언어를 사용해 메모리에 저장된 데이터를 파일에 작성하고, 다른 시스템으로 전송하며, 구문 분석하고 판독하므로 데이터 serialization 언어가 중요하다. 발신자와 수신자는 다른 시스템의 세부 정보를 알 필요가 없다. 동일한 serialization 언어가 사용되는 한, 양쪽 시스템에서 데이터를 이해할 수 있다.

3) 일반 형식

  • XML : 일반적인 지원을 받을 수 있는 데이터 언어 중 하나이다. 텍스트 기반이므로 사람과 머신이 쉽게 읽을 수 있다. 그러나 복잡한 데이터를 표현하는 경우 장황해 지기 쉽다. 이 과정에서 네트워크를 통해 저장, 처리, 전달하는 과정에서 부하가 늘어난다.
  • JSON(JavaScript Object Notation) 간단한 사양이며 중괄호를 사용하여 데이터 구조를 표시한다. XML과 비교하여 덜 자세한 정보를 표시하여 사용자가 더 쉽게 읽을 수 있다. 웹 서비스에서 데이터를 반환하는데 자주 사용된다.
  • YAML(YAML Ain't Markup Language)는 사람이 쉽게 읽을 수 있으므로 부분적 인지도가 빠른 언어이다. 데이터 구조는 줄 분리 및 들여쓰기로 정의도며 괄호, 쉼표 및 대괄호와 같은 구조적 문자에 덜 의존하게 된다.

4) 비정형 데이터

비정형 데이터는 보통 사진 또는 비디오 같은 파일에 제공된다.

  • 사진, 비디오, 오디오 파일 등의 미디어 파일
  • Word 문서 등의 Office 파일
  • 텍스트 파일
  • 로그 파일

2. Azure에서 스토리지 솔루션 선택

1) 제품 카탈로그 데이터

데이터 분류 : 새 제품에 대한 스키마를 확장하거나 수정할 필요로 인해 반 구조적

작업:

  • 고객에게는 데이터베이스 내에서 여러 필드를 쿼리하는 기능과 함께 읽기 작업이 많이 필요
  • 비즈니스에서는 지속적으로 변하는 재고를 추적하려면 쓰기 작업이 필요

대기 시간 및 처리량: 높은 처리량/짧은 대기 시

트랜잭션 지원: 모든 데이터가 기록이지만 변경되기 때문에 트랜잭션 지원이 필요.

2) Azure Cosmos DB

Azure Cosmos DB는 반구조적 데이터 또는 NoSQL 데이터를 지원한다. Azure Cosmos DB는 쿼리에 대한 SQL을 지원하고, 모든 속성이 기본적으로 인덱싱 된다. 고객이 카탈로그의 모든 속성을 필터링할 수 있도록 쿼리를 만들 수 있다.

전 세계 어디에서나 데이터를 복제할 수 있다. 요건에 맞게 데이터를 복제하여 대기 시간을 줄일 수 있다. 또한 시간에 따라 규모를 줄이고 확대할 수 있다.

3) Azure SQL Database

변수 속성을 식별할 수 있는 경우 Azure SQL Database가 적합하다. 정형 데이터와 쉽게 확장할 수 있는 JSON 열로 저장된 반정형 데이터를 결합할 수 있다. Azure SAL Database는 Azure Cosmos DB와 동일한 이점이 많지만, 데이터의 구조가 다른 엔터티에서 변경되는 경우 이점은 거의 없다. Azure Database에서는 인덱싱해야 하는 반구조적 문서의 속성을 명시적으로 정의해야 한다.