-
Schema On ReadData Engineer 2024. 8. 20. 15:55728x90
Legacy : Schema on Write(RDBMS)
- 관계형 데이터베이스와 연동된 기존 시스템에서는 RDBMS에 데이터를 배치하기에 앞서 데이터 스키마를 완벽하게 확정하는 데 모든 노력을 집중
- 데이터 스키마를 확정하려면 시스템 성능과 데이터 사용 패턴 등의 여러 사항을 사전에 고려해야 했고, 시스템 성능과 데이터 사용 패턴 등의 여러 사항을 사전에 고려
데이터가 복잡한 경우 데이터 스키마 합의에 상당한 시간이 소요되어 데이터 입수 및 분석 작업이 지연되는 결과를 초래
Schema on Read(NoSQL)
- 입수된 데이터가 실행 시점에 해석됨
- 데이터를 읽어들이는 스키마가 디스크에 저장된 데이터의 실제 구조와 분리 -> 데이터 저장/해석도 별개로 분리 가능
- 데이터를 서로 다른 형식으로 저장하면서도 이를 동일한 테이블 형식으로 읽어 들일 수 있음
→ 하둡과 하둡 생테계에서 사용하는 개념
입수부터 분석까지 걸리는 시간을 획기적으로 단축
데이터를 이해하고 변환하는 작업을 조직 내 각 부서에서 동시에 진행할 수 있음: 데이터 활용 사례와 공동으로 활용할 수 있는 구체화 뷰를 도출할 수 있음
NoSQL과 RDBMS의 차이는 알고 있었는데, 그 차이가 어떤 영역에서 구체적으로 적용될 수 있는지는 확실히 짚지 않았다.
이 개념들이 왜 나왔는지, 어떤 분야에 사용될 수 있으며 활용되고 있는지를 파악하는 능력을 기르는 게 중요하다는 것을 배웠다.
728x90'Data Engineer' 카테고리의 다른 글
Parquet? (1) 2024.09.30 모놀리스/마이크로서비스 (0) 2024.08.28 GlobalEventBus ? (0) 2024.05.02 Nginx (0) 2024.03.28 [Error] MySQL : Update 문 실수 시 조치 사항 (0) 2024.03.12