몽고 / 몽고디비 / 몽고db / 데이터 압축 / 효율 / 데이터 사용량 / 인덱스 압축
MongoDB, WiredTiger 의 data 압축
ref. 1 의 내용을 정리했다.
WiredTiger 는 모든 collection 과 index 에 압축을 제공한다. 압축은 추가적인 cpu 사용은 늘리지만, storage 사용을 줄여준다.
기본적으로 WiredTiger 는 모든 collection 들에 대해서는 snappy compression library 를 이용한 ‘block 압축(compression)’을 사용하고, 모든 index에 대해서는’prefix 압축’을 사용한다.
collection 에 대해서 다음 block compression library들도 사용 가능한다.
- zlib
- zstd(MongoDB 4.2 부터 사용가능)
대부분의 workload들에서는 기본 압축 세팅들이 storage 효율성과 processing 요구사항들의 균형을 잡아준다.
WiredTiger journal 도 기본적으로 압축이 된다.
설정 값
- storage.wiredTiger.collectionConfig.blockCompressor : snappy 압축외에 다른 알고리즘을 사용하고 싶을때
- storage.wiredTiger.indexConfig.prefixCompression : prefix 압축을 disable 하고 싶을때 사용
compression 세팅들은 collection 생성할 때 collection 별로, index 별로 설정이 가능하다.
설정값 확인
db.printCollectionStats()
를 이용하면 확인할 수 있다.
아래 예제는 ref. 2 에서 가져왔다.
"wiredTiger" : {
"metadata" : {
"formatVersion" : 1
},
"creationString" : "allocation_size=4KB,app_metadata=(formatVersion=1),block_allocation=best,block_compressor=zlib,cache_resident=0,checkpoint=(WiredTigerCheckpoint.1=(addr=\"018181e4de542a6a8281e4f2e09da0808080808080e21fc0dfc0\",order=1,time=1440667794,size=8192,write_gen=2)),checkpoint_lsn=(2,25344),checksum=on,collator=,columns=,dictionary=0,format=btree,huffman_key=,huffman_value=,id=15,internal_item_max=0,internal_key_max=0,internal_key_truncate=,internal_page_max=4KB,key_format=q,key_gap=10,leaf_item_max=0,leaf_key_max=0,leaf_page_max=32KB,leaf_value_max=64MB,memory_page_max=10m,os_cache_dirty_max=0,os_cache_max=0,prefix_compression=0,prefix_compression_min=4,split_deepen_min_child=0,split_deepen_per_child=0,split_pct=90,value_format=u,version=(major=1,minor=1)",
"type" : "file",
댓글 없음:
댓글 쓰기