Zzong's Notes

Home

❯

hadoop

❯

Apache Parquet

Apache Parquet

2026년 6월 14일1 min read

Apache Parquet

  • Apache Parquet 는 Hadoop 에코시스템에서 사용하는 columnar storage 이다.

B) Related

C) References


링크된 언급

1
TFRecord

...st=tf.train.FloatList(value=[value])) 와 같이 TFRecord 에 저장할 모든 데이터는 TensorFlow 에서 제공하는 데이터 타입으로 변환해야 한다. Apache Parquet 과의 상호 변환 문제 TFRecord 변환 과정에서 사용한 tokenize, 이미지 인코딩 등의 값을 기존에 사용하던 parquet 에 추가 후 업로드 할 때 tf.data.examp...

  • Apache Parquet
  • B) Related
  • C) References