Mi pregunta está centrada en Redshift. La reformulo:
¿Es posible que importar desde Parquet sea más rápido que desde CSV, usando COPY, evidentemente? Ya no sólo por el tamaño del archivo, sino por la propia estructura de los datos de .parquet y el formato columnar de Redshift. Y porque Parquet está orientado a este tipo de repositorios.
Mi pregunta está centrada en Redshift. La reformulo:
¿Es posible que importar desde Parquet sea más rápido que desde CSV, usando COPY, evidentemente? Ya no sólo por el tamaño del archivo, sino por la propia estructura de los datos de .parquet y el formato columnar de Redshift. Y porque Parquet está orientado a este tipo de repositorios.