在谷歌Bigquery ....我已经成功加载后从googlstorage加载了一个1.5GB的csv文件,....我的表大小是250MB为什么会这样?
可能因为数字的二进制编码比将它们编码为字符串更有效.例如,字符串"1234567890"需要10个字节(至少,如果是UTF-16编码,则为20个字节),但它可以用4字节整数表示,只需要4个字节.
"1234567890"
此外,bigquery中的表也可以省略分隔符,因为它知道每个字段宽的字节数.这是为每个保存的另一个字节,.
,