2023年2月14日 星期二

Google Cloud BigQuery傳輸問題

GCE VM 上,使用 Python Client BigQuery API查詢資訊時,如果有遇到Network 導出傳輸速率非常慢的情形。可以先嘗試排除配置不足的傳輸問題,但如仍有此情況。則可以安裝Google Cloud BigQuery Storage

 

因目前Google Cloud BigQuery 的用戶主要為以下兩種訪問的方式:


1.
使用 tabledata.list jobs.getQueryResults REST API 方法存取基於記錄的分頁。 BigQuery API以分頁方式提供結構化的行響應,適合小型結果集。


2.
使用 BigQuery 提取作業批量導出數據,將表數據以各種文件格式(如 CSVJSON Avro)導出到 Cloud Storage。數據的導出受到每日配額和導出過程的批處理性質的限制。



而透過BigQuery Storage Read API 提供了第三個對先前選項的改進 當使用 Storage Read API 時,結構化數據以二進制序列化格式通過網絡發送。 這使得一組結果的多個使用者之間可以有額外的並行性。
Storage Read API 不提供與管理 BigQuery 資源(例如數據集、作業或表)相關的功能。

沒有留言:

張貼留言

搜尋此網誌