deltaLakeCluster Табличная Функция
Это расширение для табличной функции deltaLake.
Позволяет обрабатывать файлы из таблиц Delta Lake в Amazon S3 параллельно с нескольких узлов в указанном кластере. На инициаторе создается соединение со всеми узлами кластера и динамически распределяются файлы. На рабочем узле он запрашивает у инициатора следующую задачу для обработки и выполняет её. Это повторяется, пока все задачи не будут завершены.
Синтаксис
deltaLakeS3Cluster
является псевдонимом для deltaLakeCluster
, оба предназначены для S3.
Аргументы
-
cluster_name
— Название кластера, которое используется для построения набора адресов и параметров соединения с удаленными и локальными серверами. -
Описание всех других аргументов совпадает с описанием аргументов в эквивалентной табличной функции deltaLake.
Возвращаемое значение
Таблица с указанной структурой для чтения данных из кластера в указанной таблице Delta Lake в S3.
Виртуальные колонки
_path
— Путь к файлу. Тип:LowCardinality(String)
._file
— Название файла. Тип:LowCardinality(String)
._size
— Размер файла в байтах. Тип:Nullable(UInt64)
. Если размер файла неизвестен, значение равноNULL
._time
— Время последнего изменения файла. Тип:Nullable(DateTime)
. Если время неизвестно, значение равноNULL
._etag
— Etag файла. Тип:LowCardinality(String)
. Если etag неизвестен, значение равноNULL
.