Hive
Движок Hive позволяет выполнять SELECT
запросы к таблицам HDFS Hive. В настоящее время он поддерживает форматы ввода, указанные ниже:
-
Text: поддерживает только простые скалярные типы столбцов, кроме
binary
-
ORC: поддерживает простые скалярные типы столбцов, кроме
char
; поддерживает только сложные типы, такие какarray
-
Parquet: поддерживает все простые скалярные типы столбцов; поддерживает только сложные типы, такие как
array
Создание таблицы
Смотрите подробное описание запроса CREATE TABLE.
Структура таблицы может отличаться от исходной структуры таблицы Hive:
- Имена столбцов должны совпадать с именами в исходной таблице Hive, но вы можете использовать только некоторые из этих столбцов и в любом порядке, также вы можете использовать некоторые алиасные столбцы, вычисленные из других столбцов.
- Типы столбцов должны совпадать с типами в исходной таблице Hive.
- Выражение для партиционирования должно соответствовать исходной таблице Hive, а столбцы в выражении для партиционирования должны находиться в структуре таблицы.
Параметры движка
-
thrift://host:port
— адрес Hive Metastore -
database
— имя удаленной базы данных. -
table
— имя удаленной таблицы.
Пример использования
Как использовать локальный кэш для файловой системы HDFS
Мы настоятельно рекомендуем включить локальный кэш для удаленных файловых систем. Бенчмарки показывают, что это почти в 2 раза быстрее с кэшем.
Перед использованием кэша добавьте его в config.xml
- enable: ClickHouse будет поддерживать локальный кэш для удаленной файловой системы (HDFS) после запуска, если это true.
- root_dir: Обязательный. Корневая директория для хранения локальных кэша файлов для удаленной файловой системы.
- limit_size: Обязательный. Максимальный размер (в байтах) локальных кэша файлов.
- bytes_read_before_flush: Управляет количеством байтов перед сбросом в локальную файловую систему при загрузке файла из удаленной файловой системы. Значение по умолчанию — 1MB.
Запрос таблицы Hive с форматом ввода ORC
Создание таблицы в Hive
Создание таблицы в ClickHouse
Таблица в ClickHouse, извлекая данные из таблицы Hive, созданной выше:
Запрос таблицы Hive с форматом ввода Parquet
Создание таблицы в Hive
Создание таблицы в ClickHouse
Таблица в ClickHouse, извлекая данные из таблицы Hive, созданной выше:
Запрос таблицы Hive с форматом ввода Text
Создание таблицы в Hive
Создание таблицы в ClickHouse
Таблица в ClickHouse, извлекая данные из таблицы Hive, созданной выше: