Перейти к основному содержимому
Перейти к основному содержимому

CoalescingMergeTree

Доступно с версии 25.6

Этот движок таблиц доступен с версии 25.6 и выше как в OSS, так и в Cloud.

Этот движок наследуется от MergeTree. Ключевое отличие заключается в том, как сливаются части данных: для таблиц CoalescingMergeTree ClickHouse заменяет все строки с одинаковым первичным ключом (или, скорее, с одинаковым ключом сортировки) на одну строку, содержащую последние ненулевые значения для каждого столбца.

Это позволяет выполнять обновления на уровне столбцов, что означает, что вы можете обновлять только определенные столбцы, а не целые строки.

CoalescingMergeTree предназначен для использования с Nullable типами в неключевых столбцах. Если столбцы не являются Nullable, поведение будет таким же, как у ReplacingMergeTree.

Создание таблицы

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
    ...
) ENGINE = CoalescingMergeTree([columns])
[PARTITION BY expr]
[ORDER BY expr]
[SAMPLE BY expr]
[SETTINGS name=value, ...]

Для описания параметров запроса см. описание запроса.

Параметры CoalescingMergeTree

Столбцы

columns - кортеж с именами столбцов, значения которых будут объединены. Необязательный параметр. Столбцы должны быть числового типа и не должны входить в ключ партиционирования или сортировки.

Если columns не указан, ClickHouse объединяет значения во всех столбцах, которые не находятся в ключе сортировки.

Операторные части запроса

При создании таблицы CoalescingMergeTree требуются те же операторные части, что и при создании таблицы MergeTree.

Устаревший метод создания таблицы
примечание

Не используйте этот метод в новых проектах и, если возможно, переключите старые проекты на описанный выше метод.

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
    ...
) ENGINE [=] CoalescingMergeTree(date-column [, sampling_expression], (primary, key), index_granularity, [columns])

Все параметры, кроме columns, имеют то же значение, что и в MergeTree.

  • columns — кортеж с именами столбцов, значения которых будут суммироваться. Необязательный параметр. Для описания см. текст выше.

Пример использования

Рассмотрим следующую таблицу:

CREATE TABLE test_table
(
    key UInt64,
    value_int Nullable(UInt32),
    value_string Nullable(String),
    value_date Nullable(Date)
)
ENGINE = CoalescingMergeTree()
ORDER BY key

Вставим в нее данные:

INSERT INTO test_table VALUES(1, NULL, NULL, '2025-01-01'), (2, 10, 'test', NULL);
INSERT INTO test_table VALUES(1, 42, 'win', '2025-02-01');
INSERT INTO test_table(key, value_date) VALUES(2, '2025-02-01');

Результат будет выглядеть так:

SELECT * FROM test_table ORDER BY key;
┌─key─┬─value_int─┬─value_string─┬─value_date─┐
│   1 │        42 │ win          │ 2025-02-01 │
│   1 │      ᴺᵁᴸᴸ │ ᴺᵁᴸᴸ         │ 2025-01-01 │
│   2 │      ᴺᵁᴸᴸ │ ᴺᵁᴸᴸ         │ 2025-02-01 │
│   2 │        10 │ test         │       ᴺᵁᴸᴸ │
└─────┴───────────┴──────────────┴────────────┘

Рекомендуемый запрос для получения правильного и окончательного результата:

SELECT * FROM test_table FINAL ORDER BY key;
┌─key─┬─value_int─┬─value_string─┬─value_date─┐
│   1 │        42 │ win          │ 2025-02-01 │
│   2 │        10 │ test         │ 2025-02-01 │
└─────┴───────────┴──────────────┴────────────┘

Использование модификатора FINAL заставляет ClickHouse применять логику слияния во время выполнения запроса, гарантируя, что вы получите правильное, объединенное "последнее" значение для каждого столбца. Это самый безопасный и точный метод при запросах из таблицы CoalescingMergeTree.

примечание

Подход с GROUP BY может возвращать некорректные результаты, если основные части еще не были полностью объединены.

SELECT key, last_value(value_int), last_value(value_string), last_value(value_date)  FROM test_table GROUP BY key; -- Not recommended.