Перейти к основному содержимому
Перейти к основному содержимому

sumMap

Суммирует один или несколько массивов value в соответствии с ключами, указанными в массиве key. Возвращает кортеж массивов: ключи в отсортированном порядке, за которыми следуют суммы значений для соответствующих ключей без переполнения.

Синтаксис

  • sumMap(key <Array>, value1 <Array>[, value2 <Array>, ...]) Тип Array.
  • sumMap(Tuple(key <Array>[, value1 <Array>, value2 <Array>, ...])) Тип Tuple.

Псевдоним: sumMappedArrays.

Аргументы

  • key: Массив ключей.
  • value1, value2, ...: Массив значений для суммирования для каждого ключа.

Передача кортежа массивов ключей и значений является синонимом передачи отдельно массива ключей и массивов значений.

примечание

Число элементов в key и во всех массивах value должно быть одинаковым для каждой строки, которая суммируется.

Возвращаемое значение

  • Возвращает кортеж массивов: первый массив содержит ключи в отсортированном порядке, за которым следуют массивы, содержащие суммы значений для соответствующих ключей.

Пример

Сначала мы создаем таблицу под названием sum_map и вставляем в нее некоторые данные. Массивы ключей и значений хранятся отдельно в колонке под названием statusMap типа Nested, а вместе — в колонке под названием statusMapTuple типа tuple для иллюстрации использования двух разных синтаксисов этой функции, описанных выше.

Запрос:

CREATE TABLE sum_map(
    date Date,
    timeslot DateTime,
    statusMap Nested(
        status UInt16,
        requests UInt64
    ),
    statusMapTuple Tuple(Array(Int32), Array(Int32))
) ENGINE = Log;
INSERT INTO sum_map VALUES
    ('2000-01-01', '2000-01-01 00:00:00', [1, 2, 3], [10, 10, 10], ([1, 2, 3], [10, 10, 10])),
    ('2000-01-01', '2000-01-01 00:00:00', [3, 4, 5], [10, 10, 10], ([3, 4, 5], [10, 10, 10])),
    ('2000-01-01', '2000-01-01 00:01:00', [4, 5, 6], [10, 10, 10], ([4, 5, 6], [10, 10, 10])),
    ('2000-01-01', '2000-01-01 00:01:00', [6, 7, 8], [10, 10, 10], ([6, 7, 8], [10, 10, 10]));

Затем мы запрашиваем таблицу, используя функцию sumMap, используя как синтаксис массива, так и синтаксис кортежа:

Запрос:

SELECT
    timeslot,
    sumMap(statusMap.status, statusMap.requests),
    sumMap(statusMapTuple)
FROM sum_map
GROUP BY timeslot

Результат:

┌────────────timeslot─┬─sumMap(statusMap.status, statusMap.requests)─┬─sumMap(statusMapTuple)─────────┐
│ 2000-01-01 00:00:00 │ ([1,2,3,4,5],[10,10,20,10,10])               │ ([1,2,3,4,5],[10,10,20,10,10]) │
│ 2000-01-01 00:01:00 │ ([4,5,6,7,8],[10,10,20,10,10])               │ ([4,5,6,7,8],[10,10,20,10,10]) │
└─────────────────────┴──────────────────────────────────────────────┴────────────────────────────────┘

Пример с несколькими массивами значений

sumMap также поддерживает агрегацию нескольких массивов значений одновременно. Это полезно, когда у вас есть связанные метрики, которые разделяют одни и те же ключи.

CREATE TABLE multi_metrics(
    date Date,
    browser_metrics Nested(
        browser String,
        impressions UInt32,
        clicks UInt32
    )
)
ENGINE = MergeTree()
ORDER BY tuple();

INSERT INTO multi_metrics VALUES
    ('2000-01-01', ['Firefox', 'Chrome'], [100, 200], [10, 25]),
    ('2000-01-01', ['Chrome', 'Safari'], [150, 50], [20, 5]),
    ('2000-01-01', ['Firefox', 'Edge'], [80, 40], [8, 4]);

SELECT 
    sumMap(browser_metrics.browser, browser_metrics.impressions, browser_metrics.clicks) AS result
FROM multi_metrics;
┌─result────────────────────────────────────────────────────────────────────────┐
│ (['Chrome', 'Edge', 'Firefox', 'Safari'], [350, 40, 180, 50], [45, 4, 18, 5]) │
└───────────────────────────────────────────────────────────────────────────────┘

В этом примере:

  • Результирующий кортеж содержит три массива
  • Первый массив: ключи (имена браузеров) в отсортированном порядке
  • Второй массив: общее количество показов для каждого браузера
  • Третий массив: общее количество кликов для каждого браузера

См. также