Перейти к основному содержимому
Перейти к основному содержимому

Npy

InputOutputAlias

Описание

Формат Npy предназначен для загрузки массива NumPy из файла .npy в ClickHouse. Формат файла NumPy — это бинарный формат, используемый для эффективного хранения массивов числовых данных. При импорте ClickHouse рассматривает верхний уровень измерения как массив строк с одной колонкой.

В таблице ниже представлены поддерживаемые типы данных Npy и их соответствующие типы в ClickHouse:

Соответствие типов данных

Тип данных Npy (INSERT)Тип данных ClickHouseТип данных Npy (SELECT)
i1Int8i1
i2Int16i2
i4Int32i4
i8Int64i8
u1, b1UInt8u1
u2UInt16u2
u4UInt32u4
u8UInt64u8
f2, f4Float32f4
f8Float64f8
S, UStringS
FixedStringS

Пример использования

Сохранение массива в формате .npy с использованием Python

import numpy as np
arr = np.array([[[1],[2],[3]],[[4],[5],[6]]])
np.save('example_array.npy', arr)

Чтение файла NumPy в ClickHouse

SELECT *
FROM file('example_array.npy', Npy)
┌─array─────────┐
│ [[1],[2],[3]] │
│ [[4],[5],[6]] │
└───────────────┘

Выбор данных

Вы можете выбрать данные из таблицы ClickHouse и сохранить их в файл в формате Npy, используя следующую команду с clickhouse-client:

$ clickhouse-client --query="SELECT {column} FROM {some_table} FORMAT Npy" > {filename.npy}

Настройки формата