system.asynchronous_metrics
Данные в этой системной таблице хранятся локально на каждом узле в ClickHouse Cloud. Для получения полного представления о всех данных требуется функция clusterAllReplicas
. Смотрите здесь для получения дополнительной информации.
Содержит метрики, которые рассчитываются периодически в фоновом режиме. Например, объем используемой оперативной памяти.
Столбцы:
metric
(String) — Название метрики.value
(Float64) — Значение метрики.description
(String) — Описание метрики.
Пример
Описания метрик
AsynchronousHeavyMetricsCalculationTimeSpent
Время в секундах, затраченное на расчет асинхронных тяжелых (связанных с таблицами) метрик (это накладные расходы асинхронных метрик).
AsynchronousHeavyMetricsUpdateInterval
Интервал обновления тяжелых (связанных с таблицами) метрик.
AsynchronousMetricsCalculationTimeSpent
Время в секундах, затраченное на расчет асинхронных метрик (это накладные расходы асинхронных метрик).
AsynchronousMetricsUpdateInterval
Интервал обновления метрик.
BlockActiveTime_name
Время в секундах, в течение которого блоку устройства были поставлены IO-запросы в очередь. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardBytes_name
Количество удаленных байтов на блочном устройстве. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами на системе. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardMerges_name
Количество операций удаления, запрошенных с блочного устройства и объединенных вместе планировщиком IO ОС. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами на системе. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardOps_name
Количество операций удаления, запрошенных с блочного устройства. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами на системе. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardTime_name
Время в секундах, затраченное на операции удаления, запрошенные с блочного устройства, суммированное по всем операциям. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами на системе. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockInFlightOps_name
Это значение подсчитывает количество IO-запросов, которые были выданы драйверу устройства, но еще не завершились. Оно не включает IO-запросы, которые находятся в очереди, но еще не были выданы драйверу устройства. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockQueueTime_name
Это значение подсчитывает количество миллисекунд, которые IO-запросы ожидали на этом блочном устройстве. Если несколько IO-запросов ожидают, это значение будет увеличиваться как произведение количества миллисекунд на количество ожидающих запросов. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadBytes_name
Количество байтов, прочитанных с блочного устройства. Оно может быть ниже, чем количество байтов, прочитанных из файловой системы, из-за использования кэша страниц ОС, который экономит IO. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadMerges_name
Количество операций чтения, запрошенных с блочного устройства и объединенных вместе планировщиком IO ОС. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadOps_name
Количество операций чтения, запрошенных с блочного устройства. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadTime_name
Время в секундах, затраченное на операции чтения, запрошенные с блочного устройства, суммированное по всем операциям. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteBytes_name
Количество байтов, записанных в блочное устройство. Оно может быть ниже, чем количество байтов, записанных в файловую систему, из-за использования кэша страниц ОС, который экономит IO. Запись в блочное устройство может происходить позже, чем соответствующая запись в файловую систему из-за кэширования записи. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteMerges_name
Количество операций записи, запрошенных с блочного устройства и объединенных вместе планировщиком IO ОС. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteOps_name
Количество операций записи, запрошенных с блочного устройства. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteTime_name
Время в секундах, затраченное на операции записи, запрошенные с блочного устройства, суммированное по всем операциям. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
CPUFrequencyMHz_name
Текущая частота CPU, в МГц. Большинство современных процессоров динамически регулируют частоту для экономии энергии и Turbo Boost.
DictionaryMaxUpdateDelay
Максимальная задержка (в секундах) обновления словаря.
DictionaryTotalFailedUpdates
Количество ошибок с момента последней успешной загрузки во всех словарях.
DiskAvailable_name
Доступные байты на диске (виртуальная файловая система). Удаленные файловые системы могут показывать большое значение, например 16 EiB.
DiskTotal_name
Общий размер в байтах диска (виртуальная файловая система). Удаленные файловые системы могут показывать большое значение, например 16 EiB.
DiskUnreserved_name
Доступные байты на диске (виртуальная файловая система) без резервирования для слияний, выборок и перемещений. Удаленные файловые системы могут показывать большое значение, например 16 EiB.
DiskUsed_name
Использованные байты на диске (виртуальная файловая система). Удаленные файловые системы не всегда предоставляют эту информацию.
FilesystemCacheBytes
Общее количество байтов в виртуальной файловой системе cache
. Этот кэш хранится на диске.
FilesystemCacheFiles
Общее количество сегментов файлов в кэше виртуальной файловой системы cache
. Этот кэш хранится на диске.
FilesystemLogsPathAvailableBytes
Доступные байты на том разделе, где монтируется путь логов ClickHouse. Если это значение приближается к нулю, вам следует настроить ротацию логов в файле конфигурации.
FilesystemLogsPathAvailableINodes
Количество доступных inodes на том разделе, где монтируется путь логов ClickHouse.
FilesystemLogsPathTotalBytes
Размер раздела, на котором монтируется путь логов ClickHouse, в байтах. Рекомендуется иметь как минимум 10 ГБ для логов.
FilesystemLogsPathTotalINodes
Общее количество inodes на том разделе, где монтируется путь логов ClickHouse.
FilesystemLogsPathUsedBytes
Использованные байты на том разделе, где монтируется путь логов ClickHouse.
FilesystemLogsPathUsedINodes
Количество использованных inodes на том разделе, где монтируется путь логов ClickHouse.
FilesystemMainPathAvailableBytes
Доступные байты на том разделе, где монтируется основной путь ClickHouse.
FilesystemMainPathAvailableINodes
Количество доступных inodes на том разделе, где монтируется основной путь ClickHouse. Если оно близко к нулю, это указывает на неправильную конфигурацию, и вы получите 'нет места на устройстве', даже когда диск не полон.
FilesystemMainPathTotalBytes
Размер раздела, на котором монтируется основной путь ClickHouse, в байтах.
FilesystemMainPathTotalINodes
Общее количество inodes на том разделе, где монтируется основной путь ClickHouse. Если их меньше 25 миллионов, это указывает на неправильную конфигурацию.
FilesystemMainPathUsedBytes
Использованные байты на том разделе, где монтируется основной путь ClickHouse.
FilesystemMainPathUsedINodes
Количество использованных inodes на том разделе, где монтируется основной путь ClickHouse. Это значение в основном соответствует количеству файлов.
HTTPThreads
Количество потоков в сервере HTTP интерфейса (без TLS).
InterserverThreads
Количество потоков в сервере протокола связи реплик (без TLS).
Jitter
Разница во времени, когда поток для расчета асинхронных метрик был запланирован на пробуждение, и временем, когда он фактически был пробужден. Прокси-индикатор общей задержки и отзывчивости системы.
LoadAverageN
Общая нагрузка системы, усредненная с экспоненциальным сглаживанием за 1 минуту. Нагрузка представляет собой количество потоков по всем процессам (планирующим единицам ядра ОС), которые в данный момент выполняются на CPU или ожидают IO, или готовы выполнять, но в данный момент времени не расписаны. Это число включает все процессы, а не только clickhouse-server. Число может превышать количество ядер CPU, если система перегружена и многие процессы готовы к выполнению, но ждут CPU или IO.
MaxPartCountForPartition
Максимальное количество частей на партицию во всех партициях всех таблиц семейства MergeTree. Значения более 300 указывают на неправильную конфигурацию, перегрузку или массовую загрузку данных.
MemoryCode
Количество виртуальной памяти, отображенной для страниц машинного кода серверного процесса, в байтах.
MemoryDataAndStack
Количество виртуальной памяти, отображенной для использования стека и для выделенной памяти, в байтах. Не уточняется, включает ли она стеки на поток и большую часть выделенной памяти, которая выделяется с помощью системного вызова 'mmap'. Эта метрика существует только для полноты. Я рекомендую использовать метрику MemoryResident
для мониторинга.
MemoryResidentMax
Максимальное количество физической памяти, используемой серверным процессом, в байтах.
MemoryResident
Количество физической памяти, используемой серверным процессом, в байтах.
MemoryShared
Количество памяти, используемой серверным процессом, которая также используется другими процессами, в байтах. ClickHouse не использует общую память, но некоторая память может быть обозначена ОС как общая по своим причинам. Эта метрика не имеет большого смысла для наблюдения и существует только для полноты.
MemoryVirtual
Размер виртуального адресного пространства, выделенного серверным процессом, в байтах. Размер виртуального адресного пространства обычно значительно больше, чем потребление физической памяти, и не должен использоваться как оценка для потребления памяти. Большие значения этой метрики совершенно нормальны и имеют только техническое значение.
MySQLThreads
Количество потоков в сервере протокола совместимости MySQL.
NetworkReceiveBytes_name
Количество байтов, полученных через сетевой интерфейс. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server.
NetworkReceiveDrop_name
Количество байтов, которые были отброшены, когда пакет был получен через сетевой интерфейс. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server.
NetworkReceiveErrors_name
Количество ошибок, произошедших при получении через сетевой интерфейс. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server.
NetworkReceivePackets_name
Количество сетевых пакетов, полученных через сетевой интерфейс. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendBytes_name
Количество байтов, отправленных через сетевой интерфейс. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendDrop_name
Количество раз, когда пакет был отброшен при отправке через сетевой интерфейс. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendErrors_name
Количество раз, когда произошла ошибка (например, retransmit TCP) при отправке через сетевой интерфейс. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendPackets_name
Количество сетевых пакетов, отправленных через сетевой интерфейс. Это метрика для всей системы, которая включает все процессы на хост-машине, а не только clickhouse-server.
NumberOfDatabases
Общее количество баз данных на сервере.
NumberOfDetachedByUserParts
Общее количество частей, отделенных от таблиц MergeTree пользователями с помощью запроса ALTER TABLE DETACH
(в отличие от неожиданных, сломанных или игнорируемых частей). Сервер не заботится об отделенных частях, и их можно удалить.
NumberOfDetachedParts
Общее количество частей, отделенных от таблиц MergeTree. Часть может быть отделена пользователем с помощью запроса ALTER TABLE DETACH
или самим сервером, если часть сломана, неожиданна или не нужна. Сервер не заботится об отделенных частях, и их можно удалить.
NumberOfTables
Общее количество таблиц, суммированное по базам данных на сервере, исключая базы данных, которые не могут содержать таблицы MergeTree. Исключенные движки баз данных - это те, которые генерируют набор таблиц на лету, такие как Lazy
, MySQL
, PostgreSQL
, SQlite
.
OSContextSwitches
Количество переключений контекста, которые система претерпела на хост-машине. Эта метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server.
OSGuestNiceTime
Соотношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под управлением ядра Linux, когда гостевое ОС было установлено на более высокий приоритет (Смотрите man procfs
). Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все же существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSGuestNiceTimeCPU_N
Соотношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под управлением ядра Linux, когда гостевое ОС было установлено на более высокий приоритет (Смотрите man procfs
). Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все еще существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSGuestNiceTimeNormalized
Это значение аналогично OSGuestNiceTime
, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и все же получить среднюю метрику использования ресурсов.
OSGuestTime
Соотношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под управлением ядра Linux (Смотрите man procfs
). Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все еще существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSGuestTimeCPU_N
Соотношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под управлением ядра Linux (Смотрите man procfs
). Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все еще существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSGuestTimeNormalized
Это значение аналогично OSGuestTime
, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и все же получить среднюю метрику использования ресурсов.
OSIOWaitTime
Соотношение времени, когда ядро CPU не запускало код, но когда ядро ОС не запускало никакой другой процесс на этом CPU, так как процессы ожидали IO. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSIOWaitTimeCPU_N
Соотношение времени, когда ядро CPU не запускало код, но когда ядро ОС не запускало никакой другой процесс на этом CPU, так как процессы ожидали IO. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSIOWaitTimeNormalized
Это значение аналогично OSIOWaitTime
, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и все же получить среднюю метрику использования ресурсов.
OSIdleTime
Соотношение времени, когда ядро CPU было бездействующим (даже не готовым к запуску процесса, ожидающего IO) с точки зрения ядра ОС. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Это не включает время, когда CPU был недогружен по причинам, внутренним для CPU (нагрузки памяти, задержки конвейера, ошибки предсказания ветвлений, работа другого SMT-ядер). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSIdleTimeCPU_N
Соотношение времени, когда ядро CPU было бездействующим (даже не готовым к запуску процесса, ожидающего IO) с точки зрения ядра ОС. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Это не включает время, когда CPU был недогружен по причинам, внутренним для CPU (нагрузки памяти, задержки конвейера, ошибки предсказания ветвлений, работа другого SMT-ядер). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSIdleTimeNormalized
Это значение аналогично OSIdleTime
, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и все же получить среднюю метрику использования ресурсов.
OSInterrupts
Количество прерываний на хост-машине. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server.
OSIrqTime
Соотношение времени, затраченного на выполнение запросов аппаратных прерываний на CPU. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Высокое число этой метрики может указывать на неправильную конфигурацию оборудования или очень высокую нагрузку на сеть. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSIrqTimeCPU_N
Соотношение времени, затраченного на выполнение запросов аппаратных прерываний на CPU. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Высокое число этой метрики может указывать на неправильную конфигурацию оборудования или очень высокую нагрузку на сеть. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSIrqTimeNormalized
Это значение аналогично OSIrqTime
, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и все же получить среднюю метрику использования ресурсов.
OSMemoryAvailable
Количество памяти, доступной для использования программами, в байтах. Это очень похоже на метрику OSMemoryFreePlusCached
. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server.
OSMemoryBuffers
Количество памяти, используемой буферами ядра ОС, в байтах. Обычно оно небольшое, и большие значения могут указывать на неправильную конфигурацию ОС. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server.
OSMemoryCached
Количество памяти, используемой кэшем страниц ОС, в байтах. Обычно почти вся доступная память используется кэшом страниц ОС - высокие значения этой метрики нормальны и ожидаемы. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server.
OSMemoryFreePlusCached
Количество свободной памяти плюс память кэша страниц ОС на хост-системе, в байтах. Эта память доступна для использования программами. Значение должно быть очень похоже на OSMemoryAvailable
. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server.
OSMemoryFreeWithoutCached
Количество свободной памяти на хост-системе, в байтах. Это не включает память, используемую памятью кэша страниц ОС, в байтах. Память кэша страниц также доступна для использования программами, поэтому значение этой метрики может быть запутанным. Вместо этого смотрите метрику OSMemoryAvailable
. Для удобства мы также предоставляем метрику OSMemoryFreePlusCached
, которая должна быть несколько похожа на OSMemoryAvailable. Также смотрите https://www.linuxatemyram.com/. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server.
OSMemoryTotal
Общее количество памяти на хост-системе, в байтах.
OSNiceTime
Соотношение времени, когда ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSNiceTimeCPU_N
Соотношение времени, когда ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSNiceTimeNormalized
Это значение аналогично OSNiceTime
, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное и все равно получать среднюю метрику использования ресурсов.
OSOpenFiles
Общее количество открытых файлов на хост-машине. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server.
OSProcessesBlocked
Количество потоков, заблокированных в ожидании завершения I/O (man procfs
). Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server.
OSProcessesCreated
Количество созданных процессов. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server.
OSProcessesRunning
Количество выполняемых (работающих или готовых к выполнению) потоков операционной системой. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server.
OSSoftIrqTime
Соотношение времени, затраченного на выполнение программных запросов прерываний на CPU. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Высокое число этой метрики может указывать на неэффективное программное обеспечение, работающее в системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSSoftIrqTimeCPU_N
Соотношение времени, затраченного на выполнение программных запросов прерываний на CPU. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Высокое число этой метрики может указывать на неэффективное программное обеспечение, работающее в системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSSoftIrqTimeNormalized
Это значение аналогично OSSoftIrqTime
, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное и все равно получать среднюю метрику использования ресурсов.
OSStealTime
Соотношение времени, затраченного другими операционными системами на CPU при работе в виртуализированной среде. Это метрика для всей системы, она включает все процессы на хост-машине, не только clickhouse-server. Не все виртуализированные среды представляют эту метрику, и большинство из них этого не делают. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSStealTimeCPU_N
Соотношение времени, проведенного CPU в других операционных системах при работе в виртуализированной среде. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Не все виртуализированные среды предоставляют эту метрику, и большинство из них не делают этого. Значение для одного CPU-ядра будет в интервале [0..1]. Значение для всех CPU-ядер рассчитывается как сумма по ним [0..num cores].
OSStealTimeNormalized
Значение, аналогичное OSStealTime
, но деленное на количество CPU-ядер, чтобы измеряться в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все равно получать среднюю метрику использования ресурсов.
OSSystemTime
Соотношение времени, которое CPU-ядро выполняло код ядра ОС (системный код). Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного CPU-ядра будет в интервале [0..1]. Значение для всех CPU-ядер рассчитывается как сумма по ним [0..num cores].
OSSystemTimeCPU_N
Соотношение времени, которое CPU-ядро выполняло код ядра ОС (системный код). Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного CPU-ядра будет в интервале [0..1]. Значение для всех CPU-ядер рассчитывается как сумма по ним [0..num cores].
OSSystemTimeNormalized
Значение, аналогичное OSSystemTime
, но деленное на количество CPU-ядер, чтобы измеряться в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все равно получать среднюю метрику использования ресурсов.
OSThreadsRunnable
Общее количество «работоспособных» потоков, как это видит планировщик ядра ОС.
OSThreadsTotal
Общее количество потоков, как это видит планировщик ядра ОС.
OSUptime
Время работы хост-сервера (машины, на которой запущен ClickHouse) в секундах.
OSUserTime
Соотношение времени, которое CPU-ядро выполняло код пользовательского пространства. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был недогружен по внутренним причинам (загрузки памяти, задержки конвейера, ошибки предсказания ветвления, работа другого SMT-ядра). Значение для одного CPU-ядра будет в интервале [0..1]. Значение для всех CPU-ядер рассчитывается как сумма по ним [0..num cores].
OSUserTimeCPU_N
Соотношение времени, которое CPU-ядро выполняло код пользовательского пространства. Это метрика системы в целом, она включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был недогружен по внутренним причинам (загрузки памяти, задержки конвейера, ошибки предсказания ветвления, работа другого SMT-ядра). Значение для одного CPU-ядра будет в интервале [0..1]. Значение для всех CPU-ядер рассчитывается как сумма по ним [0..num cores].
OSUserTimeNormalized
Значение, аналогичное OSUserTime
, но деленное на количество CPU-ядер, чтобы измеряться в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все равно получать среднюю метрику использования ресурсов.
PostgreSQLThreads
Количество потоков в сервере протокола совместимости PostgreSQL.
ReplicasMaxAbsoluteDelay
Максимальная разница в секундах между самой свежей реплицированной частью и самой свежей частью данных, которая еще предстоит реплицироваться, по реплицируемым таблицам. Очень высокое значение указывает на реплику без данных.
ReplicasMaxInsertsInQueue
Максимальное количество операций INSERT в очереди (еще предстоит реплицировать) по реплицируемым таблицам.
ReplicasMaxMergesInQueue
Максимальное количество операций слияния в очереди (еще предстоит применить) по реплицируемым таблицам.
ReplicasMaxQueueSize
Максимальный размер очереди (в количестве операций, таких как получение, слияние) по реплицируемым таблицам.
ReplicasMaxRelativeDelay
Максимальная разница между задержкой реплики и задержкой самой актуальной реплики той же таблицы, по реплицируемым таблицам.
ReplicasSumInsertsInQueue
Сумма операций INSERT в очереди (еще предстоит реплицировать) по реплицируемым таблицам.
ReplicasSumMergesInQueue
Сумма операций слияния в очереди (еще предстоит применить) по реплицируемым таблицам.
ReplicasSumQueueSize
Сумма размера очереди (в количестве операций, таких как получение, слияние) по реплицируемым таблицам.
TCPThreads
Количество потоков в сервере протокола TCP (без TLS).
Temperature_N
Температура соответствующего устройства в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/thermal
Temperature_name
Температура, сообщаемая соответствующим аппаратным монитором и соответствующим датчиком в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/hwmon
TotalBytesOfMergeTreeTables
Общее количество байт (сжатых, включая данные и индексы), хранящихся во всех таблицах семейства MergeTree.
TotalPartsOfMergeTreeTables
Общее количество частей данных во всех таблицах семейства MergeTree. Числа больше 10 000 отрицательно влияют на время запуска сервера, и это может указывать на неразумный выбор ключа партиционирования.
TotalPrimaryKeyBytesInMemory
Общее количество памяти (в байтах), используемой значениями первичного ключа (учитываются только активные части).
TotalPrimaryKeyBytesInMemoryAllocated
Общее количество памяти (в байтах), зарезервированной для значений первичного ключа (учитываются только активные части).
TotalRowsOfMergeTreeTables
Общее количество строк (записей), хранящихся во всех таблицах семейства MergeTree.
Uptime
Время работы сервера в секундах. Включает время, затраченное на инициализацию сервера перед приемом соединений.
jemalloc.active
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.allocated
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.dirty_purged
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.muzzy_purged
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pactive
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pdirty
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pmuzzy
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_runs
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_threads
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.run_intervals
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.epoch
Внутренний номер инкрементального обновления статистики jemalloc (аллокатор памяти Джейсона Эванса), используемый во всех других метриках jemalloc
.
jemalloc.mapped
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.metadata
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.metadata_thp
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.resident
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.retained
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.prof.active
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
Смотрите также
- Мониторинг — Основные концепции мониторинга ClickHouse.
- system.metrics — Содержит мгновенно рассчитанные метрики.
- system.events — Содержит ряд произошедших событий.
- system.metric_log — Содержит историю значений метрик из таблиц
system.metrics
иsystem.events
.