quantileExact функции
quantileExact
Точно вычисляет квантиль числовой последовательности данных.
Чтобы получить точное значение, все переданные значения объединяются в массив, который затем частично сортируется. Поэтому функция потребляет O(n)
памяти, где n
— это количество переданных значений. Однако для небольшого количества значений функция очень эффективна.
При использовании нескольких quantile*
функций с разными уровнями в запросе внутренние состояния не комбинируются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.
Синтаксис
Псевдоним: medianExact
.
Аргументы
level
— Уровень квантиля. Необязательный параметр. Константное число с плавающей точкой от 0 до 1. Мы рекомендуем использовать значениеlevel
в диапазоне[0.01, 0.99]
. Значение по умолчанию: 0.5. Приlevel=0.5
функция вычисляет медиану.expr
— Выражение для значений колонок, приводящее к числовым типам данных, Date или DateTime.
Возвращаемое значение
- Квантиль указанного уровня.
Тип:
- Для числовых типов данных выходной формат будет таким же, как и формат входных данных. Например:
Пример
Запрос:
Результат:
quantileExactLow
Похожая на quantileExact
, эта функция вычисляет точный квантиль числовой последовательности данных.
Чтобы получить точное значение, все переданные значения объединяются в массив, который затем полностью сортируется. Сложность алгоритма сортировки составляет O(N·log(N))
, где N = std::distance(first, last)
— количество сравнений.
Возвращаемое значение зависит от уровня квантиля и количества элементов в выборке, т.е. если уровень равен 0.5, то функция возвращает нижнее медианное значение для четного количества элементов и среднее медианное значение для нечетного количества элементов. Медиана вычисляется аналогично реализации median_low, которая используется в python.
Для всех остальных уровней возвращается элемент по индексу, соответствующему значению level * size_of_array
. Например:
При использовании нескольких quantile*
функций с разными уровнями в запросе внутренние состояния не комбинируются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.
Синтаксис
Псевдоним: medianExactLow
.
Аргументы
level
— Уровень квантиля. Необязательный параметр. Константное число с плавающей точкой от 0 до 1. Мы рекомендуем использовать значениеlevel
в диапазоне[0.01, 0.99]
. Значение по умолчанию: 0.5. Приlevel=0.5
функция вычисляет медиану.expr
— Выражение для значений колонок, приводящее к числовым типам данных, Date или DateTime.
Возвращаемое значение
- Квантиль указанного уровня.
Тип:
- Float64 для входных данных числового типа.
- Date, если входные значения имеют тип
Date
. - DateTime, если входные значения имеют тип
DateTime
.
Пример
Запрос:
Результат:
quantileExactHigh
Похожая на quantileExact
, эта функция вычисляет точный квантиль числовой последовательности данных.
Все переданные значения объединяются в массив, который затем полностью сортируется, чтобы получить точное значение. Сложность алгоритма сортировки составляет O(N·log(N))
, где N = std::distance(first, last)
— количество сравнений.
Возвращаемое значение зависит от уровня квантиля и количества элементов в выборке, т.е. если уровень равен 0.5, то функция возвращает верхнее медианное значение для четного количества элементов и среднее медианное значение для нечетного количества элементов. Медиана вычисляется аналогично реализации median_high, которая используется в python. Для всех остальных уровней возвращается элемент по индексу, соответствующему значению level * size_of_array
.
Эта реализация ведет себя точно так же, как и текущая реализация quantileExact
.
При использовании нескольких quantile*
функций с разными уровнями в запросе внутренние состояния не комбинируются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.
Синтаксис
Псевдоним: medianExactHigh
.
Аргументы
level
— Уровень квантиля. Необязательный параметр. Константное число с плавающей точкой от 0 до 1. Мы рекомендуем использовать значениеlevel
в диапазоне[0.01, 0.99]
. Значение по умолчанию: 0.5. Приlevel=0.5
функция вычисляет медиану.expr
— Выражение для значений колонок, приводящее к числовым типам данных, Date или DateTime.
Возвращаемое значение
- Квантиль указанного уровня.
Тип:
- Float64 для входных данных числового типа.
- Date, если входные значения имеют тип
Date
. - DateTime, если входные значения имеют тип
DateTime
.
Пример
Запрос:
Результат:
quantileExactExclusive
Точно вычисляет квантиль числовой последовательности данных.
Чтобы получить точное значение, все переданные значения объединяются в массив, который затем частично сортируется. Поэтому функция потребляет O(n)
памяти, где n
— это количество переданных значений. Однако для небольшого количества значений функция очень эффективна.
Эта функция эквивалентна функции Excel PERCENTILE.EXC (тип R6).
При использовании нескольких quantileExactExclusive
функций с разными уровнями в запросе внутренние состояния не комбинируются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantilesExactExclusive.
Синтаксис
Аргументы
expr
— Выражение для значений колонок, приводящее к числовым типам данных, Date или DateTime.
Параметры
level
— Уровень квантиля. Необязательный. Возможные значения: (0, 1) — границы не включены. Значение по умолчанию: 0.5. Приlevel=0.5
функция вычисляет медиану. Float.
Возвращаемое значение
- Квантиль указанного уровня.
Тип:
- Float64 для входных данных числового типа.
- Date, если входные значения имеют тип
Date
. - DateTime, если входные значения имеют тип
DateTime
.
Пример
Запрос:
Результат:
quantileExactInclusive
Точно вычисляет квантиль числовой последовательности данных.
Чтобы получить точное значение, все переданные значения объединяются в массив, который затем частично сортируется. Поэтому функция потребляет O(n)
памяти, где n
— это количество переданных значений. Однако для небольшого количества значений функция очень эффективна.
Эта функция эквивалентна функции Excel PERCENTILE.INC (тип R7).
При использовании нескольких quantileExactInclusive
функций с разными уровнями в запросе внутренние состояния не комбинируются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantilesExactInclusive.
Синтаксис
Аргументы
expr
— Выражение для значений колонок, приводящее к числовым типам данных, Date или DateTime.
Параметры
level
— Уровень квантиля. Необязательный. Возможные значения: [0, 1] — границы включены. Значение по умолчанию: 0.5. Приlevel=0.5
функция вычисляет медиану. Float.
Возвращаемое значение
- Квантиль указанного уровня.
Тип:
- Float64 для входных данных числового типа.
- Date, если входные значения имеют тип
Date
. - DateTime, если входные значения имеют тип
DateTime
.
Пример
Запрос:
Результат:
Смотрите также