Перейти к основному содержимому
Перейти к основному содержимому

cramersV

Cramer's V (иногда упоминаемый как phi Крамера) является мерой ассоциации между двумя колонками в таблице. Результат функции cramersV варьируется от 0 (соответствует отсутствию ассоциации между переменными) до 1 и может достигать 1 только в том случае, если каждое значение полностью определяется другим. Это можно рассматривать как ассоциацию между двумя переменными в процентах от их максимального возможного изменения.

примечание

Для версии Cramer's V с исправлением смещения смотрите: cramersVBiasCorrected

Синтаксис

cramersV(column1, column2)

Параметры

  • column1: первая колонка для сравнения.
  • column2: вторая колонка для сравнения.

Возвращаемое значение

  • значение в диапазоне от 0 (соответствует отсутствию ассоциации между значениями колонок) до 1 (полная ассоциация).

Тип: всегда Float64.

Пример

Следующие две колонки, которые сравниваются ниже, не имеют ассоциации между собой, поэтому результат cramersV равен 0:

Запрос:

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 3 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    );

Результат:

┌─cramersV(a, b)─┐
│              0 │
└────────────────┘

Следующие две колонки ниже имеют достаточно тесную ассоциацию, поэтому результат cramersV имеет высокое значение:

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 10 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    );

Результат:

┌─────cramersV(a, b)─┐
│ 0.8944271909999159 │
└────────────────────┘