Условие EXCEPT
возвращает только те строки, которые получены из первого запроса без включения строк второго.
- Оба запроса должны иметь одинаковое количество колонок в одинаковом порядке и типах данных.
- Результат
EXCEPT
может содержать дубликаты строк. Используйте EXCEPT DISTINCT
, если это нежелательно.
- Несколько операторов
EXCEPT
выполняются слева направо, если скобки не указаны.
- Оператор
EXCEPT
имеет такой же приоритет, как и условие UNION
, и более низкий приоритет, чем условие INTERSECT
.
Синтаксис
SELECT column1 [, column2 ]
FROM table1
[WHERE condition]
EXCEPT
SELECT column1 [, column2 ]
FROM table2
[WHERE condition]
Условие может быть любым выражением в зависимости от ваших требований.
Дополнительно, EXCEPT()
может использоваться для исключения колонок из результата в одной и той же таблице, как это возможно в BigQuery (Google Cloud), с помощью следующего синтаксиса:
SELECT column1 [, column2 ] EXCEPT (column3 [, column4])
FROM table1
[WHERE condition]
Примеры
Примеры в этом разделе демонстрируют использование условия EXCEPT
.
Фильтрация чисел с помощью условия EXCEPT
Вот простой пример, который возвращает числа от 1 до 10, которые не входят в диапазон от 3 до 8:
SELECT number
FROM numbers(1, 10)
EXCEPT
SELECT number
FROM numbers(3, 6)
┌─number─┐
│ 1 │
│ 2 │
│ 9 │
│ 10 │
└────────┘
Исключение определенных колонок с помощью EXCEPT()
EXCEPT()
может быть использовано для быстрого исключения колонок из результата. Например, если мы хотим выбрать все колонки из таблицы, за исключением нескольких конкретных колонок, как показано в следующем примере:
SHOW COLUMNS IN system.settings
SELECT * EXCEPT (default, alias_for, readonly, description)
FROM system.settings
LIMIT 5
┌─field───────┬─type─────────────────────────────────────────────────────────────────────┬─null─┬─key─┬─default─┬─extra─┐
1. │ alias_for │ String │ NO │ │ ᴺᵁᴸᴸ │ │
2. │ changed │ UInt8 │ NO │ │ ᴺᵁᴸᴸ │ │
3. │ default │ String │ NO │ │ ᴺᵁᴸᴸ │ │
4. │ description │ String │ NO │ │ ᴺᵁᴸᴸ │ │
5. │ is_obsolete │ UInt8 │ NO │ │ ᴺᵁᴸᴸ │ │
6. │ max │ Nullable(String) │ YES │ │ ᴺᵁᴸᴸ │ │
7. │ min │ Nullable(String) │ YES │ │ ᴺᵁᴸᴸ │ │
8. │ name │ String │ NO │ │ ᴺᵁᴸᴸ │ │
9. │ readonly │ UInt8 │ NO │ │ ᴺᵁᴸᴸ │ │
10. │ tier │ Enum8('Production' = 0, 'Obsolete' = 4, 'Experimental' = 8, 'Beta' = 12) │ NO │ │ ᴺᵁᴸᴸ │ │
11. │ type │ String │ NO │ │ ᴺᵁᴸᴸ │ │
12. │ value │ String │ NO │ │ ᴺᵁᴸᴸ │ │
└─────────────┴──────────────────────────────────────────────────────────────────────────┴──────┴─────┴─────────┴───────┘
┌─name────────────────────┬─value──────┬─changed─┬─min──┬─max──┬─type────┬─is_obsolete─┬─tier───────┐
1. │ dialect │ clickhouse │ 0 │ ᴺᵁᴸᴸ │ ᴺᵁᴸᴸ │ Dialect │ 0 │ Production │
2. │ min_compress_block_size │ 65536 │ 0 │ ᴺᵁᴸᴸ │ ᴺᵁᴸᴸ │ UInt64 │ 0 │ Production │
3. │ max_compress_block_size │ 1048576 │ 0 │ ᴺᵁᴸᴸ │ ᴺᵁᴸᴸ │ UInt64 │ 0 │ Production │
4. │ max_block_size │ 65409 │ 0 │ ᴺᵁᴸᴸ │ ᴺᵁᴸᴸ │ UInt64 │ 0 │ Production │
5. │ max_insert_block_size │ 1048449 │ 0 │ ᴺᵁᴸᴸ │ ᴺᵁᴸᴸ │ UInt64 │ 0 │ Production │
└─────────────────────────┴────────────┴─────────┴──────┴──────┴─────────┴─────────────┴────────────┘
Использование EXCEPT
и INTERSECT
с данными о криптовалютах
EXCEPT
и INTERSECT
часто могут использоваться взаимозаменяемо с различной булевой логикой, и они оба полезны, если у вас есть две таблицы, которые имеют общую колонку (или колонки).
Например, предположим, что у нас есть несколько миллионов строк исторических данных о криптовалютах, содержащих цены торговли и объем:
CREATE TABLE crypto_prices
(
trade_date Date,
crypto_name String,
volume Float32,
price Float32,
market_cap Float32,
change_1_day Float32
)
ENGINE = MergeTree
PRIMARY KEY (crypto_name, trade_date);
INSERT INTO crypto_prices
SELECT *
FROM s3(
'https://learn-clickhouse.s3.us-east-2.amazonaws.com/crypto_prices.csv',
'CSVWithNames'
);
SELECT * FROM crypto_prices
WHERE crypto_name = 'Bitcoin'
ORDER BY trade_date DESC
LIMIT 10;
┌─trade_date─┬─crypto_name─┬──────volume─┬────price─┬───market_cap─┬──change_1_day─┐
│ 2020-11-02 │ Bitcoin │ 30771456000 │ 13550.49 │ 251119860000 │ -0.013585099 │
│ 2020-11-01 │ Bitcoin │ 24453857000 │ 13737.11 │ 254569760000 │ -0.0031840964 │
│ 2020-10-31 │ Bitcoin │ 30306464000 │ 13780.99 │ 255372070000 │ 0.017308505 │
│ 2020-10-30 │ Bitcoin │ 30581486000 │ 13546.52 │ 251018150000 │ 0.008084608 │
│ 2020-10-29 │ Bitcoin │ 56499500000 │ 13437.88 │ 248995320000 │ 0.012552661 │
│ 2020-10-28 │ Bitcoin │ 35867320000 │ 13271.29 │ 245899820000 │ -0.02804481 │
│ 2020-10-27 │ Bitcoin │ 33749879000 │ 13654.22 │ 252985950000 │ 0.04427984 │
│ 2020-10-26 │ Bitcoin │ 29461459000 │ 13075.25 │ 242251000000 │ 0.0033826586 │
│ 2020-10-25 │ Bitcoin │ 24406921000 │ 13031.17 │ 241425220000 │ -0.0058658565 │
│ 2020-10-24 │ Bitcoin │ 24542319000 │ 13108.06 │ 242839880000 │ 0.013650347 │
└────────────┴─────────────┴─────────────┴──────────┴──────────────┴───────────────┘
Теперь предположим, что у нас есть таблица с названием holdings
, которая содержит список криптовалют, которыми мы владеем, а также количество монет:
CREATE TABLE holdings
(
crypto_name String,
quantity UInt64
)
ENGINE = MergeTree
PRIMARY KEY (crypto_name);
INSERT INTO holdings VALUES
('Bitcoin', 1000),
('Bitcoin', 200),
('Ethereum', 250),
('Ethereum', 5000),
('DOGEFI', 10),
('Bitcoin Diamond', 5000);
Мы можем использовать EXCEPT
, чтобы ответить на вопрос "Какие монеты мы владеем и которые никогда не торговались ниже $10?":
SELECT crypto_name FROM holdings
EXCEPT
SELECT crypto_name FROM crypto_prices
WHERE price < 10;
┌─crypto_name─┐
│ Bitcoin │
│ Bitcoin │
└─────────────┘
Это означает, что из четырех криптовалют, которыми мы владеем, только Bitcoin никогда не падал ниже $10 (базируясь на ограниченных данных, которые у нас есть в этом примере).
Использование EXCEPT DISTINCT
Обратите внимание, что в предыдущем запросе у нас было несколько удержаний Bitcoin в результате. Вы можете добавить DISTINCT
к EXCEPT
, чтобы исключить дублирующиеся строки из результата:
SELECT crypto_name FROM holdings
EXCEPT DISTINCT
SELECT crypto_name FROM crypto_prices
WHERE price < 10;
┌─crypto_name─┐
│ Bitcoin │
└─────────────┘
Смотрите также