INSERT SELECT
Содержание раздела
- Синтаксис
- Ограничения
- Примеры
- Вставка данных во все столбцы логической таблицы
- Вставка данных в некоторые столбцы логической таблицы
- Вставка данных в логическую таблицу вне дельты
- Вставка данных в логическую таблицу из другой логической БД
- Вставка данных в логическую таблицу из логического представления
- Заполнение столбца логической таблицы данными другой таблицы
- Вставка данных в логическую таблицу из standalone-таблицы
- Вставка данных в standalone-таблицу из логической таблицы
- Перезапуск операции по вставке записей
Поддерживается в версиях: 6.1 / 6.0 / 5.8 / 5.7 / 5.6.1 / 5.5 / 5.4 / 5.3 / 5.2.
Запрос вставляет записи в логическую таблицу или standalone-таблицу (далее — целевая таблица) из другой логической сущности.
Синтаксис вставки в standalone-таблицу подразумевает использование внешней writable-таблицы, которая указывает на standalone-таблицу. При вставке данных в standalone-таблицу учитывайте ограничения таблиц в конкретной СУБД.
Вставка записей в логические и материализованные представления недоступна.
Чтобы вставить большой объем данных, используйте загрузку данных или сочетание выгрузки и загрузки данных.
Источниками данных могут быть следующие сущности и их соединения:
- логическая таблица,
- логическое представление представление,
- материализованное представление,
- standalone-таблица.
Вставка данных возможна при любом из условий:
- источник данных и данные целевой таблицы находятся в одном датасорсе,
- источник данных находится в датасорсе с СУБД ADB, а данные целевой таблицы — в датасорсе с СУБД ADB, ADP, ADG и (или) ADQM.
Расположением данных логической таблицы можно управлять с помощью запросов CREATE TABLE и DROP TABLE с ключевым словом DATASOURCE_TYPE
. Первый запрос позволяет выбрать датасорсы для размещения данных таблицы, второй — удалить данные таблицы из выбранного датасорса.
Запрос обрабатывается в порядке, описанном в разделе Порядок обработки запросов на обновление данных.
В ответе возвращается:
- объект ResultSet c одной записью, содержащей номер операции записи, при успешном выполнении запроса;
- исключение при неуспешном выполнении запроса.
Записи выбираются из одного датасорса:
- указанного в запросе или наиболее оптимального — если данные выбираются из логических таблиц, логических и материализованных представлений;
- содержащего standalone-таблицу — если данные выбираются из standalone-таблицы или ее соединений с другими сущностями.
Записи вставляются в логическую таблицу следующим образом: если в текущей версии данных таблицы есть запись со значением первичного ключа, выбранным SELECT-запросом, запись обновляется; иначе добавляется новая запись. Все поля, указанные в запросе, заполняются значениями из запроса, а пропущенные поля — значениями по умолчанию.
Незавершенную операцию по вставке данных можно перезапустить, повторив исходный запрос с ключевым словом RETRY. Подробнее о способах обработки незавершенных операций см. в разделе Управление операциями записи.
При вставке данных из standalone-таблицы в логическую таблицу обеспечьте неизменность данных в standalone-таблице на время работы запроса. Иначе вставка может привести к расхождениям данных между датасорсами.
По умолчанию система ведет статистику обработки запросов к данным. Запросы INSERT SELECT
учитываются в категории WRITE
. Чтобы получить статистику, выполните GET_ENTITY_STATISTICS.
Синтаксис
Вставка данных во все столбцы таблицы:
INSERT INTO [db_name.]table_name SELECT query
Вставка данных в некоторые столбцы таблицы (с заполнением остальных столбцов значениями по умолчанию):
INSERT INTO [db_name.]table_name (column_list) SELECT query
Перезапуск операции по вставке данных:
RETRY INSERT INTO [db_name.]table_name [(column_list)] SELECT query
Параметры:
db_name
-
Имя логической базы данных. Опционально, если выбрана логическая БД, используемая по умолчанию.
table_name
-
Имя таблицы, в которую вставляются данные. Возможные значения:
- имя логической таблицы,
- имя внешней writable-таблицы, указывающей на нужную standalone-таблицу.
column_list
-
Список имен столбцов указанной таблицы. Имена перечисляются в круглых скобках через запятую. Список опционален, если количество и порядок столбцов в SELECT-подзапросе соответствуют количеству и порядку столбцов в таблице.
query
-
SELECT-подзапрос для выбора данных.
Ключевое слово SELECT
Ключевое слово SELECT
задает SELECT-подзапрос для выбора данных из источника.
Ключевое слово RETRY
Ключевое слово перезапускает обработку незавершенной операции записи, созданной запросом INSERT SELECT
. Если ключевое слово не указано, система создает новую операцию и обрабатывает ее.
Пример запроса с ключевым словом RETRY
см. ниже. Список незавершенных операций можно получить с помощью запроса GET_WRITE_OPERATIONS.
Перезапуск с ключевым словом RETRY
доступен только для операций со статусом «Выполняется». Чтобы перезапустить операцию со статусом «Отменяется», выполните RESUME_WRITE_OPERATION. Подробнее о способах перезапуска и отмены операций см. в разделе Управление операциями записи.
Ключевое слово RETRY
недоступно в запросах к standalone-таблицам.
Ограничения
Ограничения выполнения
- Выполнение запроса недоступно, если есть незавершенная операция по изменению схемы.
- Не допускается параллельное выполнение идентичных запросов.
Ограничения сущностей
- Вставка данных в логические и материализованные представления недоступна.
- Если данные вставляются из standalone-таблицы в логическую таблицу, данные standalone-таблицы должны оставаться неизменными во время работы запроса.
Другие ограничения
- Недоступна вставка данных в датасорс с тем же типом СУБД, который указан в SELECT-подзапросе (например, вставка из
ADB
вADB2
). - Типы вставляемых значений должны соответствовать типам данных столбцов в целевой таблице.
- Ключевое слово
RETRY
недоступно в запросах к standalone-таблицам.
Примеры
Вставка данных во все столбцы логической таблицы
-- выбор логической базы данных marketing в качестве базы данных по умолчанию
USE marketing;
-- создание логической таблицы sales_july_2021 с данными о продажах за июль 2021 (с размещением данных в датасорсе adb)
CREATE TABLE sales_july_2021 (
id BIGINT NOT NULL,
transaction_date TIMESTAMP NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units BIGINT NOT NULL,
store_id BIGINT NOT NULL,
description VARCHAR(256),
PRIMARY KEY (id)
) DISTRIBUTED BY (id)
DATASOURCE_TYPE ('adb');
-- открытие новой (горячей) дельты
BEGIN DELTA;
-- вставка данных из таблицы sales в таблицу sales_july_2021
INSERT INTO sales_july_2021
SELECT * FROM sales WHERE CAST(EXTRACT(MONTH FROM transaction_date) AS INT) = 7 AND
CAST(EXTRACT(YEAR FROM transaction_date) AS INT) = 2021 DATASOURCE_TYPE = 'adb';
-- закрытие дельты
COMMIT DELTA;
Вставка данных в некоторые столбцы логической таблицы
-- выбор логической базы данных marketing в качестве базы данных по умолчанию
USE marketing;
-- создание логической таблицы current_stores с выборкой из таблицы stores (с размещением данных в датасорсе adqm)
CREATE TABLE current_stores (
id BIGINT NOT NULL,
category VARCHAR(256),
region VARCHAR(256),
address VARCHAR(256),
description VARCHAR(256),
PRIMARY KEY (id)
)
DISTRIBUTED BY (id)
DATASOURCE_TYPE ('adqm');
-- открытие новой (горячей) дельты
BEGIN DELTA;
-- вставка данных в таблицу current_stores (столбец description пропущен)
INSERT INTO current_stores (id, category, region, address)
SELECT id, category, region, address FROM stores FOR SYSTEM_TIME AS OF DELTA_NUM 10 DATASOURCE_TYPE = 'adqm';
-- закрытие дельты
COMMIT DELTA;
Вставка данных в логическую таблицу вне дельты
-- вставка данных в таблицу current_stores вне дельты (столбец description пропущен)
INSERT INTO marketing.current_stores (id, category, region, address)
SELECT id, category, region, address FROM marketing.stores FOR SYSTEM_TIME AS OF DELTA_NUM 11 DATASOURCE_TYPE = 'adqm';
Вставка данных в логическую таблицу из другой логической БД
-- создание новой логической БД marketing_new
CREATE DATABASE marketing_new;
-- выбор логической базы данных marketing_new в качестве базы данных по умолчанию
USE marketing_new;
-- создание логической таблицы sales в логической БД marketing_new с размещением данных в датасорсе adp
CREATE TABLE sales (
id BIGINT NOT NULL,
transaction_date TIMESTAMP NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units BIGINT NOT NULL,
store_id BIGINT NOT NULL,
description VARCHAR(256),
PRIMARY KEY (id)
) DISTRIBUTED BY (id)
DATASOURCE_TYPE ('adp');
-- открытие новой (горячей) дельты
BEGIN DELTA;
-- вставка данных в таблицу sales из аналогичной таблицы логической БД marketing
INSERT INTO sales SELECT * FROM marketing.sales WHERE store_id BETWEEN 1234 AND 4567 DATASOURCE_TYPE = 'adp';
-- закрытие дельты
COMMIT DELTA;
Вставка данных в логическую таблицу из логического представления
-- выбор логической базы данных marketing в качестве базы данных по умолчанию
USE marketing;
-- создание логического представления basic_stores с данными о магазинах категории basic
CREATE VIEW basic_stores AS SELECT * FROM stores WHERE category = 'basic';
-- создание таблицы basic_stores_table с данными о магазинах категории basic (с размещением данных в датасорсах adb и adqm)
CREATE TABLE basic_stores_table (
id BIGINT NOT NULL,
category VARCHAR(256),
region VARCHAR(256),
address VARCHAR(256),
description VARCHAR(256),
PRIMARY KEY (id)
) DISTRIBUTED BY (id)
DATASOURCE_TYPE ('adb', 'adqm');
-- открытие новой (горячей) дельты
BEGIN DELTA;
-- вставка данных в таблицу basic_stores_table
INSERT INTO basic_stores_table SELECT * FROM basic_stores DATASOURCE_TYPE = 'adb';
-- закрытие дельты
COMMIT DELTA;
Заполнение столбца логической таблицы данными другой таблицы
-- выбор логической базы данных marketing в качестве базы данных по умолчанию
USE marketing;
-- создание логической таблицы с данными покупок и адресов магазинов, где были совершены покупки
CREATE TABLE sales_with_address (
id BIGINT NOT NULL,
transaction_date TIMESTAMP NOT NULL,
product_code VARCHAR(256),
product_units BIGINT,
store_id BIGINT,
description VARCHAR(256),
store_address VARCHAR(256),
PRIMARY KEY (id)
) DISTRIBUTED BY (id)
DATASOURCE_TYPE ('adb', 'adg', 'adqm', 'adp');
-- открытие новой (горячей) дельты
BEGIN DELTA;
-- вставка данных из таблицы sales (заполнение всех столбцов, кроме store_address)
INSERT INTO sales_with_address (id, transaction_date, product_code, product_units, store_id, description)
SELECT * FROM sales DATASOURCE_TYPE = 'adb';
-- закрытие дельты
COMMIT DELTA;
-- открытие новой (горячей) дельты
BEGIN DELTA;
--- вставка данных адресов из таблицы stores в те строки, где адрес не заполнен
INSERT INTO sales_with_address
SELECT s.id, s.transaction_date, s.product_code, s.product_units, s.store_id, s.description,
st.region || ', ' || st.address as store_address
FROM stores AS st
JOIN sales_with_address AS s ON s.store_id = st.id
WHERE s.store_address IS NULL OR s.store_address = ''
DATASOURCE_TYPE = 'adb';
-- закрытие дельты
COMMIT DELTA;
Вставка данных в логическую таблицу из standalone-таблицы
-- выбор логической базы данных marketing в качестве базы данных по умолчанию
USE marketing;
-- создание логической таблицы agreements_adp с размещением данных в датасорсе adp
CREATE TABLE agreements_adp (
id BIGINT NOT NULL,
client_id BIGINT NOT NULL,
number VARCHAR NOT NULL,
signature_date DATE,
effective_date DATE,
closing_date DATE,
description VARCHAR,
PRIMARY KEY(id)
)
DISTRIBUTED BY (id)
DATASOURCE_TYPE ('adp');
-- открытие новой (горячей) дельты
BEGIN DELTA;
-- вставка данных в логическую таблицу agreements_adp из standalone-таблицы,
-- на которую указывает внешняя readable-таблица agreements_ext_read_adp
INSERT INTO agreements_adp SELECT * FROM agreements_ext_read_adp;
-- закрытие дельты
COMMIT DELTA;
Вставка данных в standalone-таблицу из логической таблицы
-- создание внешней writable-таблицы, связанной со standalone-таблицей датасорса adqm
CREATE WRITABLE EXTERNAL TABLE marketing.sales_ext_write_adqm (
id BIGINT NOT NULL,
transaction_date TIMESTAMP NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units BIGINT NOT NULL,
store_id BIGINT NOT NULL,
description VARCHAR(256),
PRIMARY KEY (id)
)
DISTRIBUTED BY (id)
LOCATION 'core:adqm://dtm__marketing.sales'
OPTIONS ('auto.create.table.enable=true');
-- вставка данных в standalone-таблицу, на которую указывает внешняя writable-таблица sales_ext_write_adqm,
-- из логической таблицы sales
INSERT INTO marketing.sales_ext_write_adqm SELECT * FROM marketing.sales DATASOURCE_TYPE = 'adqm';
Перезапуск операции по вставке записей
-- выбор логической базы данных marketing в качестве базы данных по умолчанию
USE marketing;
-- открытие новой (горячей) дельты
BEGIN DELTA;
-- вставка записей в таблицу current_stores без указания значения столбца description
INSERT INTO current_stores
(id, category, region, address)
SELECT id, category, region, address
FROM stores FOR SYSTEM_TIME AS OF DELTA_NUM 12 DATASOURCE_TYPE = 'adqm';
-- перезапуск обработки операции по вставке записи
RETRY INSERT INTO current_stores
(id, category, region, address)
SELECT id, category, region, address
FROM stores FOR SYSTEM_TIME AS OF DELTA_NUM 12 DATASOURCE_TYPE = 'adqm';
-- закрытие дельты
COMMIT DELTA;