CREATE TABLE
Содержание раздела
- Синтаксис
- Ограничения
- Примеры
- Таблица с размещением данных во всех датасорсах
- Таблица с составным первичным ключом
- Таблица с размещением данных в двух датасорсах
- Таблица только на логическом уровне
- Таблица с периодическим остужением и удалением данных из двух датасорсов
- Таблица с периодическим остужением данных одного датасорса
- Таблица с периодическим удалением данных из одного датасорса
Поддерживается в версиях: 6.3 / 6.2 / 6.1 / 6.0 / 5.8 / 5.7 / 5.6 / 5.5 / 5.4 / 5.3 / 5.2 / 5.1 / 5.0.
Запрос создает логическую таблицу в логической базе данных.
Запрос попадает в очередь операций и обрабатывается в порядке его поступления в очередь. В ответе возвращается:
- пустой объект ResultSet при успешном выполнении запроса;
- исключение при неуспешном выполнении запроса.
При успешном выполнении запроса система создает логическую таблицу, а также подготавливает хранилище к размещению данных таблицы — создает физические таблицы, связанные с логической таблицей и предназначенные для хранения ее данных.
При ошибке выполнения корректного запроса все последующие запросы в логической БД блокируются. В этом случае следует устранить причины сбоя и повторить сбойную операцию. Если повторение операции невозможно, удалите сбойную операцию запросом ERASE_CHANGE_OPERATION и вручную устраните несоответствия на физическом уровне (если такие есть).
Каждое создание таблицы записывается в журнал. Журнал можно посмотреть с помощью запроса GET_CHANGES.
Синтаксис
CREATE TABLE [IF NOT EXISTS] [db_name.]table_name (
column_name_1 datatype_1 [ NULL | NOT NULL ],
column_name_2 datatype_2 [ NULL | NOT NULL ],
column_name_3 datatype_3 [ NULL | NOT NULL ],
PRIMARY KEY (column_list_1)
) DISTRIBUTED BY (column_list_2)
[DATASOURCE_TYPE (datasource_aliases)]
[RETENTION (origin_datasource_alias, retention_period[, archive_datasource_alias])]
[LOGICAL_ONLY]
Параметры:
db_name
-
Имя логической базы данных, в которой создается логическая таблица. Опционально, если выбрана логическая БД, используемая по умолчанию.
table_name
-
Имя создаваемой логической таблицы, уникальное среди логических сущностей логической БД.
column_name_N
-
Имя столбца таблицы.
datatype_N
-
Тип данных столбца
column_name_N
. Возможные значения см. в разделе Логические типы данных. column_list_1
-
Список столбцов, входящих в первичный ключ таблицы.
column_list_2
-
Список столбцов, входящих в ключ шардирования таблицы. Столбцы должны быть из числа столбцов
column_list_1
. datasource_aliases
-
Список имен датасорсов, в которых нужно разместить данные таблицы.
Элементы списка перечисляются через запятую, каждый из них указывается в одинарных кавычках (например,'adg'
). Варианты, которые остаются доступными, но могут быть удалены в будущем: значения без кавычек (например,adg
) или в двойных кавычках (например,"adg"
). origin_datasource_alias
-
Имя датасорса-источника, из которого перемещаются или удаляются неактуальные версии данных согласно retention-правилу. Имя указывается в одинарных кавычках (например,
'adb'
). retention_period
-
Срок хранения неактуальных версий данных (в секундах) в датасорсе
origin_datasource_alias
согласно retention-правилу.
Если значение равно 0, в датасорсеorigin_datasource_alias
хранятся только актуальные версии данных, а все неактуальные версии данных перемещаются в хранилище холодных данных или удаляются при каждой проверке retention-правила. archive_datasource_alias
-
Имя датасорса-приемника, куда согласно retention-правилу перемещаются неактуальные версии данных по истечении срока их хранения. Имя указывается в одинарных кавычках (например,
'adb2'
).
Если значение не указано, неактуальные версии данных по истечении срока хранения удаляются, а не перемещаются в хранилище холодных данных.
Ключевое слово IF NOT EXISTS
Ключевое слово IF NOT EXISTS
включает проверку наличия логической таблицы до попытки создания. Если ключевое слово указано в запросе, успешный ответ возвращается при наличии или успешном создании логической таблицы, иначе — только при успешном создании логической таблицы.
Ключевое слово PRIMARY KEY
Ключевое слово PRIMARY KEY
задает список столбцов, входящих в первичный ключ таблицы.
Ключевое слово DISTRIBUTED BY
Ключевое слово DISTRIBUTED BY
задает список столбцов, входящих в ключ шардирования таблицы. Все указываемые столбцы должны присутствовать в первичном ключе.
Ключевое слово DATASOURCE_TYPE
Ключевое слово DATASOURCE_TYPE
задает список датасорсов для размещения данных логической таблицы. Если ключевое слово и значения не указаны, данные таблицы размещаются во всех датасорсах окружения.
См. также параметр datasource_aliases.
Ключевое слово RETENTION
Ключевое слово задает retention-правило для указанного датасорса-источника. Для каждого датасорса, где размещены данные логической таблицы, можно задать свое retention-правило.
Подробнее о retention-правилах см. в разделе Retention-правило.
Если ключевое слово не указано, неактуальные версии данных бессрочно хранятся вместе с актуальными версиями данных.
Ключевое слово LOGICAL_ONLY
Ключевое слово LOGICAL_ONLY
позволяет создать логическую таблицу только на логическом уровне (в логической схеме данных), без пересоздания связанных физических таблиц в хранилище данных.
Если ключевое слово не указано, создается как логическая, так и связанные с ней физические таблицы.
Ограничения
Ограничения выполнения
- Выполнение запроса недоступно, если есть незавершенная операция записи или установлен запрет на изменение сущностей.
Ограничения имен
- Имена таблицы и ее столбцов должны соответствовать требованиям, описанным в разделе Соглашения об именах.
- Имена столбцов должны быть уникальны в рамках логической таблицы.
Ограничения столбцов
- Первичный ключ должен включать все столбцы ключа шардирования.
Ограничения ключевых слов
- Ключевое слово
RETENTION
доступно для СУБД ADB и ADP. - Выражение с ключевым словом
RETENTION
не может содержать датасорс-источник и датасорс-приемник разных типов.
Другие ограничения
- Информационная схема обновляется асинхронно, поэтому созданная таблица может не сразу появиться в информационной схеме.
Примеры
Таблица с размещением данных во всех датасорсах
CREATE TABLE marketing.sales (
id BIGINT NOT NULL,
transaction_date TIMESTAMP NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units BIGINT NOT NULL,
store_id BIGINT NOT NULL,
description VARCHAR(256),
PRIMARY KEY (id)
)
DISTRIBUTED BY (id)
Таблица с составным первичным ключом
CREATE TABLE marketing.stores (
id BIGINT NOT NULL,
category VARCHAR(256) NOT NULL,
region VARCHAR(256) NOT NULL,
address VARCHAR(256) NOT NULL,
description VARCHAR(256),
PRIMARY KEY (id, region)
)
DISTRIBUTED BY (id)
Таблица с размещением данных в двух датасорсах
CREATE TABLE marketing.clients (
id BIGINT NOT NULL,
first_name VARCHAR(256) NOT NULL,
last_name VARCHAR(256) NOT NULL,
patronymic_name VARCHAR(256),
birth_date DATE,
PRIMARY KEY (id)
) DISTRIBUTED BY (id)
DATASOURCE_TYPE ('adp','adqm')
Таблица только на логическом уровне
CREATE TABLE marketing.sales1 (
id BIGINT NOT NULL,
transaction_date TIMESTAMP NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units BIGINT NOT NULL,
store_id BIGINT NOT NULL,
description VARCHAR(256),
PRIMARY KEY (id)
)
DISTRIBUTED BY (id)
LOGICAL_ONLY
Таблица с периодическим остужением и удалением данных из двух датасорсов
-- создание логической таблицы clients_all_adp с размещением в датасорсах adp1 и adp2,
-- откуда, в зависимости от датасорса,
-- неактуальные версии данных старше месяца будут перемещаться в хранилище холодных данных (adp1 -> adp_archive) или удаляться (adp2)
CREATE TABLE marketing.clients_all_adp (
id BIGINT NOT NULL,
first_name VARCHAR(256) NOT NULL,
last_name VARCHAR(256) NOT NULL,
patronymic_name VARCHAR(256),
birth_date DATE,
PRIMARY KEY (id)
) DISTRIBUTED BY (id)
DATASOURCE_TYPE ('adp1', 'adp2')
RETENTION ('adp1', 2678400, 'adp_archive')
RETENTION ('adp2', 2678400)
Таблица с периодическим остужением данных одного датасорса
-- создание логической таблицы clients_adp1 с размещением данных в датасорсе adp1,
-- откуда неактуальные версии данных старше недели будут перемещаться в хранилище холодных данных
CREATE TABLE marketing.clients_adp1 (
id BIGINT NOT NULL,
first_name VARCHAR(256) NOT NULL,
last_name VARCHAR(256) NOT NULL,
patronymic_name VARCHAR(256),
birth_date DATE,
PRIMARY KEY (id)
) DISTRIBUTED BY (id)
DATASOURCE_TYPE ('adp1')
RETENTION ('adp1', 604800, 'adp_archive')
Таблица с периодическим удалением данных из одного датасорса
-- создание логической таблицы clients_adp2 с размещением данных в датасорсе adp2,
-- откуда неактуальные версии данных старше недели будут удаляться
CREATE TABLE marketing.clients_adp2 (
id BIGINT NOT NULL,
first_name VARCHAR(256) NOT NULL,
last_name VARCHAR(256) NOT NULL,
patronymic_name VARCHAR(256),
birth_date DATE,
PRIMARY KEY (id)
) DISTRIBUTED BY (id)
DATASOURCE_TYPE ('adp2')
RETENTION ('adp2', 604800)