<сильный>1. Как работает сканирование в AWS DynamoDB?
Ответ:
i) Операция сканирования возвращает один или несколько элементов.
ii) По умолчанию операции сканирования выполняются последовательно.
iii) По умолчанию Scan использует в конечном счете согласованные операции чтения при доступе к данным в таблице.
iv) Если общее количество отсканированных элементов превышает максимальный размер набора данных, равный 1 МБ, сканирование останавливается, и результаты возвращаются пользователю в виде значения LastEvaluatedKey для продолжения сканирования в последующей операции.
v) Операция сканирования по умолчанию выполняет последовательное чтение и может возвращать до 1 МБ (одну страницу) данных. Таким образом, один запрос на сканирование может потреблять
(1 MB page size / 4 KB item size) / 2 (eventually consistent reads) = 128 read operations.
<сильный>2. Как работает параллельное сканирование в AWS DynamoDB?
Ответ:
i) Для повышения производительности при работе с большой таблицей или вторичным индексом приложения могут запрашивать операцию параллельного сканирования.
ii) Вы можете запускать несколько рабочих потоков или процессов параллельно. Каждый воркер сможет сканировать отдельный сегмент таблицы одновременно с другими воркерами. Функция сканирования DynamoDB теперь принимает два дополнительных параметра:
- TotalSegments — количество рабочих процессов, которые будут одновременно обращаться к таблице.
- Сегмент — сегмент таблицы, к которому будет обращаться вызывающий рабочий процесс.
iii) При совместном использовании этих двух параметров сканирование ограничивается определенным блоком элементов в таблице. Вы также можете использовать существующий параметр Limit, чтобы контролировать объем данных, возвращаемых отдельным запросом на сканирование.
<сильный>3. Сканирование или параллельное сканирование в AWS DyanmoDB?
Ответ:
i) Операция сканирования может считывать только один раздел за раз. Таким образом, параллельное сканирование необходимо для более быстрого чтения нескольких разделов одновременно.
ii) Последовательное сканирование не всегда может полностью использовать предоставленную пропускную способность чтения. Так что там нужно параллельное сканирование.
iii) Параллельное сканирование: сократите свои расходы до 4 раз для определенных типов запросов и сканирований.
<сильный>4. Когда параллельное сканирование будет предпочтительным?
Ответ:
Параллельное сканирование может быть правильным выбором, если выполняются следующие условия:
Размер таблицы составляет 20 ГБ или больше.
Предоставленная пропускная способность чтения таблицы используется не полностью.
Операции последовательного сканирования выполняются слишком медленно.
<сильный>5. Применяется ли выражение фильтра перед сканированием?
Ответ: Нет, выражение FilterExpression применяется после того, как элементы уже прочитаны; процесс фильтрации не потребляет никаких дополнительных единиц емкости чтения.
Ссылка на ресурс:
Сканировать
Параллельное сканирование
Пример — параллельное сканирование с использованием Java
Amazon DynamoDB — параллельное сканирование, в 4 раза дешевле Читает, другие хорошие новости
Избегайте внезапных всплесков чтения
person
SkyWalker
schedule
21.12.2016