MariaDB 11.8 LTS с векторным поиском и расширенной поддержкой временных меток

MariaDB Foundation опубликовала ежегодный релиз долгосрочной поддержки своей популярной СУБД с открытым исходным кодом – MariaDB 11.8 LTS. Главной изюминкой релиза является MariaDB Vector, собственная реализация векторного поиска сходства – ключевой техники в машинном обучении и обработке естественного языка.

В релизе появился специальный тип данных VECTOR, индексные структуры, оптимизированные для запросов к ближайшим соседям, и вспомогательные функции, такие как VEC_DISTANCE() для вычисления евклидова или косинусного числа.

Под капотом SIMD-оптимизация использует инструкции AVX2, AVX-512, ARM NEON и IBM Power10, что позволяет выполнять крупномасштабные генерации с расширенным поиском и другие рабочие нагрузки ИИ непосредственно в движке базы данных. Для организаций, изучающих генеративный ИИ, это очень важно: вы можете хранить вложения и бизнес-данные в одном месте и при этом достигать целей поиска с низкой задержкой.

Помимо ИИ, MariaDB без лишнего шума решила проблему 2038 года для стандартных таблиц, расширив диапазон жизни TIMESTAMP до февраля 2106 года – миграция данных не требуется.

Более того, начиная с версии MariaDB 11.8 LTS, набор символов по умолчанию переходит от latin1 к utf8mb4, обеспечивая полную поддержку Emoji и современных языков из коробки. Коллажи теперь отслеживают алгоритм Unicode Collation Algorithm 14.0, что уменьшает неожиданные несоответствия при переходе разработчиков с MariaDB на другие системы с поддержкой Unicode.

Что касается безопасности, то в релиз включена PARSEC – аутентификация пароля с подписью ответа эллиптическими кривыми. Хотя PARSEC пока не является плагином по умолчанию, он объединяет лучшие современные практики (подписи на основе эллиптических кривых, хэш-функции и вызовы на основе nonce) в единый механизм.

Аутентификация через Unix-сокеты также была настроена для более плавного локального входа в систему по отзывам системных администраторов.

Что касается резервного копирования, восстановления и репликации, администраторы, проводящие выходные за резервным копированием, оценят, что mariadb-dump и mariadb-import теперь поддерживают параллельное резервное копирование и восстановление. При экспорте одной многотерабайтной схемы или целого созвездия микробаз данных несколько потоков могут значительно сократить время работы.

Репликация также выигрывает от вклада сообщества и производителей:

  • Переключение сегментов Binlog позволяет избежать дорогостоящего копирования файлов во время больших фиксаций.
  • Асинхронный откат ускоряет восстановление после сбоев.
  • Новый таймаут (slave_replication_delay_abort_timeout) автоматически прерывает блокирующие транзакции, сохраняя актуальность реплик даже при высокой нагрузке на запись.

Наконец, что касается наблюдаемости, в MariaDB 11.8 LTS появились более богатые колонки статистики и расширенные пользовательские метаданные. Теперь DBA могут обнаружить заблокированные учетные записи, истекающие сроки действия паролей и «горячие точки» рабочей нагрузки, не прибегая к внешним зондам.

Инженеры MariaDB обещают, что обновление с MariaDB 11.4 LTS или долгоживущих установок MariaDB 10.x, как правило, происходит за несколько секунд. Единственное предостережение касается таблиц с системными версиями, чей внутренний формат TIMESTAMP изменился, поэтому пользователям, полагающимся на эту функцию, следует ознакомиться с примечаниями к выпуску, прежде чем нажимать Enter.

Зарубин Иван Эксперт по Linux и Windows

Парашютист со стажем. Много читаю и слушаю подкасты. Люблю посиделки у костра, песни под гитару и приближающиеся дедлайны. Люблю путешествовать.

Похожие статьи

Комментарии (0)