Неочевидные оптимизации Iceberg таблиц
Iceberg становится де-факто отраслевым стандартом при построении lakehouse в России. Для сравнения, на последней конференции smart-data, Iceberg по частоте упоминания уступает только Spark. Это значит, что уверенное владение механикой работы Iceberg становится обязательным навыком для инженеров данных и платформенны...
Iceberg становится де-факто отраслевым стандартом при построении lakehouse в России. Для сравнения, на последней конференции smart-data, Iceberg по частоте упоминания уступает только Spark. Это значит, что уверенное владение механикой работы Iceberg становится обязательным навыком для инженеров данных и платформенных команд. Однако на практике большинство команд при внедрении ограничиваются базовыми возможностями, вроде создания таблиц, настройки партиционирования, настройки сompaction-процедурПри этом значительная часть производительности и стоимости эксплуатации Iceberg таблиц определяется менее очевидными деталями: устройством метаданных, стратегиями записи файлов и тем, как движки выполнения используют статистики файлов. Эти аспекты редко оказываются в центре внимания, но именно они часто становятся причиной деградации производительности по мере роста таблиц. На деле же пространство оптимизаций гораздо шире.В этой статье я разберу несколько неочевидных оптимизаций Iceberg таблиц.
Связанные теги
Компании и люди
Линия сюжета
Рекламный слот
Article monetization slot
Reserved for contextual monetization inside article pages.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
Как в Авито построили систему мониторинга BGP
Всем привет! Меня зовут Антон Ильичев, я сетевой инженер в Авито. В этой статье расскажу, зачем мы централизованно собираем и анализируем маршрутную информацию с сетевых устройс...
FT2 — новый сверхскоростной формат QSO
Чем занимаются нобелевские лауреаты по физике после завершения основной академической карьеры? Правильно — продолжают развивать свои научные проекты уже в качестве хобби. Так Дж...
Stable Diffusion XL: так ли сложно использовать локальную модель?
Когда звучит фраза «нарисовать картинку нейросетью», под этим обычно подразумевается отправка запроса в какой-нибудь условно-бесплатный сервис вроде Nano Banana или ChatGPT. Еще...
Каждый чайник — личность. Заметки об интеграциях в Умном доме Сбер
Салют, Хабр!Меня зовут Иван, я разработчик на Go. В SberDevices я занимаюсь реализацией интеграций — обеспечиваю возможность подключать устройства разных брендов к Умному дому С...