JBatch или далеко не самые большие данные
День 1 / 15:30 / Зал 4 / Язык: RUПрактически в любом Java-проекте для больших предприятий все еще происходит (чаще всего ночной) офлайновый процессинг данных. Но данных не так много, и пропускать их через Hadoop было бы стрельбой по воробьям из пушек. Чаще всего подобный процессинг «далеко не больших данных» происходит с помощью самописных небольших программ или, в лучшем случае, самописных фрейморков. Они часто идеально подходят для конкретной задачи, но крайне капризны, если что-то надо изменить/адаптировать/расширить. Все это заканчивается полным переписыванием. Масштабируемость самописных решений часто страдает.
Чтобы навести порядок в этом важном, но немного недооцененном аспекте, был разработан JSR-352 Java Batch. На лекции слушатели познакомятся с данным JSR. Они узнают, как определяются «работа», «задачи», как работа разбивается на «этапы» и «куски». Дмитрий рассмотрит, как распараллеливать задачи и обеспечивать их транзакционность в рамках контейнера. И главное, как рационально «не повторяться». Также пройдёт сравнение JBatch с Spring batch.
Данный фреймворк был официально включен в Java EE 7, так что он доступен «из коробочки» на любом Java EE 7 сервере.
Дмитрий Александров, T-Systems
Ведущий программист/архитектор в T-Systems, по совместительству ко-лидер Болгарской Java User Group. Помимо работы читает лекции на конференциях. Организатор конференции jPrime.io — крупнейшей Java-конференции на Балканах.
В перечень основных интересов входят динамические языки на JVM (Nashorn project) и Java EE, а также вся Spring инфраструктура.