Как посчитать CTR 100М объектов в реальном времени и не умереть

День 1 / 12:00  / Зал 5  / Язык: RU

Подсчет CTR не выглядит сложной задачей — даже если у вас есть терабайты логов с показами и кликами, небольшой кластер Hadoop-а управится с ними без каких либо проблем. Если объектов не так много, например, сотни тысяч рекламных компаний, считать CTR можно и в реальном времени. Но ситуация сильно меняется если перед вами встает задача подсчитывать в реальном времени CTR сотен миллионов объектов, обрабатывая миллионы событий в секунду, а затем использовать полученные результаты при оценке десятков миллионов кандидатов каждую секунду.

В рамках доклада Дмитрий и слушатели поговорят о том, как реализуется оценка CTR объектов в ленте Одноклассников, какие технологии были взяты за основу и как пришлось их «допиливать», а также о том, какие задачи помимо оценки CTR позволяют решать платформы потокового анализа данных.



Дмитрий Бугайченко

Дмитрий Бугайченко, Одноклассники

Закончил Санкт-Петербургский Государственный Университет в 2004 году, там же защитил кандидатскую по формально-логическим методам в 2007. Почти 9 лет проработал в аутсорсинге, не теряя контакта с университетом и научной средой. Анализ больших данных в Одноклассниках стал для Дмитрия уникальным шансом совместить теоретическую подготовку и научный фундамент с разработкой реальных, востребованных продуктов. И этим шансом он с радостью воспользовался, придя сюда пять лет назад.


Контакты

program@jokerconf.com
Программа конференции
program@jokerconf.com
sponsors@jokerconf.com
Спонсоры
sponsors@jokerconf.com
partners@jokerconf.com
Партнеры
partners@jokerconf.com