Как посчитать CTR 100М объектов в реальном времени и не умереть
День 1 / 12:00 / Зал 5 / Язык: RUПодсчет CTR не выглядит сложной задачей — даже если у вас есть терабайты логов с показами и кликами, небольшой кластер Hadoop-а управится с ними без каких либо проблем. Если объектов не так много, например, сотни тысяч рекламных компаний, считать CTR можно и в реальном времени. Но ситуация сильно меняется если перед вами встает задача подсчитывать в реальном времени CTR сотен миллионов объектов, обрабатывая миллионы событий в секунду, а затем использовать полученные результаты при оценке десятков миллионов кандидатов каждую секунду.
В рамках доклада Дмитрий и слушатели поговорят о том, как реализуется оценка CTR объектов в ленте Одноклассников, какие технологии были взяты за основу и как пришлось их «допиливать», а также о том, какие задачи помимо оценки CTR позволяют решать платформы потокового анализа данных.
Дмитрий Бугайченко, Одноклассники
Закончил Санкт-Петербургский Государственный Университет в 2004 году, там же защитил кандидатскую по формально-логическим методам в 2007. Почти 9 лет проработал в аутсорсинге, не теряя контакта с университетом и научной средой. Анализ больших данных в Одноклассниках стал для Дмитрия уникальным шансом совместить теоретическую подготовку и научный фундамент с разработкой реальных, востребованных продуктов. И этим шансом он с радостью воспользовался, придя сюда пять лет назад.