Big Data Montreal #48

Inscrivez-vous ici / Sign-up here: https://www.meetup.com/Big-Data-Montreal/events/233197738/

Big Data Montreal would like to invite you to its 48th meeting!

Join us on Tuesday August 16th 2016 at 6:00PM to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have 1 presentation scheduled:

• Now that I’ve crunched some Big Data, how can I serve it online? 
By Felix GV from LinkedIn’s Data Infrastructure.

You’ve deployed Hadoop, some ETL pipeline, a job scheduler and crunched a bunch of data, what are you going to do with the fruit of your labor? If you intend to serve this data back to your online users, then you might need a derived data serving system such as Voldemort Read-Only. Voldemort is a key value store capable of bulk loading large data sets from Hadoop. It has been battle tested at LinkedIn for many years, and it currently ingests more than 100 TB of freshly computed data every day while serving requests at sub millisecond latency. In this talk, Felix will tell you about the recent improvements that went into Voldemort, as well as a preview of the future of derived data serving at LinkedIn.

Finally, you are also welcome to join us for some casual networking, in the same room, after the presentations, followed by a beer in a close by location.

Please tell your friends and colleagues :) !

=====================================

Big Data Montréal vous invite à sa 48ième rencontre!

Joignez-vous à nous le mardi 16 août 2016 à 18h00 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Nous avons 1 présentation complète à l’horaire:

• Now that I’ve crunched some Big Data, how can I serve it online? 
By Felix GV from LinkedIn’s Data Infrastructure.

You’ve deployed Hadoop, some ETL pipeline, a job scheduler and crunched a bunch of data, what are you going to do with the fruit of your labor? If you intend to serve this data back to your online users, then you might need a derived data serving system such as Voldemort Read-Only. Voldemort is a key value store capable of bulk loading large data sets from Hadoop. It has been battle tested at LinkedIn for many years, and it currently ingests more than 100 TB of freshly computed data every day while serving requests at sub millisecond latency. In this talk, Felix will tell you about the recent improvements that went into Voldemort, as well as a preview of the future of derived data serving at LinkedIn.

Finalement, vous êtes invités à vous joindre à nous après les présentations, dans la même salle, pour continuer à réseauter, ensuite de quoi nous pourrons aller prendre un verre proche.

Passez le mot et venez en grand nombre :) !

Big Data Montréal #45 – Roaring bitmaps and HBase

Register here: http://www.meetup.com/Big-Data-Montreal/events/227426150/

Big Data Montreal would like to invite you to its 45th meeting!

Join us on Tuesday February 2nd 2016 at 18h30 to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the Cloud.ca Center (formerly RPM Startup Centre), which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have one presentation scheduled (and a few flash talks):

  • Achieving low latency for exact population count by Olivier Mirandette, Lead Software Architect at Guavus.In this presentation, we will present a scalable solution to solve a complex problem where functionality, latency, exactitude and volume of data are a challenge. The talk will include presentation of the problem, explanation of two failed proof of concept and the final solution (HBase, Coprocessor, Spark and RoaringBitMap). 

Finally, you are also welcome to join us for some casual networking, in the same room, after the presentations, followed by a bear at Brasseurs de Montreal.

Please tell your friends and colleagues :) !

 


 

Réservez vos billets ici: http://www.meetup.com/Big-Data-Montreal/events/227426150/

Big Data Montréal vous invite à sa 45e rencontre!

Joignez-vous à nous le mardi 2 février 2016 à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au Centre Cloud.ca (anciennement le RPM Startup Centre), qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Nous avons une présentation complète à l’horaire (et quelques flash-talks):

  • Achieving low latency for exact population count by Olivier Mirandette, Lead Software Architect at Guavus.In this presentation, we will present a scalable solution to solve a complex problem where functionality, latency, exactitude and volume of data are a challenge. The talk will include presentation of the problem, explanation of two failed proof of concept and the final solution (HBase, Coprocessor, Spark and RoaringBitMap). 

Finalement, vous êtes invités à vous joindre à nous après les présentations, dans la même salle, pour continuer à réseauter, ensuite de quoi nous pourrons aller prendre un verre aux aux Brasseurs de Montréal.

Passez le mot et venez en grand nombre :) !

Big Data Montréal #36 – Tuesday May 5th

Register here: bdm36.eventbrite.ca

Big Data Montreal would like to invite you to its thirty-sixth meeting!

Join us on Tuesday May 5th at 6pm to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the Centre Cloud.ca (formerly RPM Startup Centre), which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have one presentation scheduled:

  • NoSQL, Hadoop, and Beyond the Hype by Craig Vitter
    Hadoop and NoSQL. They are similar only in that they are both classified as software and do not use SQL. It is often helpful when learning about new technology to juxtapose two things side by side to better understand the differences, the job they are trying to get done, and how they often are seen fitting together within the wild. This talk is an architect’s perspective of what these technologies solve, tools that make using them easier to live with, and suggestions for how to fit them together within your business.

N.B.: This edition will be in English.

There will be food and drinks courtesy of Basho, our sponsors for this event.

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, for some casual networking (please use the appropriate ticket so we know how many people to expect).

Please tell your friends and colleagues :) !

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Inscrivez-vous ici: bdm36.eventbrite.ca

Big Data Montréal vous invite à sa trente sixième édition!

Joignez-vous à nous le mardi 5 mai à 18h00 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au Centre Cloud.ca (formerly RPM Startup Centre), qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Nous avons une présentation à l’horaire:

  • NoSQL, Hadoop, and Beyond the Hype by Craig Vitter
    Hadoop and NoSQL. They are similar only in that they are both classified as software and do not use SQL. It is often helpful when learning about new technology to juxtapose two things side by side to better understand the differences, the job they are trying to get done, and how they often are seen fitting together within the wild. This talk is an architect’s perspective of what these technologies solve, tools that make using them easier to live with, and suggestions for how to fit them together within your business.

N.B.: Cette édition sera en anglais.

Nous servirons nourriture et breuvages, gracieuseté de Basho, qui parraine cet événement.

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour continuer à réseauter (svp, utiliser le billet approprié pour que nous ayons une idée du nombre de personnes)

Passez le mot et venez en grand nombre :) !

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

Big Data Montréal #33 – Tuesday February 3rd – Hosted by Triton Digital

Tickets: bdm33.eventbrite.ca

Big Data Montreal would like to invite you to its thirty-third meeting!

Join us on Tuesday February 3rd at 6:30pm to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

NOTE: The meeting will be hosted by Triton Digital, which is located at 1440 St-Catherine West, Suite 1200.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have two scheduled presentations:

  • Big Data at Triton Digital by several Triton Engineers
    With an infrastructure capable of supporting millions of users listening to audio streams, as well as clients like Pandora, Spotify, CBS or Rdio who use their measurement systems, the volume processed by Triton Digial brings a lots of interesting challenges. This session will cover a high-level view of the architecture required to support this use-case as well as discussions around their experience with various technologies such as Druid, OpenTSDB and DataDog.

And a few flash presentations.

N.B.: This edition of BDM will be held in French

There will be food and drinks courtesy of Triton Digital, our sponsors for this event.

Finally, you are also welcome to stay at the venue after the presentations, for some casual networking.

Please tell your friends and colleagues :) !

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Big Data Montréal vous invite à sa trente troisième rencontre!

Joignez-vous à nous le mardi 3 dévrier à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

VEUILLEZ NOTER: La rencontre aura lieu chez Triton Digital, situé au 1440 Ste-Catherine Ouest, suite 1200.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Nous avons plusieurs présentations à l’horaire:

  • Big Data chez Triton Digital, présenté par plusieurs ingénieurs de Triton
    Avec une infrastructure capable de supporter plusieurs millions d’usagés qui stream de l’audio et avec des clients comme Pandora, Spotify, CBS ou Rdio qui utilisent leurs services de mesures, le volume de data que entre chez Triton Digital apporte son lot de défis. En plus d’une présentation haut niveau de l’architecture nécessaire pour supporter ce volume, Triton propose de nous parler de leurs expériences avec différents produits incluant Druid, OpenTSDB et DataDog.

N.B.: cette édition de BDM sera en français

Nous servirons nourriture et beuvrages, gracieuseté de Triton Digital!

Finalement, vous êtes invités à rester sur place après les présentations, pour discuter et faire du réseautage.

Passez le mot et venez en grand nombre :) !

 

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

Big Data Montreal #31 – Tuesday December 9th 6:30pm at the RPM Startup Centre

Tickets: bdm31.eventbrite.ca

Big Data Montreal would like to invite you to its thirty-first meeting!

Join us on Tuesday December 9th at 6:30pm to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have two scheduled presentations:

  • Spying on Hadoop with strace by Julia Evans, Machine Learning Software Engineer at Stripe
    Do you feel like you totally understand all the internals of the Hadoop ecosystem? How HDFS works? (I sure don’t!) Learning a little more about internals can help you use existing tools better, make appropriate architecture choices, and write better-performing jobs. To understand what’s going on, we’ll spy on exactly what information gets transmitted over the network with strace, and talk a little about how we can use that understanding to write smarter map/reduce jobs. You’ll come away understanding HDFS better and with some fun things to try out.
  • Introduction to Spark and MLlib by Reza Zadeh, consulting professor at Stanford and Technical Advisor to Databricks
    As computer clusters scale up, data flow models such as MapReduce have emerged as a way to run fault-tolerant computations on commodity hardware. Unfortunately, MapReduce is limited in efficiency for many numerical algorithms. We show how new data flow engines, such as Apache Spark, enable much faster iterative and numerical computations, while keeping the scalability and fault-tolerance properties of MapReduce. In this tutorial, we will begin with an overview of data flow computing models and the commodity cluster environment in comparison with traditional HPC and message-passing environments. We will then introduce Spark and show how common numerical and machine learning algorithms have been implemented on it.

And a few flash presentations.

N.B.: This edition will be in English.

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, for some casual networking (please use the appropriate ticket so we know how many people to expect).

Please tell your friends and colleagues :) !

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Billets: bdm31.eventbrite.ca

Big Data Montréal vous invite à sa trente et unième rencontre!

Joignez-vous à nous le mardi 9 décembre à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Nous avons deux présentations à l’horaire:

  • Spying on Hadoop with strace by Julia Evans, Machine Learning Software Engineer at Stripe
    Do you feel like you totally understand all the internals of the Hadoop ecosystem? How HDFS works? (I sure don’t!) Learning a little more about internals can help you use existing tools better, make appropriate architecture choices, and write better-performing jobs. To understand what’s going on, we’ll spy on exactly what information gets transmitted over the network with strace, and talk a little about how we can use that understanding to write smarter map/reduce jobs. You’ll come away understanding HDFS better and with some fun things to try out.
  • Introduction to Spark and MLlib by Reza Zadeh, consulting professor at Stanford and Technical Advisor to Databricks
    As computer clusters scale up, data flow models such as MapReduce have emerged as a way to run fault-tolerant computations on commodity hardware. Unfortunately, MapReduce is limited in efficiency for many numerical algorithms. We show how new data flow engines, such as Apache Spark, enable much faster iterative and numerical computations, while keeping the scalability and fault-tolerance properties of MapReduce. In this tutorial, we will begin with an overview of data flow computing models and the commodity cluster environment in comparison with traditional HPC and message-passing environments. We will then introduce Spark and show how common numerical and machine learning algorithms have been implemented on it.

Et quelques présentations éclair.

N.B.: Cette édition sera en anglais.

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour continuer à réseauter (svp, utiliser le billet approprié pour que nous ayons une idée du nombre de personnes)

Passez le mot et venez en grand nombre :) !

 

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

Big Data Montréal #28 – Tuesday Septembre 9th 6:30pm at the RPM Startup Centre

Tickets: bdm28.eventbrite.ca

Big Data Montreal would like to invite you to its twenty-eight meeting!

Join us on Tuesday September 9th at 6:30pm to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We currently have one scheduled presentation:

  • Kite SDK by Joey Echeverria, Cloudera. Along with the incredible power of the Hadoop ecosystem comes a lot of complexity for application developers. The Kite is the data API for the enterprise data hub. In this session we’ll cover the motivation and design of Kite and show you how Kite makes it easier to load data into Hadoop and to use the data once it’s there.

Also, we will have a few flash presentations:

  • Testing Apache Hive Systems by Julien Letrouit
  • From Data-Mining to Big Data-Mining by Francis Piéraut, Big-Data Mining/Machine Learning geek

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, for some casual networking (please use the appropriate ticket so we know how many people to expect).

Please tell your friends and colleagues :) !

 

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Billets: bdm28.eventbrite.ca

Big Data Montréal vous invite à sa vingt-huitième rencontre!

Joignez-vous à nous le mardi 9 septembre à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Nous avons une présentation à l’horaire:

  • Kite SDK by Joey Echeverria, Cloudera.Avec l’incroyable puissance de l’écosystème d’Hadoop vient malheureusement beaucoup de complexité pour les développeurs d’applications. “The Kite” est un API pour les plateformes de données des entreprises. Dans cette présentation, nous couvrirons les motivations du design de Kite et nous montrerons comment Kite simplifie les processus de chargement des données dans Hadoop ainsi que leur utilisation une fois en place.

Nous aurons également quelques présentations éclairs:

  • Tester un système Apache Hive par Julien Letrouit
  • From Data-Mining to Big Data-Mining par Francis Piéraut, Big-Data Mining/Machine Learning geek

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour continuer à réseauter (svp, utiliser le billet approprié pour que nous ayons une idée du nombre de personnes)

Passez le mot et venez en grand nombre :) !

 

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

Big Data Montreal #24 – Tuesday April 29th 18h30 at the RPM Startup Centre

Tickets: bdm24.eventbrite.ca


Big Data Montreal would like to invite you to its twenty-fourth meeting!

Note: exceptionally, this edition will *NOT* be on the first tuesday of May. We moved it forward by one week.

Join us on Tuesday April 29th at 18h30 to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have one scheduled presentation:

  • Cassandra at Netflix, by Christos Kalantzis, Cloud Database Engineering Team ManagerThis talk will cover what Netflix uses Cassandra for and why. It will also cover its footprint and where we want to take it since Netflix is an active Cassandra contributor. Finally, it will cover how Cassandra is used at Netflix and the tools we use to run it all. (slides)

 

N.B.: This edition of BDM will be in English.

There will be food and drinks served, courtesy of Netflix and DataStax!

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, for some casual networking.

Please tell your friends and colleagues :) !

 

 

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Big Data Montréal vous invite à sa vingt-quatrième rencontre!

Veuillez noter que cette édition de BDM ne se tiendra PAS le premier mardi de mai. Nous l’avons devancée d’une semaine.

Joignez-vous à nous le mardi 29 avril à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Il y a une présentation à l’horaire:

  • Cassandra at Netflix, by Christos Kalantzis, Cloud Database Engineering Team Manager.  This talk will cover what Netflix uses Cassandra for and why. It will also cover its footprint and where we want to take it since Netflix is an active Cassandra contributor. Finally, it will cover how Cassandra is used at Netflix and the tools we use to run it all. (slides)

 

N.B.: Cette édition de BDM sera en anglais.

Nous servirons nourriture et breuvages, gracieuseté de Netflix et DataStax!

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour continuer à réseauter.

Passez le mot et venez en grand nombre :) !

 

 

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !