Big Data Montréal #28 – Tuesday Septembre 9th 6:30pm at the RPM Startup Centre

Tickets: bdm28.eventbrite.ca

Big Data Montreal would like to invite you to its twenty-eight meeting!

Join us on Tuesday September 9th at 6:30pm to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We currently have one scheduled presentation:

  • Kite SDK by Joey Echeverria, Cloudera. Along with the incredible power of the Hadoop ecosystem comes a lot of complexity for application developers. The Kite is the data API for the enterprise data hub. In this session we’ll cover the motivation and design of Kite and show you how Kite makes it easier to load data into Hadoop and to use the data once it’s there.

Also, we will have a few flash presentations:

  • Testing Apache Hive Systems by Julien Letrouit
  • From Data-Mining to Big Data-Mining by Francis Piéraut, Big-Data Mining/Machine Learning geek

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, for some casual networking (please use the appropriate ticket so we know how many people to expect).

Please tell your friends and colleagues :) !

 

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Billets: bdm28.eventbrite.ca

Big Data Montréal vous invite à sa vingt-huitième rencontre!

Joignez-vous à nous le mardi 9 septembre à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Nous avons une présentation à l’horaire:

  • Kite SDK by Joey Echeverria, Cloudera.Avec l’incroyable puissance de l’écosystème d’Hadoop vient malheureusement beaucoup de complexité pour les développeurs d’applications. “The Kite” est un API pour les plateformes de données des entreprises. Dans cette présentation, nous couvrirons les motivations du design de Kite et nous montrerons comment Kite simplifie les processus de chargement des données dans Hadoop ainsi que leur utilisation une fois en place.

Nous aurons également quelques présentations éclairs:

  • Tester un système Apache Hive par Julien Letrouit
  • From Data-Mining to Big Data-Mining par Francis Piéraut, Big-Data Mining/Machine Learning geek

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour continuer à réseauter (svp, utiliser le billet approprié pour que nous ayons une idée du nombre de personnes)

Passez le mot et venez en grand nombre :) !

 

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

Big Data Montreal #27 – Tuesday August 12th 18h30 at the RPM Startup Centre

Ticket: http://bdm27.eventbrite.com/

Big Data Montreal would like to invite you to its twenty-seven meeting!

Join us on Tuesday August 12th at 18h30 to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have two scheduled presentations:

  • Presentation on HBase by Jean-Marc Spaggiari, Cloudera. HBase is one of the mostly use No-SQL database. It’s cool, it’s powerful, it’s scalable, but it’s not build for all the usecases. This talk will present you HBase, some of its internals and its usecases. When you can use it, but most importantly when you should NOT use it.
  • Presentation and demo of Impala by Tony Bussieres, SVP Development & co-founder at TickSmith. Impala is an opensource low latency SQL query engine that runs on Apache Hadoop. The talk will include a brief introduction of Impala and a demo to show how fast Impala can be!

Also we will have two flash presentation made by Francis Piéraut, Big-Data Mining/Machine Learning geek (researcher@nuance, founder@qmining, advisor@startups)

  • BDM: A new format proposal
  • Big Data: just another barrier of entry

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, for some casual networking.

Please tell your friends and colleagues :) !

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Big Data Montréal vous invite à sa vingt-septième rencontre!

Joignez-vous à nous le mardi 12 aout à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Nous avons deux présentations à l’horaire:

  • Presentation on HBase by Jean-Marc Spaggiari, Cloudera. HBase est une des bases de données “NOSQL” les plus utilisées. Elle est à la mode, puissante, scalable, mais ne réponds pas à tous les besoins. Cette présentation va vous présenter HBase, son fonctionnement interne et les cas d’utilisations et surtout quand ne pas l’utiliser.
  • Presentation and demo of Impala by Tony Bussieres, SVP Development & co-founder at TickSmith. Impala est un engin SQL à basse latence qui fonctionne avec Apache Hadoop. Cette présentation va vous introduire à Impala et va comprendre un démo pour vous prouvez comment rapide est Impala.

De plus, nous allons avoir deux présentations flash de Francis Piéraut, Big-Data Mining/Machine Learning geek (researcher@nuance, founder@qmining, advisor@startups)

  • BDM: A new format proposal
  • Big Data: just another barrier of entry

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour continuer à réseauter.

Passez le mot et venez en grand nombre :) !

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

Big Data Montreal #26 – Tuesday July 8th 18h30 at the RPM Startup Centre

Tickets: http://bdm26.eventbrite.ca


Big Data Montreal would like to invite you to its twenty-sixth meeting!

Join us on Tuesday July 8th at 18h30 to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have two scheduled presentations:

  • Debriefing of the Spark Summit 2014, by David Lauzon, Lecturer at ÉTS. Big Data Montreal is going to the Spark Summit in California this weekend to gather up-to-date informations on the development of the Spark system. What appears to be the most interesting topics will be selected and summarized to the BDM audience.
  • Presentation and demo of SparkSQL by Olivier Mirandette, Lead Software Architect at Guavus. SparkSQL is the new defacto SQL engine for the BDAS stack. The talk will include introduction to SparkSQL, how does it interact with the rest of the stack and what does it means for Shark.

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, for some casual networking.

Please tell your friends and colleagues :) !

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Big Data Montréal vous invite à sa vingt-sixième rencontre!

Joignez-vous à nous le mardi 8 juillet à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Il y a une présentation à l’horaire par plusieurs présentateurs:

  • Compte-rendu du Spark Summit 2014, par David Lauzon, enseignant à l’ÉTS, et Olivier Mirandette, architecte principal chez Guavus. Quelques BDM-eurs vont au Spark Summit en Californie cette fin de semaine pour récolter les nouvelles sur le développement de l’éco-système Spark. Les sujets qui nous serons apparus les plus intéressants seront présentés à l’audience de BDM.
  • Présentation avec démo de Spark SQL par Olivier Mirandette, architecte principal chez Guavus. SparkSQL est le nouveau moteur SQL favorisé pour la plateforme Spark. Cette présentation incluera une introduction à SparkSQL, comment le faire interagir avec le reste de la plateforme et ce que cela signifie pour Shark.

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour continuer à réseauter.

Passez le mot et venez en grand nombre :) !

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

Big Data Montreal #25 – Tuesday June 3rd 18h30 at the RPM Startup Centre

Tickets: http://bdm25.eventbrite.ca


Big Data Montreal would like to invite you to its twenty-fifth meeting!

Join us on Tuesday June 3rd at 18h30 to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have two scheduled presentations:

  • Spark Runtime Internal, by Nan Zhu, Contributor to the Apache Spark project. This talk introduces the Spark system design. It will start from the eco-system and the features of Spark which facilitates the data processing task. Then it will go through the process in which the Spark application is translated from the source code to the distributed tasks across the nodes in the Spark cluster. It will also cover the distributed memory abstraction in Spark at the end of the talk, which enables high-performance and the reliable data processing in Spark. (slides)
  • Migrating to the Berkeley Data Analytics Stack, by Olivier Mirandette, Lead Software Architect at Guavus. Olivier will present how Guavus is planning the migration of a data warehouse to the Berkely Data Analytics Stack (which includes Spark, Spark streaming and Shark).

 

N.B.: This edition of BDM will be in English.

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, for some casual networking.

Please tell your friends and colleagues :) !

 

 

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Big Data Montréal vous invite à sa vingt-cinquième rencontre!

Joignez-vous à nous le mardi 3 juin à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Il y a une présentation à l’horaire:

  • Spark Runtime Internal, by Nan Zhu, Contributor to the Apache Spark project. This talk introduces the Spark system design. It will start from the eco-system and the features of Spark which facilitates the data processing task. Then it will go through the process in which the Spark application is translated from the source code to the distributed tasks across the nodes in the Spark cluster. It will also cover the distributed memory abstraction in Spark at the end of the talk, which enables high-performance and the reliable data processing in Spark. (slides)
  • Migrating to the Berkeley Data Analytics Stack, by Olivier Mirandette, Lead Software Architect at Guavus. Olivier will present how Guavus is planning the migration of a data warehouse to the Berkely Data Analytics Stack (which includes Spark, Spark streaming and Shark).

 

N.B.: Cette édition de BDM sera en anglais.

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour continuer à réseauter.

Passez le mot et venez en grand nombre :) !

 

 

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

Big Data Montreal #24 – Tuesday April 29th 18h30 at the RPM Startup Centre

Tickets: bdm24.eventbrite.ca


Big Data Montreal would like to invite you to its twenty-fourth meeting!

Note: exceptionally, this edition will *NOT* be on the first tuesday of May. We moved it forward by one week.

Join us on Tuesday April 29th at 18h30 to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have one scheduled presentation:

  • Cassandra at Netflix, by Christos Kalantzis, Cloud Database Engineering Team ManagerThis talk will cover what Netflix uses Cassandra for and why. It will also cover its footprint and where we want to take it since Netflix is an active Cassandra contributor. Finally, it will cover how Cassandra is used at Netflix and the tools we use to run it all. (slides)

 

N.B.: This edition of BDM will be in English.

There will be food and drinks served, courtesy of Netflix and DataStax!

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, for some casual networking.

Please tell your friends and colleagues :) !

 

 

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Big Data Montréal vous invite à sa vingt-quatrième rencontre!

Veuillez noter que cette édition de BDM ne se tiendra PAS le premier mardi de mai. Nous l’avons devancée d’une semaine.

Joignez-vous à nous le mardi 29 avril à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Il y a une présentation à l’horaire:

  • Cassandra at Netflix, by Christos Kalantzis, Cloud Database Engineering Team Manager.  This talk will cover what Netflix uses Cassandra for and why. It will also cover its footprint and where we want to take it since Netflix is an active Cassandra contributor. Finally, it will cover how Cassandra is used at Netflix and the tools we use to run it all. (slides)

 

N.B.: Cette édition de BDM sera en anglais.

Nous servirons nourriture et breuvages, gracieuseté de Netflix et DataStax!

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour continuer à réseauter.

Passez le mot et venez en grand nombre :) !

 

 

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

Big Data Montreal #23 – Tuesday April 8th 18h30 at the RPM Startup Centre

Tickets: http://bdm23.eventbrite.ca/


Big Data Montreal would like to invite you to its twenty-third meeting!

Join us on Tuesday April 8th at 18h30 to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have one scheduled presentations:

  • Cassandra at Mate1, by Hisham Mardam-Bey. This talk covers how and why Cassandra is used at Mate1. We start by going over the technology stack, then we discuss how Cassandra serves Mate1′s users with news feeds and counters with the help of Kafka, Akka, and Netty. We then go on to discuss current and future plans with our Cassandra usage. (slides)
  • If you want to present a second talk, please let us know by writing to bdm-admin@googlegroups.com !

N.B.: This edition of BDM will be in English.

There will be food and drinks served, courtesy of DataStax!

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, for some casual networking.

Please tell your friends and colleagues :) !

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Big Data Montréal vous invite à sa vingt-troisième rencontre!

Joignez-vous à nous le mardi 8 avril à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Il y a une présentation à l’horaire:

  • Cassandra at Mate1, by Hisham Mardam-Bey. This talk covers how and why Cassandra is used at Mate1. We start by going over the technology stack, then we discuss how Cassandra serves Mate1′s users with news feeds and counters with the help of Kafka, Akka, and Netty. We then go on to discuss current and future plans with our Cassandra usage. (slides, ENGLISH)
  • Si vous désirez faire une seconde présentation, n’hésitez pas à nous écrire à bdm-admin@googlegroups.com !

N.B.: Cette édition de BDM sera en anglais.

Nous servirons nourriture et breuvages, gracieuseté de DataStax!

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour continuer à réseauter.

Passez le mot et venez en grand nombre :) !

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

Big Data Montreal #22 – Tuesday March 4th 18h30 at the RPM Startup Centre

bdm22.eventbrite.ca/?ref=wp


Big Data Montreal would like to invite you to its twenty-second meeting! Join us on Tuesday March 4th at 18h30 to attend a conference, as well as to network with other Big Data enthusiasts from Montreal! The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street. All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more. We have two scheduled presentations:

  • Introduction to Mesos, by Sébastien Coutu. Mesos is a cluster resource scheduler which lets frameworks like Hadoop, Storm, Marathon, Chronos, Docker, Spark and others play nicely along one another. It provides resource isolation via Linux Containers and gives redundancy and high availability using Zookeeper. This system can grow up to thousands of nodes. (slides)
  • What’s new in HBase, by Jean-Marc Spaggiari. From HBase 0.90 to HBase 1.0. Quick overview of the major HBase improvements, HBase related tools and HBase’s future.

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, where we shall network around some beer and food. Please tell your friends and colleagues :) !

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Big Data Montréal vous invite à sa vingt-deuxième rencontre! Joignez-vous à nous le mardi 4 mars à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data! La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy. Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus. Il y a deux présentations à l’horaire:

  • Introduction à Mesos, par Sébastien Coutu. Mesos est un gestionnaire de ressources distribuées pour “clusters” de traitement de données. Il permet de faire cohabiter plusieurs “frameworks” comme Hadoop, Storm, Marathon, Chronos, Docker, Spark et plusieurs autres. Il permet d’isoler chacun d’entre eux de façon efficace via Linux Containers. C’est un système plutôt robuste qui utilise Zookeeper afin de fournir la disponibilité requise et qui est capable de grandir jusqu’à des dizaines de milliers de noeuds. (slides, ENGLISH)
  • Quoi de neuf dans HBase, par Jean-Marc Spaggiari. De HBase 0.90 à HBase 1.0. Survol rapide des améliorations majeures apportées à HBase, des outils liés à HBase et du futur d’HBase.

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour y déguster cervoise et nourriture tout en réseautant.Passez le mot et venez en grand nombre :) !

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

Big Data Montreal #21 – Tuesday February 4th 18h30 at the RPM Startup Centre

Tickets: http://bdm21.eventbrite.ca/


Big Data Montreal would like to invite you to its twenty-first meeting!

Join us on Tuesday February 4th at 18h30 to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have two scheduled presentations:

  • Apache UIMA and the Watson Jeopardy! System, by Pablo Duboue. ”In this talk I will discuss some unique features of Apache UIMA, the Open Source framework used by the DeepQA System that beat the Jeopardy! champions in 2011. In particular, I will discuss how UIMA’s two running modes (batch and Asynchronous Scale-out) were key to expedite R&D efforts while allowing for answering queries in less than 5 seconds for the show. I will conclude discussing very briefly the Machine Learning component I helped build for the system.” (slides)
  • HBase on MapR M7, by Rob Anderson. HBase has emerged in recent years as a popular NoSQL database, but users are faced with a variety of operational issues, such as compactions, slow region recovery and overall administration complexity. The MapR M7 Edition makes HBase easy, dependable and fast and provides one platform for unstructured and structured data with unified data management, data protection and disaster recovery. It delivers an innovative architecture that eliminates RegionServers, compactions and manual splits while providing instant region recovery and consistent low latency. This presentation provides a deeper technical overview of M7 and explains how the system is able to provide these capabilities.

N.B.: The presentations for this edition of BDM will be in English.

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, where we shall network around some beer and food.

Please tell your friends and colleagues :) !

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Big Data Montréal vous invite à sa vingtième rencontre!

Joignez-vous à nous le mardi 4 février à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Il y a deux présentation à l’horaire:

  • Apache UIMA and the Watson Jeopardy! System, by Pablo Duboue. ”In this talk I will discuss some unique features of Apache UIMA, the Open Source framework used by the DeepQA System that beat the Jeopardy! champions in 2011. In particular, I will discuss how UIMA’s two running modes (batch and Asynchronous Scale-out) were key to expedite R&D efforts while allowing for answering queries in less than 5 seconds for the show. I will conclude discussing very briefly the Machine Learning component I helped build for the system.” (slides, ENGLISH)
  • HBase on MapR M7, by Rob Anderson. HBase has emerged in recent years as a popular NoSQL database, but users are faced with a variety of operational issues, such as compactions, slow region recovery and overall administration complexity. The MapR M7 Edition makes HBase easy, dependable and fast and provides one platform for unstructured and structured data with unified data management, data protection and disaster recovery. It delivers an innovative architecture that eliminates RegionServers, compactions and manual splits while providing instant region recovery and consistent low latency. This presentation provides a deeper technical overview of M7 and explains how the system is able to provide these capabilities.

N.B.: Les présentations pour cette édition de BDM seront en anglais.

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour y déguster cervoise et nourriture tout en réseautant.Passez le mot et venez en grand nombre :) !

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

Big Data Montreal #20 – Tuesday January 7th 18h30 at the RPM Startup Centre !!

Tickets: bdm20.eventbrite.ca/?ref=wp


Big Data Montreal would like to invite you to its twentieth meeting!

Join us on Tuesday January 7th at 18h30 to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have one scheduled presentations by Philippe Laflamme, tech lead at Hopper:

Hopper is building the world’s largest travel-related online database. One of the hard problems that was tackled is entity resolution at scale. In this presentation, we will learn about Storm, a distributed real-time computation system, and some of it’s properties, such as guaranteed message processing and scalability. We will learn about Stanford’s Swoosh algorithm and how it was implemented within Storm to create a real-time entity resolution system that can process Hopper’s large crawl database efficiently.

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, where we shall network around some beer and food.

Please tell your friends and colleagues :) !

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Big Data Montréal vous invite à sa vingtième rencontre!

Joignez-vous à nous le mardi 7 janvier à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Il y a une présentation à l’horaire, par Philippe Laflamme de chez Hopper:

Hopper construit la plus grande base de données de tourisme au monde. Un des problèmes complexes à résoudre est la résolution d’entités (entity resolution) à grande échelle. Dans cette présentation, nous apprendrons à propos de Storm, un système distribué de calculs en temps réel et quelques-unes de ses propriétés, telles que les garanties de traitement de messages. Nous apprendrons également à propos de l’algorithme Swoosh, créé par un groupe de recherche de Stanford, et comment il a été implémenté dans Storm afin de créer un système de résolution d’entités en temps réel, capable de traiter l’énorme base de données de pages Web de Hopper.

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour y déguster cervoise et nourriture tout en réseautant.Passez le mot et venez en grand nombre :) !

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !

BDM #19 : Tuesday December 3rd 18h30 at the RPM Startup Centre

Tickets: http://bdm19.eventbrite.ca/?ref=wp

(Un message français suivra…)


Big Data Montreal would like to invite you to its nineteenth meeting!

Join us on Tuesday December 3rd at 18h30 to attend a conference, as well as to network with other Big Data enthusiasts from Montreal!

The meeting will take place at the RPM Startup Centre, which is located at 420 Guy street.

All are welcome, no matter if you already have some experience with Big Data technologies or if you’re simply curious to learn more.

We have two scheduled presentations:

  1. Scaling with iRESTful, by Steve Rodrigue. This presentation will explain how you can scale your restful API in terms of traffic and data, without changing your code, when you need to scale.
  2. Introduction to the AMPLab stack, by Olivier Mirandette. This presentation will talk about Guavus’ experimentations with some of the components of the AMPLab stack, including Spark, Spark Streaming, Shark and MLbase.

Finally, you are also welcome to join us at the nearby Brasseurs de Montreal, after the presentations, where we shall network around some beer and food.

Please tell your friends and colleagues :) !

P.S.: We are (as always) looking for speakers for future editions of BDM, so if you’re interested in presenting (or if you know people who are), please don’t hesitate to write to us at bdm-admin@googlegroups.com :) !


Big Data Montréal vous invite à sa dix-neuvième rencontre!

Joignez-vous à nous le mardi 3 décembre à 18h30 pour assister à une conférence, ainsi que pour réseauter avec les autres enthousiastes montréalais du Big Data!

La rencontre aura lieu au RPM Startup Centre, qui est situé au 420 rue Guy.

Tous sont bienvenus, que vous ayez déjà de l’expérience avec les technologies de Big Data ou que vous soyez simplement curieux d’en apprendre plus.

Deux présentations sont à l’horaire:

  1. La mise à l’échelle avec iRESTful, par Steve Rodrigue. Cette présentation expliquera comment vous pouvez scaler vos interfaces REST en terme de traffic et de données, sans changement de code, et sur demande.
  2. Introduction à AMPLab, par Olivier Mirandette. Cette présentation parlera des expérimentations de Guavus avec certaines des composantes de l’écosystème de AMPLab, incluant Spark, Spark Streaming, Shark et MLbase.

Finalement, vous êtes invités à vous joindre à nous aux Brasseurs de Montréal, où la soirée se poursuivra après les présentations, pour y déguster cervoise et nourriture tout en réseautant.Passez le mot et venez en grand nombre :) !

P.S.: Nous sommes (comme toujours) à la recherche de présentateurs pour les éditions futures de BDM, donc n’hésitez pas à nous écrire à bdm-admin@googlegroups.com si vous êtes intéressés à présenter, ou si vous connaissez des gens qui le sont :) !