Specialisatie Data Management en Analytics

Over

De Data Management en Analytics specialisatie spitst zich in de interdisciplinaire context van Data Science en Big Data toe op schaalbare en gedistribueerde gegevensbeheersystemen, information retrieval en data mining algoritmes, alsook technieken voor informatievisualisatie en human-data interactie. Je bestudeert algoritmes, technieken, architecturen en methoden voor het beheer, de verwerking en de interactie met zowel gestructureerde als ongestructureerde data. Je past de verworven theoretische kennis toe in het ontwerp van applicaties die nieuwe inzichten ontsluiten uit stromen van data zoals bijvoorbeeld geproduceerd door Internet of Things apparaten.

In Detail

De Data Management en Analytics specialisatie dekt de interdisciplinaire aspecten van interactieve data science en big data management, inclusief schaalbare en gedistribueerde data management systemen, information retrieval en data mining algoritmes, alsook visualisatie en mens-data interactie technieken. Ons doel is om studenten voor te bereiden op de uitdagingen van de toekomst in het beheren en analyseren van de snelgroeiende data die handmatig door mensen wordt ingevoerd, of automatisch wordt gegenereerd, bijvoorbeeld door sensoren in het Internet Of Things, door webapplicties, of als uitkomst van wetenschappelijke experimenten. Om de studenten voor te bereiden op een toekomstige carrière als data scientist of data engineer, ligt de focus vooral op de wetenschappelijke aspecten en concepten die de fundamenten vormen van schaalbare gegevensbeheersystemen, information retrieval en data mining, alsook verschillende informatievisualisatie- en interactietechnieken, en niet op bestaande mainstream technologie. 

Als student in de Data Management en Analytics specialisatie zal je oplossingen bestuderen, ontwerpen, en ontwikkelen voor big data opslag, verwerking, en analyse en voor interactie met big data. Daarin ligt een sterke focus op het systeemaspect van oplossingen voor beheer en analyse van big data. Je zal gespecialiseerde systemen en algoritmes bestuderen voor het ontwerp van gegevensintensieve applicaties die hun data op een gedistribueerde manier opslaan, zoals bijvoorbeeld gebruikt door grote spelers in de markt zoals Google en Facebook, die centraal zullen zijn voor het ontwerpen van applicatie van de toekomst in het opkomende domein van het Internet of Things. Je zal machine learning algoritmes en technieken om informatie te zoeken in een grote collectie documenten (zoals bijvoorbeeld gebruikt in Google's zoekalgoritme) en de theorie en praktische aspecten van het automatisch detecteren van structuur in grote en complexe data. Deze kennis over methodes en technieken van machine-gebaseerde analyse van grote datasets al een belangrijke rol spelen toekomstige oplossingen aangezien data vandaag de dag massaal verzameld wordt, en het meer en meer essentieel wordt om deze verder te verwerken, analyseren en inzichten er uit te extraheren. Aangezien heel wat analytische taken niet geautomatiseerd kunnen worden, zal je ook leren over moderne informatievisualisatie en interactie technieken die de mens kunnen helpen in het verkennen en begrijpen van grote en complexe datasets. Je zal bovendien leren hoe interactieve visualisatie oplossingen te ontwikkelen die kunnen helpen om datagebaseerde kennis te presenteren en een belangrijke rol kunnen spelen in beslissingsprocessen en bij kennisoverdracht. 

De Data Management en Analytics specialisatie bestaat uit vier verplichte fundamentele vakken en een lijst van verdiepende en verbredende keuzevakken. Op deze manier kunnen de studenten zelf kiezen om hun kennis te verdiepen in opslag en gegevensbeheer van big data, verwerken en analyse van grote datasets, of innovatieve oplossingen voor mens-data interactie. Voor studenten met een bredere interesse is het uiteraard ook mogelijk om keuzevakken uit verschillende van deze richtingen te kiezen, en ze te combineren met vakken uit de andere drie afstudeerrichtingen aangeboden door het departement computerwetenschappen.

 

Data Management en Analytics is een specialisatie in onze 2 jaar durende masteropleiding in Computerwetenschappen van 120 ECTS. Studenten van deze specialisatie moeten slagen voor de zorgvuldig ontworpen kern van 30 ECTS die alle vier de specialisaties gemeen hebben, de 24 ECTS van vier verplichte vakken binnen deze specialisatie, minstens 6 ECTS van keuzevakken binnen de specialisatie, nog eens 30 ECTS van keuzevakken uit deze of een van de andere specialisaties, en voor een onderzoeksopleiding van 6 ECTS en een masterscriptie van 24 ECTS.

Hieronder volgt de lijst met verplichte cursussen:

Schaalbare Datamanagement Systemen (kern, 6 ECTS, sem 1)
In de cursus Scalable Data Management Systemen bestuderen we systemen en algoritmen die ontwikkeld zijn voor het ondersteunen van data intensieve toepassingen op schaal.  De cursus volgt een principiële aanpak en behandelt aspecten van gedistribueerde databanken, MapReduce afgeleiden, en andere relevante systemen. De cursus focust onder meer op uitdagingen rond gegevens partitionering, gedistribueerd query plannen en schaalbare transactieverwerking.
Information Retrieval and Data Mining (kern, 6 ECTS, sem 2)
Information Retrieval omvat de theorie en de praktijk van het zoeken naar en het doorzoeken van documenten, zoals bijvoorbeeld gebruikt door Google. Het is gerelateerd aan Data Mining, de theorie en de praktijk van het automatisch begrijpen van de structuur van data. Deze gecombineerde cursus behandelt onderwerpen gaande van praktische problemen zoals het ruimte-efficiënt indexeren van massale gegevensbanken, tot het bepalen van het belang van woorden en andere vormen van semantiek in gestructureerde en ongestructureerde documenten. .
Information Visualisation (kern, 6 ECTS, sem 2)
Dit vak bespreekt verschillende visualisatietechnieken ter ondersteuning van de exploratieve analyse van grote datasets. De theorie behandelt specifieke elementen van menselijke perceptie, aspecten van de kleurtheorie, alsook de ontwerpprincipes en interactietechnieken voor mens-in-de-lus data-exploratie, geïllustreerd aan de hand van verschillende case studies. De theorie wordt toegepast en verder verdiept in een groepsopdracht waarbij interactieve visualisatieoplossingen voor grote en complexe datasets ontworpen en geïmplementeerd worden..
Advanced Topics in Big Data (kern, 6 ECTS, sem 2)
In dit seminarie reviewen we onderzoekspapers binnen het domein big data. Studenten vergaren op deze manier kennis over de recente ontwikkelingen binnen het veld big data en de onderliggende technologieën. Studenten krijgen een of meerdere onderzoekspapers toegekend en leren hoe deze kritisch te analyseren alsook hoe hun evaluatie te formuleren via het schrijven van wetenschappelijke rapporten en door het geven van mondelinge presentaties.

Data Management en Analytics is een specialisatie in onze 2 jaar durende masteropleiding in Computerwetenschappen van 120 ECTS. Studenten van deze specialisatie moeten slagen voor de zorgvuldig ontworpen kern van 30 ECTS die alle vier de specialisaties gemeen hebben, de 24 ECTS van vier verplichte vakken binnen deze specialisatie, minstens 6 ECTS van keuzevakken binnen de specialisatie, nog eens 30 ECTS van keuzevakken uit deze of een van de andere specialisaties, en voor een onderzoeksopleiding van 6 ECTS en een masterscriptie van 24 ECTS.

Hieronder volgt de lijst met keuzevakken binnen deze specialisatie:

Cloud Computing and Big Data Processing (verdiepend, 6 ECTS, sem 1)
Dit vak introduceert de basisconcepten uit de gelijknamige domeinen, en het gebruik ervan binnen gerelateerde raamwerken en hulpmiddelen. Over Cloud Computing passeren beveiliging, consistentie, reactiviteit en decentralisatie (blockchain) de revue. Tot de Big Data Processing onderwerpen behoren cluster computing, fouttolerantie en gegevenslocaliteit, partitionering en streaming.
Statistical Foundations of Machine Learning  (verdiepend, 6 ECTS, sem 2)
Deze cursus behandelt de basisconcepten van statistisch machinaal leren. De volgende onderwerpen worden besproken: wat is een goed geformuleerd leerprobleem, is machinaal leren van het probleem wel mogelijk? Wat is het verschil tussen trainen en testen, en fouten en ruis? Hoe kunnen we veilig veralgemenen? Op het vlak van technieken bekijken we oa. Lineaire modellen, Neurale netwerken, Support vector machines, Kernel methoden, Bayesiaans machinaal leren, en Causaliteit.
Advanced Databases (verdiepend, 5 ECTS, sem 1)
Dit vak behandelt geavanceerde concepten die de integratie van databanken in objectgerichte en gedistribueerde software-systemen vergemakkelijken, zoals actieve databanken die data repliceren en consistent houden. Het vak behandelt ook het beheer van niet-relationele gegevenstypes, zoals temporele, graf, en ruimtelijke data. Het vak behandelt de theoretische fundamenten alsook hun toepassing in innovatieve applicatie-domeinen.
Database Systems Architecture (verdiepend, 5 ECTS, sem 1)
Of je nu zoekmachine zoals Google gebruikt, of je volgende vakantie online boekt: in zowat elke moderne applicatie is er nood aan systemen om data op grote schaal op te slaan, te verwerken, en op te zoeken. Dit vak bestudeert hoe zulke systemen ontworpen en geïmplementeerd worden, en heeft twee doelstellingen. (1) De inzichten verwerven die nodig zijn om in de toekomst zelf data management systemen te kunnen ontwikkelen en (2) een inzicht te krijgen hoe de efficiëntie van praktische bestaande data management systemen getuned kunnen worden.
Next Generation User Interfaces  (verdiepend, 6 ECTS, sem 1)
Na het volgen van deze cursus heeft de student inzicht in de interactieprincipes van nieuwe apparaten zoals smartphones, multi-touch tafels of op gebaren-interfaces, evenals de theoretische achtergrond voor deze interactieprincipes. De student kan reflecteren over de kwaliteiten en tekortkomingen van verschillende interactiestijlen, met de gebruiker als centrale component van het ontwerpproces van de interface. De theorie wordt toegepast in een groepsproject waarbij studenten hun individuele gebruikersinterface van de volgende generatie ontwerpen en ontwikkelen.

Data Management en Analytics is een specialisatie in onze 2 jaar durende masteropleiding in Computerwetenschappen van 120 ECTS. Studenten van deze specialisatie moeten slagen voor de zorgvuldig ontworpen kern van 30 ECTS die alle vier de specialisaties gemeen hebben, de 24 ECTS van vier verplichte vakken binnen deze specialisatie, minstens 6 ECTS van keuzevakken binnen de specialisatie, nog eens 30 ECTS van keuzevakken uit deze of een van de andere specialisaties, en voor een onderzoeksopleiding van 6 ECTS en een masterscriptie van 24 ECTS.

Klik hier voor het officiële overzicht van dit programma met een volledige lijst van keuzevakken.

Het onderstaande keuzevak uit het bachelorprogramma kan enkel worden gekozen met goedkeuring van de examencommissie. Het is bedoeld als een "boost"-cursus voor studenten die een bachelorprogramma afwerkten aan een instelling met minder nadruk op web technologieën.

Web Technologies (boosting, 6 ECTS, SEM1)
Dit vak onderzoekt de oorsprong van hypermedia en het World Wide Web en we bespreken huidige en toekomstige ontwikkelingen op het web. We studeren de architectuur van het internet en verschillende protocollen zoals het Hypertext Transfer Protocol (HTTP) en HTML5, JavaScript, CSS3, Web 2.0, het Semantic Web, web search en beveiliging en privacy. De theorie wordt toegepast in verschillende WPOs en in een Rich Internet Application die als onderdeel van deze cursus ontwikkeld wordt.