Kedves Látogató!

2016 februártól új Big Data képzésekkel bővül az ELTE IK választéka. Két gyakorlatias specit és egy hallgatói önképző labort indítunk a téma iránt érdeklődőknek:

  • Big Data Architektúrák (IP-15BDA): A tárgy célja olyan architektúrák és rendszerek megismertetése a hallgatókkal, amelyeket nagy adattömegek (ún. Big Data) tárolására és elemzésére alkalmaznak. A modern Big Data architektúrák tipikusan egy fizikai vagy virtuális (pl. felhő) számítógép klaszterre épülnek. A kurzus során a hallgatók megismerkednek a Yarn klasztermenedzsment eszközzel, amely több keretrendszert is képes kiszolgálni. Ilyenek például a Hadoop, Spark, Storm és Flink, továbbá ezek különböző kiegészítései. Tárgy keretén belül a hallgatók betekintést nyerhetnek az elosztott fájlrendszerek működésébe, használatába és konfigurálásába. Megismerkedhetnek a job alapú adatelemzéssel, ezenbelül a MapReduce technikával, a BSP (Bulk synchronous parrallel) alapú elosztott gráf elemzési rendszerekkel és a stream alapú megoldásokkal. Ezenkívül a tárgy áttekintést ad olyan gépi tanulási (Machine Learning) és adatbányász eszközökről, melyeket nagy adat tömegek elemzésére is
    felhasználhatók. Érintett technológiák: Java/Scala alapok, YARN, HDFS, Hadoop (MapReduce), Spark, Storm/Spark Streaming, Spark GraphX, Spark ML, Zeppelin, Lightning, Cloudera
  • Big Data Elemző Módszerek (IP-15BDE): Az informatika hatalmas fejlődésen ment keresztül az elmúlt tíz évben. Ma már életünk és világunk szinte minden entitásáról és változásáról valamilyen szintű digitális lenyomattal is rendelkezünk (pl. SmartCity, banki rendszerek, viselhető szenzorok, IoT, mobil hálózatok, közösségi hálózatok, stb.). Az informatikai rendszerek által generált egyre nagyobb adat tömegek a tárolási problémák mellett is számos kihívást jelentenek. Ezen adatok sokszor önmagukban semmitmondóak, értéket csak megfelelő tisztítás, elemzés, értelmezés és együttes használat során nyernek. A kis adattömegek esetén jól működő algoritmusok és módszerek sok esetben nagy, akár több terrabájtos adat mellett már nem nyújtanak megfelelő teljesítményt vagy egyáltalán nem alkalmazhatóak. Ezen folyamat eredményeképp az informatikai szektor is megváltozott. A piacon egyre nagyobb az igény olyan ún. adat tudós (data scientist) szakemberek iránt, akik az adatok megfelelő feldolgozását és értelmezését el tudják végezni, megfelelő gyakorlati és elméleti ismeretekkel rendelkeznek a gráf elemző és gépi tanulási módszerekről. A tárgy gyakorlati példákon keresztül vezeti be a hallgatókat a különösen nagy adattömegek elemzésének és adatbányászatának világába. Tematika röviden: Jupyter/iPython notebooks, Python/R alapok, Scikit-learn/SparkML, statisztikai alapfogalmak, feltáró elemzések (pandas, numpy, scipy, Dato), adattisztítás, klaszterezés, dimenzió csökkentés, osztályozás, ajánlórendszerek, deep learning, adatvizualizáció és prezentáció
  • Big Data hallgatói labor: Csapatban valós problémákon dolgozhatnak a hallgatók. A feladatok közé tartozik Big Data versenyfeladatok megoldása és ilyen versenyeken való részvétel. A tehetségesebbek valós ipari projektek megvalósításába is bekapcsolódhatnak. Jelenleg több ipari partnerrel is folynak projektjeink. Előzetes egyeztetés alapján a laborban való részvétel szakmai gyakorlatnak (BSc és MSc) vagy labor blokknak (Tudáskezelő rendszerek labor keretén belül) is elszámolható.

A tárgyak már elérhetők a NEPTUN-ban! Kérdéseket a lakis kukac elte pont hu email címre várjuk!

Minden érdeklődőt várunk!
Laki Sándor és Gombos Gergő