
| Ders Kodu | : CSE424 |
| Ders Türü | : Bölüm Seçmeli |
| Ders Grubu | : Lisans |
| Eğitim Dili | : İngilizce |
| Staj Durumu | : Yok |
| Teori | : 2 |
| Uyg. | : 2 |
| Kredi | : 3 |
| Laboratuvar | : 0 |
| AKTS | : 6 |
Bu ders Büyük Verideki mevcut teknolojileri, araçları, mimarileri ve sistemlerin kullanımını kapsıyarak analitik veri üretimi, depolama, yönetim, transfer, gelen büyük verilerde derinlemesine analizi kapsar. bir kapsama alanı sağlar yüksek performanslı ağlarda veri işlem çözümleri. Çeşitli alanlarda ortaya çıkan bigdata uygulamalarını inceleyerek, uygulama, geliştirme konularınıda kapsayarak yaygın olarak kullnaılan büyük veri uygulamalrını test eder. Ayrıca büyük veriyi analiz etmek için veri madenciliği ve makine öğrenme algoritmaları üzerinde durulacak.
Ders materyali ders kitaplarının yanı sıra litaratürdeki son araştırmaları da kapsayacaktır. Aşağıdaki konular bu yıl işlenecektir: Hadoop, MapReduce, Büyük ölçekli denetimli makine öğrenme, Veri akışları, Kümeleme, öneri sistemleri, Web ve güvenlik dahil olmak üzere NoSQL sistemleri (Cassandra, Pig, Hive) ve Uygulamaları.
| Dr. Öğr. Üyesi Hüseyin ABACI |
| 1. | "Teori" ve "uygulama" dengeli bir şekilde götürülerek öğrencinin büyük veri analizini ve yönetimini anlaması, kullnması ve pratik analizini öğretmeye yöneliktir. Ders öğrencinin büyük on-line depo sistemlerinde yer alan konuların ve sorunların anlmasını sağlamak için tasarlanmıştır, böyle bir sisteminin ihtiyaçlarını karşılamak için günümüz pratik teknikleri, bilgi ve yarının araştırma yaklaşımlarının çözümleri için bir temel oluşturmayı planlamaktadır. |
| 2. | Büyük veri kavramlarını, terminolojiyi, veri analitiği özelliklerini, 5V-yapısal-yapısal olmayan-metadata gibi büyük veri tiplerini öğreneceklerdir. |
| 3. | Nitel - nicel veri madenciliği, istatistiksel analiz, A/B testi, korelasyon, regresyon analizi gibi analiz tekniklerini kavrarlar. |
| 4. | Kümeleme, dağıtık dosya sistemleri, ilişkisel veritabanı sistemleri, NoSQL, hafıza içi depolama gibi depolama kavramlarına ve paralel, dağıtık, toplu veri işleme gibi büyük veri işleme kavramlarına hakim olurlar. |
| 5. | Büyük veri işlenmesinde Cloudera sanal makina, HDFS (Hadoop Dağıtık Dosya Sistemi), YARN (Yet Another Resource Negotiator and Hue) gibi paralel işleme ve diğer dizayn kalıplarını kavrarlar. |
| 1. | Big Data Fundamentals: Concepts, Drivers & Techniques (1st ed.). Thomas Erl, Wajid Khattak, and Paul Buhler. Prentice Hall Press, Upper Saddle River, NJ, USA. 2016. |
| 2. | Big Data, Principles and Best Practices of Scalable Realtime Data Systems, Nathan Marz and James Warren, Manning Publications 2015. |
| 3. | Hadoop: The Definitive Guide, Tom White, O’Reilly, 2015. |
| Değerlendirme Türü | Adet | Yüzde |
|---|---|---|
| Ara Sınav (Vize) | 1 | %20 |
| Dönem Sonu Sınavı (Final) | 1 | %34 |
| Uygulama | 10 | %20 |
| Kısa Sınav (Quiz) | 3 | %6 |
| Ödev | 1 | %20 |
| Etkinlik | Sayısı | Ön Hazırlık | Süre | Toplam Iş Yükü (Saat) |
|---|---|---|---|---|
| Kuramsal Ders | 14 | 0 | 2 | 28 |
| Uygulamalı Ders | 14 | 0 | 2 | 28 |
| Ödev | 5 | 0 | 2 | 10 |
| Dönem Ödevi | 1 | 8 | 7 | 15 |
| Kısa Sınav | 4 | 5 | 1 | 26 |
| Ara Sınav | 1 | 16 | 2 | 18 |
| Dönem Sonu Sınavı | 1 | 20 | 2 | 22 |
| TOPLAM İŞ YÜKÜ (Saat) | 147 | |||
PÇ-1 | PÇ-2 | PÇ-3 | PÇ-4 | PÇ-5 | PÇ-6 | PÇ-7 | PÇ-8 | PÇ-9 | PÇ-10 | PÇ-11 | |
OÇ-1 | 5 | 5 | 4 | 4 | 4 | 4 | 4 | ||||
OÇ-2 | 5 | 4 | 4 | 4 | 5 | 4 | 4 | 4 | |||
OÇ-3 | 5 | 5 | 4 | 4 | 4 | 5 | 4 | ||||
OÇ-4 | 5 | 5 | 5 | 4 | 5 | 4 | 4 | ||||
OÇ-5 | 5 | 4 | 5 | 4 | 4 | 4 | 5 | 4 | 4 | 5 | 4 |