Bilgi Paketi / Ders Kataloğu
Büyük Veri Analizi
Ders Kodu: CSE424
Ders Türü: Bölüm Seçmeli
Ders Grubu: Lisans
Eğitim Dili: İngilizce
Staj Durumu: Yok
Teori: 2
Uyg.: 2
Kredi: 3
Laboratuvar: 0
AKTS: 6
Amaç

Bu ders Büyük Verideki mevcut teknolojileri, araçları, mimarileri ve sistemlerin kullanımını kapsıyarak analitik veri üretimi, depolama, yönetim, transfer, gelen büyük verilerde derinlemesine analizi kapsar. bir kapsama alanı sağlar yüksek performanslı ağlarda veri işlem çözümleri. Çeşitli alanlarda ortaya çıkan bigdata uygulamalarını inceleyerek, uygulama, geliştirme konularınıda kapsayarak yaygın olarak kullnaılan büyük veri uygulamalrını test eder. Ayrıca büyük veriyi analiz etmek için veri madenciliği ve makine öğrenme algoritmaları üzerinde durulacak.

Özet İçerik

Ders materyali ders kitaplarının yanı sıra litaratürdeki son araştırmaları da kapsayacaktır. Aşağıdaki konular bu yıl işlenecektir: Hadoop, MapReduce, Büyük ölçekli denetimli makine öğrenme, Veri akışları, Kümeleme, öneri sistemleri, Web ve güvenlik dahil olmak üzere NoSQL sistemleri (Cassandra, Pig, Hive) ve Uygulamaları.

Dersi Veren Öğretim Görevlisi/Görevlileri
Dr. Öğr. Üyesi Hüseyin ABACI
Öğrenme Çıktıları
1."Teori" ve "uygulama" dengeli bir şekilde götürülerek öğrencinin büyük veri analizini ve yönetimini anlaması, kullnması ve pratik analizini öğretmeye yöneliktir. Ders öğrencinin büyük on-line depo sistemlerinde yer alan konuların ve sorunların anlmasını sağlamak için tasarlanmıştır, böyle bir sisteminin ihtiyaçlarını karşılamak için günümüz pratik teknikleri, bilgi ve yarının araştırma yaklaşımlarının çözümleri için bir temel oluşturmayı planlamaktadır.
2.Büyük veri kavramlarını, terminolojiyi, veri analitiği özelliklerini, 5V-yapısal-yapısal olmayan-metadata gibi büyük veri tiplerini öğreneceklerdir.
3.Nitel - nicel veri madenciliği, istatistiksel analiz, A/B testi, korelasyon, regresyon analizi gibi analiz tekniklerini kavrarlar.
4.Kümeleme, dağıtık dosya sistemleri, ilişkisel veritabanı sistemleri, NoSQL, hafıza içi depolama gibi depolama kavramlarına ve paralel, dağıtık, toplu veri işleme gibi büyük veri işleme kavramlarına hakim olurlar.
5.Büyük veri işlenmesinde Cloudera sanal makina, HDFS (Hadoop Dağıtık Dosya Sistemi), YARN (Yet Another Resource Negotiator and Hue) gibi paralel işleme ve diğer dizayn kalıplarını kavrarlar.
Ders Kitabı / Malzemesi / Önerilen Kaynaklar
1.Big Data Fundamentals: Concepts, Drivers & Techniques (1st ed.). Thomas Erl, Wajid Khattak, and Paul Buhler. Prentice Hall Press, Upper Saddle River, NJ, USA. 2016.
2.Big Data, Principles and Best Practices of Scalable Realtime Data Systems, Nathan Marz and James Warren, Manning Publications 2015.
3.Hadoop: The Definitive Guide, Tom White, O’Reilly, 2015.
Haftalık Ayrıntılı Ders İçeriği
1. Hafta - Teorik
Büyük Veriye Giriş: Kavramlar, terminoloji, özellikleri ve 5V, yapılandırılmış, yapılandırılmamış, yarı yapılandırılmış ve metadata gibi büyük Veri türlerini kapsar. İş ve araştırma motivasyonlarını kapsar.
2. Hafta - Teorik
Büyük Veride Depolama ve Analiz: Kümeler gibi depolama kavramları kapsar, dağıtık dosya sistemleri, RDBMS, NoSQL, sharding, bellek depolama, aynı zamanda paralel, dağıtık, toplu veri işleme ve Hadoop gibi büyük veri işleme konseptlerini kapsar.
3. Hafta - Teorik
Büyük Veri Analizi Teknikleri: Nicel, nitel veri madenciliği, istatistiksel analiz, Machine Learning, anlamsal analiz ve görsel veri analizi gibi analiz teknikleri ve konularını kapsar.
4. Hafta - Teorik
MapReduce Çerçevesi ve Hadoop: Paralel süreçler ve büyük veri işleme için diğer tasarım desenleri kapsar. Cloudera sanal makine. HDFS, YARN ve Hue.
5. Hafta - Teorik
Java ile mapreduce API ve Basic Programlama: Hadoop MapReduce Java API'yi inceleyeceğiz.
6. Hafta - Teorik
Hive kullanımı: "veri ambarı" HDFS'ler ve Hadoop. Depolanan veriler üzerinde SQL sorguları.
7. Hafta - Teorik
Spark Kullanımı: MapReduce çerçevesinin bellek tabanlı veri analizi ve RDD-Spark.
8. Hafta - Teorik
Spark Kullanımı: MapReduce çerçevesinin bellek tabanlı veri analizi ve RDD-Spark.
9. Hafta - Teorik
Spark veri akışı, Kafka ve Cassandra: Hızlı verilerin işlenmesi için standart haline gelmiş yığın kullanımı.
10. Hafta - Teorik
Spark ile MLLib, Machine Learning: Veriler üzerinde öngörüde bulunmak için öğrenme algoritmalarını gözden geçireceğiz.
11. Hafta - Teorik
Büyük Veri Kümelerinde görselleştirme: Büyük verinin içeriğini ve özelliklerini grafiksel olarak incelenmesini göreceğiz.
12. Hafta - Teorik
Büyük Veri Kümelerinde görselleştirme: Büyük verinin içeriğini ve özelliklerini grafiksel olarak incelenmesini göreceğiz.
13. Hafta - Teorik
Büyük veride ileri konular ve uygulamlar.
14. Hafta - Teorik
Büyük veride ileri konular ve uygulamlar.
Değerlendirme
Değerlendirme TürüAdetYüzde
Ara Sınav (Vize)1%20
Dönem Sonu Sınavı (Final)1%34
Uygulama10%20
Kısa Sınav (Quiz)3%6
Ödev1%20
İş Yükü Hesaplaması
EtkinlikSayısıÖn HazırlıkSüreToplam Iş Yükü (Saat)
Kuramsal Ders140228
Uygulamalı Ders140228
Ödev50210
Dönem Ödevi18715
Kısa Sınav45126
Ara Sınav116218
Dönem Sonu Sınavı120222
TOPLAM İŞ YÜKÜ (Saat)147
Program ve Öğrenme Çıktıları İlişkisi
PÇ-1
PÇ-2
PÇ-3
PÇ-4
PÇ-5
PÇ-6
PÇ-7
PÇ-8
PÇ-9
PÇ-10
PÇ-11
OÇ-1
5
5
4
4
4
4
4
OÇ-2
5
4
4
4
5
4
4
4
OÇ-3
5
5
4
4
4
5
4
OÇ-4
5
5
5
4
5
4
4
OÇ-5
5
4
5
4
4
4
5
4
4
5
4
Adnan Menderes Üniversitesi - Bilgi Paketi / Ders Kataloğu
2026