A Comparative Study of Different Database Technologies for Big Data Modeling and Analysis in Education

dc.contributor.advisor Hnıch, Brahım
dc.contributor.author Sayın, Özkan
dc.date.accessioned 2023-06-16T12:27:30Z
dc.date.available 2023-06-16T12:27:30Z
dc.date.issued 2015
dc.description.abstract Veri yaratım hızındaki artış ile Büyük Veri kavramı, yanında birçok yeni sorun ile ortaya çıktı. Tek bilgisayar üzerinde çalışan geleneksel ilişkisel veritabanları, istenen verimliliği sağlayamamaya başladı. Sonuç olarak, bu veriyi bilgisayar bulutlarında saklayan yeni yaklaşımlar, ve veriyi farklı şekillerde modelleyen yeni veritabanı yönetim teknolojileri geliştirildi. Farklı veri modelleri farklı avantajlar ve dezavantajlar sunmaktadır. Bu nedenle, tüm projeler için en iyisi olan bir veritabanı yönetim sistemi yoktur. Aksine, bir proje için doğru olan veritabanı sistemi, bu projedeki verinin nasıl depolanacağına ve sorgulanacağına bağlıdır. Kimi veri modelleri bakımı kolaylaştırır ve veri tutarlılığını garanti altına alırken, kimi verimliliğe odaklanmaktadır. Bu tezde, üç farklı (ilişkisel, döküman tabanlı ve grafik tabanlı) veritabanı sistemi incelenmiş, ve bir çevrimiçi eğitim sistemi olan Sınavo üzerinde örnek vaka çalışması yapılmıştır. Bu üç veritabanı sistemi, tasarım aşamasından, sorgu verimliliğine kadar incelenmiştir. Sonuç olarak, farklı veritabanı sistemlerinin farklı avantajlar sağladığı, ve farklı sorgu tiplerine göre değişik performans sergilediği gösterilmiştir. Büyük Veriyi depolama ve sorgulamanın dışında, veri güdümlü karar verme çok önemli ve değerli bir işlemdir. Bu tezde, örnek olarak 2 durum incelenmiştir. Sınavo sisteminde öğrencilerin performanslarını sistemin depoladığı istatistikler üzerinden bayes metodlarını kullanarak tahmin etmek için yeni bir yol önerilmiş, ayrıca soruları zorluklarına göre gruplandırmak için bir metot gösterilmiştir. en_US
dc.description.abstract With the increase in data generation, notion of Big Data emerged, along with new problems on the side. Traditional relational databases on single computers failed to perform at required e ciencies. As a result, new approaches to hosting data emerged that uses clouds of commodity hardware. In addition, new database management system (DBMS) technologies are created under NoSQL movement, with new ways of modelling data. Different data models have their own advantages and disadvantages. Consequently, there is not one DBMS that is the best choice for every project. Instead, the way the project needs data to be stored and retrieved is a determinant factor on the choice. Some data models ensure data consistency and ease maintenance; whereas, others focus on performance. We analyse three different data models, namely relational, document based and graph databases, and conduct a case study on Sınavo, an online education system. We investigate each data model from their design to their performances on different queries. We show that different systems offer different qualities and perform better at some queries and worse at others. In addition to storing Big Data, making data-driven decisions is an important and valuable process. We investigate two exemplary cases on Sınavo. We introduce a novel approach to estimating student performances by applying bayesian statistics on data stored in Sınavo system. We also propose a way of classifying questions based on their diffculty levels. en_US
dc.identifier.uri https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=sY7m19PfcL6F1NUw-cr80M9PAv0_AWBNMpiiCXdR5-foHeLB3eAJdeWVgcgPe8us
dc.identifier.uri https://hdl.handle.net/20.500.14365/31
dc.language.iso en en_US
dc.publisher İzmir Ekonomi Üniversitesi en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject buyuk veri en_US
dc.subject veritabanı en_US
dc.subject veri modeli en_US
dc.subject sql en_US
dc.subject ili¸skisel veritabanı en_US
dc.subject dokuman tabanlı veritabanı en_US
dc.subject grafik veritabanı en_US
dc.subject veri gudumlu karar verme. en_US
dc.subject big data en_US
dc.subject database en_US
dc.subject data model en_US
dc.subject sql en_US
dc.subject relational database en_US
dc.subject document store en_US
dc.subject document based database en_US
dc.subject graph database en_US
dc.subject data driven decision-making. en_US
dc.subject Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol en_US
dc.subject Computer Engineering and Computer Science and Control en_US
dc.subject Eğitim ve Öğretim en_US
dc.subject Education and Training en_US
dc.title A Comparative Study of Different Database Technologies for Big Data Modeling and Analysis in Education en_US
dc.title.alternative Büyük Veri Modelleme için Farklı Veritabanı Sistemleri ve Eğitim Sistemlerinde Analiz Üzerine Karşılaştırmalı Bir Araştırma en_US
dc.type Master Thesis en_US
dspace.entity.type Publication
gdc.author.institutional Sayın, Özkan
gdc.coar.access open access
gdc.coar.type text::thesis::master thesis
gdc.description.department İEÜ, Lisansüstü Eğitim Enstitüsü, Bilgisayar Bilimleri Ana Bilim Dalı en_US
gdc.description.endpage 149 en_US
gdc.description.publicationcategory Tez en_US
gdc.description.scopusquality N/A
gdc.description.startpage 1 en_US
gdc.description.wosquality N/A
gdc.identifier.yoktezid 381916 en_US
relation.isOrgUnitOfPublication e9e77e3e-bc94-40a7-9b24-b807b2cd0319
relation.isOrgUnitOfPublication.latestForDiscovery e9e77e3e-bc94-40a7-9b24-b807b2cd0319

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
2226.pdf
Size:
1.91 MB
Format:
Adobe Portable Document Format