Please use this identifier to cite or link to this item:
https://hdl.handle.net/20.500.11851/333
Title: | Esnek Kısıtlar Tabanlı Öbekleme | Other Titles: | Soft constraints based clustering | Authors: | Örs, Elif Tuğçe | Advisors: | Abul, Osman | Keywords: | Data clustering Data mining Cluster analysis Soft constraints Constrained clustering Genetic algorithms Veri öbekleme Veri madenciliği Öbekleme analizi Esnek kısıtlar Kısıtlarla öbekleme Genetik algoritmalar |
Publisher: | TOBB Ekonomi ve Teknoloji Üniversitesi - Fen Bilimleri Enstitüsü - Elektrik-Elektronik Mühendisliği Anabilim Dalı - Elektronik Mühendisliği Bilim Dalı | Abstract: | Clustering is an important human activity. Object groups sharing the same characteristics have a significant role in human perception of the world. Clustering has many application areas. Real world applications demand for cluster analysis which satisfies various user/domain constraints. But, it becomes an important challenge to obtain meaningful clusters by solely tuning clustering parameters, especially when high dimensional and/or high volume data sets are considered. As a result, in many of such applications, user preferences and domain constraints should be taken into consideration. The objective with this work is to obtain disjoint partial clusterings by employing soft constraints. Fuzzy, probabilistic and weighted semi-rings are used to do the clustering and as well to assess the degree of soft constraints satisfaction. Genetic algorithms are used for optimization purposes. A tool, written in Java, is developed to implement what is considered. The tool has the capability of accepting/exploiting user defined soft constraints, executing clustering algorithms, displaying data sets and resulting clusterings, and calculating the clustering metrics and validity indices. The tool is experimentally evaluated on select datasets to obtain soft constraints based clusterings. To assess the performance, extensive experimental results are presented and analyzed. Öbekleme önemli bir insan aktivitesidir. Aynı özellikleri paylaşan nesne grupları insanların dünyayı algılamasında ve tanımlamasında önemli rol oynar. Öbekleme birçok uygulama alanına sahiptir. Gerçek dünya uygulamaları çeşitli kısıtları sağlayacak şekilde bir öbekleme analizini gerektirir. Fakat, özellikle çok boyutlu ve/veya hacimli veri kümeleri söz konusu olduğunda, yalnızca öbekleme parametrelerine dayanarak anlamlı öbekler yaratmak zor olabilmektedir. Bundan dolayı, birçok uygulamada kullanıcının seçimleri ve koyduğu kısıtların göz önüne alınması istenir. Bizim çalışmamızda esnek kısıtlar kullanılarak, kesişmeyen kısmi öbeklemelerin elde edilmesi hedeflenmiştir. Öbeklemelerin yerine getirilmesi ve verilen kısıtları sağlamada ne kadar başarılı olduğunu ölçmek için bulanık, olasılıksal ve ağırlıklı yarı halka modelleri kullanılmıştır. Optimizasyon için ise genetik algoritmalardan faydalanılmıştır. Bahsi geçen işlemlerin gerçekleştirilmesinde kullanılmak üzere Java programlama dili kullanılarak bir araç geliştirilmiştir. Geliştirilen araç esnek kısıtların tanımlanması, öbekleme algoritmalarının çalıştırılması, veri kümeleri ve öbeklemelerin görsel olarak gösterilmesi, sonuçların hesaplanması ve öbek doğrulama yöntemlerinin kullanılmasını sağlamaktadır. Bu araçtan faydalanılarak seçilen veri kümeleri üzerinde kullanıcı tanımlı esnek kısıtlarına göre anlamlı öbekler oluşturmaya çalışan deneysel çalışmalar da yapılmıştır. Deney sonuçları kapsamlı olarak sunulmuş ve sonuçlar analiz edilmiştir. |
URI: | https://hdl.handle.net/20.500.11851/333 |
Appears in Collections: | Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
TZ00158.pdf | 1.27 MB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
78
checked on Dec 16, 2024
Download(s)
40
checked on Dec 16, 2024
Google ScholarTM
Check
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.