Jurnal Data Mining Clustering

Oleh Wahyu Adi

1,3 MB 3 tayangan 0 unduhan
 


Bagikan artikel

Transkrip Jurnal Data Mining Clustering

PENGELOMPOKAN DATA JUMLAH PENDUDUK BERDASARKAN KELOMPOK UMUR TAHUN 2017 DI KOTA BANDUNG MENGGUNAKAN METODE CLUSTERING DAN METODE K-MEANS Henrian Adjie Wicaksono, M. Asbahu Nizar, Wahyu Adi Setiawan Program Studi Teknik Elektro Jurusan Teknik Informatika Sekolah Tinggi Teknik Malang Abstrak Asumsi dasar untuk memahami bonus demografi adalah kondisi komposisi penduduk usia produktif (15-64 tahun) lebih besar dibandingkan dengan penduduk usia non produktif (0-14 tahun) dalam rentang waktu tertentu. Idealnya masyarakat dapat memahami posisi mereka dalam bermasyarakat, begitupun dengan pemangku kebijakan dengan menyadari pentingnya mengeluarkan kebijakan yang dapat mensupport agar potensi yang dimiliki oleh penduduk usia produktif tersebut bisa optimal dan maksimal. Menggunakan data mining merupakan salah satu gagasan informasi untuk mengelompokan kependudukan yang ada di Kota Bandung, dengan menggunakan metode clustering data kependudukan Kota Bandung akan dikumpulkan berdasarkan rentan usia yaitu usia produktif (15-64 tahun), usia non produktif (0-14 tahun) dan usia manula (>65 tahun). Dengan menggunakan clustering dan algoritma K-means diharapkan akan mendapat sebuah data yang akurat dan terpercaya. Kata kunci: (Data mining, Clustering, K-means) 1. PENDAHULUAN 1.1. Aspek pewujudan Latar Belakang kependudukan berkualitas, merupakan hal paling sangat mendasar dalam pembangunan. serta menskenario kecil upaya kuantitas yang untuk penduduk dan juga persebaran kependudukan. nilai Bandung merupakan salah satu di merupakan antara sejumlah daftar Kota-Kota pelaku dan sasaran pembangunan besar di Indonesia. Hal yang paling sekaligus mendasar universal, Dalam keluarga penduduk yang menikmati hasil yang umum dijumpai pembangunan. Dalam kaitan peran dalam suatu Kota besar adalah penduduk tersebut, kualitas mereka jumlah perlu ditingkatkan melalui berbagai banyak. Kota Bandung merupakan sumber daya yang melekat, dan salah satu Kota dengan jumlah penduduk yang 1 sangat penduduk yang terbanyak di Indonesia. Hal ini dapat dilihat dari hasil sensus penduduk pengetahuan kependudukan tentang dikenal sebagai istilah karakteristik penduduk yang berpengaruh penting terhadap proses demografi dan tingkah laku sosial ekonomi penduduk. Kota Bandung mempunyai luas wilayah sekitar 16.730 ha, maka kepadatan penduduk kota Bandung pada tahun 2011 adalah 145 jiwa/ha dan terus meningkat menjadi 148 jiwa/ha pada tahun 2016. Jumlah penduduk Kota Bandung dari tahun ke tahun peningkatan. jumlah terus Pada penduduk tahun) juga meningkat. yang semakin tahun semakin meningkat. Dalam menurun, namun usia manula (>65 mengalami Tahun 2011 Kota Bandung sebesar 2.429.176 jiwa (BPS, April 2018). Dari tahun 2011-2016 ratarata pertumbuhan penduduk adalah Struktur usia penduduk Kota Bandung yang tergolong menonjol adalah usia pendidikan tinggi (20-24 tahun) atau awal usia kerja, artinya jumlah masyarakat usia produktif relatif besar yang merupakan modal dasar bagi pembangunan. Dengan diatas, latar dapat kesimpulan belakang diperoleh suatu kependudukan Kota Bandung berdasarkan usia. Untuk mendapatkan suatu informasi yang terpercaya kami menyusun suatu data jumlah konkret untuk penduduk menghitung Kota Bandung berdasarkan usia dengan judul “Perhitungan kependudukan Kota Bandung menggunakan metode clustering dan algoritma K-Means”. 1.1 Rumusan Masalah Jumlah 1. Bagaimana cara Mengetahui penduduk Kota Bandung pada 5 daerah kelurahan mana saja tahun selanjutnya terus mengalami terdapat peningkatan yaitu dari tahun 2011 produktifnya ? 0,53 %. Menurut BPS banyak usia berjumlah 2.429.176 jiwa meningkat 2. Bagaimana cara menghitung 2.490.622 jiwa pada tahun 2016. data menggunakan metode Pada clustering dan algoritma k- tahun tersebut terjadi perubahan struktur umur penduduk Means ? yaitu jumlah penduduk usia produktif (15-64 tahun) terus meningkat, sementara jumlah penduduk usia non produktif (0-14 tahun) semakin 2 1.2 Tujuan 1. Untuk mana mengetahui daerah saja banyak yang terdapat usia produktifnya. 2. Untuk mengetahui perhitungan data menggunakan 2. LANDASAN TEORI 2.1. Pengertian Data Mining cara Data mining adalah sebuah dengan proses percarian secara otomatis metode informasi yang berguna dalam Clustering dan algoritma K- tempat penyimpanan data berukuran Means. besar. Istilah lain yang sering digunakan diantaranya knowledge 1.3 Manfaat 1. Secara teoritis penulisan discovery (mining) in (KDD), knowledge databases extraction, jurnal ini bermanfaat bagi data/pattern analysis, Ilmu archeology, data Pengetahuan khususnya bidang dalam Sosial pelaksanaan data dredging, information harvesting, dan business intelligence. Teknik data mining pendataan jumlah penduduk digunakan untuk memeriksa basis suatu dan data berukuran besar sebagai cara penduduk untuk menemukan pola yang baru wilayah pengelompokan berdasarkan usia, khususnya dan Kota Bandung. pekerjaan 2. Secara praktis berguna. Tidak pencarian semua informasi penulisan dinyatakan sebagai data mining. jurnal ini bermanfaat bagi Sebagai contoh, pencarian record masyarakat lebih individual menggunakan database jumlah management system atau pencarian berdasarkan halaman web tertentu melalui query untuk mengetahui kependudukan usia, khususnya di Kota Bandung. 1.4 Tinjauan Pustaka ke semua search engine adalah pekerjaan pencarian informasi yang erat kaitannya dengan information 1. Pendahuluan retrieval. Teknik-teknik data mining 2. Landasan Teori dapat 3. Metode Penelitian meningkatkan kemampuan sistem- 4. Implementasi dan Pengujian sistem information retrieval. digunakan untuk 5. Kesimpulan dan saran 6. Daftar Pustaka Data mining adalah bagian integral dari knowledge discovery in 3 databases (KDD). Keseluruhan Hasil dari data mining sering proses KDD untuk konversi raw data kali diintegrasikan dengan decision ke dalam informasi yang berguna support system ditunjukkan dalam Gambar 1.1. contoh, dalam (DSS). Sebagai aplikasi bisnis informasi yang dihasilkan oleh data mining dapat diintegrasikan dengan tool manajemen kampanye produk sehingga promosi pemasaran yang efektif yang dilaksanakan dan dapat diuji. Integrasi demikian memerlukan Gambar 1.1 Proses dalam KDD (Tan Data input dapat disimpan dalam berbagai format seperti flat file,spreadsheet , atau tabel-tabel relasional, dan dapat menempati tempat penyimpanan data terpusat terdistribusi pada tempat. Tujuan dari adalah banyak preprocessing mentransformasikan data input mentah ke dalam format yang sesuai untuk analisis selanjutnya. Langkah-langkah yang terlibat dalam preprocessing postprocessing yang menjamin bahwa hanya hasil yang et al, 2005) atau langkah data meliputi valid dan berguna yang akan digabungkan dengan DSS. Salah satu pekerjaan dan postprocessing adalah visualisasi memungkinkan yang analyst untuk mengeksplore data dan hasil data mining dari berbagai sudur pandang. Ukuran-ukuran statistik dan metode pengujian hipotesis dapat digunakan selama postprocessing untuk membuang hasil data mining yang palsu. mengabungkan data dari berbagai Secara khusus,data mining sumber, membersihkan (cleaning) menggunakan ide-ide seperti (1) data untuk membuang noise dan pengambilan contoh, estimasi, dan observasi duplikat, dan menyeleksi pengujian hipotesis, dari statistika record dan fitur yang relevan untuk dan (2) algoritma pencarian, teknik pekerjaan pemodelan, dan teori pembelajaran data terdapat mengumpulkan mining. banyak dan Karena cara menyimpan dari kecerdasan pengenalan pola, buatan, dan machine data, tahapan preprocessing data learning. Data mining juga telah merupakan langkat yang banyak mengadopsi ide-ide dari area lain menghabiskan waktu dalam KDD. meliputi optimisasi, evolutionary 4 computing, teori informasi, karakteristik antar satu sama lainnya pemrosesan sinyal, visualisasi dan dan berbeda dengan cluster yang information retrieval. Sejumlah area lain. Partisi tidak dilakukan secara lain peran manual melainkan dengan suatu mining, algoritma clustering. Oleh karena itu, juga pendukung seperti memberikan dalam sistem dibutuhkan data basis untuk data yang clustering sangat berguna dan bisa menyediakan menemukan group atau kelompok tempat penyimpanan yang efisien, yang tidak dikenal dalam indexing dan pemrosesan queri. Clustering banyak digunakan dalam Gambar 1.2 menunjukkan hubungan berbagai aplikasi seperti misalnya data mining dengan area-area lain. pada business data. inteligence, pengenalan pola citra, web search, bidang ilmu keamanan biologi, (security). dan untuk Di dalam business inteligence, clustering bisa mengatur Gambar 1.2 Data mining sebagai pertemuan dari banyak disiplin ilmu (Tan et al, 2005) 2.2. Metode Clustering metode customer banyaknya Contohnya ke kelompok. mengelompokan customer ke dalam beberapa cluster dengan kesamaan karakteristik yang Clustering atau klasterisasi adalah dalam banyak kuat. Clustering juga dikenal sebagai pengelompokan data segmentasi karena clustering data. Menurut Tan, 2006 clustering mempartisi banyak data set ke adalah untuk dalam banyak group berdasarkan dalam kesamaannya. Selain itu clustering sebuah mengelompokan beberapa proses data cluster ke atau kelompok juga bisa sebagai outlier detection. sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang minimum. Clustering merupakan proses partisi satu set objek data ke dalam himpunan bagian yang disebut dengan cluster. Objek yang di dalam cluster memiliki kemiripan Manfaat Clustering 1. Clustering merupakan metode segmentasi data yang sangat berguna dalam prediksi dan analisa masalah bisnis tertentu. Misalnya Segmentasi pasar, marketing pemetaan zonasi wilayah. 5 dan 2. Identifikasi obyek dalam kesamaan antar objek-objek yang bidang berbagai bidang seperti dibandingkan. Salah satunya ialah computer vision dan image dengan processing. Distance. dengan Hasil clustering yang baik akan tingkat kesamaan yang tinggi dalam satu kelas dan tingkat kesamaan yang rendah antar Euclidean distance pengukuran secara mengetahui nilai dari masing-masing atribut pada kedua poin tersebut. 2.3. Algoritma K-Means kelas. Kesamaan yang dimaksud merupakan Euclidean menghitung jarak dua buah point Konsep dasar Clustering menghasilkan weighted K-means merupakan salah satu metode clustering non hirarki numeric terhadap dua buah objek. yang Nilai kesamaan antar kedua objek yang ada ke dalam bentuk satu atau akan semakin tinggi jika kedua objek lebih cluster. Metode ini mempartisi yang data ke dalam cluster sehingga data dibandingkan memiliki berusaha yang dengan sebaliknya. Kualitas hasil sama dikelompokkan ke dalam satu clustering sangat bergantung pada cluster yang sama dan data yang metode mempunyai dipakai. Dalam karakteristik data kemiripan yang tinggi. Begitu juga yang memiliki mempartisi karateristik yang yang clustering dikenal empat tipe data. berbeda di kelompokan ke dalam Keempat tipe data pada tersebut cluster yang lain. ialah: Ada 1. Variabel berskala interval 2. Variabel biner 3. Variabel nominal, kelebihan pada algoritma k-means, yaitu : ordinal, dan rasio 4. beberapa Variabel dengan tipe lainnya. Metode clustering juga harus dapat 1. Mudah untuk di implementasi kan dan dijalankan. 2. Waktu yang dibutuhkan untuk menjalankan pembelajaran ini relatif cepat. mengukur kemampuannya sendiri 3. Mudah untuk diadaptasi. dalam 4. Umum digunakan. usaha untuk menemukan suatu pola tersembunyi pada data yang sedang diteliti. Terdapat berbagai metode yang digunakan untuk mengukur dapat Kekurangan dari algoritma KMeans yaitu : nilai 6 1. Sebelum algoritma dijalankan, titik yang diinisialisasi secara k buah titik diinisialisasi secara random.Namun jika terdapat random banyak sehingga sekali titik data pengelompokkan data yang (misalnya satu milyar buah dihasilkan berbeda- data), maka perhitungan dan beda. Jika nilai random untuk pencarian titik terdekat akan inisialisasi kurang baik, maka membutuhkan pengelompokkan yang lama. Proses tersebut dapat dihasilkan pun menjadi kurang dipercepat, namun dibutuhkan optimal. struktur data yang lebih rumit 2. dapat Dapat terjebak dalam masalah yang disebut curse of dimensionality. Hal ini dapat terjadi jika data pelatihan waktu yang seperti kD-Tree atau hashing. Variasi 1. K-means++ memiliki dimensi yang sangat Algoritma untuk memilih nilai tinggi awal (Contoh jika data untuk algoritma pelatihan terdiri dari 2 atribut means. maka dimensinya adalah 2 digunakan untuk mengurangi dimensi. Namun jika ada 20 dampak buruk algoritma k- atribut, maka akan ada 20 means dimensi). tergantung dari nilai awalnya. kerja Salah algoritma satu ini cara adalah Algoritma k- yang ini sangat 2. K-medoids mencari jarak terdekat antara Algoritma k berbasiskan prototype/model buah titik dengan titik clustering lainnya. Jika mencari jarak dari antar titik pada 2 dimensi, menggunakan centroid (rata- masih rata) mudah dilakukan. cluster. yang sebagai K-means model dari sedangkan K- Namun bagaimana mencari cluster, jarak antar titik jika terdapat 20 medoids dimensi. Hal ini akan menjadi medoid (median). menggunakan sulit. 3. Jika hanya terdapat beberapa titik sampel data, maka cukup 3. Bisecting K-means Ide dasarnya adalah mudah untuk menghitung dan menggunakan mencari titik terdekat dengan k membagi dua suatu cluster. Awalnya K-means 7 untuk setiap objek tergabung dalam satu dapat mendukung penelitian ini dan cluster. Pada tiap iterasi, pilih satu juga digunakan sebagai referensi. cluster untuk menggunakan dilakukan dibagi K-means. hingga dua Hal ini terbentuk K 3.4 Alur Penelitian Data Selection cluster. Algoritma bisecting K-means bekerja lebih cepat dari K-means Pre-Processing karena mengurangi jumlah objek yang diperbandingkan pada setiap iterasi. Tranformation 3. METODE PENELITIAN Data Mining 3.1. Objek Penelitian Interpretation Objek yang kami gunakan ini adalah data penduduk dari Kota Penjelasan Bandung. 3.2. Metode Pengumpulan Data Metode yang digunakan dari alur penelitian tersebut : 1. Data Selection Langkah dimana kita mencari dalam mengumpulkan data ini yaitu dengan observasi. Dimana kami sebuah mendapatkan data ini dari pihak digunakan dari seperkian banyaknya yang terpecaya. data yang ada. 3.3 2. Jenis Data dataset yang akan Pre-Processing Pada penelitian ini jenis data Dari dataset yang telah dipilih yang digunakan ada dua macam pada langkah ini kita perlu memilah yaitu data primer dan data sekunder. dan membersihkan data-data apa Dimana saja yang dirasa tidak peting. Pada didapatkan dalam dari data primer data yang langkah ini pula kita bisa didapatkan dari sumber terpecaya menambahkan beberapa informasi dan data sekunder yaitu data yang lain untuk memperkaya dataset yang didapatkan secara tidak langsung kita gunakan. dari objek penelitian melainkan mencari data dari sumber lain yang 3. Transformation 8 Pencarian fitur-fitur yang berguna untuk mempresentasikan data bergantung pada goal yang ingin dicapai. 4. Data Mining Proses mencari pola dimana dalam untuk data kita menggunakan metode dan algoritma yang telah ditentukan. 5. Interpretation Penerjemahan pola-pola yang dihasilkan dari data mining. 4. IMPLEMENTASI DAN PENGUJIAN 4.1 Perhitungan Manual 4.1.1 Data 4.1.2 Cara perhitungan manual 1. Menentukan jumlah cluster yang diinginkan (kami menggunkan cluster berjumlah 3) 2. Memilih centroid awal secara acak 9 Dengan data sebagai berikut : 5134.47 9717 7305 C1 {Cibaduyut, Dago, Cipedes} M1 =Cibaduyut (3280, 8465, 383) M2 = Dago (7729, 22518, 2098) M3 = Cipedes (7088, 20230, 1516) 3. keanggotaan masing-masing cluster. Setelah itu dihitung pula rasio antar besaran BCV Variation) (Between dengan Hitung dengan centroid Cluster Variation) : Pada langkah ini setiap data Karena centroid akan ditentukan centroid terdekatnya dan data tersebut akan ditetapkan kelompok sebagai yang anggota terdekat dengan centroid. Sebagai contoh untuk menghitung jarak ke centroid masing-masing cluster pada kelurahan Kebon Jeruk 2 DM1 = √(2469 - 3280) + (8815 8465) 2 + (1326 - 383) 2 = 1292,08 2 DM2 = √(2469 - 7729) + (8815 22518) 2 + (1326 - 2098) 2 = 14698 DM3 = √(2469 - 7088) 2 + (8815 20230) 2 + (1326 - 1516) 2 = 12316 sebagian WCV Cluster (Within M1=(3280,8465,383) M2=(7729,22518,2098) M3=(7088,20230,1516) d(m1,m2) = √(3280 - 7729) 2 + (8465 - 22518) 2 + (383 - 2098) 2 = 14839.86 d(m1,m3) = √(3280 - 7088) 2 + (8465 sebagai berikut : Contoh Dari table tersebut didapat data hasil perhitungan jarak antara masing – masing centroid Cluster Cluster Cluster 1 2 3 1292.08 14698 12316 4031.23 10819 8404 1485.88 16115 13712 4973.72 9893 7491 + (383 - 1516) 2 d(m2,m3) = √(7729 - 7088) 2 - 20230) 2 = 12417.720 2 + 2 (22518 - 20230) + (2098 - 1516) = 2446.33 BCV = 14839.86 + 12417.720 + 2446.33 = 29703.91 WCV dihitung dari memilih jarak terkecil antara data dengan centroid pada masing-masing cluster Jarak deka t C1 C1 C1 C1 Contohnya Nama Kelurahan Kebon Jeruk Campaka Jarak centroid terkecil 1292.08 4031.23 10 Garuda Dungus Cariang Ciroyom CIPARAY CIGADUNG DAGO BABAKANS ARI 1486.88 4974.72 5134.47 7247 7729 21538 22518 1755 2098 9088 25945 1984 1769 .5 Mean 8001 22860 CLUSTER 3 Nama Kelurahan MARGAHA YU UTARA BABAKAN SUKAHAJI GEMPOLSA RI CIJERAH Usia 0-14 WCV=1292.082+4031.232+1486.882+ 4974.722+5134.472+dst = 1.855.379.567 Sehingga besar ratio dalam iterasi 1 adalah : BCV/WCV = 29703.91/1.855.379.567 = 0,0000160096 Karena langkah ini merupakan iterasi1 maka dilanjutkan ke langkah berikutnya 4. rata-rata nilai pada masing-masing cluster. CLUSTER 1 Nama Kelurahan KEBON JERUK CAMPAKA GARUDA DUNGUS CARIANG CIROYOM Mean Nama Kelurahan BABAKAN Usia >65 thn 5402 7631 7543 14702 20244 20221 989 1211 1485 4874 5817 6888 .8 15000 16802 16699. 19 794 1223 1351 .7 Sehingga didapat Centroid baru Pembaruan centroid dengan menghitung Mean Usia 15-64 Usia 0-14 2469 4253 2350 Usia 15-64 Usia >65 thn 8815 12434 7383 1326 898 798 4456 13222 4995 13240 2965 8880 CLUSTER 2 1235 1171 834 Usia Usia Usia >65 0-14 15-64 thn 7940 21439 1241 m1=(2965, 8880, 834) m2=(8001, 22860, 1769.5) m3=(6888.80769, 16699.19231, 1351.769231) (Iterasi 2) Kembali lagi ke langkah 3 Jika masih ada data yang berpindah cluster atau jika nilai centroid diatas nilai ambang. Sehingga didapat besar rasio pada Iterasi 2 adalah : BCV/WCV = 29926.613620633/1384931665 = 0.0000216087 11 Jika dibandingkan maka Berikut ini adalah langkah – rasio sekarang lebih besar daripada langkah untuk mendapatkan hasil sebelumnya pada aplikasi Weka : algoritma oleh karena dilanjutkan itu kelangkah berikutnya. 1. Pertama buka terlebih dahulu aplikasi Weka (Iterasi 3) Sehingga didapat besar rasio pada Iterasi 3 adalah : BCV/WCV = 28779.722052823/1194352601 2. = 0.0000240965 Jika Lalu pilih menu Explorer hingga muncul tampilan dibawah ini dibandingkan maka rasio sekarang lebih besar daripada sebelumnya algoritma oleh karena dilanjutkan itu kelangkah berikutnya. (Iterasi 4) Sehingga didapat besar rasio pada 3. Iterasi 4 adalah : Masukkan file atau .ARFF pada menu Open file BCV/WCV = lalu 28706.023435527/1194534255 pilih dataset yang digunakan = 0.0000240311 Pada Iterasi 4 didapat hasil Rasio lebih kecil daripada daripada Iterasi 3 jadi perhitungan algoritma dihentikan. 4.2 .CSV Hasil Pada Weka 12 akan 4. Setelah dataset telah dimasukkan, lalu filter data tersebut dengan cara tandai semua Attributes yang digunakan lalu pilih dengan filter cara Choose>filters>unsupervised attributes>NumericToNominal > lalu Apply 7. Jika semua langkah telah dilakukan klik tombol Start untuk menampilkan hasilnya. 5. Pilih menu Cluster lalu pilih algoritma yang digunakan yaitu SimpleKMeans. 5. PENUTUP 5.1 Kesimpulan Dari uraian diatas dapat disimpulkan bahwa : - Bandung merupakan salah satu Kota besar di Indonesia. 6. Tetukan jumlah cluster dengan cara double klik pada nama algoritma lalu isi kolom numClusters sesuai acuan. Jumlah kependudukan Kota Bandung di setiap tahunnya terus mengalami peningkatan hingga rasio 0,53% per tahunnya yaitu pada tahun penduduk 2011 Kota jumlah Bandung sebesar 2.429.176 jiwa dan 2.490.622 jiwa pada tahun 2016. Struktur usia penduduk Kota Bandung 13 tergolong menjadi tiga yaitu penduduk kedalam bentuk satu atau usia lebih cluster. non produktif (0-14 tahun), usia produktif (15-64 5.2 tahun), dan usia manula (>65 Dari penelitian yang kami tahun). - Data mining sebuah yang pencarian secara ada lakukan terdapat beberapa hal merupakan proses informasi yang pada dan perlu dikembangkan. Ada beberapa catatan yang ingin tempat kami sampaikan, diantaranya: besar. Istilah lain yang sering - Untuk peneliti selanjutnya, digunakan diantaranya knowledge discovery menguasai software yang (mining) in database (KDD), digunakan dengan baik knowledge sehingga kami berharap peneliti dapat extraction, tidak adanya data/pattern analysis, data kesalahan atau error yang archeology, data dredging, terjadi. information harvesting, dan dihasilkan diharapkan bisa bussiness intelligence. sama Metode penghitungan Clustering merupakan yang Output yang dengan hasil secara suatu metode manual, karena sebenarnya digunakan untuk pada aplikasi hanya sebagai mengelompokkan kedalam data beberapa visualisasi cluster dari - Apabila dalam dalam satu cluster memiliki perhitungan tingkat kependudukan kemiripan hasil perhitungan secara manual. atau kelompok sehingga data - kami rasa masih diperbaiki otomatis penyimpanan data berukuran - Saran yang penelitian jumlah Kota maksimum dan data antar Bandung berdasarkan usia cluster ini masih belum mendapat memiliki yang minimum. informasi yang akurat, kami K-means merupakan salah siap menerima saran dan satu algoritma clustering non kritikan hirarki sekalian. yang berusaha dari pembaca mempartisi data yang ada 6. DAFTAR PUSTAKA 14 - Atmajaya, dedi. 2017. Apa itu k-means algorithm. http://lecturer.fikom.umi.ac.id/dedyat majaya/k-means-algorithm/ (Diakses pada 21 Mei 2018) Binus university. 2017. Clustering. https://socs.binus.ac.id/2017/03/09/cl ustering/ . (DIkases pada 22 Mei 2018) - Pemkot bandung. (2017). Dataset kependudukan berdasarkan umur.http://data.bandung.go.id/servi ce/index.php/datapreview/load/ 2ee698e5-b352-4960-ad4bb60dd094d092 (Diakses pada 21 Mei 2018). - Prabowo,sigit. 2013. Tahapan-tahapan KDD. http://www.sigitprabowo.id/2013/04/d ata-mining-tahap-tahapanknowladge.html. (Diakses pada 3 juni 2018). - Tjiptoherijanto prijono. 2000. Proyeksi Penduduk, angkatan kerja, tenaga kerja, dan peran serikat pekerja dalam peningkatan kesejahteraan. https://www.bappenas.go.id/files/351 3/.../prijono__20091015125259__23 56__0.pdf (Diakses pada 21 Mei 2018). 15

Judul: Jurnal Data Mining Clustering

Oleh: Wahyu Adi


Ikuti kami