JaMan Jani: Database, DBMS, Data Model dan Data Mining

1. PENGERTIAN DATABASE

Database dapat diartikan sebagai kumpulan data yang terdiri atas satu atau lebih tabel yang terintegrasi satu sama lain, di mana setiap pemakai (user) diberi wewenang (otorisasi) untuk dapat mengakses (mengubah, menghapus, menganalisis, menambah, memperbaiki) data dalam tabel-tabel tersebut.

Tabel-tabel tersebut berfungsi untuk menyimpan data dan merupakan suatu kumpulan data yang berhubungan dengan topik tertentu, misalnya daftar vcd, daftar pemasok, daftar inventaris, dsb. Beberapa istilah yang harus diketahui pada saat bekerja dengan sebuah table database adalah :

1.Field, merupakan tempat di mana data atau informasi dalam kelompok yan sama atau sejenis dimasukkan. Field itu pada umumnya tersimpan dalam bentuk kolom vertikal pada tabel.
2. Record, merupakan data lengkap dalam jumlah tunggal yang biasanya tersimpan dalam bentuk baris secara horizontal pada tabel.

2. PENGERTIAN DATA MANAGEMENT SYSTEM (DBMS)

Database Manajemen System ;

Suatu program komputer yang digunakan untuk memasukkan ,mengubah ,menghapus, memanipulasi dan memeperoleh data / informasi dengan praktis dan efisien.

Komponen Utama DBMS :

Hardware ; yang melakukan pemrosesan dan menyimpan database.
Data.
User , dapat diklasifikasikan menjadi :

a.End User ;

Pengguna aplikasi, yang mengoperasikan program aplikasi.
Pengguna interaktif, yang memberikan perintah-perintah beraras tinggi (sintak-sintak query).

b.Programmer aplikasi, yang membuat program aplikasi.

c. Database Administrator, bertanggung jawab terhadap pengelolaan database.

4. Software, sebagai interface antara user dan database.

Perintah yang digunakan untuk mengelola dan mengorganisasikan data :

Data Definition Language ;

Perintah yang biasa digunakan oleh DBA untuk mendefinisikan skema ke DBMS.

Skema : deskripsi lengkap tentang struktur field, record dan hubungan data pada database.

Hal yang perlu dijabarkan dalam DBMS :

Nama database.
Nama file pada database.
Nama field dan record.
Deskripsi file, record dan field.

DDL juga digunakan untuk menciptakan, mengubah dan menghapus database.

Yang termasuk dalam kelompok DDL :

CREATE ; membuat table.
ALTER ; mengubah struktur table.
DROP ; menghapus table.

Data Manipulation Language ;

Perintah yang digunakan untuk mengubah, memanipulasi dan mengambil data pada database.

DML dibagi menjadi 2 :

Prosedural ; menuntut user menentukan data apa saja yang diperlukan dan bagaimana cara mendapatkannya.
Non Prosedural ; menuntut user menentukan data apa saja yang diperlukan tetapi tidak perlu menyebutkan cara mendapatkannya.

Perintah yang termasuk dalam DML :

SELECT ; memilih data.
INSERT ; menambah data.
DELETE ; menghapus data.
UPDATE ; mengubah data.

Keuntungan Database Manajemen System :

Mengurangi pengulangan data.
Independensi data.
Memadukan data dari beberapa file.
Memanggil data dan informasi secara tepat.
Meningkatkan keamanan.

Kerugian Database Manajemen System :

Menggunakan software yang mahal.
Menggunakan konfiguarsi hardware yang besar.
Memperkerjakan dan menggaji staf DBA yang relatif mahal.

3. DATABASE MODEL

Berbagai teknik digunakan untuk struktur data model. Kebanyakan sistem database dibangun sekitar satu model data tertentu, meskipun semakin umum untuk produk-produk untuk menawarkan dukungan untuk lebih dari satu model. Untuk setiap satu model logis implementasi berbagai fisik dapat dibuat, dan produk yang paling akan menawarkan pengguna beberapa tingkat kontrol dalam tuning pelaksanaan fisik , karena pilihan-pilihan yang dibuat memiliki dampak yang signifikan terhadap kinerja. Contoh dari ini adalah model relasional: semua implementasi serius dari model relasional memungkinkan pembuatan indeks yang menyediakan akses cepat ke baris dalam tabel jika nilai kolom tertentu yang dikenal.

1. Database Hierarkis

Pada database Hierarkis, field atau record diatur dalam kelompok-kelompok yang berhubungan, menyerupai diagram pohon, dengan record child (level lebih rendah) berada di bawah record parent (level yang lebih tinggi).

Database hierarkis merupakan model tertua dan paling sederhana dari kelima model database. Dalam model database ini mengakses atau mengupdate data bisa berlangsung sangat cepat karena hubungan-hubungan sudah ditentukan. Tetapi, karena struktur harus didefinisikan lebih dahulu, maka hal ini cukup riskan. Lagipula menambahkan field baru ke sebuah record database membuat semua database harus didefinisikan kembali. Karena itulah diperlukan model database yang baru untuk menunjukkan masalah pengulangan data dan hubungan data yang kompleks.

2. Database Jaringan

Konsep database jaringan mirip dengan database hierarkis tetapi setiap record child dapat memiliki lebih dari satu record parent. Selanjutnya setiap record child dapat dimiliki oleh lebih dari satu record parent.

Database jaringan pada dasarnya digunakan dengan mainframe, lebih fleksibel disbanding database hierarkis karena ada hubungan yang berbeda antarcabang data. Akan tetapi strukturnya masih harus didefinisikan lebih dahulu. Pengguna harus sudah terbiasa dengan struktur database. Lagipula jumlah hubungan antar-record juga terbatas, dan untuk menguji sebuah field seseorang harus mendapatkan kembali semua record.

3. Database Relasional

Database Relasional bekerja dengan menghubungkan data pada file-file yang berbeda dengan menggunakan sebuah kunci atau elemen data yang umum.

Cara kerja database relasional:

Elemen-elemen data disimpan dalam tabel lain yang membentuk baris dan kolom. Dalam model database ini data diatur secara logis, yakni berdasarkan isi. Masing-masing record dalam tabel diidentifikasi oleh sebuah field – kunci primer – yang berisi sebuah nilai unik. Karena itulah data dalam database relasional dapat muncul dengan cara yang berbeda dari cara ia disimpan secara fisik pada komputer. Pengguna tidak boleh mengetahui lokasi fisik sebuah record untuk mendapatkan kembali datanya.

4. Database Berorientasi Objek

Model ini menggunakan objek sebagai perangkat lunak yang ditulis dalam potongan kecil yang dapat digunakan kembali sebagai elemen dalam file database. Database berorientasi objek adalah sebuah database multimedia yang bisa menyimpan lebih banyak tipe data dibanding database relasional.

Salah satu model database berorientasi objek adalah database hypertext atau database web, yang memuat teks dan dihubungkan ke dokumen lain. Model lainnya adalah database hypermedia, yang memuat link dan juga grafis, suara, dan video.

Contoh: database DB2, Cloudscape, Oracle9i dan sebagainya

5. Database Multidimensial

Database Multidimensial (MDA) memodelkan data sebagai fakta, dimensi, atau numerik untuk menganalisis data dalam jumlah besar, tujuannya adalah untuk mengambil keputusan. Database Multidimensial menggunakan bentuk kubus untuk merepresentasikan dimensi-dimensi data yang tersedia bagi seorang pengguna, maksimal empat dimensi.

Contoh: InterSystem Cache, ContourCube, dan Cognoa PowerPlay

contoh database multidimensional

4. DATA MINING

a. Pengertian data mining

Penggalian data (bahasa Inggris: data mining) adalah ekstraksi pola yang menarik dari data dalam jumlah besar . Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru. Penggalian data memiliki beberapa nama alternatif, meskipun definisi eksaknya berbeda, seperti KDD (knowledge discovery in database), analisis pola, arkeologi data, pemanenan informasi, dan intelegensia bisnis. Penggalian data diperlukan saat data yang tersedia terlalu banyak (misalnya data yang diperoleh dari sistem basis data perusahaan, e-commerce, data saham, dan data bioinformatika), tapi tidak tahu pola apa yang bisa didapatkan.

b. Teknik Penggalian Data

Pada dasarnya penggalian data dibedakan menjadi dua fungsionalitas, yaitu deskripsi dan prediksi. Berikut ini beberapa fungsionalitas penggalian data yang sering digunakan:

Karakterisasi dan Diskriminasi: yaitu menggeneralisasi, merangkum, dan mengkontraskan karakteristik data.
Penggalian pola berulang: yaitu pencarian pola asosiasi (association rule) atau pola intra-transaksi, atau pola pembelian yang terjadi dalam satu kali transaksi.
Klasifikasi: yaitu membangun suatu model yang bisa mengklasifikasikan suatu objek berdasar atribut-atributnya. Kelas target sudah tersedia dalam data sebelumnya, sehingga fokusnya adalah bagaimana mempelajari data yang ada agar klasifikator bisa mengklasifikasikan sendiri.
Prediksi: yaitu memprediksi nilai yang tidak diketahui atau nilai yang hilang, menggunakan model dari klasifikasi.
Penggugusan/Cluster analysis: yaitu mengelompokkan sekumpulan objek data berdasarkan kemiripannya. Kelas target tidak tersedia dalam data sebelumnya, sehingga fokusnya adalah memaksimalkan kemiripan intrakelas dan meminimalkan kemiripan antarkelas.
Analisis outlier: yaitu proses pengenalan data yang tidak sesuai dengan perilaku umum dari data lainnya. Contoh: mengenali noise dan pengecualian dalam data.
Analisis trend dan evolusi: meliputi analisis regresi, penggalian pola sekuensial, analisis periodisitas, dan analisis berbasis kemiripan.

c. Proses Data Mining

Tahap-Tahap Data Mining. Karena Data Mining adalah suatu rangkaian proses, Data Mining dapat dibagi menjadi beberapa tahap:

1. Pembersihan data (untuk membuang data yang tidak konsisten dan noise)

2. Integrasi data (penggabungan data dari beberapa sumber)

3. Transformasi data (data diubah menjadi bentuk yang sesuai untuk di-mining)

4. Aplikasi teknik Data Mining

5. Evaluasi pola yang ditemukan (untuk menemukan yang menarik/bernilai)

6. Presentasi pengetahuan (dengan teknik visualisasi)

Tahap-tahap tsb. bersifat interaktif di mana pemakai terlibat langsung atau dengan perantaraan knowledge base.

Implementasi (Penerapan)

Dalam bidang apasaja data mining dapat diterapkan? Berikut beberapa contoh bidang penerapan data mining:

Analisa pasar dan manajemen.

Solusi yang dapat diselesaikan dengan data mining, diantaranya: Menembak target pasar, Melihat pola beli pemakai dari waktu ke waktu, Cross-Market analysis, Profil Customer, Identifikasi kebutuhan Customer, Menilai loyalitas Customer, Informasi Summary.

Analisa Perusahaan dan Manajemen resiko.

Solusi yang dapat diselesaikan dengan data mining, diantaranya: Perencanaan keuangan dan Evaluasi aset, Perencanaan sumber daya (Resource Planning), Persaingan (Competition).

Telekomunikasi.

Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual.

Keuangan.

Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data mining untuk me-nambang trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry) .

Asuransi.

Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi .

Olahraga.

IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim New York Knicks dan Miami Heat.

Astronomi.

Jet Propulsion Laboratory (JPL) di Pasadena, California dan Palomar Observatory berhasil menemukan 22 quasar dengan bantuan data mining. Hal ini merupakan salah satu kesuksesan penerapan data mining di bidang astronomi dan ilmu ruang angkasa.

Internet Web surf-aid

IBM Surf-Aid menggunakan algoritma data mining untuk mendata akses halaman Web khususnya yang berkaitan dengan pemasaran guna melihat prilaku dan minat customer serta melihat ke- efektif-an pemasaran melalui Web.

Contoh kasus penerapan: Implementasi data mining dengan teknik Clustering untuk melakukan Competitive Intelligence perusahaan.

Pembangunan perangkat lunak data mining dengan metode clustering menggunakan algoritma hirarki divisive untuk pengelompokan customer dalam studi kasus ini, fungsi – fungsi yang dipakai adalah fungsi untuk menentukan titik-titik pusat yang berguna sebagai pusat-pusat kelompok customer.

Pages

Download

Database, DBMS, Data Model dan Data Mining

1 komentar:

Posting Komentar

Yahoo! Mesengger

Let's join..!

Free Domain

Labels

Powered by

Statistik

Traffic Rank

Celoteh Hari Ini

Followers

Blog Archive

Banner Saya

Link Sahabat

Translate

.::. Banner Sahabat .::.

Entri Populer

Klik donk!