NORMALISASI DATA
Definisi/Pengertian Normalisasi
Normalisasi merupakan teknik analisis data yang mengorganisasikan atribut-atribut data dengan cara mengelompokkan sehingga terbentuk entitas yang non-redundant, stabil, dan fleksible. Hal yang dapat dilakukan dalam normalisasi data adalah insert,update,delete, dan modifikasi pada satu atau beberapa atribut tanpa mempengaruhi integritas data dalam relasi tersebut. Normalisasi dilakukan sebagai uji coba pada suatu relasi secara berkelanjutan untuk menentukan apakah relasi itu sudah baik, yaitu dapat dilakukan proses insert,update,delete, dan modifikasi pada satu atau beberapa atribut tanpa mempengaruhi integritas data dalam relasi tersebut.
Normalisasi merupakan sebuah teknik dalam logical desain sebuah basis data yang mengelompokkan atribut dari suatu relasi sehingga membentuk struktur relasi yang baik (tanpa redudansi). Normalisasi adalah proses pembentukan struktur basis data sehingga sebagian besar ambiguity bisa dihilangkan.
Syarat perlunyya normalisasi:
· Fleksibilitas
Struktur database harus menunjang semua cara untuk menampilan data, sehingga ketika user menjalankan aplikasi dan meminta sesuatu dalam datbase, database harus dapat berjlan memenuhi permintaan user.
· integritas data
Semua data dalam database yang berkaitan harus terhubung dalam suatu relationship. Sehingga ketika suatu data berubah,maka semua data yang berkaitan dengan data tersebut harus dapat berubah secara otomatis.
· Efficiency
Pada database, ukuran suatu database merupakan hal yang penting. Maka dalam database, kita harus mengurangi redudansi data yang bisa menyebabkan ukuran databse membengkak.
· Menghindari modification anomaly
Desain database yang baik menyajikan suatu keyakinan bahwa ketika user melakukan perubahan dalam database, maka tidak terjadi hal yang tidak diinginkan.
Kapan tidak memakai normalisasi
· ketika kita ingin mempertahankan kesederhanaan database, sehingga user dapat melakukan query sendiri.
· jika tidak ingin melakukan query yang rumit. normalisasi biasanya akan membuat rumit query karena melibatkan banyak tabel.
· tidak selamanya normalisasi membuat baik, malah akan menyebabkan database semakin buruk
Tujuan Normalisasi
• Untuk menghilang kerangkapan data
• Untuk mengurangi kompleksitas
• Untuk mempermudah pemodifikasian data
Definisi/Pengertian Normalisasi Data
Normalisasi data merupakan suatu proses untuk mendapatkan struktur tabel atau relasi yang efisien dan bebas dari anomali, dan mengacu pada cara data item dikelompokkan ke dalam struktur record.
”The goal of a relational database design is to generate a set of relation scheme that allow us to store informastion easily. One approach is to design scheme that are in an appropriate normal form (silberschatz, H., 1991).”
Proses Normalisasi
Data diuraikan dalam bentuk tabel, selanjutnya dianalisisberdasarkan persyaratan tertentu ke beberapa tingkat. Apabila tabel yang diuji belum memenuhi persyaratan tertentu,maka tabel tersebut perlu dipecah menjadi beberapa tabel yanglebih sederhana sampai memenuhi bentuk yang optimal.
Kriteria Tabel efisien
Sebuah tabel dikatakan baik (efisien) atau normal jika memenuhi 3 kriteria sbb:
- Jika ada dekomposisi (penguraian) tabel, maka dekomposisinya harus dijamin aman (Lossless-Join Decomposition). Artinya, setelah tabel tersebut diuraikan / didekomposisi menjadi tabel-tabel baru, tabel-tabel baru tersebut bisa menghasilkan tabel semula dengan sama persis.
- Terpeliharanya ketergantungan fungsional pada saat perubahan data (Dependency Preservation).
- Tidak melanggar Boyce-Code Normal Form (BCNF) (-akan dijelaskan kemudian-)
Tahapan Normalisasi
Tahap Normalisasi dimulai dari tahap paling ringan (1NF) hingga paling ketat (5NF) . Biasanya hanya sampai pada tingkat 3NF atau BCNF karena sudah cukup memadai untuk menghasilkan tabel-tabel yang berkualitas baik. Urutan: 1NF, 2NF, 3NF, BCNF, 4NF, 5NF.
• Bentuk Tidak Normal
Menghilangkan perulangan group
• Bentuk Normal Pertama (1NF)
Menghilangkan ketergantungan sebagian
• Bentuk Normal Kedua (2NF)
Menghilangkan ketergantungan transitif
• Bentuk Normal Ketiga (3NF)
Menghilangkan anomali-anomali hasil dari ketergantungan fungsional
• Bentuk Normal Boyce-Codd (BCNF)
Menghilangkan Ketergantungan Multivalue
• Bentuk Normal Keempat (4NF)
Menghilangkan anomali-anomali yang tersisa
• Bentuk Normal Kelima
Normal Pertama (1st Normal Form)
• Aturan :
ü Tidak adanya atribut multi-value, atribut komposit atau kombinasinya.
ü Mendefinisikan atribut kunci.
ü Setiap atribut dalam tabel tersebut harus bernilai atomic (tidak dapat dibagi-bagi lagi)
Contoh: Misal data mahasiswa sbb:
Normalisasi Kedua (2nd Normal Form)
• Aturan :
ü Sudah memenuhi dalam bentuk normal
kesatu (1NF)
ü Semua atribut bukan kunci hanya boleh tergantung (functional dependency) pada atribut kunci
ü Jika ada ketergantungan parsial maka atribut tersebut harus dipisah pada tabel yang lain
ü Perlu ada tabel penghubung ataupun kehadiran foreign key bagi atribut-atribut yang telah dipisah tadi
Contoh: Tabel berikut memenuhi 1NF tapi tidak termasuk 2NF:
Mhs_nrp |
mhs_nama |
mhs_alamat |
mk_kode |
mk_nama |
mk_sks |
nihuruf |
Normalisasi Ketiga (3rd Normal Form)
• Aturan :
ü Sudah berada dalam bentuk normal kedua (2NF)
ü Tidak ada ketergantungan transitif (dimana atribut bukan kunci tergantung pada atribut bukan kunci lainnya).
Contoh: Tabel berikut memenuhi 2NF, tapi tidak memenuhi 3NF:
Nrp |
Nama |
Alm_Jalan |
Alm_Kota |
Alm_Provinsi |
Alm_Kodepos |
Tabel-tabel yang memenuhi kriteria normalisasi ketiga, sudah siap diimplementasikan. Sebenarnya masih ada lagi bentuk normalisasi yang lain; Normalisasi Boyce-Codd, 4NF, 5NF, hanya saja jarang dipakai. Pada kebanyakan kasus, normalisasi hanya sampai ketiga.