Pengertian Kompressing
Dalam ilmu komputer dan teori informasi, kompresi data atau sumber
pengkodean adalah proses encoding informasi dengan menggunakan lebih sedikit bit (atau unit informasi-bantalan lainnya) dari sebuah unencoded representasi akan menggunakan, melalui penggunaan
khusus pengkodean skema.
Dalam komputasi, deduplication data adalah teknik kompresi data
khusus untuk menghilangkan data-grained berlebihan kasar, biasanya untuk
meningkatkan utilisasi storage.
Seperti komunikasi apapun, dikompresi komunikasi data hanya
bekerja jika kedua pengirim dan penerima informasi memahami skema pengkodean. Misalnya, teks ini
masuk akal hanya jika penerima mengerti bahwa itu adalah dimaksudkan untuk
ditafsirkan sebagai karakter yang mewakili bahasa Inggris. Demikian pula, data
terkompresi hanya dapat dipahami jika metode decoding diketahui oleh penerima.
Kompresi berguna karena membantu mengurangi konsumsi sumber
daya mahal, seperti hard disk space atau transmisi bandwidth . Pada sisi negatifnya, data
dikompresi harus didekompresi untuk digunakan, dan ini pengolahan tambahan
mungkin merugikan beberapa aplikasi. Sebagai contoh, skema kompresi untuk video
mungkin memerlukan perangkat keras mahal untuk video yang akan didekompresi
cukup cepat untuk dilihat karena sedang decompressed (pilihan untuk dekompresi
video secara penuh sebelum menonton mungkin nyaman, dan membutuhkan ruang
penyimpanan untuk decompressed video). Rancangan skema kompresi data sehingga melibatkan
trade-off antara berbagai faktor, termasuk tingkat kompresi, jumlah distorsi
memperkenalkan (jika menggunakan skema kompresi lossy), dan sumber daya
komputasi yang dibutuhkan untuk kompres dan uncompress data.
Ada
2 kompresi data, yaitu :
a.
Lossy
Lossy kompresi
citra digunakan
dalam kamera
digital, untuk
meningkatkan kapasitas penyimpanan dengan minimal penurunan kualitas gambar.
Demikian pula, DVD menggunakan lossy MPEG-2 Video
codec untuk kompresi
video .
Dalam lossy kompresi
audio, metode psychoacoustics digunakan untuk menghapus non-terdengar
(atau kurang terdengar) komponen dari sinyal. Kompresi berbicara manusia sering
dilakukan dengan teknik khusus bahkan lebih, sehingga pidato
kompresi
"atau" suara coding kadang-kadang dibedakan sebagai suatu disiplin
yang terpisah dari kompresi audio. audio yang berbeda dan kompresi standar
pidato terdaftar di bawah codec
audio. Suara
kompresi akan digunakan dalam telepon
Internet misalnya,
sementara kompresi audio yang digunakan untuk CD ripping dan diterjemahkan oleh
pemain audio.
Berikut
ciri-ciri dari Lossy :
·
Terdapat informasi
yang hilang pada saat sampai pada telinga dan mata manusia.
·
Digunakan pada
kompresi objek audio, image, video
dimana keakuratan data absolut tidak diperlukan.
·
Aplikasi: medical screening systems, video
conferencing, dan multimedia messaging systems.
·
Metode kompresi
yang banyak digunakan adalah standar JPEG.
b. Lossless
Berikut ini ciri-ciri dari Lossless :
·
Data tidak berubah
atau hilang pada proses kompresi atau dekompresi
·
Membuat satu
replika dari objek asli
·
Menghilangkan
perulangan karakter
·
Digunakan pada data
teks dan image
·
Pada saat dilakukan
dekompres, perulangan karakter diinstal kembali
Standart compressing lossless yaitu:
1) Packbits encoding (Run-length encoding)
-
Kompresi data paling sederhana dan digunakan pada
awal penggunaan kompresi.
-
Digunakan untuk
kompresi image hitam-putih (binary).
-
String karakter yang
berulang menempati dua byte.
-
Byte pertama berisi jumlah dari
banyaknya perulangan.
-
Byte kedua berisi
karakter itu sendiri.
-
Dilakukan pada satu baris (atau scanline), dan tidak digunakan pada baris yang mempunyai jumlah scanline banyak.
-
Byte lebih besar
dari pada byte image asli. Efek ini disebut
reverse compression atau negative compression.
2) CCIT Group 3 1D
-
Berdasarkan run-length encoding, scanline dilakukan pada pixel dari warna yang
sama (hitam atau putih).
-
Hanya untuk image hitam-putih, bukan
grayscale atau warna.
-
Aplikasi utama digunakan pada faksimil
dan pada awal document imaging.
-
Menggunakan Huffman encoding untuk
encoding pixel runlength pada CCIT Group 3 dan Group 4.
Keuntungan:
·
Sederhana pada
implementasi
·
Menjadi standar
faksimil dan aplikasi document imaging
Kerugian:
·
Satu dimensi dengan
code setiap baris atau garis terpisah.
·
Tanpa mekanisme
untuk melindungi dari kesalahan.
3)
CCIT GRoup 3 2D
4)
CCIT Group 4
-
Group pertama dari
pixel (scanline) dikode yang menganggap garis putih sebagai garis referensi dari garis
berikutnya.
-
Mendapatkan level
kompresi yang tinggi.
5)
Lempel-Ziv and
Welch aalgoruthm LZW
The Lempel-Ziv (LZ) metode kompresi adalah salah
satu algoritma paling populer untuk penyimpanan lossless. mengempis adalah variasi LZ yang dioptimalkan
untuk kecepatan dekompresi dan rasio kompresi, sehingga kompresi ini bisa
lambat. Deflate digunakan dalam PkZip , gzip dan PNG . LZW (Lempel-Ziv-Welch) digunakan dalam
gambar GIF. Juga patut diperhatikan adalah LZR (LZ-Renau) metode, yang melayani
sebagai dasar dari metode Zip. metode LZ memanfaatkan model kompresi
berbasis tabel di mana entri tabel diganti untuk string data yang diulang.
Untuk metode yang paling LZ, tabel ini dihasilkan secara dinamis dari data
sebelumnya dalam input.
Tabel sendiri sering Huffman
dikodekan (misalnya
Shri, LZX). berdasarkan skema coding LZ arus yang baik adalah melakukan LZX , digunakan dalam Microsoft CAB format.
Yang sangat kompresor terbaik menggunakan model
probabilistik, di mana prediksi yang digabungkan dengan algoritma yang disebut aritmatika
coding.
Arithmetic coding, diciptakan oleh Jorma
Rissanen,
dan berubah menjadi metode praktis oleh Witten, Neal, dan Cleary, mencapai
kompresi lebih unggul dari algoritma Huffman dikenal-baik, dan cocok terutama
baik untuk konteks data kompresi adaptif tugas dimana prediksi sangat-
tergantung. Pengkodean aritmatika digunakan dalam standar kompresi
gambar-bilevel JBIG, dan dokumen-standar kompresi DjVu . Entri teks sistem, Dasher , adalah-terbalik aritmatika-coder.
Posting Komentar