KDBP SARANA PEMBINAAN BAHASA

Oleh NORHAFIZAH MOHAMED HUSIN DAN ABDUL HALIM ABDUL LATIP

Atas kesedaran terhadap keperluan pustaka korpus digital yang besar sebagai kemudahan untuk melakukan penelitian bahasa, Dewan Bahasa dan Pustaka (DBP) telah memulakan projek pangkalan data bahasa Melayu berkomputer yang kini dikenali sebagai Korpus DBP (KDBP) pada tahun 1983. KDBP dibina untuk menyediakan prasarana penelitian yang objektif dan autentik sifatnya kepada para penyelidik bahasa Melayu. Dapatan yang diperoleh daripada kajian berdasarkan korpus ini dapat mencerminkan perilaku dan pola leksikal bahasa Melayu dalam persekitaran penggunaannya yang sebenar. KDBP juga dapat dijadikan asas untuk penyusunan kamus, tatabahasa dan buku bahasa yang lain.

Pada peringkat awal, sampel data tulisan dalam bahasa Melayu dikumpulkan sebagai sumber penyelidikan bahasa. Atas pertimbangan dan keperluan linguistik yang lebih luas, termasuklah untuk membantu kerja penyusunan kamus dan penyelidikan leksikal, dasar pengumpulan ini ditukar daripada kaedah pensampelan kepada kaedah pengumpulan teks wacana yang lengkap. Sehingga bulan September 2011, KDBP mengandungi 105 juta kata data pelbagai genre yang sudah diformatkan, dirakam dan disimpan secara berstruktur dalam pangkalan data.

___

Rencana ini dipetik daripada Dewan Bahasa November 2011.

Leave a Reply