Least Square dalam Model Multiple Regression menggunakan Matlab

Regresi linear merupakan suatu metode analisis statistik yang mempelajari pola hubungan antara dua atau lebih variabel. Pada kenyataan sehari-hari sering dijumpai sebuah kejadian dipengaruhi oleh lebih dari satu variabel, oleh karenanya dikembangkanlah analisis regresi linier berganda dengan model :


Adanya metode analisis regresi ini sangat menguntungkan bagi banyak pihak, baik di bidang sains, sosial, industri maupun bisnis. Pemanfaatan analisis regresi pada Badan Meteorologi Klimatologi dan Geofisika salah satu diantaranya adalah sebagai suatu model Prakiraan Jangka Panjang (prakiraan bulanan dan prakiraan musim).

Persamaan Regresi Berganda (multiple regression) merupakan persamaan regresi dengan menggunakan dua atau lebih variabel independen. Dalam hal ini yang digunakan sebagai variabel independen adalah data Suhu Maksimum dan Suhu Minimum, sedangkan variabel dependennya adalah Kelembaban Udara.

MATLAB adalah sebuah bahasa dengan (high-performance) kinerja tinggi untuk komputasi masalah teknik. Matlab mengintegrasikan komputasi, visualisasi, dan pemrograman dalam suatu model yang sangat mudah untuk pakai dimana masalah-masalah dan penyelesaiannya diekspresikan dalam notasi matematika yang familiar.

Nama MATLAB merupakan singkatan dari matrix laboratory. MATLAB pada awalnya ditulis untuk memudahkan akses perangkat lunak matrik yang telah dibentuk oleh LINPACK dan EISPACK. Saat ini perangkat MATLAB telah menggabung dengan LAPACK dan BLAS library, yang merupakan satu kesatuan dari sebuah seni tersendiri dalam perangkat lunak untuk komputasi matrix.

Tujuan dan manfaat yang didapat dari penggunaan metode least square dalam regresi linier dengan Matlab antara lain :

  • Mengetahui hubungan antara dua variabel atau lebih dengan menggunakan sebuah persamaan matematika, khususnya matrik.
  • Mencari koefisien regresi (b0,b1,b2) dalam menentukan nilai variabel dependen kelembaban udara menggunakan variabel independen suhu maksimum dan suhu minimum menggunakan perangkat lunak Matlab.
  • Mampu mengoperasikan Matlab dan memanfaatkan sebagai perangkat simulasi dalam operasi matematika, matrik, array dan hasilnya dalam bentuk persamaan model regresi linier berganda.

Suhu Udara dan Kelembaban

Dalam kehidupan sehari-hari, kelembaban udara adalah sesuatu yang sangat penting, karena akan sangat mempengaruhi suhu udara. Di dalam atmosfer senantiasa terdapat uap air. Kadar uap air dalam udara disebut kelembaban. Kadar ini selalu berubah-ubah tergantung pada suhu udara setempat. Kelembaban udara adalah presentase kandungan uap air di dalam udara. Kelembaban udara juga ditentukan oleh jumlah uap air yang terkandung di dalam udara.

Dalam pengamatan klimatologi, pengamatan unsur suhu udara berperan dalam menentukan nilai kelembaban udara. Jenis pengamatan suhu udara yang dilakukan adalah pengamatan suhu bola kering, suhu bola basah, suhu maksimum dan suhu minimum. Nilai kelembaban udara dalam pengamatan klimatologi diperoleh dari pembacaan tabel RH yang menggunakan perbandingan antara suhu bola kering dan suhu bola basah. Sehingga secara tidak langsung unsur suhu maksimum dan suhu minimum mempengaruhi nilai dari kelembaban udara rata-rata.

Analisis Regresi

Analisis regresi merupakan sebuah alat statistik yang memberikan penjelasan tentang pola hubungan (model) antara dua variabel atau lebih. Dalam analisis regresi, dikenal dua jenis variabel yaitu :

  • Variabel Respon disebut juga variabel dependent yaitu variabel yang keberadaannya diperngaruhi oleh variabel lainnya dan dinotasikan dengan Y.
  • Variabel Prediktor disebut juga variabel independent yaitu variabel yang bebas (tidak dipengaruhi oleh variabel lainnya) dan dinotasikan dengan X.

Analisis regresi linier berganda memberikan kemudahan bagi pengguna untuk memasukkan lebih dari satu variabel prediktor hingga p-variabel prediktor dimana banyaknya p kurang dari jumlah observasi (n). Sehingga model regresi dapat ditunjukkan sebagai berikut :


Dengan model dugaan sebagai berikut :


Langkah perhitungan penaksir koefisien regresi :


kemudian dideferensialkan terhadap b0, b1, … bk, dan hasilnya disamakan dengan nol,


Persamaan normal menjadi :


Untuk mempermudah menghitung penaksir koefisien regresi maka persamaan normal diubah ke bentuk matrik,


Pada satu matrik dan dua vektor di atas, masing-masing dinamai : matrik A (berukuran (k+1)´(k+1)), vektor b (berukuran (k+1)´1), dan vektor g (juga berukuran (k+1)´1), sehingga persamaan normal menjadi :


dan didapatkan penaksir koefisien regresi, yaitu b :


Salah satu prosedur pendugaan model untuk regresi linier berganda adalah dengan prosedur Least Square (kuadrat terkecil). Konsep dari metode least square adalah menduga koefisien regresi (β) dengan meminimumkan kesalahan (error). Sehingga dugaan bagi β (atau dinotasikan dengan b) dapat dirumuskan sebagai berikut :


dengan b =


Dari persamaan tersebut kita akan dapat memprediksi nilai Y jika nilai variabel independen (X) diketahui.

Skalar, Vektor, dan Matriks

Terdapat tiga jenis format data di matlab, yaitu skalar, vektor, dan matriks.

  • Skalar, ialah suatu bilangan tunggal
  • Vektor, ialah sekelompok bilangan yang tersusun 1-dimensi. Dalam matlab biasanya disajikan sebagai vektor-baris atau vektor-kolom
  • Matriks, ialah sekelompok bilangan yang tersusun dalam segi empat 2 dimensi. Di dalam MATLAB, matriks didefinisikan dengan jumlah baris dan kolomnya. Di matlab terdapat pula matriks berdimensi 3, 4, atau lebih.

Sebenarnya, semua data bisa dinyatakan sebagai matriks. Skalar bisa dianggap sebagai matriks satu baris – satu kolom (matriks 1×1), dan vektor bisa dianggap sebagai matriks 1-dimensi: satu baris – n kolom, atau n baris – 1 kolom (matriks 1×n atau n×1). Semua perhitungan di MATLAB dilakukan dengan matriks, sehingga disebut MATrix LABoratory.

Matriks didefinisikan dengan kurung siku ( [ ] ) dan biasanya dituliskan baris-per-baris. Tanda koma (,) digunakan untuk memisahkan kolom, dan titik-koma (;) untuk memisahkan baris. Kita juga bisa menggunakan spasi untuk memisahkan kolom dan menekan Enter ke baris baru untuk memisahkan baris.

Data yang digunakan dalam menjalankan regresi linier berganda adalah data harian kelembaban udara, suhu maksimum dan suhu minimum dari hasil pengamatan pada bulan April 2009 yang ada di Stasiun Klimatologi Kediri-NTB.


Pertama kali yang dilakukan adalah menuliskan data dalam Ms.Excel, yang berguna sebagai perhitungan manual dan kontrol apa bila dalam pembuatan script di matlab menemui kendala.


Selanjutnya data disalin dan pindah ke notepad, kemudian disimpan dengan nama data.txt. Selain format dengan ekstension *.txt, matlab bisa membaca data dengan format ektensi *.dat.


Script Matlab :


Hasil Script :


Coba di jalankan menggunakan Minitab, bahwa script dan hasil yang didapat sudah benar, hehehe….


Sedikit analisis dari kegiatan diatas :

  1. Dari hasil perhitungan metode Least Square Error dalam matlab menggunakan variabel dependen kelembaban udara (RH) serta variabel independen suhu rata-rata maksimum dan minimum hasil pengamatan di Stasiun Klimatologi Kediri-NTB bulan April 2009, dihasilkan nilai koefisien regresi (b0,b1,b2) adalah (191.4857, -4.6109, 1.5335)
  2. Ketika script dijalankan dalam program matlab, nilai Tmax (32.5) dan Tmin (20.3) dimasukan, nilai RH yang ditampilkan adalah 72.76.
  3. Pembuktian perhitungan matlab dilakukan dengan melihat hasil dari Minitab. Minitab membuktikan bahwa nilai (b0,b1,b2) yang dihasilkan sama persis, dengan persamaan regresinya RH = 191 – 4,61 TX + 1,53 TN.

Jadi…… :

  • Dari beberapa analisis diatas dapat disimpulkan bahwa dengan menggunakan perangkat lunak matlab, untuk mencari koefisien regresi bisa diproleh dengan cepat, tanpa repot melakukan perhitungan matrik secara manual.
  • Script yang ditulis dalam matlab sangat membantu dalam perhitungan matematika menggunakan matrik.

Source :

Urip Haryoko, 2011, Multiple Regression, Mata Kuliah Statistik II, Akademi Meteorologi dan Geofisika, Jakarta.

Suhermin Ari Pujiati, 2008, Analisis Regresi Linier Berganda Untuk Mengetahui Hubungan Antara Beberapa Aktivitas Promosi dengan Penjualan Produk, Pasca Sarjana Jurusan Statistika, FMIPA ITS, Surabaya

I Gede Agus Purbawa dan I Nyoman Gede Wiryajaya, 2008, Validasi Model Regresi Linier Berganda dan Model Arima untuk Prakiraan Jangka Panjang di Bali, Buletin M&G Juni 2008, Jakarta

Anonymous, http://oc.its.ac.id/ambilfile.php?idp=738, Least Square atau Kuadrat Terkecil, akses tanggal 19 April 2011

Teguh Widiarsono MT, 2005, Tutorial Praktis Belajar Matlab, Jakarta.

Advertisements

3 thoughts on “Least Square dalam Model Multiple Regression menggunakan Matlab

  1. postingan yg bagus, tp kalo variabel independent nya lebih dari 2, misalkan 5, bagai mana cara menghitungnya?

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s