際際滷

際際滷Share a Scribd company logo
   ialah input pada setiap time step . Contoh, 1 merupakan koresponding one-hot vector pada kata kedua pada kalimat.
  adalah hidden state pada setiap time step . Hidden state ialah memory pada sebuah jaringan.  dikalkulasikan sesuai
dengan hidden state sebelumnya dan input pada step saat ini:  = (  + ≠1). Pada fungsi  biasanya adalah non-
linearitas seperti tanh atau ReLU. 1 dibutuhkan untuk mengkalkulasikan hidden state yang pertama, biasanya
semuanya di-inisilisasi dengan 0 (nol).
  adalah ouput pada setiap step . Contoh, jika anda ingin memprediksi kata selanjutnya pada sebuah kalimat maka 
merupakan vector probabilitas di seluruh vocabulary. Yang berarti jika dirumuskan  = softmax().
Ada beberapa hal yang perlu anda catat disini:
 Hidden State  adalah memory pada jaringan.  merekam informasi yang pada seluruh waktu pada time step (langkah
waktu) sebelumnya. Output step  hanya dikalkulasikan pada memory pada setiap waktu (time) . Seperti yang
disebutkan diatas bahwa pada prakteknya untuk merekam setiap informasi pada waktu sebelumnya di RNN sangatlah
rumit, karena khususnya  tidak bisa merekam informasi pada time step yang lampau terlalu banyak.
 Tidak seperti pada tradisional (konservatif) deep neural network, yang menggunakan parameter yang berbeda pada setiap
layer-nya, sebuah RNN membagikan secara merata pada semua parameter diatas (, ,  ) pada seluruh langkah. Jika
kita me-refleksikan dari sini bahwa faktanya kita menjalankan seluruh tugas yang sama pada setiap langkah, hanya
berbeda input saja. Hal ini sangat menguras jumlah parameter yang harus kita pelajari.
 Pada diagram diatas memiliki output pada setiap time step-nya, tetapi jika bergantung kepada tugasnya hal tersebut tidak
terlalu pending. Contohnya, saat memprediksikan sentiment (maksud) pada sebuah kalimat kita hanya peduli pada output
terakhirnya, bukan sentiment (maksud) disetiap kata. Hal ini berbanding lurus bahwa kita mungkin tidak perlu input
pada setiap time step. Fitur Utama pada sebuah RNN ialah hidden state yang merekam beberapa informasi pada sebuah
kalimat.
 One hot ialah sebuah group diantara bit yang memiliki kombinasi nilai dengan nilai tertinggi ialah 1 dan terendah ialah 0.

More Related Content

Additional Files - RNN Introduction

  • 1. ialah input pada setiap time step . Contoh, 1 merupakan koresponding one-hot vector pada kata kedua pada kalimat. adalah hidden state pada setiap time step . Hidden state ialah memory pada sebuah jaringan. dikalkulasikan sesuai dengan hidden state sebelumnya dan input pada step saat ini: = ( + ≠1). Pada fungsi biasanya adalah non- linearitas seperti tanh atau ReLU. 1 dibutuhkan untuk mengkalkulasikan hidden state yang pertama, biasanya semuanya di-inisilisasi dengan 0 (nol). adalah ouput pada setiap step . Contoh, jika anda ingin memprediksi kata selanjutnya pada sebuah kalimat maka merupakan vector probabilitas di seluruh vocabulary. Yang berarti jika dirumuskan = softmax(). Ada beberapa hal yang perlu anda catat disini: Hidden State adalah memory pada jaringan. merekam informasi yang pada seluruh waktu pada time step (langkah waktu) sebelumnya. Output step hanya dikalkulasikan pada memory pada setiap waktu (time) . Seperti yang disebutkan diatas bahwa pada prakteknya untuk merekam setiap informasi pada waktu sebelumnya di RNN sangatlah rumit, karena khususnya tidak bisa merekam informasi pada time step yang lampau terlalu banyak. Tidak seperti pada tradisional (konservatif) deep neural network, yang menggunakan parameter yang berbeda pada setiap layer-nya, sebuah RNN membagikan secara merata pada semua parameter diatas (, , ) pada seluruh langkah. Jika kita me-refleksikan dari sini bahwa faktanya kita menjalankan seluruh tugas yang sama pada setiap langkah, hanya berbeda input saja. Hal ini sangat menguras jumlah parameter yang harus kita pelajari. Pada diagram diatas memiliki output pada setiap time step-nya, tetapi jika bergantung kepada tugasnya hal tersebut tidak terlalu pending. Contohnya, saat memprediksikan sentiment (maksud) pada sebuah kalimat kita hanya peduli pada output terakhirnya, bukan sentiment (maksud) disetiap kata. Hal ini berbanding lurus bahwa kita mungkin tidak perlu input pada setiap time step. Fitur Utama pada sebuah RNN ialah hidden state yang merekam beberapa informasi pada sebuah kalimat. One hot ialah sebuah group diantara bit yang memiliki kombinasi nilai dengan nilai tertinggi ialah 1 dan terendah ialah 0.