�ݺ�ߣ

• 𝑥 𝑡 ialah input pada setiap time step 𝑡. Contoh, 𝑥1 merupakan
koresponding one-hot vector pada kata kedua pada kalimat.
• 𝑠𝑡 adalah hidden state pada setiap time step 𝑡. Hidden state ialah
“memory” pada sebuah jaringan. 𝑠𝑡 dikalkulasikan sesuai dengan
hidden state sebelumnya dan input pada step saat ini: 𝑠𝑡 = 𝑓(𝑈𝑥 𝑡 +
𝑊𝑠𝑡−1). Pada fungsi 𝑓 biasanya adalah non-linearitas seperti tanh
atau ReLU. 𝑠−1 dibutuhkan untuk mengkalkulasikan hidden state
yang pertama, biasanya semuanya di-inisilisasi dengan 0 (nol).
• 𝑜𝑡 adalah ouput pada setiap step 𝑡. Contoh, jika anda ingin
memprediksi “kata selanjutnya” pada sebuah kalimat maka 𝑜𝑡
merupakan vector probabilitas di seluruh vocabulary. Yang berarti jika
dirumuskan 𝑜𝑡 = softmax(𝑉𝑠𝑡).

Ada beberapa hal yang perlu anda catat disini:
• Hidden State 𝑠𝑡 adalah memory pada jaringan. 𝑠𝑡 merekam informasi yang
pada seluruh waktu pada time step (langkah waktu) sebelumnya. Output
step 𝑜𝑡 hanya dikalkulasikan pada memory pada setiap waktu (time) 𝑡.
Seperti yang disebutkan diatas bahwa pada prakteknya untuk merekam
setiap informasi pada waktu sebelumnya di RNN sangatlah rumit, karena
khususnya 𝑠𝑡 tidak bisa merekam informasi pada time step yang lampau
terlalu banyak.
• Tidak seperti pada tradisional (konservatif) deep neural network, yang
menggunakan parameter yang berbeda pada setiap layer-nya, sebuah RNN
membagikan secara merata pada semua parameter diatas (𝑊, 𝑉, 𝑊 ) pada
seluruh langkah. Jika kita me-refleksikan dari sini bahwa faktanya kita
menjalankan seluruh tugas yang sama pada setiap langkah, hanya
berbeda input saja. Hal ini sangat menguras jumlah parameter yang harus
kita pelajari.

• Pada diagram diatas memiliki output pada setiap time step-nya, tetapi
jika bergantung kepada tugasnya hal tersebut tidak terlalu pending.
Contohnya, saat memprediksikan sentiment (maksud) pada sebuah
kalimat kita hanya peduli pada output terakhirnya, bukan sentiment
(maksud) disetiap kata. Hal ini berbanding lurus bahwa kita mungkin
tidak perlu input pada setiap time step. Fitur Utama pada sebuah
RNN ialah hidden state yang merekam beberapa informasi pada
sebuah kalimat.
• One hot ialah sebuah group diantara bit yang memiliki kombinasi nilai
dengan nilai tertinggi ialah 1 dan terendah ialah 0.

�ݺ�ߣ

Additional Files - For Article RNN

More Related Content

Additional Files - For Article RNN