|
24
1.
Keadaan
system retailer
dideskripsikan
oleh
vektor
x
t
di
mana
masing-masing
komponen sesuai dengan buffer (Gambar 2.2).
2. Setiap keputusan u
t
bersesuaian dengan vektor pemesanan toko dan gudang
selama
tahap
waktu
ke-t.
Keputusan
u
t
harus
dicari
sebagai
dasar
dari
keadaan
sebelum keputusan x
t
.
3. Dari keadaan sebelum keputusan x
t
dan keputusan u
t
telah diberikan, maka
keadaan setelah keputusan y
t
dapat ditentukan hasilnya. Keadaan setelah
keputusan
y
t
berubah karena permintaan pelanggan
telah
terpenuhi
selama proses
transportasi.
4. Nilai dari keadaan setelah keputusan y
t
adalah
nilai dari keadaan sebelum
keputusan
selanjutnya
x
t+1
.
Transisi
dari
y
t
menuju
x
t+1
disebabkan
karena
permintaan
barang.
Pada
formulasi dynamic
programming
yang
dipakai,
nilai
permintaan ditentukan oleh nilai gangguan acak w
t
.
5. Biaya g(y
t
,w
t
) dihitung secara langsung dari biaya-biaya yang ada di dalam
sistem inventory.
Variabel
yang
dibutuhkan dynamic
programming
untuk
menghitung
optimasi
inventory control tidak
sesuai untuk masalah kontrol persediaan barang
yang kompleks,
maka digunakan Neuro-Dynamic Programming.
2.5
Neuro-Dynamic Programming
2.5.1
Pengertian Neuro-Dynamic Programming
Neuro-dynamic
programming
merupakan pengembangan
dari
dynamic
programming. Metode
ini
mengunakan
dasar-dasar intelegensi semu (Artificial
Intelligence)
yang
mencakup
simulasi,
dan
berbasis
algoritma
serta
fungsi
teknik
|