Jak Lstm oblicza liczbę parametrów?
Jak Lstm oblicza liczbę parametrów?

Wideo: Jak Lstm oblicza liczbę parametrów?

Wideo: Jak Lstm oblicza liczbę parametrów?
Wideo: LSTM: Understanding the Number of Parameters 2024, Listopad
Anonim

Tak więc, zgodnie z twoimi wartościami. Podanie go do wzoru daje:->(n=256, m=4096), suma liczba parametrów to 4*((256*256) + (256*4096) + (256)) = 4*(1114368) = 4457472. numer ciężarów jest 28 = 16 (num_units * num_units) dla połączeń cyklicznych + 12 (input_dim * num_units) dla danych wejściowych.

Zapytany również, jak oceniasz liczbę parametrów?

Do Oblicz uczący się parametry tutaj wszystko, co musimy zrobić, to po prostu pomnożyć przez kształt szerokości m, wysokości n i uwzględnić wszystkie takie filtry k. Nie zapomnij o określeniu odchylenia dla każdego z filtrów. Liczba parametrów w warstwie CONV byłoby: ((m * n)+1)*k), dodane 1 ze względu na składnik odchylenia dla każdego filtra.

Podobnie, ile ukrytych jednostek ma Lstm? jakiś LSTM sieć. Sieć ma pięć wejść jednostki , a ukryta warstwa składa się z dwóch LSTM bloki pamięci i trzy wyjścia jednostki . Każdy blok pamięci ma cztery wejścia, ale tylko jedno wyjście.

W dalszej kolejności można zapytać, jak oceniasz liczbę parametrów w RNN?

1 odpowiedź. Jednostki W, U i V są wspólne dla wszystkich etapów RNN i to są jedyne parametry w modelu opisanym na rysunku. Stąd liczba parametrów do nauczenia podczas treningu = dim(W)+dim(V)+dim(U). Na podstawie danych w pytaniu to = n2+kn+nm.

Ile warstw ma Lstm?

Ogólnie 2 warstwy okazały się wystarczające do wykrycia bardziej złożonych funkcji. Więcej warstwy może być lepszy, ale też trudniejszy do trenowania. Ogólna zasada – 1 ukryty warstwa pracuj z prostymi problemami, takimi jak ten, a dwa wystarczą, aby znaleźć dość złożone funkcje.

Zalecana: