class
SHAInet::MultiHeadAttention
- SHAInet::MultiHeadAttention
- Reference
- Object
Defined in:
shainet/transformer/multi_head_attention.crConstructors
Instance Method Summary
- #apply_gradients(lr : Float64)
- #backward(d_out : SimpleMatrix)
- #d_model : Int32
- #forward(x : SimpleMatrix)
- #grads_w_k : SimpleMatrix
- #grads_w_k=(grads_w_k : SimpleMatrix)
- #grads_w_o : SimpleMatrix
- #grads_w_o=(grads_w_o : SimpleMatrix)
- #grads_w_q : SimpleMatrix
- #grads_w_q=(grads_w_q : SimpleMatrix)
- #grads_w_v : SimpleMatrix
- #grads_w_v=(grads_w_v : SimpleMatrix)
- #head_dim : Int32
- #num_heads : Int32
- #w_k : SHAInet::SimpleMatrix
- #w_o : SHAInet::SimpleMatrix
- #w_q : SHAInet::SimpleMatrix
- #w_v : SHAInet::SimpleMatrix
- #zero_gradients