class SHAInet::MultiHeadAttention

Defined in:

shainet/transformer/multi_head_attention.cr

Constructors

.new(d_model : Int32, num_heads : Int32)

Instance Method Summary

#apply_gradients(lr : Float64)
#backward(d_out : SimpleMatrix)
#d_model : Int32
#forward(x : SimpleMatrix)
#grads_w_k : SimpleMatrix
#grads_w_k=(grads_w_k : SimpleMatrix)
#grads_w_o : SimpleMatrix
#grads_w_o=(grads_w_o : SimpleMatrix)
#grads_w_q : SimpleMatrix
#grads_w_q=(grads_w_q : SimpleMatrix)
#grads_w_v : SimpleMatrix
#grads_w_v=(grads_w_v : SimpleMatrix)
#head_dim : Int32
#num_heads : Int32
#w_k : SHAInet::SimpleMatrix
#w_o : SHAInet::SimpleMatrix
#w_q : SHAInet::SimpleMatrix
#w_v : SHAInet::SimpleMatrix
#zero_gradients

Constructor Detail

def self.new(d_model : Int32, num_heads : Int32) #

[View source]

Instance Method Detail

def apply_gradients(lr : Float64) #

[View source]

def backward(d_out : SimpleMatrix) #

[View source]

def d_model : Int32 #

[View source]

def forward(x : SimpleMatrix) #

[View source]

def grads_w_k : SimpleMatrix #

[View source]

def grads_w_k=(grads_w_k : SimpleMatrix) #

[View source]

def grads_w_o : SimpleMatrix #

[View source]

def grads_w_o=(grads_w_o : SimpleMatrix) #

[View source]

def grads_w_q : SimpleMatrix #

[View source]

def grads_w_q=(grads_w_q : SimpleMatrix) #

[View source]

def grads_w_v : SimpleMatrix #

[View source]

def grads_w_v=(grads_w_v : SimpleMatrix) #

[View source]

def head_dim : Int32 #

[View source]

def num_heads : Int32 #

[View source]

def w_k : SHAInet::SimpleMatrix #

[View source]

def w_o : SHAInet::SimpleMatrix #

[View source]

def w_q : SHAInet::SimpleMatrix #

[View source]

def w_v : SHAInet::SimpleMatrix #

[View source]

def zero_gradients #

[View source]

CrystalDoc.info

shainet

class SHAInet::MultiHeadAttention

Defined in:

Constructors

Instance Method Summary

Constructor Detail

Instance Method Detail