io.github.kirstenali.deepj.layers.transformer

package io.github.kirstenali.deepj.layers.transformer

Related Packages

Package

Description

io.github.kirstenali.deepj.layers
Classes

Class

Description

LayerNorm1D

LayerNorm over feature dimension (cols) with trainable gamma/beta exposed as Parameters.

MultiHeadSelfAttention

Multi-head causal self-attention for a single sequence (no batch dimension).

TransformerBlock

Pre-LN Transformer block: x = x + Attn(LN(x)) x = x + MLP(LN(x))