可変長トークナイザが視覚合成をどう進化させるか——新たなマージ手法の可能性
学習可能なグローバルマージによる可変長トークナイゼーションと拡散トランスフォーマー
査読前の可能性がある研究情報
学習可能なグローバルマージを用いた可変長トークナイザが、視覚合成における品質と計算量のトレードオフを改善
速報・AI要約未精査
Variable-Length Tokenization
Learnable Global Merging
Diffusion Transformers
Latent Diffusion Models
arXiv cs.AI