LMStudioのglm-4.7-flashはオリジナルのより有志がMXFP4で量子化したバージョンのほうが安定する。
オリジナルはすぐ同じ文章を繰り返すけど有志版はそれが起こらない。同じように量子化されたものでも、行った人によってモデルの動作が明らかに異なる。
LMStudioのglm-4.7-flashはオリジナルのより有志がMXFP4で量子化したバージョンのほうが安定する。
オリジナルはすぐ同じ文章を繰り返すけど有志版はそれが起こらない。同じように量子化されたものでも、行った人によってモデルの動作が明らかに異なる。